Pentaho Data Integration Desarrollando Procesos ETL - Fundamental

Pentaho Data Integration Desarrollando Procesos ETL - Fundamental

Aprenderás a utilizar Pentaho Data Integration (PDI) mediante ejemplos y ejercicios, y de forma gradual verás cada una de las opciones de Spoon. Trabajarás con los steps más utilizados en los Jobs/Transformations. Aprenderás cómo cargar y actualizar un DW. Ejecutarás las soluciones desde líneas de comandos. Al finalizar el curso podrás crear Jobs/Transformations altamente parametrizables y adaptadas a tu contexto.

299.00
299.0 USD 299.00
299.00
Responsable Johana Diaz Acosta
Última actualización 02/12/2023
Miembros 12
  • MÓDULO 1: Pentaho Data Integration (PDI)
    • Vista previa gratis
    • Vista previa gratis
    • Sesión 01 - Completa en vivo
    • Sesión 02 - Completa en vivo
    • Sesion 03 - Completo en Vivo
    • Sesión 04 - Completo en Vivo
    • Sesión 05 - Completo En Vivo
    • Características
    • Definición y Uso de Integración de Datos
    • Licencia
    • Ejemplificación de Tareas de Integración de Datos
    • Configuración de Variables de Entorno / Descarga / Instalación / Configuración de Driver JDBC de MySQL
    • Tipos y Utilización de Repositorio: Conexión con Repositorio de Pentaho BA | Repositorio en Base de Datos | Repositorio en Sistema de Archivos | Opción Repository Manager | Metadata
    • Características y Diferencias entre Transformations y Jobs
  • MÓDULO 2: Transformations, Panel Execution, Panel Execution Results
    • Características Funcionamiento de las Transformations
    • Panel Execute, Desplegado antes de Ejecutar las Transformationes/Jobs: Environment Type | Log Level | Parameters
    • Descripción y Ejemplificación del Panel Execution Results
    • Descripción y Análisis de las Opciones más Importantes de sus Tabs
    • Laboratorio: ▪ Transformación con Cálculos Lógicos y Matemáticos
  • MÓDULO 3: Variables de Entorno, Parameters, Arguments
    • Descripción y Uso de las Variables de Entorno
    • Ejemplos y Notación de las Variables de Entorno
    • Descripción y Uso de los Parámetros
    • Modos de Creación de Parámetros
    • Descripción, Definición y Uso de Argumentos
    • Descripción y Uso de la Opción Preview
    • Práctico: Creación de Transformación cuyos Valores Obtenidos Dependa de los Parámetros Asignados en la ejecución
    • Práctico: Creación de Transformación que Obtenga Valores de Argumentos, Ejecute una Función JavaScript y Genere un Documento HTML
  • MÓDULO 4: Expresiones Regulares (REGEX), javascript (JS)
    • Aplicación y Ejemplos de RegEx
    • Documentación y Patrones más Utilizados de las RegEx
    • Laboratorio: Obteniendo los Nombres de las Librerías Presentes en PDI y que Mediante RegEx Separe Sintácticamente su Nombre, Extensión y Versión
    • Descripción y Documentación de JS, Aplicación de JS en PDI
    • Ejemplificación y Aplicación Avanzada de Step Modified Java Script Value
  • MÓDULO 5: Variables Globales
    • Descripción, Uso, Ejemplos
    • Administración de Variables Globales
    • Práctico: Creación de Transformation que Realice las Siguientes Tareas: Utilizar Variables de Entorno para Establecer URL y Nombres de Archivos; Trabajar con Datos en Formato XML; Convertir Filas en Columnas; Comparar dos Flujos de Datos por Aproximación Utilizando Algoritmo Levenshtein; Obtener Valores Mínimos y Máximos; Trabajar con Datos JSON
    • Práctico: Creación de Transfomation que Realice las Siguientes Tareas: Análisis, Distribución, Mapeo, Clasificación, Aplicación de Rangos, Aplicación de Secuencia Condicionada, Conversiones
  • MÓDULO 6: Dataflow II
    • Unión de Datasets con Diferente Metadata
    • Laboratorio: Convertir de Filas a Columnas, Convertir de Columnas a Filas, Unir Datasets, Mapeo y Distribución de Datasets, Aplicación de Fórmulas Avanzadas, Compartir Dataset
  • MÓDULO 7: Hops
    • Descripción y Administración de Hops de Transformations y Jobs
    • Configuración Avanzada de Hops de Transformations: Habilitar/Deshabilitar | Cambiar Dirección | Condición | Borrar | Bulk Change
    • Configuración Avanzada de Hops de Jobs y Análisis de Status: Incondicional | Exito | Fracaso | Habilitar/Deshabilitar
    • Descripción de Notas en Transformations/Jobs
    • Descripción de las Opciones de Grilla
  • MÓDULO 8: Share Objects
    • Descripción y Tipos de Objetos Compartidos
    • Administración, Ejemplificación y Utilización de Objetos Compartidos
    • Configuración de Metadata de Objetos Compartidos
    • Práctico: Creación de Transformation que Realice las Siguientes Tareas; Obtener Diferentes Archivos de Salida Dependiendo de Condiciones Establecidas en el Flujo de Datos; Comparar Flujos de Datos Identificando Elementos Nuevos,Eliminados y Modificados Utilizar Variables de Entorno y RegEx
    • Práctico: Creación de Transformations y Jobs para Ejemplificar las Diferentes Utilizaciones de Result Filenames
  • MÓDULO 9: Jobs
    • Descripción, Características y Principales Usos
    • Comportamiento y Modo de Funcionamiento de los Jobs
    • Configuración para Ejecución de Steps en Paralelo
    • Configuración para Ejecución de Transformations por Cada Fila Analizada del Dataset
    • Análisis y Explicación de Ruta de Ejecución de los Steps de Jobs
    • Práctico: Creación de un Job que Realice las Siguientes Tareas; Controle el Workflow de Ejecución de Dos Transformations; Evalúe la Salida de Status de los Diferentes Steps
    • Laboratorio: Generar un Dataset; Guardar el Dataset en la Lista Result rows; Ejecutar una Segunda Transformation que Obtenga el Dataset de la Lista Result Rows; Configurar Salidas de Log y Analizar los Resultados
  • MÓDULO 10: Bases de datos
    • Descripción, Uso y Realización de Acciones Avanzadas Sobre Bases de Datos
    • Utilización y Configuración Avanzada de Error Handling
    • Definición y Utilización de Opción Clear Cache Database
    • Práctico: Creación de Job que Realice Múltiples Tipos de Acciones Sobre Bases de Datos.
  • MÓDULO 11: E-Mail & Web
    • Ejemplificación, Uso y Configuración Avanzada de Envío de Emails
    • Utilización de Diferentes Protocolos: POP3 | IMAP | MBOX
    • Práctico: Creación de Transformations y Jobs que Realicen las Siguientes Tareas; Obtener de un Archivo CSV una Lista de URLs Web con los Discos de Artistas de Rock; Obtener el Documento HTML de Cada URL Web; Filtrar de Cada Documento HTML la Sección Dedicada a la Lista de Canciones de Dada Disco; Generar un Archivo CSV por Cada Disco con la Información de sus Respectivas Canciones.
    • Práctico: Creación de un Job que Realice las Siguientes Tareas: Utilizar Variables de Entorno y RegEx para Obtener una Lista de Archivos; Validar Direcciones de e-Mail; Enviar e-Mail que Contenga como Adjuntos los Archivos Obtenidos
  • MÓDULO 12: Pan & Kitchen
    • Descripción de las Principales Herramientas PDI: Spoon | Pan | Kitchen | Carte
    • Opciones Avanzadas Ejecución de Transformations o Jobs por Líneas de Comandos
    • Descripción, Ejemplificación y Uso de Calendarización de Ejecución de Transformations y Jobs
    • Calendarización Utilizando Cron
    • Calendarización Utilizando Task Scheduler
  • MÓDULO 13: Marketplace
    • Descripción y Características del Marketplace de PDI
    • Instalación de Plugins: Weka, DataCleaner
    • Utilización de Transformation como Datasource para Dashboards (CDE)
    • Utilización de Transformation como Datasource para Reporting (PRD)
    • Configuración y Ejecución de Reportes PRD en Transformation PDI