Big Data Architect on AWS, Pentaho & Cía

Big Data Architect on AWS, Pentaho & Cía

Aprende a implementar soluciones de Cloud Big Data en la nube de AWS, desde la captura hasta su explotación y visualización en tiempo real por medio de laboratorios prácticos: Kinesis Firehose, Kinesis Data Stream, DMS, S3, DynamoDB, WCU, Redshift, Lambda, Glue, Databricks, EMR, Hadoop, HIve, Spark, VPC, AWS CLI, RDS, EC2, S3, Cloudwatch, Boto3, Athena, IAM y muchas otras herramientas. Aprenderás a usar todas estas herramientas por medio de patrones de diseño e integración con entornos de Data Lakes.

80.00
80.0 USD 80.00
80.00
Responsable Carlos Fierro
Última actualización 01/08/2023
Tiempo de finalización 19 minutos
Miembros 2
Data Engineer BI Analytics con Pentaho Spark Big Data Pentaho Databricks AWS
  • MÓDULO 1: Arquitectura AWS y Preparación de Entorno
    • Presentación de Conceptos Big Data, Analytics y Cloud
    • Fases de una Arquitectura Big Data Cloud
    • Presentación de Mix Tecnológico (almacenamiento, tratamiento, analítica, visualización, seguridad) existentes
    • Tipos de Servicios: IaaP, PaaS, SaaS
    • Preparación de Cuenta
    • Instalación de PgAdmin
    • Instalación de Termius SSH
  • MÓDULO 2: Despliegue de Infraestructura Básica de Procesamiento y Almacenamiento
    • Amazon RDS para Creación de Gestores de Bases de Datos
    • Administración Remota de RDS
    • Introducción a VPC y Firewalls sobre AWS
    • Amazon EC2 para despliegue de Máquinas Virtuales
    • Tipos de Instancia y Recomendaciones de Elección
    • Conexión Remota Segura con RSA y Pem
    • Gestión de Servidores Linux
    • Montado de Discos Duros sobre Máquinas Virtuales
  • MÓDULO 3: Integración On-Premise, Redes Virtuales y Sistemas de Archivos
    • Arquitectura de Integración On-Premise / AWS Despliegue de Servidores Gateway
    • Instalación de AWS CLI sobre el Gateway en Windows
    • Instalación de AWS CLI sobre el Gateway en Linux
    • Instalación de AWS CLI sobre el Gateway en MAC
    • Inicio de Sesión de AWS CLI sobre el Gateway
    • Habilitación de Cloud Shell
    • Comandos de AWS CLI
    • Amazon S3 para Sistemas de Archivos Distribuidos
    • Amazon VPC para Implementación de Redes Virtuales
    • Creación de Redes Subredes
    • FQDN y Emparejamiento sobre Redes Remotas
    • Habilitación y Bloqueo de IPs y Puertos
  • MÓDULO 4: Almacenamiento y Procesamiento Semi-Estructurado
    • DynamoDB para Almacenamiento Semi-Estructurado
    • Creación de Tablas sobre DynamoDB
    • Inserción Batch hacia DynamoDB desde el Portal Web
    • Conexión On-Premise hacia DynamoDB con Boto3
    • Operaciones sobre DynamoDB
    • Inserción Batchera Estructurada desde On-Premise hacia DynamoDB
    • Inserción Batchera Semi-Estructurada desde On-Premise hacia DynamoDB
    • Inserción Real-Time hacia DynamoDB
  • MÓDULO 5: Datawarehouse on AWS, Serverless, Gestión de Accesos y Logs
    • Administración de Accesos con IAM
    • Amazon Cloud Watch para Almacenamiento de Logs
    • Preparación de AWS Lambda para Procesamiento Serverless
    • Configuración de Parámetros y Log sobre AWS Lambda
    • Integración de AWS Lambda con S3
    • Integración de AWS Lambda con DynamoDB
    • Amazon Redshift para Construcción de Data Warehouses
    • Creación de Espacio de Nombres en Amazon Redshift
    • Carga de Datos hacia Amazon Redshift
    • Procesamiento y Construcción de Gráficos en Amazon Redshit
  • MÓDULO 6: Procesamiento Sobre Entornos de Big Data
    • Procesamiento en Entornos de Big Data con Spark
    • Lenguajes de Programación Disponibles
    • Databricks con Tecnología de Despliegue de Clústers
    • Montado con Storage Amazon S3 sobre Databricks
    • Lectura desde Amazon S3 hacia Spark
    • Procesamiento de Datos con Spark
    • Almacenamiento de Resultantes sobre Spark
  • MÓDULO 7: Datalake on AWS
    • Arquitectura Datalake sobre AWS
    • Taxonomía del Datalake sobre Amazon S3
    • AWS Glue para Implementación de Pasos de Procesamiento
    • Implementación de la Capa Landing-Tmp
    • Implementación de la Capa Universal
    • Implementación de la Capa Smart
    • Creación de Roles de Seguridad
    • Vistas Estructuradas con Amazon Athena
    • Clústers Elásticos con Amazon EMR
    • Orquestación de Procesos sobre AWS Step Functions
  • MÓDULO 8: Procesamiento sobre Entornos de Big Data
    • Arquitectura de Procesamiento Real-Time
    • Procesamiento de Datos en Real-Time sobre AWS
    • Creación de Streams sobre Kinesis Data Stream
    • Implementación de Producer sobre Kineses Data Stream
    • Visualización de Storm Data sobre Kinesis Data Stream
    • Integración de Kinesis Data Stream con Lambda
    • Integración de Kinesis Data Stream con Kinesis Firehose
    • Integración de Kinesis Data Stream con S3