Big Data Architect on AWS, Pentaho & Cía
Aprende a implementar soluciones de Cloud Big Data en la nube de AWS, desde la captura hasta su explotación y visualización en tiempo real por medio de laboratorios prácticos: Kinesis Firehose, Kinesis Data Stream, DMS, S3, DynamoDB, WCU, Redshift, Lambda, Glue, Databricks, EMR, Hadoop, HIve, Spark, VPC, AWS CLI, RDS, EC2, S3, Cloudwatch, Boto3, Athena, IAM y muchas otras herramientas. Aprenderás a usar todas estas herramientas por medio de patrones de diseño e integración con entornos de Data Lakes.
$ 80.00
80.0
USD
$ 80.00
Responsable | Carlos Fierro |
---|---|
Última actualización | 01/08/2023 |
Tiempo de finalización | 19 minutos |
Miembros | 2 |
Share This Course
Compartir enlace
Share on Social Media
Share by Email
Por favor iniciar sesión para compartir esto Big Data Architect on AWS, Pentaho & Cía por correo.
Data Engineer
BI Analytics con Pentaho
Spark
Big Data
Pentaho
Databricks
AWS
-
MÓDULO 1: Arquitectura AWS y Preparación de Entorno
-
Presentación de Conceptos Big Data, Analytics y Cloud
-
Fases de una Arquitectura Big Data Cloud
-
Presentación de Mix Tecnológico (almacenamiento, tratamiento, analítica, visualización, seguridad) existentes
-
Tipos de Servicios: IaaP, PaaS, SaaS
-
Preparación de Cuenta
-
Instalación de PgAdmin
-
Instalación de Termius SSH
-
-
MÓDULO 2: Despliegue de Infraestructura Básica de Procesamiento y Almacenamiento
-
Amazon RDS para Creación de Gestores de Bases de Datos
-
Administración Remota de RDS
-
Introducción a VPC y Firewalls sobre AWS
-
Amazon EC2 para despliegue de Máquinas Virtuales
-
Tipos de Instancia y Recomendaciones de Elección
-
Conexión Remota Segura con RSA y Pem
-
Gestión de Servidores Linux
-
Montado de Discos Duros sobre Máquinas Virtuales
-
-
MÓDULO 3: Integración On-Premise, Redes Virtuales y Sistemas de Archivos
-
Arquitectura de Integración On-Premise / AWS Despliegue de Servidores Gateway
-
Instalación de AWS CLI sobre el Gateway en Windows
-
Instalación de AWS CLI sobre el Gateway en Linux
-
Instalación de AWS CLI sobre el Gateway en MAC
-
Inicio de Sesión de AWS CLI sobre el Gateway
-
Habilitación de Cloud Shell
-
Comandos de AWS CLI
-
Amazon S3 para Sistemas de Archivos Distribuidos
-
Amazon VPC para Implementación de Redes Virtuales
-
Creación de Redes Subredes
-
FQDN y Emparejamiento sobre Redes Remotas
-
Habilitación y Bloqueo de IPs y Puertos
-
-
MÓDULO 4: Almacenamiento y Procesamiento Semi-Estructurado
-
DynamoDB para Almacenamiento Semi-Estructurado
-
Creación de Tablas sobre DynamoDB
-
Inserción Batch hacia DynamoDB desde el Portal Web
-
Conexión On-Premise hacia DynamoDB con Boto3
-
Operaciones sobre DynamoDB
-
Inserción Batchera Estructurada desde On-Premise hacia DynamoDB
-
Inserción Batchera Semi-Estructurada desde On-Premise hacia DynamoDB
-
Inserción Real-Time hacia DynamoDB
-
-
MÓDULO 5: Datawarehouse on AWS, Serverless, Gestión de Accesos y Logs
-
Administración de Accesos con IAM
-
Amazon Cloud Watch para Almacenamiento de Logs
-
Preparación de AWS Lambda para Procesamiento Serverless
-
Configuración de Parámetros y Log sobre AWS Lambda
-
Integración de AWS Lambda con S3
-
Integración de AWS Lambda con DynamoDB
-
Amazon Redshift para Construcción de Data Warehouses
-
Creación de Espacio de Nombres en Amazon Redshift
-
Carga de Datos hacia Amazon Redshift
-
Procesamiento y Construcción de Gráficos en Amazon Redshit
-
-
MÓDULO 6: Procesamiento Sobre Entornos de Big Data
-
Procesamiento en Entornos de Big Data con Spark
-
Lenguajes de Programación Disponibles
-
Databricks con Tecnología de Despliegue de Clústers
-
Montado con Storage Amazon S3 sobre Databricks
-
Lectura desde Amazon S3 hacia Spark
-
Procesamiento de Datos con Spark
-
Almacenamiento de Resultantes sobre Spark
-
-
MÓDULO 7: Datalake on AWS
-
Arquitectura Datalake sobre AWS
-
Taxonomía del Datalake sobre Amazon S3
-
AWS Glue para Implementación de Pasos de Procesamiento
-
Implementación de la Capa Landing-Tmp
-
Implementación de la Capa Universal
-
Implementación de la Capa Smart
-
Creación de Roles de Seguridad
-
Vistas Estructuradas con Amazon Athena
-
Clústers Elásticos con Amazon EMR
-
Orquestación de Procesos sobre AWS Step Functions
-
-
MÓDULO 8: Procesamiento sobre Entornos de Big Data
-
Arquitectura de Procesamiento Real-Time
-
Procesamiento de Datos en Real-Time sobre AWS
-
Creación de Streams sobre Kinesis Data Stream
-
Implementación de Producer sobre Kineses Data Stream
-
Visualización de Storm Data sobre Kinesis Data Stream
-
Integración de Kinesis Data Stream con Lambda
-
Integración de Kinesis Data Stream con Kinesis Firehose
-
Integración de Kinesis Data Stream con S3
-