Curso subvencionado presencial
Madrid
Duración : 50 Días
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Sedes
Localización
Fecha inicio
Temario completo de este curso
- Acerca de Apache Hadoop
- Acerca de Cloudera
- La motivación para Hadoop
- Problemas con los sistemas tradicionales de gran escala
- Cómo Hadoop aborda estos desafíos
- HDFS: El sistema de ficheros distribuidos de Hadoop
- El funcionamiento de MapReduce
- Anatomía de un cluster Hadoop
- Aplicaciones comunes y usos especiales de la solución Hadoop
- El ecosistema Hadoop
- Almacenamiento de datos: Hbase
- Integración de datos: Flume y Sqoop
- Procesamiento de datos: Spark
- Análisis de los datos: Hive, Pig e Impala
- Exploración de datos: Cloudera Search
- Integración de Hadoop en el CPD
- Herramientas para gestionar Hadoop
- Planificación del proyecto
MÓDULO 3: ANALISTA DE DATOS CLOUDERA
- Introducción
- Fundamentos Hadoop
- Introducción a Pig
- Análisis de datos básico con Pig
- Procesado de datos complejos con Pig
- Operaciones con multiconjuntos de datos con Pig
- Troubleshooting y optimización de Pig
- Introducción a Hive e Impala
- Consultas con Hive e Impala
- Administración de datos
- Almacenamiento y datos de rendimiento
- Análisis de datos relacional con Hive e Impala
- Trabajar con Impala
- Analizando texto y datos complejos con Hive
- Optimización Hive
- Extensión de Hive
- Elección de la mejor opción
- Conclusión