¿Qué quieres aprender?

ANALISTA DE DATOS BIG DATA CLOUDERA

ANALISTA DE DATOS BIG DATA CLOUDERA

Grupo Colon-IECM

Curso subvencionado presencial

Madrid


Gratis

Duración : 50 Días

¿Quieres hablar con un asesor sobre este curso?

Sedes

Localización

Fecha inicio

Madrid
Marzo 2023

Temario completo de este curso

MÓDULO 1: FUNDAMENTOS DE SQL
- Introducción
- Base de datos básica
- Estructura de base de datos
- El uso de SQL
- Creación de una base de datos
- Las consultas básicas
- Mantenimiento de la Base de datos
- Copia de tablas y modificaciones de columnas
- Índices y restricciones
- Eliminar o modificar filas de la tabla de datos
- Funciones: uso y tipos - Funciones específicas
- Joins
- Exportación de datos, consultas y utilidades
- Importación de datos y de archivos de datos
- Importación con sentencias y utilidades
- Subconsultas generales y básicas
- Subconsulta no correlacionada y correlacionada
- Tipos de subconsultas
- Modificación de la tabla con subconsultas
- Motores de almacenamiento
- Creación de Vistas
- Transacciones
- Recuperación de Metadatos
- Conclusiones
MÓDULO 2: FUNDAMENTOS DE CLOUDERA APACHE HADOOP

- Acerca de Apache Hadoop

- Acerca de Cloudera

- La motivación para Hadoop

- Problemas con los sistemas tradicionales de gran escala

- Cómo Hadoop aborda estos desafíos

- HDFS: El sistema de ficheros distribuidos de Hadoop

- El funcionamiento de MapReduce

- Anatomía de un cluster Hadoop

- Aplicaciones comunes y usos especiales de la solución Hadoop

- El ecosistema Hadoop

- Almacenamiento de datos: Hbase

- Integración de datos: Flume y Sqoop

- Procesamiento de datos: Spark

- Análisis de los datos: Hive, Pig e Impala

- Exploración de datos: Cloudera Search

- Integración de Hadoop en el CPD

- Herramientas para gestionar Hadoop

- Planificación del proyecto
MÓDULO 3: ANALISTA DE DATOS CLOUDERA

- Introducción

- Fundamentos Hadoop

- Introducción a Pig

- Análisis de datos básico con Pig

- Procesado de datos complejos con Pig

- Operaciones con multiconjuntos de datos con Pig

- Troubleshooting y optimización de Pig

- Introducción a Hive e Impala

- Consultas con Hive e Impala

- Administración de datos

- Almacenamiento y datos de rendimiento

- Análisis de datos relacional con Hive e Impala

- Trabajar con Impala

- Analizando texto y datos complejos con Hive

- Optimización Hive

- Extensión de Hive

- Elección de la mejor opción

- Conclusión

Ver más