De qué trata este curso:
Este curso cubre todos los aspectos fundamentales de Apache Spark streaming con Python, y te enseña todo lo que necesitas saber sobre el desarrollo de aplicaciones Apache Spark.
Al final de este curso, obtendrás un conocimiento profundo sobre Apache Spark streaming, así como habilidades generales de manejo y análisis de big data para ayudar a tu empresa o proyecto a adaptar Apache Spark para la construcción de un pipeline de procesamiento de big data y aplicaciones de análisis de datos.
Este curso sera absolutamente critico para cualquiera que quiera dominar Data Science hoy en día.
Emagister S.L. (responsable) tratará tus datos personales con la finalidad de gestionar el envío de solicitudes de información y comunicaciones promocionales de formación con tu consentimiento. Ejerce tus derechos de acceso, supresión, rectificación, limitación, portabilidad y otros, según se indica en nuestra política de privacidad.
Objetivos
Resumen general de la arquitectura de Apache Spark. Se capaz de trabajar con la abstracción principal de Apache Spark, RDDs o conjuntos de datos distribuidos y resilientes, para procesar y analizar grandes conjuntos de datos. Desarrollar aplicaciones Apache Spark 2.0, utilizando transformaciones y acciones en RDD y Spark SQL. Escalar aplicaciones Spark a un clúster Hadoop YARN a través del servicio Elastic MapReduce de Amazon. Analizar datos estructurados y semiestructurados utilizando conjuntos de datos (Datasets) y Dataframes, y entender a detalle el funcionamiento de Spark SQL. Compartir información a través de diferentes nodos en un clúster de Apache Spark, mediante variables de difusión y acumuladores. Técnicas avanzadas para optimizar y mejorar, trabajos de Apache Spark mediante el particionado, almacenamiento en caché y la persistencia de RDDs. Buenas prácticas de trabajo con Apache Spark
A quién va dirigido
Cualquier persona que quiera entender completamente cómo funciona Apache Spark, y cómo se usa Apache Spark en la industria. Ingenieros de software que deseen desarrollar aplicaciones con Apache Spark 2.0 utilizando Spark Core y Spark SQL. Científicos de datos o ingenieros de datos que quieran avanzar en su carrera mejorando sus habilidades de procesamiento de Big Data.
Requisitos
Una computadora con sistema operativo Windows, OSX o Linux Tener conocimientos previos de programación con Python
Temario completo de este curso