Culture Lab

Curso de Big Data con Apache Hadoop y Apache Spark

Culture Lab

Curso
Presencial | On-line | Semi-presencial
  • Madrid
250 €

Descripción

Apache Hadoop y Apache Spark componen una simbiosis perfecta para desarrollar tus proyectos Big Data de alto nivel. Con este curso de conseguirás las herramientas y conocimientos necesarios para dar sus primeros pasos en este campo con total seguridad y eficacia. Se explica en forma clara y simple las diferentes etapas de un proyecto, con ejemplos prácticos que ayudan a comprender los diferentes conceptos.

Para lograr todo esto se utilizarán librerías específicas como Apache Hadoop y Apache Spark.

Temario

1. Introducción a tecnologías Big Data, Apache Hadoop y Apache Spark.
  • ¿Qué es Big Data y qué hay de nuevo?
  • Principales tecnologías Big Data.
  • Apache Hadoop: plataforma de almacenamiento y procesamiento de datos.
  • Apache Spark: procesamiento de datos.
2. Apache Hadoop: Core.
  • Almacenamiento de datos en Hadoop: HDFS.
  • Gestión de recursos y tareas: YARN.
  • Instalación, administración y monitorización del cluster con Apache Ambari.
  • Seguridad y gobierno de datos.
3. Ingesta y transformación de datos en Apache Hadoop.
  • Apache Sqoop: intercambio de datos con bases de datos relacionales.
  • Apache Flume y Apache Kafka: ingesta de datos.
  • Apache Pig: transformación de datos en Hadoop.
  • Herramientas ETL: Informatica PowerCenter, Pentaho Kettle.
4. Acceso y explotación de datos en Apache Hadoop.
  • MapReduce: "antiguo" framework de procesamiento de datos.
  • Apache HBase: NoSQL sobre Hadoop.
  • Apache Hive: SQL sobre Hadoop.
  • Otras tecnologías de SQL sobre Hadoop: Cloudera Impala, Apache Drill, Apache Phoenix.
  • Procesamiento de eventos en tiempo real con Apache Storm.
5. Apache Spark.
  • Introducción a Apache Spark. Spark vs MapReduce vs Tez
  • Introducción a Scala.
  • Conceptos básicos, RDDs, transformaciones y acciones.
  • Desarrollo de aplicaciones con Spark.
6. Spark streaming.
  • Introducción a Spark Streaming
  • Casos de uso. Apache Storm vs Spark Streaming.
  • Desarrollo de aplicaciones realtime con Spark Streaming.
Ver más

Destinatarios

El curso está principalmente orientado a:  

  • Desarrolladores

  • Programadores

  • Analistas de datos

  • Interesados en conocer el desarrollo Big Data con Hadoop y Spark así como sus posibilidades de implantación



Requisitos

Requisitos técnicos:

 

  • Para poder realizar el curso, los alumnos deberán tener experiencia previa en programación Java o similares, así como nociones en bases de datos SQL o similares.

  • Para realizar el curso es necesario contar con un equipo con procesador Intel i7,  con 16 GB de memoria RAM.

  • Para poder completar todas las prácticas del curso se recomienda disponer de un ordenador con VirtualBox, Vagrant y el cliente de git instalados en Linux, Windows o Mac OS. Esto permitirá crear de forma automática una máquina virtual para trabajar con MongoDB y otra para trabajar con Hadoop.



Metodología

Podrás realizar el curso a través de tu ordenador, móvil o tablet para realizar el curso cómodamente y a tu ritmo
Durante el curso tendrás que completar 7 temas dedicados, con un total 130 lecciones, 20 prácticas y 2 exámenes tipo test durante la formación estimados en 25 horas.
En el momento que lo necesites podrás efectuar tus consultas al formador, a través de correo electrónico, para resolver tus dudas relativas al curso.
Una vez finalizada la formación, recibirás un Certificado del curso emitido por Culture Lab TS S.L.

Fecha Límite:

Una vez inscrito en el curso Online, tendrás acceso a todo el contenido durante los próximos 3 meses.

Duración

25 horas aproximadamente.

Objetivos


  • Entenderás el conjunto de tecnologías que dan soporte a Big Data y el posicionamiento de cada una.

  • Conocerás y practicarás con los componentes asociados al ecosistema Hadoop: Hive, HDFS, Pig, etc.

  • Conocerás Apache Spark y serás capaz de desarrollar programas de análisis de datos con esta tecnología.

  • En resumen, estarás preparado para participar en un proyecto Big Data real.



Precio

250 €
El curso tiene un coste de 250 euros exentos de IVA en modalidad Online

Sí, me interesa

conocer todos los detalles, precios, becas, fechas y plazas disponibles

Curso de Big Data con Apache Hadoop y Apache Spark

Para contactar debes aceptar la política de privacidad
Enviando este formulario acepta recibir información periódica de Educaweb relacionada con estos cursos.
También te recomendamos estos cursos

Curso de Big Data con Apache Hadoop y Apache Spark