Curso de Big Data Science

Curso
On-line
300 horas
Precio 2.596 €

Descripción

¿Qué es Big Data? Es el conjunto de datos, cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.

Temario

1) Módulo 1: Introducción a los sistemas Informáticos y tecnologías Big Data
- Principales componentes de un sistema informático. Sistemas Operativos, para que sirven, que tipos hay y cómo funcionan…
- Introducción a GNU/Linux
- GNU/Linux Avanzado
- Como usar GNU/Linux en Cloud (AWS)
- Introducción teórica a las tecnologías Big Data: Bases de Datos SQL/No SQL, Computación distribuida, Cloud…
 
2) Módulo 2: Fundamentos de Programación en Python
- Introducción a los lenguajes de programación
- Python: Sentencias Básicas y Bloques Lógicos
- Python: Funciones y Scope
- Python: Clases y Objetos y Tratamiento de Excepciones
- Python: Módulos y Uso de librerías de Python
 
3) Módulo 3: Análisis de Datos con Python
- Python: Librerías básicas de Data Science: Pandas, Numpy, Matplotlib, Sklearn…
- Introducción teórica al análisis exploratorio de Datos
- Python: Ejemplificación del análisis exploratorio de datos mediate Datasets reales
 
 4) Módulo 4: Introducción al Machine Learning
- Desambiguación de términos: ¿Machine Learning? ¿Deep Learning? ¿Data Science? ¿Big Data? Machine Learning: Aprendizaje supervisado (regresión/clasificación), no supervisado y por refuerzo.
- Nuestros primeros pasos con el Machine Learning: Regresión Lineal y Regresión Logística. Ejemplos con datos reales en Python.
 
4.1) Módulo 4.1: Introducción a la IA Generativa
- ¿Como aprovechar los recientes avances en IA generativa? Panorama actual de tecnologías más relevantes por campo:
  • Texto: ChatGPT, Bard, LLaMA…
  • Imagen: Dalle, Midjourney, Stable Diffusion…
- ¿Qué es el Prompt Engineering? ¿Es quizás una de las profesiones del futuro¿
- Usando la API de Open AI para crear nuestros primeros chatbots basados en ChatGPT.
 
5) Módulo 5: Bases de Datos Big Data
- Introducción a las Bases de datos SQL
- Programación en Python con SQLite
- Bases de datos NoSQL: Clave-Valor, Columnares, Documentales y de Grafos
- Bases de Datos NoSQL Documentales: MongoDB (PyMongo)
 
6) Módulo 6: Procesamiento Distribuido
- Funcionamiento de un sistema Big Data de Procesamiento Distribuido: Ingestión, Almacenamiento, Gestión de Recursos, Cálculo Distribuido…
- Hadoop
- Introducción a Spark: pySpark y DataFrame API
- Machine Learning con Spark ML
- PySpark Pandas
 
7) Módulo 7: TFM (Opcional)
- El alumno presentará una propuesta de proyecto de en el que se utilicen tecnologías Big Data y lenguaje de Python para resolver un caso de negocio al docente.
- Una vez aprobada la propuesta el alumno lo realizará
- Al entregarlo el docente dará su feedback y si este es positivo el alumno tendrá una mención especial en su diploma y prioridad en nuestra bolsa de empleo.
 
Herramientas y librerías que aprenderás.
  • Python
  • Linux
  • Jupyter Lab
  • Pycharm
  • AWS
  • Spark (PySpark, Spark MLlib, PySpak Pandas)
  • Hadoop (HDFS, YARN)
  • Mongo DB
  • NumPy
  • Pandas
  • Matplotlib
  • Sklearn
  • ChatGPT
  • DALL·E 3
  • OpenAI API
  • Chatbots

Destinatarios

  • Para realizar nuestro curso en Big Data Science no es necesario que dispongas de titulaciones académicas previas. Si estás en alguna de estas situaciones este curso es para ti.
  • Personas sin conocimientos técnicos: Estás en situación de desempleo o quieres cambiar de área a una que ofrezca grandes posibilidades laborales.
  • Personas con pocos conocimientos técnicos: Has visto algo por tu cuenta o realizado alguna formación, pero deseas aprender más y dedicarte profesionalmente al Big Data.
  • Personas que ya trabajan en el área tecnológica: eres programador y deseas aprender nuevas herramientas y tecnologías para desarrollarte profesionalmente.

Requisitos

Para realizar el máster no necesitas ningún requisito académico previo, tan solo tienes que disponer de algunos conocimientos en programación.
 

Metodología

Clases en directo: Todas las semanas podrás visualizar una clase desde cualquier parte del mundo, rompiendo las barreras geográficas, y accediendo desde cualquier dispositivo, ya sea desde el móvil, una tablet o el ordenador. 24 horas 7 días a la semana: Acceso al campus online siempre que desees. Proyecto fin de curso.

Idiomas en los que se imparte

Español

Duración

Duración: 300 horas. Inicio: A consultar.

Objetivos

  • Uso y gestión de datos en bases de datos relacionales, como fuente de datos para los programas.
  • Conocer funcionamiento y uso de las bd NOSQL en relación a las bases de datos tradicionales.
  • Adquirir las bases necesarias del lenguaje java, para su posterior aplicación en el desarrollo de programas, así como uso de la interface gráfica, gestión de ficheros y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.
  • Adquirir las bases necesarias del lenguaje Python, para su posterior aplicación en el desarrollo de programas, y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.
  • Conocer las formas de procesamiento/almacenamiento de datos a gran escala. Ecosistema Hadoop.
  • Conocer la programación funcional en Scala para su posterior uso en Spark.
  • Conocer la arquitectura Spak y su impacto en el mundo Big Data. Procesamiento a gran escala con Spark.

Titulación obtenida

Una vez que finalices el curso conseguirás 6 titulaciones: Máster en Big Data Science. Iniciación a GNU/Linux. Desarrollo en Python avanzado. Análisis de datos y visualización con Python. Big Data Avanzado. Iniciación al Machine Learning.

Prácticas

Sí.

Perspectivas laborales

Trabajar como Data Engineer, Data Analyst o Data Scientist especializado en Big Data. Actuar como Ingeniero de Software y programador en proyectos de ingeniería y consultoría relacionados con el dato. Ser arquitecto y administrador de sistemas Big Data. Liderar proyectos de datos como experto en Big Data.

Promociones

Descuentos y becas disponibles.

Precio

Precio 2.596 €
Precio: 2.596,75 euros.

Ventajas del curso

Curso de iniciación incluido. Profesores expertos. Formación online tutorizada. Clases/tutorías en directo. Formación basada en la práctica y en el desarrollo de ejercicios. Programa de becas personalizadas.

Bolsa de empleo

Acceso a Bolsa de Empleo

Profesorado

Profesores expertos. El claustro docente se distingue por ser expertos en la materia y trabajadores en activo del mundo digital.
Curso de Big Data Science
Grupo Atrium TIC
Campus y sedes: Grupo Atrium TIC
Grupo Atrium TIC
C/ Cartagena, 58 bajo, 28028 Madrid 28028 Madrid
Cursos más populares
Solicita información
X