Curso de Big Data Science
Información del curso
Curso
On-line
300 horas
Precio 2.596 €
Descripción
¿Qué es Big Data? Es el conjunto de datos, cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) dificultan su captura, gestión, procesamiento o análisis mediante tecnologías y herramientas convencionales, tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización, dentro del tiempo necesario para que sean útiles.
Temario
1) Módulo 1: Introducción a los sistemas Informáticos y tecnologías Big Data
- Principales componentes de un sistema informático. Sistemas Operativos, para que sirven, que tipos hay y cómo funcionan…
- Introducción a GNU/Linux
- GNU/Linux Avanzado
- Como usar GNU/Linux en Cloud (AWS)
- Introducción teórica a las tecnologías Big Data: Bases de Datos SQL/No SQL, Computación distribuida, Cloud…
2) Módulo 2: Fundamentos de Programación en Python
- Introducción a los lenguajes de programación
- Python: Sentencias Básicas y Bloques Lógicos
- Python: Funciones y Scope
- Python: Clases y Objetos y Tratamiento de Excepciones
- Python: Módulos y Uso de librerías de Python
3) Módulo 3: Análisis de Datos con Python
- Python: Librerías básicas de Data Science: Pandas, Numpy, Matplotlib, Sklearn…
- Introducción teórica al análisis exploratorio de Datos
- Python: Ejemplificación del análisis exploratorio de datos mediate Datasets reales
4) Módulo 4: Introducción al Machine Learning
- Desambiguación de términos: ¿Machine Learning? ¿Deep Learning? ¿Data Science? ¿Big Data? Machine Learning: Aprendizaje supervisado (regresión/clasificación), no supervisado y por refuerzo.
- Nuestros primeros pasos con el Machine Learning: Regresión Lineal y Regresión Logística. Ejemplos con datos reales en Python.
4.1) Módulo 4.1: Introducción a la IA Generativa
- ¿Como aprovechar los recientes avances en IA generativa? Panorama actual de tecnologías más relevantes por campo:
- Usando la API de Open AI para crear nuestros primeros chatbots basados en ChatGPT.
5) Módulo 5: Bases de Datos Big Data
- Introducción a las Bases de datos SQL
- Programación en Python con SQLite
- Bases de datos NoSQL: Clave-Valor, Columnares, Documentales y de Grafos
- Bases de Datos NoSQL Documentales: MongoDB (PyMongo)
6) Módulo 6: Procesamiento Distribuido
- Funcionamiento de un sistema Big Data de Procesamiento Distribuido: Ingestión, Almacenamiento, Gestión de Recursos, Cálculo Distribuido…
- Hadoop
- Introducción a Spark: pySpark y DataFrame API
- Machine Learning con Spark ML
- PySpark Pandas
7) Módulo 7: TFM (Opcional)
- El alumno presentará una propuesta de proyecto de en el que se utilicen tecnologías Big Data y lenguaje de Python para resolver un caso de negocio al docente.
- Una vez aprobada la propuesta el alumno lo realizará
- Al entregarlo el docente dará su feedback y si este es positivo el alumno tendrá una mención especial en su diploma y prioridad en nuestra bolsa de empleo.
Herramientas y librerías que aprenderás.
- Principales componentes de un sistema informático. Sistemas Operativos, para que sirven, que tipos hay y cómo funcionan…
- Introducción a GNU/Linux
- GNU/Linux Avanzado
- Como usar GNU/Linux en Cloud (AWS)
- Introducción teórica a las tecnologías Big Data: Bases de Datos SQL/No SQL, Computación distribuida, Cloud…
2) Módulo 2: Fundamentos de Programación en Python
- Introducción a los lenguajes de programación
- Python: Sentencias Básicas y Bloques Lógicos
- Python: Funciones y Scope
- Python: Clases y Objetos y Tratamiento de Excepciones
- Python: Módulos y Uso de librerías de Python
3) Módulo 3: Análisis de Datos con Python
- Python: Librerías básicas de Data Science: Pandas, Numpy, Matplotlib, Sklearn…
- Introducción teórica al análisis exploratorio de Datos
- Python: Ejemplificación del análisis exploratorio de datos mediate Datasets reales
4) Módulo 4: Introducción al Machine Learning
- Desambiguación de términos: ¿Machine Learning? ¿Deep Learning? ¿Data Science? ¿Big Data? Machine Learning: Aprendizaje supervisado (regresión/clasificación), no supervisado y por refuerzo.
- Nuestros primeros pasos con el Machine Learning: Regresión Lineal y Regresión Logística. Ejemplos con datos reales en Python.
4.1) Módulo 4.1: Introducción a la IA Generativa
- ¿Como aprovechar los recientes avances en IA generativa? Panorama actual de tecnologías más relevantes por campo:
- Texto: ChatGPT, Bard, LLaMA…
- Imagen: Dalle, Midjourney, Stable Diffusion…
- Usando la API de Open AI para crear nuestros primeros chatbots basados en ChatGPT.
5) Módulo 5: Bases de Datos Big Data
- Introducción a las Bases de datos SQL
- Programación en Python con SQLite
- Bases de datos NoSQL: Clave-Valor, Columnares, Documentales y de Grafos
- Bases de Datos NoSQL Documentales: MongoDB (PyMongo)
6) Módulo 6: Procesamiento Distribuido
- Funcionamiento de un sistema Big Data de Procesamiento Distribuido: Ingestión, Almacenamiento, Gestión de Recursos, Cálculo Distribuido…
- Hadoop
- Introducción a Spark: pySpark y DataFrame API
- Machine Learning con Spark ML
- PySpark Pandas
7) Módulo 7: TFM (Opcional)
- El alumno presentará una propuesta de proyecto de en el que se utilicen tecnologías Big Data y lenguaje de Python para resolver un caso de negocio al docente.
- Una vez aprobada la propuesta el alumno lo realizará
- Al entregarlo el docente dará su feedback y si este es positivo el alumno tendrá una mención especial en su diploma y prioridad en nuestra bolsa de empleo.
Herramientas y librerías que aprenderás.
- Python
- Linux
- Jupyter Lab
- Pycharm
- AWS
- Spark (PySpark, Spark MLlib, PySpak Pandas)
- Hadoop (HDFS, YARN)
- Mongo DB
- NumPy
- Pandas
- Matplotlib
- Sklearn
- ChatGPT
- DALL·E 3
- OpenAI API
- Chatbots
Destinatarios
- Para realizar nuestro curso en Big Data Science no es necesario que dispongas de titulaciones académicas previas. Si estás en alguna de estas situaciones este curso es para ti.
- Personas sin conocimientos técnicos: Estás en situación de desempleo o quieres cambiar de área a una que ofrezca grandes posibilidades laborales.
- Personas con pocos conocimientos técnicos: Has visto algo por tu cuenta o realizado alguna formación, pero deseas aprender más y dedicarte profesionalmente al Big Data.
- Personas que ya trabajan en el área tecnológica: eres programador y deseas aprender nuevas herramientas y tecnologías para desarrollarte profesionalmente.
Requisitos
Para realizar el máster no necesitas ningún requisito académico previo, tan solo tienes que disponer de algunos conocimientos en programación.
Metodología
Clases en directo: Todas las semanas podrás visualizar una clase desde cualquier parte del mundo, rompiendo las barreras geográficas, y accediendo desde cualquier dispositivo, ya sea desde el móvil, una tablet o el ordenador.
24 horas 7 días a la semana: Acceso al campus online siempre que desees.
Proyecto fin de curso.
Idiomas en los que se imparte
Español
Duración
Duración: 300 horas.
Inicio: A consultar.
Objetivos
- Uso y gestión de datos en bases de datos relacionales, como fuente de datos para los programas.
- Conocer funcionamiento y uso de las bd NOSQL en relación a las bases de datos tradicionales.
- Adquirir las bases necesarias del lenguaje java, para su posterior aplicación en el desarrollo de programas, así como uso de la interface gráfica, gestión de ficheros y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.
- Adquirir las bases necesarias del lenguaje Python, para su posterior aplicación en el desarrollo de programas, y pruebas unitarias, combinadas con la utilización de patrones y buenas prácticas de programación.
- Conocer las formas de procesamiento/almacenamiento de datos a gran escala. Ecosistema Hadoop.
- Conocer la programación funcional en Scala para su posterior uso en Spark.
- Conocer la arquitectura Spak y su impacto en el mundo Big Data. Procesamiento a gran escala con Spark.
Titulación obtenida
Una vez que finalices el curso conseguirás 6 titulaciones:
Máster en Big Data Science.
Iniciación a GNU/Linux.
Desarrollo en Python avanzado.
Análisis de datos y visualización con Python.
Big Data Avanzado.
Iniciación al Machine Learning.
Prácticas
Sí.
Perspectivas laborales
Trabajar como Data Engineer, Data Analyst o Data Scientist especializado en Big Data.
Actuar como Ingeniero de Software y programador en proyectos de ingeniería y consultoría relacionados con el dato.
Ser arquitecto y administrador de sistemas Big Data.
Liderar proyectos de datos como experto en Big Data.
Promociones
Descuentos y becas disponibles.
Precio
Precio 2.596 €
Precio: 2.596,75 euros.
Ventajas del curso
Curso de iniciación incluido.
Profesores expertos.
Formación online tutorizada.
Clases/tutorías en directo.
Formación basada en la práctica y en el desarrollo de ejercicios.
Programa de becas personalizadas.
Bolsa de empleo
Acceso a Bolsa de Empleo
Profesorado
Profesores expertos. El claustro docente se distingue por ser expertos en la materia y trabajadores en activo del mundo digital.
Curso de Big Data Science
Grupo Atrium TIC
Campus y sedes: Grupo Atrium TIC
Grupo Atrium TIC
C/ Cartagena, 58 bajo, 28028 Madrid
28028
Madrid
Cursos más populares