Instituto IMDEA Alimentación

Técnicas Estadísticas de Data Mining con R

Instituto IMDEA Alimentación

Curso
Presencial
28 Horas
  • Madrid
375 €

Descripción

Este curso reúne las técnicas estadísticas predictivas más usadas en Data Mining.

En este curso se han reunido una serie de técnicas procedentes de distintos campos como el análisis multivariante, el aprendizaje estadístico, la inteligencia artificial y técnicas de machine learning.



La mayoría de las técnicas presentadas son técnicas predictivas, cuyo objetivo principal es desarrollar un modelo matemático que permita obtener predicciones en una variable de interés en observaciones no incluidas en la construcción del modelo. Se han seleccionado las técnicas predictivas más importantes y cuyo uso está más extendido: regresión lineal y logística, métodos penalizados (LASSO), métodos basados en árboles (CART), support vector machines (SVM), redes neuronales, random forest, etc.



El curso incluye los aspectos más importantes para la construcción de modelos predictivos: preprocesamiento y descripción básica de los datos, optimización de los parámetros involucrados en cada una de las técnicas, evaluación de la capacidad predictiva de los modelos mediante técnicas de remuestreo (validación cruzada y bootstrapping), selección de variables que van a formar parte del modelo, comportamiento de cada técnica en problemas de alta dimensión, etc.


Ver más

Temario

El curso está dividido en 21 sesiones, con una duración variable de entre 1 y 2 horas, dependiendo de la importancia del tema.
En cada sesión se explican los conceptos estadísticos teóricos ilustrados desde un punto de vista práctico con ejemplos realizados con R, explicando los paquetes y funcionalidades más importantes del software para cada técnica. Finalmente, se proponen ejercicios a los alumnos para que puedan practicar los conocimientos adquiridos.

1. Introducción. Data Mining. Aprendizaje Supervisado y No Supervisado. Modelos.Predictivos. Clasificación y Regresión.
2. Nociones de R. Funciones y programación. Tratamiento de datos.
3. Análisis descriptivo. Pre-procesamiento de datos.
4. Análisis de Componentes Principales (PCA).
5. Análisis Clúster. Métodos Jerárquicos. K-means.
6. Análisis Discriminante Lineal (LDA). Clasificador Naïve Bayes.
7. Regresión Logística.
8. Medidas de Evaluación de Modelos. Medidas de capacidad predictiva. Curvas ROC.
9. Técnicas de Evaluación de Modelos. Validación cruzada. Muestras Bootstrap.
10. Regresión Lineal. Métodos de Regresión por pasos.
11. Regresión sobre Componentes Principales. Mínimos Cuadrados Parciales (PLS).
12. Métodos de Regresión Penalizados. Ridge Regression. LASSO.
13. Métodos basados en Vecindad y Núcleos. k-NN.
14. Redes Neuronales (NN).
15. Support Vector Machines (SVM).
16. Árboles de Regresión y Clasificación (CART).
17. Multiclasificadores. Bagging. Boosting.
18. Random Forest (RF).
19. Selección de Variables. Filter. Wrapper. Recursive Feature Elimination.
20. Caso práctico: Comparación de Modelos Predictivos.
21. Caso práctico: Evaluación de la Significación Estadística de un Clasificador mediante Test de Permutaciones.
Ver más

Requisitos

Para el máximo aprovechamiento del módulo, son necesarios conocimientos de R y de Estadística, incluido modelos de regresión (en caso de duda contacten con los profesores del módulo)


Plazas

16

Duración

4 días. 12, 13, 14 y 15 de Diciembre de 2016.

Precio

375 €
Se entrega material.

Sí, me interesa

conocer todos los detalles, precios, becas, fechas y plazas disponibles

Técnicas Estadísticas de Data Mining con R

Para contactar debes aceptar la política de privacidad
Enviando este formulario acepta recibir información periódica de Educaweb relacionada con estos cursos.
También te recomendamos estos cursos

Técnicas Estadísticas de Data Mining con R