Ingeniería Matemática

Máster. Curso 2020/2021.

ESTADÍSTICA APLICADA Y MINERÍA DE DATOS - 604330

Curso Académico 2020-21

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG1 - Aprender a aplicar los conocimientos adquiridos y a explotar su potencial para la resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) en el tratamiento estadístico-computacional de la información.

CG2 - Elaborar adecuadamente y con originalidad argumentos motivados y proyectos de trabajo, redactar planes, así como formular hipótesis y conjeturas razonables en su área de especialización.

CG3 - Integrar los conocimientos adecuados y enfrentarse a la complejidad de emitir juicios en función de criterios, de normas externas o de reflexiones personales justificadas

CG4 - Comunicar y presentar públicamente ideas, procedimientos o informes de investigación, así como asesorar a personas u organizaciones en el tratamiento estadístico-computacional de la información. La presentación de estas ideas debe transmitir de forma clara y precisa las conclusiones de forma que sean entendidas tanto por el especialista como por el profano en temas estadístico-computacionales.

CG7 - Saber abstraer en un modelo matemático las propiedades y características esenciales de un problema real reconociendo su rango de aplicabilidad y limitaciones.

Transversales
CT1 - Saber aplicar sus conocimientos a su trabajo o vocación de una forma profesional y poseer las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y en la resolución de problemas y estudio de casos. Esto implica, más concretamente: Integrar creativamente conocimientos y aplicarlos a la resolución de problemas complejos, perseguir objetivos de calidad en el desarrollo de su actividad profesional, adquirir capacidad para la toma de decisiones y de dirección de recursos humanos, ser capaz de mostrar creatividad, iniciativa y espíritu emprendedor para afrontar los retos de su actividad, valorar la importancia de los métodos estadístico-computacionales en el contexto industrial, económico, administrativo, medio ambiental y social.

CT2 - Tener la capacidad de reunir e interpretar datos relevantes para emitir juicios que incluyan una reflexión sobre temas relevantes de índole científica, tecnológica y empresarial. Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
Específicas
CE1 - Adquisición de una formación sólida y rigurosa en temas avanzados de Estadística, Matemática computacional, Modelos estocásticos y Metodología de la toma de Decisiones aplicadas al tratamiento de la Información.

CE2 - Capacidad para planificar la resolución de un problema en función de las herramientas de que se disponga y, en su caso, de las restricciones de tiempo y
recursos.

CE3 - Capacidad para utilizar aplicaciones informáticas estadísticas, de cálculo numérico y simbólico, visualización gráfica, optimización u otras para resolver problemas con un elevado grado de complejidad.

CE4 - Desarrollar habilidades de aprendizaje en Estadística Computacional y Matemáticas, así como en sus respectivas aplicaciones, que permitan al alumno continuar estudiando y profundizando en la materia de modo autónomo, así como el desarrollo profesional con un alto grado de independencia.

CE5 - Resolver problemas y casos reales planteados en el tratamiento estadístico-computacional de la información generada en los ámbitos de la ciencia, la tecnología y la sociedad mediante habilidades de modelización matemática, estimación y computación.

CE7 - Capacidad de utilización de herramientas de búsqueda de recursos bibliográficos, así como manejo, gestión y análisis de grandes bases de datos.

ACTIVIDADES DOCENTES

Clases teóricas
Método expositivo
Clases prácticas
Estudio de casos
Prácticas de ordenador utilizando el software SAS, donde se pretende que los estudiantes aprendan a aplicar e interpretar las diferentes técnicas estudiadas.

Presenciales

3,6

No presenciales

5,4

Semestre

1

Breve descriptor:

Modelización analítica supervisada y no supervisada

Requisitos

Conocimientos de Probabilidad y Estadística. Inferencia Estadística.

Objetivos

Se trata de que el alumno adquiera los conocimientos suficientes para la aplicación adecuada de un conjunto de herramientas estadísticas para el análisis de datos además de adquirir los conocimientos teóricos que las sustentan. Los objetivos de estas técnicas son entre otros: (1) explicar posibles interrelaciones entre diferentes variables de interés asociadas al experimento en estudio, (2) resumir los conjuntos de datos con multiples variables mediante un conjunto reducido de nuevas variables, con la minima perdida de información (3) analizar las relaciones entre variables o entre individuos de un conjunto de datos, para formar grupos de clasificación con características similares (4) ajustar modelos para la clasificación/predicción de nuevas observaciones (5) modelización de series temporales, etc. Asimismo, se pretende que los estudiantes aprendan a aplicar e interpretar estas técnicas con SAS.

Contenido

1. Introducción a la minería de datos
2. Componentes principales
3. Análisis de correspondencias
4. Análisis cluster
5. Regresión lineal
6. Análisis discriminante
7. Metodologías de modelización supervisada
8. Árboles de decisión
9. Regresión logística
10. Redes neuronales
11. Ensamblaje de modelos: bagging, random forest, boosting, stacking
12. Series temporales

Evaluación

La nota se establecerá en función de los siguientes criterios:

- Asistencia: 10%
- Presentación de una práctica escrita en la que se apliquen las diferentes técnicas de modelización aprendidas: 90%

Bibliografía

1. Aznar, A., Trívez, F.J., “Métodos de predicción en economía II, Análisis de Series Temporales”, Ariel Economía 1993
2. Bishop, C.M., “Pattern Recognition and Machine Learning”, Springer 2006
3. Cuadras, C.M. Nuevos Métodos de Análisis Multivariante. Ed. CMC Editions Barcelona 2007
4. Hair-Anderson-Tatham-Black, “Análisis multivariante”, Prentice Hall 1999
5. Hastie, T., Tibshirani, R., Friedman, J., “The Elements of Statistical Learning”, Springer 2001
6. James, G., Witten, D., Hastie, T., Tibshirani, R., “An introduction to Statistical Learning”, Springer 2013
7. Johnson A.Richard, Wichern D.W. Applied Multivariate Statistical Analysis. Pearson International Ed 2007
8. Lebart, L.; Morineau, A.; Warwick, K.M. Multivariate Descriptive Statistical Analysis. New York John Wiley & sons 1984
9. Mardia, K.V.; Kent J.T.; Bibby, J.M. Multivariate Analysis.AcademicPress1979
10. Morrison, D. Multivariate Statistical Methods. Mac Graw Hill 1990
11. Peña D., Análisis de Datos Multivariante. Mac Graw Hill 2002
12. Peña, D., “Análisis de Series Temporales”, Alianza Editorial 2010

Otra información relevante

Profesorado:
Nombre – Despacho – Teléfono - Email
Carlos Rivero, Despacho 4, Edificio Central, Fac. Económicas, 913942304, crivero@ucm.es
Teresa Vázquez Gutiérrez, Despacho 303-K, Facultad de Matemáticas, 913944377, teresa.vazquez@ucm.es
Daniel Vélez Serrano, Despacho 504, Facultad de Matemáticas, 913944729, danvelez@ ucm.es

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único08/10/2020 - 28/01/2021MARTES 16:30 - 18:30INF3CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
JUEVES 16:30 - 18:30INF3CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ