Ingeniería Matemática

Máster. Curso 2022/2023.

ESTADÍSTICA APLICADA Y MINERÍA DE DATOS - 604330

Curso Académico 2022-23

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
CG1 - Aprender a aplicar los conocimientos adquiridos y a explotar su potencial para la resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) en el tratamiento estadístico-computacional de la información.

CG2 - Elaborar adecuadamente y con originalidad argumentos motivados y proyectos de trabajo, redactar planes, así como formular hipótesis y conjeturas razonables en su área de especialización.

CG3 - Integrar los conocimientos adecuados y enfrentarse a la complejidad de emitir juicios en función de criterios, de normas externas o de reflexiones personales justificadas

CG4 - Comunicar y presentar públicamente ideas, procedimientos o informes de investigación, así como asesorar a personas u organizaciones en el tratamiento estadístico-computacional de la información. La presentación de estas ideas debe transmitir de forma clara y precisa las conclusiones de forma que sean entendidas tanto por el especialista como por el profano en temas estadístico-computacionales.

CG7 - Saber abstraer en un modelo matemático las propiedades y características esenciales de un problema real reconociendo su rango de aplicabilidad y limitaciones.

Transversales
CT1 - Saber aplicar sus conocimientos a su trabajo o vocación de una forma profesional y poseer las competencias que suelen demostrarse por medio de la elaboración y defensa de argumentos y en la resolución de problemas y estudio de casos. Esto implica, más concretamente: Integrar creativamente conocimientos y aplicarlos a la resolución de problemas complejos, perseguir objetivos de calidad en el desarrollo de su actividad profesional, adquirir capacidad para la toma de decisiones y de dirección de recursos humanos, ser capaz de mostrar creatividad, iniciativa y espíritu emprendedor para afrontar los retos de su actividad, valorar la importancia de los métodos estadístico-computacionales en el contexto industrial, económico, administrativo, medio ambiental y social.

CT2 - Tener la capacidad de reunir e interpretar datos relevantes para emitir juicios que incluyan una reflexión sobre temas relevantes de índole científica, tecnológica y empresarial. Demostrar razonamiento crítico y gestionar información científica y técnica de calidad, bibliografía, bases de datos especializadas y recursos accesibles a través de Internet.
Específicas
CE1 - Adquisición de una formación sólida y rigurosa en temas avanzados de Estadística, Matemática computacional, Modelos estocásticos y Metodología de la toma de Decisiones aplicadas al tratamiento de la Información.

CE2 - Capacidad para planificar la resolución de un problema en función de las herramientas de que se disponga y, en su caso, de las restricciones de tiempo y
recursos.

CE3 - Capacidad para utilizar aplicaciones informáticas estadísticas, de cálculo numérico y simbólico, visualización gráfica, optimización u otras para resolver problemas con un elevado grado de complejidad.

CE4 - Desarrollar habilidades de aprendizaje en Estadística Computacional y Matemáticas, así como en sus respectivas aplicaciones, que permitan al alumno continuar estudiando y profundizando en la materia de modo autónomo, así como el desarrollo profesional con un alto grado de independencia.

CE5 - Resolver problemas y casos reales planteados en el tratamiento estadístico-computacional de la información generada en los ámbitos de la ciencia, la tecnología y la sociedad mediante habilidades de modelización matemática, estimación y computación.

CE7 - Capacidad de utilización de herramientas de búsqueda de recursos bibliográficos, así como manejo, gestión y análisis de grandes bases de datos.

ACTIVIDADES DOCENTES

Clases teóricas
Método expositivo de los contenidos teóricos
Clases prácticas
Estudio de casos
Prácticas de ordenador utilizando SAS y R, donde se pretende que los estudiantes aprendan a aplicar e interpretar las diferentes técnicas estudiadas.

Presenciales

3,6

No presenciales

5,4

Semestre

1

Breve descriptor:

Modelización analítica supervisada y no supervisada

Requisitos

Conocimientos de Probabilidad y Estadística. Inferencia Estadística.

Objetivos

Se trata de que el alumno adquiera los conocimientos suficientes para la aplicación adecuada de un conjunto de herramientas estadísticas para el análisis de datos además de adquirir los conocimientos teóricos que las sustentan. Los objetivos de estas técnicas son entre otros: (1) explicar posibles interrelaciones entre diferentes variables de interés asociadas al experimento en estudio, (2) resumir los conjuntos de datos con multiples variables mediante un conjunto reducido de nuevas variables, con la minima perdida de información (3) analizar las relaciones entre variables o entre individuos de un conjunto de datos, para formar grupos de clasificación con características similares (4) ajustar modelos para la clasificación/predicción de nuevas observaciones (5) modelización de series temporales, etc. Asimismo, se pretende que los estudiantes aprendan a aplicar e interpretar estas técnicas con SAS.

Contenido

1. Programación en SAS
2. Introducción a la minería de datos
3. Componentes principales
4. Análisis de correspondencias
5. Análisis cluster
6. Metodología de modelización supervisada
7. Análisis discriminante
8. Regresión lineal
9. Árboles de decisión
10. Regresión logística
11. Redes neuronales
12. Ensamblaje de modelos: bagging, random forest, boosting, stacking
13. Series temporales

Evaluación

La nota se establecerá en función de los siguientes criterios:

- Asistencia: 10%
- El contenido comprendido del tema 2 al tema 5 se cubrirá con la realización de una práctica que constituiría el 30% de la calificación global de la asignatura.
- El contenido comprendido del tema 6 al tema 12 se cubrirá con la realización de una práctica que constituiría el 30% de la calificación global de la asignatura.
- El contenido referente al tema 13 se cubrirá con la realización de una práctica que constituiría el 30% de la calificación global de la asignatura.

En caso de que alguna de las tres partes no resultase aprobada, dicha parte debería ser aprobada en la convocatoria extraordinaria, por lo que el alumno podría tener que realizar uno, dos o tres nuevas prácticas.

Bibliografía

1. Aznar, A., Trívez, F.J., Métodos de predicción en economía II, Análisis de Series Temporales. Ariel Economía 1993
2. Bishop, C.M., Pattern Recognition and Machine Learning. Springer 2006
3. Breiman, L., Friedman, J.H., Olshen, R.A. & Stone, C.J. (1984): Classification and Regression Trees. Wadsworth.
4. Cuadras, C.M. Nuevos Métodos de Análisis Multivariante. Ed. CMC Editions Barcelona 2007
5. Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking. Provost y Fawcett. Publisher: O'Reilly Media (2013).
6. Hair-Anderson-Tatham-Black, Análisis multivariante. Prentice Hall 1999
7. Hastie, T., Tibshirani, R., Friedman, J., The Elements of Statistical Learning. Springer 2001
8. James, G., Witten, D., Hastie, T., Tibshirani, R., An introduction to Statistical Learning. Springer 2013
9. Johnson A.Richard, Wichern D.W. Applied Multivariate Statistical Analysis. Pearson International Ed 2007
10. Lebart, L.; Morineau, A.; Warwick, K.M. Multivariate Descriptive Statistical Analysis. New York John Wiley & sons 1984
11. Mardia, K.V.; Kent J.T.; Bibby, J.M. Multivariate Analysis. Academic Press 1979
12. Morrison, D. Multivariate Statistical Methods. Mac Graw Hill 1990
13. Peña D., Análisis de Datos Multivariante. Mac Graw Hill 2002
14. Peña, D., Análisis de Series Temporales, Alianza Editorial 2010
15. Schutt, R.; O'Neil, C. (2013). Doing data science: Straight talk from the frontline. O'Reilly Media, Inc.

Otra información relevante

Profesorado:
Nombre – Despacho – Teléfono - Email
Daniel Vélez Serrano, Despacho 303I, Facultad de Matemáticas, danvelez@ucm.es
Carlos Rivero, Despacho 4, Edificio Central, Fac. Económicas, 913942304, crivero@ucm.es
Teresa Vázquez Gutiérrez, Despacho 303-K, Facultad de Matemáticas, 913944377, teresa.vazquez@ucm.es

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo Único03/10/2022 - 07/10/2022LUNES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
LUNES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
MARTES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
MARTES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
MIÉRCOLES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
MIÉRCOLES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
JUEVES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
JUEVES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
11/10/2022 - 09/02/2023MARTES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
JUEVES 19:00 - 21:00-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ
10/02/2023 - 10/02/2023VIERNES 16:30 - 18:30-CARLOS RIVERO RODRIGUEZ
DANIEL VELEZ SERRANO
MARIA TERESA VAZQUEZ GUTIERREZ