Ciencia de los Datos Aplicada
Grado y Doble Grado. Curso 2024/2025.
APRENDIZAJE SUPERVISADO III - 806319
Curso Académico 2024-25
Datos Generales
- Plan de estudios: 081C - GRADO EN CIENCIA DE LOS DATOS APLICADA (2022-23)
- Carácter: Obligatoria
- ECTS: 6.0
SINOPSIS
COMPETENCIAS
Generales
Específicas
ACTIVIDADES DOCENTES
Presenciales
No presenciales
Semestre
Objetivos
Este curso se centra en técnicas avanzadas de aprendizaje supervisado, proporcionando conocimientos teóricos y prácticos sobre varios algoritmos y procesos utilizados en la definición y aplicación de modelos. A lo largo del curso, se profundizará en los siguientes temas, todos ellos desarrollados para problemas de clasificación y de regresión: Support Vector Machines, Algoritmo del Vecino Más Próximo (k-NN), ensamblado de modelos y la puesta en producción de modelos, incluyendo la creación de aplicaciones.
Contenido
1. Support Vector Machines (SVM)
Introducción a SVM: conceptos básicos y geometría del SVM; SVM para clasificación y regresión.
Teoría del margen máximo: Hiperplanos y márgenes en un espacio de características, maximización del margen para mejorar la generalización.
Kernels en SVM: funciones kernel y su importancia en la transformación de datos; tipos de kernels.
Implementación y optimización: parámetros de ajuste y validación cruzada; implementación práctica en Python.
2. Algoritmo del Vecino Más Próximo (k-NN)
Introducción al algoritmo k-NN: concepto y principios fundamentales del k-NN; elección del valor de k y su impacto en el modelo.
Distancias y métricas: diferentes métricas de distancia; impacto de la normalización de datos en k-NN.
Aplicaciones de k-NN: ejemplos prácticos en clasificación y regresión; ventajas y limitaciones del algoritmo k-NN.
Implementación y optimización: parámetros de ajuste y validación cruzada; implementación práctica en Python.
3. Ensamblado de Modelos
Conceptos básicos: ventajas del ensamblado de modelos; métodos de ensamblado con distintos modelos base.
Implementación y optimización: parámetros de ajuste y validación cruzada; implementación práctica en Python.
4. Puesta en Producción de Modelos
Ciclo de vida de Machine Learning
Infraestructura y Herramientas
Monitorización y Mantenimiento
Creación de Aplicaciones
Evaluación
La nota final tendrá en cuenta tanto la evaluación continua como el examen final, y se calculará como el máximo entre:
a) Calificación del examen final
b) La media ponderada de la evaluación continua y el examen final, siendo el peso de la evaluación continua de al menos el 50%. En todo caso, el alumno tiene la opción de superar la asignatura por evaluación continua. Cualquier alumno podrá presentarse al examen final, siendo la valoración del mismo el 100% de su nota final.
Bibliografía
2 Raschka, S. Mirjalili, V. (2019) Python Machine Learning. Marcombo.
3 An introduction to Statistical learning with applications in Python https://github.com/qx0731/Sharing_ISL_python
4 Kuhn, M., & Johnson, K. (2013). Applied Predictive Modeling. Springer.
5 Scikit-learn Documentation. Disponible en: https://scikit-learn.org/stable/documentation.html
Estructura
Módulos | Materias |
---|---|
No existen datos de módulos o materias para esta asignatura. |
Grupos
Clases Teóricas y/o Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo Único | 22/01/2025 - 13/05/2025 | VIERNES 11:00 - 13:00 | - | INMACULADA GUTIERREZ GARCIA-PARDO |
Actividades Prácticas | ||||
---|---|---|---|---|
Grupo | Periodos | Horarios | Aula | Profesor |
Grupo Único | 22/01/2025 - 13/05/2025 | MARTES 13:00 - 15:00 | - | INMACULADA GUTIERREZ GARCIA-PARDO |