Ciencia de Datos e Inteligencia de Negocios

Máster. Curso 2024/2025.

TÉCNICAS DE MACHINE LEARNING - 610507

Curso Académico 2024-25

Datos Generales

SINOPSIS

COMPETENCIAS

Generales
RA8 - Comprender el funcionamiento de los principales algoritmos de aprendizaje automático como el modelo de red neuronal, random forest y gradient boosting
RA15 - Dominar herramientas estadísticas básicas y el software estadístico especializado y avanzado para la aplicación de las técnicas de Ciencia de datos
RA17 - Modelizar problemas de clasificación y predicción dentro del ámbito de la estrategia empresarial
RA19 - Elaborar un programa básico en lenguaje de programación en un contexto de modelización predictiva
RA20 - Tomar las decisiones apropiadas en la utilización de algoritmos predictivos en un problema real
RA21 - Aplicar diferentes modelos de segmentación, agrupación de observaciones y reducción de variables
RA23 - Desarrollar el espíritu innovador en un ámbito interdisciplinario, fomentando la búsqueda de soluciones creativas a diversos tipos de problemas
RA27 - Establecer las fases y estructura de una investigación relacionada con la Ciencia de Datos partiendo de un problema concreto


ACTIVIDADES DOCENTES

Clases teóricas
50%
Clases prácticas
50%
TOTAL
100%

Presenciales

1,92

No presenciales

4,08

Semestre

2

Breve descriptor:

Se trata de introducir al alumno en las Redes Neuronales y otros algoritmos de predicción y clasificación como random forest, gradient boosting o support vector machines con el objetivo de saber utilizar estas técnicas para poder resolver problemas predicción y clasificación que no puedan resolverse por los métodos tradicionales. Se incidirá principalmente en las aplicaciones utilizando el programa estadístico SAS ENTERPRISE MINER, SAS en entorno de programación,  R y/o Python.

Requisitos

Estar familiarizado al menos con los siguientes programas de software estadístico: SAS y R. Se recomienda también conocer Python.

Objetivos

Modelizar problemas de clasificación y predicción y comprender las principales medidas de evaluación de la capacidad predictiva de estos modelos.

Comprender el funcionamiento de los principales algoritmos de aprendizaje automático como random forest, gradient boosting y redes neuronales.Conocer los fundamentos de los lenguajes de programación más utilizados en Ciencia de Datos y manejar con soltura la sintaxis y librerías en lenguajes
abiertos actuales en Ciencia de Datos como R y SAS.

Contenido

Fundamentos de las Redes neuronales. Redes neuronales para regresión.Redes neuronales para clasificación. Algoritmos basados en árboles: bagging, random forest, gradient boosting. Support vector machines. Métodos Ensemble.

Evaluación

Se realizarán prácticas a entregar de cada uno de los modelos propuestos pudiendo aprobar por evaluación continua. Cualquier alumno tendrá derecho a una prueba final pudiendo resultar su calificación la nota final del curso.

Bibliografía

Bishop, C.M. (1995), Neural Networks for Pattern Recognition, Oxford: Oxford University Press.

Hastie, Tibshirani (2009): The Elements of Statistical Learning (PDF) http://statweb.stanford.edu/~tibs/ElemStatLearn/

Randall Matignon (2005): Neural Network Modeling using SAS Enterprise Miner. Ed. AuthorHouse Schapire and Freund (2014): Boosting. MIT Press.
ftp://ftp.sas.com/pub/neural/FAQ.html

Davis, L. (1991): Handbook of Genetic Algorithms. Van Nostrand Reinhold.

Estructura

MódulosMaterias
No existen datos de módulos o materias para esta asignatura.

Grupos

Clases teóricas y/o prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo A20/01/2025 - 16/05/2025MIÉRCOLES 18:00 - 19:30-JAVIER PORTELA GARCIA-MIGUEL
Grupo B20/01/2025 - 16/05/2025MARTES 18:00 - 19:30-JAVIER PORTELA GARCIA-MIGUEL


Actividades prácticas
GrupoPeriodosHorariosAulaProfesor
Grupo A20/01/2025 - 16/05/2025MIÉRCOLES 19:30 - 21:00-JAVIER PORTELA GARCIA-MIGUEL
Grupo B20/01/2025 - 16/05/2025MARTES 19:30 - 21:00-JAVIER PORTELA GARCIA-MIGUEL