|
||||||||||||||||||||||||||||||||||||
Consulta de los datos generales Descripción La asignatura en el conjunto del plan de estudios Campos profesionales en el que se proyecta Conocimientos previos Objetivos y competencias Contenidos Consulta de los recursos de aprendizaje de los que dispone la asignatura Consulta del modelo de evaluación | ||||||||||||||||||||||||||||||||||||
ATENCIÓN: Esta información recoge los apartados del plan docente de la asignatura durante el último semestre con docencia. Al iniciar el periodo de matrícula, podrás consultar el calendario y modelo de evaluación para el siguiente semestre en Trámites / Matrícula / Horarios de las pruebas de evaluación final. | ||||||||||||||||||||||||||||||||||||
El objetivo de la minería de datos es extraer conocimiento en forma de patrones, reglas y otros modelos matemáticos y algorítmicos que describen la naturaleza subyacente a un problema concreto. Es sabido que no existe un modelo universal que funcione mejor que el resto para cualquier problema o conjunto de datos (el llamado "no free lunch theorem"), sino que es necesario analizar la naturaleza de dicho problema e intentar aplicar el mejor método posible, o bien una combinación de ellos. En la actualidad, la investigación frontera en el ámbito de la minería de datos se basa, por una parte, en mejorar los algoritmos conocidos mediante el fine-tuning de sus parámetros, lo cual puede permitir obtener resultados ligeramente mejores para un conjunto de datos dado. En el escenario actual Big Data, debido a la aparición de conjuntos de datos masivos, de alta dimensionalidad y mayoritariamente categóricos, es necesario también ajustar los algoritmos tradicionales para incrementar su eficacia, dado que se incumplen muchas de las premisas en las cuales están basados (normalidad, suavidad, distancias bien definidas, etc.). Por otra parte, también es posible mejorar los resultados obtenidos mediante la combinación de diferentes clasificadores, creando sistemas de decisión complejos a partir de cientos o miles de clasificadores más sencillos. Esto incluye el uso de esquemas de votación, la generación aleatoria de clasificadores a partir de un modelo preestablecido y la reutilización de decisiones tomadas anteriormente para mejorar la predicción actual. Por lo tanto, en esta asignatura se describen algunos de los modelos y algoritmos considerados el estado del arte en minería de datos y se introduce el concepto de combinación de clasificadores, de forma que el estudiante comprenda la necesidad de analizar el problema a resolver desde diferentes perspectivas analíticas y proponga una solución que combine uno o más modelos en función de los objetivos a alcanzar. |
||||||||||||||||||||||||||||||||||||
Esta asignatura pertenece al conjunto de asignaturas obligatorias dentro del Máster universitario en Ciencia de datos (Data Science). Se recomienda cursar esta asignatura antes que el resto de asignaturas de análisis de datos, que se ofrecen como optativas dentro del máster. |
||||||||||||||||||||||||||||||||||||
El objetivo del máster es la formación de profesionales en la ciencia de datos. Esta asignatura, específicamente, se focaliza en los campos relacionados con el análisis, la estadística avanzada y la minería de datos (o machine learning). A medida que esta especialidad ha crecido y las empresas reconocen la necesidad de esta clase de perfiles, también lo han hecho las diferentes salidas profesionales:
|
||||||||||||||||||||||||||||||||||||
Para la realización de esta asignatura se presuponen conocimientos de programación, principalmente en lenguaje Python. Por lo que respecta a conocimientos teóricos o matemáticos, se presupone que los estudiantes que cursan esta asignatura han cursado previamente la asignatura de "minería de datos", que introduce los conceptos básicos sobre los algoritmos supervisados y no supervisados. Además, como la metodología incluye estudios de casos y la investigación autónoma de información, es aconsejable que el estudiante esté familiarizado con la búsqueda de fuentes de información, el análisis de la información cuantitativa y cualitativa, la capacidad de sintetizar y obtener conclusiones así como de poseer ciertas habilidades de comunicación escrita. Finalmente, dada la naturaleza de la asignatura, es necesario utilizar herramientas y procedimientos descritos en lengua inglesa, por lo que un nivel básico de lectura y comprensión de textos técnicos es imprescindible. |
||||||||||||||||||||||||||||||||||||
Los objetivos que se pretende que el estudiante alcance mediante esta asignatura son los siguientes:
|
||||||||||||||||||||||||||||||||||||
Introducción
Validación y evaluación de resultados
Extracción y selección de atributos
Métodos no supervisados
Métodos supervisados
Combinación de clasificadores
|
||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||
|