|
||||||||||||
Consulta de los datos generales Descripción La asignatura en el conjunto del plan de estudios Campos profesionales en el que se proyecta Conocimientos previos Información previa a la matrícula Objetivos y competencias Contenidos Consulta de los recursos de aprendizaje de los que dispone la asignatura Informaciones sobre la evaluación en la UOC Consulta del modelo de evaluación | ||||||||||||
ATENCIÓN: Esta información recoge los apartados del plan docente de la asignatura durante el último semestre con docencia. Al iniciar el periodo de matrícula, podrás consultar el calendario y modelo de evaluación para el siguiente semestre en Trámites / Matrícula / Horarios de las pruebas de evaluación final. | ||||||||||||
Minería de datos es una asignatura de aplicación de los conocimientos previos aprendidos en Estadística y de presentación de algunos nuevos de análisis avanzado de datos. Se presenta un conjunto de métodos procedentes de la inteligencia artificial, aprendizaje automático y sistemas de bases de datos que forman el núcleo esencial de la disciplina conocida como Data Mining. Los conceptos estadísticos son muy útiles en esta asignatura y permiten aprovechar con mayor profundidad y detalle algunas de las técnicas que se estudiarán. | ||||||||||||
Esta asignatura es optativa y está pensada para realizarla tras haber adquirido los conocimientos necesarios de estadística como punto final de una trayectoria orientada al análisis de información. La aplicación de la minería de datos en el ámbito de las ciencias de la información y de la comunicación se muesta en áreas multidisciplinarias basadas en la recuperación de información en internet o Webmining, minería de textos o Textmining, lingüística computacional y aprendizaje automático. |
||||||||||||
Hoy en día se considera crucial el análisis de datos para lograr información. Las opciones profesionales de esta asignatura son, por una parte, el mundo del I+D tanto en la industria informática como en la empresa orientada a negocio, y por otra parte, la investigación en un contexto más académico. Esta asignatura pretende preparar a futuros analistas de información, los cuales tendrán que extraer conocimiento en forma de patrones escondidos en cantidades ingentes de datos que hoy en día genera cualquier proceso productivo sea industrial, empresarial en general o de investigación científica. Un ejemplo sería prever la reacción de cualquier organización o fenómeno ante determinadas decisiones o acciones en función de los datos guardados de experiencias anteriores. |
||||||||||||
Esta asignatura requiere conocimientos básicos de estadística. |
||||||||||||
Para cursar esta asignatura hace falta haber superado la asignatura de Estadística y metodologías de investigación cuantitativa. También es necesario ser capaz de leer documentación en inglés. |
||||||||||||
Objetivos
Competencias transversales
Competencias específicas
|
||||||||||||
El material didáctico se divide en los siguientes módulos que presentan cierta interrelación entre ellos. Se incluyen casos de estudio útiles para aplicar los métodos explicados desde un punto de vista teórico. A continuación se pueden ver los módulos que se tienen que trabajar para poder alcanzar los objetivos de la asignatura. 1ª PARTE Módulo 1: El proceso de Minería de Datos. Descubrimiento de conocimiento a partir de datos. Las fases del proceso de extracción de conocimiento. Las herramientas de Minería de Datos. Casos de estudio Módulo 2: Preparación de datos. Preliminares: repaso de conceptos estadísticos. Preliminares: tipo de atributos. Operaciones de preparación de datos. Tratamiento de la falta de datos. Reducción de dimensionalidad. Métodos de reducción de casos. 2ª PARTE Módulo 3: Clasificación: árboles de decisión. Introducción: la estructura de los árboles de decisión. Métodos de construcción de árboles de decisión por clasificación: ID3 y C4.5. Construcción de árboles de decisión para regresión y clasificación: CART. Construcción de árboles de decisión por predicción numérica: CHAID. Métodos de construcción de árboles de decisión multivariantes: LMDT. Ponderación final de los árboles de decisión. Módulo 4: Métodos de agregación. La similaridad, base para la agrupación de objetos. Espacio, distancia y semblanza. Métodos de agregación basados en semblanza y métodos probabilistas. Interpretación de los modelos obtenidos. Ponderación de los métodos de agregación. Módulo 5: Reglas de asociación. ¿Qué son las reglas de asociación? Construcción de reglas de asociación simples. Ponderación de las reglas de asociación. 3ª PARTE Módulo 6: Evaluación de modelos. Evaluación de modelos clasificatorios. Validación cruzada ("K Cross-Validation"). Comparación de rendimientos. Otras formas de estimar la calidad de modelos predictivos. Coste. Módulo 7: Caso de Estudio. Presentación del caso: “El discurso del rey” Preparación de datos. Obtención de modelos. Evaluación y comparación 4ª PARTE Módulo 8: Lenguajes documentales. Lenguajes documentales: indexación, recuperación y evaluación Sistemas de clasificación, listas de encabezamientos de materia y listas de autoridades Tesaurus, lista de descriptores libres y indexación automática |
||||||||||||
|
||||||||||||
La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados. La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves. El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular. La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente). Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso. Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda. La UOC habilitará los mecanismos que considere oportunos para velar por la calidad de sus titulaciones y garantizar la excelencia y la calidad de su modelo educativo. |
||||||||||||
|