Minería de datos Código:  79.644    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los materiales de los que dispone la asignatura   Informaciones sobre la evaluación a la UOC   Consulta del modelo de evaluación  
ATENCIÓN: Esta información recoge los apartados del plan docente de la asignatura durante el último semestre con docencia. Al iniciar el periodo de matrícula, podrás consultar el calendario y modelo de evaluación para el siguiente semestre en Secretaría/ Matrícula / Horarios pruebas de evaluación final.
Minería de datos es una asignatura de aplicación de los conocimientos previos aprendidos en Estadística y de presentación de algunos nuevos de análisis avanzado de datos. Se presenta un conjunto de métodos procedentes de la inteligencia artificial, aprendizaje automático y sistemas de bases de datos que forman el núcleo esencial de la disciplina conocida como Data Mining. Los conceptos estadísticos son muy útiles en esta asignatura y permiten aprovechar con mayor profundidad y detalle algunas de las técnicas que se estudiarán.

Amunt

Esta asignatura es optativa y está pensada para realizarla tras haber adquirido los conocimientos necesarios de estadística como punto final de una trayectoria orientada al análisis de información.

La aplicación de la minería de datos en el ámbito de las ciencias de la información y de la comunicación se muesta en áreas multidisciplinarias basadas en la recuperación de información en internet o Webmining, minería de textos o Textmining, lingüística computacional y aprendizaje automático.

Amunt

Hoy en día se considera crucial el análisis de datos para lograr información.

Las opciones profesionales de esta asignatura son, por una parte, el mundo del I+D tanto en la industria informática como en la empresa orientada a negocio, y por otra parte, la investigación en un contexto más académico.

Esta asignatura pretende preparar a futuros analistas de información, los cuales tendrán que extraer conocimiento en forma de patrones escondidos en cantidades ingentes de datos que hoy en día genera cualquier proceso productivo sea industrial, empresarial en general o de investigación científica. Un ejemplo sería prever la reacción de cualquier organización o fenómeno ante determinadas decisiones o acciones en función de los datos guardados de experiencias anteriores.

Amunt

Esta asignatura requiere conocimientos básicos de estadística.

También es necesario ser capaz de leer documentación en inglés. 

Amunt

Para cursar esta asignatura hace falta haber superado la asignatura de Estadística y metodologías de investigación cuantitativa. 

También es necesario ser capaz de leer documentación en inglés. 

Amunt

Objetivos
  • Saber en qué consiste el proceso de minería de datos y conocer sus metodologías y fases de ejecución.
  • Conocer los ámbitos en los que se puede aplicar un proceso de minería de datos.
  • Conocer los principales modelos de recuperación y de análisis de datos útiles en minería de datos.
  • Conocer las técnicas que permiten construir los modelos mencionados: cuándo se pueden aplicar y bajo qué condiciones; qué clase de resultados dan; cómo se deben preparar los datos para poderlos utilizar y cómo se ha de evaluar y comparar su calidad.
  • Decidir ante un problema práctico concreto qué metodología de minería de datos conviene utilizar, qué modelo se quiere obtener, qué técnica resultaría más adecuada de utilizar y cómo evaluar los resultados obtenidos.
  • Practicar con un programa estadístico de análisis de datos que implementa algunas técnicas de minería de datos tratadas a lo largo del curso en el ámbito de la ciencias de la información y de la comunicación.

Competencias transversales
  • Uso y aplicación de las TIC en el ámbito académico y profesional.
  • Capacidad para adaptarse a las tecnologías y a los futuros entornos actualizando las competencias profesionales.
  • Capacidad para innovar y generar nuevas ideas.

Competencias específicas
  • Capacidad para planificar y gestionar proyectos en el entorno de las TIC.
  • Capacidad para evaluar soluciones tecnológicas y elaborar propuestas de proyectos teniendo en cuenta los recursos, las alternativas disponibles y las condiciones de mercado.
  • Capacidad de analizar un problema en el nivel de abstracción adecuado a cada situación y aplicar las habilidades y los conocimientos adquiridos para abordarlo y resolverlo.
  • Capacidad de diseñar y construir aplicaciones informáticas mediante técnicas de desarrollo, integración y reutilización.
  • Capacidad para aplicar las técnicas específicas de tratamiento, almacenamiento y administración de datos.
  • Capacidad para proponer y evaluar diferentes alternativas tecnológicas para resolver un problema concreto.

Amunt

El material didáctico se divide en los siguientes módulos que presentan cierta interrelación entre ellos. Se incluyen casos de estudio útiles para aplicar los métodos explicados desde un punto de vista teórico.

A continuación se pueden ver los módulos que se tienen que trabajar para poder alcanzar los objetivos de la asignatura.

1ª PARTE

Módulo 1: El proceso de Minería de Datos.
Descubrimiento de conocimiento a partir de datos.
Las fases del proceso de extracción de conocimiento.
Las herramientas de Minería de Datos.
Casos de estudio

Módulo 2: Preparación de datos.
Preliminares: repaso de conceptos estadísticos.
Preliminares: tipo de atributos.
Operaciones de preparación de datos.
Tratamiento de la falta de datos.
Reducción de dimensionalidad.
Métodos de reducción de casos.

2ª PARTE

Módulo 3: Clasificación: árboles de decisión.
Introducción: la estructura de los árboles de decisión.
Métodos de construcción de árboles de decisión por clasificación: ID3 y C4.5.
Construcción de árboles de decisión para regresión y clasificación: CART.
Construcción de árboles de decisión por predicción numérica: CHAID.
Métodos de construcción de árboles de decisión multivariantes: LMDT.
Ponderación final de los árboles de decisión.

Módulo 4: Métodos de agregación.
La similaridad, base para la agrupación de objetos.
Espacio, distancia y semblanza.
Métodos de agregación basados en semblanza y métodos probabilistas.
Interpretación de los modelos obtenidos.
Ponderación de los métodos de agregación.

Módulo 5: Reglas de asociación.
¿Qué son las reglas de asociación?
Construcción de reglas de asociación simples.
Ponderación de las reglas de asociación.

3ª PARTE

Módulo 6: Evaluación de modelos.
Evaluación de modelos clasificatorios.
Validación cruzada ("K Cross-Validation").
Comparación de rendimientos.
Otras formas de estimar la calidad de modelos predictivos.
Coste.

Módulo 7: Caso de Estudio.
Presentación del caso: “El discurso del rey”
Preparación de datos.
Obtención de modelos.
Evaluación y comparación

4ª PARTE

Módulo 8: Lenguajes documentales.
Lenguajes documentales: indexación, recuperación y evaluación
Sistemas de clasificación, listas de encabezamientos de materia y listas de autoridades
Tesaurus, lista de descriptores libres y indexación automática


Amunt

Elementos de estadística y de matemática de la información PDF
Minería de datos PDF
Minería de datos. Introducción y guía de estudio Web
Minería de datos. Introducción y guía de estudio PDF
Lenguajes documentales II Web

Amunt

La Normativa académica de la UOC dispone que el proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de originalidad en la autoría o el mal uso de las condiciones en las que se hace la evaluación de la asignatura es una infracción que puede tener consecuencias académicas graves.

El estudiante será calificado con un suspenso (D/0) si se detecta falta de originalidad en la autoría de alguna actividad evaluable (práctica, prueba de evaluación continua (PEC) o final (PEF), o la que se defina en el plan docente), ya sea porque ha utilizado material o dispositivos no autorizados, ya sea porque ha copiado de forma textual de internet, o ha copiado de apuntes, de materiales, manuales o artículos (sin la citación correspondiente) o de otro estudiante, o por cualquier otra conducta irregular.

La calificación de suspenso (D/0) en la evaluación continua (EC) puede conllevar la obligación de hacer el examen presencial para superar la asignatura (si hay examen y si superarlo es suficiente para superar la asignatura según indique este plan docente).

Cuando esta mala conducta se produzca durante la realización de las pruebas de evaluación finales presenciales, el estudiante puede ser expulsado del aula, y el examinador hará constar todos los elementos y la información relativos al caso.

Además, esta conducta puede dar lugar a la incoación de un procedimiento disciplinario y la aplicación, si procede, de la sanción que corresponda.

Amunt

Esta asignatura se puede superar por una doble vía: por un lado, a partir de la evaluación continua ( EC) y una prueba de síntesis ( PS ) y , por otro lado , con la realización de un examen final ( EX ) .
- Para hacer la PS hay que haber superado la EC.
- Para hacer el EX no hay que haber superado la EC.
- En caso de haber superado la EC existe la opción de optar por el EX en vez de la PS .
La fórmula de acreditación de la asignatura es la siguiente: EC + PS o EX.

 

Amunt