Minería de datos Código:  75.584    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Información adicional sobre los recursos de aprendizaje y herramientas de apoyo   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Los datos son el nuevo petróleo. Por lo tanto, Minería de Datos es una asignatura de aplicación de los conocimientos previos que habéis aprendido en asignaturas como Estadística y Bases de Datos, y de presentación de algunos nuevos más específicos del ámbito de extracción de conocimiento. Se presentan un conjunto de métodos procedentes de la Inteligencia Artificial, que forman el núcleo esencial de la disciplina conocida como Data Mining. Los conceptos básicos de las asignaturas mencionadas son muy útiles en esta asignatura y permitirán evaluar mejor algunas de las técnicas que se estudiarán.

Amunt

Dentro del Grado de Ingeniería Informática, esta asignatura es optativa y está pensada para realizarla tras haber adquirido los conocimientos necesarios de estadística, bases de datos y programación, como punto final de una trayectoria orientada al análisis de información. En el caso del Grado en Ciencia de Datos Aplicada se trata de una asignatura obligatoria.

Por otra parte, esta asignatura también se ofrece como complemento de formación en otros programas, de forma que los estudiantes adquieran los conocimientos básicos propios del ámbito de la minería de datos.

Amunt

Hoy en día se considera crucial  el análisis de datos para lograr información.

Las opciones profesionales de esta asignatura son, por una parte, el mundo del I+D tanto en la industria informática como en la empresa orientada a negocio, y por otra parte, la investigación en un contexto más académico.

Esta asignatura pretende preparar a futuros analistas de información, los cuales tendrán que descubrir conocimiento en forma de patrones escondidos en cantidades ingentes de datos que hoy en día genera cualquier proceso industrial o económico. Un ejemplo seria  prever cómo reaccionará el mercado ante de una campaña de marketing en función de los datos guardados de experiencias anteriores.

Amunt

Esta asignatura requiere conocimientos básicos de estadística, así como conocimientos de programación y bases de datos. También es necesario ser capaz de leer documentación en inglés.

Amunt

Para cursar esta asignatura se recomienda haber cursado con anterioridad Estadística, Fundamentos de Programación y Uso de Bases de Datos o asignaturas equivalentes.

Amunt

Objetivos

1. Saber en qué consiste el proceso de minería de datos y conocer sus fases.

2. Conocer las tareas a que se puede dirigir un proceso de minería de datos.

3. Conocer los principales modelos que se pueden extraer de los datos y sirven para traer adelante las tareas anteriores.

4.  Conocer las técnicas que permiten construir los modelos mencionados: cuando se pueden aplicar y bajo cuáles condiciones, qué clase de resultados dan, como se deden preparar los datos por poderlas utilizar y como se ha de evaluar y comparar su calidad.

5.  Decidir ante un problema práctico concreto qué tarea de minería de datos conviene utilizar, qué modelo se quiere obtener, qué técnica resultaría más adecuada de utilizar y como evaluar los resultados obtenidos.

7. Practicar con un producto de código abierto de ámbito académico que implementa algunas tecnologías de las tratadas a lo largo del curso.

Competencias transversales

2. Uso y aplicación de las TIC en el ámbito académico y profesional.

5. Capacidad para adaptarse a las tecnologías y a los futuros entornos actualizando las competencias profesionales.

6. Capacidad para innovar y generar nuevas ideas.

Competencias específicas

1. Capacidad para planificar y gestionar proyectos en el entorno de las TIC.

3. Capacidad para evaluar soluciones tecnológicas y elaborar propuestas de proyectos teniendo en cuenta los recursos, las alternativas disponibles y las condiciones de mercado.

6. Capacidad de analizar un problema en el nivel de abstracción adecuado a cada situación y aplicar las habilidades y los conocimientos adquiridos para abordarlo y resolverlo.

11. Capacidad de diseñar y construir aplicaciones informáticas mediante técnicas de desarrollo, integración y reutilización.

13. Capacidad para aplicar las técnicas específicas de tratamiento, almacenamiento y administración de datos.

14. Capacidad para proponer y evaluar diferentes alternativas tecnológicas para resolver un problema concreto.

Amunt

El material didáctico de la asignatura se divide en seis módulos y un prólogo que presentan una notable interrelación entre ellos. El sexto es un caso de estudio que se puede utilizar para ver cómo los métodos explicados en los otros módulos se aplican en un caso concreto y real.

A continuación, podéis ver los módulos que se tienen que trabajar para poder alcanzar los objetivos de la asignatura. 

Módulo 1: El proceso de Minería de Datos.

  1. Descubrimiento de conocimiento a partir de datos.
  2. Las fases del proceso de extracción de conocimiento.
  3. Las herramientas de Minería de Datos.

Módulo 2: Preprocesado de datos y gestión de características.

  1. Transformación de valores.
  2. Reducción de la dimensionalidad.
  3. Valores ausentes.
  4. Visualización de características.
  5. Selección de características.
  6. Ingeniería de características.

Módulo 3: Modelos no supervisados

  1. Conceptos pre eliminares.
  2. Clustering y segmentación.
  3. Modelos basados en densidad.
  4. Afinity propagation.

Módulo 4: Modelos supervisados

  1. Modelos basados en proximidad.
  2. Árboles de decisión.
  3. Modelos de regresión.

Módulo 5: Evaluación de modelos.

  1. Evaluación de modelos supervisados de clasificación.
  2. Evaluación de modelos supervisados de regresión.
  3. Evaluación de modelos no supervisados.

Módulo 6: Caso de Estudio.

  1. Presentación del caso
  2. Paso 1: establecer un objetivo analítico
  3. Paso 2: verificar los datos
  4. Paso 3: preprocesado de datos
  5. Paso 4: análisis exploratorio
  6. Paso 5: clasificación
  7. Paso 6: reproducibilidad

Amunt

2. Preprocesado de datos PDF
4. Modelos no supervisados PDF
6. Evaluación de modelos PDF
1. El proceso de minería de datos PDF
3. Gestión de características PDF
7. Caso de estudio PDF
0. Prólogo PDF
5. Modelos supervisados PDF

Amunt

El material didáctico asociado a la asignatura comprende:

  1. Este Plan Docente.
  2. Los módulos didácticos que están disponibles en el aula.
  3. El software utilizado en  la asignatura y su documentación.
  4. El laboratorio de Minería de Datos asociado.
  5. Diferentes recursos docentes que se iran enlazando en el aula a lo largo del semestre (datasets, ejemplos de buenas prácticas, ...).

 

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt