Deep learning Código:  M2.875    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Campos profesionales en el que se proyecta   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el segundo semestre del curso 2023-2024. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Desde los inicios de la inteligencia artificial (IA) se ha soñado con máquinas capaces de "pensar" de forma similar a como lo hacemos los seres humanos. Lejos de conseguir este ambicioso objetivo, en las últimas décadas y años hemos visto como se consiguieron superar importantes desafíos en ámbitos o problemas muy concretos. Por ejemplo, en 1997 la computadora Deep Blue de IBM fue capaz de ganar al ajedrez al campeón mundial Garry Kasparov. Aunque saber jugar correctamente al ajedrez es un problema muy complejo para los seres humanos, éste se rige por una serie de normas estrictas y en un entorno muy delimitado y perfectamente especificado. Esto hace que lo que es una tarea compleja (o muy compleja) para una persona, sea una tarea "fácil" de implementar en un computador. Los computadores, por regla general, se manejan bien en los escenarios formales. Es decir, escenarios cerrados, regidos por reglas y con un conjunto de actores finito. 

Por el contrario, algunas de las acciones más elementales e intuitivas para los humanos, como por ejemplo reconocer una persona, un animal o un objeto, pueden ser tareas tremendamente complejas de resolver para un computador. La principal dificultad radica en el hecho de que, en estos casos, no es fácil formalizar los conceptos abstractos que aparecen en estos escenarios. Definir formalmente los conceptos abstractos relacionados con estos escenarios es terriblemente complejo. La representación de los conceptos deviene un punto clave en la implementación modelos, y en el caso de los conceptos abstractos, la complejidad de la tarea dificulta enormemente que pueda ser implementado mediante los modelos de IA clásicos.

Debido a la dificultad para introducir este tipo de conocimiento a priori en los modelos, se ha optado por utilizar modelos que sean capaces de extraer su propio conocimiento a partir de los datos. Esta área se ha denominado aprendizaje automático o machine learning. Existen multitud de técnicas y modelos que permiten aprender a partir de un conjunto de datos, como por ejemplo modelos de regresión, árboles de decisión o las máquinas de vectores soporte (SVM, support vector machine). En muchos casos, los modelos son capaces de aprender patrones a partir de los datos, pero no son capaces de aprender conceptos abstractos y complejos a partir de estos datos.

El concepto de deep learning (o aprendizaje profundo) aparece como un subconjunto, dentro del aprendizaje automático, donde se persigue crear modelos que sean capaces de representar conceptos complejos y/o abstractos a partir de conceptos más sencillos. Es decir, el modelo es capaz de crear de forma automática una jerarquía de conceptos, empezando por conceptos simples, e ir mezclando estos conceptos más simples para ir creando conceptos cada vez más complejos. Esto permite definir conceptos abstractos como composiciones de conceptos mucho más simples. Cuando esta jerarquía de conceptos tiene múltiples capas, hablamos de la "profundidad" del modelo. Es aquí donde aparece el concepto de aprendizaje profundo o deep learning.

Aunque actualmente se asocia el concepto de deep learning con las redes neuronales, existen otros modelos de aprendizaje automático que también son capaces de componer conceptos a partir de una jerarquía de conceptos más simples. Aún así, en esta asignatura nos centraremos en las distintas variedades de redes neuronales profundas, concreatemente redes neuronales convolucionales (CNN, convolutional neural networks) y redes recurrentes (RNN, recurrent neural networks), que actualmente representan el estado del arte en deep learning.

Amunt

Esta asignatura pertenece al conjunto de asignaturas optativas dentro del Máster universitario en Ciencia de datos (Data Science).

Amunt

El objetivo del máster es la formación de profesionales en la ciencia de datos. Esta asignatura, específicamente, se focaliza en los campos relacionados con el análisis de imágenes y de series temporales empleando algoritmos de aprendizaje profundo (o deep learning), en concreto redes neuronales convolucionales y redes neuronales recurrentes.

Amunt

Para la realización de esta asignatura se presuponen conocimientos de programación (principalmente en lenguaje Python), así como conocimientos de minería de datos o aprendizaje automático (machine learning).

Se recomienda haber cursado la asignatura "Modelos Avanzados de Minería de Datos" antes de cursar esta asignatura.

Además, como la metodología incluye estudios de casos y la investigación autónoma de información, es aconsejable que el estudiante esté familiarizado con la búsqueda de fuentes de información, el análisis de la información cuantitativa y cualitativa, la capacidad de sintetizar y obtener conclusiones así como de poseer ciertas habilidades de comunicación escrita.

Finalmente, dada la naturaleza de la asignatura, es necesario utilizar herramientas, materiales adicionales y procedimientos descritos en lengua inglesa, por lo que un nivel básico de lectura y comprensión de textos técnicos es imprescindible.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

Los objetivos que se pretende que el estudiante alcance mediante esta asignatura son los siguientes:

  • Entender el funcionamiento de las redes neuronales artificiales, así como de sus principales parámetros y diferentes arquitecturas.
  • Conocer y saber aplicar los principales métodos de optimización en redes neuronales, tales como el tunning de hiper-parámetros, el dropout, función de entropía cruzada, métodos de regularización, etc.
  • Conocer los diferentes tipos de auto-encoders, así como su funcionamiento, arquitecturas y objetivos principales.
  • Entender el funcionamiento, los componentes y la estructura de una red neuronal convolucional (CNN).
  • Conocer las principales arquitecturas de redes neuronales convolucionales, tales como la ResNet o Inception.
  • Entender el funcionamiento, los componentes y la estructura de una red neuronal recurrente (RNN).
  • Conocer las principales arquitecturas de redes neuronales recurrentes.

Amunt

Parte I. Introducción

1. Introducción y contextualización

  • ¿Qué es Deep Learning?
  • Contextualización de las redes neuronales

2. Conceptos básicos de aprendizaje automático

  • Tipología de métodos
  • Tipología de tareas
  • Preprocesamiento de datos
  • Datos de entrenamiento y test
  • Evaluación de modelos

Parte II. Redes neuronales artificiales

3. Principios y fundamentos

  • Las neuronas
  • Arquitectura de una red neuronal
  • Entrenamiento de una red neuronal
  • El problema de la desaparición del gradiente

4. Optimización del proceso de aprendizaje

  • Técnicas relacionadas con el rendimiento de la red
  • Técnicas relacionadas con la velocidad del proceso de aprendizaje
  • Técnicas relacionadas con el sobreentrenamiento

5. Autoencoders

  • Estructura básica
  • Entrenamiento de un autoencoder
  • Pre-entrenamiento utilizando autoencoders
  • Tipos de autoencoders

Parte III. Redes neuronales convolucionales

6. Introducción y conceptos básicos

  • Visión por computador
  • La operación de convolución
  • Ventajas derivadas de la convolución

7. Componentes y estructura de una CNN

  • La capa de convolución
  • Otras capas de las CNN
  • Estructura de una red neuronal convolucional

8. Arquitecturas de CNN

  • Redes convolucionales clásicas
  • Residual Networks (ResNet)
  • Inception

Parte IV. Redes neuronales recurrentes

10. Fundamentos de las redes recurrentes

  • Concepto de recurrencia
  • Tipos de redes neuronales recurrentes
  • Entrenamiento de una red neuronal recurrente

11. Tipología de celdas recurrentes

  • Long Short Term Memory (LSTM)
  • Gated Recurrent Unit (GRU)

12. Arquitecturas de redes recurrentes

  • Redes neuronales recurrentes bidireccionales
  • Redes neuronales recurrentes profundas
  • Arquitectura codificador-decodificador
  • Mecanismo de atención

Amunt

Espacio de recursos de ciencia de datos Web
Test quizzie Moodle Web
Introducción al análisis de series temporales PDF
3. Fundamentos de las redes neuronales convolucionales PDF
Modelos generativos PDF
2. Las redes neuronales artificiales PDF
5. Redes neuronales recurrentes PDF
1. Introducción al deep learning PDF
Transformadores PDF
4. Arquitecturas y aplicaciones de las redes neuronales convolucionales PDF

Amunt

El proceso de evaluación se fundamenta en el trabajo personal de cada estudiante y presupone la autenticidad de la autoría y la originalidad de los ejercicios realizados.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; el intento fraudulento de obtener un resultado académico mejor; la colaboración, el encubrimiento o el favorecimiento de la copia, o la utilización de material o dispositivos no autorizados durante la evaluación, entre otras, son conductas irregulares que pueden tener consecuencias académicas y disciplinarias graves.

Por un lado, si se detecta alguna de estas conductas irregulares, puede comportar el suspenso (D/0) en las actividades evaluables que se definan en el plan docente - incluidas las pruebas finales - o en la calificación final de la asignatura, ya sea porque se han utilizado materiales o dispositivos no autorizados durante las pruebas, como redes sociales o buscadores de información en internet, porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas del resto de estudiantes, etc.) sin la correspondiente citación, o porque se ha practicado cualquier otra conducta irregular.

Por el otro, y de acuerdo con las normativas académicas, las conductas irregulares en la evaluación, además de comportar el suspenso de la asignatura, pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda.

La UOC se reserva la potestad de solicitar al estudiante que se identifique o que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación por los medios que establezca la universidad (síncronos o asíncronos). A estos efectos, la UOC puede exigir al estudiante el uso de un micrófono, una cámara u otras herramientas durante la evaluación y que este se asegure de que funcionan correctamente.

La verificación de los conocimientos para garantizar la autoría de la prueba no implicará en ningún caso una segunda evaluación.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt