Análisis de sentimientos y textos Código:  M2.877    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Los datos en formato de texto (formato no estructurado) es uno de los grandes recursos que tenemos a disposición en grandes cantidades pero que, por su naturaleza, es complejo de procesar y extraer la información o conocimiento que contiene.

En esta asignatura veremos las bases del procesamiento del lenguaje natural o, concretamente, de la comprensión del lenguaje natural (Natural Language Understanding). Esta base teórica nos permite adentrarnos en el análisis de sentimientos (sentiment analysis), que constituye un importante campo de investigación en la actualidad.

Concretamente, veremos las como interpretar y analizar automáticamente la información textual, como extraer sentimientos y opiniones de textos, y cómo evaluar la calidad de los sistemas de reconocimiento de sentimientos. Finalmente, veremos cómo aplicar algunos de los principales métodos de aprendizaje automático (machine learning) para tareas de reconocimiento de textos y análisis de sentimientos.

Amunt

Esta asignatura pertenece al conjunto de asignaturas optativas del Máster universitario en Ciencia de datos (Data Science).

Amunt

El curso requiere que los estudiantes tengan conocimientos de programación (preferiblemente en lenguaje Python), así como conocimientos avanzados de aprendizaje automático (machine learning).

Se recomienda haber cursado la asignatura "Modelos avanzados de minería de datos" antes de cursar esta asignatura, ya que se utilizan conceptos explicados en esta asignatura.

Además, como la metodología incluye estudios de casos y la investigación autónoma de información, es aconsejable que el estudiante esté familiarizado con la búsqueda de fuentes de información, el análisis de la información cuantitativa y cualitativa, la capacidad de sintetizar y obtener conclusiones así como de poseer ciertas habilidades de comunicación escrita.

Asimismo también es necesario que los estudiantes tengan la capacidad de leer y comprender el idioma inglés ya que una parte de los materiales adicionales y otros recursos, están en este idioma.

Amunt

Los objetivos que se desea que el estudiante alcance mediante esta asignatura son los siguientes:

  • Conocer las principales técnicas y herramientas para el procesamiento y comprensión del lenguaje natural.
  • Saber aplicar las técnicas y herramientas para las principales tareas de comprensión del lenguaje natural, incluyendo la identificación automática de temas e idiomas y la extracción de palabras clave.
  • Conocer el proceso, junto con las principales técnicas y herramientas, para el análisis de sentimientos basados en textos.
  • Saber cuándo aplicar las diferentes aproximaciones al análisis de sentimientos y las principales diferencias entre ellas.
  • Comprender las principales características de las técnicas supervisadas y no supervisadas para el análisis de sentimientos basados en textos.

Amunt

Módulo 1: Cómo interpretar y analizar automáticamente la información textual
1. ¿Qué se considera palabra?
1.1. La palabra como unidad de significante y significado
1.2. Términos monopalabra y multipalabra
2. ¿Preprocesar o no preprocesar?
2.1. El corpus de análisis
2.2. Preprocesado del texto y sus herramientas
2.3. Resultados
3. Detección de términos relevantes
3.1. Ley de Zipf
3.2. Filtraje de stop words
3.3. Normalización del texto
3.4. Vectorización del texto
3.5. Vectorización de los términos
4. Detección de temas (topic detection)
4.1. Detección de temas con Wordnet
4.2. Wordnet, DBpedia y ConceptNet
4.3. LDA
4.4. Recursos para hacer topic detection
4.5. Resultados
5. Predicción
5.1. Pasos a realizar
5.1.1. Preprocesado
5.1.2. Entrenamiento
5.1.3. Predicción
5.1.4. Recursos para hacer la predicción
5.2. Resultados

Módulo 2: Extracción de sentimientos y opiniones
1. Elementos de una opinión
1.1. El target o topic
1.2. Los aspectos
1.3. Polaridad
1.4. El opinion holder y el momento
1.5. Elementos de una opinión: un ejemplo
2. Detección automática de los elementos de una opinión
2.1.Detección del target
2.2. Detección de los aspectos
2.3 Detección de la polaridad
2.4. Detección del opinion holder y del momento
3. Casos de uso del sentiment analysis
3.1. Conocer cosas a mejorar a través de las opiniones
3.2. Opiniones sobre un programa de televisión
3.3. Detección de opiniones falsas

Módulo 3: Evaluación de la calidad de los sistemas de reconocimiento de sentimientos
1. Métricas de evaluación
1.1. La matriz de confusión
1.2. Métricas a partir de la matriz de confusión
1.3. La sensibilidad de los datos de la matriz de confusión
2. Evaluación de los casos de uso
2.1. Predictor de una opinión como favorable o desfavorable
2.2. Evaluación del clasificador de titulares del NYT
2.2. Evaluación del clasificador de opiniones falsas
2.3. Análisis de los resultados y nuevos retos

Amunt

Espacio de recursos de ciencia de datos Web
Deep learning para el análisis de sentimientos PDF
Módulo 4- Implementación del deep learning aplicado al procesamiento del lenguaje natural PDF
Módulo 4-Introducción al deep learning aplicado al procesamiento del lenguaje natural PDF
Named Entity Linking (Screencast) Audiovisual
Named Entity Recognition (Screencast) Audiovisual

Amunt

Amunt