Análisis de sentimientos y redes sociales Código:  M2.856    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Conocimientos previos   Información previa a la matrícula   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de los que dispone la asignatura   Consulta del modelo de evaluación  
ATENCIÓN: Esta información recoge los apartados del plan docente de la asignatura durante el último semestre con docencia. Al iniciar el periodo de matrícula, podrás consultar el calendario y modelo de evaluación para el siguiente semestre en Trámites / Matrícula / Horarios de las pruebas de evaluación final.

En esta asignatura se verán dos conceptos que, aunque diferentes y de naturaleza distinta, en muchas ocasiones suelen ir de la mano y suelen formar parte de un mismo análisis. Estamos hablando de realizar análisis de sentimientos y opiniones en redes sociales u otro tipo de redes.

En estos casos, por un lado tenemos que analizar e interpretar el texto contenido en estas redes. Para ello, en esta asignatura veremos las bases del procesamiento del lenguaje natural o, concretamente, de la comprensión del lenguaje natural (Natural Language Understanding). Esta base teórica nos permitirá adentrarnos en el análisis de los sentimientos (sentiment analysis), que constituye un importante campo de investigación en la actualidad. 

Por otro lado, veremos las principales técnicas y métodos empleados en el análisis de datos de redes sociales (social network analysis, SNA). Concretamente, veremos las principales propiedades de las redes reales, así como algoritmos de detectcción de comunidades (i.e. clustering), análisis del flujo de información y visualización de redes.

Amunt

Esta asignatura pertenece al conjunto de asignaturas optativas del Máster universitario en Ciencia de datos (Data Science).

Amunt

El curso requiere que los estudiantes tengan conocimientos de programación (preferiblemente en lenguaje Python), así como conocimientos de minería de datos y teoría de grafos.

Se recomienda haber cursado la asignatura "Modelos avanzados de minería de datos" antes de cursar esta asignatura.

Además, como la metodología incluye estudios de casos y la investigación autónoma de información, es aconsejable que el estudiante esté familiarizado con la búsqueda de fuentes de información, el análisis de la información cuantitativa y cualitativa, la capacidad de sintetizar y obtener conclusiones así como de poseer ciertas habilidades de comunicación escrita.

Asimismo también es necesario que los estudiantes tengan la capacidad de leer y comprender el idioma inglés puesto que una parte de los materiales adicionales y otros recursos, están en dicho idioma.

Amunt

Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés.

Amunt

Los objetivos que se desea que el estudiante alcance mediante esta asignatura son los siguientes:

  • Conocer las principales técnicas y herramientas para el procesamiento y comprensión del lenguaje natural.
  • Saber aplicar las técnicas y herramientas para las principales tareas de comprensión del lenguaje natural, incluyendo la identificación automática de temas e idiomas y la extracción de palabras clave.
  • Conocer el proceso, junto con las principales técnicas y herramientas, para el análisis de sentimientos basados en textos.
  • Saber cuándo aplicar las distintas aproximaciones al análisis de sentimientos y las principales diferencias entre ellas.
  • Comprender las principales características de las técnicas supervisadas y no supervisadas para el análisis de sentimientos basados en textos.
  • Conocer las principales características de las redes reales, así como las bases teóricas para su representación mediante grafos.
  • Comprender y saber aplicar las principales técnicas relacionadas con la evaluación de redes, detección de comunidades, análisis del flujo de información y visualización de redes o grafos.

Amunt

Comprensión del lenguaje natural (Natural Language Understanding)
a) Fundamentos y herramientas
- Corpus/Bases de datos textuales (WordNet, MultiWordNet, stop words, etc.)
- Tokenización (n-gramas)
- Stemming (algoritmo de Porter/Snowball) vs Lemmatization
- Part-of-Speech tagging (POS tag, etiquetado gramatical)
- Parsing (estructura gramatical de las oraciones del texto)
- Representación cuantitativa del texto (vectores, tf-idf, etc)
b) Usos
- Identificación automática de temas (Document clustering or text categorization)
- Identificación automática del idioma (Language identification)
- Resumen automático (Text summarization) o extracción automática de frases clave (Automatic key phrase extraction)

Sentiment analysis
a) Proceso
- Corpus (input)
- Document pre-processing
- Sentiment lexicons and linguistic resources (SentiWordNet, General nquirer Lexicón, emotion lexicon, subjectivity lexicon, etc)
- Document analysis
- Sentiment scores and annotations (output)
b) Aproximaciones
- Document based sentiment analysis
- Sentence based sentiment analysis
- Feature based sentiment analysis (explicit, implicit)
- Comparative sentiment analysis
c) Técnicas
- Supervised learning: Classification algorithms (SVM, Naïve Bayes, KNN, etc)
- Unsupervised learning: Semantic orientation (Predefined POS, lexicons, PMI)
- Parsing
- Information extraction
- Association rule learning
- Visualization techniques (maps, graphs, etc)
d) Aplicaciones
- Reviews of consumer products and services
- Product reputation
- Political analysis
- Financial markets
- Emotion awareness
- Industrial studies (pharmaceutical, cars, etc)
e) Principales retos
- Sentiment data modeling
- Anaphora resolution
- Objectivity (factual data)
- Noisy texts
- Sarcasm identification

Social network analysis (SNA)
a) Introducción a la teoría de grafos
b) Las redes en el mundo real (propiedades small world y power law)
c) Métricas y propiedades de las redes
d) Detección de comunidades
e) Flujos de información
f) Visualización de redes

Amunt

Esta asignatura sólo puede superarse a partir de la evaluación continua (EC). La nota final de evaluación continua se convierte en la nota final de la asignatura. La fórmula de acreditación de la asignatura es la siguiente: EC.

 

Amunt