|
|||||
Consulta de los datos generales Descripción La asignatura en el conjunto del plan de estudios Conocimientos previos Información previa a la matrícula Objetivos y competencias Contenidos Consulta de los materiales que dispone la asignatura Consulta del modelo de evaluación | |||||
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios. | |||||
En esta asignatura se verá, por un lado, las bases del procesamiento del lenguaje natural o, concretamente, de la comprensión del lenguaje natural (Natural Language Understanding). Esta base teórica nos permitirá adentrarnos en el análisis de los sentimientos (sentiment analysis), que constituye un importante campo de investigación en la actualidad. Por otro lado, veremos las principales técnicas y métodos empleados en el análisis de datos de redes sociales (social network analysis). Concretamente, veremos las principales propiedades de las redes reales, así como algoritmos de clustering, análisis del flujo de información y visualización de redes.
|
|||||
Esta asignatura forma parte del conjunto de asignaturas optativas del máster. | |||||
Se recomienda disponer de conocimientos de minería de datos y teoría de grafos. | |||||
Algunos de los contenidos de esta asignatura deben estudiarse a partir de materiales y recursos escritos en inglés. | |||||
|
|||||
Comprensión del lenguaje natural (Natural Language Understanding) a) Fundamentos y herramientas - Corpus/Bases de datos textuales (WordNet, MultiWordNet, stop words, etc.) - Tokenización (n-gramas) - Stemming (algoritmo de Porter/Snowball) vs Lemmatization - Part-of-Speech tagging (POS tag, etiquetado gramatical) - Parsing (estructura gramatical de las oraciones del texto) - Representación cuantitativa del texto (vectores, tf-idf, etc) b) Usos - Identificación automática de temas (Document clustering or text categorization) - Identificación automática del idioma (Language identification) - Resumen automático (Text summarization) o extracción automática de frases clave (Automatic key phrase extraction) Sentiment analysis a) Proceso - Corpus (input) - Document pre-processing - Sentiment lexicons and linguistic resources (SentiWordNet, General nquirer Lexicón, emotion lexicon, subjectivity lexicon, etc) - Document analysis - Sentiment scores and annotations (output) b) Aproximaciones - Document based sentiment analysis - Sentence based sentiment analysis - Feature based sentiment analysis (explicit, implicit) - Comparative sentiment analysis c) Técnicas - Supervised learning: Classification algorithms (SVM, Naïve Bayes, KNN, etc) - Unsupervised learning: Semantic orientation (Predefined POS, lexicons, PMI) - Parsing - Information extraction - Association rule learning - Visualization techniques (maps, graphs, etc) d) Aplicaciones - Reviews of consumer products and services - Product reputation - Political analysis - Financial markets - Emotion awareness - Industrial studies (pharmaceutical, cars, etc) e) Principales retos - Sentiment data modeling - Anaphora resolution - Objectivity (factual data) - Noisy texts - Sarcasm identification Social network analysis (SNA) a) Introducción a la teoría de grafos b) Las redes en el mundo real (propiedades small world y power law) c) Métricas y propiedades de las redes d) Detección de comunidades e) Flujos de información f) Visualización de redes
|
|||||
|
|||||
Ponderación de las calificaciones
Opción para superar la asignatura: EC
Nota final de asignatura: EC |