Análisis de textos Código:  M2.893    :  6
Consulta de los datos generales   Descripción   La asignatura en el conjunto del plan de estudios   Conocimientos previos   Objetivos y competencias   Contenidos   Consulta de los recursos de aprendizaje de la UOC para la asignatura   Informaciones sobre la evaluación en la UOC   Consulta del modelo de evaluación  
Este es el plan docente de la asignatura para el primer semestre del curso 2024-2025. Podéis consultar si la asignatura se ofrece este semestre en el espacio del campus Más UOC / La universidad / Planes de estudios). Una vez empiece la docencia, tenéis que consultarlo en el aula. El plan docente puede estar sujeto a cambios.

Los datos en formato de texto (formato no estructurado) son uno de los grandes recursos que tenemos a disposición pero que, por su naturaleza, son extremadamente complejos de analizar y de extraer automáticamente la información y conocimiento que contienen.

En esta asignatura veremos las bases del procesamiento del lenguaje natural o, concretamente, de la comprensión del lenguaje natural (Natural Language Understanding). Esta base teórica nos permite adentrarnos en el análisis de sentimientos (sentiment analysis), que constituye un importante campo de investigación en la actualidad.

Concretamente, veremos  como interpretar y analizar automáticamente la información textual, como extraer sentimientos y opiniones de textos, y cómo evaluar la calidad de los sistemas de reconocimiento de sentimientos. Lo haremos mediante técnicas clásicas de linguística computacional, así como también aplicando algunos de los principales métodos de aprendizaje automático (machine learning) y aprendizaje profundo (deep learning) para tareas de reconocimiento de textos y análisis de sentimientos.

Amunt

Esta asignatura pertenece al conjunto de asignaturas optativas del Máster universitario en Ciencia de datos (Data Science).

Amunt

El curso requiere que los estudiantes tengan conocimientos de programación (preferiblemente en lenguaje Python), así como conocimientos avanzados de aprendizaje automático (machine learning).

Se recomienda haber cursado la asignatura "Aprendizaje automático" antes de cursar esta asignatura, ya que se utilizan conceptos explicados en esta asignatura.

Además, como la metodología incluye estudios de casos y la investigación autónoma de información, es aconsejable que el estudiante esté familiarizado con la búsqueda de fuentes de información, el análisis de la información cuantitativa y cualitativa, la capacidad de sintetizar y obtener conclusiones así como de poseer ciertas habilidades de comunicación escrita.

Asimismo también es necesario que los estudiantes tengan la capacidad de leer y comprender el idioma inglés ya que una parte de los materiales adicionales y otros recursos, están en este idioma.

Amunt

Esta asignatura, diseñada de acuerdo con el real decreto de organización de las enseñanzas universitarias (RD 822/2021), permite desarrollar los conocimientos, habilidades y competencias que se detallan a continuación:

 Conocimientos o contenidos (Knowledge) 

 

¿      K1 Comprender el proceso general o global de un proyecto de ciencia o análisis de datos, incluyendo la identificación de fuentes de datos, la captura y almacenamiento de datos, el procesamiento y análisis de los mismos y, finalmente, la presentación de los resultados.

¿      K4 Comprender los mecanismos de extracción y transformación de datos, ya sea a partir de una única fuente de datos o haciendo uso de múltiples de fuentes de datos.

¿      K7 Comprender el amplio abanico de técnicas, métodos y herramientas disponibles para realizar el análisis de datos a partir de un conjunto de preguntas de negocio o de investigación.

 

Habilidades o destrezas (Skills)

 

¿      S1 Conceptualizar y diseñar un flujo de trabajo que permita resolver problemas específicos en el entorno de un proyecto de ciencia de datos.

¿      S3 Analizar, conceptualizar, diseñar y desarrollar aplicaciones basadas en inteligencia artificial para la resolución de problemas específicos en el contexto de un proyecto de ciencia de datos.

¿      S4 Conocer las distintas técnicas, métodos, modelos y algoritmos dentro de la inteligencia artificial que permiten la resolución de diferentes tareas, considerando sus principales puntos fuertes y sus debilidades o problemas más relevantes.

Competencias (Competences)

 

¿      C2 Desarrollar el pensamiento crítico y autocrítico en el análisis, la conceptualización y el diseño de proyectos de ciencia de datos.

 

La combinación de estos conocimientos, destrezas y competencias se refleja en los siguientes resultados de aprendizaje:

¿      Procesamiento y comprensión del lenguaje natural.

¿      Aplicar las técnicas y herramientas para las principales tareas de comprensión del lenguaje natural, incluyendo la identificación automática de temas e idiomas, la identificación de entidades nombradas y la extracción de palabras clave.

¿      Comprender y aplicar el proceso, incluyendo las principales técnicas y herramientas, de análisis de sentimientos basados en textos.

¿      Aplicar las distintas aproximaciones al análisis de texto y las principales diferencias entre ellas.

¿      Comprender las principales características de las técnicas supervisadas y no-supervisadas para el análisis de textos.

Actuar de manera ética, honesta y cívica en el trabajo académico y profesional, evitando el plagio o cualquier otro uso indebido del trabajo de terceros.

Amunt

Los contenidos trabajados en el curso abarcan las siguientes temáticas:

Módulo 1: Cómo interpretar y analizar automáticamente la información textual 

Módulo 2: Extracción de sentimientos y opiniones 

Módulo 3: Evaluación de la calidad de los sistemas de reconocimiento de sentimientos 

Módulo 4: Deep Learning aplicado al procesamiento de lenguaje natural

Módulo 5: Identificar y enlazar entidades nombradas

Módulo 6: Deep Learning aplicado al análisis de sentimientos y opiniones 

Módulo 7: Nuevas tendencias

Amunt

Espacio de recursos de ciencia de datos Web
Deep learning para el análisis de sentimientos PDF
Módulo 4- Implementación del deep learning aplicado al procesamiento del lenguaje natural PDF
Módulo 4-Introducción al deep learning aplicado al procesamiento del lenguaje natural PDF
Named Entity Linking (Screencast) Audiovisual
Named Entity Recognition (Screencast) Audiovisual

Amunt

En la UOC, la evaluación generalmente es virtual. Se estructura en torno a la evaluación continua, que incluye diferentes actividades o retos; la evaluación final, que se lleva a cabo mediante pruebas o exámenes, y el trabajo final de la titulación.

Las actividades o pruebas de evaluación pueden ser escritas y/o audiovisuales, con preguntas aleatorias, pruebas orales síncronas o asíncronas, etc., de acuerdo con lo que decida cada equipo docente. Los trabajos finales representan el cierre de un proceso formativo que implica la realización de un trabajo original y tutorizado que tiene como objetivo demostrar la adquisición competencial hecha a lo largo del programa.

Para verificar la identidad del estudiante y la autoría de las pruebas de evaluación, la UOC se reserva la potestad de aplicar diferentes sistemas de reconocimiento de la identidad y de detección del plagio. Con este objetivo, la UOC puede llevar a cabo grabación audiovisual o usar métodos o técnicas de supervisión durante la ejecución de cualquier actividad académica.

Asimismo, la UOC puede exigir al estudiante el uso de dispositivos electrónicos (micrófonos, cámaras u otras herramientas) o software específico durante la evaluación. Es responsabilidad del estudiante asegurar que estos dispositivos funcionan correctamente.

El proceso de evaluación se fundamenta en el trabajo personal del estudiante y presupone la autenticidad de la autoría y la originalidad de las actividades académicas. La web sobre integridad académica y plagio de la UOC contiene información al respecto.

La falta de autenticidad en la autoría o de originalidad de las pruebas de evaluación; la copia o el plagio; la suplantación de identidad; la aceptación o la obtención de cualquier actividad académica a cambio o no de una contraprestación; la colaboración, el encubrimiento o el favorecimiento de la copia, o el uso de material, software o dispositivos no autorizados en el plan docente o el enunciado de la actividad académica, incluida la inteligencia artificial y la traducción automática, entre otras, son conductas irregulares en la evaluación que pueden tener consecuencias académicas y disciplinarias graves.

Estas conductas irregulares pueden conllevar el suspenso (D/0) en las actividades evaluables definidas en el plan docente -incluidas las pruebas finales- o en la calificación final de la asignatura, ya sea porque se han utilizado materiales, software o dispositivos no autorizados durante las pruebas (como el uso de inteligencia artificial no permitida, redes sociales o buscadores de información en internet), porque se han copiado fragmentos de texto de una fuente externa (internet, apuntes, libros, artículos, trabajos o pruebas de otros estudiantes, etc.) sin la citación correspondiente, por la compraventa de actividades académicas, o porque se ha llevado a cabo cualquier otra conducta irregular.

Asimismo, y de acuerdo con la normativa académica, las conductas irregulares en la evaluación también pueden dar lugar a la incoación de un procedimiento disciplinario y a la aplicación, si procede, de la sanción que corresponda, de conformidad con lo establecido en la normativa de convivencia de la UOC.

En el marco del proceso de evaluación, la UOC se reserva la potestad de:

  • Solicitar al estudiante que acredite su identidad según lo establecido en la normativa académica.
  • Solicitar al estudiante que acredite la autoría de su trabajo a lo largo de todo el proceso de evaluación, tanto en la evaluación continua como en la evaluación final, a través de una entrevista oral síncrona, que puede ser objeto de grabación audiovisual, o por los medios establecidos por la UOC. Estos medios tienen el objetivo de verificar los conocimientos y las competencias que garanticen la identidad del estudiante. Si no es posible garantizar que el estudiante es el autor de la prueba, esta puede ser calificada con una D, en el caso de la evaluación continua, o con un suspenso, en el caso de la evaluación final.

Inteligencia artificial en el marco de la evaluación

La UOC reconoce el valor y el potencial de la inteligencia artificial (IA) en el ámbito educativo y, a su vez, pone de manifiesto los riesgos que supone si no se utiliza de forma ética, crítica y responsable. En este sentido, en cada actividad de evaluación se informará al estudiantado sobre las herramientas y los recursos de IA que se pueden utilizar y en qué condiciones. Por su parte, el estudiantado se compromete a seguir las indicaciones de la UOC a la hora de realizar las actividades de evaluación y de citar las herramientas utilizadas y, concretamente, a identificar los textos o imágenes generados por sistemas de IA, los cuales no podrá presentar como si fueran propios.

Respecto a usar o no la IA para resolver una actividad, el enunciado de las actividades de evaluación indica las limitaciones en el uso de estas herramientas. Debe tenerse en cuenta que usarlas de manera inadecuada, como por ejemplo en actividades en las que no están permitidas o no citarlas en las actividades en las que sí lo están, puede considerarse una conducta irregular en la evaluación. En caso de duda, se recomienda que, antes entregar la actividad, se haga llegar una consulta al profesorado colaborador del aula.

Amunt

La asignatura solo puede aprobarse con el seguimiento y la superación de la evaluación continua (EC). La calificación final de la asignatura es la nota obtenida en la EC.

 

Amunt