Anàlisi de textos Codi:  M2.993    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

Les dades en format de text (format no estructurat) són un dels grans recursos que tenim a disposició però que, per la seva naturalesa, són extremadament complexos d'analitzar i d'extreure automàticament la informació i coneixement que contenen.

En aquesta assignatura veurem les bases del processament del llenguatge natural o, concretament, de la comprensió del llenguatge natural (Natural Language Understanding). Aquesta base teòrica ens permet endinsar-nos en l'anàlisi de sentiments (sentiment analysis), que constitueix un important camp de recerca en l'actualitat.

Concretament, veurem com interpretar i analitzar automàticament la informació textual, com extreure sentiments i opinions de textos i com avaluar la qualitat dels sistemes de reconeixement de sentiments. Ho farem mitjançant tècniques clàssiques de linguística computacional, així com també aplicant alguns dels principals mètodes d'aprenentatge automàtic (machine learning) i d'aprenentatge profund (deep learning) per a tasques de reconeixement de textos i anàlisis de sentiments.

Amunt

Aquesta assignatura pertany al conjunt d'assignatures optatives del Màster universitari en Ciència de dades (Data Science).

Amunt

El curs requereix que els estudiants tinguin coneixements de programació (preferiblement en llenguatge Python), així com coneixements avançats d'aprenentatge automàtic (machine learning).

Es recomana haver cursat l'assignatura "Aprenentatge automàtic" abans de cursar aquesta assignatura, ja que s'utilitzen conceptes explicats en aquesta assignatura.

A més, com la metodologia inclou estudis de casos i la recerca autònoma d'informació, és aconsellable que l'estudiant estigui familiaritzat amb la cerca de fonts d'informació, l'anàlisi de la informació quantitativa i qualitativa, la capacitat de sintetitzar i obtenir conclusions així com de posseir certes habilitats de comunicació escrita.

Així mateix també és necessari que els estudiants tinguin la capacitat de llegir i comprendre l'idioma anglès ja que una part dels materials addicionals i altres recursos, estan en aquest idioma.

Amunt

Els objectius que es desitja que l'estudiant assoleixi mitjançant aquesta assignatura són els següents:

  • Conèixer les principals tècniques i eines per al processament i comprensió del llenguatge natural.
  • Saber aplicar les tècniques i eines per a les principals tasques de comprensió del llenguatge natural, incloent la identificació automàtica de temes i idiomes i l'extracció de paraules clau.
  • Conèixer el procés, juntament amb les principals tècniques i eines, per a l'anàlisi de sentiments basats en textos.
  • Saber quan aplicar les diferents aproximacions a l'anàlisi de sentiments i les principals diferències entre elles.
  • Comprendre les principals característiques de les tècniques supervisades i no supervisades per a l'anàlisi de sentiments basats en textos.

Amunt

Els continguts treballats en el curs abasten les següents temàtiques:

Mòdul 1: Com interpretar i analitzar automàticament la informació textual 

Mòdul 2: Extracció de sentiments i opinions 

Mòdul 3: Avaluació de la qualitat dels sistemes de reconeixement de sentiments 

Mòdul 4: Deep Learning aplicat al processament de llenguatge natural

Mòdul 5: Detectar i enllaçar entitats anomenades (NER i NEL)

Mòdul 6: Deep Learning aplicat a l'anàlisi de sentiments i opinions 

Mòdul 7: Noves tendéncias

Amunt

Espai de recursos de ciència de dades Web
Deep learning per a l'anàlisi de sentiments PDF
Mòdul 4-Implementació de deep learning aplicat al processament del llenguatge natural PDF
Mòdul 4-Introducció al deep learning aplicat al processament del llenguatge natural PDF
Named Entity Linking (Screencast) Audiovisual
Named Entity Recognition (Screencast) Audiovisual

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt