Tecnologies del llenguatge Codi:  07.554    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informació addicional sobre els recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

Enfocament conceptual i projecció professional

L'objectiu de l'assignatura és oferir a l'alumne un coneixement sòlid, teòric i pràctic, dels aspectes més centrals de la Lingüística Computacional. La Lingüística Computacional és un camp d'estudi interdisciplinari en el que, com el seu nom assenyala, conflueixen fonamentalment dues disciplines: la Lingüística i les Ciències de la Computació, o Informàtica. La primera disciplina té com a objectiu l'estudi del llenguatge en les seves dimensions: Fonètica, Fonologia, Morfologia, Sintaxis i Semàntica. Les diferents teories han de descriure i explicar el fet lingüístic i han de fer-ho amb el major rigor, adequació empírica i precisió possibles. Això s'aconsegueix mitjançant la construcció de models formals. La Informàtica té al seu càrrec la implementació en ordinadors d'aquests models. Hi ha un conjunt de disciplines que proporcionen les eines per a la formalització i que enllacen Lingüística i Informàtica, fonamentalment la Lògica i l'Estadística. Des de la perspectiva de la Informàtica, el tractament del llenguatge es contempla dins del camp de la Intel·ligència Artificial, on s'estudia la modelació i implementació del conjunt de les capacitats cognoscitives.

Amunt

 L'alumne de Segon Cicle ha estat ja introduït en la Lingüística Computacional mitjançant Llengua catalana i tecnologies digitals, on es va oferir una panoràmica sobre les aplicacions del tractament informatitzat del llenguatge. Juntament amb la presentació dels seus diferents àmbits tecnològics es van exposar alguns dels conceptes propis de la disciplina.  

En aquesta assignatura oferim una visió molt més pràctica de la disciplina, on totes les tècniques exposades es provaran de manera pràctica. Aquesta vessant pràctica es concreta amb la programació de petites aplicacions de Processament del Llenguatge Natural amb Python i NLTK (Natural Language Toolkit)

Amunt

Les aplicacions de la Lingüística en el terreny industrial o comercial tradicionalment han estat lligades a l'àmbit editorial (correcció, documentalisme), a la traducció i l'ensenyament de llengües. La irrupció de l'ordinador permet l'automatització total o parcial de les tasques pròpies d'aquestes activitats i també l'extensió de les aplicacions del coneixement lingüístic. Ens trobem així, des de mitjans del segle XX, i particularment dels anys vuitanta ençà, amb la consolidació de la Lingüística Computacional en un ampli conjunt de línies de treball:

         - Traducció automàtica

         - Classificació i recuperació documental

         - Generació automàtica d'informes i resums

         - Correcció

         - Comunicació home-màquina en llenguatge natural

         - Anàlisi i generació de parla

Darrerament, amb l'explosió d'Internet, s'ha fixat el terme de Tecnologies de la Informació per a referir-se al conjunt de tècniques i eines de programació lligades a la cerca i processament de la informació recollida en suport informàtic. L'eficàcia en aquests processos resulta vital per a molts camps industrials. El volum creixent d'informació disponible està en part recollit en bases de dades i en part dispers en múltiples documents. Aquests documents estan escrits en llenguatge natural, i així els coneixements propis de la Lingüística Computacional tenen un paper fonamental en el disseny de programes eficaços per al seu processament.

Els coneixements i tècniques de la Lingüística Computacional són en general independents del llenguatge objecte del processament. En el cas dels estudiants de Filologia Catalana, l'apropament a aquesta disciplina té un sentit especial donat que hi ha una demanda creixent per a la presència del català a Internet, i també pel desenvolupament d'eines informàtiques que ajudin a consolidar la nostra llengua en molts àmbits de l'Administració, el comerç i la indústria. Aquesta assignatura us familiaritzarà amb les principals tècniques del processament del llenguatge amb ordinadors, facilitant-vos la incorporació a projectes on es demanin lingüistes amb formació computacional i obrint-vos la porta a una posterior especialització en aquest camp mitjançant cursos de màster o doctorat.

Durant el curs aprendrem a programar aplicacions de Processament del Llenguatge Natural en el llenguatge de programació Python. Per poder superar l'assignatura no cal tenir coneixements de programació en aquest llenguatge ni en cap altra. La programació d'aplicacions es veurà molt facilitada per l'ús del paquet NLTK (Natural Language Toolkit). Aquest contacte amb la programació podrà ser de gran utilitat tant en els estudis com en la pràctica professional.

Amunt

L'alumne hauria de tenir com a coneixements generals de gramàtica, especialment el relacionats amb la sintaxi. No es requereixen coneixements específics del camp, però és idoni haver cursat Llengua catalana i tecnologies digitals. Tampoc seran necessaris coneixements previs de programació.

Amunt

 Objectius

L'assignatura té com a objectius generals adquirir la capacitat de formalitzar problemes lingüístics, saber expressar-los com a problemes computacionals i lligar-los a les necessitats de les principals aplicacions de la Lingüística Computacional. És a dir, quina estructura de dades i quins procediments són apropiats per a obtenir una representació sintàctica i semàntica d'un text, quins recursos de programari poden ser utilitzats, i quines representacions són convenients per als diferents tipus d'aplicacions.

Competències específiques:

5. Identificació de les relacions de la lingüística amb les altres ciències, humanes, socials o experimentals, i, al mateix temps, caracterització del que la distingeix i singularitza com a ciència.

5.6. Relacionar l'anàlisi lingüística amb la intel·ligència artificial i les seves tècniques i aplicacions que incorporen coneixement lingüístic, i ser capaç d'avaluar el coneixement lingüístic que incorpora una aplicació.

18. Aplicació dels coneixements de llengua, literatura, lingüística i processament del llenguatge en activitats específiques dels àmbits de l'assessorament lingüístic i les indústries culturals.

18.1. Conèixer les tècniques que estan subjacents a les aplicacions informàtiques de tractament del llenguatge i saber donar-hi coneixement lingüístic.

Competències transversals

2. Ús i aplicació de les TIC en l'àmbit acadèmic i professional.

2.2. Utilitzar les eines i els recursos informàtics relacionats amb la disciplina de manera adequada a cada context.

5. Resolució de problemes i formulació de preguntes.

5.1. Resoldre problemes rellevants a la disciplina amb criteri i de manera efectiva, tot identificant, analitzant i definint els elements significatius.

Amunt

1. Introducció

2. Elements bàsics del llenguatge de programació Python

3. Natural Language Toolkit (NLTK)

4. Anàlisi textual i processament de corpus

5. Morfologia computacional

6. Etiquetatge morfosintàctic

7. Formalismes sintàctics

8. Tractament de formats textuals amb Python

Amunt

Les citacions i referències bibliogràfiques en el treball acadèmic Web
Programació en Python per a filòlegs, lingüistes i traductors Web

Amunt

Els materials de l'assignatura són:

  1. Mòduls en suport paper.
  2. Els programes necessaris es descarregaran d'Internet.

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt