Tecnologies del llenguatge Codi:  07.554    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
ATENCIÓ: Aquest és el pla docent de l'assignatura per al primer semestre del curs 2020-2021. Us servirà per planificar la matrícula. Un cop comenci la docència, heu de consultar-lo a l'aula. (El pla docent pot estar subjecte a canvis.)

Enfocament conceptual i projecció professional

L'objectiu de l'assignatura és oferir a l'alumne un coneixement sòlid, teòric i pràctic, dels aspectes més centrals de la Lingüística Computacional. La Lingüística Computacional és un camp d'estudi interdisciplinari en el que, com el seu nom assenyala, conflueixen fonamentalment dues disciplines: la Lingüística i les Ciències de la Computació, o Informàtica. La primera disciplina té com a objectiu l'estudi del llenguatge en les seves dimensions: Fonètica, Fonologia, Morfologia, Sintaxis i Semàntica. Les diferents teories han de descriure i explicar el fet lingüístic i han de fer-ho amb el major rigor, adequació empírica i precisió possibles. Això s'aconsegueix mitjançant la construcció de models formals. La Informàtica té al seu càrrec la implementació en ordinadors d'aquests models. Hi ha un conjunt de disciplines que proporcionen les eines per a la formalització i que enllacen Lingüística i Informàtica, fonamentalment la Lògica i l'Estadística. Des de la perspectiva de la Informàtica, el tractament del llenguatge es contempla dins del camp de la Intel·ligència Artificial, on s'estudia la modelació i implementació del conjunt de les capacitats cognoscitives.

Amunt

 L'alumne de Segon Cicle ha estat ja introduït en la Lingüística Computacional mitjançant Llengua catalana i tecnologies digitals, on es va oferir una panoràmica sobre les aplicacions del tractament informatitzat del llenguatge. Juntament amb la presentació dels seus diferents àmbits tecnològics es van exposar alguns dels conceptes propis de la disciplina.  En aquesta assignatura oferim una visió molt més pràctica de la disciplina, on totes les tècniques exposades es provaran de manera pràctica. Aquesta vessant pràctica es concreta amb la programació de petites aplicacions de Processament del Llenguatge Natural amb Python i NLTK (Natural Language Toolkit)

Amunt

Les aplicacions de la Lingüística en el terreny industrial o comercial tradicionalment han estat lligades a l'àmbit editorial (correcció, documentalisme), a la traducció i l'ensenyament de llengües. La irrupció de l'ordinador permet l'automatització total o parcial de les tasques pròpies d'aquestes activitats i també l'extensió de les aplicacions del coneixement lingüístic. Ens trobem així, des de mitjans del segle XX, i particularment dels anys vuitanta ençà, amb la consolidació de la Lingüística Computacional en un ampli conjunt de línies de treball:

         - Traducció automàtica

         - Classificació i recuperació documental

         - Generació automàtica d'informes i resums

         - Correcció

         - Comunicació home-màquina en llenguatge natural

         - Anàlisi i generació de parla

Darrerament, amb l'explosió d'Internet, s'ha fixat el terme de Tecnologies de la Informació per a referir-se al conjunt de tècniques i eines de programació lligades a la cerca i processament de la informació recollida en suport informàtic. L'eficàcia en aquests processos resulta vital per a molts camps industrials. El volum creixent d'informació disponible està en part recollit en bases de dades i en part dispers en múltiples documents. Aquests documents estan escrits en llenguatge natural, i així els coneixements propis de la Lingüística Computacional tenen un paper fonamental en el disseny de programes eficaços per al seu processament.

Els coneixements i tècniques de la Lingüística Computacional són en general independents del llenguatge objecte del processament. En el cas dels estudiants de Filologia Catalana, l'apropament a aquesta disciplina té un sentit especial donat que hi ha una demanda creixent per a la presència del català a Internet, i també pel desenvolupament d'eines informàtiques que ajudin a consolidar la nostra llengua en molts àmbits de l'Administració, el comerç i la indústria. Aquesta assignatura us familiaritzarà amb les principals tècniques del processament del llenguatge amb ordinadors, facilitant-vos la incorporació a projectes on es demanin lingüistes amb formació computacional i obrint-vos la porta a una posterior especialització en aquest camp mitjançant cursos de màster o doctorat.

Durant el curs aprendrem a programar aplicacions de Processament del Llenguatge Natural en el llenguatge de programació Python. Per poder superar l'assignatura no cal tenir coneixements de programació en aquest llenguatge ni en cap altra. La programació d'aplicacions es veurà molt facilitada per l'ús del paquet NLTK (Natural Language Toolkit). Aquest contacte amb la programació podrà ser de gran utilitat tant en els estudis com en la pràctica professional.

Amunt

L'alumne hauria de tenir com a coneixements generals de gramàtica, especialment el relacionats amb la sintaxi. No es requereixen coneixements específics del camp, però és idoni haver cursat Llengua catalana i tecnologies digitals. Tampoc seran necessaris coneixements previs de programació.

Amunt

 Objectius

L'assignatura té com a objectius generals adquirir la capacitat de formalitzar problemes lingüístics, saber expressar-los com a problemes computacionals i lligar-los a les necessitats de les principals aplicacions de la Lingüística Computacional. És a dir, quina estructura de dades i quins procediments són apropiats per a obtenir una representació sintàctica i semàntica d'un text, quins recursos de programari poden ser utilitzats, i quines representacions són convenients per als diferents tipus d'aplicacions.

Competències específiques:

5. Identificació de les relacions de la lingüística amb les altres ciències, humanes, socials o experimentals, i, al mateix temps, caracterització del que la distingeix i singularitza com a ciència.

5.6. Relacionar l'anàlisi lingüística amb la intel·ligència artificial i les seves tècniques i aplicacions que incorporen coneixement lingüístic, i ser capaç d'avaluar el coneixement lingüístic que incorpora una aplicació.

18. Aplicació dels coneixements de llengua, literatura, lingüística i processament del llenguatge en activitats específiques dels àmbits de l'assessorament lingüístic i les indústries culturals.

18.1. Conèixer les tècniques que estan subjacents a les aplicacions informàtiques de tractament del llenguatge i saber donar-hi coneixement lingüístic.

Competències transversals

2. Ús i aplicació de les TIC en l'àmbit acadèmic i professional.

2.2. Utilitzar les eines i els recursos informàtics relacionats amb la disciplina de manera adequada a cada context.

5. Resolució de problemes i formulació de preguntes.

5.1. Resoldre problemes rellevants a la disciplina amb criteri i de manera efectiva, tot identificant, analitzant i definint els elements significatius.

Amunt

1. Introducció a la lingüística computacional

2. Introducció a la programació en Python

3. Anàlisi textual i processament de corpus

4. Morfologia computacional

5. Etiquetatge morfosintàctic

6. Anàlisi fragmental (chunking)

7. Introducció a la programació en Prolog

8. Formalismes sintàctics

9. Eines i recursos per al català i castellà

Amunt

Amunt

Els materials de l'assignatura son:

  1. Mòduls en suport paper.
  2. Els programes necessaris es descarregaran d'Internet.

Amunt

La Normativa acadèmica de la UOC disposa que el procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis fets.

La manca d'originalitat en l'autoria o el mal ús de les condicions en què es fa l'avaluació de l'assignatura és una infracció que pot tenir conseqüències acadèmiques greus.

Es qualificarà l'estudiant amb un suspens (D/0) si es detecta manca d'originalitat en l'autoria d'alguna activitat avaluable (pràctica, prova d'avaluació contínua (PAC) o final (PAF), o la que es defineixi al pla docent), sigui perquè ha utilitzat material o dispositius no autoritzats, sigui perquè ha copiat textualment d'internet, o ha copiat d'apunts, de materials, de manuals o d'articles (sense la citació corresponent), d'altres estudiants, o per qualsevol altra conducta irregular.

La qualificació de suspens (D/0) en les qualificacions finals d'avaluació contínua pot comportar l'obligació de fer l'examen presencial per a superar l'assignatura (si hi ha examen i si superar-lo és suficient per a superar l'assignatura segons indiqui el pla docent).

Quan aquesta mala conducta es produeixi durant la realització de les proves d'avaluació finals presencials, l'estudiant pot ser expulsat de l'aula, i l'examinador farà constar tots els elements i la informació relatius al cas.

D'altra banda, aquesta conducta pot donar lloc a la incoació d'un procediment disciplinari i l'aplicació, si escau, de la sanció que correspongui.

La UOC habilitarà els mecanismes que consideri oportuns per a vetllar per la qualitat de les seves titulacions i garantir l'excel·lència i la qualitat del seu model educatiu.

Amunt

Aquesta assignatura es pot superar per una doble via: d'una banda a partir de l'avaluació contínua (AC), i d'altra banda, mitjançant la realització d'un examen final (EX). Per a fer l'EX no cal haver superat l'AC. La fórmula d'acreditació de l'assignatura és la següent: AC o EX.

 

Amunt