Aprenentatge automàtic Codi:  M2.991    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

L'objectiu de la mineria de dades és extreure coneixement en forma de patrons, regles i altres models matemàtics i algorísmics que descriuen la naturalesa subjacent a un problema concret. És sabut que no hi ha un model universal que funcioni millor que la resta per a qualsevol problema o conjunt de dades (l'anomenat "no free lunch theorem"), sinó que cal analitzar la naturalesa d'aquest problema i intentar aplicar el millor mètode possible, o bé una combinació d'ells.

En l'actualitat, la investigació frontera en l'àmbit de la mineria de dades es basa, d'una banda, a millorar els algoritmes coneguts mitjançant el fine-tuning dels seus paràmetres, la qual cosa pot permetre obtenir resultats lleugerament millors per a un conjunt de dades donat. A l'escenari actual Big Data, a causa de l'aparició de conjunts de dades massius, d'alta dimensionalitat i majoritàriament categòrics, cal també ajustar els algoritmes tradicionals per incrementar la seva eficàcia, atès que s'incompleixen moltes de les premisses en les quals estan basats (normalitat, suavitat, distàncies ben definides, etc.).

D'altra banda, també és possible millorar els resultats obtinguts mitjançant la combinació de diferents classificadors, creant sistemes de decisió complexos a partir de centenars o milers de classificadors més senzills. Això inclou l'ús d'esquemes de votació, la generació aleatòria de classificadors a partir d'un model preestablert i la reutilització de decisions preses anteriorment per millorar la predicció actual.

Per tant, en aquesta assignatura es descriuen alguns dels models i algoritmes considerats l'estat de l'art en mineria de dades i s'introdueix el concepte de combinació de classificadors, de manera que l'estudiant comprengui la necessitat d'analitzar el problema a resoldre des de diferents perspectives analítiques i proposi una solució que combini un o més models en funció dels objectius a assolir.

Amunt

Aquesta assignatura pertany al conjunt d'assignatures obligatòries dins del Màster universitari en Ciència de dades (Data Science).

Es recomana cursar aquesta assignatura abans que la resta d'assignatures d'anàlisi de dades, que s'ofereixen com a optatives dins del màster.

Amunt

L'objectiu del màster és la formació de professionals en la ciència de dades. Aquesta assignatura, específicament, es focalitza en els camps relacionats amb l'anàlisi, l'estadística avançada i la mineria de dades (o machine learning).

A mesura que aquesta especialitat ha crescut i les empreses reconeixen la necessitat d'aquesta classe de perfils, també ho han fet les diferents sortides professionals:

  • Científics de dades en departaments especialitzats d'anàlisi i estadística o en empreses externes que proporcionen aquesta classe de servei als seus clients.
  • Responsables, caps de projecte o analistes en projectes de mineria o anàlisi de dades.
  • Emprenedors, que desitgen crear negocis basats en la creació o la implantació de sistemes especialitzats de ciència de dades o d'algun dels seus components, així com productes i / o serveis basats en dades.

Amunt

Per a la realització d'aquesta assignatura es necessiten coneixements de programació, principalment en llenguatge Python.

Pel que fa a coneixements teòrics o matemàtics, es pressuposa que els estudiants que cursen aquesta assignatura han cursat prèviament l'assignatura de "mineria de dades", que introdueix els conceptes bàsics sobre els algoritmes supervisats i no supervisats.

A més, ja que la metodologia inclou estudis de casos i la investigació autònoma d'informació, és aconsellable que l'estudiant estigui familiaritzat amb la recerca de fonts d'informació, l'anàlisi de la informació quantitativa i qualitativa, la capacitat de sintetitzar i obtenir conclusions així com de posseir certes habilitats de comunicació escrita.

Finalment, donada la naturalesa de l'assignatura, és necessari utilitzar eines i procediments descrits en llengua anglesa, de manera que un nivell bàsic de lectura i comprensió de textos tècnics és imprescindible.

Amunt

Aquesta assignatura, dissenyada d'acord amb el Reial decret d'organització dels ensenyaments universitaris (RD 822/2021), permet desenvolupar els coneixements, les habilitats i les competències que es detallen a continuació:


Coneixements o continguts (Knowledge)

  • K6 Conèixer i aplicar tècniques d'anàlisi estadística i descriptiva per obtenir informació rellevant a partir de les dades emprades en un projecte de ciència de dades.

  • K7 Comprendre l'ampli ventall de tècniques, mètodes i eines disponibles per fer l'anàlisi de dades a partir d'un conjunt de preguntes de negoci o de recerca.

 Habilitats o destreses (Skills)

  • S3 Analitzar, conceptualitzar, dissenyar i desenvolupar aplicacions basades en intel·ligència artificial per resoldre problemes específics en el context d'un projecte de ciència de dades.

  • S4 Conèixer les diferents tècniques, mètodes, models i algorismes dins de la intel·ligència artificial que permeten la resolució de diferents tasques, considerant-ne els principals punts forts i les debilitats o problemes més rellevants.

  • S5 Utilitzar de manera avançada els llenguatges de programació, les eines de desenvolupament i les tecnologies disponibles per a l'anàlisi, el disseny i la implementació d'aplicacions basades en intel·ligència artificial.

Competències (Competències)

  • C1 Actuar de manera honesta, ètica, sostenible, socialment responsable i respectuosa amb els drets humans i la diversitat, tant a la pràctica acadèmica com a la professional, i dissenyar solucions per a la millora d'aquestes pràctiques.

  • C2 Desenvolupar el pensament crític i autocrític a l'anàlisi, la conceptualització i el disseny de projectes de ciència de dades.

  • C3 Dissenyar, desenvolupar i gestionar projectes de ciència de dades, adaptant-se a l'evolució de les tecnologies, els llenguatges de programació i les necessitats d'empreses, institucions i, en general, de la societat.

  • C6 Avaluar de manera crítica, justificada i objectiva el resultat d'un projecte de ciència de dades.

La combinació d'aquests coneixements, destreses i competències es reflecteix en els resultats d'aprenentatge següents:

  • Comprendre els mètodes principals de selecció i generació d'atributs per a la reducció de la dimensionalitat de les dades.

  • Comprendre la diferència entre mètodes supervisats i no supervisats, saber escollir el més adequat i com combinar-los per resoldre un problema determinat.

  • Identificar i aplicar els mètodes principals per a la creació de models de classificació, regressió i agrupació.

  • Optimitzar els diferents models d'aprenentatge automàtic, ja siguin models supervisats o no supervisats.

  • Avaluar l'ajust dels resultats obtinguts a partir dels models construïts.

  • Aplicar mètodes de combinació de classificadors per millorar l'eficiència dels models construïts.

  • Actuar de manera ètica, honesta i cívica en el treball acadèmic i professional, evitant el plagi o qualsevol altre ús indegut del treball de tercers.

  • Incorporar l'anàlisi de la diversitat funcional, social, cultural, econòmica, política, lingüística i de gènere a la pràctica acadèmica i professional.

Amunt

Introducció

  • Introducció a la mineria de dades
  • Conceptes preliminars
  • Preparació de les dades

Validació i avaluació de resultats

  • Protocols de validació
  • Avaluació de resultats

Extracció i selecció d'atributs

  • Extracció i selecció d'atributs

Mètodes no supervisats

  • Agrupament jeràrquic
  • El mètode k-means i derivats
  • Canopy clustering algorithm

Mètodes supervisats

  • Algorisme k-NN
  • Màquines de suport vectorial
  • Xarxes neuronals
  • Arbres de decisió
  • Mètodes probabilístics

Combinació de classificadors

  • Combinació de classificadors

Amunt

Objectius PLA1 Audiovisual
Tipologia de problemes i mètodes Audiovisual
Avaluació de resultats Audiovisual
Entrenament i test Audiovisual
Objectius PLA2 Audiovisual
Agrupament jeràrquic Audiovisual
El mètode k-means i derivats Audiovisual
Algorisme d'agrupament Canopy Audiovisual
Objectius PLA3 Audiovisual
Algorisme k-NN Audiovisual
Support Vector Machines (SVM) Audiovisual
Xarxes neuronals artificials (ANN) Audiovisual
Objectius PLA4 Audiovisual
Combinació de classificadors Audiovisual
Arbres de decisió Audiovisual
Ou aglutinador: Accés a bases de dades d'articles de congressos i revistes de mineria de dades i machine learning Web
Espai de recursos de ciència de dades Web
Introducció a l'anàlisi de sèries temporals PDF
Biaix algorísmic PDF
Biaixos de sexe i gènere en intel·ligència artificial i salut Audiovisual

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt