Mineria de dades Codi:  05.584    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informació addicional sobre els recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

Les dades són el nou petroli. Així doncs, Mineria de Dades és una assignatura d'aplicació dels coneixements previs que heu après a Estadística i Bases de Dades i de presentació d'alguns de nous més específics de l'àmbit d'extracció de coneixement. Es presenten un conjunt de mètodes procedents de la Intel·ligència Artificial, que formen el nucli essencial de la disciplina coneguda com Data Mining. Els conceptes bàsics de les assignatures mencionades són molt útils en aquesta assignatura i permetran avaluar millor algunes de les tècniques que s'estudiaran.

Amunt

Dintre del Grau d'Enginyeria Informàtica, aquesta assignatura és optativa i està pensada per realitzar-la després d'haver adquirit els coneixements necessaris d'estadística, bases de dades i programació, com a punt final d'una trajectòria orientada a l'anàlisi d'informació. En el cas del Grau de Ciència de Dades Aplicada es tracta d'una assignatura obligatòria. Finalment, aquesta assignatura també s'ofereix a d'altres programes com a complement de formació.

Amunt

Avui dia es considera crucial l'anàlisi de dades per aconseguir informació.

Les opcions professionals d'aquesta assignatura són, d'una banda, el món del R+D tant en la indústria informàtica com en l'empresa orientada a negoci i, per altra banda, la investigació en un context més acadèmic.

Aquesta assignatura pretén preparar futurs analistes d'informació, els quals hauran de descobrir coneixement en forma de patrons amagats en quantitats ingents de dades que avui dia genera qualsevol procés industrial o econòmic. Un exemple seria preveure com reaccionarà el mercat davant d'una campanya de màrqueting en funció de les dades emmagatzemades d'experiències anteriors.

Amunt

Aquesta assignatura requereix coneixements bàsics d'estadística, així com coneixements de programació i bases de dades. També cal ser capaç de llegir documentació en anglès.

Amunt

Per cursar aquesta assignatura es recomana haver cursat amb anterioritat assignatures com ara Estadística, Fonaments de Programació i Ús de Bases de Dades (o equivalents).

Amunt

Objectius

1. Saber en què consisteix el procés de mineria de dades i conèixer les seves fases.

2. Conèixer les tasques a que es pot dirigir un procés de mineria de dades.

3. Conèixer els principals models que es poden extreure de les dades i serveixen per a portar endavant les tasques anteriors.

4.  Conèixer les tècniques que permeten construir els models esmentats: quan es poden aplicar i sota quines condiciones; quina mena de resultats donen; com cal preparar les dades per poder-les utilitzar i com s'ha d'avaluar i comparar la seva qualitat.

5.  Decidir davant un problema pràctic concret quina tasca de mineria de dades convé endegar, quin model es vol obtenir, quina tècnica resultaria més adequada d'utilitzar i com avaluar els resultats obtinguts.

6. Practicar amb un entorn tecnològic actual que implementa les tecnologies tractades al llarg del curs.

 

Competències transversals

2. Ús i aplicació de les TIC en l'àmbit acadèmic i professional.

5. Capacitat per a adaptar-se a les tecnologies i als futurs entorns actualitzant les competències professionals.

6. Capacitat per a innovar i generar noves idees.

 

Competències específiques

1. Capacitat per a planificar i gestionar projectes en l'entorn de les TIC.

3. Capacitat per a avaluar solucions tecnològiques i elaborar propostes de projectes tenint en compte els recursos, les alternatives disponibles i les condicions de mercat.

6. Capacitat d'analitzar un problema en el nivell d'abstracció adequat a cada situació i aplicar les habilitats i els coneixements adquirits per a abordar-lo i resoldre'l.

11. Capacitat de dissenyar i construir aplicacions informàtiques mitjançant tècniques de desenvolupament, integració i reutilització.

13. Capacitat per a aplicar les tècniques específiques de tractament, emmagatzematge i administració de dades.

14. Capacitat per a proposar i avaluar diferents alternatives tecnològiques per a resoldre un problema concret.

 

Amunt

El material didàctic de l'assignatura es divideix en sis mòduls i un pròleg que presenten una notable interrelació entre ells. El sisè és un cas d'estudi que es pot utilitzar per a veure com els mètodes explicats als altres mòduls s'apliquen en un cas concret i real.

A continuació s'enumeren els mòduls que s'han de treballar per poder assolir els objectius de l'assignatura. 

Mòdul 1: El procés de Mineria de Dades

  1. Descobriment de coneixement en grans volums de dades.
  2. Les fases del procés d'extracció de coneixement.
  3. Les eines de mineria de dades i les àrees relacionades.

Mòdul 2: Preprocessament de dades i gestió de característiques

  1. Transformacions de valors.
  2. Reducció de la dimensionalitat.
  3. Valors absents.
  4. Visualització de característiques.
  5. Selecció de característiques.
  6. Enginyeria de característiques.

Mòdul 3: Models no supervisats

  1. Conceptes preliminars.
  2. Clustering i segmentació.
  3. Models basats en la densitat.
  4. Affinity propagation.

Mòdul 4: Models supervisats

  1. Models basats en la proximitat.
  2. Arbres de decisió.
  3. Models de regressió

Mòdul 5: Avaluació de models

  1. Avaluació de models supervisats de classificació.
  2. Avaluació de models supervisats de regressió.
  3. Avaluació de models no supervisats

Mòdul 6: Cas d'Estudi

  1. Presentació del cas.
  2. Pas 1: establir un objectiu analític.
  3. Pas 2: verificar les dades.
  4. Pas 3: preprocessament de dades.
  5. Pas 4: anàlisi exploratòria.
  6. Pas 5: classificació.
  7. Pas 6: reproductibilitat.

Amunt

1. El procés de mineria de dades PDF
3. Gestió de característiques PDF
5. Models supervisats PDF
0. Pròleg PDF
7. Cas d'estudi PDF
2. Preprocessament de dades PDF
6. Avaluació de models PDF
4. Models no supervisats PDF

Amunt

El material didàctic associat a l'assignatura comprèn:  

1. Aquest Pla Docent.

 2. Els mòduls didàctics que estan disponibles a l'aula.

3. El programari utilitzat a l'assignatura i la seva documentació.

4. El laboratori de Mineria de Dades associat.

5. Diferents recursos docents que s'aniran enllaçant a l'aula al llarg del semestre (datasets, exemples de bones pràctiques, ...).

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt