Mineria de dades Codi:  05.584    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
ATENCIÓ: Aquesta informació recull els apartats del pla docent de l'assignatura durant el darrer semestre amb docència. En iniciar el període de matrícula, podràs consultar el calendari i model d'avaluació per al següent semestre a Tràmits / Matrícula / Horaris de les proves d'avaluació final.

Mineria de Dades és una assignatura d'aplicació dels coneixements previs que heu après a Estadística i Bases de Dades i de presentació d'alguns de nous. Es presenten un conjunt de mètodes procedents de la Intel·ligència Artificial, que formen el nucli essencial de la disciplina coneguda com Data Mining. Els conceptes estadístics són molt útils en aquesta assignatura i permetran avaluar millor algunes de les tècniques que s'estudiaran.

Amunt

Dintre del Grau d'Enginyeria Informàtica, aquesta assignatura és optativa i està pensada per realitzar-la després d'haver adquirit els coneixements necessaris d'estadística, bases de dades i programació, com a punt final d'una trajectòria orientada a l'anàlisi d'informació.

Per altra banda, aquesta assignatura també s'ofereix com a complement de formació en altres programes, per dotar als estudiants de màster dels coneixements bàsics en l'àmbit de la mineria de dades.

Amunt

Avui dia es considera crucial l'anàlisi de dades per aconseguir informació.

Les opcions professionals d'aquesta assignatura són, d'una banda, el món del R+D tant en la indústria informàtica com en l'empresa orientada a negoci i, per altra banda, la investigació en un context més acadèmic.

Aquesta assignatura pretén preparar futurs analistes d'informació, els quals hauran de descobrir coneixement en forma de patrons amagats en quantitats ingents de dades que avui dia genera qualsevol procés industrial o econòmic. Un exemple seria preveure com reaccionarà el mercat davant d'una campanya de màrqueting en funció de les dades emmagatzemades d'experiències anteriors.

Amunt

Aquesta assignatura requereix coneixements bàsics d'estadística, així com coneixements de programació i bases de dades. També cal ser capaç de llegir documentació en anglès.

Amunt

Per cursar aquesta assignatura cal haver superat Estadística i es recomana haver superat Bases de dades I.

Amunt

Objectius

1. Saber en què consisteix el procés de mineria de dades i conèixer les seves fases.

2. Conèixer les tasques a que es pot dirigir un procés de mineria de dades.

3. Conèixer els principals models que es poden extreure de les dades i serveixen per a portar endavant les tasques anteriors.

4.  Conèixer les tècniques que permeten construir els models esmentats: quan es poden aplicar i sota quines condiciones; quina mena de resultats donen; com cal preparar les dades per poder-les utilitzar i com s'ha d'avaluar i comparar la seva qualitat.

5.  Decidir davant un problema pràctic concret quina tasca de mineria de dades convé endegar, quin model es vol obtenir, quina tècnica resultaria més adequada d'utilitzar i com avaluar els resultats obtinguts.

6. Practicar amb un entorn tecnològic actual que implementa les tecnologies tractades al llarg del curs.

 

Competències transversals

2. Ús i aplicació de les TIC en l'àmbit acadèmic i professional.

5. Capacitat per a adaptar-se a les tecnologies i als futurs entorns actualitzant les competències professionals.

6. Capacitat per a innovar i generar noves idees.

 

Competències específiques

1. Capacitat per a planificar i gestionar projectes en l'entorn de les TIC.

3. Capacitat per a avaluar solucions tecnològiques i elaborar propostes de projectes tenint en compte els recursos, les alternatives disponibles i les condicions de mercat.

6. Capacitat d'analitzar un problema en el nivell d'abstracció adequat a cada situació i aplicar les habilitats i els coneixements adquirits per a abordar-lo i resoldre'l.

11. Capacitat de dissenyar i construir aplicacions informàtiques mitjançant tècniques de desenvolupament, integració i reutilització.

13. Capacitat per a aplicar les tècniques específiques de tractament, emmagatzematge i administració de dades.

14. Capacitat per a proposar i avaluar diferents alternatives tecnològiques per a resoldre un problema concret.

 

Amunt

El material didàctic de l'assignatura en format paper es divideix en nou mòduls que presenten una notable interrelació entre ells. El novè és un cas d'estudi que es pot utilitzar per a veure com els mètodes explicats als altres mòduls s'apliquen en un cas concret i real.

A continuació s'enumeren els mòduls que s'han de treballar per poder assolir els objectius de l'assignatura. En negreta s'indiquen els mòduls d'estudi obligatòri i avaluables.

Mòdul 1: El procés de Mineria de Dades

  1. Descoberta de coneixement a partir de dades
  2. Les fases del procés d'extracció de coneixement    
  3. Les eines de Mineria de Dades
  4. Cas d'estudi de tot el curs: Hyper-Gym

Mòdul 2: Preparació de dades

  1. Preliminars: repàs de conceptes estadístics
  2. Preliminars: tipus d'atributs
  3. Operacions de preparació de dades
  4. Tractament de la manca de dades
  5. Reducció de dimensionalitat
  6. Mètodes de reducció de casos

Mòdul 3: Classificació: arbres de decisió

  1. Introducció: l'estructura dels arbres de decisió
  2. Mètodes de construcció d'arbres de decisió per classificació: ID3 i C4.5
  3. Construcció d'arbres de decisió per regressió i classificació: CART
  4. Construcció d'arbres de decisió per predicció numèrica: CHAID
  5. Mètodes de construcció d'arbres de decisió multivariants: LMDT
  6. Ponderació final dels arbres de decisió

Mòdul 5: Mètodes d'agregació

  1. La similaritat, base per a l'agrupació d'objectes
  2. Espai, distància i semblança
  3. Mètodes d'agregació basats en semblança i mètodes probabilistes
  4. Interpretació dels models obtinguts
  5. Ponderació dels mètodes d'agregació

Mòdul 6: Regles d'associació

  1. Què són les regles d'associació?
  2. Construcció de regles d'associació simples
  3. Ponderació de les regles d'associació

Mòdul 8: Avaluació de models

  1. Avaluació de models classificatoris
  2. Validació creuada ("K Cross-Validation")
  3. Comparació de rendiments
  4. Altres formes d'estimar la qualitat de models predictius
  5. Cost

Mòdul 9: Cas d'Estudi

  1. El cas dels pous de petroli
  2. Preparació de dades
  3. Obtenció de models
  4. Avaluació i comparació

Amunt

Mineria de dades PDF
Mineria de dades PDF
Redacció de textos científicotècnics PDF

Amunt

El material didàctic associat a l'assignatura comprèn:  

1. Aquest Pla Docent.

 2. Els mòduls didàctics que estan disponibles en format paper.

El Material Didàctic en format paper està constituït per nou mòduls. No es necessari treballar sobre tots aquests mòduls per tal d'assolir els objectius de l'assignatura. L'estudiant es podrà moure fàcilment pels materials que ha d'estudiar seguint les indicacions d'aquest pla docent. Tot i això, l'estudiant es lliure d'ampliar els seus coneixements sobre Data Mining amb la lectura dels mòduls que no s'estudien en l'assignatura. 

El Mòdul 9 és la descripció d'un cas real d'aplicació i permet contextualitzar els conceptes que es van explicant al llarg dels altres mòduls. Per tant es considera que es un complement dels altres mòduls i es pot consultar en paral·lel als altres durant el curs.

3. El programari utilitzat a l'assignatura i la seva documentació.

4. Diferents recursos docents que s'aniran enllaçant a l'aula al llarg del semestre.

Amunt

La Normativa acadèmica de la UOC disposa que el procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis fets.

La manca d'originalitat en l'autoria o el mal ús de les condicions en què es fa l'avaluació de l'assignatura és una infracció que pot tenir conseqüències acadèmiques greus.

L'estudiant serà qualificat amb un suspens (D/0) si es detecta manca d'originalitat en l'autoria d'alguna activitat avaluable (pràctica, prova d'avaluació contínua (PAC) o final (PAF), o la que es defineixi al pla docent), sigui perquè ha utilitzat material o dispositius no autoritzats, sigui perquè ha copiat textualment d'internet, o ha copiat d'apunts, de materials, de manuals o d'articles (sense la citació corresponent), d'altres estudiants, o per qualsevol altra conducta irregular.

La qualificació de suspens (D/0) en les qualificacions finals d'avaluació contínua pot comportar l'obligació de fer l'examen presencial per a superar l'assignatura (si hi ha examen i si superar-lo és suficient per a superar l'assignatura segons indiqui el pla docent).

Quan aquesta mala conducta es produeixi durant la realització de les proves d'avaluació finals presencials, l'estudiant pot ser expulsat de l'aula, i l'examinador farà constar tots els elements i la informació relatius al cas.

D'altra banda, aquesta conducta pot donar lloc a la incoació d'un procediment disciplinari i l'aplicació, si escau, de la sanció que correspongui.

La UOC habilitarà els mecanismes que consideri oportuns per a vetllar per la qualitat de les seves titulacions i garantir l'excel·lència i la qualitat del seu model educatiu.

Amunt

Aquesta assignatura només es pot superar a partir de l'avaluació contínua (AC), nota que es combina amb una nota de pràctiques (Pr) per a obtenir la nota final de l'assignatura. No es preveu fer cap examen final o prova de validació presencial. La fórmula d'acreditació de l'assignatura és la següent: AC + Pr.

 
 

Amunt