Big data Codi:  09.639    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels materials de què disposa l'assignatura   Materials i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
ATENCIÓ: Aquesta informació recull els apartats del pla docent de l'assignatura durant el darrer semestre amb docència. En iniciar el període de matrícula, podràs consultar el calendari i model d'avaluació per al següent semestre a Secretaria / Matrícula / Horaris proves d'avaluació final.

L'assignatura Big data, de 6 crèdits ECTS, forma part del bloc de matèries de formació obligatòria del grau d'Informació i Documentació. Aquesta assignatura proporciona a l'estudiant els fonaments teòrics i pràctics per entendre el funcionament dels sistemes de grans volums de dades i les seves aplicacions.

El curs presenta un recorregut des dels conceptes bàsic essencials per comprendre la importància dels mètodes d'anàlisis denominades Big Data fins a comprendre el funcionament dels sistemes i eines que s'utilitzen per les principals empreses per al desenvolupament dels models de comprensió de les dades disponibles, tot això passant per una descripció de com aplicar aquests conceptes i eines en el desenvolupament professional o de recerca.

Aquesta és una assignatura que parteix de plantejaments acadèmicament sòlids, però que va a realitzar un desenvolupament aplicat a la comprensió tant dels elements teòrics com a l'aplicació pràctica de les eines funcionals per a l'anàlisi dels grans volums de dades.

El professional de l'anàlisi de dades, que ara és conegut com a analista de dades, enginyer de dades o arquitecte de dades, es troba al centre del model de transformació dels arcaics models d'anàlisis de dades, segons l'estadística clàssica.

Per tant, és molt important adquirir una consciència clara de l'impacte que està tenint i tindrà en la societat la implantació cada vegada més accelerada de les tecnologies derivades de l'anàlisi de grans volums de dades. Així com el que aquest desenvolupament comporta en un moment en què el debat al voltant de conceptes com la nova economia o la globalització ocupen un lloc destacat en els mitjans i l'opinió pública. I és que hem de tenir en compte que el professional de la informació no serà tan solament un espectador privilegiat dels canvis que es produeixin, sinó que en moltes ocasions haurà de ser un dels seus actors principals.

Amunt

La informació és una de les matèries primeres del pla d'estudis d'Informació i Documentació. Aquesta assignatura pretén apropar als estudiants a l'emergent món del big data i les seves immenses potencialitats en tots els àmbits de la societat actual.

Amunt

Aquesta assignatura pretén preparar a professionals de la informació que s'hauran d'enfrontar als reptes que suposa l'ús de grans volums de dades en les organitzacions.

Big Data, o l'anàlisi de grans volums de dades, constitueix un dels camps d'estudi i d'aplicació més rellevants en l'anàlisi teòrica i pràctic de la informació. Constitueix en aquests moments un imprescindible camp de coneixement per als professionals que desenvolupen les seves activitats laborals en qualsevol àmbit d'activitat: des de l'ensenyament, recerca educativa, política, empreses de qualsevol àmbit i activitat, elaboració i distribució de la informació, etc.


Des de l'àmbit de la gestió de la informació, el coneixement dels models i les aplicacions pràctiques dels sistemes d'anàlisis de grans volums de dades són imprescindible per poder aprofitar al màxim les possibilitats -en enorme expansió- de les noves tecnologies aplicades a l'anàlisi de la informació, a més de permetre establir-se com un interlocutor vàlid amb els experts en aquestes tecnologies, davant qualsevol necessitat d'informació en una organització.

Pot dir-se amb propietat que en qualsevol camp professional que es projecti la carrera d'un professional de la informació, els continguts d'aquesta assignatura estaran presents. Per això el criteri que s'espera que desenvolupi l'estudiant amb aquesta assignatura pot influir en la visió i enfocament amb que s'enfronti als reptes que li ofereixi l'entorn professional al que es dediqui.

Amunt

Aquesta assignatura requereix coneixements bàsics d'estadística, així com coneixements de programació i bases de dades.
 
Resulta convenient que l'estudiant tingui certs coneixements previs sobre tecnologies programari i/o gestió de la informació.
Recomanable coneixements d'anglès a nivell de lectura i comprensió.

Amunt

Es recomana haver cursat prèviament les assignatures Enginyeria del programari, Bases de dades, Estadística i metodologies de recerca quantitatives. 

Amunt

OBJECTIUS GENERALS

  • Conèixer els fonaments teòrics i pràctics de Big data.
  • Entendre el funcionament dels sistemes de grans volums de dades i les seves aplicacions.
  • Conèixer les principals tècniques per analitzar grans volums de dades.

L'objectiu és realitzar un complet estudi de les tecnologies Big Data, caracteritzades pel tractament de grans volums de dades que no poden ser adquirits, gestionats o processaments mitjançant tècniques tradicionals.

S'estudiaran detalladament tecnologies com Cloud Computing, Emmagatzematge massiu, Arquitectures d'anàlisis Big Data, Tecnologies open source (Hadoop), i s'analitzaran les fases de la cadena de valor de Big Data.

També s'estudiaran transversalment els camps habituals d'aplicació i es revisaran aplicacions representatives i, finalment, s'abordaran aspectes de seguretat i privadesa.

COMPETÈNCIES 


En finalitzar l'assignatura l'estudiant haurà d'haver adquirit les següents competències generals:

  • Identificar i analitzar les situacions reals en les quals es pot aplicar la tecnologia Big Data.
  • Capacitat per interpretar els models d'anàlisis de dades i aplicar-los en les situacions practiques reals.
  • Aprenentatge autònom i capacitat de síntesi i d'anàlisi.
  • Desenvolupar capacitat d'anàlisi crítica sobre els sistemes i eines de Big Data.
  • Obtenir una visió global de la situació d'implantació i possibilitats futures de la tecnologia Big Data.
  • Domini dels conceptes clau i del llenguatge propi de les tècniques i eines de Biga Data i relacionades.

Amunt

Introducció Big data
1. Big data: Què és i d'on procedeix?
2. Per què estudiar els grans volums de dades?
3. Big data: Quin és el seu origen?
4. Característiques de Big data de dades i aspectes de escalabilitat
5. Data Science: el valor dels grans volums de dades
6. El procés d'anàlisi de dades
7. Conceptes bàsics sobre computació escalable
8. Introducció a Hadoop

La plataforma Hadoop i la seva Framework d'aplicacions
1. Fonaments
2. Aplicacions
3. Hadoop Distributed File System (HDFS)
4. Funcions Map / Redueix
5. Apache Spark

Introducció a l'anàlisi de dades
1. HBASE: La base de dades de Hadoop
2. HIVE: El magatzem de dades basat en Hadoop
3. PIG: Un motor de flux de dades per Hadoop
4. SPARK: Mètode per realitzar anàlisis

Machine Learning
1. Fonaments de l'Aprenentatge Automàtic (Machine Learning)
2. Eines i Tècniques de classificació
3. Aprenent a utilitzar les regles d'associació
4. Anàlisi mitjançant agrupació (Clúster Analisys)

Amunt

Big Data PDF
Big Data Web

Amunt

El material de l'assignatura és la referència bàsica en el seguiment de l'assignatura, i té com a objectiu facilitar i estimular el procés d'aprenentatge.

El material didàctic de l'assignatura conté la informació bàsica que els estudiants necessiten, i que és la base per avaluar el seu estudi sent la columna vertebral d'aquesta assignatura. El professor consultor pot complementar aquesta informació a través de la realització de lectures complementàries necessàries per poder realitzar les Proves d'Avaluació Contínua (PAC's). Per això els mòduls i les PAC's constitueixen un altre element important on l'estudiant trobarà bibliografia complementària.

Amunt

La Normativa acadèmica de la UOC disposa que el procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis fets.

La manca d'originalitat en l'autoria o el mal ús de les condicions en què es fa l'avaluació de l'assignatura és una infracció que pot tenir conseqüències acadèmiques greus.

L'estudiant serà qualificat amb un suspens (D/0) si es detecta manca d'originalitat en l'autoria d'alguna activitat avaluable (pràctica, prova d'avaluació contínua (PAC) o final (PAF), o la que es defineixi al pla docent), sigui perquè ha utilitzat material o dispositius no autoritzats, sigui perquè ha copiat textualment d'internet, o ha copiat d'apunts, de materials, de manuals o d'articles (sense la citació corresponent), d'altres estudiants, o per qualsevol altra conducta irregular.

La qualificació de suspens (D/0) en les qualificacions finals d'avaluació contínua pot comportar l'obligació de fer l'examen presencial per a superar l'assignatura (si hi ha examen i si superar-lo és suficient per a superar l'assignatura segons indiqui el pla docent).

Quan aquesta mala conducta es produeixi durant la realització de les proves d'avaluació finals presencials, l'estudiant pot ser expulsat de l'aula, i l'examinador farà constar tots els elements i la informació relatius al cas.

D'altra banda, aquesta conducta pot donar lloc a la incoació d'un procediment disciplinari i l'aplicació, si escau, de la sanció que correspongui.

La UOC habilitarà els mecanismes que consideri oportuns per a vetllar per la qualitat de les seves titulacions i garantir l'excel·lència i la qualitat del seu model educatiu.

Amunt

Aquesta assignatura es pot superar per una doble via: d'una banda, a partir de l'avaluació contínua (AC) i una prova de síntesi (PS) i, d'altra banda, amb la realització d'un examen final (EX).
- Per a fer la PS cal haver superat l'AC.
- Per a fer l'EX no cal haver superat l'AC.
- En cas d'haver superat l'AC hi ha l'opció d'optar per l'EX en comptes de la PS.
La fórmula d'acreditació de l'assignatura és la següent: AC+PS o EX.

 

Amunt