Big data Codi:  09.639    Crèdits:  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels materials de què disposa l'assignatura   Materials i eines de suport   Bibliografia i fonts d'informació   Metodologia   Informació sobre l'avaluació a la UOC   Consulta del model d'avaluació   Avaluació continuada   Avaluació final   Feedback  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

L'assignatura Big data, de 6 crèdits ECTS, forma part del bloc de matèries de formació obligatòria del grau d'Informació i Documentació. Aquesta assignatura proporciona a l'estudiant els fonaments teòrics i pràctics per entendre el funcionament dels sistemes de grans volums de dades i les seves aplicacions.

El curs presenta un recorregut des dels conceptes bàsic essencials per comprendre la importància dels mètodes d'anàlisis denominades Big Data fins a comprendre el funcionament dels sistemes i eines que s'utilitzen per les principals empreses per al desenvolupament dels models de comprensió de les dades disponibles, tot això passant per una descripció de com aplicar aquests conceptes i eines en el desenvolupament professional o de recerca.

Aquesta és una assignatura que parteix de plantejaments acadèmicament sòlids, però que va a realitzar un desenvolupament aplicat a la comprensió tant dels elements teòrics com a l'aplicació pràctica de les eines funcionals per a l'anàlisi dels grans volums de dades.

El professional de l'anàlisi de dades, que ara és conegut com a analista de dades, enginyer de dades o arquitecte de dades, es troba al centre del model de transformació dels arcaics models d'anàlisis de dades, segons l'estadística clàssica.

Per tant, és molt important adquirir una consciència clara de l'impacte que està tenint i tindrà en la societat la implantació cada vegada més accelerada de les tecnologies derivades de l'anàlisi de grans volums de dades. Així com el que aquest desenvolupament comporta en un moment en què el debat al voltant de conceptes com la nova economia o la globalització ocupen un lloc destacat en els mitjans i l'opinió pública. I és que hem de tenir en compte que el professional de la informació no serà tan solament un espectador privilegiat dels canvis que es produeixin, sinó que en moltes ocasions haurà de ser un dels seus actors principals.

Amunt

La informació és una de les matèries primeres del pla d'estudis d'Informació i Documentació. Aquesta assignatura pretén apropar als estudiants a l'emergent món del big data i les seves immenses potencialitats en tots els àmbits de la societat actual.

Amunt

Aquesta assignatura pretén preparar a professionals de la informació que s'hauran d'enfrontar als reptes que suposa l'ús de grans volums de dades en les organitzacions.

Big Data, o l'anàlisi de grans volums de dades, constitueix un dels camps d'estudi i d'aplicació més rellevants en l'anàlisi teòrica i pràctic de la informació. Constitueix en aquests moments un imprescindible camp de coneixement per als professionals que desenvolupen les seves activitats laborals en qualsevol àmbit d'activitat: des de l'ensenyament, recerca educativa, política, empreses de qualsevol àmbit i activitat, elaboració i distribució de la informació, etc.


Des de l'àmbit de la gestió de la informació, el coneixement dels models i les aplicacions pràctiques dels sistemes d'anàlisis de grans volums de dades són imprescindible per poder aprofitar al màxim les possibilitats -en enorme expansió- de les noves tecnologies aplicades a l'anàlisi de la informació, a més de permetre establir-se com un interlocutor vàlid amb els experts en aquestes tecnologies, davant qualsevol necessitat d'informació en una organització.

Pot dir-se amb propietat que en qualsevol camp professional que es projecti la carrera d'un professional de la informació, els continguts d'aquesta assignatura estaran presents. Per això el criteri que s'espera que desenvolupi l'estudiant amb aquesta assignatura pot influir en la visió i enfocament amb que s'enfronti als reptes que li ofereixi l'entorn professional al que es dediqui.

Amunt

Aquesta assignatura requereix coneixements bàsics d'estadística, així com coneixements de programació i bases de dades.
 
Resulta convenient que l'estudiant tingui certs coneixements previs sobre tecnologies programari i/o gestió de la informació.
Recomanable coneixements d'anglès a nivell de lectura i comprensió.

Amunt

Es recomana haver cursat prèviament les assignatures Enginyeria del programari, Bases de dades, Estadística i metodologies de recerca quantitatives. 

Amunt

OBJECTIUS GENERALS

  • Conèixer els fonaments teòrics i pràctics de Big data.
  • Entendre el funcionament dels sistemes de grans volums de dades i les seves aplicacions.
  • Conèixer les principals tècniques per analitzar grans volums de dades.

L'objectiu és realitzar un complet estudi de les tecnologies Big Data, caracteritzades pel tractament de grans volums de dades que no poden ser adquirits, gestionats o processaments mitjançant tècniques tradicionals.

S'estudiaran detalladament tecnologies com Cloud Computing, Emmagatzematge massiu, Arquitectures d'anàlisis Big Data, Tecnologies open source (Hadoop), i s'analitzaran les fases de la cadena de valor de Big Data.

També s'estudiaran transversalment els camps habituals d'aplicació i es revisaran aplicacions representatives i, finalment, s'abordaran aspectes de seguretat i privadesa.

COMPETÈNCIES 


En finalitzar l'assignatura l'estudiant haurà d'haver adquirit les següents competències generals:

  • Identificar i analitzar les situacions reals en les quals es pot aplicar la tecnologia Big Data.
  • Capacitat per interpretar els models d'anàlisis de dades i aplicar-los en les situacions practiques reals.
  • Aprenentatge autònom i capacitat de síntesi i d'anàlisi.
  • Desenvolupar capacitat d'anàlisi crítica sobre els sistemes i eines de Big Data.
  • Obtenir una visió global de la situació d'implantació i possibilitats futures de la tecnologia Big Data.
  • Domini dels conceptes clau i del llenguatge propi de les tècniques i eines de Biga Data i relacionades.

Amunt

Introducció Big data
1. Big data: Què és i d'on procedeix?
2. Per què estudiar els grans volums de dades?
3. Big data: Quin és el seu origen?
4. Característiques de Big data de dades i aspectes de escalabilitat
5. Data Science: el valor dels grans volums de dades
6. El procés d'anàlisi de dades
7. Conceptes bàsics sobre computació escalable
8. Introducció a Hadoop

La plataforma Hadoop i la seva Framework d'aplicacions
1. Fonaments
2. Aplicacions
3. Hadoop Distributed File System (HDFS)
4. Funcions Map / Redueix
5. Apache Spark

Introducció a l'anàlisi de dades
1. HBASE: La base de dades de Hadoop
2. HIVE: El magatzem de dades basat en Hadoop
3. PIG: Un motor de flux de dades per Hadoop
4. SPARK: Mètode per realitzar anàlisis

Machine Learning
1. Fonaments de l'Aprenentatge Automàtic (Machine Learning)
2. Eines i Tècniques de classificació
3. Aprenent a utilitzar les regles d'associació
4. Anàlisi mitjançant agrupació (Clúster Analisys)

Amunt

Material Suport

Amunt

El material de l'assignatura és la referència bàsica en el seguiment de l'assignatura, i té com a objectiu facilitar i estimular el procés d'aprenentatge.

El material didàctic de l'assignatura conté la informació bàsica que els estudiants necessiten, i que és la base per avaluar el seu estudi sent la columna vertebral d'aquesta assignatura. El professor consultor pot complementar aquesta informació a través de la realització de lectures complementàries necessàries per poder realitzar les Proves d'Avaluació Contínua (PAC's). Per això els mòduls i les PAC's constitueixen un altre element important on l'estudiant trobarà bibliografia complementària.

Amunt

La bibliografia necessària per dur a terme les diferents PAC serà facilitada a través dels mòduls.

Qualsevol altra bibliografia addicional necessària serà facilitada directament pel professor/consultor directament a l'aula.

Amunt

Els mòduls són l'element central sobre el qual es construeix la metodologia d'estudi. En ells es presenta i defineix el tema de cada mòdul i es proposa un determinat itinerari de lectura per abordar l'estudi. L'itinerari proposat està pensat per permetre un millor seguiment i comprensió de conceptes, dades i idees que es presenten i per facilitar avançar de forma lògica en l'assoliment dels objectius de l'assignatura.


A través dels espais de comunicació de l'aula, el professor anirà conduint el procés d'aprenentatge, assenyalant els temps i aclarint els dubtes que puguin sorgir. D'acord amb el calendari fixat en el pla docent proposarà les activitats a realitzar per a l'avaluació contínua i, en funció dels mòduls, proposarà també idees per a la reflexió i discussió col·lectiva, sempre de participació voluntària.

L'assignatura està plantejada amb una voluntat clarament interdisciplinària i busca beneficiar-se de les aportacions que des de diferents perspectives puguin fer els estudiants.

Amunt

La Normativa acadèmica de la UOC disposa que el procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis fets.

La manca d'originalitat en l'autoria o el mal ús de les condicions en què es fa l'avaluació de l'assignatura és una infracció que pot tenir conseqüències acadèmiques greus.

L'estudiant serà qualificat amb un suspens (D/0) si es detecta manca d'originalitat en l'autoria d'alguna activitat avaluable (pràctica, prova d'avaluació contínua (PAC) o final (PAF), o la que es defineixi al pla docent), sigui perquè ha utilitzat material o dispositius no autoritzats, sigui perquè ha copiat textualment d'internet, o ha copiat d'apunts, de materials, de manuals o d'articles (sense la citació corresponent), d'altres estudiants, o per qualsevol altra conducta irregular.

La qualificació de suspens (D/0) en les qualificacions finals d'avaluació contínua pot comportar l'obligació de fer l'examen presencial per a superar l'assignatura (si hi ha examen i si superar-lo és suficient per a superar l'assignatura segons indiqui el pla docent).

Quan aquesta mala conducta es produeixi durant la realització de les proves d'avaluació finals presencials, l'estudiant pot ser expulsat de l'aula, i l'examinador farà constar tots els elements i la informació relatius al cas.

D'altra banda, aquesta conducta pot donar lloc a la incoació d'un procediment disciplinari i l'aplicació, si escau, de la sanció que correspongui.

La UOC habilitarà els mecanismes que consideri oportuns per a vetllar per la qualitat de les seves titulacions i garantir l'excel·lència i la qualitat del seu model educatiu.

Amunt

Pots superar l'assignatura per mitjà de dues vies:

  1. Amb avaluació contínua (AC) i una prova de síntesi (PS):
    • Si superes l'avaluació contínua i a la prova de síntesi obtens la nota mínima necessària, la nota final serà la ponderació que especifiqui el pla docent.
    • Si superes l'avaluació contínua i a la prova de síntesi no obtens la nota mínima necessària, la qualificació final serà la nota quantitativa que obtinguis a la prova de síntesi.
    • Si superes l'avaluació contínua i no et presentes a la prova de síntesi, la nota final serà un No presentat.
    • Si suspens l'avaluació contínua, la nota final serà un No presentat.
    • Si no et presentes a l'avaluació contínua, la nota final serà un No presentat.

  2. Amb examen (per seguir aquesta via no cal haver superat l'avaluació contínua per fer l'examen):
    • Si no has presentat l'avaluació contínua, la nota final serà la qualificació numèrica obtinguda a l'examen.
    • Si a l'avaluació contínua has obtingut una nota diferent d'un No presentat, la nota final serà el càlcul més favorable entre la nota numèrica de l'examen i la ponderació de la nota de l'avaluació contínua amb la nota de l'examen, segons el que estableixi el pla docent. Per aplicar aquest càlcul, a l'examen cal obtenir una nota mínima de 4 (si és inferior, la nota final de l'assignatura serà la qualificació de l'examen).
    • Si no et presentes a l'examen, la qualificació final serà un No presentat.


Ponderació de les qualificacions

Opció per superar l'assignatura: AC + PS

Nota final d'assignatura: AC + PS

AC = 60%

PS = 40%

Notes mínimes:

· PS = 3,5

Quan la nota obtinguda a la PS sigui inferior als mínims establerts per a cada fórmula, la qualificació final de l'assignatura serà la nota obtinguda a la PS.

Opció amb EX: EX + AC

Nota final d'assignatura: EX + AC

EX = 65%

AC = 35%

Notes mínimes:

· EX = 4

Aquesta fórmula de ponderació només s'aplicarà quan la nota resultant millori la nota obtinguda a l'EX. Quan la nota obtinguda a l'EX sigui inferior a 4 o la qualificació resultant de la fórmula de ponderació no permeti millorar la nota obtinguda a l'EX, la qualificació final de l'assignatura serà la nota obtinguda a l'EX.

En el cas d'assignatures amb pràctiques (Pr) que creuïn amb l'examen (EX), la fórmula de ponderació només s'aplicarà quan la nota resultant millori la nota obtinguda a FE (FE=EX+Pr). Quan la nota obtinguda a l'EX sigui inferior a 4, la qualificació resultant de l'assignatura serà la nota obtinguda a l'EX. Quan la qualificació resultant de la fórmula de ponderació no permeti millorar la nota obtinguda a FE, la qualificació final de l'assignatura serà la nota obtinguda a FE.

Amunt

Aquells estudiants que desitgin optar a la realització de la prova de validació de l'Avaluació Continuada (EC) haurien d'haver lliurat les quatre proves d'avaluació continuada dins dels terminis fixats en el Pla Docent, havent superat almenys tres d'elles (qualificació de C+ o superior). A més no podrà haver obtingut una D en cap de les PAC presentades.

PAC

Hi haurà quatre PECs que fan referència als continguts del curs i que es produiran en moments puntuals del curs.

- PAC1 corresponent al mòdul 1.
- PAC2 corresponent al mòdul 2.
- PAC3 corresponent al mòdul 3.
- PAC4 corresponent al mòdul 4.

Les quatre PAC faran mitjana configurant així la qualificació final per a l'Avaluació Continuada.


Important: els estudiants que al llarg del curs no presentin alguna les quatre activitats d'avaluació continuada obligatòries, en el termini proposat, per poder optar a la Prova de Validació, obtindran com a qualificació final d'Avaluació Continuada un NP (no presentat).

AVÍS: malgrat considerar-se perfectament normal i útil l'estudi en grup i el treball cooperatiu com a estratègia efectiva d'estudi, això no implica que es permeti la presentació de treballs no originals o realitzats de forma no individual. En conseqüència, ho lliura d'una activitat copiada total o parcialment d'un altre treball comportarà la consideració de l'activitat com a suspès (D) para tots els estudiants implicats. Detectada la duplicitat o plagi d'una activitat, total o parcialment, l'estudiant haurà de presentar-se a examen final per aprovar l'assignatura.

En aquest sentit, detectada una incidència d'aquest tipus, el consultor ho posarà en coneixement de l'estudiant/s afectat/s mitjançant un missatge a la seva bústia personal. Igualment, el consultor informarà de l'incident al professor responsable de l'assignatura, al tutor, i al director del grau.

Amunt

Els alumnes que hagin superat l'avaluació continuada, és a dir, que hagin obtingut la qualificació final A, B o C+ faran una prova de validació o de síntesi. La prova de validació consisteix preguntes obertes sobre el contingut de la PAC. Els temes sobre els quals tractaran són aquells considerats bàsics i de coneixement obligatori per superar l'assignatura.
Els estudiants que no hagin seguit l'EC o no ho hagin superat haurien de fer obligatòriament l'examen per obtenir la nota final de l'assignatura. Tots dos tipus de proves d'avaluació final seran presencials.

Prova de síntesi (PS): la PS té per objectiu avaluar l'assoliment dels objectius i l'adquisició de les competències i els continguts de l'assignatura i completar el procés d'avaluació. Per fer la PS, s'ha d'haver superat l'EC d'acord amb els criteris establerts en el pla docent. El temps previst per a la realització de la PS presencial és de 60 minuts (1 hora).

Examen (EX): l'examen és una prova d'avaluació final que té per objectiu avaluar l'assoliment dels objectius i l'adquisició de les competències i els continguts de l'assignatura, d'una manera global i completa, independentment de si l'estudiant ha superat l'EC o no. El temps previst per a la realització de l'EX és de 120 minuts (2 hores).

Amunt

Per ajudar a autorregular el progrés en l'aprenentatge i conèixer el grau de consecució dels objectius i competències de la PAC, una vegada tancat el termini de lliurament de cadascuna de les activitats previstes, el consultor facilitarà la següent informació:

A través del Tauló: el consultor proporcionarà indicacions dirigides al conjunt de la classe sobre la correcta resolució de cada activitat, i una valoració global de cada PAC que inclourà el comentari dels encerts i errors més freqüents i altres aspectes que el consultor consideri pertinents. A més, es proporcionarà una solució tipus o una selecció de les millors respostes (opcional segons l'assignatura).

A través del Registre d'Avaluació Contínua (REC): rebrà comentaris individuals sobre la seva activitat.

En el Registre d'Avaluació Contínua es farà constar la qualificació assignada individualment a les activitats que han estat lliurades.

Amunt