Bases de dades no relacionals Codi:  22.412    Crèdits:  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Bibliografia i fonts d'informació   Metodologia   Informació sobre l'avaluació a la UOC   Consulta del model d'avaluació   Avaluació continuada   Avaluació final   Feedback  
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

Aquesta assignatura constitueix una introducció a les bases de dades NoSQL. En concret, l'assignatura proporciona a l'estudiant una visió dels múltiples conceptes, models i eines que es poden agrupar sota aquesta denominació.

Sota el paraigua NoSQL s'inclou tot un conjunt de bases de dades, basades en diferents models de dades, que constitueixen una alternativa a les bases de dades relacionals, i que són especialment idònies per a certs dominis d'aplicació. Entre aquests dominis destaquen aquells que treballen amb grans volums de dades que es troben dispersos en diferents repositoris, aquells dominis que treballen amb dades poc estructurades i dominis en els quals s'estableixen múltiples i complexes interrelacions entre les dades.

Amunt

Aquesta assignatura forma part del conjunt d'assignatures obligatòries del grau, i es recomana que sigui cursada durant el cinquè semestre d'estudis.

Aquesta assignatura és la tercera assignatura de l'àrea de bases de dades. En la primera hem aprés com utilitzar les bases de dades relacionals per donar suport a l'emmagatzemament i anàlisis de dades. En la segona hem vist com crear factories d'informació corporatives (els anomenats data warehouse en anglès) que permeten emmagatzemar les dades en un format adient pel seu anàlisi. En aquesta assignatura anem més enllà i estudiem noves eines que ens permetran emmagatzemar i analitzar dades massives i dades heterogènies més eficientment.

Amunt

L'objectiu del grau és la formació de professionals tot-terreny amb una formació en l'anàlisi i solució de problemes de negoci, estadística avançada, mineria de dades i disseny i construcció de sistemes d'informació, que poden treballar en diferents departaments de l'empresa o en un centre de competències transversal. Els coneixements i habilitats desenvolupats en aquesta assignatura seran d'especial utilitat en l'emmagatzematge i tractament de dades complexes (per la seva estructura, volum, freqüència, grandària, etc.) i en el disseny i implementació de sistemes que requereixin distribució i/o replicació de dades.

Amunt

Són necessaris coneixements de bases de dades relacionals i de SQL. És recomanable disposar de coneixements de data warehousing i sistemes distribuïts.

A més, es requereix capacitat per llegir i comprendre l'idioma anglès ja que una part important dels materials de referència, així com d'altres recursos, estan en aquest idioma.

Amunt

Alguns dels continguts d'aquesta assignatura han d'estudiar-se a partir de materials i recursos escrits en anglès.

Amunt

  • Adquirir la destresa necessària per a la manipulació de dades, la conversió de formats i l'emmagatzematge de les dades.
  • Ser capaç de dissenyar i implementar una infraestructura per emmagatzemar un conjunt heterogeni de dades, tant en entorns centralitzats com distribuïts en funció del volum i les necessitats de dades.
  • Saber utilitzar el gestor de bases de dades més adequat en cada context, incloent gestors tradicionals (relacionals bàsicament) i no tradicionals (NoSQL bàsicament).
  • Ser capaç de contextualitzar els conceptes fonamentals de bases de dades NoSQL i posar-los en valor.
  • Conèixer els diferents models NoSQL: saber com organitza les dades cadascun d'ells i conèixer els seus principis bàsics de disseny.
  • Saber definir models i fer consultes en algunes bases de dades NoSQL concretes, assenyalant les característiques diferenciadores de cada model.
  • Conèixer les característiques principals i el funcionament d'alguns dels productes NoSQL més rellevants, com a mínim MongoDB, Neo4j i Cassandra.
  • Saber descriure com les bases de dades NoSQL permeten escalar aplicacions Big Data, fent referència al teorema CAP, i entendre el concepte d'escalat horitzontal (sharding).

Amunt

L'assignatura consta de 5 blocs temàtics, que al seu torn inclouen diferents temes. El contingut associat a cada bloc temàtic és el que es detalla a continuació:

Bloc 1: Preliminars

En aquest bloc es realitzarà una introducció a les característiques fonamentals associades a les bases de dades NoSQL, posant l'accent en la seva definició, motivació, característiques i inconvenients, així com la seva contextualització a l'àrea de les bases de dades.

Bloc 2. Models de dades

En aquest bloc es presenten els models de dades més rellevants en les bases de dades NoSQL, així com algunes consideracions de disseny a tenir en compte quan treballem amb ells. Els models de dades que estudiarem són els models d'agregació (que inclouen, al seu torn, els models clau-valor, documental i orientat a columnes) i els models orientats a grafs.

Bloc 3. Distribució de dades

Bona part de les bases de dades NoSQL s'utilitzen en entorns altament distribuïts que gestionen grans volums de dades. Per això és necessari presentar els principals conceptes relacionats amb bases de dades distribuïdes. Entre aquests conceptes, d'una banda, s'inclouen la definició de base de dades distribuïda, així com aspectes relatius al seu disseny. D'altra banda, es tractaran característiques com la consistència i disponibilitat de les dades en entorns altament distribuïts, i com aquestes queden expressades en el teorema CAP. Per a això serà necessari estudiar el model de transaccions ACID en el qual es basen les bases de dades relacionals i el model BASE que segueixen en algunes bases de dades NoSQL.

Bloc 4. Bases de dades NoSQL

En aquest bloc s'examinarà, per a cadascun dels models de dades presentat en el bloc 2, un exemple de base de dades NoSQL, és a dir, un producte comercial concret. Els productes que es presentaran són Riak, MongoDB, Cassandra i Neo4J que constitueixen exemples de bases de dades NoSQL clau-valor, documental i orientada a grafs, respectivament. Així mateix es discutiran aspectes relatius a distribució de dades per els productes estudiats.

Bloc 5. Ús de bases de dades NoSQL

En l'últim bloc està dedicat a la consulta i actualització de dades emmagatzemades en BD NoSQL. En concret treballarem amb Neo4J (una BD orientada a grafs) i MongoDB (una BD de documents). Comptarem amb el suport de diferents casos pràctics amb MongoDB, Neo4j i Redis.

Amunt

Material Suport
Magatzems de columnes: contextualització PDF
Bases de dades NoSQL - Introducció Audiovisual
Bases de dades NoSQL - Representació de dades en models orientats al graf Audiovisual
Bases de dades NoSQL - Característiques Audiovisual
Bases de dades NoSQL - Representació de dades en models d'agregació Audiovisual
Bases de dades NoSQL - Models de dades Audiovisual
Espai de recursos de ciència de dades Web
1.2. Persistència políglota (Vídeo) Audiovisual
MongoDB. Aggregation Framework. Exercicis PDF
2.9. Disseny de grafs (Screening) Audiovisual
2.8. Disseny d'agregats (Screening) Audiovisual
MongoDB. Consulta i modificació de dades. Exercicis PDF
MV Bases de dades NoSQL Programari en línia
Disseny d'una base de dades en graf per analitzar l’activitat d’usuaris a Twitter PDF
Neo4j. Disseny i creació de grafs. Respostes exercicis PDF
Neo4j. Disseny i creació de grafs. Exercicis PDF
Neo4j. Transformació d'una base de dades relacional a un model en graf PDF
MongoDB. Aggregation Framework. Respostes exercicis PDF
MongoDB. Gestió de dades espacials. Exercicis PDF
Neo4j. Cypher. Respostes exercicis PDF
MongoDB. Gestió de dades espacials. Respostes exercicis PDF
Neo4j. Cypher. Exercicis PDF
MongoDB. Ús d'índexs. Respostes exercicis PDF
MongoDB. Ús d'índexs. Exercicis PDF
MongoDB. Consulta i modificació de dades. Respostes exercicis PDF
Bases de dades NoSQL. Ús de màquina virtual PDF

Amunt

L'assignatura inclou els tipus de material següents:

  • Vídeos i anotacions
  • Llibres de text
  • Materials didàctics UOC, de dos tipus:
    • Material didàctic propi de l'assignatura
    • Materials didàctics de suport
  • Una màquina virtual i indicacions instal·lació de programari

El material principal de l'assignatura són un conjunt de vídeos. Aquests vídeos s'associen als temes de l'assignatura que, al seu torn, s'enquadren en els cinc blocs temàtics descrits a l'apartat "Continguts" d'aquest pla docent. Per a cada vídeo, es lliura (en format pdf) la seva transcripció detallada. Aquestes transcripcions constitueixen les anotacions de l'assignatura. A part dels vídeos, certs temes tenen associada la lectura de certs capítols d'un llibre de text o materials didàctics UOC en format pdf. Els recursos necessaris per abordar cada bloc temàtic es definiran en detall en l'espai de l'aula del bloc temàtica.

Per a l'aprenentatge del bloc 5 (Ús de bases de dades NoSQL), tindreu accés a una màquina virtual que conté els entorns de MongoDB, Neo4j i Cassandra instal·lats i les bases de dades dels casos pràctics de Neo4j i MongoDB pre-instal·lades.

Per acabar, és possible que sigui necessari la lectura d'articles de revista (que seran subministrats des de l'aula) per ampliar o complementar els continguts de l'assignatura.

Amunt

Els següents llibres (accessibles en format electrònic a través de la biblioteca virtual) constitueixen la bibliografia complementaria:

  • J. Celko (2013). Joe Celko's complete guide to NoSQL : what every SQL professional needs to know about non-relational databases. Elsevier Science.
  • G. Harrison (2015). Next Generation Databases: NoSQL, NewSQL and Big Data: what every professional needs to know about the future of databases in a world of NoSQL and Big Data. Apress.
  • L. Liu & M.T. Özsu (Eds.) (2009). Encyclopedia of Database Systems. Springer.
  • M.T. Özsu & P. Valduriez (2011). Principles of Distributed Systems. 3rd edition. Springer.

A més a més, els materials didàctics UOC que donen suport a l'asssignatura són els següents:

  • Abelló (2012). Transaction Models and Concurrency Control. Material docente UOC, asignatura Arquitectura de bases de datos.
  • J. Casas (2013). Diseño conceptual de bases de datos. Material docente UOC, asignatura Diseño de bases de datos.
  • M. E. Rodríguez (2011). Gestión de transacciones. Material docente UOC, asignatura Uso de bases de datos.
  • Romero y M. Oliva (2012). Distributed Databases. Material docente UOC, asignatura Arquitectura de bases de datos.

A part de la bibliografia inclosa en aquest apartat, cada tema pot incloure altres referències bibliogràfiques (articles de revista, vídeos o entrades de blogs). Aquesta bibliografia està inclosa al final de cada vídeo i en els apunts de l'assignatura.

Amunt

Per entendre l'enfocament metodològic general es recomana la lectura de l'apartat "Materials i eines de suport", i el de "Avaluació". A més és necessari que llegiu atentament la informació continguda en cadascun dels mòduls de l'aula i la informació setmanal que us vagi compartint l'equip docent de l'assignatura en el tauló.

Recomanem el següent cicle d'estudi per a cada tema (i en conseqüència per a cada bloc temàtic):

  • Escoltar els vídeos associats a cada tema i en l'ordre indicat. Estudiar acuradament les anotacions associades a cada vídeo. En certs temes, depenent dels vostres coneixements previs, pot ser necessari llegir alguns dels materials UOC de suport. En el cas del bloc 5 (Ús de bases de dades NoSQL) tindreu mòduls didàctics UOC en format pdf.
  • Participar en el seguiment actiu dels espais de comunicació de l'aula. Allí es plantejaran dubtes, es donaran respostes i es tractaran temes i aspectes relacionats amb la matèria d'estudi.
  • Començar a preparar les proves d'avaluació contínua i pràctiques amb antelació. Es requerirà la consulta dels diferents materials de l'assignatura i, en general, no tenen una solució única. Justificar i argumentar la solució o les solucions proposades és de vital importància, igual que respectar les dates de lliurament.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material o dispositius no autoritzats durant l'avaluació, entre d'altres, són conductes irregulars que poden tenir conseqüències acadèmiques i disciplinàries greus.

D'una banda, si es detecta alguna d'aquestes conductes irregulars, pot comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent –incloses les proves finals– o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha practicat qualsevol altra conducta irregular.

De l'altra, i d'acord amb les normatives acadèmiques, les conductes irregulars en l'avaluació, a més de comportar el suspens de l'assignatura, poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.


Ponderació de les qualificacions

Opció per superar l'assignatura: AC

Nota final d'assignatura: AC

Amunt

L'avaluació contínua, en el context de l'assignatura, inclou 2 Proves d'Avaluació Continuada (PAC) i una pràctica. Totes elles de realització individual. És obligatori realitzar totes les activitats per poder aprovar l'assignatura.

A continuació es detallen els blocs temàtics que s'avaluen en cada activitat:

  • PAC1: blocs temàtics 1 i 2
  • PAC2: blocs temàtics 3 i 4
  • PRA 1: tot l'après durant el curs.

El seguiment correcte de l'assignatura us compromet a realitzar les activitats proposades segons les indicacions que s'indiquen al seu enunciat i aquest Pla Docent. En cas que no sigui així, les activitats s'avaluaran amb una qualificació de suspens (D). D'altra banda, i a criteri de la Universitat, l'incompliment d'aquesta obligació serà comunicada a la gestió dels estudis, amb la finalitat d'avaluar si l'estudiant està autoritzat per aprovar qualsevol altra matèria mitjançant una avaluació contínua en el semestre en curs o el següent.

Les activitats s'han de lliurar dins dels terminis establerts en aquest pla docent (vegeu l'apartat de "Dates clau"). En cas de situacions excepcionals que no permetin complir els terminis, per favor posar-vos en contacte amb el vostre consultor abans de la finalització de l'activitat per avaluar alternatives. Si la PAC o la PRA s'entrega després de la Data clau, la seva puntuació final serà d'un 70% de la nota obtinguda.

No s'acceptarà el lliurament de cap PAC/PRA després de la publicació de la solució de la mateixa PAC/PRA.

Amunt

Aquesta assignatura únicament es pot superar a través de la realització i lliurament de les seves proves d'avaluació contínua i la seva pràctica. La nota final d'avaluació contínua (AC) es calcularà a partir de la fòrmula següent:

Nota Final AC = (Nota PAC1 * 0,2) + (Nota PAC2 * 0,2) + (Nota PRA * 0,6)

És important destacar:

  • Aquells estudiants que únicament hagin lliurat 1 activitat tindran com a nota final d'AC no presentat.
  • Les activitats lliurades que no incloguin almenys un 25% dels exercicis proposats resolts seran considerades com no presentades.

Amunt

En el context de l'assignatura, l'equip docent podrà fer tres tipus de retorn sobre les activitats avaluables realitzades pels estudiants:

  • Retorn general: consisteix en la publicació d'una possible solució oficial (amb explicacions, en cas que aquestes siguin necessàries) de les activitats avaluables propostes. Aquest tipus de retorn sempre es realitzarà. La publicació de les solucions oficials es realitzarà després de la data límit de lliurament fixat per als estudiants.
  • Retorn grupal: consisteix en la publicació (via tauló o conjuntament amb la solució oficial de les activitats avaluables) dels errors més freqüentment realitzats pels estudiants. Aquest tipus de retorn només es realitzarà en cas de ser pertinent, i una vegada que l'equip docent hagi finalitzat el procés de correcció.
  • Retorn individualitzat: consisteix en la realització de comentaris individuals sobre els lliuraments realitzats pels estudiants de les activitats avaluables. Es realitzarà sempre en el cas d'aquells estudiants pels quals, en funció de la seva evolució, incorrin en risc de no superar l'assignatura. Es pot realitzar mitjançant la bústia personal o el registre d'avaluació contínua, una vegada l'equip docent hagi finalitzat el procés de correcció. En relació al retorn individualitzat, és important destacar que qualsevol estudiant el pot sol·licitar, tant a nivell d'evolució del semestre com després de cada activitat avaluable. Es recomana fer aquesta petició després de cada activitat avaluable sobre la qual tingueu dubtes o necessitats d'aclariment, i no esperar a les qualificacions finals. En el procés de revisió pot participar l'equip docent al complet (consultor i professor responsable de l'assignatura).

Amunt