Bases de dades no relacionals Codi:  22.412    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informació addicional sobre els recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

Aquesta assignatura constitueix una introducció a les bases de dades NoSQL. En concret, l'assignatura proporciona a l'estudiant una visió dels múltiples conceptes, models i eines que es poden agrupar sota aquesta denominació.

Sota el paraigua NoSQL s'inclou tot un conjunt de bases de dades, basades en diferents models de dades, que constitueixen una alternativa a les bases de dades relacionals, i que són especialment idònies per a certs dominis d'aplicació. Entre aquests dominis destaquen aquells que treballen amb grans volums de dades que es troben dispersos en diferents repositoris, aquells dominis que treballen amb dades poc estructurades i dominis en els quals s'estableixen múltiples i complexes interrelacions entre les dades.

Amunt

Aquesta assignatura forma part del conjunt d'assignatures obligatòries del grau, i es recomana que sigui cursada durant el cinquè semestre d'estudis.

Aquesta assignatura és la tercera assignatura de l'àrea de bases de dades. En la primera hem aprés com utilitzar les bases de dades relacionals per donar suport a l'emmagatzemament i anàlisis de dades. En la segona hem vist com crear factories d'informació corporatives (els anomenats data warehouse en anglès) que permeten emmagatzemar les dades en un format adient pel seu anàlisi. En aquesta assignatura anem més enllà i estudiem noves eines que ens permetran emmagatzemar i analitzar dades massives i dades heterogènies més eficientment.

Amunt

L'objectiu del grau és la formació de professionals tot-terreny amb una formació en l'anàlisi i solució de problemes de negoci, estadística avançada, mineria de dades i disseny i construcció de sistemes d'informació, que poden treballar en diferents departaments de l'empresa o en un centre de competències transversal. Els coneixements i habilitats desenvolupats en aquesta assignatura seran d'especial utilitat en l'emmagatzematge i tractament de dades complexes (per la seva estructura, volum, freqüència, grandària, etc.) i en el disseny i implementació de sistemes que requereixin distribució i/o replicació de dades.

Amunt

Són necessaris coneixements de bases de dades relacionals i de SQL. És recomanable disposar de coneixements de data warehousing i sistemes distribuïts.

A més, es requereix capacitat per llegir i comprendre l'idioma anglès ja que una part important dels materials de referència, així com d'altres recursos, estan en aquest idioma.

Amunt

Alguns dels continguts d'aquesta assignatura han d'estudiar-se a partir de materials i recursos escrits en anglès.

Amunt

  • Adquirir la destresa necessària per a la manipulació de dades, la conversió de formats i l'emmagatzematge de les dades.
  • Ser capaç de dissenyar i implementar una infraestructura per emmagatzemar un conjunt heterogeni de dades, tant en entorns centralitzats com distribuïts en funció del volum i les necessitats de dades.
  • Saber utilitzar el gestor de bases de dades més adequat en cada context, incloent gestors tradicionals (relacionals bàsicament) i no tradicionals (NoSQL bàsicament).
  • Ser capaç de contextualitzar els conceptes fonamentals de bases de dades NoSQL i posar-los en valor.
  • Conèixer els diferents models NoSQL: saber com organitza les dades cadascun d'ells i conèixer els seus principis bàsics de disseny.
  • Saber definir models i fer consultes en algunes bases de dades NoSQL concretes, assenyalant les característiques diferenciadores de cada model.
  • Conèixer les característiques principals i el funcionament d'alguns dels productes NoSQL més rellevants, com a mínim MongoDB, Neo4j i Cassandra.
  • Saber descriure com les bases de dades NoSQL permeten escalar aplicacions Big Data, fent referència al teorema CAP, i entendre el concepte d'escalat horitzontal (sharding).

Amunt

L'assignatura consta de 5 blocs temàtics, que al seu torn inclouen diferents temes. El contingut associat a cada bloc temàtic és el que es detalla a continuació:

Bloc 1: Preliminars

En aquest bloc es realitzarà una introducció a les característiques fonamentals associades a les bases de dades NoSQL, posant l'accent en la seva definició, motivació, característiques i inconvenients, així com la seva contextualització a l'àrea de les bases de dades.

Bloc 2. Models de dades

En aquest bloc es presenten els models de dades més rellevants en les bases de dades NoSQL, així com algunes consideracions de disseny a tenir en compte quan treballem amb ells. Els models de dades que estudiarem són els models d'agregació (que inclouen, al seu torn, els models clau-valor, documental i orientat a columnes) i els models orientats a grafs.

Bloc 3. Distribució de dades

Bona part de les bases de dades NoSQL s'utilitzen en entorns altament distribuïts que gestionen grans volums de dades. Per això és necessari presentar els principals conceptes relacionats amb bases de dades distribuïdes. Entre aquests conceptes, d'una banda, s'inclouen la definició de base de dades distribuïda, així com aspectes relatius al seu disseny. D'altra banda, es tractaran característiques com la consistència i disponibilitat de les dades en entorns altament distribuïts, i com aquestes queden expressades en el teorema CAP. Per a això serà necessari estudiar el model de transaccions ACID en el qual es basen les bases de dades relacionals i el model BASE que segueixen en algunes bases de dades NoSQL.

Bloc 4. Bases de dades NoSQL

En aquest bloc s'examinarà, per a cadascun dels models de dades presentat en el bloc 2, un exemple de base de dades NoSQL, és a dir, un producte comercial concret. Els productes que es presentaran són Riak, MongoDB, Cassandra i Neo4J que constitueixen exemples de bases de dades NoSQL clau-valor, documental i orientada a grafs, respectivament. Així mateix es discutiran aspectes relatius a distribució de dades per els productes estudiats.

Bloc 5. Ús de bases de dades NoSQL

En l'últim bloc està dedicat a la consulta i actualització de dades emmagatzemades en BD NoSQL. En concret treballarem amb Neo4J (una BD orientada a grafs) i MongoDB (una BD de documents). Comptarem amb el suport de diferents casos pràctics amb MongoDB, Neo4j i Redis.

Amunt

Magatzems de columnes: contextualització PDF
Bases de dades NoSQL - Introducció Audiovisual
Bases de dades NoSQL - Representació de dades en models orientats al graf Audiovisual
Bases de dades NoSQL - Característiques Audiovisual
Bases de dades NoSQL - Representació de dades en models d'agregació Audiovisual
Bases de dades NoSQL - Models de dades Audiovisual
Espai de recursos de ciència de dades Web
1.2. Persistència políglota (Vídeo) Audiovisual
MongoDB. Aggregation Framework. Exercicis PDF
2.9. Disseny de grafs (Screening) Audiovisual
2.8. Disseny d'agregats (Screening) Audiovisual
MongoDB. Consulta i modificació de dades. Exercicis PDF
MV Bases de dades NoSQL Programari en línia
Disseny d'una base de dades en graf per analitzar l’activitat d’usuaris a Twitter PDF
Neo4j. Disseny i creació de grafs. Respostes exercicis PDF
Neo4j. Disseny i creació de grafs. Exercicis PDF
Neo4j. Transformació d'una base de dades relacional a un model en graf PDF
MongoDB. Aggregation Framework. Respostes exercicis PDF
MongoDB. Gestió de dades espacials. Exercicis PDF
Neo4j. Cypher. Respostes exercicis PDF
MongoDB. Gestió de dades espacials. Respostes exercicis PDF
Neo4j. Cypher. Exercicis PDF
MongoDB. Ús d'índexs. Respostes exercicis PDF
MongoDB. Ús d'índexs. Exercicis PDF
MongoDB. Consulta i modificació de dades. Respostes exercicis PDF
Bases de dades NoSQL. Ús de màquina virtual PDF

Amunt

L'assignatura inclou els tipus de material següents:

  • Vídeos i anotacions
  • Llibres de text
  • Materials didàctics UOC, de dos tipus:
    • Material didàctic propi de l'assignatura
    • Materials didàctics de suport
  • Una màquina virtual i indicacions instal·lació de programari

El material principal de l'assignatura són un conjunt de vídeos. Aquests vídeos s'associen als temes de l'assignatura que, al seu torn, s'enquadren en els cinc blocs temàtics descrits a l'apartat "Continguts" d'aquest pla docent. Per a cada vídeo, es lliura (en format pdf) la seva transcripció detallada. Aquestes transcripcions constitueixen les anotacions de l'assignatura. A part dels vídeos, certs temes tenen associada la lectura de certs capítols d'un llibre de text o materials didàctics UOC en format pdf. Els recursos necessaris per abordar cada bloc temàtic es definiran en detall en l'espai de l'aula del bloc temàtica.

Per a l'aprenentatge del bloc 5 (Ús de bases de dades NoSQL), tindreu accés a una màquina virtual que conté els entorns de MongoDB, Neo4j i Cassandra instal·lats i les bases de dades dels casos pràctics de Neo4j i MongoDB pre-instal·lades.

Per acabar, és possible que sigui necessari la lectura d'articles de revista (que seran subministrats des de l'aula) per ampliar o complementar els continguts de l'assignatura.

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt