Arquitectures de bases de dades no tradicionals Codi:  M2.952    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de què disposa l'assignatura   Recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura. Us servirà per planificar la matrícula (consulteu si l'assignatura s'ofereix aquest semestre a l'espai del Campus Més UOC / La Universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. (El pla docent pot estar subjecte a canvis.)

Aquesta assignatura constitueix una introducció a les bases de dades NoSQL. En concret, l'assignatura proporciona a l'estudiant una visió dels múltiples conceptes, models i eines que es poden agrupar sota aquesta denominació.

Sota el paraigua NoSQL s'inclou tot un conjunt de bases de dades, basades en diferents models de dades, que constitueixen una alternativa a les bases de dades relacionals, i que són especialment idònies per a certs dominis d'aplicació. Entre aquests dominis destaquen aquells que treballen amb grans volums de dades que es troben dispersos en diferents repositoris, aquells dominis que treballen amb dades poc estructurades i dominis en els quals s'estableixen múltiples i complexes interrelacions entre les dades.

Amunt

Aquesta assignatura forma part del conjunt d'assignatures obligatòries del màster, i es recomana que sigui cursada durant el segon semestre d'estudis.

Amunt

L'objectiu del màster de Data Science de la UOC és la formació de professionals tot-terreny amb una formació en l'anàlisi i solució de problemes de negoci, estadística avançada, mineria de dades i disseny i construcció de sistemes d'informació, que poden treballar en diferents departaments de l'empresa o en un centre de competències transversal. Els coneixements i habilitats desenvolupats en aquesta assignatura seran d'especial utilitat en l'emmagatzematge i tractament de dades complexes (per la seva estructura, volum, frecuéncia, grandària, etc.) i en el disseny i implementació de sistemes que requereixin distribució i/o replicació de dades.

Amunt

Són necessaris coneixements de bases de dades relacionals i de SQL. És recomanable disposar de coneixements de data warehousing i sistemes distribuïts.

A més, es requereix capacitat per llegir i comprendre l'idioma anglès ja que una part important dels materials de referència, així com d'altres recursos, estan en aquest idioma.

Amunt

Alguns dels continguts d'aquesta assignatura han d'estudiar-se a partir de materials i recursos escrits en anglès.

Amunt

  • Adquirir la destresa necessària per a la manipulació de dades, la conversió de formats i l'emmagatzematge de les dades.
  • Ser capaç de dissenyar i implementar una infraestructura per emmagatzemar un conjunt heterogeni de dades, tant en entorns centralitzats com distribuïts en funció del volum i les necessitats de dades.
  • Saber utilitzar el gestor de bases de dades més adequat en cada context, incloent gestors tradicionals (relacionals bàsicament) i no tradicionals (NoSQL bàsicament).
  • Ser capaç de contextualitzar els conceptes fonamentals de bases de dades NoSQL i posar-los en valor.
  • Conèixer els diferents models NoSQL: saber com organitza les dades cadascun d'ells i conèixer els seus principis bàsics de disseny.
  • Saber definir models i fer consultes en algunes bases de dades NoSQL concretes, assenyalant les característiques diferenciadores de cada model.
  • Conèixer les característiques principals i el funcionament d'alguns dels productes NoSQL més rellevants.
  • Saber descriure com les bases de dades NoSQL permeten escalar aplicacions Big Data, fent referència al teorema CAP, i entendre el concepte d'escalat horitzontal (sharding).

Amunt

L'assignatura consta de 5 blocs temàtics, que al seu torn inclouen diferents temes. El contingut associat a cada bloc temàtic és el que es detalla a continuació:

Bloc 1: Preliminars

En aquest bloc es realitzarà una introducció a les característiques fonamentals associades a les bases de dades NoSQL, posant l'accent en la seva definició, motivació, característiques i inconvenients, així com la seva contextualització a l'àrea de les bases de dades.

Bloc 2. Models de dades

En aquest bloc es presenten els models de dades més rellevants en les bases de dades NoSQL, així com algunes consideracions de disseny a tenir en compte quan treballem amb ells. Els models de dades que estudiarem són els models d'agregació (que inclouen, al seu torn, els models clau-valor, documental i orientat a columnes) i els models orientats a grafs.

Bloc 3. Distribució de dades

Bona part de les bases de dades NoSQL s'utilitzen en entorns altament distribuïts que gestionen grans volums de dades. Per això és necessari presentar els principals conceptes relacionats amb bases de dades distribuïdes. Entre aquests conceptes, d'una banda, s'inclouen la definició de base de dades distribuïda, així com aspectes relatius al seu disseny. D'altra banda, es tractaran característiques com la consistència i disponibilitat de les dades en entorns altament distribuïts, i com aquestes queden expressades en el teorema CAP. Per a això serà necessari estudiar el model de transaccions ACID en el qual es basen les bases de dades relacionals i el model BASE que segueixen en algunes bases de dades NoSQL.

Bloc 4. Bases de dades NoSQL

En aquest bloc s'examinarà, per a cadascun dels models de dades presentat en el bloc 2, un exemple de base de dades NoSQL, és a dir, un producte comercial concret. Els productes que es presentaran són Riak, MongoDB, Cassandra i Neo4J que constitueixen exemples de bases de dades NoSQL clau-valor, documental i orientada a grafs, respectivament. Així mateix es discutiran aspectes relatius a distribució de dades per els productes estudiats.

Bloc 5. Ús de bases de dades NoSQL

En l'últim bloc està dedicat a la consulta i actualització de dades emmagatzemades en BD NoSQL. En concret treballarem amb Neo4J (una BD orientada a grafs) i MongoDB (una BD de documents). Comptarem amb el suport de dos casos pràctics.

Amunt

BD Twiter Web
Distributed Databases PDF
Transaction Models and Concurrency Control PDF
Espai de recursos de ciència de dades Web
Máquina virtual Linux Mint Programari en línia
Máquina virtual Linux Mint (Manual) PDF
Bases de dades NoSQL (MV) Programari en línia

Amunt

L'assignatura inclou els tipus de material següents:

  • Vídeos i anotacions
  • Llibres de text (més informació a l'apartat de "Bibliografia i fonts d'informació")
  • Materials didàctics UOC, de dos tipus:
    • Material didàctic propi de l'assignatura
    • Materials didàctics de suport
  • Màquines virtuals i indicacions instal·lació de programari

El material principal de l'assignatura són un conjunt de vídeos. Aquests vídeos s'associen als temes de l'assignatura que, al seu torn, s'enquadren en els cinc blocs temàtics descrits a l'apartat "Continguts" d'aquest pla docent. Per a cada vídeo, es lliura (en format pdf) la seva transcripció detallada. Aquestes transcripcions constitueixen les anotacions de l'assignatura.

A part dels vídeos, certs temes tenen associada la lectura de certs capítols d'un llibre de text. Aquest llibre de text (ressenyat en l'apartat "Bibliografia i fonts d'informació" d'aquest pla docent) estarà disponible en línia a l'aula (a l'apartat "Fuentes d'informació").

Finalment, també us proporcionem diversos materials didàctics UOC en format pdf. En primer lloc, aquest és el cas del material associat a l'últim bloc temàtic de l'assignatura (Bloc 5. Ús de bases de dades NoSQL) on es presenten dos casos pràctics, un sobre el disseny d'una BD NoSQL en graf i un altre sobre el disseny d'una BD NoSQL de documents. Aquests casos pràctics s'orienten, respectivament, a facilitar l'aprenentatge de Neo4J i MongoDB.

En segon lloc, la resta de materials didàctics UOC que se subministren (de nou aquests materials es descriuen en l'apartat "Bibliografia i fonts d'informació" d'aquest pla docent), són materials de suport que, o bé cobreixen coneixements que es pressuposen en el context de l'assignatura, o bé amplien certs temes tractats en l'assignatura (en concret, en els vídeos i anotacions de l'assignatura i el llibre de text). La lectura d'aquests materials en més o menys profunditat dependrà dels vostres coneixements previs o del vostre interès a aprofundir en la matèria d'estudi.

En tercer lloc, per a l'aprenentatge del bloc 5 (Ús de bases de dades NoSQL), tindreu accés a una màquina virtual per MongoDB i rebreu les instruccions precises per treballar amb Neo4J.

Per acabar, és possible que sigui necessari la lectura d'articles de revista (que seran subministrats des de l'aula) per ampliar o complementar els continguts de l'assignatura.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material o dispositius no autoritzats durant l'avaluació, entre d'altres, són conductes irregulars que poden tenir conseqüències acadèmiques i disciplinàries greus.

D'una banda, si es detecta alguna d'aquestes conductes irregulars, pot comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent –incloses les proves finals– o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha practicat qualsevol altra conducta irregular.

De l'altra, i d'acord amb les normatives acadèmiques, les conductes irregulars en l'avaluació, a més de comportar el suspens de l'assignatura, poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui.

Amunt

Aquesta assignatura només es pot superar a partir de l'avaluació contínua (AC). La nota final d'avaluació contínua esdevé la nota final de l'assignatura. La fórmula d'acreditació de l'assignatura és la següent: AC.

 

Amunt