Optimització de bases de dades en entorns analítics Codi:  22.413    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.
A les assignatures prèvies de bases de dades, hem treballat amb diferents eines per emmagatzemar i analitzar dades: les bases de dades relacionals, les bases de dades analítiques, les bases de dades distribuïdes i les bases de dades NoSQL. Aquesta assignatura va més enllà, indicant com utilitzar les bases de dades vistes fins ara de forma eficient en entorns distribuïts i presentant altres sistemes gestors de bases de dades alternatius que podem fer servir per tractar casos d'ús concrets en entorns analítics.

Amunt

Aquesta assignatura forma part de la matèria de Bases de Dades del grau de ciència de dades aplicada, formada per les següents assignatures: Disseny i ús de bases de dades analítiques, Bases de dades per a Data Warehousing, Bases de dades no relacionals i Optimització de bases de dades en entorns analítics.

Amunt

L'objectiu del grau és la formació de professionals tot terreny amb una formació en anàlisi i solució de problemes de negoci, estadística avançada i mineria de dades i disseny i construcció de sistemes d'informació, que poden treballar a diferents departaments de l'empresa o a un centre de competències transversal. Els coneixements i habilitats desenvolupats en aquesta assignatura seran d'especial utilitat en l'emmagatzematge i tractament de dades complexes (per la seva estructura, volum, freqüència, mida, etc.) i en el disseny i la implementació de sistemes que requereixin distribució i/o replicació de dades.

Amunt

Per a realitzar aquesta assignatura cal haver realitzat les anteriors assignatures de bases de dades: Disseny i ús de bases de dades analítiques, Bases de dades per a Data Warehousing i Bases de dades no relacionals

Amunt

Part dels continguts d'aquesta assignatura han de ser estudiats a partir de materials i recursos escrits (o enregistrats) en anglès.

Amunt

  • Ser capaç de dissenyar i implementar una base de dades distribuïda per satisfer les necessitats específiques de cada problema.
  • Conèixer els processos de fragmentació, distribució i localització de dades en un entorn distribuït i quins efectes tenen aquests processos en el rendiment dels sistemes gestors de bases de dades distribuïts.
  • Conèixer els sistemes transaccionals que permeten garantir la consistència en les bases de dades distribuïdes.
  • Ser capaç d'optimitzar consultes en entorns distribuïts de bases de dades.
  • Saber utilitzar el sistema gestor de bases de dades més adequat a cada context.
  • Ser capaç de contextualitzar els conceptes fonamentals de les bases de dades NewSQL, multimodel, de vectors i de magatcems de columnes.
  • Conèixer les característiques principals i el funcionament d'alguns productes d'emmagatzematge de bases de dades no tradicionals i que poden ser d'interès en entorns analítics (ArangoDB, CockroachDB, Vertica i Chroma).

Amunt

Per abordar les competències associades a l'assignatura, els estudiants hauran d'abordar els següents sis reptes:
  1. Com dissenyar una base de dades distribuïda? L'objectiu d'aquest repte és entendre els avantatges dels sistemes distribuïts i conèixer què s'ha de tenir en compte per fer una distribució de dades eficient. Per això, es presentarà informació sobre sistemes de bases de dades distribuïdes, fragmentació, localizació (o allocation) i replicació.
  2. Com mantenir la consistència en una base de dades distribuïda? La distribució i la replicació de dades estableix diferents reptes a l'hora de mantenir la consistència de la base de dades. Tant per la gestió de transaccions, que han de permetre l'execució de transaccions complexes que afecten dades de diferents nodes de forma atòmica, com per la gestió de rèpliques, que ha de garantir que les diferents rèpliques de la base de dades tenen valors consistents.
  3. Com optimitzar consultes en un entorn distribuït? L'objectiu d'aquest bloc és comprendre quins elements intervenen al resoldre consultes en un entorn distribuït i aprendre a optimitzar consultes en bases de dades distribuides.
  4. Com indexar dades de forma distribuïda? L'objectiu és comprendre les característiques i els usos dels sistemes d'indexació distribuïts.
  5. Quins altres models, més enllà dels models relacionals i els NoSQL, poden ser d'interès? L'objectiu és que els estudiants vegin (i treballin) amb tipus de bases de dades diferents de les que han vist fins ara i potencialment útils en entorns analítics. En aquest bloc es treballarà amb tres tipus de bases de dades: les híbrides o multimodel, les NewSQL i les de vectors.
  6. Què són els magatzems de columnes i quina utilitat tenen? Els magatzems de columnes són bases de dades similars a les relacionals, però on les dades es guarden columna a columna en comptes de fila a fila. Aquesta organització possibilita la comprensió de dades, l'optimització de consultes i una consulta de dades agregades molt més eficient. L´objectiu d´aquest bloc és que els estudiants vegin (i treballin) amb aquest tipus de base de dades.

Amunt

Espai de recursos de ciència de dades Web
1. Introducció a CockroachDB PDF
ArangoDB. Tutorial PDF
ArangoDB. Inici i primeres passes PDF
ChromaDB. Entorn de treball PDF
1. Tutorial de CockroachDB PDF

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt