Bases de dades analítiques Codi:  M2.988    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Informació prèvia a la matrícula   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informació addicional sobre els recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al segon semestre del curs 2023-2024. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

El concepte de bases de dades analítiques va sorgir a la dècada dels anys 70 amb el desenvolupament dels sistemes de processament de transaccions en línia que s'utilitzaven per al registre i seguiment de transaccions comercials. A mesura que les organitzacions començaven a acumular grans quantitats de dades, va sorgir la necessitat d'analitzar les dades de manera més profunda amb l'objectiu de convertir-les en informació. Amb el creixement exponencial de dades i la demanda d'anàlisis més sofisticats als anys 80, i amb l'auge d'Internet i el comerç electrònic durant els anys 90, es va desencadenar una major demanda de tecnologies que poguessin gestionar i analitzar grans volums de dades de manera efectiva. En aquest context, van sorgir noves tecnologies de bases de dades analítiques, com els magatzems de dades, oferint un millor rendiment en realitzar consultes analítiques complexes.

En les últimes dècades i amb l'explosió de dades generades per xarxes socials, dispositius mòbils i sensors IoT, les bases de dades analítiques han seguit evolucionant per facilitar la gestió i l'anàlisi de nous tipus de dades. Addicionalment, han sorgit tecnologies per al processament distribuït i el còmput en el núvol, que han permès escalar els sistemes de bases de dades analítiques per gestionar grans volums de dades d'una forma eficaç.

L'objectiu d'aquesta assignatura és aprendre els coneixements i habilitats necessàries per treballar amb dades de manera efectiva en un entorn empresarial o acadèmic, permetent l'anàlisi de dades complexes amb l'objectiu de dur a terme la presa de decisions basada en les dades.

Per això caldrà conèixer els fonaments teòrics de les bases de dades analítiques, incloent les diferents arquitectures i els models de dades, així com els conceptes del procés de disseny de les bases de dades destinades a l'anàlisi. S'adquiriran els coneixements necessaris per comprendre els processos d'integració, com a punt clau per extreure dades de diverses fonts, transformar-les en un format adequat i carregar-les en una base de dades analítica, així com els coneixements per utilitzar les bases de dades per analitzar conjunts de dades, i extreure informació significativa per presentar la informació de manera clara i comprensible.

Amunt

Bases de dades analítiques és una assignatura obligatòria en el Màster Universitari en Ciència de dades que forma part del conjunt d'assignatures que són complements de formació. Per tant, una assignatura d’entrada que proporciona els fonaments per cursar altres matèries relacionades amb les dades.

Amunt

Els coneixements adquirits en aquesta assignatura seran d'utilitat per a perfils tals com arquitectes, enginyers i científics de dades, analistes de dades, o administradors de bases de dades. És a dir, professionals responsables de realitzar anàlisis de dades mitjançant les diferents eines que proporcionen les plataformes analítiques.

Amunt

No és necessari disposar de coneixements previs, però sí que es requereix de cert coneixement de la llengua anglesa per comprendre documentació tècnica dels productes instal·lats i/o informació de referència disponible a la xarxa.

Amunt

La informació que els estudiants han de conèixer abans de matricular-se és:

 

  • És una assignatura pràctica.
  • El seu model d'avaluació és EC i la PR és l'activitat d'avaluació fonamental del curs. És obligatòria i requereix una qualificació mínima per aprovar.
  • Es disposa d'un entorn de pràctiques configurat per a la realització de la pràctica i suport a aquest entorn.
  • Veure coneixements previs a l'apartat anterior.

 

Amunt

L'objectiu d'aquesta assignatura és donar a l'estudiant una visió general en matèria de bases de dades i més concretament, contextualitzar a l'estudiant en el disseny de les bases de dades relacionals i l'ús del llenguatge estructurat de consultes SQL, per posteriorment introduir l'anàlisi de dades mitjançant els models multidimensional i tabulars.

Les principals competències que l'estudiant ha d'adquirir en el context de l'assignatura són les que s'indiquen a continuació:

 

  • Donat un problema de ciència de dades, saber identificar les dades implicades, estar familiaritzat amb el cicle de vida de la dada i amb tots els sistemes implicats.
  • Adquirir els coneixements necessaris per accedir i actualitzar les dades emmagatzemades en les bases de dades mitjançant el llenguatge SQL.
  • Ser capaç de poblar els magatzems de dades a partir de diferents fonts d'informació mitjançant la creació i execució de processos ETL.
  • Conèixer i adquirir destresa en l'ús de diferents tipus d'aplicacions i eines (EIS, OLAP, sistemes in-memory) per a una òptima explotació del magatzem de dades.
  • Ser capaç d'arribar a conclusions importants com a conseqüència de l'anàlisi de resultats obtinguts de l'explotació de dades.

 

Amunt

Els continguts principals de la part teòrica de l'assignatura es recullen en els mòduls didàctics que es detallen a continuació:

 

  • Dades, informació i coneixement. S'aborda de manera exhaustiva el concepte de data, tant en la seva definició general com en la seva rellevància per a l'anàlisi d'informació, per després desglossar les etapes del cicle de vida d'una data, des de la seva generació, anàlisi, arxivat i eventual eliminació. Introdueix el concepte de Magatzem de Dades o Data Warehouse, que s'examinarà amb més detall al llarg del curs, per concloure amb una introducció al procés d'anàlisi de dades, presentant les fases que el componen, així com una breu descripció de les eines analítiques més comunament emprades en aquest camp.
  • Sistemes de bases de dades relacionals. S'ofereix una visió global dels sistemes de bases de dades relacionals: quins són els seus objectius i característiques principals, quines característiques té el model relacional, quines són les diferents etapes del procés de disseny d'una base de dades, així com una introducció al llenguatge estàndard d'accés i tractament de dades.
  • Sistemes de bases de dades analítiques. S'ofereix una visió global dels sistemes de bases de dades analítiques, introduint el concepte de FIC o Fàbrica d'Informació Corporativa, així com dels components que la constitueixen. De tots els seus components es focalitza en el data warehouse i els data marts com a elements base en el magatzem de les dades d'una corporació, i els metadades i processos d'integració i transformació responsables del flux de les dades. Posteriorment s'introdueix el món de l'anàlisi de les dades, detallant els sistemes multidimensionals/OLAP i els sistemes tabulars, com a dues arquitectures destinades a facilitar l'accés als usuaris als dades i dur a terme anàlisis des de diferents perspectives. Per últim, en un nivell més tècnic, s'introdueix l'ús de les consultes avançades a tenir en compte en els anàlisis complexos de dades.
  • Anàlisi de dades. S'introdueix el concepte de presentació i interpretació de dades com a punt de partida per conèixer els diferents mètodes i eines disponibles per dur a terme l'anàlisi de dades. Es detallen les tres grans formes d'analitzar les dades: l'autoconsum mitjançant l'ús del llenguatge SQL, l'ús de models multidimensionals i eines OLAP i, finalment, utilitzant eines de representació visual.

 

El mòdul Sistemes de bases de dades relacionals no és un mòdul com els altres, és una guia d’estudi que indica com estudiar el mòdul a partir d’un conjunt variat de recursos.

Amunt

Exemples de codi SQL Web
Buenas prácticas: Codificación de procedimientos y funciones Audiovisual
Bones pràctiques: codificació SQL PDF
Bones pràctiques: codificació de procediments i funcions PDF
Disseny físic de bases de dades PDF
El llenguatge SQL I PDF
Dades, informació i coneixement PDF
Sistemes de bases de dades relacionals PDF
Sistemes de bases de dades analítiques PDF
Anàlisi de dades PDF
Material del curs de Bases de dades analítiques (Qüestionaris Moodle)
Material de suport de Bases de dades analítiques (Joc d'activitats pràctiques)

Amunt

A l’aula de teoria estan TOTS els recursos de la assignatura, inclòs el programari i eines per a fer les activitats pràctiques del curs.

Pel que fa a teoria, cada mòdul didàctic té associada una guia d’estudi. Això es degut a que els mòduls son bastant complets per a poder ser autocontinguts i alguns dels seus apartats son opcionals per a aprofundir, si es desitja. Les guies ajuden a abordar l’estudi de cada mòdul de forma més dirigida i eficient.

A més, es disposa d’altres recursos addicionals. Entre aquests destaquen un conjunt d’activitats de mostra, que en cap cas s’han d’entendre com un manual o guia pas a pas per a realitzar les activitats de curs. Simplement son un exemple.

Cada activitat avaluable del curs disposa d’un conjunt de recursos associats que se troben en la secció Recursos d’aprenentatge de cada activitat. Aquests recursos poden ser de variada tipologia como mòduls d’altres assignatures, presentacions que resumeixen continguts, exemples de codi, vídeos de suport, etc.

Pel que fa a recursos per a la part pràctica de la assignatura, es proporciona un entorn de pràctiques basat en escriptoris virtuals (entorno VDI), prèviament configurats per a fer les activitats pràctiques del curso, de manera que s’asseguri que  tots i totes les estudiants disposen de les mateixes versions de programari i enes. Aquest entorno virtual és només per a ús docent.

En la part servidor:

  • Sistema operatiu: Windows Server 2016
  • Base de dades: Windows SQL Server 2016 (SGBD + SQL Server Analysis Services + SQL Server Reporting Services) i PostgreSQL versió 16

I en la part client:

  • SQL Server Management Studio 2017
  • Visual Studio 2017
  • SQL Server Data Tools
  • Power BI Desktop
  • Pentaho Data Integration v.9.2

Aquest entorn disposa d’un conjunt de recursos entre els que es destaquen, per la seva importància, els següents:

  • DW_Entorn_Virtual_VDI.pdf: com a guia de configuració i connexió.
  • Importar_base_de_dades_com_crear_Vistes_i_Cubs.pdf: amb indicacions sobre com procedir en la creació de cubs

Aquests materials es poden trobar en l'apartat Recursos d'Aprenentatge de cada activitat que els requereix.

Així mateix, donat el caràcter pràctic de l'assignatura es proporciona un entorn de pràctiques basat en escriptoris virtuals (entorn VDI) prèviament configurat per a la realització de les activitats pràctiques del curs. Aquest entorn virtual és d'ús únicament docent.

I per oferir suport tècnic en aquest entorn i resoldre les incidències que puguin succeir amb l'ús de l'entorn VDI o del programari instal·lat, es disposarà d'un professor/a de l'aula de laboratori, 76.596.- Laboratori de suport a les bases de dades analítiques.

Amunt

A la UOC, l'avaluació generalment és virtual. S'estructura entorn de l'avaluació contínua, que inclou diferents activitats o reptes; l'avaluació final, que es porta a terme mitjançant proves o exàmens, i el treball final de la titulació.

Les activitats o proves d'avaluació poden ser escrites i/o audiovisuals, amb preguntes aleatòries, proves orals síncrones o asíncrones, etc., d'acord amb el que decideixi cada equip docent. Els treballs finals representen el tancament d'un procés formatiu que implica la realització d'un treball original i tutoritzat que té com a objectiu demostrar l'adquisició competencial feta al llarg del programa.

Per verificar la identitat de l'estudiant i l'autoria de les proves d'avaluació, la UOC es reserva la potestat d'aplicar diferents sistemes de reconeixement de la identitat i de detecció del plagi. Amb aquest objectiu, la UOC pot dur a terme enregistrament audiovisual o fer servir mètodes o tècniques de supervisió durant l'execució de qualsevol activitat acadèmica.

Així mateix, la UOC pot exigir a l'estudiant l'ús de dispositius electrònics (micròfons, càmeres o altres eines) o programari específic durant l'avaluació. És responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat de les activitats acadèmiques. Al web sobre integritat acadèmica i plagi de la UOC hi ha més informació respecte d'aquesta qüestió.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; la suplantació d'identitat; l'acceptació o l'obtenció de qualsevol activitat acadèmica a canvi d'una contraprestació o no; la col·laboració, l'encobriment o l'afavoriment de la còpia, o l'ús de material, programari o dispositius no autoritzats en el pla docent o l'enunciat de l'activitat acadèmica, inclosa la intel·ligència artificial i la traducció automàtica, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves (com l'ús d'intel·ligència artificial no permesa, xarxes socials o cercadors d'informació a internet), perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, per la compravenda d'activitats acadèmiques, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb el que estableix la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons el que estableix la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant en l'avaluació contínua com en l'avaluació final, per mitjà d'una entrevista oral síncrona, que pot ser objecte d'enregistrament audiovisual, o pels mitjans que estableixi la Universitat. Aquests mitjans tenen l'objectiu de verificar els coneixements i les competències que garanteixin la identitat de l'estudiant. Si no és possible garantir que l'estudiant és l'autor de la prova, aquesta pot ser qualificada amb una D, en el cas de l'avaluació contínua, o amb un suspens, en el cas de l'avaluació final.

Intel·ligència artificial en el marc de l'avaluació

La UOC reconeix el valor i el potencial de la intel·ligència artificial (IA) en l'àmbit educatiu, alhora que posa de manifest els riscos que comporta si no s'utilitza de manera ètica, crítica i responsable. En aquest sentit, en cada activitat d'avaluació s'informarà l'estudiantat sobre les eines i els recursos d'IA que es poden utilitzar i en quines condicions. Per la seva banda, l'estudiantat es compromet a seguir les indicacions de la UOC a l'hora de dur a terme les activitats d'avaluació i de citar les eines utilitzades i, concretament, a identificar els textos o les imatges generats per sistemes d'IA, els quals no podrà presentar com si fossin propis.

Amb relació a fer servir o no la IA per resoldre una activitat, l'enunciat de les activitats d'avaluació indica les limitacions en l'ús d'aquestes eines. Cal tenir en compte que fer-les servir de manera inadequada, com ara en activitats en què no estan permeses o no citar-les en les activitats en què sí que ho estan, es pot considerar una conducta irregular en l'avaluació. En cas de dubte, es recomana que, abans de lliurar l'activitat, es faci arribar una consulta al professorat col·laborador de l'aula.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt