Privadesa i seguretat de les dades Codi:  22.416    :  6
Consulta de les dades generals   Descripció   L'assignatura en el conjunt del pla d'estudis   Camps professionals en què es projecta   Coneixements previs   Objectius i competències   Continguts   Consulta dels recursos d'aprenentatge de la UOC per a l'assignatura   Informació addicional sobre els recursos d'aprenentatge i eines de suport   Informacions sobre l'avaluació a la UOC   Consulta del model d'avaluació  
Aquest és el pla docent de l'assignatura per al primer semestre del curs 2024-2025. Podeu consultar si l'assignatura s'ofereix aquest semestre a l'espai del campus Més UOC / La universitat / Plans d'estudis). Un cop comenci la docència, heu de consultar-lo a l'aula. El pla docent pot estar subjecte a canvis.

L'assignatura Privadesa i seguretat de les dades pretén oferir a l'alumnat una introducció als conceptes i tècniques que es fan servir per preservar i avaluar la privadesa i la seguretat de la informació.

En primer lloc, l'assignatura descriu el concepte de privadesa de la informació, així com altres conceptes relacionats, i presenta els principis bàsics que cal tenir en compte a l'hora de dissenyar sistemes tenint en compte requeriments de privadesa. Després, d'una banda, l'assignatura presenta els principals problemes de privadesa als què ens enfrontem en la societat actual i, d'altra banda, es descriuen les tècniques que ens permeten publicar conjunts de dades personals tot garantint cert grau de privadesa. 

En segon lloc, l'assignatura presenta els principals problemes de seguretat de la informació, i les eines que ens ofereix la criptografia moderna per a protegir-la. Així, es presenten els tres pilars de la criptografia moderna: les xifres de clau simètrica, la criptografia de clau pública i les funcions hash, tot exposant-ne les seves propietats, les primitives que es fan servir actualment, i les seves aplicacions.

Tant la privadesa com la seguretat de la informació tenen cada vegada més importància en el món en què vivim a causa del creixent valor que té la informació. D'una banda, les tècniques criptogràfiques són necessàries per tal de protegir la seguretat i la privadesa de les persones quan fan ús de la tecnologia i de les xarxes de comunicacions. En especial és important protegir les persones d'activitats de vigilància massiva que poden dur a terme de forma il·legal no només empreses privades sinó també alguns organismes governamentals que actuen fora dels circuïts legals. D'altra banda, més enllà de la pròpia protecció de les persones usuàries, les empreses i qualsevol entitat que es relacioni o utilitzi la tecnologia necessita mecanismes que protegeixin els seus actius digitals que, en ocasions, poden ser tots els actius d'una companyia. Finalment, el desenvolupament de la criptografia també permet el naixement de nous paradigmes de relació entre les persones com ara la creació de noves monedes virtuals, les criptomonedes, que no depenen de cap entitat centralitzada per poder funcionar.

Per últim, l'assignatura va un pas més enllà, i presenta la problemàtica de la privadesa i la seguretat en el context de la mineria de dades, dos camps emergents que estan guanyant popularitat amb l'increment de l'ús d'algorismes d'aprenentatge automàtic en diversos àmbits de la societat. 

El curs vol donar un enfocament pràctic a la seguretat i la privadesa de les dades, i és per aquest motiu que l'assignatura s'estructura conjuntament en base a continguts tant teòrics com pràctics que són complementats amb activitats de programació que permeten conèixer els problemes reals que sorgeixen en la implementació de sistemes de preservació de la privadesa i sistemes que facin ús de la criptografia.

Amunt

L'assignatura és obligatòria i és una de les tres assignatures de la matèria de Tractament de dades del Grau en ciència de dades aplicada. 

L'assignatura proporciona els coneixements bàsics de privadesa i seguretat de les dades, que podran ser complementats amb l'assignatura optativa de Seguretat de sistemes per tal de conèixer altres vessants de la seguretat més enllà de les pròpies dades.

Amunt

Aquesta assignatura permet a l'estudiantat adquirir les competències bàsiques en seguretat i privadesa de les dades, que inclouen la recollida de requisits de seguretat i privadesa d'un sistema que tracti amb dades, l'avaluació de la privadesa d'un sistema existent o d'un conjunt de dades, l'anonimització d'un conjunt de dades per a la seva publicació i la selecció de les primitives criptogràfiques idònies per garantir els requisits de seguretat desitjats.

Amunt

L'assignatura introdueix l'estudiantat del grau en la temàtica de la privadesa i la seguretat de les dades. 

L'assignatura requereix haver cursat prèviament l'assignatura Captura i preparació de dades, que alhora requereix haver cursat Tipologia i fonts de dades.

Addicionalment, per al correcte seguiment de l'assignatura calen coneixements bàsics de programació i matemàtiques, equivalents als que s'ofereixen en els primers cursos del grau.

Amunt

A continuació es detallen les competències específiques de l'assignatura:
[CE4] Dissenyar un marc experimental tenint en compte els mètodes més adequats per a la captura, el processament, l'emmagatzematge, l'anàlisi i la visualització de dades.
[CE5] Utilitzar de forma combinada els fonaments matemàtics, estadístics i de programació per desenvolupar solucions a problemes en l'àmbit de la ciència de les dades.
[CE9] Aplicar tècniques específiques de captura, tractament i anàlisi de dades estructurades, semi-estructurades i no estructurades.
[CE13] Exercir l'activitat professional d'acord al codi ètic i els aspectes legals en el marc de la privacitat i seguretat de les dades.
A més, l'assignatura també treballa les següents competències bàsiques, generals i transversals del grau:
[CT1] Ús i aplicació de les TIC en l'àmbit acadèmic i professional.
[CT2] Comunicar-se en una llengua estrangera.
[CT3] Expressar-se de forma escrita de forma adequada al context acadèmic i professional.
[CB1] Que els estudiants hagin demostrat posseir i comprendre coneixements en una àrea d'estudi que parteix de la base de l'educació secundària general, i se sol trobar a un nivell que, si bé es recolza en llibres de text avançats, inclou també alguns aspectes que impliquen coneixements procedents de l'avantguarda del seu camp d'estudi.
[CB2] Que l'estudiantat sàpiga aplicar els seus coneixements al seu treball o vocació d'una forma professional i posseeixin les competències que solen demostrar-se per mitjà de l'elaboració i defensa d'arguments i la resolució de problemes dins la seva àrea d'estudi.
[CB3] Que l'estudiantat tingui la capacitat de reunir i interpretar dades rellevants (normalment dins la seva àrea d'estudi) per emetre judicis que incloguin una reflexió sobre temes rellevants d'índole social, científica o ètica.
[CG3] Cercar, gestionar i utilitzar la informació més adequada per modelitzar problemes concrets i aplicar adequadament procediments teòrics per a la seva resolució de manera autònoma i creativa.

Amunt

L'assignatura està plantejada al voltant de cinc reptes, que vinculen situacions, preocupacions o escenaris reals amb els conceptes que es treballen a l'assignatura. 


Repte 1: Jo no tinc res a amagar!

Considerar que la privadesa de les nostres dades no és important ja que nosaltres no tenim res a amagar és una opinió molt estesa en la nostra societat. Així, amb l'argument que només qui fa malifetes o actes il·legals és qui vol amagar el seu comportament vers a altres i que, precisament, aquestes persones no han de gaudir del dret a la privadesa, la ciutadania es troba sotmesa cada vegada més a la vigilància i seguiment constant tant de governs com de grans empreses. Però, per què ens ha de preocupar aquesta vigilància? Quines conseqüències pot tenir la cessió indiscriminada de les nostres dades? És important el dret a la privadesa per a la ciutadania corrent?

Com a persones usuàries de la tecnologia generem dades que descriuen el nostre comportament i ens vinculen a altres persones. Així, quan naveguem per Internet, quan realitzem cerques de contingut, quan ens connectem a les xarxes socials, quan fem servir el nostre smartphone o, fins i tot, quan engeguem la calefacció o obrim la porta del pàrquing, estem potencialment generant dades sobre nosaltres, que permetran a les companyies que gestionen aquests serveis (i sovint també a terceres parts) saber com som, què fem, amb qui estem, o fins i tot com pensem.

En aquest repte, ens plantejarem per què és important la privadesa de les nostres dades, tot presentant els conceptes bàsics de la privadesa, els atacs i riscos existents per a aquesta, i veurem també quines estratègies es poden seguir per tal de preservar-la. Addicionalment, coneixerem què se'n fa de les dades que generem com a persones usuàries.


Contingut:

  • Unitat 1: Introducció a la privadesa 
  • Unitat 2: Atacs a la privadesa dels usuaris


Repte 2: Publicació de dades: un risc per la privadesa?

L'ús de grans conjunts de dades sobre individus, juntament amb algorismes d'aprenentatge automàtic, ha permès a la societat avançar en molts àmbits: des de la identificació de mutacions genètiques que causen certes malalties, fins a l'optimització de les xarxes de comunicacions, la creació de campanyes de conscienciació social efectives, o la creació de rutes de trànsit que evitin embussos. És per tant evident que en algunes circumstàncies serà important disposar de conjunts de dades, ja que aquests permeten millorar processos (alguns d'ells d'importància vital). 

Ara bé, com hem vist, les dades de persones usuàries de sistemes acostumen a ser delicades, ja que poden permetre a qui les té inferir informació sensible de les persones. Què podem fer doncs, per tal de permetre treballar amb conjunts de dades relacionades amb individus a l'hora que en protegim la privadesa? 

Contingut:

  • Unitat 3: Introducció a la privadesa en la publicació de dades
  • Unitat 4: Models de preservació de la privadesa per a dades complexes


Repte 3: De Khnumhotep II a la blockchain, passant per Juli Cèsar i les Potències de l'Eix

Fa 4000 anys a la riba del Nil un escribà descrivia la història del seu senyor, Khnumhotep II, intercanviant alguns dels símbols dels jeroglífics més comuns per altres de més desconeguts. Tot i que estrictament aquesta pràctica no seria considerada criptografia, sí que és la primera escriptura de la qual en tenim constància on s'intenta transformar deliberadament un text. Des de llavors, la criptografia ha tingut un paper clau en molts events històrics.

Així, els espartans feien servir criptografia per a enviar comunicacions militars; Juli Cèsar és conegut per utilitzar un criptosistema de substitució simple per a comunicar-se amb les seves amistats i les persones que l'aconsellaven; la màquina Enigma va tenir un paper clau en les comunicacions alemanyes durant la Segona Guerra Mundial; i avui en dia podem fer pagaments descentralitzats i sense intermediaris gràcies a la criptografia.

En aquest primer repte centrat en la seguretat de les dades, repassarem els conceptes claus de criptografia de clau privada, la criptografia que es coneixia fins als anys 70, i que encara avui té un paper clau en la seguretat de les dades.

Contingut:

  • Unitat 5: Introducció a la criptografia
  • Unitat 6: Criptografia de clau simètrica
  • Unitat 7: Funcions hash



Repte 4: New directions in cryptography

New directions in cryptography és l'encertat títol del paper que van publicar Whitfield Diffie i Martin Hellman l'any 1976. El paper presentava els conceptes fonamentals en què es basa la criptografia de clau pública o asimètrica, un nou tipus de criptografia en la qual, a diferència de la que s'havia utilitzat fins aquell moment, la persona emissora i la receptora del missatge no comparteixen la mateixa clau. Aquests conceptes són el fonament de la criptografia que fem servir avui en dia, motiu pel qual Diffie i Hellman van ser galardonats amb el prestigiós premi Turing l'any 2015.

Com poden comunicar-se confidencialment dues persones que no comparteixen cap secret previ? Com podem fer que la persona que envia un missatge no pugui negar-ne posteriorment l'autoria? Podem tenir comunicacions segures a escala mundial? Aquestes i moltes altres preguntes són les que podem respondre fent servir esquemes basats en criptografia de clau pública. 

En aquest repte, estudiarem la criptografia de clau pública, que permet superar les limitacions de la criptografia simètrica pel que fa a la distribució i gestió de les claus i, a més, permet crear signatures digitals, que garanteixen la propietat de no-repudi.


Contingut:

  • Unitat 8: Criptografia de clau pública
  • Unitat 9: Infraestructura de clau pública


Repte 5: Que no ens donin garses per perdius!

A mesura que els models predictius basats en dades es fan prevalents a la nostra societat, problemes de seguretat i privadesa d'aquests models es fan palès. 

Així, d'una banda, hi ha models que es despleguen en entorns adversaris, és a dir, en entorns on hi pot haver alguna persona interessada a fer-los fallar deliberadament. L'exemple més conegut és segurament el d'un filtre d'spam en el correu electrònic: el model (en aquest cas, un classificador binari) es fa servir per decidir si cada correu que es rep és considerat o no correu brossa. La persona adversària és doncs l'spammer, que intentarà crear correus que siguin considerats com a legítims per al model. Els classificadors d'imatges, molt populars avui en dia, també són susceptibles a atacs, on les persones adversàries modifiquen les imatges de manera que els models donin respostes errònies, per imatges on clarament un humà donaria una resposta molt diferent.

D'altra banda, l'ús de models en entorns crítics com ara la concessió de crèdits i hipoteques o la selecció de recursos humans, comença a mostrar els seus problemes, no només pel que fa a la privadesa de les dades que es fan servir per entrenar aquests models, sinó també pel que fa a la discriminació o la justificació de les decisions preses per aquests models, sobretot quan aquests són complexos.

En aquest repte, ens introduirem doncs en la seguretat, privadesa i justícia dels algorismes basats en dades, tot veient els problemes als quals s'enfronten els models desplegats en entorns reals i com els podem adreçar.

Contingut:

  • Unitat 11: Biaix algorísmic
  • Unitat 12: Seguretat en la mineria de dades

Amunt

Criptografia PDF
Protecció de la privadesa per a dades complexes PDF
Introducció a la privadesa en la publicació de dades PDF
Introducció a la privadesa PDF
Atacs a la privadesa dels usuaris a internet PDF
Espai de recursos de ciència de dades Web
Biaix algorísmic PDF
Atacs a l'aprenentatge automàtic PDF
Funcionament SHA-256 Audiovisual
Funcions hash PDF
MV - Linux Programari en línia

Amunt

Els recursos d'aprenentatge bàsics de l'assigantura són un conjunt de mòduls didàctics, que descriuen els continguts coberts per l'assignatura:

  • Unitat 1: Introducció a la privadesa, per Julián Salas Piñón.
  • Unitat 2: Atacs a la privadesa dels usuaris, per Marc Juárez Miró i Enric Luján Carbonell.
  • Unitat 3: Introducció a la privadesa en la publicació de dades, per Guillermo Navarro-Arribas.
  • Unitat 4: Models de preservació de la privadesa per a dades complexes, per Julián Salas Piñón.
  • Unitat 5: Introducció a la criptografia, per Cristina Pérez Solà i Jordi Herrera Joancomartí.
  • Unitat 6: Criptografia de clau simètrica, per Jordi Herrera Joancomartí i Cristina Pérez Solà.
  • Unitat 7: Funcions hash, per Jordi Herrera Joancomartí i Cristina Pérez Solà.
  • Unitat 8: Criptografia de clau pública, per Cristina Pérez Solà i Jordi Herrera Joancomartí.
  • Unitat 9: Infraestructura de clau pública, per Cristina Pérez Solà i Jordi Herrera Joancomartí.
  • Unitat 11: Biaix algorísmic, per Marc Juárez Miró.
  • Unitat 12: Seguretat en la mineria de dades, per Gerard Riera Solà.

Aquests mòduls didàctics es troben acompanyats d'un conjunt de Jupyter Notebooks amb exercicis resolts en Python sobre els temes que inclouen una component més pràctica:

  • Anonimització de dades simples i complexes (unitats 3 i 4), per Julián Salas Piñón, Guillermo Navarro-Arribas i Cristina Pérez Solà.
  • Criptografia de clau simètrica (unitats 6 i 7), per Cristina Pérez Solà.
  • Criptografia de clau pública (unitat 8), per Cristina Pérez Solà.
  • Atacs a l'aprenentatge automàtic (unitat 12), per Gerard Riera Solà.

Addicionalment, l'assignatura es complementa amb lectures i consultes a recursos externs, que permeten tant ajudar en la comprensió dels materials teòrics com ampliar la informació sobre els temes més avançats.

Amunt

El procés d'avaluació es fonamenta en el treball personal de l'estudiant i pressuposa l'autenticitat de l'autoria i l'originalitat dels exercicis realitzats.

La manca d'autenticitat en l'autoria o d'originalitat de les proves d'avaluació; la còpia o el plagi; l'intent fraudulent d'obtenir un resultat acadèmic millor; la col·laboració, l'encobriment o l'afavoriment de la còpia, o la utilització de material, programari o dispositius no autoritzats durant l'avaluació, entre altres, són conductes irregulars en l'avaluació que poden tenir conseqüències acadèmiques i disciplinàries greus.

Aquestes conductes irregulars poden comportar el suspens (D/0) en les activitats avaluables que es defineixin en el pla docent -incloses les proves finals- o en la qualificació final de l'assignatura, sigui perquè s'han utilitzat materials, programari o dispositius no autoritzats durant les proves, com ara xarxes socials o cercadors d'informació a internet, perquè s'han copiat fragments de text d'una font externa (internet, apunts, llibres, articles, treballs o proves d'altres estudiants, etc.) sense la citació corresponent, o perquè s'ha dut a terme qualsevol altra conducta irregular.

Així mateix, i d'acord amb la normativa acadèmica, les conductes irregulars en l'avaluació també poden donar lloc a la incoació d'un procediment disciplinari i a l'aplicació, si escau, de la sanció que correspongui, de conformitat amb l'establert a la normativa de convivència de la UOC.

En el marc del procés d'avaluació, la UOC es reserva la potestat de:

  • Sol·licitar a l'estudiant que acrediti la seva identitat segons l'establert a la normativa acadèmica.
  • Sol·licitar a l'estudiant que acrediti l'autoria del seu treball al llarg de tot el procés d'avaluació, tant avaluació contínua com avaluació final, per mitjà d'una prova oral o els mitjans síncrons o asíncrons que estableixi la Universitat. Aquests mitjans tindran per objecte verificar els coneixements i les competències que garanteixin l'autoria; en cap cas no implicaran una segona avaluació. Si no és possible garantir l'autoria de l'estudiant, la prova serà qualificada amb D, en el cas de l'avaluació contínua, o amb un Suspens, en el cas de l'avaluació final.

    A aquests efectes, la UOC pot exigir a l'estudiant l'ús d'un micròfon, una càmera o altres eines durant l'avaluació; és responsabilitat de l'estudiant assegurar que aquests dispositius funcionen correctament.

Amunt

L'assignatura només es pot aprovar amb el seguiment i la superació de l'avaluació contínua (AC). La qualificació final de l'assignatura és la nota obtinguda a l'AC.

 

Amunt