Protecció del copyright electrònic

  • Josep Domingo Ferrer

     Josep Domingo Ferrer

    Llicenciat i doctor en Informàtica per la Universitat Autònoma de Barcelona. Llicenciat en Matemàtiques per la UNED. El seu àmbit de recerca és la seguretat de la informació. Autor de més de setanta publicacions, tant nacionals com internacionals. Actualment és professor titular d'universitat al Departament d'Enginyeria Informàtica i Matemàtiques de la Universitat Rovira i Virgili, on encapçala el grup CRISES.

  • Francesc Sebé Feixas

     Francesc Sebé Feixas

    Enginyer tècnic en Informàtica de Sistemes per la Universitat de Lleida i Enginyer en Informàtica per la Universitat Rovira i Virgili. El seu àmbit de recerca és la seguretat de la informació i més concretament la criptografia, la protecció del copyright i el secret estadístic. Actualment està realitzant els seus estudis de doctorat i és personal de suport a la recerca al grup de CRISES de la URV.

PID_00160562
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars dels drets.

Introducció

En aquest mòdul didàctic donarem els fonaments per a entendre les tècniques de protecció de la propietat intel·lectual de la informació multimèdia objecte de transacció electrònica.
Comencem distingint les dues estratègies bàsiques de protecció anticòpia: impediment de la còpia i detecció de la còpia. Tot seguit, ens centrem en les tècniques de detecció, que són les més prometedores.
Dintre de la detecció de còpia, parlarem de les marques d'aigua, que són l'eina fonamental d'aquesta estratègia. També parlarem d'un cas particular de marca d'aigua, les anomenades empremtes digitals.
Descriurem de manera genèrica els processos d'encast i de recuperació de la marca. Tot seguit, enumerarem quins requisits ha de complir un bon sistema de marcatge anticòpia i classificarem els sistemes de marca d'aigua i els d'empremta digital.
Finalment, estudiarem dos sistemes amb propietats diferents, un d'aquests apropiat per al marcatge d'imatges estàtiques i l'altre, per al marcatge de vídeo digital.

Objectius

Els materials didàctics d'aquest mòdul us han de permetre d'assolir els objectius següents:
  1. Fer-vos càrrec de la importància de protegir el copyright de la informació multimèdia.

  2. Entendre per què la detecció de la còpia ofereix més garanties que l'impediment de la còpia.

  3. Conèixer els principis operatius de les marques d'aigua i de les empremtes digitals.

  4. Tenir clara una classificació de les tècniques existents de detecció de còpia.

  5. Comprendre el disseny i el funcionament de dos sistemes de marca d'aigua amb propietats diferents.

1.Protecció del copyright en continguts multimèdia

"First, there's the room you can see through the glass -that's
just the same as our drawing room, only the things go the other way."
L. Carroll (1872). Through the Looking Glass And What Alice Found There (cap. 1).

1.1.Importància de protegir el copyright

Una de les característiques de la informació en format digital és que la seva qualitat no es degrada al llarg del seu cicle de vida. La informació en format analògic no es comporta igual: tots hem vist que la qualitat d'una cinta d'àudio o de vídeo analògic disminueix si es reprodueix moltes vegades o si la cinta no és l'original.
Quan s'associa un valor econòmic a una certa informació digital (per exemple, una cançó MP3, una pel·lícula MPEG, etc.), la no-degradació de les còpies esdevé per al propietari intel·lectual de la informació més un problema que un avantatge. Aquesta situació es produeix en el comerç electrònic de continguts multimèdia.
En efecte, si no s'adopten mesures de protecció, qualsevol comprador d'un contingut en pot fer tantes còpies com vulgui, sense pràcticament cap cost i sense que la qualitat de les còpies minvi respecte de l'original.
És evident que la possibilitat d'obtenir sense cost còpies idèntiques a l'original és una amenaça per a la viabilitat econòmica del comerç electrònic de contingut multimèdia.
En el cas extrem, podria arribar a passar que el propietari del contingut només en vengués una còpia i que, a partir d'aquest moment, es fessin tot de còpies il·legals.
Del que hem dit anteriorment, se'n desprèn l'extrema importància de protegir-se contra la còpia no autoritzada d'informació en format electrònic. La protecció de la propietat intel·lectual en la societat de la informació ha estat un dels objectius del cinquè programa marc d'R+D de la Unió Europea.

1.2.Impediment de còpia enfront de detecció de còpia

Hi ha dues estratègies bàsiques de protecció:
  • Impediment de la còpia

  • Detecció de la còpia

a) Impediment de còpia
L'estratègia d'impediment de còpia consisteix a fer impossible la realització de còpies no autoritzades. Se sol basar en mecanismes de maquinari.
En sistemes de distribució de continguts per mitjà d'Internet, es pretén evitar la còpia descontrolada utilitzant la criptografia.
Sistema de control de distribució
Dintre del sistema hi ha un programari anomenat Digital Rights Management (DRM) que entra en funcionament quan un contingut (un vídeo o una cançó) ha de ser venut. Aquest programari xifra un determinat producte i l'envia a un servidor, per mitjà del qual els clients el poden adquirir. Quan un client compra un contingut, en fa el pagament i aquest se li envia juntament amb la clau necessària per a desxifrar-lo. El sistema es basa en el fet que el programari de reproducció és l'únic capaç de desxifrar el contingut i que no permet que el producte desxifrat sigui copiat a disc.
En última instància, per a impedir la còpia, cal que els dispositius reproductors i gravadors de contingut multimèdia incorporin unes certes mesures anticòpia en el seu maquinari.
En un entorn real, en què les especificacions d'aquests dispositius són obertes o almenys conegudes per un gran nombre de fabricants, és bastant il·lusori pensar que tots els dispositius fabricats compliran estrictament les mesures previstes.
El trencament de les mesures anticòpia dels discos compactes (CD), de les televisions xifrades de pagament i, darrerament, dels discos de vídeo digital (DVD) són exemples del fracàs clamorós de l'estratègia d'impediment de còpia.
El cas del DVD
Al sistema DVD, els continguts del vídeo hi incorporen uns bits d'informació anticòpia. Un reproductor DVD que s'ajusti a les especificacions no copiarà dades que portin uns bits anticòpia amb el significat ‘no copien'.
Si els bits anticòpia duen el significat ‘copiar una vegada', aleshores el reproductor permetrà de copiar les dades una vegada, però, a partir de la còpia, no se'n podrà fer d'altres (la còpia portarà uns bits anticòpia dient ‘no copien').
Per tal d'evitar el canvi no autoritzat dels bits anticòpia per part de tercers, el sistema DVD preveu el xifratge dels continguts mitjançant un criptosistema (molt feble) anomenat Content Scrambling System (CSS). Doncs bé, resulta que, el 1999, uns intrusos (hackers) alemanys i noruecs van posar a Internet el programa DeCSS, que permet de desxifrar i llegir continguts DVD, amb la qual cosa és fàcil alterar-ne els bits anticòpia i saltar-se el mecanisme d'impediment de còpia.
b) Detecció de còpia
L'estratègia de detecció de còpia no pretén evitar que un determinat contingut sigui copiat, sinó que es basa a fer que les còpies il·legals siguin identificables.
La detecció de la còpia un cop aquesta s'ha produït és l'única estratègia que queda si fracassa l'intent d'impedir que les còpies no autoritzades es facin. L'objectiu és encastar una marca d'aigua, consistent en una seqüència de bits d'informació, dintre dels continguts que cal protegir.
Si la marca d'aigua conté informació sobre el propietari, la seva extracció permetrà de demostrar a qui pertany el contingut en cas de conflicte. Si la marca d'aigua conté informació sobre el comprador al qual s'ha venut la còpia, llavors s'anomena empremta digital.
Les empremtes digitals són un subtipus de marca d'aigua que permeten de seguir el rastre de les còpies il·legals que es fan circular; si tot va bé, permeten de saber qui ha estat el comprador que les ha redistribuïdes de manera no autoritzada.

2.Estat de la tècnica de detecció de còpia

El funcionament dels sistemes de detecció de la còpia basats en marques d'aigua és el següent:
1) Per a encastar un bit de la marca, cal un fragment dels continguts que cal protegir, del qual hi hagi dues versions lleugerament diferents. En aquest context, la diferència entre versions es considera lleugera si és imperceptible per a l'usuari del contingut. Si es fa servir la primera versió, es codifica un "0" com a valor del bit de marca corresponent; si es fa servir la segona versió, es codifica un "1".
2) Quan es ven una còpia del contingut, el venedor tria un valor per a cada bit de la marca i fa servir les versions pertinents dels fragments corresponents als bits per a construir un contingut marcat.
3) Quan el venedor troba un contingut redistribuït, en recupera la marca per tal de demostrar que en posseeix el copyright o bé per a trobar quin comprador és responsable de la redistribució.

2.1.Encast i recuperació de la marca

El procediment per a encastar una marca d'aigua en un contingut està representat a la figura 1 i té, com a paràmetres d'entrada, la marca M, els continguts que cal protegir X i una clau secreta K emprada per a escampar M dintre de X. La sortida del procediment d'encast és l'objecte marcat 11034_m5_06.gif.
Figura 1: Procediment d'encast de marca
Figura 1: Procediment d'encast de marca
El procediment per a recuperar una marca a partir d'un objecte marcat redistribuït està representat a la figura 2 i té, com a paràmetres d'entrada, l'objecte redistribuït 11034_m5_06.gif', la clau secreta K emprada durant l'encast i, segons les propietats de l'esquema de marca d'aigua utilitzat, algun paràmetre addicional.
Depenent del sistema, la sortida del procediment és la marca recuperada M' o bé una variable booleana SÍ/NO.
Figura 2. Procediment de recuperació de marca
Figura 2. Procediment de recuperació de marca
Noteu que és possible que l'objecte marcat redistribuït 11034_m5_06.gif', pres com a entrada per al procediment de recuperació, no correspongui exactament a cap objecte marcat 11034_m5_06.gif' segons el procediment d'encast. En efecte, entre el moment de marcar-lo i el moment en què se'n detecta la redistribució, el contingut pot haver sofert algunes manipulacions. Per tant, és possible (tot i que no és desitjable) que la marca recuperada M' no correspongui a la marca realment encastada M.

2.2.Propietats dels sistemes de marca d'aigua i d'empremta digital

"Il faut qu'il n'exige pas le secret, et qu'il puisse sans inconvénient tomber entre les mains de l'ennemi."

A. Kerckhoff (1883, gener). "La cryptographie militaire". Journal des Sciences Militaires (9, pàg. 5-38).

Fins ara hem dit que cal encastar la marca d'aigua en els continguts que cal protegir. En aquest apartat incidirem en el fet que cal fer-ho bé.
Llistem, a continuació, algunes propietats desitjables en els sistemes de marca d'aigua:
  • Imperceptibilitat: l'encast de la marca no ha de deteriorar perceptiblement la qualitat dels continguts que es volen protegir. Altrament, la protecció del copyright seria una victòria pírrica. La imperceptibilitat es pot mesurar de manera subjectiva, recorrent a l'opinió de persones que examinin el contingut marcat, o bé de manera objectiva, amb mesures com la màxima relació senyal-soroll (PSNR) entre el contingut original i el contingut marcat.

  • Robustesa: es diu que un sistema de marca d'aigua és robust contra un cert atac de manipulació si, després d'atacar el contingut marcat amb aquesta manipulació, encara se'n pot recuperar la marca que s'hi va encastar abans de l'atac.

La robustesa ideal consisteix en el fet que l'alteració necessària que cal aplicar per a eliminar la marca hagi de ser tan gran que faci que el contingut perdi el seu valor comercial.
Podem distingir dues menes d'atacs:
  • Atacs d'un sol usuari

  • Atacs de confabulació

Els atacs d'un sol usuari són realitzats per un sol comprador de manera accidental o intencionada.
Exemple d'atac d'un sol usuari
Si els continguts són imatges, els atacs poden consistir en compressió amb pèrdua, distorsió geomètrica (rotació, escalat, estirament, etc.), filtratge passabaix... De fet, per al cas de les imatges, hi ha un programa benchmark de domini públic, anomenat StirMark, que efectua una bateria d'atacs estàndard per a provar la robustesa dels sistemes de marca d'aigua (vegeu les activitats al final del mòdul).
  • Marcatge múltiple: es refereix a la possibilitat d'encastar diverses marques superposades en el mateix contingut, de manera que més tard es puguin recuperar una per una sense que s'hagin interferit. Per a cada marca encastada, les marques que s'hi encasten posteriorment poden ser vistes com a soroll, per la qual cosa un sistema de marcatge múltiple ha de ser necessàriament robust al soroll.

  • Capacitat: fa referència al nombre màxim de bits de marca que podem encastar al sistema amb un cert volum de contingut sense modificar la propietat d'imperceptibilitat.

  • Mínim secret: els procediments d'encast i de recuperació de la marca haurien de ser públics, de manera que només la clau emprada quedés en secret, segons l'anomenat principi de Kerckhoff. Malauradament, moltes de les solucions comercials de marca d'aigua es basen en algorismes no publicats, amb la qual cosa no és possible saber quina protecció oferirien aquestes solucions si se'n filtressin els algorismes. Clarament, el secret de la clau depèn de l'usuari del sistema, mentre que el secret de l'algorisme depèn del seu dissenyador, amb la qual cosa una indiscreció del dissenyador comprometria la seguretat dels usuaris.

Cal posar èmfasi en el fet que la propietat de robustesa esmentada anteriorment fa referència a atacs genèrics independents del sistema de marca d'aigua utilitzat. Si l'atacant coneix els algorismes d'encast i de recuperació del sistema, i fa servir aquest coneixement per a muntar atacs específics, aleshores es parla de resistència a manipulacions intencionades (1) una propietat força més difícil d'aconseguir que la robustesa.
Si el sistema de marca d'aigua es fa servir per a encastar empremtes digitals (la marca d'aigua és diferent per a cada còpia i n'identifica el comprador), aleshores podem enunciar tres propietats addicionals:
  • Seguretat per al comprador: no hauria de passar que la recuperació de la marca porti a acusar de redistribució compradors innocents.

  • Resistència a confabulacions: no hauria de passar que la confabulació d'uns quants compradors els permeti de fabricar una nova còpia a partir de la qual no es pugui recuperar la marca de cap d'ells.

    Noteu que, en el cas de les empremtes digitals, la marca d'aigua encastada és diferent per a cada còpia venuda, amb la qual cosa és concebible que uns compradors confabulats aconsegueixin localitzar i/o alterar alguns bits de la marca encastada a força de comparar i/o barrejar les seves còpies respectives. La confabulació triomfa si la marca recuperada de la còpia barrejada no correspon a cap dels confabulats.

  • Anonimat: la compra de continguts marcats amb empremtes digitals no hauria de fer perdre l'anonimat al comprador.

El requisit d'anonimat només té sentit en un context de transacció electrònica anònima, en què el pagament pels continguts adquirits també sigui anònim. De tota manera, hem de dir que, actualment, no hi ha cap sistema efectiu d'empremta digital que satisfaci aquest requisit.
Els dissenyadors de sistemes d'empremta digital solen fer el que s'anomena suposició de marcatge.
En la suposició de marcatge, se suposa que dos o més compradors deshonestos només poden localitzar i esborrar bits de marca a partir de la comparació de les seves còpies.
En altres paraules, la suposició anterior vol dir que els dissenyadors de sistemes d'empremta digital es concentren a trobar codificacions de les marques encastades que els permetin de superar atacs de confabulació. Quant a la resta d'atacs, suposen que el sistema de marca d'aigua amb el qual s'encasten i recuperen les marques és prou robust per a superar-los.
Així, doncs, un sistema d'empremta digital consisteix en el següent:
  • Un sistema de marca d'aigua robust i que no requereixi subministrar la marca que cal recuperar com a paràmetre d'entrada de l'algorisme de recuperació. Aquest requisit és lògic, perquè cada còpia marcada porta una marca diferent, amb la qual cosa no se sap a priori quina marca es vol recuperar.

  • Una codificació de les marques que cal encastar que els permeti de sobreviure als atacs de confabulació previstos en la suposició de marcatge.

2.3.Classificació dels sistemes de marca d'aigua

Per a classificar els sistemes de marca d'aigua existents, ens fixarem en els paràmetres d'entrada que requereix el seu algorisme de recuperació de marca. Òbviament, aquest algorisme sempre requereix com a entrades el contingut marcat redistribuït i també la clau secreta usada durant l'encast (vegeu la figura 1). Són els paràmetres d'entrada addicionals els que ens permeten de fer la classificació següent:
  • Sistemes cecs: són aquells que poden recuperar la marca amb només els dos paràmetres d'entrada esmentats anteriorment, el contingut marcat redistribuït 11034_m5_06.gif' i la clau secreta K. Es tracta dels sistemes més flexibles, per bé que no els més robustos.

  • Sistemes semicecs: per a poder recuperar la marca, aquesta mena de sistemes requereixen, a més de 11034_m5_06.gif' i K, o bé el contingut original X o bé la marca M que s'està cercant. Això presenta inconvenients respecte dels sistemes cecs:

    • Si es requereix X, l'inconvenient és que el recuperador de marca ha de tenir accés al contingut original, amb la qual cosa ha de coincidir amb el propietari del contingut (o bé tenir-ne la confiança absoluta).

    • Si es requereix M, aleshores el sistema no és utilitzable per a empremta digital (en què no se sap a priori quina marca es recuperarà).

  • Sistemes privats: aquests sistemes necessiten tota la informació possible per a recuperar la marca. Això vol dir 11034_m5_06.gif', X, K i M. La sortida que dóna l'algorisme de recuperació de marca és una variable booleana SÍ/NO que val "SÍ", si s'ha trobat M dins de 11034_m5_06.gif', i val "NO", si no s'hi ha trobat M.

Figura 3: Classificació dels sistemes de marca d'aigua segons la informació necessària per a la recuperació.
Figura 3: Classificació dels sistemes de marca d'aigua segons la informació necessària per a la recuperació.

2.4.Classificació dels sistemes d'empremta digital

El concepte d'empremta digital (2) fou proposat per N.R. Wagner el 1983. Al final dels anys noranta, van aparèixer nous sistemes d'empremta digital, amb la qual cosa el concepte de Wagner fou "rebatejat" com a empremta digital simètrica. Actualment, podem distingir els tipus de sistemes d'empremta digital següents (alguns d'aquests tipus no són mútuament excloents):
  • Sistemes simètrics: en aquests sistemes, el venedor marca la còpia i després la ven. Per tant, tant el comprador com el venedor tenen accés a la còpia marcada. Com que el venedor veu la còpia marcada després de marcar-la, un venedor deshonest pot redistribuir la còpia corresponent a un usuari i després acusar-lo en fals. D'altra banda, en un judici un comprador culpable podria esgrimir l'argument anterior per a acusar en fals el venedor de la redistribució. Per tant, els sistemes simètrics d'empremta digital no proporcionen cap prova de redistribució davant de tercers: el venedor només es pot convèncer ell mateix que un comprador és culpable.

  • Sistemes asimètrics: foren proposats per Pfitzmann i Schunter el 1996 per tal d'obtenir una prova de redistribució. L'algorisme d'encast de marca ja no l'executa el venedor tot sol, sinó que és un protocol en el qual cooperen venedor i comprador. El protocol és tal que el venedor no veu la còpia marcada resultant, però, quan la troba redistribuïda (per Internet, per exemple), pot recuperar-ne la marca encastada i, per tant, la identitat del comprador. Com que el comprador és l'únic que coneix la còpia marcada, llevat que la redistribueixi, el coneixement de la còpia marcada per part del venedor és una prova acusatòria contra el comprador.

  • Sistemes anònims: foren proposats el 1997 per Pfitzmann i Waidner per a intentar satisfer el requisit d'anonimat. Tots els sistemes anònims proposats són també asimètrics, amb la particularitat que el comprador utilitza pseudònims en el protocol de marcatge per a preservar el seu anonimat.

  • Sistemes anticonfabulació: foren introduïts per Boneh i Shaw el 1995 i el seu objectiu és satisfer el requisit de resistència a les confabulacions. Es basen en una codificació de les marques encastades tal que si una confabulació de fins a c compradors (on c és un paràmetre) fabrica una marca a partir de les seves marques diferents, la marca resultant serà descodificada com la marca d'un dels confabulats. D'aquesta manera, la confabulació no queda impune. Boneh i Shaw construïren uns codis especials per a codificar les marques i, en el 2000, Domingo i Herrera van demostrar que és possible resistir confabulacions de dos compradors amb alguns codis, correctors d'errors dels habitualment utilitzats per a la transmissió d'informació en canals amb soroll.

Cal dir que, actualment, no hi ha implementacions ni de sistemes asimètrics ni de sistemes anònims. El problema fonamental és aconseguir un protocol d'encast de marca eficient.

3.Marca d'aigua per a imatges estàtiques

3.1.Imatges digitals

Des d'un punt de vista de processament informàtic, una imatge digital consisteix en una matriu de dues dimensions en què cada element conté informació sobre un punt de color. Aquests punts són els anomenats píxels. Els nombres de files i columnes d'aquesta matriu corresponen a l'amplada i l'alçada de la imatge, respectivament.
La informació continguda en un píxel dependrà del tipus d'imatge. Així, doncs, en el cas d'una imatge monocroma, cada píxel contindrà un nombre enter que representarà el seu nivell de gris. Si el que tenim és una imatge en color, són tres enters, cadascun dels quals indica el nivell de cada pla de color (roig, verd i blau).
A causa de l'elevada quantitat d'informació continguda en una imatge, els fitxers necessaris per al seu emmagatzematge tenen una mida massa gran perquè siguin còmodes de manipular i transportar. És per això que habitualment les imatges s'emmagatzemen en formats de fitxer que apliquen una compressió.
Hi ha dos tipus de compressió:
  • Sense pèrdua: compressió en què la informació recuperada després de descomprimir és exactament la mateixa que abans de comprimir.

  • Amb pèrdua: compressió en què la informació recuperada després de descomprimir pot ser lleugerament diferent a l'original. Amb aquest tipus de compressió, s'aconsegueixen fitxers comprimits de mida més petita que són els utilitzats més habitualment.

El fet que les imatges s'emmagatzemin en formats de compressió amb pèrdua fa que les tècniques de marca d'aigua utilitzades hagin de ser prou robustes perquè la marca inserida segueixi essent recuperable després de la compressió.

3.2.Robustesa dels sistemes de marca d'aigua per a imatges

Ja s'ha esmentat que la robustesa d'un sistema de marca d'aigua preveu la resistència de la marca contra les manipulacions no intencionades que pot experimentar l'objecte durant el seu cicle de vida.
En el cas d'una imatge, aquestes manipulacions acostumen a ser:
  • Compressió amb pèrdua

  • Canvi de format

  • Filtratge

  • Escalat

  • Variació de la relació d'aspecte

  • Retallada dels marges

També n'hi ha d'altres de menys habituals com ara petites rotacions.
Convé, doncs, que els sistemes de marca d'aigua siguin robustos contra aquests tipus de manipulació.

3.3.Procediment general de marcatge d'una imatge

Tal com s'ha dit amb anterioritat, l'encast d'una marca d'aigua dintre de continguts multimèdia es fa realitzant petits canvis al producte. En el cas de les imatges, aquestes modificacions afecten el nivell de color dels píxels de la imatge.
Habitualment, el procés de marcatge d'una imatge es divideix en les fases següents:
1. Determinar els píxels de la imatge en què s'encastaran els bits de la marca.
2. Determinar la màxima modificació aplicable a cada píxel per tal que el marcatge sigui imperceptible.
3. Encastar la marca.
El procés de recuperació de la marca encastada en una imatge passa per les fases següents:
1. Determinar els píxels on està encastat cada bit.
2. Recuperar els diferents bits de la marca.
3. Comprovar que la marca recuperada és correcta.

3.4.Estudi del cas 1: descripció d'un sistema semicec de marca d'aigua per a imatges

A continuació descriurem un sistema de marca d'aigua semicec per a imatges.
En la descripció d'aquest sistema, denotarem la imatge com el conjunt de tots els seus píxels X = {xi : 1 ≤ i ≤ n}, en què n és el nombre de píxels de la imatge i xi és el nivell de color de l'i-èsim píxel. Suposarem que la imatge és monocroma, per tant, cada píxel solament conté un enter d'informació de nivell de gris. L'extensió del sistema per a imatges en color és ben senzilla, solament cal aplicar la tècnica a cadascun dels plans de color per separat.
3.4.1.Algorisme d'encast de marca
En aquest sistema, l'entitat que vol encastar una marca d'aigua ha de proporcionar el valor dels paràmetres següents:
  • q: correspon a un nivell de qualitat de l'algorisme de compressió amb pèrdua JPEG. S'utilitza per a determinar a quins píxels s'encastaran els bits de la marca i quina és la modificació que cal aplicar a cadascun per a fer aquest encast.

  • p: correspon a un nivell de PSNR. S'utilitza per a afitar la màxima diferència entre la imatge abans i després del procés de marcatge.

  • k: llavor d'un generador pseudoaleatori criptogràficament segur. La seva funció és generar una seqüència pseudoaleatòria amb la qual xifrar els bits abans d'encastar-los.

  • La marca que cal encastar. Consisteix en una seqüència binària que denotarem m.

1) Determinació dels píxels de la imatge en què s'encastaran bits de la marca.
En aquest pas, s'agafa la imatge original i es comprimeix utilitzant l'algorisme JPEG amb paràmetre q. A continuació, es descomprimeix el fitxer comprimit i en resulta l'obtenció de la imatge X'.
Cal que tinguem en compte que la imatge X' serà lleugerament diferent a X, a causa que l'algorisme JPEG aplica compressió amb pèrdua.
Aleshores, per cada píxel i de la imatge calculem δi : = xi – x'i. Aquells píxels en què δi ≠ 0 serà on s'encastaran els bits de la marca. Observem que els píxels amb δi ≠ 0 són aquells en què ha variat el nivell de color després de la compressió amb pèrdua.
2) Determinació de la modificació aplicable a cada píxel
En aquesta fase, s'utilitzen els valors calculats a la fase anterior. A cada píxel xi amb δi ≠ 0, se li podrà variar el nivell de color un màxim de 11034_m5_05.gif unitats. Cal tenir en compte que δ pot ser negatiu.
Aquesta manera d'aconseguir la imperceptibilitat es basa en el fet que fixem el màxim increment realitzable a un píxel com aquell causat per la compressió amb pèrdua JPEG amb factor de qualitat q. D'aquesta manera, l'impacte visual del marcatge serà semblant al causat per JPEG.
3) Encast de la marca
Primerament, es fa un procés de codificació i replicació de la seqüència m per tal que es pugui recuperar íntegrament, malgrat que alguns dels bits encastats canviïn de valor a causa de les alteracions en la imatge marcada. Aquest es fa de la manera següent:
a) Es codifica m utilitzant un codi corrector d'errors. La seqüència codificada resultant, l'anomenarem M.
b) Es replica la seqüència codificada M tants cops com sigui necessari fins a obtenir una seqüència de longitud igual al nombre de píxels de la imatge amb δi ≠ 0. La seqüència resultant, l'anomenarem M'.
A continuació, xifrem en flux la seqüència M'. Això es fa de la manera següent:
c) Mitjançant un generador pseudoaleatori amb la clau k com a llavor, generem una seqüència de bits S de la mateixa longitud que M'.
d) Xifrem M' en flux amb la seqüència S. El resultat d'aquesta operació, el denotarem com S' : = M' ⊕ S.
Un cop es té la marca codificada, replicada i xifrada, es procedeix a encastar-la dintre de la imatge X. La imatge marcada, la denotarem com:
11034_m5_06.gif = {11034_m5_07.gifi, 1 ≤ i ≤ n}.
Això es fa de la manera següent:
e) Inicialitzar j: = 0. Per a i =1 fins n fer:
  • Si δi = 0 aleshores 11034_m5_07.gifi : = xi

  • Si δi ≠ 0 aleshores

    • Calcular j: = j + 1

    • Si S'j = 0 aleshores 11034_m5_07.gifi: = xi – δi

    • Si S'j = 1 aleshores 11034_m5_07.gifi: = xi + δi

Observem que a les posicions en què δi no hi ha modificació, ja que el píxel de la imatge marcada és igual al de la imatge original. A la resta, l'encast del bit corresponent es fa incrementant o disminuint el nivell de color, depenent de si té valor 1 o 0, respectivament.
Finalment, es fa un darrer pas que té per objectiu reduir la diferència entre la imatge original i la imatge marcada fins que el PSNR entre les dues imatges sigui superior o igual a l'indicat mitjançant el paràmetre p.
f) Mentre PSNR (11034_m5_06.gif/X) < p fer
  • Escollir aleatòriament un índex i tal que l ≤ i ≤ n.

  • Si 11034_m5_07.gifi – xi > 3 aleshores 11034_m5_07.gifi: = 11034_m5_07.gifi – 1.

  • Si 11034_m5_07.gifi – xi < –3 aleshores 11034_m5_07.gifi: = 11034_m5_07.gifi +1 .

El fet de reduir solament l'increment si la diferència entre el píxel marcat i el píxel original és més gran que 3 es fa per fer que la marca no sigui massa feble.
La sortida d'aquest algorisme és la imatge marcada 11034_m5_06.gif.
3.4.2.Algorisme de recuperació de marca
L'entitat que vol recuperar la marca d'una imatge ha de proporcionar el valor dels paràmetres q, k (que han de ser els mateixos que es van utilitzar durant l'algorisme d'encast). Després, també ha de conèixer la longitud de la seqüència que es busca i cal tenir accés a la imatge original X (és un sistema semicec). La imatge presumptament marcada de la qual volem recuperar la marca la denotarem com 11034_m5_06.gif = {11034_m5_06.gifi1 ≤ i ≤ n}.
1) Determinar els píxels on està encastat cada bit.
De la mateixa manera que en l'algorisme d'encast, s'agafa la imatge original X i es comprimeix utilitzant l'algorisme JPEG amb paràmetre q. Després es torna a descomprimir i s'obté la imatge X'.
Aleshores, per cada píxel i de la imatge es calcula δi : = xi – x'i. Aquells píxels amb δi ≠ 0 és on hi ha els bits de la marca.
2) Recuperar els diferents bits de la marca.
La marca es recupera de la manera següent:
a) A partir de la longitud de la seqüència que es busca, calcular la seva longitud un cop codificada, és a dir, 11034_m5_08.gif.
b) A continuació, s'inicialitzen dos vectors uns [.] i zeros [.] de mida 11034_m5_08.gif inicialitzant totes les posicions a zero. La funció d'aquests dos vectors és comptar, per cada bit de 11034_m5_09.gif, quants cops es recupera amb valor 1 i quants cops amb valor 0.
c) Utilitzant la clau k com a llavor, es genera la seqüència pseudoaleatòria S de longitud igual al nombre de píxels de X amb δi ≠ 0.
d) Per cada píxel i en què δi ≠ 0, calcular 11034_m5_10.gifi: = 11034_m5_06.gifi–xi.
e) Sigui j: = 0.
Per a i = 1 fins n fer
Si δi ≠ 0 aleshores
I. j:= j+1. Si j> 11034_m5_08.gif aleshores j: = 1
II. Si signe δi = signe(11034_m5_10.gifi) aleshores 11034_m5_11.gifj: = 1
III) Si signe (11034_m5_10.gifi) = signe (11034_m5_10.gifi) aleshores 11034_m5_11.gifj: = 0
IV. Calcular el j-èssim bit de 11034_m5_09.gif com 11034_m5_12.gifj: = 11034_m5_11.gifj + sj
V. Si 11034_m5_12.gif'j = 1 aleshores uns [j] : =uns [j] + 1
VI. Si 11034_m5_12.gif'j = 0 aleshores zeros [j] : = zeros [j] + 1
En els passos (II) i (III) es determina quin bit conté el píxel i. Si la imatge de la qual volem recuperar la marca no ha estat alterada, aleshores 11034_m5_07.gifi = xi ± δi depenent de si el bit que calia encastar era un 1 o un 0. Així, doncs, 11034_m5_10.gifi = 11034_m5_07.gifi – xi = (xi ± δi) – xi = ± δi. D'aquesta manera, si el signe de (11034_m5_10.gifi) és igual al signe de (δi), es dedueix que l'increment va ser positiu, amb la qual cosa el bit encastat és un 1; altrament és un 0.
Observeu que una alteració en un píxel li fa canviar el valor del bit encastat solament si el signe de (11034_m5_10.gifi) es veu modificat. Aquest fet fa que el mètode toleri determinades alteracions.
Al pas (IV), utilitzant el bit corresponent de la seqüència S es desxifra el bit recuperat anteriorment i, a continuació, al pas (V) o (VI), ens anotem el resultat obtingut.
A continuació,
f) Per a j = 1 fins 11034_m5_08.gif fer
  • si uns [j] > zeros [j] aleshores 11034_m5_12.gifj : = 1,

  • si zeros [j] > uns [j] aleshores 11034_m5_12.gifj : = 0 .

El valor definitiu de cada bit de la marca codificada es determina com aquell que ha aparegut més cops després de recuperar-lo dels diferents píxels en què estava encastat.
g) Finalment, descodifiquem 11034_m5_09.gif amb el mateix codi corrector d'errors utilitzat en l'algorisme de marcatge i obtenim la marca descodificada.
3) Comprovar que la marca és correcta
Per a comprovar si una marca descodificada recuperada 11034_m5_12.gif és correcta, cal que abans de ser encastada se li hagi afegit redundància en forma de suma de comprovació o CRC. En aquest cas, solament cal comprovar que aquesta redundància sigui correcta.

4.Marca d'aigua per a vídeo digital

4.1.Vídeo digital

El vídeo digital consisteix en una seqüència d'imatges digitals que es reprodueixen seqüencialment en el temps i que pot tenir so o no tenir-ne.
En el cas que tinguem un vídeo amb imatge i so, aquest s'emmagatzema en un únic fitxer que conté els dos fluxos multiplexats: el flux d'imatge i el flux de so.
Generalment, els formats de compressió de vídeo aconsegueixen taxes de compressió més altes que les d'imatge ja que aprofiten la redundància temporal. Tot i això, la mida d'un fitxer de vídeo comprimit amb una qualitat acceptable, es compta per desenes de megabits, depenent de la seva durada i del format de compressió utilitzat.
A causa que un vídeo pot tenir so, l'encast de marca es pot realitzar tant en el flux d'imatge com en el de so, com en tots dos.
Les modificacions per a encastar una marca en un flux d'imatge es poden fer de dues maneres:
  • Aplicant modificacions als píxels dels diferents fotogrames. Fer-ho així resulta molt costós en el temps, perquè, per a marcar cada fotograma, primer cal descomprimir-lo, després encastar-hi la marca i després tornar-lo a comprimir. D'altra banda, és una tècnica més portable, ja que no depèn del format de compressió utilitzat.

  • Aplicant modificacions als bits de la seqüència comprimida o semi-descomprimida. D'aquesta manera, ens estalviem les etapes de descompressió i compressió. És una manera molt més ràpida, però que depèn del format de compressió utilitzat.

Independentment dels fluxos en què encastem la marca (imatge i/o so) o de si ho fem directament sobre els píxels dels fotogrames o sobre la seva representació comprimida, cal que el sistema utilitzat sigui cec o semicec, en aquest segon cas només en la variant que requereix conèixer la seqüència que busquem.
En cap cas no és factible requerir el vídeo original per a la recuperació de la marca, pel fet que la mida d'aquest és massa gran.

4.2.Robustesa dels sistemes de marca d'aigua per a vídeo digital

Cal que un sistema de marca d'aigua per a vídeo suporti les modificacions que se li poden fer.
Aquestes inclouen els canvis següents:
  • Canvi de format.

  • Compressió.

  • Eliminació de fotogrames (cosa que succeeix quan solament ens interessa un determinat tram del vídeo i n'eliminem la resta).

  • Inserció de fotogrames (per exemple, els crèdits inicials d'una pel·lícula).

4.3.Estudi del cas 2: descripció d'un sistema cec de marca d'aigua per a imatges aplicable a vídeo digital

A continuació, descriurem un sistema cec de marca d'aigua per a imatges. Com que és un sistema cec i s'ha comprovat que és robust contra la compressió MPEG-1, aquest sistema és utilitzable per a marcar vídeo en aquest format.
El procediment per a marcar vídeo amb aquest sistema és el següent:
1) En cas que el vídeo també contingui àudio, es fa una separació dels dos fluxos.
2) S'agafa el flux de vídeo i per cada fotograma:
  • Se'l descomprimeix.

  • Se'l marca.

  • Es torna a comprimir el fotograma marcat tot afegint-lo a un flux d'imatges marcades comprimides.

3) En cas que el vídeo original contingués àudio, es tornen a multiplexar els dos fluxos.
El procediment per a recuperar la marca d'un vídeo és el següent:
1) En cas que el vídeo també contingui àudio, es fa una separació dels dos fluxos.
2) S'agafa el flux de vídeo i per cada fotograma:
  • Se'l descomprimeix.

  • Se li aplica l'algorisme de recuperació de marca.

  • En cas de trobar una marca, ho registrem.

3) A partir dels resultats obtinguts, decidim si s'ha trobat una marca i quina és aquesta.
Tal com hem fet en la descripció del sistema anterior, denotarem la imatge com X = {xi : 1 ≤ i ≤ n}, en què n és el nombre de píxels de la imatge i xi és el nivell de color de l'i-èsim píxel. També suposarem que la imatge és monocroma i, per tant, cada píxel solament conté un enter d'informació de nivell de gris. Igual que en el cas anterior, l'extensió del sistema per imatges en color és ben senzilla, simplement aplicant la tècnica a cadascun dels plans de color per separat.
4.3.1.Algorisme d'encast de marca
L'entitat que vol encastar la marca ha de proporcionar una sèrie de paràmetres que són dt, lb1 , ub1 , lb2, ub2 . Tots aquests paràmetres afecten la imperceptibilitat i la robustesa del sistema. Descriurem més endavant el seu significat i la utilització que se'n fa.
A més, també cal proporcionar:
  • k: llavor d'un generador pseudoaleatori criptogràficament segur. La seva funció serà determinar les posicions en les quals encastar bits de la marca i com cal modificar els píxels.

  • La marca que cal encastar. Consisteix en una seqüència binària que denotarem m.

1) Determinació dels píxels de la imatge on s'encastaran els bits de la marca
Per a fer això, primer es codifica la marca m utilitzant un codi corrector d'errors. La seqüència resultant, l'anomenarem M. La longitud de M, la denotarem com a 11034_m5_13.gif.
Utilitzant k com a llavor, situar pseudoaleatòriament 11034_m5_13.gif rajoles Ri no encavalcades sobre la imatge. La mida de les rajoles també està determinada per k. L'i-èsim bit de la marca codificada s'encastarà en els píxels de la i-èsima rajola.
2) Determinació de la modificació aplicable a cada píxel
A cada píxel de la imatge, se li associa un valor anomenat component visual i que denotarem com a Vi. Aquests valors es calculen basant-se en la idea que els píxels foscos i aquells que es troben en regions no homogènies de la imatge són als que es pot aplicar una modificació més gran amb l'impacte visual més petit.
En aquesta fase, s'utilitzen els paràmetres lb1 , ub1 , que prenen valors enters i que s'utilitzen per a afitar inferiorment i superiorment la variació del nivell de color dels píxels.
També s'utilitza dt, que correspon a un llindar a partir del qual els nivells de color inferiors a aquest es consideren foscos.
Suposant que cada nivell de color pot prendre un valor entre 0 i 255, una bona tria és dt = 70, lb1 = 2, ub1 = 11.
La manera de calcular Vi és la següent:
a) Per a cada píxel xi de la imatge es calcula la seva no-homogeneïtat amb nhi: = max 11034_m5_14.gif/2, per a tots els píxels xj que són veïns de xi sobre la imatge. nhi es pot veure com una mena de derivada discreta al píxel i. Observeu que nhi serà més gran en aquells píxels que tenen un nivell de color més diferent respecte als seus veïns. Això passa en regions no homogènies de la imatge.
Aleshores, s'afita el valor de nhi entre lb1 i ub1 fent la correcció següent:
  • Si nhi >ub1, aleshores, nhi :=ub1

  • Si nhi <lb1, aleshores,nhi :=lb1

b) Per a cada píxel xi de la imatge, es calcula la seva foscor amb di: = (dt-xi)*ub1 /dt si xi <dt i di: = 0, altrament. Un píxel es considera fosc si el seu nivell de color és inferior a dt. El valor di està entre 0 i ub1. Observeu que di val 0 per xi = dt i va augmentant linealment fins a ub1 a mesura que el nivell de color del píxel xi va disminuint.
c) Finalment, es calcula la component visual del píxel xi amb Vi: = max(nhi, di).
3) Encast de la marca
En aquesta fase s'utilitzen els paràmetres lb2 i ub2. Suposant que cada nivell de color pot prendre un valor entre 0 i 255, una bona tria és lb2 =10 i ub2 =13.
Es parteix de la marca codificada M que hem calculat en la fase 1.
a) Utilitzant k com a llavor, assignar pseudoaleatòriament a cada rajola Ri un valor ai entre lb2 iub2.
b) Per a inserir l'i-èsim bit mi de la marca M dintre de la rajola Ri:
  • Dividir el rang de nivells de color que pot prendre un píxel en subintervals de mida ai.

  • Etiquetar els subintervals consecutius alternativament com a 0 o 1.

  • Per a cada píxel xj que hi ha dintre de Ri:

    I) Si xj està dintre d'un subinterval etiquetat amb el valor mi, aleshores, acostar-lo al centre de l'interval incrementant-lo o disminuint-lo com a màxim Vj nivells de color.

    II) Si xj està dintre d'un subinterval etiquetat amb el valor 11034_m5_15.gifi, aleshores, acostar-lo al centre de l'interval veí més pròxim incrementant-lo o disminuint-lo com a màxim Vj nivells de color.

4.3.2.Algorisme de recuperació de marca
L'entitat que vol recuperar la marca d'una imatge ha de proporcionar els paràmetres lb2, ub2 i la clau secreta k . També ha de conèixer la longitud de la seqüència que es busca. Denotarem la imatge presumptament marcada de la qual volem recuperar la marca com a 11034_m5_06.gif = 11034_m5_06.gifi, 1 ≤ i ≤ n.
1) Determinar els píxels on està encastat cada bit.34
a) A partir de la longitud de la seqüència que es busca, calcular la seva longitud un cop codificada, és a dir 11034_m5_08.gif.
b) Utilitzant la clau k com a llavor i utilitzant el mateix algorisme que en l'encast de marca, situar 11034_m5_08.gif rajoles Ri no encavalcades amb la imatge. L'i-èsim bit de la marca codificada està encastat en els píxels de la i-èsima rajola.
2) Recuperar els diferents bits de la marca.
a) Per a recuperar l'i-èsim bit 11034_m5_12.gifi de 11034_m5_09.gif de la rajola Ri:
  • Dividir el rang de nivells de color que pot prendre un píxel en subintervals de mida ai.

  • Etiquetar els subintervals consecutius alternativament com a 0 o 1.

  • Inicialitzar dos comptadors uns:=0 i zeros:=0

  • Per cada píxel xj de Ri:

    I. Si xj està en un subinterval etiquetat com a 1, aleshores uns : = uns +1.

    II. Si xj està en un subinterval etiquetat com a 0, aleshores zeros : = zeros +1.

  • Si uns > zeros aleshores, ;

  • Si zeros > uns aleshores, 11034_m5_12.gifi : = 1.

Aquest primer pas s'aplica per a cadascuna de les rajoles en què hem dividit la imatge.
b) Finalment, descodifiquem 11034_m5_09.gif amb el mateix codi corrector d'errors utilitzat en l'algorisme de marcatge i obtenim la marca descodificada.
3) Comprovar que la marca és correcta.
Per a comprovar si una marca descodificada recuperada és correcta, cal que abans de ser encastada se li hagi afegit la redundància en forma de suma de comprovació o CRC. En aquest cas, solament cal comprovar que aquesta redundància sigui correcta.

Resum

Hi ha dues estratègies bàsiques de protecció anticòpia: impediment de la còpia i detecció de la còpia. L'experiència (CD, DVD, etc.) demostra que només la segona ofereix garanties reals i, en qualsevol cas, pot ser combinada amb la primera, si es desitja.
Les marques d'aigua són l'eina fonamental per a la detecció de la còpia, i consisteixen a encastar de manera imperceptible un cert missatge, anomenat marca, en el contingut multimèdia que cal protegir. Normalment, la marca encastada diu qui és el propietari del contingut protegit.
Les empremtes digitals són un cas particular de marca d'aigua en què la marca encastada és diferent per a cada còpia venuda del contingut i n'identifica el comprador.
Les propietats que ha de tenir un bon sistema de marca d'aigua són, entre d'altres, robustesa, capacitat, imperceptibilitat i mínim secret.
Un sistema d'empremta digital convé que sigui, a més, resistent a confabulacions i, almenys idealment, seria desitjable que fos asimètric (per a proporcionar proves de redistribució davant de tercers) i anònim (per a preservar l'anonimat del comprador). Actualment, no hi ha implementacions d'empremta digital asimètrica ni anònima.
Hem presentat dos estudis de casos consistents en sistemes de marca d'aigua per a la protecció d'imatges que treballen en el domini espacial. El primer és un sistema semicec que requereix la imatge original a més de la marcada per a poder recuperar la marca. La robustesa d'aquest sistema és molt alta. El segon estudi de cas és un sistema cec. Pel fet de ser cec, és molt més còmode que l'anterior a l'hora de protegir grans volums d'imatges, com seria el cas del vídeo (el recuperador de marques no necessita ni conèixer ni emmagatzemar el vídeo original).
Cap dels dos estudis de cas presentats no requereix que el recuperador de marca conegui a priori quina marca vol recuperar, per la qual cosa són utilitzables per a aplicacions d'empremta digital.

Activitats

1. Implementeu un sistema de marca d'aigua semàntica per a textos ASCII en català. Heu de definir parelles de sinònims per a paraules habituals (per exemple, llavors i aleshores). Quan trobeu una paraula al text que té un sinònim, per a encastar un bit 0, agafeu el primer sinònim de la parella i, per a encastar un bit 1, agafeu el segon sinònim. La clau secreta és, en aquest cas, la llista de parelles de sinònims que feu servir i la convenció de quina codifica un 1 i quina un 0.
2. Descarregueu el programa benchmark StirMark de www.cl.cam.ac.uk/~fapp2/watermarking/stirmark. Aquest programa efectua un seguit de manipulacions sobre les imatges. És un estàndard de facto per a comprovar la robustesa dels sistemes de marca d'aigua. Normalment es passen les manipulacions sobre una imatge marcada i es mira si encara és possible extreure la marca de les imatges manipulades que dóna StirMark. Proveu de passar-lo a una imatge, encara que no estigui marcada, per a veure la quantitat de modificacions que es poden fer sobre una imatge, la majoria imperceptibles a l'ull humà.
3. Visiteu la pàgina web de Digimarc (www.digimarc.com). Aquesta empresa ofereix un sistema cec de marca d'aigua els algorismes del qual no són públicament coneguts.

Exercicis d'autoavaluació

1. Suposeu que feu servir el sistema de marca d'aigua semicec explicat en el primer estudi de cas. Suposeu que enfosquim una imatge en blanc i negre marcada dividint el nivell de gris de tots els píxels per dos. Seria possible que l'algorisme de recuperació recuperés correctament la marca a partir de la imatge enfosquida?
2. Amb el sistema de marca d'aigua cec del segon estudi de cas, es recupera correctament la marca si la imatge marcada ha sofert una petita rotació (posem per cas de 2 graus)?
3. Poseu un exemple de confabulació amb èxit de dos compradors en un sistema d'empremta digital. Si el comprador c1 té la marca m1 enterrada al seu contingut i el comprador c2 hi té la marca m2, es diu que hi ha èxit si aconsegueixen un contingut en què la marca encastada és m3, tal que, després de passar-hi un codi corrector d'errors, m3 no descodifica ni com a m1 ni com a m2. Suposeu que es fa servir un codi corrector d'errors tal que corregeix exactament un error (és a dir, si m3 es diferencia en una posició de m1, m3 es descodifica com m1; el mateix amb m2). Suposem també que les marques mi tenen 8 bits i que s'aplica la suposició de marcatge.

Solucionari

Exercicis d'autoavaluació
1. La resposta és no. Amb gran probabilitat, 11034_m5_07.gifi = 11034_m5_09.gifi – xi (pas 4 de l'algorisme recuperació) donarà negatiu perquè el nivell de color enfosquit xi serà més petit que l'original xi. Per tant, el signe de les δi serà negatiu pràcticament per a tots els píxels; per tant, en tots els píxels on el signe hauria hagut de ser positiu (aproximadament el 50%), això portarà a una recuperació errònia dels bits encastats (pas 5 de l'algorisme de recuperació).
2. Mentre la major part dels píxels que hi havia a cada rajola abans de la rotació hi continuïn essent després de la rotació, es podrà extreure el bit de marca correcte a partir dels píxels de la rajola. Si la rotació és petita, la majoria de píxels continuaran a la seva rajola i la marca serà recuperada correctament.
3. Sigui m1 = 00000111, m2 = 11110000. Aleshores c1 i c2 comparen els seus continguts i veuen en quins fragments hi ha encastat cada bit de marca. Per a la suposició de marcatge, el 5è. bit no el podran canviar. Tot seguit, barregen els seus continguts de manera que les seves marques queden barrejades com a m3 = 00110011 (m3 "hereta" els bits 1, 2, 5, 7 i 8 de m1 i la resta de m2). Observem que m3 es diferencia en tres posicions de m1 i en quatre de m2, i, com que el codi corrector d'errors no pot corregir més d'un error, m3 no serà descodificat ni com a m1 ni com a m2.

Glossari

capacitat
Màxima quantitat de bits de marca que un sistema de marca d'aigua pot encastar en un volum de contingut prefixat.
confabulació
En un sistema d'empremta digital, posada en comú de les seves còpies per part de diversos compradors amb l'objectiu de fabricar una còpia de la qual no es pugui recuperar la marca de cap dels compradors confabulats.
detecció de còpia
Estratègia que, un cop feta una còpia fraudulenta, cerca d'establir la identitat de qui ha fet la còpia o bé d'acreditar la propietat intel·lectual del material copiat.
empremta anònima
Sistema d'empremta asimètrica en què el comprador preserva el seu anonimat durant el protocol d'encast. L'anonimat només es perd en cas que el comprador faci una redistribució fraudulenta.
empremta asimètrica
Sistema d'empremta digital en què el venedor no veu el contingut marcat en el moment d'encastar-hi la marca, de tal manera que només el pot conèixer com a resultat d'haver-ne detectat la redistribució.
empremta digital
Subclasse de tècniques de marques d'aigua en què la marca encastada és diferent per a cada còpia venuda i n'identifica el comprador.
impediment de còpia
Estratègia que intenta fer impossible la realització d'una còpia, normalment amb l'auxili del maquinari.
imperceptibilitat
Propietat d'un sistema de marca d'aigua de no alterar la qualitat perceptual dels continguts com a resultat d'encastar-hi la marca.
marca
Informació encastada en el contingut per una tècnica de marca d'aigua.
marca d'aigua
Tècnica de detecció de còpia basada a encastar de manera imperceptible certa informació de copyright en els continguts que cal protegir.
marca cega
Sistema de marca d'aigua que no requereix el contingut original per a la recuperació de la marca.
marca privada
Sistema de marca d'aigua que, per a recuperar la marca, requereix el contingut original i la marca que es vol recuperar.
marca semicega
Sistema de marca d'aigua que, per a recuperar la marca, o bé requereix el contingut original o bé la marca que es vol recuperar.
redistribució
Còpia no autoritzada per part d'un comprador legal i distribució d'aquesta a tercers.
robustesa
Propietat d'un sistema de marca d'aigua de ser capaç de recuperar correctament la marca a partir d'imatges marcades que han sofert manipulacions genèriques independents del sistema de marca d'aigua emprat.
tamper-proofness
Propietat d'un sistema de marca d'aigua de ser capaç de recuperar correctament la marca a partir d'imatges marcades que han sofert manipulacions dissenyades tenint en compte el funcionament dels algorismes d'encast i de recuperació.

Bibliografia

Cherry, S.M. (2001). "Making Music Pay". IEEE Spectrum. October 2001 (pàg. 41-46).
Katzenbeisser, S.; Petitcolas, F.A.P. (2000). Information Hiding: Techniques for Steganography and Digital Watermarking. Artech House.
Sebé, F.; Domingo-Ferrer, J. (2001). "Oblivious image watermarking robust against scaling and geometric distortion". Information Security, LNCS (2200, pàg. 420-432). Berlín.
Sebé, F.; Domingo-Ferrer, J.; Herrera, J. (2000). "Spatial-domain image watermarking robust against compression, filtering, cropping and scaling". Information Security, LNCS (1975, pàg. 44-53). Berlín.