xmlns:xi="http://www.w3.org/2003/XInclude" xmlns:qti="http://www.imsglobal.org/xsd/imsqti_v2p1" Tractament i publicació d'imatge i vídeo Tractament i publicació d'imatge i vídeo

Transformacions geomètriques

  • Sílvia Pujalte Piñán

PID_00239715
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars del copyright.

Introducció

En els mòduls "Histogrames i transformacions puntuals", "Transformacions espacials lineals" i "Transformacions espacials no lineals" hem estudiat transformacions puntuals i espacials (lineals i no lineals) aplicades a imatges. En totes aquestes imatges la transformació consisteix a modificar el nivell de gris (o el color, si és el cas) de cada píxel, sense modificar-ne la posició. En aquest mòdul estudiarem les transformacions geomètriques, que el que fan és modificar la posició dels píxels de la imatge original; dins d'aquestes transformacions s'inclouen la interpolació i la delmació, en les quals ens centrarem, i d'altres, com la translació o la rotació.
En el primer apartat introduirem el concepte de resolució d'una imatge, i estudiarem la relació que hi ha entre el nombre de píxels d'una imatge, la resolució i les dimensions físiques que té.
El segon apartat el dedicarem a descriure la primera de les transformacions geomètriques que tractarem en aquest mòdul, la interpolació, i les aplicacions que té. Aquest apartat ens servirà també com a base per al tercer, en què descriurem la segona transformació geomètrica, la delmació.
En el quart apartat descriurem molt breument altres transformacions geomètriques, com ara la rotació, el biaix i la perspectiva.
Els exemples i exercicis d'aquest mòdul es fan amb l'aplicació Photoshop i les imatges que es detallen en la taula resum al final del mòdul; també aquesta vegada recomanem seguir els exemples amb Photoshop a mesura que s'estudia.

Objectius

Els objectius principals d'aquest mòdul són els següents:
  1. Introduir el concepte de resolució.

  2. Introduir el concepte de dimensions físiques de la imatge.

  3. Relacionar les dimensions físiques i virtuals (en píxels) de la imatge.

  4. Introduir el concepte de transformació geomètrica.

  5. Introduir el concepte d'interpolació i els diferents mètodes per a fer-la.

  6. Introduir el concepte de delmació i els diferents mètodes per a fer-la.

  7. Relacionar, mitjançant experiments dirigits, els conceptes introduïts amb la transformació d'imatges.

Aquests objectius estan relacionats amb les competències de l'assignatura següents:
A. Capacitat de modificar una imatge digital basant-se en uns requisits previs.
B. Capacitat de canviar la resolució, relació d'aspecte i forma d'una imatge.
C. Capacitat de discriminar les opcions factibles de les que no ho són en un estudi d'especificacions d'un projecte, un sistema o una tasca.
D. Capacitat de visualitzar i imprimir imatges de manera eficaç i eficient.
I amb les competències generals del grau següents:
11. Capacitat de capturar, emmagatzemar i modificar informació d'àudio, imatge i vídeo digitals aplicant-hi principis i mètodes de realització i composició del llenguatge audiovisual.
23. Capacitat d'analitzar un problema en el nivell d'abstracció adequat a cada situació i aplicar les habilitats i els coneixements adquirits per a abordar-lo i resoldre'l.

1.Resolució i mida d'una imatge

Fins ara, quan ens hem referit a les dimensions de les imatges hem parlat únicament de píxels; hem vist en els exemples i exercicis imatges de 128 × 128 o 512 × 512, per exemple. Aquesta mesura és una mesura digital, que només té sentit en un entorn informàtic; pot dependre del tractament aplicat a imatges que ja existeixen, com les que fem servir en aquesta assignatura, o de l'instrument d'adquisició de la imatge, per exemple el sensor òptic CCD d'una càmera de fotos. De les dimensions en píxels d'una imatge depèn el pes d'emmagatzematge que tingui (1) .
Preguntem-nos ara quina és la mida física d'una imatge, quina superfície ocuparà quan l'imprimim. I la resposta és que, físicament, la imatge serà tan gran o tan petita com vulguem nosaltres; és una mesura relativa, que depèn d'un altre paràmetre que és la resolució. L'única mesura absoluta que tenim quan ens referim a imatges és la mesura en píxels.
La resolució indica el nombre de píxels que assignem per unitat de mesura, i s'expressa comunament en píxels per polzada (2) (ppi, Pixels per Inch, en les seves sigles en anglès) per influència del sistema mètric anglosaxó. La resolució ens dóna una idea de la definició de la imatge: si a cada polzada hi ha 300 píxels la imatge està més definida que si n'hi ha 72; com més alta és la resolució més definició hi ha. L'experiència i la tecnologia han determinat alguns valors típics de resolució segons l'aplicació de les imatges; així, per a visualitzar en pantalla se sol utilitzar 72ppi; per a una impressió estàndard, entre 300ppi i 600ppi, i per a negatius, entorn de 4.000ppi.
PPI i DPI
No hem de confondre la resolució digital d'una imatge, que s'expressa en píxels per polzada, pixels per inch (ppi), amb la resolució d'impressió d'una impressora, que s'expressa en punts per polzada, dots per inch (dpi). Per tant:
  • PPI: indica la resolució de la imatge digital i determina quines mides físiques tindrà quan l'imprimim.

  • DPI: indica la quantitat de punts de tinta per polzada que una impressora és capaç de plasmar. En general, a major DPI obtenim impressions més nítides i detallades. Convé subratllar que els DPI d'una impressora mai condicionaran amb les mides físiques que tindrà una imatge digital quan l'imprimim.

De vegades, també es fan servir les sigles PPP, però són una mica més confoses. Per norma general, indiquen punts per polzada (DPI), però també les podem trobar en textos com a sigles de píxels per polzada (PPI).
Coneguda la mida en píxels, quan fixem la resolució fixem també la mida física de la imatge, que és el quocient de tots dos valors:
mida (polzades) = mida (píxels) resolució (píxels/polzada) 4.1
Exemple
La imatge de la figura 1 té unes dimensions de 256 × 256 píxels; la resolució que veiem amb l'eina de Photoshop Image/Size quan obrim el fitxer és de 72 píxels/polzada. Amb aquestes dades, les dimensions de la imatge entesa com a document són 3,56 × 3,56 in, o el que és el mateix, 9,03 × 9,03 cm, com ens mostra la figura 1a. Si augmentem la resolució a 300 píxels/polzada la mida del document es redueix i passa a ser de 0,85 × 0,85, és a dir, 2,17 × 2,17 cm, i es redueix en la mateixa proporció en què augmenta la resolució (figura 1b).
Figura 1. a) Dimensions de la imatge per defecte b) Dimensions quan es canvia la resolució
Figura 1. a) Dimensions de la imatge per defecte b) Dimensions quan es canvia la resolució
Fixem-nos que les dimensions en píxels no han variat, i tampoc no ho ha fet el pes del fitxer, 64 kB. La imatge digital és exactament la mateixa en tots dos casos però quan la imprimim trobarem que les mides físiques són diferents. Si seguiu l'exemple amb Photoshop, podeu provar de guardar la imatge amb les dues resolucions i imprimir-les; comprovareu que, efectivament, la mida ha canviat, en la proporció que es mostra en la figura 2.
Figura 2. Imatge de la figura 1 amb a) resolució de 72 píxels/polzada i b) resolució de 300 píxels/polzada
Figura 2. Imatge de la figura 1 amb a) resolució de 72 píxels/polzada i b) resolució de 300 píxels/polzada
Com hem vist, fixant la resolució determinem la mida de la imatge; lògicament, el mateix succeeix al contrari: si fixem la mida física de la imatge la resolució també queda determinada (desactivant en Photoshop el remostratge de la imatge). En la figura 3 veiem la mateixa imatge que en la figura 1, només que ara volem que un cop impresa la imatge faci 12 × 12 cm. Quan modifiquem aquest valor en el menú de l'eina Image Size la resolució es redueix en la mateixa proporció que ha augmentat la mida física. Un cop més comprovem que la mida de la imatge en píxels no varia, i la imatge digital continua essent la mateixa.
Figura 3. Imatge de la figura 1, fixant-ne la mida d'impressió
Figura 3. Imatge de la figura 1, fixant-ne la mida d'impressió
I, és clar, conegudes la mida física de la imatge i la resolució, queda fixada la mida en píxels de la imatge. Un exemple típic d'aquest cas és l'adquisició d'una imatge amb un escàner: la mida física és la del document que escanegem i la resolució la triem nosaltres entre les opcions que ens dóna l'aparell.
Si anem reduint la resolució per tal de fer la impressió de la imatge més gran la qualitat percebuda se'n ressent, va perdent definició i els píxels es distingeixen clarament; portant-ho al límit, si abaixem la resolució fins a 1 píxel/polzada cada píxel es veurà com un quadrat d'1 polzada de costat.
Quan augmentem la resolució, podem veure la imatge més de prop amb la mateixa percepció de qualitat. En canvi, si reduïm la resolució, per a mantenir la mateixa percepció de qualitat ens n'hem d'allunyar ja que la mida del píxel és més gran. Això passa, per exemple, a l'hora d'imprimir cartells que no es veuran de prop.
Per a canviar la mida en píxels d'una imatge el que fem és, com veurem en els apartats següents d'aquest mòdul, aplicar-hi una transformació geomètrica, una interpolació si volem augmentar la mida o una delmació si volem disminuir-la.

1.1.Exercicis

Exercici 1
Partint d'una imatge amb unes dimensions en píxels de 800 × 600 i una resolució de 72ppi, respon les següents preguntes:
a) Si canviem la resolució de la imatge a 300ppi, sense modificar les seves dimensions en píxels, quina de les dues imatges es veuria més gran en el monitor de l'ordinador, l'original o la modificada?
b) Quines serien les mides en centímetres d'aquestes imatges en imprimir-les en una impressora amb una resolució de 100dpi?
c) Canviarien les seves mides en imprimir-les en una impressora amb una resolució de 300dpi? Hi hauria diferències?
Solució
a) Com hem vist, els píxels per polzada (ppi) d'una imatge ens indiquen quines seran les seves mides físiques en imprimir-la. Després de fer aquest canvi, la imatge continuarà tenint les mateixes dimensions en píxels i, per tant, la imatge modificada es veurà igual que l'original en el monitor de l'ordinador.
b) La resolució d'impressió d'una impressora només afecta la nitidesa i precisió dels detalls de la imatge impresa, però mai les seves mides. Per tant, aquest valor de 144dpi no és necessari per calcular quines serien les seves mides.
Les seves mides serien:
800 (píxels) / 72 (píxels per polzada) ≈ 11,11 polzades ≈ 28,22 cm
600 (píxels) / 72 (píxels per polzada) ≈ 8,33 polzades ≈ 21,17 cm
c) Com queda explicat, els punts per polzada d'una impressora no afecten les mides físiques de la imatge impresa.
En imprimir a 100dpi, la impressora farà servir (100dpi × 100dpi) / (72ppi × 72ppi) ≈ 1,92 punts de tinta per a cada píxel de la imatge. En canvi, a 300dpi, els punts de tinta que utilitzarà per a cada píxel són (300dpi × 300dpi) / (72ppi × 72ppi) ≈ 17,36, donant una imatge de les mateixes mides, però més nítida i amb detalls més precisos.
Exercici 2
Si escanegem un full DIN A4 amb una resolució de 300ppi, quina és la mida de la imatge en píxels? Quina és la mida de la imatge en mil·límetres?
Solució
Un full DIN A4 té unes dimensions de 210 × 297 mm, que en polzades és 8,268 × 11,693. Si la resolució és de 300ppi, les dimensions en píxels són les següents:
  • 8,268 polzades × 300 píxels/polzada = 2.480 píxels;

  • 11,693 polzades × 300 píxels/polzada = 3.508 píxels.

La imatge en mil·límetres té les mateixes dimensions que el full que escanegem. Si teniu un escàner podeu comprovar aquests valors.
Exercici 3
Si a la imatge escanejada en l'exercici 1 hi canviem la resolució a 600ppi. Quina és la mida de la imatge nova en píxels? I en mil·límetres?
Solució
Si augmentem la resolució al doble, les dimensions en mil·límetres es redueixen a la meitat, 105 × 148 mm, és a dir, l'A4 es converteix en A6.
Exercici 4
Volem imprimir la imatge escanejada en l'exercici 1 en format A3. Com hem de canviar la resolució de la imatge?
Solució
Les dimensions físiques d'una imatge en format A3 són 210 mm · 2 = 297 mm i 297 mm · 2 = 420 mm . Perquè les dues dimensions quedin multiplicades per 2 , hem de reduir la resolució amb el mateix factor; llavors la resolució nova és 300 píxels / polzada 2 = 212 píxels / polzada .

2.Interpolació

Les transformacions geomètriques modifiquen les relacions espacials entre els píxels sense modificar-ne el nivell; la imatge transformada conté els píxels de la imatge original amb el mateix nivell de gris, però en posicions diferents de les que hi ocupaven. Són transformacions geomètriques, per exemple, la interpolació, que augmenta el nombre de píxels d'una imatge, la delmació, que el redueix, o la rotació, que gira la imatge un determinat angle. Podem interpretar aquest tipus de transformació com un canvi del punt d'observació de la imatge; per exemple, si augmentem la imatge és com si ens hi acostéssim, i si la reduïm és com si ens n'allunyéssim.
En general, les transformacions geomètriques es poden estudiar en dues etapes:
  • La primera, la determinació de les coordenades noves de cada píxel segons el tipus de transformació. Així com descrivíem les transformacions puntuals amb una corba o les espacials amb una màscara o un element estructural, les relacions matemàtiques que defineixen les posicions noves en les transformacions geomètriques són complexes i el que es fa habitualment, i farem també nosaltres, és descriure-les gràficament.

  • La segona, el càlcul del valor d'intensitat dels píxels nous en la imatge transformada. Aquest valor es calcula a partir de la imatge original i els mètodes emprats són comuns a tots els tipus de transformació; en aquest mòdul en descriurem alguns.

La interpolació és la primera de les transformacions geomètriques que veurem.
La interpolació augmenta el nombre de píxels de la imatge original alhora que en manté la informació; l'objectiu és que la imatge transformada representi el mateix que la imatge original.
En la interpolació, la primera etapa de les descrites més amunt consisteix a fer la imatge més gran, desplaçant files i columnes i deixant espai entre les unes i les altres per a afegir-hi píxels nous; la segona consisteix a trobar els valors de gris dels píxels nous que s'adaptin més bé a la imatge original.

2.1.Posició dels píxels en la imatge interpolada

Descriurem la primera etapa gràficament amb un exemple: transformarem una imatge de 4 × 4 píxels en una de 8 × 8 píxels. En la imatge original (figura 4a), cada punt representa un píxel d'un valor de gris concret. Per a visualitzar millor la interpolació hi posem a sobre una graella imaginària els punts d'encreuament de la qual són les localitzacions dels píxels.
El desplaçament de files i columnes el fem en dos passos: primer (figura 4b) dupliquem el nombre de columnes i separem els píxels de la imatge original deixant espai per a afegir-ne un de nou entre cada dos; a continuació dupliquem el nombre de files, igualment deixant espai per a afegir-hi píxels entre mig (figura 4c). La graella sobre la imatge transformada té ara espai per a 64 píxels, els 16 originals més els que hi hem afegit.
Figura 4. Interpolació en factor 2, vertical i horitzontal
Figura 4. Interpolació en factor 2, vertical i horitzontal
La relació entre el nombre de files i columnes després i abans de la interpolació es coneix com a factor d'interpolació.
L'exemple l'hem fet amb un factor d'interpolació 2, perquè dupliquem el nombre de files i de columnes; si tripliquéssim el nombre de files i de columnes seria un factor d'interpolació 3, i així successivament. Òbviament, el factor d'interpolació pot ser també no enter i també pot ser diferent en les dues dimensions, tot i que en aquest cas distorsionem la imatge perquè no mantenim les proporcions.
Un cop definida la posició dels píxels nous queda per resoldre quina ha de ser la intensitat d'aquests píxels; el valor que tenen el calculem a partir dels píxels que ja existeixen seguint diferents mètodes, alguns dels quals veurem a continuació. Cal tenir en compte que, independentment del mètode que fem servir, una interpolació no millora la qualitat de la imatge original perquè la informació "nova" l'obtenim a partir de l'"antiga", de la informació coneguda (no hi afegim res). Al contrari, veurem que, depenent del factor d'interpolació i les característiques de la imatge, la interpolació introdueix distorsió visible.

2.2.Interpolació: mètode del veí més proper

El primer mètode d'interpolació consisteix a donar a cada píxel nou de la imatge transformada el mateix nivell de gris que el píxel que té més proper. Tant computacionalment com conceptualment és un mètode molt senzill; només s'hi involucra un píxel.
La figura 5 mostra el resultat d'aquesta interpolació per a la imatge que il·lustrava la interpolació en la figura 4. Els punts d'encreuament buits de la quadrícula en la figura 4c) s'han omplert amb píxels el valor dels quals és el mateix que el píxel original més proper. La regió ombrejada de la figura mostra el píxel a la posició (0,0) i les tres rèpliques que té; per a la resta de píxels el procediment és el mateix.
Figura 5. Interpolació: mètode del veí més proper per a la figura 4
Figura 5. Interpolació: mètode del veí més proper per a la figura 4
Estudiem-ne la validesa sobre una imatge concreta. La figura 6a) mostra la imatge original (de dimensions 256 × 256), que interpolem amb un factor 4; la imatge interpolada té, per tant, dimensions 1.024 × 1.024.
Figura 6. Interpolació: mètode del veí més proper
Figura 6. Interpolació: mètode del veí més proper
Com hi observem, la interpolació per veí més proper distorsiona els contorns dels objectes de la imatge, i produeix l'efecte conegut com a mosaic o pixelat; la percepció que tenim és que ara els píxels són prou grans per a distingir-los. L'efecte és més evident a les zones on hi ha variacions fortes de nivell; per exemple, en la imatge, els ulls del lleopard.

2.3.Interpolació bilineal

La interpolació bilineal pren com a referència per a calcular el nivell de gris d'un píxel nou els valors dels quatre veïns més propers que té.
En el nostre cas l'ús de la interpolació bilineal equival a calcular la intensitat del píxel nou com a mitjana aritmètica de les quatre intensitats (3) . Amb aquest mètode no es produeixen transicions brusques com amb l'anterior, perquè la mitjana les suavitza; recordem que, quan en el mòdul "Transformacions espacials lineals" descrivíem les màscares de suavització, vèiem que el que feien era mitjanar els píxels de la regió de treball. Tal com vèiem també en el mateix mòdul, podem mirar de contrarestar aquest efecte aplicant una màscara de realçament per a definir els contorns que hem perdut.
La figura 7 mostra el resultat d'interpolar amb interpolació bilineal la imatge de la figura 4. Si ens fixem en la regió ombrejada, veiem que el nivell de gris dels píxels nous situats a les vores es calcula com a mitjana aritmètica dels dos veïns que té a la mateixa fila o columna (per exemple, el píxel a la posició (0,1) té nivell 30, mitjana dels nivells dels píxels (0,0) i (0,2), 20 i 40, respectivament. El nivell dels píxels a l'interior de la imatge es calcula mitjanant el valor de gris dels quatre píxels més propers; a la regió ombrejada, el píxel a la posició (1,1) té valor de gris 35, resultat de mitjanar el nivell dels píxels a les posicions (0,0), (0,2), (2,0) i (2,2), 20, 40, 40 i 40, respectivament.
Figura 7. Interpolació bilineal
Figura 7. Interpolació bilineal
La figura 8 mostra el mateix fragment de la mateixa imatge de la figura 6 interpolada amb interpolació bilineal, amb un factor 4 també. Ja no hi ha l'efecte de pixelat que vèiem en la imatge interpolada per veí més pròxim, però els contorns estan lleugerament desenfocats.
Figura 8. Interpolació bilineal
Figura 8. Interpolació bilineal

2.4.Interpolació bicúbica

La interpolació bicúbica millora els resultats de la interpolació bilineal, aconsegueix més precisió i l'efecte de desenfocament és menys evident. Per a calcular el nivell de gris de cada píxel nou fa servir veïnatges de 16 píxels, i dóna més importància als quatre veïns més propers.
La figura 9 mostra, per a la mateixa imatge dels dos exemples anteriors, el resultat d'interpolar amb una interpolació bicúbica. Com avançàvem, els contorns estan més definits que amb la interpolació bilineal.
Figura 9. Interpolació bicúbica
Figura 9. Interpolació bicúbica
L'elecció del mètode d'interpolació depèn sobretot de l'eficiència de l'ordinador que fem servir i de les característiques de la imatge; entre els mètodes d'interpolació disponibles actualment la interpolació bicúbica és la que aconsegueix un compromís millor entre temps de càlcul i qualitat, motiu pel qual és molt utilitzada.
En tot cas hem de ser conscients que, com avançàvem al començament de l'apartat, la interpolació no millora mai la imatge original; si és possible sempre és millor adquirir directament la imatge amb la mida de la imatge interpolada que interpolar una imatge més petita.

2.5.Aplicacions de la interpolació. Zoom

En l'apartat 1 estudiàvem la relació entre la mida física, mida en píxels i resolució d'una imatge, i vèiem que, donada una imatge amb unes certes dimensions en píxels, augmentar-ne la mida física implica reduir-ne la resolució, de manera que es perd qualitat en la visualització.
L'aplicació més immediata de la interpolació és augmentar el nombre de píxels per a augmentar les dimensions físiques de la imatge i mantenir-ne la resolució. Com hem vist amb la imatge que hem fet servir com a exemple, la interpolació no resol el problema definitivament, perquè també té limitacions, però permet augmentar les mides físiques més del que ho podem fer sense interpolar.
L'altra aplicació de la interpolació és el zoom, l'acostament a la imatge. Tots hem experimentat aquest efecte amb Photoshop, per exemple, quan ampliem la imatge per observar-ne un detall, o amb la càmera de fotos digital. En aquest segon cas no hem de confondre el que s'anomena zoom òptic amb el zoom digital; el zoom òptic és un zoom real, que s'aconsegueix movent les lents per a modificar la distància focal abans de copsar la imatge, mentre que el zoom digital és una interpolació (seguint algun dels mètodes vistos anteriorment, per exemple) que es fa un cop la imatge ja ha estat copsada. Per tant, tot i que totes dues imatges tenen la mateixa mida en píxels, el zoom òptic obté una imatge de més qualitat que el digital.

2.6.Exercicis d'interpolació

Exercici 1
Farem servir la imatge nat2.pgm per a comprovar en dues etapes el procés d'interpolació d'una imatge. En primer lloc, canvieu l'amplada de la imatge a 512 píxels i manteniu l'alçària a 256. En segon lloc, en la imatge nova, canvieu l'alçària a 512. Repetiu el procés doblant primer l'alçària i a continuació l'amplada. Finalment, modifiqueu en la imatge original tant l'alçària com l'amplada a 512. Quines conclusions en traieu?
En aquest exercici és indiferent quin mètode d'interpolació fem servir perquè ens fixem només en la posició dels píxels.
Solució
Quan doblem l'amplada de la imatge obtenim una imatge distorsionada. La distorsió es corregeix quan doblem a continuació l'alçària, de manera que la imatge torna a tenir les proporcions d'origen; l'hem interpolat amb un factor d'interpolació 2. Si comencem per doblar l'amplada la imatge també es distorsiona, però els resultats quan doblem l'alçària són, com esperàvem, els mateixos que en el primer cas i els mateixos que si doblem directament les dues dimensions (4) .
Exercici 2
Obriu la imatge clock.pgm i apliqueu-hi una interpolació amb factor 1,5 i mètode d'interpolació del veí més proper. Descriviu la qualitat de la imatge transformada als diferents objectes de la imatge (marc de fotos, rellotge i llibre) i al fons i la superfície sobre la qual són.
Solució
Al marc de fotos es veu clarament un efecte de pixelat. Al rellotge aquest efecte s'aprecia sobretot a l'esfera i als contorns. Al llibre és més present també als contorns. El fons i la superfície pràcticament no es veuen pixelats; només el reflex del marc de fotografies. En definitiva, comprovem que les regions de les imatges on els nivells de grisos són més uniformes són menys sensibles als errors provocats pel duplicat dels píxels, i que com més variacions de nivell hi ha i més pròximes són, més pixelat hi ha.
Exercici 3
Continuem amb la imatge clock.pgm; en aquest exercici la interpolem amb el mateix factor que l'anterior però fem servir interpolació bilineal. Descriviu la qualitat de la imatge resultant i compareu-la amb la de la imatge interpolada en l'exercici 2.
Solució
Si la comparem amb la imatge obtinguda amb la interpolació en l'exercici 2 el resultat és molt millor, perquè no hi ha pixelat, que és un defecte molt evident. En general, els contorns dels objectes es veuen borrosos; han perdut nitidesa respecte a la imatge original.
Exercici 4
Interpolem ara la imatge clock.pgm amb un factor d'interpolació 2 i interpolació bicúbica; compareu els resultats amb els de l'exercici 3.
Solució
La imatge interpolada és més nítida que en l'exercici anterior; la diferència és prou apreciable per a considerar-la una millora respecte al cas bilineal.
Exercici 5
Finalment, torneu a interpolar la imatge clock.pgm amb els tres mètodes d'interpolació utilitzats en els exercicis anteriors i un factor d'interpolació d'1,2 i compareu els resultats amb els obtinguts amb factor d'interpolació 2.
Solució
Ara la mida de la imatge interpolada és més petita, i s'hi aprecia menys la distorsió introduïda per la interpolació. En el cas de la interpolació per veí més pròxim s'aprecia lleugerament el pixelat, però en les dues imatges interpolades amb interpolació bilineal i bicúbica les diferències són pràcticament indistingibles.
Exercici 6
Volem imprimir la imatge wood.pgm amb una amplada de 10 cm (i l'alçària necessària per a no deformar-la), i ens recomanen una resolució de 200 píxels/polzada. Expliqueu com modificaríeu les dimensions de la imatge per a obtenir la impressió desitjada. Quines són les dimensions finals en píxels? Quin mètode d'interpolació trieu?
Solució
La imatge wood.pgm té unes dimensions, en píxels, de 512 × 768. Amb la resolució desitjada, 200 píxels/polzada, la amplada que té és de 6,5 cm (5) . Com que ens cal que sigui de 10 cm, interpolem la imatge per tenir més píxels; fixem l'amplada demanada i la mida en píxels resultant és de 787 × 1.181. Pel que fa al mètode d'interpolació, descartem el veí més pròxim perquè pixela la imatge; entre el bilineal i el bicúbic aquest darrer presenta una imatge lleugerament més nítida.
Exercici 7
Amb l'eina Zoom In de Photoshop apliqueu un zoom del 250% a la imatge clock.pgm. Amb quina de les interpolacions fetes en els exercicis anteriors relacioneu el resultat?
Solució
La imatge que resulta quan fem el zoom és idèntica a la que obtenim aplicant una interpolació amb el mètode del veí més proper; quan fem un zoom sobre la imatge el que fem és aquesta mateixa interpolació, només a efecte de visualització; la imatge que ampliem no es modifica.

3.Delmació

La descripció de la interpolació ens facilita la de la segona transformació geomètrica que estudiarem, la delmació, ja que es tracta d'operacions complementàries.
La interpolació augmenta la mida en píxels d'una imatge i la delmació la redueix, en tots dos casos amb l'objectiu que la imatge transformada representi el mateix que l'original.
Començarem amb l'exemple més senzill de delmació, la delmació sense interpolar. El primer pas de la transformació, la definició de les posicions noves dels píxels, el veurem gràficament fent servir la mateixa imatge de la figura 1, reproduïda en la figura 10a). L'objectiu és transformar la imatge de 4 × 4 píxels en una imatge de 2 × 2 píxels (és a dir, treballem amb un factor de delmació 2) i ho fem en dos passos: el primer suprimeix una columna de píxels de cada dues (els píxels amb contorn discontinu en la figura 10b); el segon suprimeix una fila de cada dues (els píxels amb contorn discontinu en la figura 10c). El resultat el tenim en la figura 10d), la imatge transformada té dimensions 2 × 2.
Figura 10. Delmació en factor 2
Figura 10. Delmació en factor 2
Pel que fa al valor d'intensitat de gris dels píxels de la imatge nova, en principi ja està definit perquè tots els píxels de la imatge transformada existien en la imatge original, és a dir, no cal aplicar-hi cap modificació addicional. És important remarcar que la delmació implica necessàriament una pèrdua d'informació respecte a la imatge original; si ens fixem en la imatge de l'exemple, l'original tenia píxels de quatre nivells de gris diferents i la transformada només en té dos. Els píxels que eliminem són irrecuperables; si volem tornar a ampliar la imatge que hem delmat l'hem d'interpolar, amb les conseqüències pel que fa a la qualitat que hem discutit anteriorment.
La figura 11a) mostra una imatge de 256 × 256 píxels delmada amb un factor de delmació 2 i fent servir l'opció de veí més proper de Photoshop, que equival a la delmació sense interpolar (figura 11b):
Figura 11. Delmació sense interpolar
Figura 11. Delmació sense interpolar
Com passava amb la interpolació, les regions més sensibles a la delmació són les que en la imatge original presenten forts contrastos de nivell de gris. En aquest cas, l'efecte no desitjat és un realçament dels contorns, ja que com que se suprimeixen píxels els contorns que eren més suaus passen a ser més abruptes. Si apreciem aquesta distorsió podem optar per aplicar posteriorment a la delmació una màscara de suavització, o fer servir una interpolació bilineal o bicúbica, que, com hem vist, suavitzen també la imatge.
La figura 12 mostra el resultat de delmar la imatge original de la figura 11 amb interpolació per veí proper (figura 12a), interpolació bilineal (figura 12b) i interpolació bicúbica (figura 12c). Al full imprés és difícil apreciar la diferència entre totes tres; a la pantalla es veu una lleugeríssima millora en els contorns en els casos b) i c). L'eina Image Apply de Photoshop ens permet restar dues imatges i observar la diferència que hi ha entre l'una i l'altra; si la fem servir amb les imatges de la figura 12 podem estudiar amb més precisió les diferències que a un primer cop d'ull és més difícil de veure:
Figura 12. Delmació. a) Sense interpolar (veí més proper) b) Amb interpolació bilineal c) Amb interpolació bicúbica
Figura 12. Delmació. a) Sense interpolar (veí més proper) b) Amb interpolació bilineal c) Amb interpolació bicúbica
Depenent de les característiques de la imatge i del factor de delmació es pot donar el cas que la imatge delmada no representi el mateix que l'original; s'hi produeix una distorsió greu, coneguda com a aliàsing. Una manera d'evitar aquesta distorsió és interpolar els nivells de gris a la delmació.
Veiem un exemple d'aquesta situació en la figura 13. Per raons d'espai incloem només un fragment de la imatge original, que té unes dimensions en píxels de 512 × 512, en la figura 13a). Si la delmem i no interpolem els nivells de gris (és a dir, fem servir el mètode del veí més proper), els resultats són els que es mostren en la figura 13b); les files i columnes de píxels que hem eliminat amb la delmació coincidien amb les línies negres de la imatge, de manera que en la imatge delmada han desaparegut:
Figura 13. Distorsió deguda a la delmació
Figura 13. Distorsió deguda a la delmació
Si fem servir una interpolació, sia bilineal o bicúbica, la informació de la imatge no es perd; ho veiem en la figura 14, on hem fet servir interpolació bilineal:
Figura 14. Distorsió corregida amb una interpolació bilineal
Figura 14. Distorsió corregida amb una interpolació bilineal

3.1.Exercicis de delmació

Exercici 1
Delmeu amb un factor de delmació 2 la imatge 97b.pgm, primer sense interpolar i després interpolant amb interpolació bilineal i bicúbica. Compareu la qualitat percebuda en tots els casos. Un cop comparades per observació les tres imatges, compareu-les objectivament fent la resta entre la imatge sense interpolar i les interpolades, i comenteu si coincideixen els criteris en el cas objectiu i el subjectiu.
Solució
A primera vista no s'aprecien diferències entre la imatge delmada sense interpolar i les imatges delmades interpolant. En canvi, quan fem la mesura objectiva, la resta entre la imatge sense interpolar i les interpolades (amb l'eina Apply Image), trobem que hi ha diferències als contorns, molt poc marcades.
Exercici 2
Delmeu la imatge peppers.pgm amb un factor de delmació 1,5. Quina és la mida en píxels de la imatge transformada? A continuació interpoleu-la amb el factor necessari perquè tingui les mateixes dimensions que la imatge original, i compareu aquesta imatge amb la transformada. Feu diverses proves amb diferents mètodes d'interpolació dels nivells de gris.
Solució
Si delmem amb un factor 1,5, la imatge transformada té unes dimensions en píxels de 341 × 341; per a recuperar les dimensions de la imatge original hem d'interpolar també amb un factor 1,5. Amb qualsevol mètode d'interpolació que fem servir, en la imatge doblement transformada s'aprecien diferències respecte a l'original, que van des del pixelat si fem servir interpolació per veí més proper en totes dues transformacions fins a un lleuger desenfocament si fem servir interpolació bicúbica també en tots dos casos.
Exercici 3
Hem vist que, en determinats casos, la delmació pot comportar que la imatge transformada no representi el mateix que l'original; en aquest exercici aplicarem els nostres coneixements sobre transformacions lineals per a prevenir aquesta distorsió.
Obriu la imatge ruler.512.pgm i apliqueu-hi una màscara de suavitzat. A continuació, delmeu la imatge amb un factor 2, sense interpolar els nivells de gris (és a dir, fent servir l'opció de veí més proper). S'ha distorsionat, la imatge? Com raonaríeu el perquè?
Solució
Apliquem, per exemple, una màscara amb tots els coeficients a 1, la màscara h1 del mòdul "Transformacions espacials lineals"; quan la delmem, veiem que la imatge representa la mateixa quadrícula que l'original. El que ha succeït és que el filtratge ha suavitzat els contorns, que ara són més "amples" i la delmació no n'elimina tota la informació; la que queda és suficient per a representar la imatge original.
Exercici 4
La imatge 128x128bn.tif està formada per píxels blancs i negres alternats com en un tauler d'escacs. La delmem amb un factor 2 amb diferents mètodes d'interpolació per estudiar-ne els resultats. En primer lloc, delmeu-la amb interpolació bilineal o bicúbica; quina és la imatge resultant, i per què? En segon lloc, delmeu-la sense interpolar (mètode del veí més proper), i comenteu els resultats. Finalment, roteu la imatge 90 graus (o també podeu fer Flip Canvas horizontal) i repetiu la delmació sense interpolar; què ha passat?
Solució
Quan delmem amb interpolació bilineal o bicúbica obtenim una imatge gris, amb nivell 128 (feu servir l'histograma per a comprovar-ho), és a dir, el nivell de mitjana entre el blanc i el negre. Quan delmem sense interpolar, la imatge delmada és negra; de cada dues files (i columnes) se n'elimina una, i en aquest cas s'eliminen totes les blanques. Ens trobem amb un cas similar al de la figura 13. En el tercer cas, la imatge rotada comença per un píxel blanc, i s'eliminen tots els negres, de manera que la imatge delmada és blanca.

4.Altres transformacions geomètriques

En l'apartat 2 descrivíem les transformacions geomètriques com una família de transformacions que podíem estudiar en dos passos, i il·lustràvem el primer pas situant una graella imaginària sobre la imatge original, les interseccions de la qual coincidien amb la posició dels píxels. La transformació, com vèiem en la figura 4, consistia en el cas de la interpolació a afegir files i columnes a les que ja existien, mentre que en el cas de la delmació (figura 10) consistia a eliminar files i columnes.
La graella que ens serveix de referència es pot transformar d'altres maneres; per exemple, rodant-la. Com es pot veure en la figura 15, on rodem la graella 45º en sentit horari, la posició dels píxels nous no coincideix amb la que tenien en la imatge original. Aquesta transformació, i d'altres que veurem amb aquest apartat, presenta una complexitat més alta que la interpolació i la delmació ja que el càlcul de la posició nova dels píxels no és immediat. Per aquest motiu ens limitarem a presentar-les de manera descriptiva, aprofitant les eines de Photoshop que les implementen. Pel que fa al segon pas en l'estudi de les transformacions geomètriques, la interpolació del nivell de gris dels píxels, els mètodes que es fan servir són els mateixos que hem estudiat prèviament, de manera que no ho tornarem a tractar en aquest apartat.
Figura 15. Rotació
Figura 15. Rotació

4.1.Rotació

La rotació fixa un punt d'origen entorn del qual gira la imatge un cert nombre de graus.
Veurem un exemple de rotació amb la imatge leopard.pgm, que rodem amb l'eina Edit/Transform/Rotate (6) ; en aquest cas (figura 16) rodem entorn del centre de la imatge, i 30º en sentit horari. En la figura s'aprecia la barra d'eines de la transformació on hem introduït aquestes dades. La imatge rodada té el mateix aspecte que l'original excepte pel gir (salvant les inexactituds introduïdes per la interpolació dels nivells de gris), és a dir, no hem introduït canvis en la informació. Podem fer servir aquesta transformació, per exemple, per a posar dreta una fotografia que ens ha quedat una mica inclinada.
Figura 16. Rotació
Figura 16. Rotació

4.2.Biaix

Si en lloc d'aplicar la mateixa rotació a tota la imatge apliquem un angle diferent a la dimensió vertical i a l'horitzontal el que obtenim és una imatge esbiaixada.
Ho veiem en la figura 17, on hem aplicat un angle de -30º a la dimensió horitzontal sense modificar l'horitzontal, i amb el punt de rotació al centre de la imatge. Amb aquesta rotació la imatge transformada es distorsiona; el motiu continua essent el mateix que en la imatge original però les proporcions que té han canviat:
Figura 17. Biaix
Figura 17. Biaix

4.3.Perspectiva

La transformació de perspectiva deixa un costat de la imatge fix i fa el costat oposat més petit, de manera que queda més "allunyat"; això proporciona un efecte de profunditat i canvia la perspectiva des de la qual observem la imatge.
La figura 18 mostra una transformació de perspectiva aplicada a la fotografia del lleopard; hem aplicat una modificació de 6º a l'eix vertical. La imatge que abans "observàvem" de cara ara l'"observem" des d'un costat; hem modificat la perspectiva. Aquesta transformació la podem fer servir, per exemple, per a corregir la distorsió que introdueix la lent als extrems d'una imatge quan fem una fotografia:
Figura 18. Perspectiva
Figura 18. Perspectiva
Totes aquestes transformacions es poden aplicar successivament a una imatge que ja ha estat transformada, i es poden fer servir tant per a millorar la imatge retocant-la lleugerament com per a crear efectes artístics, de manera que les combinacions i els resultats possibles són molt amplis.

4.4.Exercicis

Perquè les imatges no ens quedin retallades per les diverses transformacions (7) que hi fem, en podem modificar les dimensions (eina Image/Canvas Size de Photoshop) i fer-les de 512 × 512; un cop modificada la imatge es pot tornar a reduir.
Exercici 1
En la imatge plane.pgm volem modificar la posició de l'avioneta, de manera que les ales posteriors quedin en paral·lel amb la vora inferior de la imatge. Quina transformació hi podem aplicar, i amb quins paràmetres?
Solució
Hi podem aplicar una rotació, amb un angle de -27º aproximadament, és a dir, girem la imatge en sentit antihorari.
Exercici 2
Repetiu l'exercici anterior, però fent servir la transformació biaix. Com hem d'aplicar-la per a obtenir els mateixos resultats que hem obtingut?
Solució
Si fem servir la transformació biaix hem de rodar tots dos eixos de la imatge per separat; perquè tota la imatge rodi el mateix angle, fixem l'angle de rotació horitzontal en 27º i el vertical en -27º.
Exercici 3
Volem modificar la imatge barche.pgm per a veure la popa del vaixell des d'una posició més frontal. Quina transformació hi podem aplicar i amb quins paràmetres?
Solució
Hi hem d'aplicar una transformació de perspectiva, amb un angle en la dimensió vertical de -7º, per exemple, i així veiem la popa més frontalment.

Resum

Les dimensions d'una imatge digital s'expressen en píxels. Quan volem convertir una imatge digital en una imatge física (per exemple, imprimint-la) expressem les dimensions de la imatge en unitats de longitud.
La resolució indica la quantitat de píxels per unitat de longitud, i s'expressa habitualment en píxels per polzada. Una imatge digital no té una resolució pròpia, sinó que la resolució es fixa segons la qualitat que es demani per a la imatge. Les dimensions físiques i digitals d'una imatge estan relacionades per la resolució: dividint la mida digital entre la resolució obtenim la mida física.
Mentre que les transformacions puntuals i espacials modifiquen el nivell de gris dels píxels sense modificar-ne la posició, les transformacions geomètriques modifiquen les relacions espacials entre els píxels de la imatge original i la transformada.
La interpolació és una transformació geomètrica que augmenta el nombre de píxels de la imatge, intercalant regularment files i columnes de píxels nous entre els que ja existeixen; el nivell de gris dels píxels nous es calcula a partir dels que ja existeixen. Aquest càlcul es pot fer per diferents mètodes, més precisos com més complexos; els tres mètodes més representatius són la interpolació per veí més proper, la bilineal i la bicúbica.
La delmació és una transformació geomètrica que disminueix el nombre de píxels de la imatge, eliminant regularment files i columnes de la imatge original. En el cas general, no cal modificar els nivells de gris de la imatge transformada. En casos concrets s'obtenen millors resultats recalculant el nivell dels píxels amb els mateixos mètodes que fem servir per a la interpolació.
La interpolació augmenta la mida de la imatge però no en millora la qualitat; hi afegim píxels nous però no hi afegim informació. La delmació implica una pèrdua d'informació de la imatge; quan eliminem píxels eliminem de manera irrecuperable part de la informació.
La interpolació tendeix a difuminar les vores de la imatge mentre que la delmació tendeix a realçar-les; en tots dos casos es poden aplicar els mètodes vistos en els mòduls anteriors per a mirar de reduir aquests efectes, però hem d'assumir més pèrdua de qualitat com més modifiquem les mides originals de la imatge.
Una de les aplicacions de la interpolació i la delmació és el zoom: quan ens "acostem" a la imatge per a observar-ne millor un detall fem una interpolació, mentre que quan ens n'"allunyem" per a veure-la completa fem una delmació.
Algunes altres transformacions geomètriques són la rotació, que gira la imatge un angle concret, el biaix, que inclina la imatge, deformant-la.