xmlns:xi="http://www.w3.org/2003/XInclude" xmlns:qti="http://www.imsglobal.org/xsd/imsqti_v2p1" Tractament i publicació d'imatge i vídeo Tractament i publicació d'imatge i vídeo

Histogrames i transformacions puntuals

  • Sílvia Pujalte Piñán

PID_00239713
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars del copyright.

Introducció

Aquest mòdul està dedicat a una família de transformacions aplicables a imatges, les transformacions puntuals, que tracten la imatge com un conjunt de píxels independents. Veurem que, tot i la seva senzillesa, són eines valuoses, capaces, per exemple, de millorar de manera important la representació de les imatges.
En el primer apartat farem un breu repàs de conceptes que ja coneixem i establirem la nomenclatura que seguirem durant aquest mòdul i els següents.
En el segon apartat ens referirem a l'histograma, una eina d'anàlisi de les imatges que ens serà d'utilitat abans d'aplicar-hi cap transformació; un cop definit veurem diferents tipus d'imatges i estudiarem les característiques del seu histograma.
El tercer apartat el dedicarem a les transformacions puntuals, aquelles que es fan modificant la imatge píxel a píxel amb independència de la resta. Veurem les operacions més habituals, des de les més senzilles, com el negatiu i la binarització, fins a les més potents, que ens permetran modificar el contrast de la imatge donant llum a les zones que ens interessi modificar o enfosquint-les.
A continuació parlarem del canvi de nombre de nivells en una imatge, i ens referirem en particular al canvi de nivells en imatges en color, en què es converteix el color real en color indexat.
Acabarem el mòdul descrivint dues transformacions puntuals que involucren imatges en color, el pseudocolor i el fals color.
Les explicacions les il·lustrarem amb exemples fets amb l'aplicació Photoshop fent servir una base de dades d'imatges de disposició lliure, que podem baixar de l'adreça http://decsai.ugr.es/cvg/dbimagenes/; si no diem el contrari, les imatges esmentades tindran sempre aquest origen. És recomanable seguir els exemples amb Photoshop alhora que s'estudien els materials ja que a la pantalla i ampliant la imatge es poden observar detalls dels resultats que a les imatges impreses es perden. Per facilitar aquesta tasca, al final del mòdul incloem una llista de les imatges utilitzades a cada figura.
El mòdul inclou també exercicis sobre els temes tractats, proposats per a fer també amb Photoshop; tots aquests temes inclouen la solució.

Objectius

Els objectius principals d'aquest mòdul són els següents:
  1. Introduir el concepte d'histograma.

  2. Introduir els conceptes bàsics de transformacions d'imatges basades en el píxel.

  3. Introduir el concepte de fals color i pseudocolor.

  4. Relacionar, mitjançant experiments dirigits, els conceptes introduïts amb la transformació d'imatges.

Aquests objectius estan relacionats amb les competències de l'assignatura següents:
A. Capacitat de modificar una imatge digital basant-se en uns requisits previs.
C. Capacitat de discriminar les opcions factibles de les que no ho són en un estudi d'especificacions d'un projecte, un sistema o una tasca.
D. Capacitat de visualitzar i imprimir imatges de manera eficaç i eficient.
I amb les competències generals del grau següents:
11. Capacitat de capturar, emmagatzemar i modificar informació d'àudio, imatge i vídeo digitals aplicant-hi principis i mètodes de realització i composició del llenguatge audiovisual.
22. Capacitat d'utilitzar els fonaments matemàtics, estadístics i físics per a comprendre els sistemes TIC.

1.Conceptes previs sobre histogrames i transformacions puntuals

En general, podem interpretar una imatge digital com una quadrícula on la intersecció de cada fila i cada columna és un punt de la imatge, o píxel. Com veiem en la figura 1, les columnes es comencen a numerar sobre l'eix horitzontal, per l'extrem inferior esquerre, en sentit creixent cap a la dreta, i les files, sobre l'eix vertical, per l'extrem superior esquerre, en sentit creixent cap a baix. En general, tindrem M files i N columnes; aquests valors determinen la resolució espacial, és a dir, el detall més petit que podem distingir a la imatge; com més resolució (més files i més columnes) més detall veurem.
Figura 1. Conveni per a la representació de files i columnes d'una imatge digital
Figura 1. Conveni per a la representació de files i columnes d'una imatge digital
Els píxels (1) tenen un valor assignat segons la informació que representin; en el cas d'una imatge en escala de grisos, cada píxel té assignat un nivell de gris o intensitat de brillantor, entre 0 (píxel negre) i el valor màxim (píxel blanc), típicament 255; els valors intermedis es corresponen amb els tons de gris, del més fosc al més clar segons n'augmenta el valor. El nombre de nivells de grisos acostuma a ser una potència de dos, L = 2k, en què k és el nombre de bits per píxel (ens hi referim també com a profunditat); del valor que tenen en depèn la resolució en amplitud, el canvi més petit distingible entre tons de grisos, o pas de quantificació.
El programa Photoshop segueix el mateix conveni, com veiem a la visualització de qualsevol imatge, per exemple la de la figura 2; la posició del cursor la indiquen els paràmetres X, Y, que corresponen al nombre de fila i de columna, respectivament.
Figura 2. Informació sobre la imatge amb Photoshop
Figura 2. Informació sobre la imatge amb Photoshop
En una imatge en color, el valor de cada píxel és una terna que representa les tres components del color que poden estar expressades en diferents espais; per exemple, si treballem en l'espai RGB cada píxel contindrà la informació sobre els nivells de vermell, verd i blau.

2.Histogrames

L'histograma és una eina de gran interès perquè ens serveix, juntament amb la inspecció visual, per a "diagnosticar" la nostra imatge abans d'aplicar-hi qualsevol tractament; per això és important dedicar-hi un temps abans d'introduir les diferents tècniques de transformacions puntuals.
L'histograma d'una imatge monocromàtica és una gràfica en dues dimensions que indica, per a cada nivell de gris, el nombre de píxels de la imatge que tenen aquests nivells; en l'eix horitzontal hi tenim els nivells de gris i en l'eix vertical, el nombre d'aparicions de cada nivell. Així, a l'histograma hi veiem la distribució dels píxels a la imatge.
Imatge monocromàtica i imatge en escala de grisos
Molts textos –aquest inclòs– es permeten la petita llicència d'utilitzar com a sinònims els termes «imatge monocromàtica» i «imatge en escala de grisos». Per definició, una imatge monocromàtica és una imatge composta per un únic color, en les seves diverses intensitats. Per tant, una imatge en escala de grisos és una imatge monocromàtica: és una imatge composta per diverses intensitats de gris. Però hem de tenir present que també serien imatges monocromàtiques aquelles imatges que continguessin solament tonalitats de qualsevol altre color. Per exemple, una imatge en tons sèpia també seria una imatge monocromàtica.
A la figura 3 hi tenim l'histograma de la imatge peppers.pgm. Observem que hi són presents tots els nivells fins a aproximadament el 230, mentre que els tons de nivell superior (els més clars) no hi estan representats. Hi observem també que els nivells més representats són entorn dels valors 62-65.
Figura 3. Histograma
Figura 3. Histograma
L'histograma ens dóna informació global sobre la imatge: per una banda, informació qualitativa, que reforça les característiques generals de la imatge que podem anticipar a partir de visualitzar-la, i per l'altra, informació quantitativa de tipus estadístic, com veurem en exemples posteriors.
El contrast es defineix com la diferència en luminància o color entre un punt d'una imatge i els punts dels seus voltants. Així doncs, en general, podem dir que l'histograma d'una imatge ben contrastada està distribuït per la major part dels nivells disponibles (és el cas de la figura 3), mentre que una imatge poc contrastada, independentment dels valors predominants que tingui, el té concentrat en un marge estret de valors (vegeu l'exemple 1). Una imatge brillant té l'histograma desplaçat cap a la dreta (vegeu l'exemple 2), mentre que una imatge fosca el té desplaçat cap a l'esquerra (vegeu l'exemple 3).
Convé subratllar que no cal que l'histograma d'una imatge contingui píxels a tots els nivells de gris per ser una imatge ben contrastada. Per exemple, una imatge amb només dos nivells de gris, blanc i negre, seria una imatge ben contrastada.
L'histograma no ens dóna informació espacial de la imatge. Ens diu amb quina freqüència apareixen els diferents nivells de gris però no ens diu a quina part de la imatge; de la localització només en sabem el que apreciem per observació. Per tant, l'histograma no identifica una imatge; dues imatges diferents poden tenir histogrames idèntics.
Figura 4. Dues imatges diferents amb el mateix histograma
Figura 4. Dues imatges diferents amb el mateix histograma
06524m1fig16.jpg
Exemple 1
La figura 5 presenta una imatge poc contrastada, de nivells de gris intermedis; l'histograma és, com podíem esperar, estret, concentrat entorn dels nivells centrals. A més a més, observem que l'histograma no és continu sinó que presenta discontinuïtats, és a dir, hi ha nivells que no estan representats; això habitualment obeeix a una adquisició deficient.
Figura 5. Histograma de l'exemple 1
Figura 5. Histograma de l'exemple 1
Exemple 2
La imatge de la figura 6 és clara, les zones fosques són molt escasses; veiem a l'histograma que la distribució té els valors màxims als nivells centrals i s'estén cap als valors màxims, mentre que als valors inferiors hi té poca presència.
Podem aprofitar aquest histograma per a esmentar dues de les mesures estadístiques d'una imatge que es poden calcular a partir de l'histograma: la mitjana i la mediana. La mitjana representa el valor d'intensitat mitjà de la imatge, mentre que la mediana representa el nivell de gris central de la distribució, és a dir, el que té el 50% dels píxels per sota i l'altre 50% per sobre. Totes dues mesures, mitjana i mediana, són valors que ens informen sobre la brillantor global d'una imatge; si són alts indica que la imatge és clara, mentre que si són baixos indica que la imatge és fosca.
Figura 6. Histograma de l'exemple 2
Figura 6. Histograma de l'exemple 2
Exemple 3
Estudiem ara l'histograma de la imatge de la figura 7. Hi predominen els nivells foscos, concentrats en una banda molt estreta, el 90% dels píxels tenen nivells inferiors a 68 i el 99%, nivells inferiors a 150.
Figura 7. Histograma de l'exemple 3
Figura 7. Histograma de l'exemple 3
Exemple 4
Fins ara ens hem referit a imatges monocromàtiques; en una imatge en color a l'espai RGB l'histograma es calcula per a cada component per separat (figura 8a); en aquest cas no tenim informació sobre la freqüència d'aparició conjunta, és a dir, no tenim informació sobre els colors que formen la imatge. Si treballem en altres espais de colors diferents de l'RGB obtindrem igualment l'histograma per a cada component; per exemple, si ens cal tenir informació sobre la luminància podem fer l'histograma per l'espai CIE-Lab.
Figura 8a. Histograma de les components RGB d'una imatge en color de l'exemple 4
Figura 8a. Histograma de les components RGB d'una imatge en color de l'exemple 4

2.1.Exercicis amb histogrames

Exercici 1
La millor manera de familiaritzar-se amb els histogrames és visualitzar-ne uns quants: visualitzar la imatge, fer una estimació de la distribució dels píxels (presència majoritària de zones clares, fosques o mitjanes, concentració dels nivells) i intentar predir la forma aproximada de l'histograma; llavors visualitzem l'histograma, comprovem si la nostra estimació es correspon amb la gràfica i parem atenció a la informació que ens dóna aquesta gràfica i que no hem pogut apreciar per inspecció visual. Us recomanem que torneu a estudiar els histogrames de les imatges que hem fet servir com a exemple i posteriorment els d'altres que no hagueu vist prèviament; en els apartats posteriors del mòdul farem servir també l'histograma com a eina per a resoldre els problemes plantejats.
Exercici 2
A tall d'exemple amb una imatge concreta, visualitzeu amb Photoshop l'histograma de la imatge astro1.pgm.
a) Quines característiques té la distribució de nivells de grisos de la imatge?
b) Indiqueu entre quins nivells de gris es troba l'histograma, prenent com a nivell mínim el valor per sota del qual hi ha aproximadament un 1% dels nivells i com a valor màxim el valor per sobre del qual hi ha també l'1% dels nivells.
Solució
a) L'histograma es concentra als nivells centrals de gris, amb una distribució prou simètrica. Hi ha pocs píxels amb nivells molt clars o molt foscos. És la distribució que podríem esperar després d'observar la imatge.
b) Aproximadament, els nivells de grisos són entre 37 i 187.
Exercici 3
Sobre la imatge en escala de grisos figura-ex3.pgm (l'adjuntem amb els materials), determineu la probabilitat que, en escollir a l'atzar un píxel, aquest tingui el mateix nivell de gris que el píxel de la posició (200,200). Repetiu l'experiment amb el mateix píxel sobre la imatge gray21.512.pgm.
Solució
a) Per resoldre aquest exercici, amb l'eina Zoom (Z), començarem ampliant la imatge, de manera que sigui possible localitzar clarament el píxel de la posició (200,200). Un cop localitzat, amb l'ajuda de l'eina Marco rectangular (M), el seleccionem. Com podem veure a la imatge, en fer una selecció, l'histograma de Photoshop ens mostra només la informació de la regió seleccionada. En el nostre cas, en haver seleccionat un únic punt, els valors Promedio (Mean) o Mediana (Median) ja ens indiquen que el nivell de gris d'aquest punt és 185.
Figura 8b
Figura 8b
Ara, sense seleccionar cap punt o regió a la imatge (podem fer servir l'eina Selección/Deseleccionar), a l'histograma, si cliquem amb el punter del ratolí sobre el nivell de gris 185, veurem que hi ha 8116 punts amb aquest mateix nivell de gris (Cantidad = 8116). Per tant, com que la imatge té 65536 píxels, la probabilitat de trobar un píxel a l'atzar amb la mateixa intensitat és 8116/65536 ≈ 0.124, que –expressat en percentatge– equival al 12,4%.
Figura 8c
Figura 8c
b) Imatge gray21.512.pgm. El píxel de la posició (200,200) té un nivell de gris 140, i la probabilitat de trobar-ne un altre amb la mateixa intensitat és 4,8%.

3.Transformacions puntuals

Les transformacions d'imatges ens permeten millorar-ne la qualitat o ressaltar-ne detalls que a la vista no es perceben amb claredat; tècnicament quan transformem una imatge el que fem és obtenir una imatge B a partir d'una imatge A (en general, tot i que a vegades les imatges d'origen poden ser més d'una), i la manera en què es modifica A per a convertir-se en B determina el tipus de transformació.
En el cas de les transformacions puntuals (2) , que són les que ens ocupen, cada píxel de B s'obté a partir del píxel de A amb les mateixes coordenades, i només a partir d'aquest píxel; no l'afecta cap altre píxel de A (sí que seria el cas de les transformacions espacials, en què el valor de cada píxel de la imatge B s'obté a partir del mateix píxel de la imatge A i els seus veïns).

3.1.Transformacions del nivell de gris

Les transformacions del nivell de gris varien la manera en què els nivells estan distribuïts a la imatge amb l'objectiu de millorar-la o facilitar-ne la visualització; podem invertir els nivells, aclarir la imatge, enfosquir-la, realçar un marge de nivells, etc.
En tots els casos ho fem definint una corba o funció de transformació, que anomenem T(l), que relaciona els píxels de la imatge de sortida B amb els de la imatge d'entrada A.
Exemple de funció de transformació
En la figura 9 veiem un exemple típic de funció de transformació (fent servir la funció Images/Adjustments/Curves de Photoshop); a l'eix horitzontal hi tenim els nivells de gris de la imatge A, del més fosc al més clar, i a l'eix vertical, els nivells de la imatge B, també del més fosc al més clar. Els píxels de la imatge d'entrada A que valen l canvien el valor a T(l) quan es construeix la imatge B. En el cas de la figura 9 la transformació és T(l) = l; els píxels que, per exemple, valen 204 en la imatge A passen a valer T(204) = 204, és a dir, el mateix, en la imatge B; en aquest cas la imatge queda inalterada, B = A; es tracta de la transformació identitat.
Veurem a continuació les transformacions més habituals; ens referirem, sense pèrdua de generalitat, a imatges monocrom; quan les transformacions tenen sentit per a imatges en color el procés habitual és aplicar-les per separat sobre cadascuna de les components.
Figura 9. Corba de transformació: identitat
Figura 9. Corba de transformació: identitat
3.1.1.Transformació negatiu
La transformació negatiu, o inversa, és una de les més senzilles que podem aplicar a una imatge. Consisteix a invertir el valor dels nivells de gris de la imatge d'entrada, de manera que, en els extrems, el blanc passa a ser negre i el negre, blanc; és l'equivalent a fer el negatiu de la imatge i realçar detalls clars en una imatge fosca. La funció de transformació que té és:
T(l) = 255 – l
La figura 10 mostra la corba de la transformació i un exemple d'ús. Veiem sobre la gràfica que el píxel que en la imatge d'entrada A té un nivell de gris 25 en la imatge B en la sortida té un nivell 230 (línia discontínua):
T(25) = 255 – 25 = 230
i un píxel de nivell 204 en l'entrada té en la sortida un nivell 51 (línia contínua):
T(25) = 255 – 204 = 51
Figura 10. Corba de transformació: negatiu
Figura 10. Corba de transformació: negatiu
3.1.2.Transformació de binarització
En la transformació de binarització tots els nivells de gris de la imatge A queden reduïts a dos en la imatge B: el nivell màxim (255) i el mínim (0). Per tant, obtenim una imatge binària.
La transformació queda definida per un llindar o threshold; tots els nivells que queden per sobre del llindar passen a tenir valor 255 i tots els que queden per sota passen a valor 0; això es correspon amb una funció de transformació com:
T ( l ) = 255 l l l i n d a r 0 l < l l i n d a r 1.1
Si el llindar se situa a prop dels nivells foscos, la imatge binaritzada té més presència de píxels blancs, mentre que si és a prop dels nivells clars, llavors té més presència de píxels negres. En la figura 11 veiem un exemple de binarització, amb un llindar de valor 98.
Figura 11. Corba de transformació: binarització
Figura 11. Corba de transformació: binarització
3.1.3.Transformacions d'aclariment de la imatge
De vegades ens podem trobar imatges, per exemple imatges mèdiques, que tenen un marge dinàmic massa gran per a visualitzar-les correctament; si ens interessa veure en detall les zones fosques que no queden ben representades podem aplicar una transformació d'aclariment de la imatge.
La figura 12 mostra una corba típica d'aclariment de la imatge i l'efecte que té sobre una imatge fosca: un rang estret de nivells foscos en la imatge original s'eixampla i es correspon amb un rang ampli en la imatge transformada, i un rang ampli de nivells clars en la imatge original s'estreny i es correspon amb un rang estret en la imatge modificada. L'ajustament de la corba es fa, en cada cas, depenent de la imatge original.
Figura 12. Corba d'aclariment de la imatge
Figura 12. Corba d'aclariment de la imatge
El càlcul dels nivells de grisos mitjançant corbes d'aquest tipus (i el mateix es pot aplicar a les transformacions d'enfosquiment de la imatge que veurem tot seguit) pot donar lloc a valors no enters; per exemple, un nivell de gris de 132,4. En aquests casos, i en vista que els nivells de grisos només poden tenir valors enters, Photoshop o l'aplicació que fem servir arrodoneix el valor a l'enter més proper, en aquest cas a 132. Aquestes correccions són, en la major part dels casos, poc apreciables a la vista, però es poden reflectir a l'histograma, en què apareixen nivells buits del tipus que havíem vist a l'histograma de la figura 5.
3.1.4.Transformacions d'enfosquiment de la imatge
Si el que necessitem és enfosquir una imatge farem servir una funció de transformació la corba típica de la qual veiem en la figura 13, juntament amb un exemple d'aplicació.
En general, en una corba d'enfosquiment de la imatge un rang ampli de nivells baixos i mitjans en la imatge d'entrada es converteix en un rang petit de nivells baixos en la imatge de sortida.
Figura 13. Corba d'enfosquiment de la imatge
Figura 13. Corba d'enfosquiment de la imatge
3.1.5.Transformacions d'aclariment i d'enfosquiment per parts
Finalment, ens referirem en aquest subapartat a les transformacions d'aclariment i d'enfosquiment per parts, que utilitzarem per a modificar el contrast d'una imatge. En aquest cas la corba de transformació està formada per trams; en la figura 14 veiem un exemple en què la transformació és controlada per dos punts, X i Y. El rang de nivells de grisos fins al punt X en l'entrada de la imatge es correspon amb nivells més foscos en la sortida –en aquesta zona la imatge s'enfosqueix–, mentre que el rang de nivells a partir del punt Y és correspon amb nivells més clars –en aquesta zona la imatge s'aclareix. El resultat final és l'augment de contrast de la imatge.
Figura 14. Exemple de corba de transformació per parts
Figura 14. Exemple de corba de transformació per parts
Exemple d'aplicació de transformació per parts
Treballarem a partir de la imatge de la figura 5; l'objectiu és millorar-ne el contrast. En l'histograma llegim els valors de gris mínim (13) i màxim (212) representats en la imatge; fem servir aquests dos punts com els punts X i Y de la figura 14 i hi assignem els valors de nivell de sortida mínim i màxim, respectivament; d'aquesta manera expandim els nivells a tot el marge de grisos possible; la corba i els resultats els veiem en la figura 15.
Figura 15. Transformacions d'aclariment i d'enfosquiment per parts
Figura 15. Transformacions d'aclariment i d'enfosquiment per parts

3.2.Exercicis amb transformacions puntuals

Exercici 1
Ens proposem fer la binarització de la imatge tulips.pgm en dos casos:
a) triant el llindar de binarització de tal manera que en la imatge resultant el 50% dels píxels sigui blanc i l'altre 50%, negre;
b) triant un llindar tal que en la imatge resultant només s'apreciïn les tulipes, ni les tiges ni les fulles.
Solució
a) El nivell d'intensitat que ens interessa trobar en l'histograma de la imatge original és la mediana, és a dir, el nivell de gris per sota del qual es troben el 50% dels píxels. Per a la imatge tulips.pgm aquest valor és 113.
b) En aquest cas per a trobar el llindar hem de fer algunes proves fins que visualitzem el resultat desitjat; triarem, aproximadament, 165.
Exercici 2
A la imatge P1020145.jpg s'hi ha aplicat una transformació d'aclariment el resultat de la qual es veu en la figura 16a; la corba de transformació s'ha calculat estudiant l'histograma de la imatge original i assignant 128 al valor d'intensitat per sota del qual es troben aproximadament el 90% dels píxels. Dibuixeu aproximadament la corba que transforma la imatge.
Figura 16a
Figura 16a
Solució
L'histograma de la imatge P1020145.jpg ens mostra que el valor de nivell de gris que té per sota el 90% dels píxels és l = 6; aquest valor ha de tenir el valor de sortida mitjà, el 128.
Figura16b
Figura16b
Podem pensar que aquests valors de nivell 6 i sortida 128 són els valors que un artista o tècnic ha considerat convenient utilitzar per aclarir aquesta imatge de forma equilibrada. No hi ha una fórmula matemàtica per calcular aquests valors i cada imatge –tot i tenir histogrames similars– haurà de ser tractada individualment.
Exercici 3
Ens proposem millorar la imatge 4.2.02.pgm amb una transformació d'enfosquiment d'imatges. Volem que el valor per sobre del qual hi ha el 75% dels píxels quedi a 128. Dibuixeu aproximadament la corba i apliqueu-la a la imatge.
Solució
Veiem a l'histograma que el nivell per sobre del qual queden el 75% dels píxels és 185, i fixem aquest punt a la corba; en la imatge que resulta de la transformació s'hi aprecia un enfosquiment general.
Exercici 4
En la imatge rosa.tif es vol fer ressaltar els estams i la textura dels pètals. Proposeu dues transformacions i comenteu quina de les dues solucions adopteu i per què.
Solució
Una opció és aplicar a la imatge una transformació d'enfosquiment; podem fer, per exemple, que el nivell de gris 170 de la imatge original quedi al nivell 128 de la imatge transformada. La segona opció és aplicar una transformació de millora del contrast, i fer que els nivells de gris de la imatge original per sota de gris quedin a 0 i els que estan per sobre de 210 quedin a 255 (decidim aquests valors a partir de l'histograma de la imatge). De les dues solucions, la que ressalta més els estams i, sobretot, la textura dels pètals, és la primera, l'enfosquiment.
Exercici 5
La figura 17 ens mostra una corba de transformació puntual. Indiqueu de quin tipus de transformació es tracta i quin és l'efecte que té sobre una imatge (il·lustreu la vostra explicació amb un exemple sobre la imatge tulips.pgm). Amb quina altra transformació està relacionada? Quines eines de Photoshop us permeten fer aquesta transformació?
Figura 17
Figura 17
Solució
Amb aquesta corba obtenim una imatge binària, però a diferència de la binarització tal com l'hem estudiada, en aquest cas no hi ha un llindar que separi el nivell blanc del negre sinó que hi ha un marge de valors pels quals la imatge és negra i dos pels quals la imatge és blanca. Podem fer aquesta transformació amb l'eina Image/Adjustments/Gradient maps.
Exercici 6
Obriu la imatge 4.01.02.pgm amb Photoshop i dupliqueu la capa de fons; sobre la capa duplicada canvieu el mode de capa de normal a trama. Proposeu una transformació puntual que aconsegueixi un efecte similar. Feu el mateix però amb el mode de capa multiplicar.
Solució
En el primer cas (capa en mode trama), amb una transformació d'aclariment de la imatge obtenim un efecte similar. En el segon cas (capa en mode multiplicar), obtenim un resultat similar a una transformació d'enfosquiment de la imatge.

4.Canvi del nombre de nivells

Al començament del mòdul parlàvem dels paràmetres que caracteritzen una imatge i esmentàvem els nivells d'intensitat (típicament 256, del 0 al 255), o, equivalentment, el nombre de bits que calen per codificar-los (típicament 8 bits, 28 = 256); el nombre de nivells es tria durant la quantificació de la imatge i intuïtivament podem aventurar que la qualitat percebuda de la imatge està relacionada amb el nombre nivells, i augmentarà segons augmenta aquest nombre.
En realitat, això no és del tot cert, i arriba un moment en què per molt que augmentem el nombre de bits, als nostres ulls no hi ha una diferència perceptible. La profunditat de bits més utilitzada per imatges monocromàtiques és 8, un valor que dóna una qualitat suficient per a la majoria de les aplicacions; per a aplicacions molt concretes que necessiten més resolució es fan servir 16 bits, sobretot si el processament posterior és molt extens.
Estudiem com es percep el cas contrari, la disminució del nombre de nivells, prenent com a referència 256 nivells, la quantificació comuna a totes les imatges que hem estudiat fins ara. Fixant el nombre de nivells a 128 o a 64 encara tenim prou qualitat, però si reduïm més el nombre de nivells comença a visualitzar-se el que coneixem com a falsos contorns: un grup de píxels veïns es quantifiquen amb el mateix nivell i generen un contorn que no es correspon amb cap objecte de la imatge (per això se'n diu així). Aquest efecte es comença a notar, depenent de la imatge, quan baixem a 5 bits de quantificació, i amb 4 bits ja és molt evident; si disminuïm més el nombre de bits les noves regions que es generen són tan grans que la imatge pren un aspecte artificial, fins a arribar al cas extrem d'1 bit, en què només tenim dos nivells, blanc i negre.
La figura 18 mostra una imatge quantificada amb 8 bits i 3 bits; en el segon cas s'hi aprecien els falsos contorns que apareixen quan es redueix dràsticament el nombre de nivells.
Figura 18. Quantificació amb 8 bits i 3 bits
Figura 18. Quantificació amb 8 bits i 3 bits

4.1.Color indexat

Per a imatges en color la quantificació més freqüent assigna 8 bits a cada color, que fa que cada píxel es quantifiqui amb 24 bits (és la qualitat coneguda com a color real).
Una quantificació alternativa que utilitzen alguns formats com GIF és el color indexat, que fa servir una paleta de només 256 colors. La informació sobre el color de cada píxel no s'hi emmagatzema directament sinó que es guarda a la paleta. Cada píxel conté l'índex del color dins la paleta. Com que només té 256 opcions possibles, permet codificar un píxel en color amb només 8 bits, i així estalvia espai, però a costa de limitar el nombre de colors possible (256).
Si volem convertir una imatge de color real en una imatge de color indexat, cal reduir necessàriament el nombre de nivells representables, reducció que passa per dues decisions: quins colors es trien i com s'assignen als colors de la imatge original. Els colors triats es guarden en una taula i el píxel de la imatge convertida conté l'índex del color associat en aquesta taula. La qualitat de la imatge de color indexat depèn de la tria de la paleta de colors.
Per a fer la tria de colors hi ha diversos mètodes. En compararem dos: l'uniforme, que divideix l'espai de color en regions iguals i tria el valor mitjà de cada regió, i el de popularitat (adaptatiu, amb la nomenclatura de Photoshop), que també tria l'espai de color en regions iguals però tria el valor més freqüent. En tots dos casos la paleta no és fixa, sinó que depèn de la imatge. Podem treballar també amb paletes fixes específiques per al sistema de visualització (un web o un sistema operatiu determinat).
La figura 19 mostra la conversió d'una imatge de color real a color indexat; s'ha triat una paleta de 256 colors i a) el mètode uniforme, b) el mètode de popularitat. Amb el mètode uniforme s'observen contorns falsos al fullam, cosa que indica que el nombre de colors és insuficient, mentre que amb el mètode de popularitat, més eficient, no s'aprecien grans diferències.
Figura 19. Canvi de nivells: a) color indexat amb criteri uniforme i b) amb criteri de popularitat
Figura 19. Canvi de nivells: a) color indexat amb criteri uniforme i b) amb criteri de popularitat

4.2.Exercicis de canvis de nivell

Exercici 1
Canvieu el nombre de nivells en la imatge pallon.pbm i convertiu-la a color indexat. Feu servir el mètode de popularitat (o adaptatiu); comenceu per una paleta de 256 nivells i aneu disminuint la mida (128, 64, 32, etc.). En quin moment comencen a fer-se apreciables els falsos contorns?
Solució
Amb una paleta de 128 colors ja es perceben alguns contorns; amb 64 colors ja són clarament perceptibles. Per exemple, en el globus violeta en primer pla, els reflexos presenten falsos contorns, i el color violeta també està dividit en dues zones verticalment.
Exercici 2
Repetiu l'exercici anterior però fent servir el mètode uniforme en lloc de l'adaptatiu.
Solució
En aquest cas amb 256 nivells hi ha tants falsos contorns que la imatge té un aspecte clarament artificial.

5.Pseudocolor i fals color

El sistema visual humà és capaç de treballar en un marge molt ampli d'intensitats de llum, però no simultàniament; donades unes determinades condicions locals s'hi adapta i és capaç de distingir només uns quants nivells de gris. En canvi, en aquest mateix entorn local és capaç de distingir molts més colors diferents.
Quan s'ha d'estudiar imatges en nivells de grisos en què és fonamental distingir petits detalls (per exemple, imatges mèdiques), una tècnica utilitzada és associar a cada nivell de gris un color; aquesta visualització en color d'una imatge monocromàtica es coneix com a pseudocolor.
L'associació entre nivells de gris i color és arbitrària; els colors es trien segons l'aplicació per a fer ressaltar les característiques de la imatge que ens interessen. Un cop triats es construeix una taula en què cada element conté un color (una terna de valors), i la transformació d'imatge monocromàtica a pseudocolor és una transformació puntual en què a cada píxel de nivell de gris de la imatge original hi correspon un píxel de color en la imatge transformada.
En aquest sentit el pseudocolor es pot interpretar com una variant del color indexat aplicat a imatges monocromàtiques: cada nivell de gris està vinculat a un color de la paleta identificat per la posició que ocupa dins la taula, de manera que els bits que calen per a representar la imatge monocromàtica són els mateixos que per a representar-la en pseudocolor.
La figura 20 mostra la imatge d'una ressonància magnètica en nivells de grisos i la versió pseudoacolorida d'aquesta imatge amb la paleta espectral. Aquesta paleta ordena els colors de l'espectre visible (els que veiem a l'arc de Sant Martí) segons la longitud d'ona que tenen; la longitud d'ona més curta, el color violat, s'associa al negre i la més llarga, el vermell, al blanc (amb Photoshop, convertim primer la imatge monocromàtica a imatge indexada i hi associem posteriorment la taula de color).
La imatge pseudoacolorida no té un aspecte "natural", però s'aconsegueix l'efecte buscat, que és destacar zones poc apreciables en una imatge monocromàtica. Fixem-nos, per exemple, en les àrees vermelles, clarament distingibles de les zones veïnes grogues, mentre que en la imatge monocromàtica costa d'aïllar visualment aquestes àrees.
Figura 20. Imatge monocròmatica transformada a pseudocolor
Figura 20. Imatge monocròmatica transformada a pseudocolor
El fals color respon a una necessitat similar a la que ens porta al pseudocolor, millorar la visualització de la imatge destacant-ne determinades zones. La diferència és que, mentre que el pseudocolor s'obté a partir d'una imatge monocromàtica, el fals color s'obté a partir d'imatges en color: es canvia el color del píxel per a obtenir-ne un de nou. Com el pseudocolor, el fals color és una transformació puntual, es modifica la imatge original píxel a píxel.
Les tres components de color d'un píxel són, per separat, imatges monocromàtiques; per a obtenir el fals color es modifica cadascuna de les tres components, generalment amb les transformacions que hem vist en l'apartat 3 d'aquest mòdul: aclariment de la imatge, enfosquiment, etc.
Exemple de fals color
En veiem un exemple de fals color en la figura 21, en què la imatge peppers.ppm s'ha convertit en una imatge amb tons blavosos i violetes. En aquest cas la transformació aplicada a cada canal de color ha estat el negatiu (transformació definida en el subapartat 3.1 i il·lustrada en la figura 10).
Figura 21. Imatge en color transformada a fals color. S'ha aplicat la transformació negatiu a cada canal de color
Figura 21. Imatge en color transformada a fals color. S'ha aplicat la transformació negatiu a cada canal de color

5.1.Exercicis de pseudocolor i fals color

Exercici 1
La imatge gray21.512.pgm està formada per vint-i-un rectangles, cadascun d'un nivell de gris, ordenats de més fosc a més clar. Hem descrit la paleta espectral i l'ordenació dels colors d'aquesta paleta respecte als nivells de gris; comproveu amb la imatge gray21.512.pgm aquesta ordenació i estudieu com estan ordenats els colors en la resta de paletes de l'eina Image/Mode/Color Table de Photoshop.
Solució
La paleta Black Body està ordenada de la manera següent: el color negre s'associa amb el nivell negre, i passa pels colors vermell, carbassa i groc fins a arribar al blanc, que s'associa amb el nivell blanc. Les paletes System no tenen una ordenació que variï gradualment els colors.
Exercici 2
La imatge heart.pgm és una imatge mèdica monocromàtica; transformeu-la a pseudocolor fent servir la taula o taules de color de Photoshop que ressaltin millor els vasos sanguinis.
Solució
Les dues taules que destaquen millor els vasos sanguinis són Spectrum i Black body; amb aquestes dues els colors varien gradualment entre nivell de gris i es manté la continuïtat als vasos.
Exercici 3
Apliqueu una transformació de fals color a la imatge peppers.ppm aplicant la transformació negatiu a cada canal de color.
Solució
Per a fer aquesta transformació obrim la finestra Canals i hi seleccionem només la component que volem modificar, així no visualitzem les altres dues. Amb l'eina Image/Adjustments/Curves seleccionen el mateix canal que visualitzem, i modifiquem la corba perquè la transformació que s'hi aplica sigui el negatiu. Repetim el procés per als tres canals.
Exercici 4
Volem aplicar una transformació de fals color a la imatge peppers.ppm perquè es vegi aproximadament com es mostra en la figura 22. Quina transformació podem aplicar als canals de color de la imatge?
Figura 22
Figura 22
Solució
Els colors de la imatge transformada els veiem més foscos; podem aplicar a cada canal una transformació d'enfosquiment. En aquest cas hem fixat tant per al canal vermell com per al verd el nivell de sortida 10 per al nivell d'entrada 50. El canal blau no l'hem modificat.

6.Imatges emprades en les figures

Les imatges (recordem que són de distribució lliure) que s'han utilitzat en les figures d'aquest mòdul per als exemples amb Photoshop són les següents:
Figura
Imatge
Adreça URL

2

peppers.pgm

http://decsai.ugr.es/cvg/dbimagenes/g512.php

3

peppers.pgm

http://decsai.ugr.es/cvg/dbimagenes/g512.php

4

cameraman.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

5

7.1.03.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

6

car2.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

7

carnev.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

8

geranidolor.jpg

S'adjunta la imatge

10

tulips.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

11

leopard.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

12

carnev.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

13

cameraman.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

15

7.1.03.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

19

tulips.ppm

http://decsai.ugr.es/cvg/dbimagenes/c256.php

20

mr030.gpm

http://decsai.ugr.es/cvg/dbimagenes/gbio256.php

21

peppers.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

Resum

L'histograma d'una imatge monocromàtica és una gràfica en dues dimensions que ens mostra la distribució dels nivells de grisos d'una imatge (quins són els nivells que predominen, en quin marge estan continguts la major part dels nivells, etc.). No ens dóna, en canvi, informació espacial; sabem quins nivells conté la imatge però no a quines regions es concentren. L'estudi de l'histograma és un pas previ a la modificació dels nivells de gris d'una imatge.
Les transformacions puntuals són les operacions que consideren una imatge un conjunt de píxels independents; actuen píxel a píxel sense tenir en compte la resta de la imatge, i estan definides per la funció que relaciona cada píxel de la imatge original amb el corresponent de la imatge transformada. Les transformacions del nivell de gris més senzilles són les següents:
  • Negatiu: inverteix els nivells de gris de la imatge.

  • Binarització: redueix els nivells de gris a dos nivells.

  • Aclariment de la imatge: pren un rang estret de nivells foscos en la imatge d'entrada i els expandeix en nivells foscos i mitjans en la imatge transformada.

  • Enfosquiment de la imatge: pren un rang de nivells foscos i mitjans en la imatge d'entrada i els comprimeix en nivells foscos en la imatge de sortida.

El nombre de nivells d'una imatge, principalment en nivells de grisos, ha de ser prou gran perquè l'ull no detecti les conseqüències d'una quantificació insuficient; aquesta insuficiència es pot manifestar amb efectes com els falsos contorns, produïts per diferències massa grans de valors de nivells de gris entre píxels propers.
En el cas de les imatges en color podem reduir el nombre de nivells utilitzat (i, per tant, el nombre de bits necessaris per a representar-los) recorrent al color indexat; amb aquesta quantificació es treballa amb un nombre petit de nivells emmagatzemats en una taula. La conversió de color real a color indexat es pot fer seguint diversos mètodes, que s'adapten a la imatge o al dispositiu de visualització.
El sistema visual humà només és capaç de percebre uns pocs nivells de gris en un entorn lluminós concret, mentre que en el mateix entorn distingeix molts més colors diferents; el pseudocolor és una transformació puntual que converteix els nivells de grisos d'una imatge en color per a facilitar la visualització de detalls importants. Cada nivell de gris s'associa amb un color definit en una paleta triada segons l'aplicació.
El fals color és una transformació puntual que modifica el color d'una imatge, sia per a destacar detalls poc visibles (com, per exemple, imatges captades via satèl·lit), sia amb criteris artístics.