xmlns:xi="http://www.w3.org/2003/XInclude" xmlns:qti="http://www.imsglobal.org/xsd/imsqti_v2p1" Tractament i publicació d'imatge i vídeo Tractament i publicació d'imatge i vídeo

Transformacions espacials no lineals

  • Sílvia Pujalte Piñán

PID_00239712
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars del copyright.

Introducció

Hi ha transformacions que no compleixen les condicions de linealitat que especificàvem en el mòdul "Transformacions espacials lineals" i que, per tant, no es poden aplicar a la imatge mitjançant una màscara de convolució; es tracta d'operacions no lineals com la mediana o les derivades d'una disciplina que rep el nom de morfologia matemàtica.
Les transformacions puntuals i espacials lineals que hem vist anteriorment les hem aplicat, no exclusivament però sí que en gran part, a millorar imatges: reducció de soroll, millora de contrast, realçament de contorns, etc. Les transformacions que estudiarem en aquest mòdul s'utilitzen principalment per a analitzar les imatges: aïllar objectes, simplificar formes, detectar contorns (una aplicació que havíem vist també en les transformacions espacials lineals), etc. Aquestes transformacions s'utilitzen sovint en aplicacions industrials o mèdiques, per exemple.
En el primer apartat definirem el filtre de mediana i veurem l'aplicació que té com a transformació reductora de soroll impulsional, un tipus de soroll que, segons vèiem en el mòdul "Transformacions espacials lineals", no respon bé als filtres lineals.
El segon apartat, que ocupa la resta del mòdul, el dedicarem a la morfologia. En primer lloc, veurem semblances i diferències entre la manera de calcular les transformacions morfològiques i les lineals espacials, per a definir a continuació les dues operacions bàsiques, l'erosió i la dilatació. En segon lloc, un cop vistes aquestes operacions i les característiques que tenen, definirem dos filtres que es construeixen a partir de les operacions bàsiques, l'obertura i el tancament.
Finalment, reprendrem l'estudi de l'emfatització de contorns, que havíem vist en el mòdul "Transformacions espacials lineals", i mostrarem que aquesta operació es pot fer també a partir d'operacions morfològiques.
Els exemples que il·lustren la mòdul s'han fet, com en els mòduls anteriors, amb l'aplicació Photoshop, amb les imatges de domini públic que es detallen al final del mòdul. És recomanable reproduir els exemples a mesura que s'estudia.

Objectius

Els objectius principals d'aquest mòdul són els següents:
  1. Introduir el concepte de transformació no espacial.

  2. Presentar el filtre de mediana com a eina per a reduir soroll.

  3. Introduir el concepte d'operació morfològica.

  4. Introduir els conceptes d'erosió i de dilatació i les aplicacions que tenen.

  5. Presentar altres operacions morfològiques a partir de l'erosió i la dilatació i les aplicacions que tenen.

  6. Relacionar, mitjançant experiments dirigits, els conceptes introduïts amb la transformació d'imatges.

Aquests objectius estan relacionats amb les competències de l'assignatura següents:
A. Capacitat de modificar una imatge digital basant-se en uns requisits previs.
C. Capacitat de discriminar les opcions factibles de les que no ho són en un estudi d'especificacions d'un projecte, un sistema o una tasca.
D. Capacitat de visualitzar i imprimir imatges de manera eficaç i eficient.
I amb les competències generals del grau següents:
11. Capacitat de capturar, emmagatzemar i modificar informació d'àudio, imatge i vídeo digitals aplicant-hi principis i mètodes de realització i composició del llenguatge audiovisual.
22. Capacitat d'utilitzar els fonaments matemàtics, estadístics i físics per a comprendre els sistemes TIC.

1.Mediana

Comencem la descripció de les transformacions espacials no lineals pel filtre de mediana, una aplicació molt útil per a reduir el soroll impulsional, que, recordem-ho, no responia bé a les transformacions de suavització. Donada una mostra formada per un conjunt de valors que podem ordenar, la mediana és el valor central, és a dir, el que té tants valors per sota com per sobre.
Si apliquem l'operador mediana a la imatge A cada píxel de la imatge B transformada s'obté substituint el píxel corresponent de la imatge A per la mediana de la finestra de treball associada.
Per exemple, donat un píxel amb valor de gris 128 i els seus veïns com es mostra a la figura 1, el píxel corresponent de la imatge transformada té nivell de gris 126, ja que quan ordenem els píxels de més petit a més gran queda a la posició central:
123, 124, 124, 125, 126, 128, 128, 128, 130
Figura 1
Figura 1
Amb aquest exemple veiem que amb una finestra els píxels de la qual tenen valors d'intensitat similars la mitjana no introdueix diferències significatives, però si el píxel central té una intensitat molt diferent aquest valor es perd, com veiem en l'exemple següent:

123

128

124

125

0

130

124

128

126

Els píxels ordenats per nivell de gris són:
0, 123, 124, 124, 125, 126, 128, 128, 130
ja que la mediana és 125; els valors extrems no són mai al mig de la sèrie ordenada, sinó que sempre són al principi o al final, i d'aquesta manera queden eliminats de la imatge.
Clarament, el filtre de mediana és indicat per a reduir el soroll impulsional, píxels aïllats que prenen valors extrems. La figura 2 ens en mostra un exemple prenent una finestra de treball de 3 × 3; la reducció és important.
Figura 2. Soroll impulsional reduït amb un filtre de mediana
Figura 2. Soroll impulsional reduït amb un filtre de mediana

1.1.Exercicis amb filtre de mediana

Exercici 1
La imatge einstein.pgm és una imatge sense soroll. En aquest exercici hi afegirem soroll impulsional i, posteriorment, hi aplicarem un filtre de mediana per a reduir-lo; d'aquesta manera podrem comparar la imatge un cop netejada del soroll amb la imatge sorollosa i la imatge original.
Per a afegir soroll a la imatge original hem de fer servir l'eina de Photoshop Filter/Filter Gallery/Texture/Grain (o Filtro/Galería de filtros/Textura/Granulado en la versió del programa en castellà), triar una intensitat del 10%, un contrast del 50% i al camp Grain Type (Tipo de granulado) seleccionar el tipus Sprinckles (Rociado). Un cop embrutada la imatge amb soroll, hi apliquem el filtre de mediana Filter/Noise/Median (Filtro/Ruido/Mediana), amb una finestra de treball de 3 × 3.
Comenteu l'efecte del filtre de mediana sobre la imatge sorollosa, i compareu la imatge filtrada amb l'original.
Solució
El filtre de mediana no pot eliminar completament el soroll impulsional que hem afegit a la imatge original; un cop filtrada la imatge encara es poden observar punts blancs. A més, el filtre de mediana ha suavitzat la imatge.
Exercici 2
Repetiu l'exercici anterior, però aquest cop afegint-hi soroll impulsional d'intensitat 5%.
Solució
En aquest cas quan hi apliquem el filtre de mediana el soroll pràcticament desapareix. La imatge filtrada, comparada amb l'original, queda suavitzada també, com en l'exercici anterior.

2.Morfologia

La morfologia matemàtica és una tècnica, basada en la teoria de conjunts, molt utilitzada en tractament d'imatge; es construeix sobre dos operadors bàsics, erosió i dilatació, que són els que estudiarem en primer lloc. Són transformacions que es defineixen per a imatges binàries i s'estenen a imatges en nivells de grisos.
Tot i que es tracta d'operacions no lineals, en descriurem el funcionament mantenint el paral·lelisme amb les transformacions lineals espacials fins on ens sigui possible.

2.1.Element estructurant

En lloc de màscara, les operacions morfològiques fan servir el que s'anomena element estructurant. La màscara defineix el tipus de transformació que s'aplica a la imatge i la finestra de treball; l'element estructurant, en canvi, defineix només la finestra de treball.
Considerant els elements estructurants estructures quadrades, com les màscares, els píxels afectats són els marcats amb el valor 1; la resta valen 0:
06524m3fig17.gif
L'element estructurant EE1 afecta el píxel central de la finestra i els vuit veïns més immediats que té, mentre que EE2 afecta el píxel central i dos dels seus veïns. En aquest mòdul considerarem els elements estructurants amb tots els coeficients amb valor 1, de dimensions 3 × 3 o de superiors, però sempre quadrats.
L'element estructurant es desplaça per la imatge píxel a píxel, com feia la màscara. La diferència amb les operacions lineals és que no hi ha convolució espacial sinó que a cada finestra s'hi aplica una operació no lineal; com esmentàvem anteriorment, les operacions bàsiques són l'erosió i la dilatació.

2.2.Erosió i dilatació

L'operador erosió cerca, per a cada píxel de la imatge original, el nivell de gris més petit present en la finestra de treball i substitueix en la imatge transformada el píxel corresponent per aquest valor mínim.
En una imatge binària només es poden donar dos casos:
  • Que tots els píxels de la finestra de treball tinguin nivell de gris 255 (és a dir, blanc), i llavors el píxel en la imatge transformada no es modifica.

  • Que almenys un dels píxels de la finestra de treball tingui nivell de gris 0 (negre), i aquest és el valor del píxel en la imatge de sortida. El resultat és que les zones blanques de la imatge es redueixen i les zones negres augmenten, com es pot veure en la figura 3, erosionada (1) amb EE1 (amb la funció de Photoshop Filter/Other/Minimum).

Figura 3. Erosió aplicada a una imatge binària
Figura 3. Erosió aplicada a una imatge binària
Si la imatge és en nivells de grisos, l'erosió produeix un enfosquiment general de la imatge i també una certa distorsió dels contorns, més apreciable com més gran és l'element estructurant; en tenim un exemple en la figura 4.
Figura 4. Erosió aplicada a una imatge monocromàtica
Figura 4. Erosió aplicada a una imatge monocromàtica
L'operador dilatació fa l'operació dual de l'erosió i torna el nivell de gris màxim de la finestra de treball; amb imatges binàries això significa que només que hi hagi un píxel amb valor 255, la sortida és 255. Llavors, les zones negres es redueixen i les blanques s'amplien, com mostra la figura 5, en què la mateixa imatge que s'erosionava en la figura 3 s'ha dilatat amb EE1 (amb la funció de Photoshop Filter/Other/Maximum).
Figura 5. Dilatació aplicada a una imatge binària
Figura 5. Dilatació aplicada a una imatge binària
En una imatge monocromàtica la dilatació (2) produeix un aclariment general; la figura 6 ens mostra una dilatació amb l'element estructurant EE1 sobre la mateixa imatge de la figura 4. S'hi aprecia també, com en el cas de l'erosió, distorsió en els contorns.
Figura 6. Dilatació aplicada a una imatge monocromàtica
Figura 6. Dilatació aplicada a una imatge monocromàtica
Els noms erosió i dilatació fan referència a l'efecte de les transformacions a imatges binàries amb objectes blancs sobre un fons negre; els objectes queden erosionats o dilatats respecte a la forma original que tenien.
La figura 7 ens mostra, a partir d'una imatge que conté diferents objectes quadrats, algunes aplicacions dels operadors erosió (figura 7a) i dilatació (figura 7b); en tots els casos les operacions s'han fet amb l'element estructurant EE1.
  • El contorn quadrat s'aprima amb l'erosió, mentre que s'eixampla amb la dilatació. Lògicament, el quadrat negre interior es fa més gran amb l'erosió i més petit amb la dilatació.

  • Els quadradets més petits desapareixen amb l'erosió. La valoració petit o gran es fa en relació amb l'element estructurant; en aquest cas els quadradets que s'han eliminat tenen una mida inferior a 3 × 3 píxels, mentre que els que continuen essent visibles són més grans que l'element estructurant.

  • L'erosió separa objectes propers, com ara els dos quadrats més grans; això facilita l'aïllament o el recompte d'objectes.

  • La dilatació, al contrari, uneix objectes propers, cosa que pot ser molt útil per a omplir o completar objectes que l'adquisició de la imatge no ha representat prou bé.

Figura 7. Efectes de l'erosió (a) i dilatació (b) sobre una imatge binària
Figura 7. Efectes de l'erosió (a) i dilatació (b) sobre una imatge binària
Observem en la figura 7 que aconseguir l'efecte desitjat amb l'erosió o bé amb la dilatació implica assumir certa distorsió. Per exemple, si el nostre objectiu és eliminar els quadradets més petits, això comporta que la resta dels objectes es facin també més petits; s'observa especialment en els quadradets que queden reduïts pràcticament a un punt. En el subapartat següent estudiarem l'obertura i el tancament, dos filtres que combinen l'erosió i la dilatació per a reduir aquests efectes no desitjats.

2.3.Obertura i tancament

Amb l'obertura i el tancament modifiquem els mateixos aspectes de la imatge que amb l'erosió i la dilatació per separat però modificant tan poc com es pugui la resta de la imatge. Actuen de filtre, modificant certa informació i conservant-ne la resta.
L'obertura (3) consisteix en una erosió seguida d'una dilatació amb el mateix element estructurant. La primera operació esborra els detalls petits i d'intensitat alta alhora que enfosqueix la imatge; la dilatació aclareix la imatge sense recuperar els detalls esborrats. Per tant, l'obertura elimina detalls clars d'una imatge. Concretament, elimina els objectes clars de mida més petita que els de l'element estructurant.
(3) L'obertura elimina els objectes clars més petits que l'element estructurant i distorsiona al mínim la resta d'objectes.
Exemple d'obertura
La figura 8a) mostra la fotografia d'una galàxia. El nostre objectiu és destacar-la del fons, i la primera transformació que fem és binaritzar la imatge, amb un llindar de 128; el resultat d'aquesta transformació és la figura 8b). Sobre el fons negre hi veiem la galàxia, altres estrelles d'una certa mida i punts que no són estrelles sinó soroll de fons que hi havia en la imatge original i que la binarització no ha eliminat. Per a suprimir-los, apliquem una obertura sobre la imatge. La figura 8c) mostra el resultat del primer pas, l'erosió, que elimina els píxels sorollosos alhora que redueix la mida de la galàxia, i la figura 8d) mostra la imatge definitiva després del segon pas, la dilatació, amb la galàxia de la mida original.
Figura 8. Obertura d'una imatge monocromàtica
Figura 8. Obertura d'una imatge monocromàtica
El tancament (4) consisteix en una dilatació seguida d'una erosió, mantenint sempre el mateix element estructurant. La dilatació elimina els detalls foscos de la imatge i l'aclareix; l'erosió enfosqueix la imatge sense recuperar els detalls eliminats. Així, el tancament elimina detalls foscos de la imatge de mida més petita que els de l'element estructurant.
(4) El tancament elimina els objectes foscos més petits que l'element estructurant i distorsiona al mínim la resta de la imatge.
Exemple de tancament
La figura 9 mostra un exemple d'aplicació del tancament. L'objectiu és eliminar de la fotografia original (figura 9a) els cables que la travessen en diagonal, i deixar-hi només l'estructura de la torre. Hi apliquem una dilatació, i fem servir un element estructurant de 5 × 5 perquè veiem que amb l'element de 3 × 3 que hem fet servir fins ara no n'hi ha prou per a esborrar totalment les línies. El resultat de la dilatació (figura 9b): els cables, efectivament, s'han esborrat i tota la resta de línies s'han aprimat. L'erosió aplicada posteriorment (figura 9c), les recupera.
Figura 9. Tancament d'una imatge monocromàtica
Figura 9. Tancament d'una imatge monocromàtica

2.4.Èmfasi general de contorns

Acabarem aquest apartat mostrant com podem fer servir les operacions morfològiques per a detectar contorns en una imatge, com a alternativa a les transformacions espacials lineals; de les diverses maneres que hi ha de fer-ho, prendrem com a exemple la detecció de contorns fent servir l'erosió.
Sabem que, en una imatge binària, l'erosió redueix la mida dels objectes blancs, i en veiem un altre exemple en la figura 10, amb un element estructurant 3 × 3. Si comparem la imatge original (figura 10a) amb l'erosionada (figura 10b), tots els píxels de totes dues imatges són iguals, tant en el fons negre com en els quadradets blancs, excepte en els píxels que s'han erosionat; intuïtivament, si restem les imatges, tots els píxels de la imatge diferència tenen nivell 0 excepte els píxels que s'han modificat, que són, precisament, els contorns. La figura 10c) ens mostra la diferència entre totes dues imatges (obtinguda amb Photoshop amb l'eina Image/Apply image).
Figura 10. Detecció de contorns mitjançant erosió
Figura 10. Detecció de contorns mitjançant erosió
Per tant, una manera de detectar contorns mitjançant operacions morfològiques és restar a la imatge original la imatge erosionada.
Continuant la dilatació del mateix raonament que per al cas de l'erosió, arribem a una altra manera de fer-ho: restar a la imatge dilatada la imatge original. En la figura 11 tenim un exemple de detecció de contorns fent servir la dilatació amb una imatge monocromàtica.
Figura 11. Detecció de contorns mitjançant dilatació
Figura 11. Detecció de contorns mitjançant dilatació
Un cop hem transformat la imatge per a obtenir-ne exclusivament els contorns, els contorns de la imatge original es poden emfatitzar de la mateixa manera que apuntàvem en el mòdul "Transformacions espacials lineals", sumant totes dues imatges; la figura 12 mostra l'emfatització dels contorns de la imatge utilitzada en la figura 11 seguint aquest mètode.
Figura 12. Emfatització de contorns mitjançant dilatació
Figura 12. Emfatització de contorns mitjançant dilatació

2.5.Exercicis de morfologia

Exercici 1
Volem modificar la imatge nature8.pgm per tal que els cercles concèntrics s'omplin i es vegin com un cercle negre, i volem fer servir una erosió. Penseu que és una bona opció? Quina haurà de ser la mida mínima de l'element estructurant per a aconseguir l'efecte que busquem? Quin altre efecte apreciem en la imatge transformada?
Solució
L'erosió cercarà valors mínims i reduirà les zones blanques de la imatge, de manera que les línies negres concèntriques s'aniran eixamplant fins a ajuntar-se; sí que és una bona opció. Fem servir l'opció Filter/Other/Minimum; amb un element estructurant 3 × 3 (radi = 1) encara es veu una línia blanca, i amb 5 × 5 (radi = 2) aconseguim l'objectiu. A més d'omplir-se els cercles de negre, el quadrat blanc intern és més petit que abans de la transformació.
Exercici 2
Continuem amb la imatge nature8.pgm, i treballem també amb la imatge triangulo_de_ang.pgm. Apliquem a totes dues imatges una dilatació amb un element estructurant 3 × 3. Quins són els resultats de la transformació en tots dos casos? Quina conclusió podem treure respecte al gruix de les línies en totes dues imatges?
Solució
En la imatge nature8.pgm la dilatació de les zones blanques (fem servir l'opció Filter/Other/Maximum) fa que els cercles negres s'aprimin, però continuen essent visibles; en canvi, en la imatge triangulo_de_ang.pgm les línies s'esborren i només queda el fons gris. Això ens indica que les línies negres en la primera imatge són més gruixudes que en la segona.
Exercici 3
La imatge quadradets.tiff conté quadradets de diferents mides; el nostre objectiu és eliminar-ne els més petits fent servir una obertura. Quin és l'element estructurant que esborra els sis quadradets més petits? Quin element estructurant hem de fer servir en la dilatació?
Solució
En l'erosió, l'element estructurant 3 × 3 (radi = 1) és massa petit per a esborrar els quadradets; hem de fer servir un element 5 × 5. En la dilatació hem de fer servir el mateix; si no ho fem així la resta d'objectes de la imatge no es restauraran amb la mida correcta. Comprovem en la imatge transformada final que, efectivament, hem eliminat els objectes no desitjats sense distorsionar la resta d'imatges.
Exercici 4
Volem eliminar el text que apareix en la imatge cmpndd.pgm, inclòs el que se superposa a la fotografia de la part inferior. Quina transformació morfològica faríeu servir? Quins són els resultats que obtenim?
Solució
Ens cal una operació que elimini els detalls més foscos de la imatge; per tant, parlem d'una dilatació. Si hi apliquem només una dilatació aconseguim el nostre objectiu, però la resta de la imatge, que és monocromàtica, queda globalment més clara que l'original. Aplicant-hi a continuació una erosió (i, globalment, hi apliquem un tancament) enfosquim un altre cop la imatge. Cal remarcar que en la fotografia de la part inferior s'hi aprecia distorsió encara que fem servir l'element estructurant més petit de què disposem.
Exercici 5
Els objectius d'aquest exercici, que farem amb la imatge einstein.pgm, són dos: obtenir una imatge nova que contingui només els contorns de la imatge original i emfatitzar els contorns de la imatge original, en tots dos casos transformant la imatge mitjançant l'erosió. Expliqueu els passos que seguiu per a aconseguir tots dos objectius.
Solució
Primer hem de detectar els contorns de la imatge; ens cal fer una erosió, amb un element estructurant 3 × 3, i restar-hi la imatge erosionada en la imatge original. Per a fer la resta farem servir la utilitat Image/Apply image de Photoshop. La imatge que obtenim té el fons negre i sobre aquest fons es dibuixen els contorns de la imatge original. Per a emfatitzar els contorns en la imatge original només cal sumar-hi la imatge que hem obtingut anteriorment; n'obtenim una imatge amb els contorns més definits.

3.Imatges emprades en les figures

Les imatges que s'han utilitzat en les figures d'aquest mòdul per als exemples amb Photoshop són les següents:
Figura
Imatge
Adreça URL

1

soroll impulsional.tiff

S'adjunta la imatge

2

thueven.pgm

http://decsai.ugr.es/cvg/dbimagenes/gilu128.php

3

7.01.05.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

4

thueven.pgm

http://decsai.ugr.es/cvg/dbimagenes/gilu128.php

5

7.01.05.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

6

mesquadradets.tiff

S'adjunta la imatge

7

7314.pgm

http://decsai.ugr.es/cvg/dbimagenes/gal256.php

8

33b.pgm

http://decsai.ugr.es/cvg/dbimagenes/g512.php

9

quadradets.tiff

S'adjunta la imatge

10

indor4.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

11

indor4.pgm

http://decsai.ugr.es/cvg/dbimagenes/g256.php

Resum

Les operacions espacials no lineals no compleixen les condicions necessàries per a implementar-les mitjançant una màscara i una convolució espacial. En lloc d'això, queden definides per la finestra de treball i una operació en la qual el píxel de sortida es tria per comparació del nivell de gris que té amb el de la resta dels píxels de la finestra.
La mediana és una d'aquestes operacions no lineals, en què cada píxel de la imatge transformada és la mediana de la finestra de treball associada al píxel corresponent en la imatge original.
Les operacions morfològiques són una altra família d'operacions no lineals, construïdes a partir de dues operacions bàsiques, erosió i dilatació. En les operacions morfològiques la finestra de treball queda definida per l'element estructurant, una matriu similar a la màscara en què els coeficients poden tenir valor 1 o 0 segons si el píxel corresponent queda afectat per l'operació o no.
L'erosió és una operació que busca el valor mínim de nivell de gris en la finestra de treball i substitueix cada píxel de la imatge original per aquest valor mínim. En conseqüència, suprimeix els detalls més clars de la imatge i l'enfosqueix globalment.
La dilatació és una operació que busca el valor màxim de nivell de gris en la finestra de treball i substitueix cada píxel de la imatge original per aquest màxim. En conseqüència, suprimeix els detalls més foscos de la imatge i l'aclareix globalment.
Obertura i tancament són dos filtres que es defineixen a partir de les operacions anteriors: l'obertura és una erosió seguida d'una dilatació i el tancament és una dilatació seguida d'una erosió. En tots dos casos es manté l'element estructurant.
Una de les diverses aplicacions de les operacions morfològiques és l'èmfasi de contorns; els contorns d'una imatge es poden obtenir, entre altres maneres, restant-hi en la imatge original la seva versió erosionada (o restant-hi en la versió dilatada la imatge original).