xmlns:xi="http://www.w3.org/2003/XInclude" xmlns:qti="http://www.imsglobal.org/xsd/imsqti_v2p1" Tractament i publicació d'imatge i vídeo Tractament i publicació d'imatge i vídeo

L'alta definició

  • Xavier Bonet

PID_00194876
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars del copyright.

Introducció

En aquest mòdul s'analitzen els sistemes de televisió i de cinematografia digital. Això significa que se n'avaluen les propietats, aplicacions i limitacions, amb el propòsit que l'estudiant arribi a comprendre el perquè de la diversitat de formats i pugui visualitzar quina podria ser la tendència de la televisió en el futur.
Per a fer aquest estudi es comença amb una breu introducció històrica, en què es pot observar que l'alta definició és un projecte iniciat fa molts anys i al seu torn se'n pot veure la implementació en el mercat mundial. Posteriorment s'analitzen els paràmetres que defineixen els diferents formats d'alta definició.
Respecte de la metodologia, aquesta és una assignatura amb una dimensió teòrica important, que al seu torn es reforça amb una sèrie d'activitats que tenen el propòsit de facilitar l'adquisició de les competències plantejades.
Per a tenir una visió global de la dimensió dels temes tractats, és molt important que es busquin exemples de les qüestions plantejadesi es contrastin.
Finalment, és important que per a contrastar les dades explicades en els apunts es consultin els webs d'alguns dels fabricants dels formats estudiats.

Objectius

Des de l'aparició de la televisió fins a l'actualitat, les característiques de la televisió han evolucionat enormement, evolució que ha estat paral·lel a la que ha fet el cinema, fins a arribar al punt en el qual en l'actualitat està prenent molt protagonisme el concepte de cinema a casa o home cinema. Per complir aquest propòsit, les grans empreses destinades a la fabricació de pantalles han fet un gran esforç per fer arribar pantalles grans a casa dels usuaris.
El propòsit d'aquest mòdul és explicar les bases històriques i tecnològiques en què es basen els sistemes de televisió d'alta definició actuals, de manera que una vegada finalitzada la lectura s'hagin adquirit els conceptes que en justifiquen les característiques, formats intermedis i limitacions.
Aquests objectius estan relacionats amb les competències de l'assignatura següents:
a) Competències generals del grau a què respon:
4. Capacitat per a adaptar-se a les tecnologies i als entorns futurs actualitzant les competències professionals.
11. Ser capaç d'analitzar un problema en el nivell d'abstracció adequat a cada situació i aplicar les habilitats i coneixements adquirits per a abordar-lo i resoldre'l.
22. Atendre adequadament consultes sobre projectes, tecnologies i mercat de productes multimèdia avaluant de manera precisa l'entorn d'aplicació, els recursos i les alternatives tecnològiques disponibles.
b) Competències de l'assignatura:
C. Capacitat de distingir les opcions factibles de les que no ho són en un estudi d'especificacions d'un projecte, sistema o tasca.
E. Capacitat d'escollir amb criteris fonamentats entre vídeo analògic i digital per al seu ús en una situació concreta.
F. Capacitat per a editar i comprimir un vídeo digital de manera eficient i eficaç.

1.Introducció històrica

Uns dels primers promotors de l'alta definició van ser els japonesos, que amb el Dr. Fujio de la televisió pública japonesa Nippon Hôsô Kykai (NHK) van crear el projecte MUSE, també conegut com a Hi Vision al final dels anys setanta. Es tractava d'un sistema de televisió analògic que oferia 1.125 línies de resolució vertical, de les quals 1.035 eren realment actives en la pantalla. En aquest cas va ser una de les primeres vegades en què es va fer una aposta clara pels sistemes de televisió panoràmics, establint una relació d'aspecte de pantalla de 5:3, la qual cosa és equivalent a 15:9 i, al mateix temps, es van incorporar dos canals d'àudio amb una qualitat equivalent a la del CD.
Paral·lelament als EUA, el 1977, la Society of Motion Picture and Television Engineers (SMPTE) crea un grup de treball que tres anys més tard acaba presentant un sistema de 1.100 línies de resolució vertical amb una relació d'aspecte de pantalla de 2:1. Llavors, el 1979 l'NHK va presentar el seu sistema MUSE (analògic) al Comitè Federal de Comunicacions (FFC) dels EUA.
Al cap de pocs anys, concretament el 1983, als EUA es va crear l'Advanced Television Systems Committee (ATSC), organització que tenia com a propòsit definir i coordinar un estàndard de televisió d'alta definició que treballés mitjançant tecnologia digital, el qual va tenir el mateix nom que l'organització que el va crear. Però no és fins a tretze anys més tard, el desembre de 1996, que el Comitè Federal de Comunicacions (FFC) dels EUA adopta l'ATSC com un nou sistema de televisió d'alta definició basat en tecnologia digital, com també tots els requisits i estàndards necessaris per a la difusió d'aquesta tecnologia per cable, terrestre i per satèl·lit.
També al principi dels anys vuitanta a Europa es va desenvolupar un sistema que es denominava de definició millorada (1) , conegut com a MAC. Aquesta tecnologia utilitzava pantalles amb una relació d'aspecte de 16:9, però amb la mateixa quantitat de línies que el sistema PAL. És a dir que oferia millor qualitat que el sistema PAL, però no es tractava en realitat d'un sistema d'alta definició.
El 1986, com a primer pas cap a l'adopció de l'estàndard de producció MUSE, l'NHK presenta al Comitè Consultiu Internacional de Radiocomunicacions (CCIR) els plànols de disseny i les especificacions del seu sistema. Abans d'acceptar la tecnologia japonesa com a nou estàndard internacional i davant de l'amenaça que representa per la seva indústria de l'electrònica de consum, la Comunitat Econòmica Europea (CEE) crea el projecte Eureka-95. Dins d'aquest projecte es crea l'HD-MAC, que és el primer sistema d'alta definició europeu basat en senyal analògic, amb 1.250 línies de les quals 1.152 són actives i 50 Hz, i que utilitza el satèl·lit per a la seva difusió. Finalment, així com el MUSE va tenir cert èxit al Japó i els Estats Units, a Europa l'HD-MAC pràcticament no va sortir del laboratori.
Aquests són alguns dels pocs esdeveniments destacables que es van retransmetre mitjançant la tecnologia HD-MAC:
  • La copa del món de futbol d'Itàlia 1990

  • La conferència sobre l'Orient Mitjà celebrada a Madrid 1991

  • Els Jocs Olímpics de Barcelona i l'Expo de Sevilla 1992

L'elevat cost dels equips de producció, l'amplada de banda excessiva que necessitava per a la seva transmissió (36 MHz), la falta de pantalles de mida adequada i de gravadors capaços d'acceptar senyals de televisió d'alta definició, i l'arribada imminent de la televisió digital van ser alguns dels motius pels quals el 1993 es va abandonar la norma HD-MAC. A partir d'aquell moment la Unió Europea de Radiodifusió (UER) es va dedicar especialment al desenvolupament del digital video broadcasting (DVB) en totes les variants que van des del disseny d'especificacions que regulen la difusió de senyals de qualitat estàndard SDTV fins a l'alta definició per cable, terrestre i per satèl·lit.
El maig del 1993, als EUA es constitueix la Grand Alliance, que és un consorci integrat per AT&T, Zenit, el centre d'investigació de David Sarnoff, General Instrument Corporation, MIT, Philips i Thompson. Aquest consorci és el que acaba definint l'estàndard Advanced Television Systems Committee (ATSC) per emetre HD mitjançant la difusió terrestre, és a dir, la TDT. Quan aquest estàndard apareix, ja ho fa amb una resolució màxima de 1.920 × 1.080 píxels, la qual cosa multiplica per sis la mida de la imatge. De tota manera, mitjançant la codificació de vídeo en MPEG-2, el 2009 es va fer una revisió de l'especificació i des de llavors també suporta l'AVC/H.264.
Paral·lelament al Japó també es va desenvolupar un sistema de televisió digital d'alta definició denominat integrated services digital broadcasting (ISDB). El 1999 es va adoptar la ISDB-T com a estàndard de difusió terrestre de l'alta definició digital, però no va ser fins al 2003 que aquest senyal va arribar a les cases dels espectadors. Actualment, al Japó amb la ISDB es poden rebre senyals d'alta definició per cable, terrestre, per satèl·lit o per mòbil amb una resolució de 1.920 × 1.080 píxels.
A Europa, després del fracàs del sistema d'alta definició analògic HD-MAC es van centrar a desenvolupar el DVB, que en l'actualitat permet la difusió de material audiovisual via satèl·lit, cable, terrestre i telefonia mòbil, que avui ja suporta la definició de vídeo estàndard així com l'alta definició.
Actualment a Europa, els EUA i el Japó la difusió de continguts en alta definició ja és una realitat que es troba gairebé totalment implementada: a Europa sota l'especificació definida en la norma DVB, als EUA mitjançant l'ASTC i al Japó amb l'ISBN. Tots suporten la codificació de senyals comprimides sota els estàndards MPEG-2 com també l'actual MPEG-4 AVC/H.264; és a dir, tots suporten una resolució Full HD de 1.920 × 1.080 píxels.

2.Resolució de la imatge d'alta definició

Així com la traducció literal de l'HDTV és televisió d'alta definició, potser seria més adequat anomenar-la televisió de pantalla ampla. Això és perquè el propòsit inicial de l'alta definició no és lliurar a l'usuari una imatge d'una qualitat superior a la que ja tenia amb la definició estàndard, sinó poder oferir a l'espectador una pantalla gran, sense que aquest hagi d'augmentar la distància de visionament. D'aquesta manera s'incrementa l'angle de cobertura visual de l'espectador i es millora l'experiència audiovisual. Per a augmentar la superfície de pantalla mantenint la distància de separació entre píxels (és a dir, sense saturar l'agudesa visual), és necessari incrementar la quantitat de píxels de la imatge, és a dir, la resolució.
Però quant s'hauria d'augmentar la resolució de la imatge?
La televisió de definició estàndard requereix una distància de visionament de sis vegades l'altura de la pantalla. Si aquesta distància es compleix, l'ésser humà és incapaç de percebre la separació entre píxels i, consegüentment, percep una imatge homogènia.
Una fórmula per a comprovar la relació entre la mida de la pantalla i la resolució de la imatge seria la següent:
76524_m8_009.gif
En què:
  • Nv correspon a la quantitat de píxels de resolució vertical de la imatge.

  • α correspon a l'angle mínim discernible per l'ull (en radiants).

  • n correspon a d/h (distància de visionament partit per l'altura de la imatge).

Tenint en compte l'expressió següent, es pot deduir que en una pantalla observada a una distància de sis vegades la seva altura es pot reproduir una imatge amb una resolució vertical aproximadament de 550 píxels:
76524_m8_010.gif
I que, en observar una pantalla a una distància de tres vegades la seva altura, la quantitat de píxels de resolució vertical necessaris ha de ser aproximadament de 1.100.
76524_m8_011.gif
És a dir, en reduir a la meitat la distància de visionament, s'obliga a duplicar la quantitat de línies per a mantenir el mateix angle crític d'agudesa visual.
Segons una enquesta feta a Estocolm, si els usuaris poden escollir una mida de pantalla, aquesta es troba entre les 30" i les 40" de mitjana. En una altra prova, aquesta vegada feta per la BBC, es van posar cent setanta persones davant diferents pantalles de grans dimensions i es va comprovar que se situaven a una distància mitjana d'uns 2,7 m.
A aquests usuaris se'ls van mostrar imatges en què la meitat de la pantalla contenia una part de la imatge a una resolució de 4 k i l'altra meitat de la pantalla tenia una resolució inferior. Es va comprovar que, col·locant imatges de 720 × 576 píxels en la meitat de menys resolució, l'agudesa visual se saturava en pantalles situades entre les 22" i les 28", és a dir que amb aquestes pantalles, a una distància d'uns 2,7 m, l'espectador no era capaç de detectar quina part de la imatge tenia 4 k i quina part tenia poca resolució.
La mateixa prova es va fer col·locant en la regió de menys qualitat una resolució de 1.280 × 720 píxels, i es va comprovar que la saturació visual s'aconseguia amb pantalles que es trobaven entre les 28" i les 42". Això significa que, amb aquestes pantalles, alguns espectadors ja eren capaços de discernir la meitat d'alta resolució de l'altra meitat de menys resolució. I en repetir la prova amb una resolució de 1.920 × 1.080 píxels la saturació visual es produïa amb pantalles d'entre 42" i 60".
En conclusió, a una distància de visionament d'uns 2,7 m i essent cauts, en una pantalla de 22" no s'haurien de reproduir imatges de qualitat inferior a 720 × 576 píxels. Amb pantalles de 28" no s'haurien de reproduir imatges amb una resolució inferior a 1.280 × 720 píxels, i amb pantalles de 42" no s'haurien de reproduir imatges de menys de 1.920 × 1.080 píxels. Si no fos així, possiblement la imatge es veuria pixelada.
Segons la norma UIT BT.709, una imatge d'alta definició és la que es pot veure a una distància de tres vegades l'altura de la pantalla sense que s'apreciïn defectes; és a dir, percebent una qualitat d'imatge transparent.
Exemple
Si es considera una pantalla de 16:9 com un rectangle, cada costat d'aquest rectangle es pot expressar com el producte de la hipotenusa (d) pel sinus i el cosinus de l'angle que forma la hipotenusa amb el catet contigu.
Figura 1. Proporcions d'imatge en un format 16:9 i la seva representació trigonomètrica
Figura 1. Proporcions d'imatge en un format 16:9 i la seva representació trigonomètrica
76524_m8_012.gif
Per tant, una pantalla de 22" s'hauria de veure a una distància de 3 × (0,49 × 22"); és a dir, a unes 32", que equivalen a uns 2,54 × 32" = 81 cm. Una pantalla de 42" s'hauria de veure a una distància d'uns 156 cm; és a dir, uns 1,5 m com a mínim. Això significa que si l'espectador se situa a una distància inferior a aquesta podria percebre una pèrdua de resolució.
Observant la relació entre la mida de les pantalles i les distàncies de visionament es pot deduir que, amb l'alta definició, es duplica la resolució horitzontal i vertical de la pantalla, i que la relació d'aspecte passa de 4:3 (12:9) a 16:9. Això es tradueix en el fet que la superfície de la pantalla pràcticament es multiplica per 5:
Figura 2. Proporcions entre formats de televisió amb definició estàndard i els d'alta definició
En l'esquema es poden veure les proporcions entre formats de televisió amb definició estàndard i els d'alta definició en funció de la relació d'aspecte utilitzada, tots amb una relació d'aspecte de píxel quadrat:
En l'esquema es poden veure les proporcions entre formats de televisió amb definició estàndard i els d'alta definició en funció de la relació d'aspecte utilitzada, tots amb una relació d'aspecte de píxel quadrat:
En augmentar la mida de la pantalla i modificar la relació d'aspecte, l'angle horitzontal de visionament es multiplica per 2,6. Concretament, amb definició estàndard l'angle visual vertical és d'uns 10° i l'horitzontal és de 13,3°. En canvi, amb alta definició, l'angle de visionament vertical és de 20° mentre que l'horitzontal augmenta fins a 20 × (16/9) = 34°.
Figura 3. Angle de visió horitzontal en els diferents sistemes de televisió
Figura 3. Angle de visió horitzontal en els diferents sistemes de televisió

2.1.Implicació en l'amplada de banda

Com s'acaba de veure, una imatge d'alta definició (a partir d'ara l'expressarem com a HDTV (2) ) requereix una imatge amb una resolució cinc vegades superior a la d'una imatge amb una definició estàndard (que a partir d'ara expressarem com a SDTV (3) ).
Això té repercussions clares en l'amplada de banda del senyal, ja que aquest també augmenta entre cinc i sis vegades. Si un senyal digital de definició estàndard de 720 × 576 píxels amb cinquanta camps entrellaçats genera uns 170 Mbps. Per la seva banda, un senyal d'HDTV de 1.920 × 1.080, també de cinquanta camps entrellaçats, genera una amplada de banda de 900 Mbps. Actualment, les modernes tècniques de modulació digital permeten ubicar en un canal UHF convencional uns 20 Mbps.
Gràcies a les tècniques de compressió digital, és possible reduir els 170 Mbps del senyal SDTV a només 4 Mbps, i els 900 Mbps del senyal d'HDTV a 20 Mbps. Així es poden transportar fins a cinc programes diferents d'SDTV per un sol canal UHF. Aquest és el resultat d'aplicar les potents tècniques de compressió que incorpora l'MPEG-2 present en tota mena d'aplicacions digitals, des del DVD fins a la televisió digital terrestre (TDT). Però l'MPEG-2 és un estàndard que ja té més de deu anys d'història i això, en tecnologia digital, és molt de temps. No és que l'MPEG-2 hagi quedat obsolet, ja que continuarà essent la base de sistemes com el DVD o la TDT, però ara es disposa d'un nou sistema de compressió: l'MPEG-4.
El sistema MPEG-4 és més potent i és capaç de codificar les imatges de televisió amb almenys el doble de resolució per a la mateixa amplada de banda. Per tant, amb l'MPEG-4 és possible transmetre fins a deu canals de SDTV o dos canals d'HDTV per cada canal d'emissió UHF.
Això significa que des de la denominada apagada analògica queda lliure una gran quantitat de canals de manera que els canals UHF es poden utilitzar per a televisió digital, tant en SDTV com en HDTV. Tenint en compte que gairebé hi ha cinquanta canals UHF és clar que es disposarà d'amplada de banda més que suficient i tot això sense tenir en compte altres mitjans de transmissió, com la televisió per satèl·lit o per cable.

3.Mètodes d'escaneig entrellaçat i progressiu

Històricament, els sistemes de televisió analògics com el PAL treballaven amb un escaneig entrellaçat de la imatge.
L'escaneig entrellaçat de la imatge implica que cada fotograma es divideix en dues semiimatges de la meitat de resolució vertical i aquestes es reprodueixen en lloc del fotograma sencer. Això fa que, utilitzant l'entrellaçament, en el temps corresponent a un fotograma es projectin dues semiimatges o camps de tal manera que la quantitat d'impactes visuals que rep l'espectador és del doble per unitat de temps. El propòsit d'això és minimitzar el parpelleig, ja que aquest es redueix a la meitat en passar, per exemple, de 25 FPS a cinquanta camps.
Òbviament, la millor solució per a minimitzar l'efecte de parpelleig de la imatge hauria estat duplicar la quantitat de fotogrames per segon, però això hauria implicat el doble d'amplada de banda, i aquesta era una condició que no es podia acceptar.
Actualment, la gran majoria d'espectadors que visualitzen imatges d'alta definició ho fan amb una pantalla plana LCD, de plasma, DLP, etc., i totes utilitzen l'exploració progressiva com a mètode d'escaneig.
Com s'ha comentat, l'exploració entrellaçada va ser un truc enginyós per a estalviar amplada de banda en l'era analògica. Un sistema d'exploració entrellaçada redueix a la meitat les necessitats d'amplada de banda respecte a un sistema d'exploració progressiva, però, d'altra banda, introdueix molts problemes. Quan fa vuitanta anys es va inventar la televisió, probablement era la millor solució. Actualment, les tècniques digitals han deixat obsolet el mètode entrellaçat. Les pantalles d'ordinador dels anys vuitanta permetien escollir entre l'exploració entrellaçada i la progressiva, però des del principi dels noranta l'exploració entrellaçada ha caigut en desús en les aplicacions informàtiques, fins i tot quan s'empren tubs de rajos catòdics, perquè ja no és necessària i només introdueix problemes.
D'altra banda, les tècniques de compressió donen millors resultats amb material originat de manera progressiva que amb material entrellaçat. Els reproductors de DVD actuals disposen de senyals de sortida amb exploració progressiva i, a l'hora de vendre un producte, constitueixen un dels atractius principals. En altres paraules, progressiu s'ha convertit en sinònim de modern.
Quan es va començar a parlar d'un d'estàndard d'HDTV comú per a tot el món, la UER va considerar la possibilitat que Europa canviés a un sistema de 60 Hz, amb la intenció de facilitar la màxima similitud amb els sistemes americans. Certament resulta atractiu tenir la mateixa norma per a tot el món, sense l'eterna divisió entre les regions de 50 Hz i les de 60 Hz. A més, seixanta imatges per segon reprodueixen millor el moviment alhora que redueixen el parpelleig, sobretot en pantalles grans. Alguns han considerat que vuitanta imatges per segon serien perfectes per a la reproducció del moviment i la reducció del parpelleig. En qualsevol cas, en les reunions que van mantenir els diferents organismes, no va ser possible posar-se d'acord, de manera que actualment hi ha famílies de normes de 50 Hz i de 60 Hz, a les quals cal afegir les de 24 Hz procedents del cinema.
L'exploració entrellaçada es pot utilitzar com a senyal d'entrada per als sistemes de compressió avançats i en les pantalles planes, encara que resulta menys eficaç que la progressiva. Igualment per a la transmissió i la conversió de normes, l'entrellaçament resulta menys adequat i introdueix més artificis en presència de moviment. En l'actualitat es disposa de xips que duen a terme el procés de desentrellaçament capaços de convertir imatges entrellaçades en progressives, amb compensació de moviment. Aquests processadors analitzen quina part de la imatge s'ha mogut en el temps corresponent al camp i desplacen selectivament els segments d'imatge adequats. El resultat és similar, encara que inferior, a com seria la imatge si s'hagués pres en mode progressiu. El preu d'aquests xips és relativament baix, de manera que actualment l'incorporen moltes pantalles que es poden trobar en el mercat.

3.1.Avantatges del mètode d'escaneig progressiu

Tot el que s'estalvia en amplada de banda utilitzant l'escaneig entrellaçat seguit d'un sistema de compressió digital, es pot fer millor amb imatges d'entrada progressives i un sistema de compressió capaç d'adaptar-se al contingut. És a dir, que una vegada s'introdueixen les tècniques de compressió, pel que fa a l'amplada de banda ja no compensa la utilització de l'entrellaçament.
Resulta relativament fàcil convertir un senyal progressiu en un senyal entrellaçat, però és bastant més difícil convertir una imatge entrellaçada en una de progressiva sense que s'hi generin artificis i defectes. El receptor necessita utilitzar algoritmes diferents per a les zones estàtiques i per a les zones en moviment de la imatge. La complexitat és que es tracta de compensar informació que ja no és en la imatge. Una vegada que el segment superior de l'espectre verticotemporal s'ha perdut per l'intercalat, ja no es pot recuperar. En cas d'haver de fer una conversió d'entrellaçat a progressiu, seria millor fer-ho una vegada amb equip car abans de l'emissió, que no milers o milions de vegades en cada un dels receptors. Això apunta que l'emissió es faci en qualsevol cas en mode progressiva.
A partir de l'experiència d'alguns radiodifusors americans que treballen amb un sistema progressiu, es veu que l'exploració progressiva és especialment adequada per a la retransmissió de programes esportius, en què es produeix un moviment ràpid. Aquestes millores es noten tant en la reproducció normal com en la càmera lenta.
En cinema sempre s'han utilitzat 24 FPS, però el món del cinema sempre s'ha mogut per mons diferents de la televisió. Tanmateix, amb l'arribada de l'HDTV apareix l'anomenada cinematografia digital, de manera que els 24 FPS passen a ser una cadència d'imatge vàlida en HDTV.
En general, es reconeix que els sistemes progressius presenten avantatges sobre els entrellaçats, però la tecnologia no és encara prou madura per a abandonar totalment l'entrellaçament en tots els casos. Així que, treballant en progressiu, es presenten les possibilitats següents: 23,97p, 24p, 25p, 29,97p, 30p, 50p, 59,94p i 60p; és a dir, vuit possibles freqüències d'imatge en mode progressiu. En mode entrellaçat només es presenten tres alternatives: 50i, 59,94i i 60i. En total, onze possibles cadències diferents de freqüència d'imatge.
Perquè els senyals que treballen amb totes aquestes freqüències temporals es puguin distribuir per la mateixa interfície, es normalitza una freqüència de mostreig de la luminància comuna i aquesta és de 74,25 MHz; és a dir, en total hi haurà 74.250.000 píxels de mostres de luminància per segon, encara que evidentment no totes seran actives. Aquesta interfície comuna servirà per a tots els sistemes temporals, excepte per als tres més exigents (50p, 59,94p, 60p). Aquesta interfície per a la distribució de senyals d'HDTV, es denomina HD-SDI.

3.2.Resolucions utilitzades en l'HDTV

La recomanació UIT BT.709 preveu diferents formats vàlids per a l'HDTV. Entre aquests els més comuns són els denominats 720, amb una resolució de 1.280 × 720 píxels, i els denominats 1.080, amb 1.920 × 1.080 píxels de resolució.
En aquests formats el tipus d'escaneig de la imatge té molta importància; per aquesta raó, aquest paràmetre s'inclou en la nomenclatura del format. D'aquesta manera es poden classificar els formats d'HDTV segons si són 720i, 720p, 1080i o 1080p.
Aquesta situació es tradueix en el fet que bàsicament hi ha dues resolucions que poden treballar mitjançant un escaneig entrellaçat (interlaced) –la 720i i la 1080i–, i dues que utilitzen l'escaneig progressiu d'imatge (progresive) –la 720p i la 1080p.
Òbviament, per a la qualitat d'imatge l'opció més avantatjosa és la que treballa a 1080p, ja que és la que té una resolució d'imatge millor i, a més, utilitza un escaneig progressiu. De fet, la gran majoria de pantalles planes de televisió que hi ha en l'actualitat treballen en 1080p. Però, avui dia, els requeriments tècnics dels formats difosos en 1080p són sovint massa elevats. Per aquesta raó, fins que no s'arribi a emetre de manera generalitzada en 1080p, la "batalla" es troba entre els formats 720p50 i el 1080i25, és a dir, entre un format de menys resolució vertical amb escaneig progressiu i 50 FPS (720p50), i un altre amb més resolució vertical amb escaneig entrellaçat i a 25 FPS (1080i25). Els dos formats tenen pràcticament la mateixa amplada de banda i cada un té avantatges i desavantatges respecte al seu competidor.
Els partidaris del sistema 1080i segurament acudiran a l'argument que el sistema 1080 ofereix 2,25 vegades més píxels que el 720p. Però si es mira amb deteniment una imatge entrellaçada es poden apreciar artificis com l'interline twitter (parpelleig interlineat), efecte que apareix quan la imatge conté ratlles horitzontals fines molt contrastades respecte al fons. Aquest defecte redueix la resolució vertical efectiva. Moltes proves fetes per radiodifusors, fabricants d'equips, etc. demostren que, en termes subjectius, 720p i 1080i proporcionen bàsicament la mateixa resolució vertical.
El format 1920 × 1080 proporciona més resolució horitzontal que el sistema 1280 × 720. La relació entre tots dos sistemes seria de 1280/1920 = 0,67; és a dir, el sistema de 720 línies només proporciona un 67% de la resolució, en comparació amb el sistema de 1.080 línies. A la pràctica, els CCD de l'aproximadament 80% de les càmeres que treballen amb 1.080 línies només disposen de 1.440 píxels per línia i no dels 1.920 nominals. Atès que es tracta de sensors CCD amb relació d'aspecte 16:9, aquests no empren "píxels quadrats" sinó apaïsats, la qual cosa implica que les càmeres de 720 línies proporcionen una resolució horitzontal equivalent a un 89% de la resolució de les càmeres de 1.080 línies. Igualment moltes pantalles actuals etiquetades com a HDTV no arriben als 1.920 píxels de resolució horitzontal.
Resumint, el sistema 1080i ofereix bàsicament la mateixa resolució vertical que el 720p, mentre millora lleugerament la resolució horitzontal.
La resolució és important en el cas d'imatges estàtiques, però les imatges de televisió rarament ho són. Per exemple, la majoria dels esdeveniments esportius inclouen moviments ràpids i zooms inesperats. Sembla que tothom està d'acord que per a reproduir el moviment resulta més adequat un sistema d'exploració progressiu que un entrellaçament, especialment quan s'ha de congelar la imatge o fer una càmera lenta (slow motion). L'elecció entre 720p i 1080i és una solució de compromís entre la resolució estàtica i la reproducció fluida del moviment. En l'actualitat la majoria de cadenes que emeten en alta definició utilitzen un dels dos formats, i utilitzar-ne un o un altre només depèn de la decisió dels seus directius.
Al Japó tots els radiodifusors utilitzen el format 1080i, i mentre que als EUA la majoria també empra el 1080i, alguns molt orientats a esports que han optat pel 720p.
La UER (4) recomana el 720p com a format d'emissió d'HDTV en una primera etapa. La causa és la disponibilitat de pantalles planes que utilitzen un escaneig progressiu. Per a tots, el format més desitjable és sens dubte el 1080p50 o el 1080p60.
De tota manera, en l'actualitat, els formats 1080p només tenen sentit si els continguts es troben emmagatzemats en un Blu-Ray o en algun suport d'emmagatzemament com ara un disc dur. El problema d'aquest format apareix quan cal transmetre senyals per mitjà d'algun sistema de difusió com la TDT que, tal com s'ha vist, es troba amb un espectre radioelèctric limitat. Possiblement, aquesta limitació d'amplada de banda se solucionarà quan els centres difusors i els receptors dels usuaris incorporin de manera generalitzada sistemes de compressió prou eficients, com l'H.264, per a poder ubicar el programa en 1080p dins del canal de difusió convencional, o quan els difusors prefereixin tenir menys canals de continguts però una qualitat d'imatge superior.
Aquesta limitació tan evident de la TDT o la difusió per satèl·lit evoluciona en paral·lel a l'increment de l'amplada de banda a Internet. Quan un usuari gaudeixi d'una connexió en banda ampla capaç de suportar fluxos de dades constants d'entre uns 5 Mbps i 10 Mbps serà capaç de poder veure en temps real programes produïts en 1080p. Actualment la majoria plataformes de serveis tenen ofertes de connexions ADSL amb contractes de fins a 20 Mbps, però la realitat demostra que aquest flux de dades es pot aconseguir molt poques vegades.
D'altra banda, les línies ADSL ja es troben en el seu màxim rendiment, i les plataformes s'estan orientant sobretot a oferir al client serveis per mitjà de fibra òptica que arribaria directament a l'usuari final. Aquesta alternativa que permetria oferir fluxos de dades deu vegades superiors als actuals és molt vàlida per a grans ciutats i les seves rodalies, però no ho és per a les regions allunyades dels nuclis urbans i amb poca densitat de població, ja que als operadors no els compensa fer una inversió tan important si no la poden recuperar.
També cal tenir present que la connexió a Internet en la majoria dels països és de pagament, mentre que la TDT és per al client un servei que no ha de pagar de manera directa. A més, amb la TDT hi ha la possibilitat de rebre la televisió mentre el receptor està en moviment, amb una qualitat superior a la que ofereixen els sistemes d'Internet per a mòbil.
En qualsevol cas, en l'actualitat no hi ha cap tecnologia que sobresurti clarament respecte a les altres i de moment sembla que estan destinades a continuar compartint el mercat.

3.3.El 1080p, un format de futur

D'on surten els valors 1.920 × 1.080? Com és sabut els formats d'SDTV utilitzen una resolució horitzontal de 720 píxels. En voler obtenir un format d'alta definició, van voler duplicar aquest valor i van obtenir una resolució horitzontal de 1.440 píxels. De tota manera, un format de 1.440 × 1.080 té sentit si s'utilitza una relació d'aspecte de pantalla de 4:3, ja que (1.440/4) × 3 = 1.080. Això no obstant, un dels requisits de l'HDTV era augmentar la relació d'aspecte a 16:9. Això implicava que, si es modificava la relació d'aspecte de la pantalla i es volia mantenir una relació d'aspecte de píxel quadrada, havia d'augmentar la resolució horitzontal de la imatge fins a 1.920, ja que (1.080/9) × 16 = 1.920.
Utilitzar píxels quadrats és un avantatge, ja que facilita el processament de les imatges durant la producció i sobretot simplifica la conversió entre formats d'imatge. En informàtica sempre (o gairebé sempre) s'han utilitzat píxels quadrats (640 × 480, 800 × 600, 1024 × 768, etc.). El valor també és divisible per 2, la qual cosa el fa òptim a l'hora d'implementar les tècniques de compressió.
El 1.920 × 1.080 va ser acceptat i reconegut per la UIT com a format comú d'imatge (CIF (5) ) per a tot el món per primera vegada en la història de la televisió. A la pràctica, s'està utilitzant la resolució temporal 24p o el 50/60i, encara que s'espera que a mesura que la tecnologia progressi s'imposi el més exigent 50/60p, que proporciona la màxima resolució amb la millor reproducció del moviment. Això és especialment important en la producció en què es vol la màxima qualitat. A partir del format 1.920 × 1.080 50/60p es pot obtenir, per filtratge, qualsevol altre format, ja que l'espectre tridimensional (horitzontal, vertical i temporal) del senyal 1.920 × 1.080 50/60p és capaç de contenir els espectres d'altres normes.
Quan un subformat com el 720p o el 1080i s'obté a partir del format 1920 × 1080p està comprovat que la qualitat és superior a la que s'obtindria si s'hagués gravat des d'origen en el subformat natiu; és a dir, si la imatge s'obtingués directament en el format inferior.

3.4.L'ultra high definition (UHD) o super hi-vision

Actualment hi ha un format en ple desenvolupament que oferiria resolucions molt superiors a l'HDTV, aquest format impulsat per l'NHK proposa dos estàndards: UHD 2160 i UHD 4320. En el primer cas es tractaria d'un senyal amb una resolució de 3.840 × 2.160 píxels i en la segona opció es tindria una imatge de 7.680 × 4.320 píxels de resolució. Les primeres propostes i especificacions d'aquests possibles futurs estàndards es recullen en els documents SMPTE 2036 o la UIT-BT.1706.
La característica principal del format ultra high definition és que la seva resolució implica multiplicar per 16 la resolució d'imatge de l'HDTV o, dit d'una altra manera, mantenint la mateixa separació entre píxels, les pantalles del sistema UHD 4.320 són 16 vegades més grans que les de 1.080, mantenint-se la relació d'aspecte de 16:9.
Dins de la recomanació s'especifica que aquestes imatges s'han de veure a 0,75 vegades l'altura de la pantalla; en aquesta distància i amb les dimensions de la pantalla l'angle de visió arriba a ser de fins a 100°. L'únic inconvenient d'aquestes proporcions és que possiblement l'acció s'ha de centrar en les regions centrals de la pantalla si no es vol que l'espectador estigui tota l'estona girant el cap per a poder seguir l'acció. Alguns estudis demostren que l'espectador prefereix veure la totalitat de la pantalla abans d'haver d'escollir i, per tant, renunciar a part de la imatge.
Figura 4. Relació entre els formats d'HDTV, els de d-cinema i els de super hi-vision
Figura 4. Relació entre els formats d'HDTV, els de d-cinema i els de super hi-vision
Encara no és clar quina en serà l'aplicació principal. Lògicament si en l'àmbit de la televisió s'utilitza l'HDTV un sector que pot adquirir aquest format podria ser el cinema digital. De tota manera tampoc no seria estrany trobar pantalles per a l'ús domèstic amb grans dimensions (60", 80", 100" o més) que vistes a 0,75 vegades l'altura de la pantalla permetessin una sensació totalment cinematogràfica a casa.
Així com el so, en els formats de televisió d'alta definició coincideix amb les configuracions cinematogràfiques (i en el mercat bàsicament hi ha els formats Dolby Digital, Dolby TrueHD, DTS, DTS-HD, MPEG-2 i MPEG-4 amb totes les seves variants i especificacions), el super hi-vision també ofereix una nova configuració d'àudio multicanal per a aplicacions en sales de cinema.
Figura 5. Distribució d'altaveus en funció dels canals d'àudio en el sistema super hi-vision
Figura 5. Distribució d'altaveus en funció dels canals d'àudio en el sistema super hi-vision
Ja que inicialment, i pensant en el super hi-vision com un sistema per a la difusió en pantalles cinematogràfiques, es divideix l'espai en diferents nivells en funció de l'altura de la sala i s'ubica una gran quantitat de petits altaveus en la part frontal. El sistema bàsicament és capaç de suportar fins a vint-i-dos canals d'àudio diferents més dos canals destinats als subwofers (és a dir, a les freqüències més greus).

3.5.La cinematografia digital

El cinema mai no ha tingut en compte el món de la televisió i, si alguna vegada l'hi ha tingut, ha estat per allunyar-se'n. Per aquesta raó en cinematografia no coincideixen ni la resolució d'imatge, ni les relacions d'aspecte ni la quantitat de fotogrames per segon.
Com que el cinema històricament s'ha gravat fonamentalment sobre un negatiu de 35 mm i tota la superfície del suport és sensible a la llum, tan sols és necessari col·locar una màscara o catch entre l'òptica i el negatiu per a escollir la relació d'aspecte que més interessi.
Per aquesta raó hi ha múltiples relacions d'aspecte cinematogràfiques i cap no coincideix amb els 16:9 (1,78) de l'HDTV. En l'actualitat, bàsicament hi ha dues relacions d'aspecte relacionades amb el cinema: la 1,85:1 i la 2,39:1.
Figura 6. Proporcions entre formats de d-cinema en funció de la relació d'aspecte d'imatge
Figura 6. Proporcions entre formats de d-cinema en funció de la relació d'aspecte d'imatge
Així com en la televisió digital hi ha una gran quantitat d'organismes que es dediquen a buscar i definir estàndards comuns que permetin l'intercanvi de continguts audiovisuals, com l'SMPTE, UIT, UER, ETSE, etc., en l'àmbit cinematogràfic no hi ha cap organisme oficial que assumeixi aquesta tasca. Per aquesta raó els principals productors i distribuïdors de cinema de Hollywood, els denominats majors, s'han unit per buscar conjuntament un estàndard que els permeti treballar a tots amb els mateixos paràmetres, denominat Digital Cinema Initiative (DCI). De fet, a causa que el 80% del mercat cinematogràfic mundial el cobreix el mercat americà, l'impacte sobre el sector és molt rellevant.
Al contrari de l'HDTV, la nomenclatura associada a la resolució d'imatge en cinema digital o d-cinema no es basa en la resolució vertical sinó en la resolució horitzontal; és a dir, en la quantitat de píxels que hi ha en l'amplada de la imatge. D'aquesta manera, actualment en d-cinema hi ha dues resolucions estandarditzades, els formats 2K i 4K.
Inicialment quan el cinema es gravava sobre un negatiu de, per exemple, 35 mm, es col·locava una espècie de màscara sobre el negatiu per a aconseguir la relació d'aspecte desitjada. En l'actualitat, durant tot el procés de producció el d-cinema també grava i utilitza formats sencers, denominats full aperture (FA), open gate o, en català, finestreta oberta, i posteriorment hi aplica un retall o catch en la postproducció. Aquests formats tenen una resolució de 2K FA (2.048 × 1.356) píxels, i en 4K FA (4.096 × 3.112) i s'hi treballa durant tot el procés de producció.
Si s'observa la relació d'aspecte dels formats 2K FA i 4K FA es pot veure que no es tracta de formats panoràmics, sinó que són gairebé 4:3 (com el negatiu de 35 mm). Posteriorment, en la sala de postproducció, el realitzador i el muntador reenquadraran la imatge ubicant-la en un catch d'1,85 o 2,39. Això significa que, habitualment quan es grava en cinema digital, el realitzador o director té unes marques a la pantalla que li indiquen on quedarà retallada la imatge en la difusió. Però si en el rodatge, per exemple, algun element no desitjat entra en el pla, com podria ser un micròfon, posteriorment en la postproducció es pot reenquadrar la imatge fent que el micròfon no es vegi.
La DCI especifica amb quines resolucions d'imatge s'ha de fer l'intercanvi de continguts en el cinema digital. De manera que la imatge que d'origen es grava en un format 2K FA quan es fa el muntatge s'escull a quina relació d'aspecte es vol convertir la imatge, de manera que si s'utilitza una relació d'aspecte de 2,39:1 un format de 2K DCI queda amb una resolució de 2.048 × 858 (és a dir, s'aprofita tota la resolució horitzontal del format d'origen). I si s'utilitza una relació d'aspecte d'1,85:1 la resolució resultant del 2K DCI és de 1.998 × 1.080. En aquest cas coincideix amb la resolució vertical de l'HDTV.
Figura 7. Proporcions entre formats de 2 K en d-cinema i les seves resolucions
En l'esquema es poden veure les proporcions entre formats de 2 K en d-cinema i les seves resolucions associades en funció de si són FA o DCI i la relació d'aspecte de la seva imatge.
En l'esquema es poden veure les proporcions entre formats de 2 K en d-cinema i les seves resolucions associades en funció de si són FA o DCI i la relació d'aspecte de la seva imatge.
Observeu que en el cas dels formats 4 K DCI passa el mateix, però amb resolucions molt superiors.
Figura 8. Proporcions entre formats de 4 K en d-cinema i les seves resolucions
En l'esquema es poden veure les proporcions entre formats de 4 K en d-cinema i les seves resolucions associades en funció de si són FA o DCI i la relació d'aspecte de la seva imatge.
En l'esquema es poden veure les proporcions entre formats de 4 K en d-cinema i les seves resolucions associades en funció de si són FA o DCI i la relació d'aspecte de la seva imatge.
Les càmeres d'HDTV d'alta qualitat sempre graven en una resolució de 1.920 × 1.080. Això significa que la diferència entre elles se centra en l'estructura de mostreig utilitzada, la profunditat de color i altres paràmetres propis de vídeo. Però mai no poden superar aquesta resolució d'imatge. Per aquesta raó no són òptimes per a l'enregistrament de cinema digital. En l'actualitat, de vegades algunes produccions es fan en HDTV pensades per a ser projectades sobre una pantalla de cinema, en aquest cas es pot parlar de cinema electrònic o e-cinema. Actualment, aquests esdeveniments estan en apogeu i utilitzen les sales de cinema per a la projecció d'esdeveniments esportius, concerts, etc. Però és important no confondre l'e-cinema amb el d-cinema.
En el cas del cinema digital, les càmeres cinematogràfiques són específiques per a aquesta aplicació, i capaces d'oferir resolucions d'imatge superiors a les de l'HDTV. En aquest cas es tracta de càmeres com la Red One o la Dalsa Origin, que emmagatzemen les imatges sobre discos durs (magnètics o en estat sòlid), ja que no hi ha cap format de vídeo que sigui capaç de gravar una resolució superior a l'HDTV.

3.6.Exercicis

Exercici 1
Actualment en el mercat hi ha una gran quantitat de pantalles amb l'etiqueta "HD Ready" i amb l'etiqueta "Full HD". Investigueu quines són les diferències entre els dos tipus d'enumeració.
Exercici 2
En el mòdul apareix la nomenclatura HD-SDI que, com s'ha vist, correspon al protocol i les característiques associades a una interfície digital. A continuació hi ha una taula amb una sèrie d'interfícies també àmpliament utilitzades. Busqueu a Internet les dades necessàries per a omplir la taula proposada:
Format
Amplada de banda màxima
Resolució
Aplicació

HDMI

Firewire o IEEE 1394

SDI

HD-SDI

Dual HD-SDI

3G-SDI

Solució
Format
Amplada de banda màxima
Resolució
Aplicació

HDMI

4,95 Gbps

HDTV

Domèstic

Firewire o IEEE 1394

800 Mbps

SDTV i HDTV

Domèstic

SDI

270 Mbps

SDTV

Professional

HD-SDI

1,485 Gbps

HDTV

Professional

Dual HD-SDI

2,970 Gbps

HDTV

Professional

3G-SDI

2,970 Gbps

HDTV

Professional

Exercici 3
En el mòdul s'ha estudiat que sovint interessa gravar amb la millor qualitat possible, encara que posteriorment la imatge s'hagi de degradar per a adaptar-se al nostre format de treball o difusió. Per a fer aquest truncament d'informació sovint es passa d'altes freqüències d'imatge (per exemple, de 60 FPS) a velocitats inferiors. Investigueu quines tècniques de pulldown hi ha i com treballen.
Exercici 4
Actualment es troben en ple apogeu els continguts generats i produïts en sistemes de 3D. Investigueu quins formats hi ha en l'actualitat, tenint en compte el procés de rodatge i distribució del senyal.

Bibliografia

Carrasco, Jorge (2010). Cine y televisión digital. Editorial Liber Web.
Tarrés, Francesc (2000). Sistemas audiovisuales. Televisión analógica y digital. Ediciones UPC.
Watkinson, John (1992). El arte del video digital. Editorial IORTV.
Enllaços d'Internet