xmlns:xi="http://www.w3.org/2003/XInclude" xmlns:qti="http://www.imsglobal.org/xsd/imsqti_v2p1" Tractament i publicació d'imatge i vídeo Tractament i publicació d'imatge i vídeo

Els formats de vídeo

Dispositius d'emmagatzematge i reproducció de vídeo
  • Xavier Bonet

PID_00194875
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars del copyright.

Introducció

En aquest mòdul s'analitzen les diferents tècniques (negatiu, cinta magnètica, formats magnetoòptics, etc.) que s'han utilitzat i que s'utilitzen per a l'emmagatzemament de material audiovisual. El propòsit és observar de quina manera ha evolucionat cada una de les tècniques i veure com aquestes han impactat sobre diferents àmbits del sector audiovisual.
És important destacar que totes han tingut un gran protagonisme en cada un dels sectors (cinematografia i fotografia, vídeo professional, vídeo domèstic, etc.), tot i que actualment tendeixen a desaparèixer per a donar pas als formats destinats a emmagatzemar dades digitals mitjançant discos durs o memòries d'estat sòlid.
Respecte de la metodologia, aquesta és una assignatura amb una dimensió teòrica important, que al seu torn es troba reforçada amb una sèrie d'activitats que tenen el propòsit de facilitar l'adquisició de les competències plantejades.
Per a tenir una visió global de la dimensió dels temes tractats, és molt important que es contrasti i es busquin exemples de les qüestions plantejades. Per aquesta raó la majoria d'exercicis plantejats tenen com a objectiu buscar exemples que permetin visualitzar sobre dispositius reals els conceptes explicats.
Finalment, és important que per a contrastar les dades explicades en els apunts es consultin els webs d'alguns dels fabricants dels formats que s'hi presenten.

Objectius

Al llarg de l'últim segle s'ha utilitzat una gran quantitat de formats d'emmagatzemament de senyals audiovisuals, des del negatiu cinematogràfic fins als formats actuals d'enregistrament en memòries d'estat sòlid. Els objectius d'aquest mòdul són els següents:
  1. Introduir i analitzar el conjunt de formats de vídeo que s'han utilitzat durant anys, sobretot en l'àmbit professional.

  2. Presentar una visió general de les tècniques i processos més utilitzats en què es basen els formats d'emmagatzemament audiovisual.

  3. Analitzar en profunditat els paràmetres més destacables de cada un dels formats més comuns en l'actualitat.

  4. Adquirir una visió global de quina ha estat l'evolució de les tècniques.

  5. Ser capaç de comprendre i analitzar les possibilitats d'un format a partir de l'anàlisi dels seus paràmetres tècnics.

Aquests objectius estan relacionats amb les competències de l'assignatura següents:
a) Competències generals del grau a què respon:
4. Capacitat per a adaptar-se a les tecnologies i als entorns futurs actualitzant les competències professionals.
11. Ser capaç d'analitzar un problema en el nivell d'abstracció adequat a cada situació i aplicar les habilitats i coneixements adquirits per a abordar-lo i resoldre'l.
22. Atendre adequadament consultes sobre projectes, tecnologies i mercat de productes multimèdia avaluant de manera precisa l'entorn d'aplicació, els recursos i les alternatives tecnològiques disponibles.
b) Competències de l'assignatura
C. Capacitat per a diferenciar les opcions factibles de les que no ho són en un estudi d'especificacions d'un projecte, sistema o tasca.
E. Capacitat per a escollir amb criteris fonamentats entre vídeo analògic i digital en una situació concreta.
F. Capacitat per a editar i comprimir un vídeo digital de manera eficient i eficaç.

1.Introducció històrica

En els últims segles, l'home modern s'ha vist en la necessitat de trobar tècniques que li permetin plasmar la realitat mitjançant una manera de veure el temps, amb l'ajuda de les càmeres i no de l'expressió artística manual com havia estat amb els seus antecessors.
Els orígens de la fotografia es remunten al principi del segle XIX, quan l'any 1816 el científic francès Nicéphore Niepce va ser capaç de retenir sobre una emulsió de sals de plata la primera imatge. De tota manera, la primera mostra d'una imatge captada mitjançant un sistema fotogràfic correspon a l'any 1826 quan el mateix científic, amb una càmera obscura, va fer una fotografia des de la seva habitació anomenada Vista des de la finestra de Le Gras (figura 1):
Nicéphore Niepce. Vista des de la finestra de Le Gras
Mostra de la primera imatge conservada, en la qual s'ha utilitzat un procés fotoquímic en la captació. Font: Wikipedia
Mostra de la primera imatge conservada, en la qual s'ha utilitzat un procés fotoquímic en la captació. Font: Wikipedia
En l'actualitat, la utilització de material fotosensible per a captar la imatge està arribant al final de la seva existència, ja que en l'àmbit fotogràfic és molt poca la gent que utilitza el negatiu com a suport per a la captació d'imatge i, en el cas del cinema, cada vegada són menys els directors que treballen amb el 35 mm.
Al final de la primera dècada del segle XXI, les escoles de cinema ja comencen a estar equipades amb càmeres cinematogràfiques digitals i les noves generacions de directors de cinema ja aprenen tot el procés cinematogràfic basat en un circuit íntegrament digital.
De tots els sistemes d'emmagatzematge d'imatge, el que va abandonar primer la captació sobre negatiu va ser la càmera de vídeo, passant en l'àmbit domèstic, del negatiu de 8 mm, a les primeres càmeres de vídeo que gravaven en vídeo 8, VHS-C o Hi8. Al mateix temps i paral·lelament, van començar a aparèixer els primers formats d'enregistrament en vídeo estacionari com el vídeo 2000, Betamax, VHS i S-VHS.
En el sector professional, a mitjan segle XX també van aparèixer una sèrie de formats que van substituir progressivament el negatiu cinematogràfic. Els primers van ser el format quàdruplex, el polzada B o B segmentat, el polzada C, U-Matic i posteriorment el Betacam, que es va convertir en l'últim antecessor dels formats de vídeo professionals digitals.
Durant els anys noranta i la primera dècada del segle XXI, els formats de vídeo han passat, tant en l'àmbit domèstic com en el professional, de l'enregistrament analògic a l'enregistrament digital. Justament ha estat conseqüència del procés de digitalització quan han aparegut tècniques de compressió de dades que permeten controlar la qualitat de vídeo final. Actualment, la majoria dels formats d'enregistrament en cinta domèstics i professionals enregistren les dades de vídeo després d'aplicar un procés de compressió. Lògicament, el factor de compressió és més petit com més gran és la qualitat de vídeo desitjada i això es tradueix en un increment de l'amplada de banda final. Una altra conseqüència del procés de digitalització és la desaparició progressiva dels formats d'enregistrament en cinta, incorporant-se cada vegada més sistemes d'enregistrament sobre suports d'accés aleatori, com és el cas de les memòries d'estat sòlid.
Des del primer sistema d'enregistrament digital en cinta fins a l'actualitat han sorgit més d'una trentena de formats diferents, sense que mai no s'hagi arribat a definir en el mercat un únic format comú. Un altre dels camps que ha experimentat una transformació important és la fotografia, que en aquesta última dècada ha canviat el negatiu de 35 mm per un sensor electrònic capaç de captar la imatge i transformar-la en dades que s'emmagatzemen digitalment en una memòria.
L'últim àmbit que està abandonant el cel·luloide per a adaptar-se als nous sistemes de tractament d'imatge digitals és justament el que necessita més amplada de banda per a gestionar la informació, es tracta del cinema. Actualment, en el mercat hi ha múltiples formats capaços de gravar vídeo amb una resolució d'imatge més o menys equivalent a la resolució del negatiu cinematogràfic. I la clara tendència del mercat actual és incorporar aquests nous sistemes progressivament.

1.1.Exercicis sobre formats

Exercici 1
Feu una taula en què apareguin cronològicament tots els formats proposats indicant la seva data d'aparició en el mercat, si utilitzen tecnologia cel·luloide, analògica o digital i la resolució d'imatge.
Resolució d'una imatge
En els sistemes digitals, la resolució d'imatge queda determinada per la quantitat de píxels que té cada imatge. En canvi, saber la resolució que té un sistema de vídeo analògic no és tan senzill. La majoria de formats de vídeo analògics a Europa tenen 575 línies ubicades unes sobre les altres, però la quantitat de columnes (o el que seria l'equivalent a la quantitat de píxels horitzontals en una imatge digital) no correspon a un únic valor comú a tots els formats. És justament aquest valor el que determina la qualitat del format. És a dir, tots els sistemes de vídeo analògics a Europa tenen la mateixa quantitat de línies (575 files) i una quantitat diferent de columnes en funció del format. En el paràmetre resolució de la taula que cal completar s'ha d'indicar la quantitat de línies equivalents "columnes" que el format és capaç de suportar.
Amb el cel·luloide, en treballar amb partícules fotosensibles, no és vàlid quantificar la resolució de la imatge de manera quantitativa, tot i que hi ha qui s'atreveix a fer aproximacions de la resolució equivalent en píxels que té el negatiu. De tota manera, en cinema digital, les càmeres capten la imatge amb un sensor CCD, i en aquest cas sí es té una resolució coneguda.
Com que és important poder veure de quina manera s'han anat implementant les noves tecnologies en cada àmbit, modifiqueu el color de la cel·la segons la pauta següent:
76524_m7_002.gif
En la llista que proposem no apareixen tots els formats de captació d'imatge que han existit, tan sols hi ha els que són més destacables per les seves qualitats tecnològiques o pel nivell elevat de penetració en el mercat.
Taula 1
N. E.: no hi ha cap resolució associada.
N. E.: no hi ha cap resolució associada.
En la taula 1 teniu un exemple d'una part de la taula que s'ha de completar en l'exercici a partir de la llista proposada:
  • Formats de fotografia:

    • Leica 1929

    • Kine Exakta

    • Nikon D1

  • Formats de vídeo:

    • Quàdruplex

    • Polzada B o B segmentat

    • VHS

    • Betamax

    • Vídeo 8 mm

    • S-VHS

    • Hi 8

    • U-Matic

    • Betacam SP

    • D1

    • D5

    • Betacam Digital

    • DVD

    • DV i mini-DV

    • DV Cam

    • DVC Pro 25

    • XDCAM

    • DVC Pro 50

    • Betacam SX

    • Betacam IMX

    • Digital-S

    • Blu Ray Disc

    • HDV

    • Digital-S HD

    • HD-D5

    • HDCAM

    • HDCAM SR

  • Formats de cinema:

    • Super 8

    • 16 mm

    • 35 mm

    • Arri D20

    • Panavision Genesis

    • DALSA

    • RED ONE

2.Introducció a les diferents tècniques i suports d'enregistrament

Des de l'aparició del cel·luloide fins a l'actualitat, hi ha hagut múltiples tècniques d'emmagatzemament i suports d'enregistrament de material audiovisual. Cada un té unes propietats que el caracteritzen i el fan idoni per a alguna aplicació.

2.1.Exercicis sobre tècniques i suports d'enregistrament

Exercici 1
A partir de la llista de formats que trobeu a la taula 2, investigueu i relacioneu cada amb la tecnologia d'enregistrament que utilitza de entre les proposades:
Taula 2
Formats
Tècniques d'enregistrament

DAT (digital audio tape)
Memòria USB (pen drive)
Disc compacte (compact disc)
Minidisc
DV
Blu Ray Disc
Disc dur
Targeta SIM

Suport magnètic
Suport òptic
Suport en estat sòlid
Suport magnetoòptic

3.Suports magnètics

3.1.Introducció al magnetisme i l'electromagnetisme

Tothom coneix les característiques dels materials magnètics, i se sap que són capaços de generar una força al seu voltant (denominada camp magnètic) capaç d'afectar els objectes que es trobin en el seu interior.
Els camps magnètics es poden representar mitjançant unes línies que ens permeten definir la força, direcció i sentit del camp en qualsevol punt de l'espai. Aquestes línies es denominen línies de camp o línies de flux magnètic.
Figura 2. Esquema de distribució de les línies de camp magnètic en un imant
Figura 2. Esquema de distribució de les línies de camp magnètic en un imant
Algunes de les propietats més interessants dels materials magnètics són les següents:
  • Sempre mantenen la mateixa estructura: hi ha dos pols, el positiu i el negatiu, els quals sempre van aparellats i són inseparables. Entre ells es genera un camp d'atracció.

  • Les línies de camp dels materials magnètics van del pol positiu al negatiu.

  • Les partícules amb el mateix signe de càrrega es repel·leixen i les que són de càrrega diferent s'atreuen.

  • El flux magnètic és la quantitat de línies de força que formen el camp magnètic per unitat de superfície. De manera que, com més unides estan les línies magnètiques, més flux representen.

Quan una partícula amb una càrrega elèctrica associada es mou respecte a una altra genera un camp elèctric canviant, aquesta variació sempre implica una variació d'un camp magnètic. Aquests dos camps són proporcionals en amplitud, freqüència i intensitat. Igualment la variació d'un camp magnètic sempre en genera un altre d'elèctric i proporcional. Aquest fenomen és conegut com electromagnetisme.
Figura 3. Esquema de distribució i orientació dels camps elèctrics respecte als magnètics en un raig d'electromagnetisme
Figura 3. Esquema de distribució i orientació dels camps elèctrics respecte als magnètics en un raig d'electromagnetisme

3.2.Procés d'enregistrament en cinta

Una cinta està composta per un suport (habitualment de polièster) recobert amb una capa fina de petites partícules fèrriques, com si es tractés de petits imants; és a dir, amb la polaritat (pol positiu i pol negatiu) que els caracteritza. Aquestes partícules es troben adherides al suport mitjançant un material aglutinant que s'encarrega de permetre que les partícules fèrriques puguin girar sobre si mateixes sense arribar-se a desenganxar del suport.
Figura 4. Esquema de distribució de les partícules magnètiques sobre una cinta, en funció de la influència d'un camp magnètic
Figura 4. Esquema de distribució de les partícules magnètiques sobre una cinta, en funció de la influència d'un camp magnètic
En el procés d'enregistrament d'una cinta, el senyal que es vol gravar genera un camp magnètic en el capçal d'enregistrament. Si es passa la cinta sota la influència del camp magnètic, l'orientació de les partícules varia en funció de la intensitat i direcció del camp. L'estructura de col·locació de les partícules sobre la cinta sempre depèn de l'amplitud i freqüència del camp magnètic induït per les variacions del voltatge al capçal.
En el cicle de lectura d'una cinta, el procés és invers al d'enregistrament; en aquest cas el que genera el camp magnètic és la mateixa disposició de les partícules sobre la cinta. Quan el capçal de lectura rep el petit camp magnètic que generen les partícules de la cinta que hi van passant per davant, s'encarrega de captar i transformar el camp magnètic en electricitat, per a així poder-la enviar ràpidament a una etapa d'amplificació. D'aquesta manera el senyal ja queda llest per al seu processament posterior.
Hi ha dues configuracions d'enregistrament que depenen bàsicament de l'amplada de banda de dades que es vol gravar. En la primera, el capçal es troba fixat en l'estructura del gravador i només es mou la cinta.
Cal observar que en aquest cas l'amplada de banda màxima que es volgués gravar és la que correspon a la freqüència màxima que l'ésser humà pot sentir, és a dir, 20.000 Hz. Però l'amplada de banda del vídeo analògic habitualment es troba entre 3 MHz i 10 MHz, la qual cosa implica que la velocitat relativa entre el capçal i la cinta ha de ser molt superior. Com s'ha pogut veure, els primers formats de vídeo professional requerien treballar amb grans bobines de cinta que passava a gran velocitat per davant del capçal, per poder complir així els requisits d'amplada de banda del vídeo, però eren altament inestables, pesades i la cinta durava molt poc. Per aquesta raó es va optar per dissenyar un sistema que augmentés la velocitat relativa entre la cinta i el capçal; aquest sistema consistia a ubicar el capçal en un tambor que permetia que el capçal girés. Si el capçal també es mou girant a alta velocitat, la velocitat relativa entre la cinta i el capçal augmenta enormement i a més d'una manera extremadament precisa.
Figura 5. Diagrama de la disposició d'una cinta respecte a un tambor rotatori, mitjançant una enfilada helicoïdal
Figura 5. Diagrama de la disposició d'una cinta respecte a un tambor rotatori, mitjançant una enfilada helicoïdal
Utilitzar un tambor rotatori obliga a integrar els capçals i enfilar la cinta al voltant del tambor, tants graus com sigui necessari en funció del nombre de capçals, per a aconseguir que constantment algun es trobi en contacte amb la cinta. Si no fos així es perdria informació. Habitualment, la cinta es troba en contacte amb el tambor en més de 180°. Lògicament mai no es poden superar 360°, ja que la cinta que arriba al tambor podria entrar en contacte amb la cinta que surt.
Perquè el que hem descrit es pugui dur a terme, és necessari utilitzar una enfilada helicoïdal al voltant del tambor, la qual cosa permetrà tenir sempre un capçal en contacte amb la cinta i evitar que en cap moment un capçal no gravi sobre la informació que ha gravat el capçal anterior. Aquest tipus d'enfilada genera un patró magnètic sobre la cinta en què les pistes de vídeo queden situades en diagonal. Aquesta tècnica és molt vàlida, ja que permet aprofitar al màxim la superfície de la cinta i reduir-ne així també la velocitat.
Figura 6. Disposició de les pistes de vídeo, àudio i control sobre la superfície d'una cinta magnètica
Figura 6. Disposició de les pistes de vídeo, àudio i control sobre la superfície d'una cinta magnètica
En utilitzar una velocitat de desplaçament de cinta inferior, el volum de cinta necessari és molt més petit, la qual cosa es tradueix en la possibilitat de dissenyar cintes de dimensions més reduïdes i, en conseqüència, es poden dissenyar càmeres de vídeo també de dimensions cada vegada més reduïdes.
És important observar que en el cas de la cinta es poden gravar tant senyals analògics com senyals digitals. Al cap i a la fi, des d'un punt de vista físic, les partícules magnètiques de la cinta queden distribuïdes en múltiples orientacions en el cas d'un senyal analògic, o en tan sol dos sentits en el cas del senyal digital, que són els que corresponen al 0 i l'1 lògics. De tota manera, la resta de formats d'enregistrament que s'estudiaran a partir d'ara seran íntegrament per a aplicacions digitals.

3.3.Procés d'enregistrament en un disc dur

3.3.1.Estructura mecànica del disc dur
El disc dur, igual que la cinta, basa el procés d'enregistrament íntegrament en el magnetisme. La filosofia d'enregistrament i reproducció en disc dur és pràcticament igual que en l'enregistrament en cinta, ja que es continua tenint un suport ple de partícules fèrriques i un conjunt de capçals encarregats de generar i captar camps magnètics.
Des del punt de vista estructural, el disc dur està format per una sèrie de discos, amb una petita separació entre ells, d'un compost de vidre, ceràmica o alumini recoberts per una capa fina d'un aliatge metàl·lic. Els discos estan units a un eix central i aquest a un motor que els fa girar a una velocitat constant entre 3.600 rpm i 10.000 rpm. Normalment, els discos tenen dues cares que es poden usar per a arxivar dades, tot i que una de les cares se sol reservar per a emmagatzemar informació de control.
Figura 7. Esquema de la disposició dels capçals de lectura i enregistrament en un disc dur
Figura 7. Esquema de la disposició dels capçals de lectura i enregistrament en un disc dur
Sobre cada un d'aquests discos hi ha un capçal dual o en alguns casos fins a dos (és a dir, capaços de llegir i escriure informació) que, suportats per un braç mecàni,c es mouen transversalment a velocitat molt alta i a poques micres de distància sobre la superfície del disc, sense arribar mai a tocar-lo.
3.3.2.Distribució de les dades sobre el disc
Les dades es distribueixen magnèticament en el disc seguint una estructura que es divideix en quatre elements:
  • Pistes. Un disc està dividit en cercles prims concèntrics anomenats pistes. Els capçals es mouen entre la pista més externa o pista zero i la més interna. De manera que la pista és la trajectòria circular traçada a través de la superfície circular del plat d'un disc pel capçal de lectura/escriptura.

  • Sectors. La unitat digital útil més petita en termes de memòria és el byte, que correspon a 8 bits. La majoria de discos durs emmagatzemen la informació en agrupacions de bytes denominades sectors. La majoria dels discos durs usen sectors de 512 bytes, de manera que possiblement les pistes més properes al centre del disc només contenen un sector, en canvi les pistes que es trobin més allunyades del centre podran contenir més sectors, ja que les pistes són més grans.

  • Clúster. Un clúster és un conjunt contigu de sectors que creen la unitat més petita d'emmagatzemament d'un disc. En funció de la mida dels arxius s'utilitzen més o menys clústers, de tota manera si un arxiu és més petit que el clúster aquest no es pot omplir amb dades de cap altre arxiu; és a dir, queda desaprofitat. La mida dels clústers depèn del sistema de formatació del disc (FAT, FAT16, FAT32, NTFS, etc.).

  • Cilindres. Els cilindres corresponen al conjunt de pistes de diferents discos que són a la mateixa distància del centre. En cas que el disc tingui les dues cares útils, cada parell de pistes equidistants del centre formarà part del mateix cilindre. En aquest cas, els dos capçals de cada disc sempre seran al mateix cilindre, ja que aquests utilitzen el mateix suport mecànic.

4.Suports òptics d'emmagatzemament

Alguns suports com la cinta permeten emmagatzemar dades tant analògiques com digitals, i en els anys vuitanta en el sector professional ja s'utilitzaven formats d'enregistrament de cinta com el digital audio tape (DAT) per a gravar àudio digitalment. Però en el cas dels suports òptics, tan sols poden emmagatzemar dades digitalment.
En els anys vuitanta, els sistemes d'emmagatzematge òptics van provocar una gran revolució, ja que amb el disc compacte (compact disc) es va introduir la tecnologia digital en l'àmbit domèstic i des de llavors fins a l'actualitat han aparegut en el mercat una gran quantitat de sistemes d'emmagatzematge òptic com el SACD, DVD, HD-DVD, Blue Ray Disc, etc., que s'han ofert com a alternatives molt competitives per a l'enregistrament de dades, i d'àudio i vídeo en el mercat domèstic.
El funcionament d'un sistema òptic es basa en la relació entre unes petites pertorbacions ubicades a la superfície del disc metàl·lic i l'alteració de les característiques d'un raig làser en impactar contra aquestes pertorbacions.
Fixeu-vos en l'estructura física d'un disc òptic en la figura 8. En aquest cas es té una base de policarbonat plàstic que pràcticament cobreix tot el gruix del disc. Durant el procés de fabricació, sobre aquest plàstic s'impressiona o estampa una gran quantitat de petits microsolcs, que representen les dades 0 i 1 lògiques, situades de manera contínua unes a continuació de les altres. La capa de policarbonat plàstic es cobreix amb una capa metàl·lica fina capaç de reflectir la llum del làser; aquesta capa metàl·lica també es cobreix amb una capa protectora. A sobre de la capa protectora es pot situar la capa de l'etiqueta del disc.
Figura 8. Esquema de la secció d'un suport d'emmagatzemament òptic
Figura 8. Esquema de la secció d'un suport d'emmagatzemament òptic
Igual que els antics discos de vinil, els discos compactes codifiquen tota la informació del disc de manera seqüencial formant una espiral, de manera que el lector làser, "i a la inversa dels vinils", comença per llegir les dades de l'interior del disc i a poc a poc es desplaça linealment cap a l'exterior del disc. Com a conseqüència, la velocitat de gir del disc disminueix a mesura que el lector s'allunya del centre del disc, per a mantenir un flux de lectura de dades constant. En realitat és el mateix flux de dades l'encarregat de controlar la velocitat de gir constant, de manera que, quan es llegeixen més dades del previst, un senyal de control redueix la velocitat de gir del disc i al revés.

4.1.Procés de lectura d'un disc òptic

En el procés de lectura d'un disc òptic intervenen un feix làser, un conjunt de lents i miralls, i un grup de sensors, seguint certs passos.
Figura 9. Distribució de lents, prismes i sensors que intervenen en el procés de lectura d'un disc òptic
Figura 9. Distribució de lents, prismes i sensors que intervenen en el procés de lectura d'un disc òptic
Els passos són els següents:
Primer pas. El feix de llum làser surt de l'emissor i travessa la reixeta de difracció i la lent col·limadora. El propòsit de la lent col·limadora és seleccionar tan sols els rajos de llum que tinguin un mateix pla de polarització. D'aquesta manera, de la lent només surten un conjunt de rajos amb el mateix pla de polarització; els rajos que no la creuen són absorbits per la mateixa lent.
A la lent col·limadora, el feix de llum es divideix en tres subrajos, un de central més gran que és l'encarregat de llegir les dades del disc, i dos de laterals més petits que s'utilitzen per a assegurar que el feix central llegeix correctament sobre la pista que li correspon. És a dir, els rajos laterals tenen com a propòsit evitar que el feix central pugui saltar a una pista propera per error, aquest concepte es denomina seguiment de tracking.
Segon pas. Els tres rajos creuen el prisma de polarització, de moment sense experimentar cap efecte.
Tercer pas. A la lent de polarització tots els rajos experimenten un gir de 45° sobre el seu pla de polarització.
Quart pas. Després que els rajos han rebotat al mirall es dirigeixen a la lent d'enfocament que farà convergir tots els rajos en una regió molt més reduïda, forçant el raig central a dirigir-se sobre la pista de lectura i els dos rajos laterals a projectar-se parcialment cada un a banda i banda de la pista de lectura.
Cal recordar que la superfície del disc està formada per pics i valls que representen les dades digitals gravades. Quan el raig central incideix a sobre llegeix una vall o 0 lògic, aquest es reflecteix al disc i provoca un angle de reflexió diferent de l'angle d'incidència, de manera que aquesta llum es dispersa. En el moment en què el raig llegeix un pic o 1 lògic, l'angle d'incidència serà igual al reflectit, per la qual cosa el raig retornarà pel mateix camí pel qual va arribar però en sentit oposat.
Cinquè pas. La llum retorna pel mateix camí que havia seguit en el procés d'anada al lector, passant pel mirall i de nou per la lent de polarització, que tornarà a aplicar un gir en el mateix sentit al pla de polarització dels rajos. Fixeu-vos que els rajos que originalment tenien un pla vertical després d'haver-los aplicat els dos girs de 45°, "un d'anada i l'altre de tornada", ara quedaran totalment horitzontals.
Sisè pas. Una vegada creuada la lent de polarització el prisma de polarització força els rajos a rebotar i a projectar-se sobre la lent cilíndrica. Aquest procés té lloc perquè el prisma tan sols permet que el creuin els rajos de llum que tenen un pla de polarització determinat, i els que no el tenen reboten com si es tractés d'un mirall. Per aquesta raó, en el trajecte d'anada, la llum creua el prisma sense cap problema i, en canvi, una vegada aplicat el doble gir de 45°, la llum rebota al prisma sense poder-lo creuar.
Setè pas. La lent cilíndrica focalitza els tres rajos de llum –el central de lectura i els dos laterals de seguiment de tracking– sobre un grup de fotoreceptors.
Els fotoreceptors són dispositius capaços de generar un voltatge elèctric proporcional a la quantitat de llum que hi ha incidit.
En un lector de discos òptics hi ha diferents distribucions de fotoreceptors, i la utilització d'una o una altra només depèn del fabricant. A continuació se'n presenta una de les més habituals:
Figura 12. Esquema de la disposició de sensors lectors i de tracking en un lector de disc òptic
Figura 12. Esquema de la disposició de sensors lectors i de tracking en un lector de disc òptic

4.2.Seguiment de tracking

Per a assegurar-se que el feix lector llegeix constantment la pista que li correspon i a fi d'evitar que es produeixin salts de pista no desitjats, hi ha dos rajos que es creen a la lent col·limadora que experimenten els mateixos processos i segueixen el mateix trajecte que el raig de llum central. Aquests dos rajos impacten contra la superfície del disc i retornen sobre els fotoreceptors de seguiment de tracking. En realitat és com si es tractés d'un parell de sensors que es troben a banda i banda d'una línia, en el moment en què un dels sensors se sobreposa més que l'altre sobre la pista els sensors ho detecten, i així es corregeix la posició automàticament. Justament aquest sistema és el que permet que el lector segueixi correctament tot el recorregut que té la pista espiral d'un disc òptic.
Si el seguiment de tracking és correcte, els feixos laterals es projecten de manera que la meitat de la seva superfície es trobi sobre la part llisa del disc, i l'altra meitat sobre la pista que conté la informació. Quan el grup de feixos de llum surt per error de la trajectòria correcta, un dels feixos laterals tendeix a dirigir-se cap a la regió llisa del disc, mentre que l'altre feix tendeix a projectar una major part de la seva llum sobre la part de dades de la pista. Això fa que la quantitat de llum que rebota sobre el disc és diferent en els dos rajos; aquesta variació es veu reflectida en la quantitat de llum que rep cada sensor de tracking. A partir de la diferència de potencials en cada un dels fotoreceptors es pot donar l'ordre al braç que suporta el conjunt òptic que modifiqui la seva posició i corregeixi així la pèrdua de tracking.
Figura 13. Components que intervenen en la correcció automàtica de tracking en un lector òptic
Figura 13. Components que intervenen en la correcció automàtica de tracking en un lector òptic

4.3.Autofocus

La mida física d'un 1 o un 0 lògics sobre la superfície del disc, pot ser de pocs nanòmetres en funció del tipus de suport utilitzat. Això significa que una petita modificació a la superfície del disc pot traduir-se en una focalització incorrecta del làser sobre el disc i, consegüentment, una interpretació errònia de les dades. Per aquesta raó és de vital importància que la distància entre l'òptica d'enfocament i la superfície del disc sigui sempre constant.
Per a garantir la focalització correcta del làser sobre la superfície del disc s'utilitza el fotoreceptor central, que interpreta les dades que provenen de la lectura en el disc de manera que, en funció de la intensitat lluminosa que rep, interpreta un 1 o un 0 lògic.
El fotoreceptor central està format a partir de quatre petits fotosensors (A, B, C i D). La lent cilíndrica té la propietat de projectar un cercle perfecte sobre els quatre sensors quan la distància entre la lent d'enfocament i la superfície del disc és la correcta. I quan, per error, aquesta distància és modificada (a causa d'una irregularitat sobre la superfície del disc o d'un desajuntament del grup òtic), en lloc de projectar un cercle sobre els fotosensors projecta una el·lipse. En funció de la parella de sensors que rebin més llum el lector podrà saber si es troba massa a prop o massa lluny de la superfície del disc. Per corregir aquests petits errors d'enfocament, els sensors envien un senyal de control a una bobina que suporta la lent d'enfocament perquè la ressituï a la posició correcta.
Figura 14. Diferents opcions de pèrdua de focus en el sistema de lectura d'un disc òptic
Figura 14. Diferents opcions de pèrdua de focus en el sistema de lectura d'un disc òptic

5.Suports magnetoòptics d'emmagatzemament

Dels suports magnetoòptics, possiblement el més conegut per l'impacte comercial és el minidisc. Encara que en l'actualitat cada vegada s'utilitza menys, ja que hi ha alternatives més eficients i de més qualitat, el minidisc ha estat un format utilitzat àmpliament sobretot en l'àmbit de la ràdio, ja que oferia una qualitat de so òptima i una flexibilitat que no tenien els altres formats.
La característica principal d'un format magnetoòptic és que les dades s'enregistren sobre un disc magnètic com si es tractés d'un disc dur, però amb la propietat que aquestes tan sols es poden gravar quan la temperatura del material magnètic és molt elevada. Això significa que, a temperatura ambient, és extremadament difícil que per proximitat d'un imant o camp electromagnètic d'intensitat elevada es puguin esborrar o modificar les dades gravades.
Físicament un format magnetoòptic està format per una base de policarbonat, sobre la qual es col·loca un conjunt de dues capes dielèctriques amb material magnetotèrmic enmig. Les tres capes es cobreixen amb una capa metàl·lica fina d'alumini, que al seu torn també es protegeix amb una última capa transparent ubicada a la part superior.
Figura 15. Secció on es pot veure la disposició de capes en un format magnetoòptic
Figura 15. Secció on es pot veure la disposició de capes en un format magnetoòptic

5.1.Procés d'enregistrament

Hi ha diferents tècniques d'enregistrament, de tota manera la més habitual es basa en el procés que descrivim a continuació.
Hi ha una bobina que constantment genera un camp magnètic. Aquesta bobina es troba físicament molt propera al disc, però a temperatura ambient el camp magnètic que genera no és suficient per a modificar l'orientació de les partícules magnètiques del disc. Quan es vol gravar una dada, s'encén un làser i escalfa una petita regió del disc fins que aquest assoleix la temperatura de Courier (uns 180° C). En aquest moment el material es torna molt més sensible als camps magnètics i, consegüentment, les partícules del material magnètic del disc es veuen afectades pel camp que genera la bobina, de manera que les dades queden gravades. Una vegada el disc recupera la temperatura ambient és molt difícil que un camp magnètic pugui modificar la informació emmagatzemada.
És a dir que, des del punt de vista físic, les dades es troben gravades en el disc sobre un suport magnètic i perquè aquestes es puguin modificar es requereix un canvi important de temperatura.

5.2.Procés de lectura

Com s'ha vist en els sistemes d'enregistrament òptic, és de vital importància el pla focal del feix de llum. En el procés de lectura, en els formats magnetoòptics s'utilitza una tècnica molt semblant a la utilitzada per als discos òptics. En aquest cas, el làser surt de l'emissor, creua un joc de lents i miralls i, quan impacta amb la regió metàl·lica del disc magnetoòptic, en funció de l'orientació de les partícules magnètiques en el suport, el raig rebota contra un pla de polarització o un altre. En funció del pla de polarització que adquireix una vegada ha rebotat, aquest retorna fins a arribar als sensors de lectura o no. A partir de si aquest sensor rep llum o no la rep, podrà discriminar les dades com a uns o zeros lògics.

6.Sistemes d'emmagatzematge en estat sòlid

Les unitats d'estat sòlid, també denominades solid satate drive (SSD), són uns dispositius que permeten emmagatzemar dades mitjançant una tecnologia basada en transistors integrats. De manera que cada SSD pot contenir una gran quantitat de transistors on cada un s'encarrega d'emmagatzemar 1 bit o 2 bits (en funció de la tècnica de fabricació utilitzada).
Tècniques de fabricació
Bàsicament, en memòries flaix hi ha dues tècniques de fabricació denominades single level cell (SLC) i multilevel cell (MLC). La SLC tan sols és capaç d'emmagatzemar 1 bit en cada transistor, mentre que el sistema MLC és capaç d'emmagatzemar fins a 2 bits sobre cada transistor. De tota manera, el SLC té l'avantatge que els xips són considerablement més ràpids que els de la tecnologia oposada (MLC), consumeixen menys, tenen més temps d'ús i necessiten menys temps per a accedir a les dades. En contrapartida, en ser menys densos, la capacitat per xip és més petita, i això repercuteix en un preu considerablement més alt dels dispositius fabricats amb aquest mètode.
En general, les característiques de les SSD que sobresurten respecte als discos durs convencionals basats en l'enregistrament sobre disc són que ofereixen més velocitat d'accés a les dades, són molt més robustes i són pràcticament inoïbles.
Dins de les memòries SSD hi ha moltes variants que, en funció del disseny, tenen unes característiques de rendiment específiques. Dues de les variants més utilitzades són les memòries NAND flaix i les RAM (com l'SRAM o la DRAM).
La diferència principal entre les memòries tipus flaix i les RAM és que les memòries flaix permeten emmagatzemar les dades independentment que tinguin alimentació. Aquestes memòries es denominen no volàtils. En canvi, les memòries RAM tan sols poden emmagatzemar dades mentre tenen alimentació, i en el moment en què deixen d'estar alimentades es perden. Aquest tipus de memòria es denomina volàtil.
Durant anys, les SSD RAM s'han utilitzat com a memòries intermèdies en els ordinadors, a causa de l'alta velocitat en la lectura de dades (tenen una latència inferior a 10 microsegons). De manera que en la RAM s'emmagatzemen les dades que l'ordinador utilitza més freqüentment i d'aquesta manera es compensa la baixa velocitat de lectura/escriptura dels discos durs convencionals.
Les SSD basades en la tecnologia flaix, tot i tenir una velocitat d'accés a les dades lleugerament inferior a les memòries RAM (amb una latència propera als 25 microsegons), en tractar-se de memòries no volàtils es converteixen en una alternativa molt eficient als discos durs convencionals basats en l'enregistrament en disc. De tota manera, de moment la relació preu / byte de capacitat continua essent molt més cara en el cas de les memòries flaix que en el cas dels discos convencionals i, així com hi ha discos durs de diversos terabytes de capacitat, les memòries flaix amb més capacitat tenen prop de 100 gigabytes.
En el vídeo, aquest fet és de vital importància, ja que el flux de dades que s'utilitza és molt gran. Per aquesta raó les càmeres que actualment graven sobre targetes SSD flaix incorporen diverses ranures per a poder inserir diferents targetes alhora i augmentar així el temps d'autonomia en l'enregistrament.

7.Formats de vídeo digitals

Una de les característiques típiques associades als formats d'emmagatzemament i reproducció del senyal de vídeo és la gran quantitat de formats i variants. En els últims trenta anys han aparegut gairebé mig centenar de formats de vídeo diferents.

7.1.Conceptes previs

7.1.1.El codi de temps o time code
En el treball diari en vídeo sempre ha estat necessària la utilització d'algun sistema de numeració que d'alguna manera etiqueti i, per tant, permeti identificar tots i cada un dels fotogrames gravats.
En els primers formats de vídeo que van aparèixer en el mercat, s'utilitzava un senyal analògic sinusoïdal que anava gravat a la cinta com a referència temporal. El propòsit principal d'aquest senyal era controlar i verificar que la velocitat de pas de la cinta per davant del capçal d'enregistrament i reproducció fos la correcta. De tota manera, aquest senyal també s'utilitzava com a referència d'un comptador. D'aquesta manera, si es reproduïa una cinta des de l'inici, es podia saber constantment quant temps feia que durava la reproducció. Aquest senyal es denomina control track line (CTL). L'inconvenient principal del CTL és que quan es canvia la cinta o es fa un reset del comptador es perd la referència en la numeració de cada fotograma.
La manera de solucionar aquesta limitació consisteix a gravar sobre la cinta un senyal digital que identifiqui de manera única cada un dels fotogrames mitjançant un codi. D'aquesta manera, en tractar-se d'un senyal digital específic per a aquest propòsit, quan es col·loca una cinta en el vídeo el comptador representa el codi que correspon a cada un dels fotogrames inequívocament. Per aquesta raó la numeració del codi de temps s'expressa en hores, minuts, segons i fotogrames.
Figura 16. Exemple d'un visor de codi de temps
Figura 16. Exemple d'un visor de codi de temps
Hi ha dos tipus de codi de temps en funció bàsicament de la manera en què van gravats sobre la cinta de vídeo:
  • Longitudinal time code (LTC). És el sistema digital definit per la SMPTE/EBU com a eina per a l'enumeració de cada fotograma. Aquesta informació es troba gravada longitudinalment en la cinta com si es tractés d'una pista d'àudio.

  • Vertical interval time code. És el sistema digital definit per la SMPTE/EBU com a eina per a l'enumeració de cada fotograma. Aquesta informació es troba gravada amb el senyal de vídeo en línies de l'interval d'esborrament de pantalla.

7.1.2.Tècniques de compressió reversibles i irreversibles
Les tècniques de compressió han portat l'autèntica revolució al sector audiovisual. Des de la seva aparició la quantitat de tècniques que han sorgit ha estat espectacular per la qualitat i eficiència de moltes. Actualment, més del 95% de les aplicacions audiovisuals del mercat s'utilitzen tant en el sector domèstic com en el professional i, gràcies a aquestes, la societat ha tingut un accés pràcticament il·limitat a aplicacions i continguts audiovisuals.
Una manera de classificar les tècniques de compressió és en funció de si provoquen pèrdues o no sobre el material. És a dir, si una vegada aplicat el procés de compressió i descompressió el material que es recupera és exactament el mateix que en origen o si, al contrari, hi ha hagut alguna pèrdua.
Hi ha algun material que no es pot permetre el luxe de patir cap pèrdua, ja que altrament quedaria del tot inservible; per exemple, una aplicació informàtica (qualsevol programa, base de dades, document, etc.) s'ha de comprimir amb tècniques de compressió reversibles o, el que és el mateix, sense pèrdues (lossless). Ja que, si no és així, l'arxiu recuperat no es podria utilitzar. Per contra, una fotografia, un vídeo, l'àudio, etc. són tipus d'arxius en què, en funció de la utilitat, el fet que el material tingui alguna pèrdua de qualitat a canvi de poder-lo utilitzar pot compensar l'usuari. Les tècniques que s'utilitzen en aquest cas són irreversibles, és a dir, amb pèrdues (lossy).
De tota manera, quan s'utilitzen les unes o les altres?, o, si les irreversibles produeixen pèrdues, per quina raó no s'utilitzen sempre les tècniques reversibles?
Les tècniques de compressió reversibles com les que utilitzen WinZip, WinRAR o DropSuaff són molt útils per a reduir la mida de documents o aplicacions. De tota manera, el factor de compressió que s'aconsegueix és molt reduït, habitualment de prop de 2:1 i 3:1, i rarament s'aconsegueix superar un factor de 5:1. Això fa que les tècniques reversibles no siguin suficients per a comprimir material audiovisual.
Exemple de compressió de vídeo
Suposem que es vol enviar un vídeo gravat en una definició estàndard de 720 × 576 píxels i 25 FPS al qual correspon un amplada de banda aproximada de 200 Mbps perquè es pugui reproduir des d'un web. Habitualment, en l'actualitat els vídeos que es reprodueixen en temps real (streaming) tenen una amplada de banda aproximada d'1 Mbps En aquest cas, el factor de compressió necessari és de 200:1. Evidentment, és impossible aconseguir taxes de compressió d'aquesta magnitud amb tècniques de compressió reversibles, per aquesta raó s'ha de sacrificar part de la qualitat usant tècniques irreversibles. De tota manera, dins d'un codificador de vídeo també es poden trobar tècniques reversibles i irreversibles treballant conjuntament.
7.1.3.Compressió espacial i temporal
Les primeres tècniques de compressió d'imatge que van aparèixer es basaven en la compressió espacial. Això significa que analitzen la imatge en funció de les seves dimensions (altura i amplada) i mitjançant un conjunt de tècniques s'aconsegueix reduir el pes de l'arxiu de la imatge. Aquestes tècniques són les que s'utilitzen en la codificació d'imatges fixes com pot ser el cas del format (JPEG, GIF, TGA, PNG, etc.).
Tots els sistemes de compressió que basen la compressió en un únic ítem es denominen sistemes de compressió intra.
Per exemple, una fotografia comprimida utilitza compressió intra, ja que la seva compressió tan sols depèn de la mateixa fotografia.
En canvi, en la majoria de sistemes de compressió de vídeo, a causa del nivell elevat de redundància que hi ha en el contingut dels fotogrames consecutius, s'utilitza com a tècnica la compressió temporal o inter. D'aquesta manera, no és necessari codificar cada vegada les dades entre fotogrames consecutius que són iguals; tan sols es codifica la informació d'un fotograma sencer i posteriorment es codifiquen les petites diferències que hi pot haver entre fotogrames pròxims a aquest.
Si les dades que es comparen corresponen a fotogrames consecutius, la tècnica de compressió es denomina compressió interquadre o compressió interframe:
Figura 17. Esquema en què es poden veure els fotogrames necessaris per a fer una compressió interquadre
Figura 17. Esquema en què es poden veure els fotogrames necessaris per a fer una compressió interquadre
Si les dades que es comparen corresponen a camps consecutius d'un vídeo que utilitza escanejat entrellaçat, la tècnica de compressió es denomina intercamp o compressió interfield:
Figura 18. Esquema en què es poden veure els camps necessaris per a fer una compressió intercamp
Figura 18. Esquema en què es poden veure els camps necessaris per a fer una compressió intercamp
En l'actualitat, la majoria de formats de vídeo graven utilitzant la compressió temporal, de tota manera ja hi ha alguns formats de nivell molt alt, per exemple per a l'enregistrament de cinema digital, que tan sols utilitzen enregistrament de tipus intra. Ja que, en tractar-se d'una aplicació en què la qualitat de la imatge és tan important, es prefereix no aconseguir factors elevats de compressió encara que això es tradueixi en la necessitat de ser capaços de gestionar enormes fluxos de dades.

7.2.D-1

Al final dels anys setanta i principi dels vuitanta, en molts àmbits del sector audiovisual es plantejava la necessitat de trobar algun sistema que permetés gravar i fer còpies successives sense que això es traduís en una pèrdua de qualitat en la imatge. Per aconseguir aquest propòsit, el 1986 les empreses Sony i BTS van presentar el primer format de vídeo capaç de gravar la imatge i el so digitalment sobre una cinta de 3/4 de polzada.
En els anys vuitanta encara no existien les tècniques de compressió d'imatge, per aquesta raó el D1 era un format que gravava vídeo en components (Y, R-Y, B-Y) sense cap tipus de compressió i codificant les mostres a 8 bits. Això es traduïa en un elevadíssima amplada de banda de 216 Mbps. Gestionar un volum tan elevat de dades necessita que els circuits que les han de processar siguin molt potents i estables; això implica que el preu de l'aparell era desorbitat, de manera que poques empreses se'l podien permetre. Es tractava d'un format adequat per a aplicacions de postproducció complexa en alta qualitat com, per exemple, capçals de TV, publicitat, animació, cinema, etc.
Després del D1, van aparèixer altres formats de fabricants com Panasonic o Ampex amb unes característiques molt similars a les del D1. Alguns com el D2 (de Sony i Ampex) i el D3 (de Panasonic) aconseguien reduir en gran manera l'amplada de banda total (a 142 Mbps), ja que en lloc de digitalitzar un senyal de vídeo en components, digitalitzaven vídeo compost. Això permetia simplificar els circuits i reduir el preu del dispositiu.
L'any 1992 Ampex va presentar el D4. En aquest cas es tractava d'un format capaç de gravar vídeo en components però amb la mateixa amplada de banda que el D2 i el D3. Això és perquè per primera vegada apareix la possibilitat d'aplicar una petita compressió (1,5: 1) a cada un dels fotogrames.
Dos anys més tard, el 1994, Panasonic va presentar un altre format denominat D5, que era capaç de gravar en components sense compressió i acceptava per primera vegada escollir entre una relació d'aspecte de 4:3 o 16:9. Si es gravava en 16:9 les mostres es codificaven a 8 bits, però si es gravava en 4:3 suportava codificar cada mostra a 10 bits. Això es traduïa en una amplada de banda final de 303 Mbps.
Taula 3. Paràmetres del format D1 (1986)
Paràmetres
Especificacions

Sistema

625-50 (entrellaçat)

Fabricant

Sony i BTS

Amplada de la cinta

3/4 de polzada

Tipus de senyal

Components UIT-601

Resolució

720 × 576

Estructura de mostreig

4:2:2

Resolució de les mostres

8 bits

Compressió

No

Dades de vídeo abans de la compressió

172 Mbps

Dades comprimides

172 Mbps

Dades totals gravades

216 Mbps

Pistes d'àudio

4 canals (48 kHz / 16 bits)

Aplicació principal

Postproducció i publicitat

Diàmetre del tambor

75 mm

Rotació del tambor

150 rps

Tipus de cinta

Òxid Fe-Co

Velocitat d'escriptura

35,63 m/segon

Velocitat de la cinta

286,8 mm/s

Amplada de pistes de vídeo

40 μm

Durada màxima de les cintes

Petites: 13 min; mitjanes: 41 min; grans: 94 min

7.3.Betacam digital

El Betacam digital ha estat durant el final dels anys noranta i la primera dècada del segle XXI el format més utilitzat en el sector professional. Això és degut a les seves excel·lents prestacions tècniques, la gran qualitat d'imatge i sobretot a la compatibilitat que oferia amb les cintes Betacam analògiques. Aquest fet és de vital importància, ja que durant molts anys les productores i cadenes de televisió havien treballat en la versió analògica (Betacam SP) i, en fer el canvi a la versió digital, podien continuar reproduint tot el material que tenien d'arxiu amb el nou dispositiu digital.
El Betacam digital és un format d'enregistrament d'àudio i vídeo digitals en components (Y, R-Y, B-Y) sobre una cinta d'1/2 polzada desenvolupat per Sony el 1993. El format segueix les especificacions definides en la recomanació de la UIT-R 601.
UIT
La Unió Internacional de Telecomunicacions, UIT (International Telecomunications Union, ITU) és una institució formada per diversos subgrups que depèn de l'ONU, amb l'objectiu de definir una sèrie de recomanacions o estàndards per a unificar criteris sobre tècniques de disseny, codificació i transmissió de senyals.
Concretament, la UIT-R-601 és la recomanació en què s'especifiquen els paràmetres a partir dels quals s'ha de digitalitzar una imatge, per a aconseguir un intercanvi correcte de continguts a escala internacional, amb una qualitat d'imatge professional.
El Betacam digital és dels primers formats a utilitzar compressió en la imatge, concretament aplica un petit factor de 2:1. En aquell moment, utilitzar un factor de compressió tan reduït es traduïa en una pèrdua de qualitat d'imatge pràcticament imperceptible, i és per aquest motiu que aquest format es considera absolutament professional. En l'actualitat, gràcies a l'evolució i la gran eficiència de les tècniques de compressió, hi ha formats que utilitzant factors de compressió més grans ofereixen una qualitat similar a la del Betacam digital.
En oferir tan bona qualitat, ser robust i permetre la multigeneració, és un format adequat per a la postproducció digital.
Taula 4. Paràmetres principals del format Betacam digital (1993)
Paràmetres
Especificacions

Sistema

525-60 (entrellaçat)

625-50 (entrellaçat)

Fabricant

Sony

Amplada de la cinta

1/2″ (12,7 mm)

Tipus de senyal

Components UIT-601

Resolució

720 × 480

720 × 576

Estructura de mostreig

4:2:2

Resolució de les mostres

10 bits

Compressió

2:1 (intraquadre)

Dades de vídeo abans de la compressió

218 Mbps

Dades comprimides

109 Mbps

Dades totals gravades

127,8 Mbps

Pistes d'àudio

4 canals (48 kHz / 16 bits)

Aplicació principal

Postproducció i radiodifusió

Diàmetre del tambor

81,4 mm

Rotació del tambor

75 rps

Tipus de cinta

Partícules de metall

Velocitat d'escriptura

19,8 m/s

Velocitat de la cinta

96,7 mm/s

Amplada de pistes de vídeo

26 μm amb enregistrament azimutal

Durada màxima de les cintes

Petites: 40 min Mitjanes: – Grans: 124 min

7.4.Betacam SX

El Betacam SX és un format d'enregistrament magnètic de vídeo i àudio digitals sobre cinta d'1/2 polzada, desenvolupat per Sony el 1996.
En aquest cas es buscava un format similar al Betacam SP però amb la capacitat de gravar digitalment. És a dir, es tracta d'una subversió del Betacam digital a un preu molt més accessible i que ofereix una qualitat similar a la del Betacam SP.
Per a aconseguir reduir el preu, s'implementen una sèrie de tècniques de compressió que permeten reduir l'amplada de banda fins a 18 Mbps; és a dir, s'hi aplica un factor de compressió de 10:1. Per a aconseguir un factor de compressió tan elevat cal utilitzar tècniques de compressió temporal; amb aquest format s'utilitza per primera vegada en vídeo professional aquest tipus de tècniques a partir de l'algoritme definit per l'MPEG sota l'estàndard (ISO/IEC 13818-2 o MPEG-2).
Fixeu-vos que tots els formats analitzats fins ara incorporen quatre canals d'àudio digital mostrejats a 48 kHz i quantificats a 16 bits. Aquests canals d'àudio es graven sense compressió, ja que l'estalvi no seria significatiu davant el gran flux de dades que requereix el senyal de vídeo.
Finalment sobre la cinta es graven uns 40 Mbps. Això és el resultat de sumar els 18 Mbps del vídeo amb la informació d'àudio i la codificació posterior d'aquests, per a la detecció i correcció de possibles errors com drops, ratllades a la cinta, obturació o brutícia als capçals, etc.
Taula 5. Paràmetres principals del format Betacam SX (1996)
Paràmetres
Especificacions

Sistema

525-60 (entrellaçat)

625-50 (entrellaçat)

Fabricant

Sony

Amplada de la cinta

1/2″ (12,7 mm)

Tipus de senyal

Components UIT-601

Resolució

720 × 480

720 × 576

Estructura de mostreig

4:2:2

Resolució de les mostres

8 bits

Compressió

10:1 (interquadre)

Dades de vídeo abans de la compressió

172 Mbps

Dades comprimides

18 Mbps

Dades totals gravades

40 Mbps

Pistes d'àudio

4 canals (48 kHz / 16 bits)

Aplicació principal

Informatius professionals

Diàmetre del tambor

81,4 mm

Rotació del tambor

75 rps

Tipus de cinta

Partícules de metall

Velocitat d'escriptura

19,1 m/s

Velocitat de la cinta

59,5 mm/s

Amplada de pistes de vídeo

32 μm amb enregistrament azimutal

Durada màxima de les cintes

Petites: 62 min; mitjanes: –; grans: 194 min

7.5.Betacam IMX

Des del punt de vista tecnològic, el Betacam IMX s'ha convertit en el substitut natural del Betacam digital. Es pot remarcar que s'ha convertit en el substitut tecnològic i no en el substitut natural, ja que en l'actualitat la quantitat de formats que són capaços de fer la competència al Betacam IMX són molts més que els que en el seu moment la podien fer al Betacam digital.
Des de la perspectiva tecnològica es tracta d'un format capaç de mostrejar mitjançant la norma 4:2:2 a 8 bits (en lloc dels 10 bits del Betacam digital) i amb un factor de compressió molt reduït de 3,3:1, sense utilitzar compressió temporal. En aquest cas és el primer format que grava sota l'especificació 422P@ML de l'MPEG-2. L'amplada de banda resultant és de 50 Mbps.
422P@ML
Dins de les especificacions de l'MPEG-2 hi ha diferents categories de qualitat i eficiència de compressió classificades com a combinacions d'una sèrie de perfils i nivells. Una d'aquestes combinacions està dissenyada específicament per a aplicacions en l'àmbit professional i és la que Betacam IMX utilitza com a format d'enregistrament. Concretament, es denomina 422P@ML, ja que el senyal està compost pels paràmetres definits en un perfil denominat 422 profile (422P) conjuntament amb les característiques del nivell principal o main level, d'aquí s'obté l'expressió (422P@ML).
En aquests paràmetres es pot veure de quina manera augmenta l'eficiència en els sistemes de compressió:
  • L'any 1993 els sistemes de compressió es començaven a aplicar al senyal de vídeo, ja que amb el Betacam digital amb una norma 4:2:2 codificada a 10 bits i amb un factor de compressió de 2:1 de tipus intra s'obtenia una amplada de banda de 127 Mbps.

  • L'any 1996 les tècniques ja havien evolucionat prou per a aplicar una compressió temporal al senyal. Amb això s'aconseguia una imatge més degradada, però en contrapartida un augment enorme del factor de compressió passant dels 172 Mbps d'abans de la compressió a 18 Mbps després de la compressió. Això feia que els circuits haguessin de gestionar amplades de banda molt més reduïdes i, consegüentment, el preu de l'aparell també es reduïa.

  • L'any 2000, el maquinari ha evolucionat prou per a poder gestionar fluxos elevats de dades a un cost més raonable. Això es tradueix en la possibilitat de tornar a incorporar en el Betacam IMX un reduït factor de compressió (com en el Betacam digital), sense necessitat d'utilitzar tècniques de compressió temporal. És a dir, gràcies a l'evolució de les tècniques de compressió i la millora del maquinari, en aquest cas s'obté una qualitat superior al Betacam digital a un preu bastant més raonable. Lògicament en aquest cas el Betacam IMX ofereix plena compatibilitat cap avall amb la resta de formats Betacam (SP, digital i SX).

Taula 6. Paràmetres principals del format Betacam IMX (2000)
Paràmetres
Especificacions

Sistema

525-60 (entrellaçat)

625-50 (entrellaçat)

Fabricant

Sony

Amplada de la cinta

1/2″ (12,7 mm)

Tipus de senyal

Components UIT-601

Resolució

720 × 480

720 × 576

Estructura de mostreig

4:2:2

Resolució de les mostres

8 bits

Compressió

3,3:1 (intraquadre)-MPEG-2 (422P@ML)

Dades de vídeo abans de la compressió

172 Mbps

Dades comprimides

50 Mbps

Dades totals gravades

87,7 Mbps

Pistes d'àudio

8 canals (48 kHz /16 bits) 4 (canals 48 kHz / 24 bits)

Aplicació principal

Programes professionals

Diàmetre del tambor

81,4 mm

Rotació del tambor

50 rps

Tipus de cinta

Partícules de metall

Velocitat d'escriptura

12,7 m/s

Velocitat de la cinta

53,77 mm/s

Amplada de pistes de vídeo

21,7 μm amb enregistrament azimutal (8 tracks × frame)

Durada màxima de les cintes

Petites: 71 min; mitjanes: –; grans: 220 min

7.6.Formats DV: Mini-DV, DVCAM i DVC PRO

El format DV va ser creat el 1994 per un consorci de més de seixanta empreses del sector com Sony, Panasonic, JVC, Sharp, Cànon, etc. Inicialment es va concebre, sota la norma IEC 61834, com un substitut digital dels antics formats analògics en l'àmbit del vídeo industrial. De tota manera, l'avenç tecnològic que va representar aquest format va ser tan important que es va acabar introduint en tots els sectors.
En l'àmbit del vídeo domèstic va aparèixer amb les cintes DV i mini-DV amb les quals va desbancar sobretot els formats d'enregistrament de vídeo domèstic en cinta com el VHS-C o el vídeo 8 mm. Llavors, molts consumidors van adquirir càmeres que gravaven en format mini-DV, i van aparèixer molt pocs dispositius estacionaris, de manera que durant molts anys la gent tenia a casa un vídeo VHS o Betamax per a gravar i reproduir, en alguns casos un DVD com a reproductor digital i una càmera mini-DV per a gravar digitalment. Lògicament, en la majoria dels casos quan volien visualitzar el material gravat amb la càmera l'havien de reproduir des de la mateixa càmera.
En el sector del vídeo industrial va representar una revolució, ja que va substituir absolutament tots els formats analògics com l'S-VHS, Hi8, U-Matic. La qualitat era tan bona que, fins i tot, es va acabar introduint en molts àmbits del sector professional. Va aconseguir ser present en el mercat del vídeo industrial i professional mitjançant els formats DVCAM i DVCPRO. Habitualment el DVCAM es trobava en aplicacions industrials i el DVCPRO en aplicacions professionals.
Aquest nivell de presència en tots els sectors era i encara és de gran importància, ja que permet l'intercanvi d'imatges entre sectors sense traduir-se en una gran pèrdua de qualitat d'imatge. De manera que és més fàcil, per exemple, posar en un informatiu unes imatges gravades per un videoaficionat.
7.6.1.DV i mini-DV
El DV és un format d'enregistrament d'àudio i vídeo digital en components sobre cinta d'1/4 de polzada de metall vaporitzat.
Originalment va ser un format desenvolupat per l'empresa Matsushita el 1993 conjuntament amb altres fabricants com Sony, Philips, Thomson, Hitachi, JVC, Sanyo, Sharp i Mitsubishi el 1994. El propòsit d'aquest format era substituir els antics formats de vídeo domèstics analògics (VHS, S-VHS, Hi8, Vídeo 8, etc.).
Es tracta d'un format digital que grava vídeo en components (Y, R-Y, B-Y) i els mostreja segons la norma 4:2:0 si treballa en els sistemes PAL i SECAM o sota la norma 4:1:1 si es treballa en NTSC.
Com la majoria de formats de vídeo digital, aplica una compressió al senyal de vídeo. En aquest cas, del tipus DCT intracamp/intraquadre. Amb aquest format el factor de compressió aplicat és de 5,5:1, amb el qual senyals que abans de la compressió tenen una amplada de banda de gairebé 125 Mbps després d'haver-los comprimit queda en 25 Mbps.
A més d'incorporar tècniques de compressió intraquadre com la DCT, aquest format és capaç d'aplicar compressió temporal quan ho considera necessari de manera que quan detecta el moviment en l'escena aplica compressió (intracamp), en canvi, quan detecta imatges estàtiques la DCT s'aplica sobre blocs dels dos camps (intraquadre).
Taula 7. Paràmetres principals del format DV (1994)
Paràmetres
Especificacions

Sistema

525-60 (entrellaçat)

625-50 (entrellaçat)

Fabricant

Diversos (Sony, Panasonic, JVC i d'altres)

Amplada de la cinta

1/4″ (6,35 mm)

Tipus de senyal

Components UIT-601

Resolució

720 × 480

720 × 576

Estructura de mostreig

4:1:1

4:2:0

Resolució de les mostres

8 bits

Compressió

5:1 (intraquadre)

Dades de vídeo abans de la compressió

124,4 Mbps

Dades comprimides

25 Mbps

Dades totals gravades

41,8 Mbps

Pistes d'àudio

2 canals (48 kHz / 16 bits) o 4 canals (32 kHz / 12 bits)

Aplicació principal

Domèstic

Diàmetre del tambor

21,7 mm

Rotació del tambor

150 rps

Tipus de cinta

Metall vaporitzat

Velocitat d'escriptura

10,16 m/s

Velocitat de la cinta

18.831 mm/s

Amplada de pistes de vídeo

10 μm amb enregistrament azimutal

Durada màxima de les cintes

Petites: 60 min; mitjanes: –; grans: 180 min

7.6.2.DVCAM
DVCAM és un format d'enregistrament d'àudio i vídeo per a components sobre cinta d'1/4 de polzada desenvolupada per Sony el 1995, basat en el DV domèstic amb el qual presenta certa compatibilitat.
Utilitza el mateix format de cinta que el DV. L'única diferència consisteix a augmentar la velocitat de la cinta un 50% de manera que l'amplada de les pistes sigui de 15 μm en comptes dels 10 μm del DV. Augmentant la velocitat se suposa que s'aconsegueix un format més robust i amb millor qualitat suficient (segons SONY) per a satisfer les exigències del sector professional.
Habitualment les càmeres i vídeos que utilitzen aquest format d'enregistrament són més robustos i tenen més i millors prestacions que els formats domèstics que treballen amb cintes DV o mini-DV. És a dir, les càmeres ja incorporen òptiques de mida gran o intermèdia i moltes deixen de ser handicam per a convertir-se en càmeres que s'han de recolzar sobre l'espatlla per a suportar millor el pes. Això es tradueix en un augment de preu dels dispositius sense arribar al pressupost que exigeix el material professional. Per aquesta raó, es tracta d'un format ideal per a aplicacions de vídeo industrial, corporatiu, institucional, casaments, etc.
El DVCAM, com el DV, utilitza un algoritme de compressió que commuta de manera automàtica un intraquadre per un intracamp i viceversa en funció del contingut del programa. Aquest format ens introdueix com a novetat el CLIPLINK, que facilitarà el procés d'edició gràcies al fet que és capaç d'emmagatzemar en una memòria autoalimentada de la cinta fins a cent noranta-vuit imatges amb baixa resolució corresponents a l'inici de totes les seqüències que s'han gravat. Aquestes van associades al seu codi de temps d'inici i final, la qual cosa permet que l'operador marqui les seqüències com a vàlides o no vàlides.
Per interconnectar digitalment aparells que treballin amb aquest format i amb el format DV, Sony ha desenvolupat un protocol basat en l'IEEE 1394 (Firewire) anomenat i.Link.
Taula 8. Paràmetres principals del format DVCAM (1996)
Paràmetres
Especificacions

Sistema

525-60 (entrellaçat)

625-50 (entrellaçat)

Fabricant

Sony

Amplada de la cinta

1/4" (6,35 mm)

Tipus de senyal

Components UIT-601

Resolució

720 × 480

720 × 576

Estructura de mostreig

4:1:1

4:2:0

Resolució de les mostres

8 bits

Compressió

5:1 (intraquadre)

Dades de vídeo abans de la compressió

124,4 Mbps

Dades comprimides

25 Mbps

Dades totals gravades

41,8 Mbps

Pistes d'àudio

2 canals (48 kHz / 16 bits) o 4 canals (32 kHz / 12 bits)

Aplicació principal

Industrial

Diàmetre del tambor

21,7 mm

Rotació del tambor

150 rps

Tipus de cinta

Metall vaporitzat

Velocitat d'escriptura

10,16 m/s

Velocitat de la cinta

28.831 mm/s

Amplada de pistes de vídeo

15 μm amb enregistrament azimutal

Durada màxima de les cintes

Petites: 40 min; mitjanes: –; grans: 184 min

7.6.3.DVCPRO 25
DVCPRO 25 és un format d'enregistrament de vídeo digital en components sobre cinta d'1/4 de polzada, desenvolupat per Matsushita (Panasonic) per al mercat professional el 1995. De vegades es denomina DVCPRO "a seques", sense el 25.
Es tracta d'un format que tenint unes característiques de processament de senyal pràcticament iguals a la resta de formats DV, el seu àmbit de treball és el sector professional, ja que els dispositius (càmeres i vídeos) utilitzats són d'alta qualitat i estabilitat.
En tenir una cinta tan estreta es fa pràcticament impossible inserir una pista de codi de temps longitudinal, per aquesta raó incorpora un codi de temps en una àrea de subcodi de les pistes de vídeo.
Una de les diferències entre aquest format i els seus predecessors és que utilitza una única norma de mostreig, concretament la norma 4:1:1, amb la qual cosa s'aconsegueixen imatges d'alta qualitat que després de la compressió acaben amb un amplada de banda de 25 Mbps.
L'empremta magnètica del format professional és gairebé idèntica a la del DV, encara que l'espaiat entre pistes del DVC-Pro és gairebé el doble de la versió domèstica, amb la qual cosa s'aconsegueix certa compatibilitat entre formats. L'amplada de les seves pistes és superior a la del DVCAM i els DV o MiniDV i, com a conseqüència, hi ha compatibilitat cap avall amb la resta de formats. És a dir, un lector DVCAM pot reproduir cintes DVCAM i DV o Mini DV però no pot reproduir cintes DVC-Pro. Un vídeo DVC-Pro pot reproduir els tres formats DVC-Pro, DVCAM i DV o mini-DV.
Taula 9. Paràmetres principals del format DVCPRO en cinta (1995)
Paràmetres
Especificacions

Sistema

525-60 (entrellaçat)

625-50 (entrellaçat)

Fabricant

Panasonic

Amplada de la cinta

1/4" (6,35 mm)

Tipus de senyal

Components UIT-601

Resolució

720 × 480

720 × 576

Estructura de mostreig

4:1:1

Resolució de les mostres

8 bits

Compressió

5:1 (intraquadre)

Dades de vídeo abans de la compressió

124,4 Mbps

Dades comprimides

25 Mbps

Dades totals gravades

41,8 Mbps

Pistes d'àudio

2 canals (48 kHz / 16 bits) o 4 canals (32 kHz / 12 bits)

Aplicació principal

Professional

Diàmetre del tambor

21,7 mm

Rotació del tambor

150 rps

Tipus de cinta

Partícules de metall

Velocitat d'escriptura

10,16 m/s

Velocitat de la cinta

18.831 mm/s

Amplada de pistes de vídeo

18 μm amb enregistrament azimutal

Durada màxima de les cintes

Petites: 60 min; mitjanes: –; grans: 180 min

7.6.4.Targetes P2
La versió d'enregistrament en cinta cada vegada s'utilitza menys, ja que el 2004 Panasonic va introduir l'opció de gravar sobre targeta d'estat sòlid P2. Aquest format està essent acceptat àmpliament pel mercat i cada vegada més es troba en altres formats de vídeo, com els d'alta definició.
La targeta permet suportar multitud de formats; és a dir, és independent de la codificació que utilitzi. Així doncs, en una targeta P2 tant es poden gravar senyals DVC-PRO com DVC-PRO-50 o DVC-PRO HD "d'alta definició". Lògicament, en funció del format que s'utilitzi l'autonomia d'enregistrament canvia de manera inversament proporcional a l'amplada de banda que es grava.
A continuació es pot veure una relació entre la capacitat de les targetes P2 i l'autonomia d'enregistrament en funció del format de vídeo que estiguin gravant.
Taula 10. Relació entre la capacitat i el temps d'enregistrament d'algunes targetes P2
Capacitat
DVCPRO
DVCPRO HD 720p@24fps
DVCPRO-50
DVCPRO HD 1080i60 o 720p60 o AVC-Intra100

4 GB

16 min

10 min

8 min

4 min

8 GB

32 min

20 min

16 min

8 min

16 GB

1 h i 4 min

40 min

32 min

16 min

32 GB

2 h i 8 min

1 h i 20 min

1 h i 4 min

32 min

64 GB

4 h i 16 min

2 h i 40 min

2 h i 8 min

64 min

7.6.5.DVC-PRO 50
Les subnormes de mostreig 4:2:0 i la 4:1:1 mai no han estat especialment ben considerades en el sector professional a causa del factor elevat de submostreig de la informació corresponent als components de color. Això és perquè un senyal amb poca resolució espacial de color limita en gran manera el marge per a la correcció del color i, sobretot, la capacitat d'incrustar imatges correctament mitjançant incrustació (chroma key). Per aquesta raó Panasonic va treure al mercat una versió del DVCPRO destinada al sector professional denominada DVCPRO-50, que treballa mitjançant la norma 4:2:2, igual que el Betacam digital.
Una altra de les diferències que sobresurten i permeten considerar el DVCPRO50 un format destinat a aplicacions professionals és el factor reduït de compressió que aplica al senyal, que és de 3,3:1. Amb aquest factor de compressió s'obté un amplada de banda final de dades de 50 Mbps D'aquí surt el 50 corresponent al seu nom, i que el permet diferenciar del DVCPRO convencional.
Els dispositius de lectura DVCPRO50 tenen plena compatibilitat cap avall, la qual cosa significa que permeten llegir totes les cintes DVCPRO, DVCAM o DV. Cal observar que, habitualment, les cintes de DVCPRO50 són les mateixes que en DVCPRO. Encara que el fabricant ha tret algun model específic per a DVCPRO50 –amb la llengüeta de color vermell, en lloc del groc–, sovint s'utilitzen les mateixes cintes per a gravar en DVCPRO25 que per a gravar en DVCPRO50. L'única diferència és que quan es grava un senyal de 50 Mbps, en tractar-se del doble d'amplada de banda, la velocitat de desplaçament de la cinta ha de ser el doble, amb la qual cosa la seva autonomia d'enregistrament es redueix a la meitat.
Taula 11. Paràmetres principals del format DVCPRO50 "D8" (1998)
Paràmetres
Especificacions

Sistema

525-60 (entrellaçat)

625-50 (entrellaçat)

Fabricant

Diversos (Sony, Panasonic, JVC i d'altres)

Amplada de la cinta

1/4" (6,35 mm)

Tipus de senyal

Components UIT-601

Resolució

720 × 480

720 × 576

Estructura de mostreig

4:2:2

Resolució de les mostres

8 bits

Compressió

3,3:1 (intraquadre)

Dades de vídeo abans de la compressió

172 Mbps

Dades comprimides

50 Mbps

Dades totals gravades

99 Mbps

Pistes d'àudio

4 canals (48 kHz / 16 bits)

Aplicació principal

Programes professionals

Diàmetre del tambor

21,7 mm

Rotació del tambor

150 rps

Tipus de cinta

Partícules de metall

Velocitat d'escriptura

11,37 m/s

Velocitat de la cinta

66,7 mm/s

Amplada de pistes de vídeo

18 μm amb enregistrament azimutal

Durada màxima de les cintes

Petites: – min; mitjanes: 31 min; grans: 92 min

8.Codificació i compressió de vídeo i àudio digital

En el apartat anterior hem introduït els conceptes de compressió de vídeo i àudio digital reversible i irreversible. Com hem vist, la compressió reversible és una compressió sense pèrdues (lossless), mentre que la compressió irreversible sí que implica pèrdues d'informació (lossy). També hem parlat sobre la compressió espacial i la compressió temporal, i estudiat en quins casos s'aplica una i en quins casos l'altra. Finalment, hem vist alguns formats de vídeo, tots ells molt relacionats amb tècniques i suports d'enregistrament.
Però sovint ens trobem que un vídeo digitalitzat i emmagatzemat amb un dels formats de vídeo vists a l'apartat anterior ha de ser editat i convertit a un nou format abans de ser distribuït, o –directament– emmagatzemat en un altre suport. Un format molt bo per capturar i emmagatzemar vídeo digital pot ser un format molt dolent per distribuir vídeos a la xarxa.
En aquest apartat estudiarem alguns dels conceptes més importants relacionats amb el procés de codificar i exportar vídeo digital fent servir un editor de vídeo, o, simplement, canviar el seu format amb un convertidor. Si bé farem referència a alguns programes per exemplificar alguns dels termes analitzats, l'apartat no és una guia sobre com exportar o convertir vídeo en un editor o editors de vídeo en particular. La finalitat principal és la d'introduir i analitzar alguns dels conceptes claus que intervenen en aquests processos per dotar l'alumne dels coneixements necessaris i imprescindibles per poder fer aquestes operacions de forma satisfactòria sobre qualsevol programari.

8.1.Contenidors multimèdia i còdecs

Per començar, és important entendre i saber diferenciar clarament els conceptes de contenidor multimèdia i còdec, ja que, malgrat ser conceptes fonamentals en el vídeo digital, molt sovint es confonen.
Un contenidor multimèdia és un arxiu digital per emmagatzemar vídeo i àudio. Els contenidors més complexos també poden emmagatzemar subtítols, capítols i metadades. Les especificacions tècniques de l'arxiu contenidor defineixen la manera en què tots aquests elements se sincronitzen i relacionen entre si, permetent la seva correcta reproducció. Per exemple, QuickTime és un contenidor multimèdia d'Apple amb extensió .mov o .qt.
En canvi, un còdec és un algoritme implementat en un programa o una màquina –o en un dispositiu que combini programari i maquinari–, que permet codificar o descodificar un senyal o flux de dades digitals.
Si bé són coses diferents, el concepte de codificació s'acostuma a associar al de compressió, ja que, encara que es pot codificar sense comprimir, normalment la finalitat del procés de codificació és la d'aconseguir reduir la mida d'un arxiu o el flux de dades digitals.
Les característiques del contenidor multimèdia determinen els tipus de còdecs de vídeo i àudio suportats pel contenidor, i la possibilitat d'afegir subtítols o altres funcionalitats avançades, com poden ser els fluxos de bits variables (més endavant estudiarem aquest concepte). Per tant, si volem fer servir un còdec en particular, primer ens hem d'assegurar que escollim un contenidor compatible amb aquest còdec.
Per exemplificar aquests dos conceptes, a la figura 19 tenim una captura de pantalla de la finestra Export Settings del programa Premiere, des d'on es configura el format que tindrà el vídeo de sortida del projecte. Com podem veure, el primer que s'ha de fer és seleccionar el contenidor multimèdia des de la pestanya Format.
Figura 19. Selecció del contenidor multimèdia a la finestra Export Settings de Premiere
Figura 19. Selecció del contenidor multimèdia a la finestra Export Settings de Premiere
Un cop seleccionat el contenidor, el mateix programa ens indica quins són els còdecs (o el còdec, ja que alguns contenidors només en suporten un) de vídeo i àudio disponibles per a aquest contenidor. A la pestanya Video se selecciona el còdec del vídeo, i a la pestanya Audio, el còdec de l'àudio (figura 20).
Figura 20. Selecció del còdec de vídeo i el còdec d'àudio a Premiere
Figura 20. Selecció del còdec de vídeo i el còdec d'àudio a Premiere
Així doncs, el resultat d'exportar el vídeo d'aquest projecte amb aquesta configuració serà un arxiu contenidor multimèdia en format QuickTime, que a dins tindrà un vídeo codificat amb el còdec Apple ProRes 422 (HQ) i un àudio codificat amb el còdec Apple Lossless (però podíem haver-ne escollit qualsevol altre). Evidentment, un usuari final no veuria aquestes parts, sinó un únic arxiu .mov que seria possible reproduir, per exemple, en el reproductor QuickTime Player d'Apple.
Aquí és important fer notar que és aquest reproductor el que efectua el procés de descodificar les dades de vídeo i àudio incloses en el contenidor multimèdia. El contenidor multimèdia no inclou els còdecs, només inclou la informació de quins còdecs s'han fet servir; i és el programa reproductor l'encarregat, en primer lloc, d'interpretar correctament quins són els còdecs necessaris, i en segon lloc, descodificar la informació inclosa en el contenidor amb els còdecs que ja ha de tenir instal·lats. Aquesta és la raó perquè, de vegades, un reproductor no sigui capaç de reproduir un arxiu multimèdia: no té els còdecs necessaris per poder interpretar les dades incloses en l'arxiu contenidor. Per això, a l'hora de codificar i exportar un vídeo, en el cas que no s'utilitzin còdecs molt populars, és imprescindible assegurar-se que la plataforma, usuari o usuaris destinataris del vídeo tenen accés a aquests còdecs.
Sobre el terme format de vídeo podem dir que normalment fa referència a l'arxiu contenidor. Per exemple, parlem de vídeo en format QuickTime o format AVI. De totes maneres, alguns textos fan servir el terme format de vídeo per referir-se exclusivament al còdec de vídeo utilitzat. Així que, quan parlen de format de vídeo, estem parlant de si el vídeo està codificat amb el còdec H.264/AVC, l'MPEG-2 o qualsevol altre.
Per acabar de complicar una mica més la terminologia, de vegades el contenidor i el còdec de vídeo tenen el mateix nom, i de vegades no se sap exactament si és part d'un o de l'altre, o es fa servir el nom del contenidor per referir-se al còdec; per exemple, es parla de codificació MP3, però el nom del còdec és MPEG-1 Audio Layer 3. De totes maneres, si es tenen clars els conceptes de contenidor multimèdia i còdec, és senzill deduir a què es refereix un text quan parla de formats de vídeo o detectar quan es mesclen aquests termes, sigui per simplificar la terminologia o per desconeixement.
Per acabar aquest apartat, en aquesta taula es mostren alguns dels contenidors multimèdia existents, amb la seva extensió, propietari i còdecs de vídeo i àudio suportats.
Taula 12
Extensió
Propietari
Àudio
Vídeo

3GP

.3gp

3GPP

AMR-NB/WB, AMR-WB+, AAC

MPEG-4, H.263, H.264/MPEG-4 AVC

Advanced System Format

.asf .wma .wmv

Microsoft

ACM, DMO

VFW, DMO

AVI

.avi

Microsoft

ACM

VFW, H.264/AVC

DivX

.dvix

DivXNetworks Inc.

MP3, PCM, AC-3

DivX

Flash Video

.flv

Adobe

MP3, Nellymoser, ADPCM, raw PCM, AAC

H.264/MPEG-4 AVC

Matroska

.mkv .mka .mks

Domini públic

Tots

Tots

MCF

No en té una de concreta

Domini públic GNU/Linux

Tots

Tots

MP4

.mp4

MPEG

MPEG-1 Layers I, II, III (MP3), MPEG-2, MPEG-4 AAC, Vorbis

MPEG-1, MPEG-2, H.263, MPEG-4 ASP, H.264/MPEG-4 AVC

MPEG

.mpg .mpeg

MPEG

MPEG-1 Layers I, II, III (mp3), PCM Lineal

MPEG-1, MPEG-2

MPEG-2PS Program Stream

.ps

MPEG

MPEG-1 Layers I, II, III (mp3), PCM Lineal, AC-3, DTS

MPEG-1, MPEG-2

MPEG-2TS Transport Stream

.ts

MPEG

MPEG-1 Layers I, II, III (mp3), PCM Lineal, AC-3, DTS, AAC

MPEG-1, MPEG-2,MPEG-4 ASP, H.264/MPEG-4 AVC

OGG/OGM

.ogg

Xiph.org

Vorbis

Theora

Quicktime

.mov .qt

Apple

Sound Manager, CoreAudio

Codificador de Quicktime

RealMedia (RMVB)

.rmvb

RealNetworks

Real Audio, Vorbis, AAC

Real Video

VOB

.vob

MPEG

AC-3, PCM Lineal, DTS, MPEG-2 Part 3, MPEG-1 Layer II

MPEG-2 Part 2

Font: Viquipèdia

8.2.Exportació de vídeo digital

Com ja hem comentat en la introducció, la finalitat d'aquestes pàgines és la d'introduir alguns conceptes fonamentals en l'exportació o conversió de vídeo digital, sense centrar-nos en un programari en particular. La comprensió d'aquests termes proporcionarà a l'alumne una sòlida base que li donarà suport quan efectuï alguna d'aquestes operacions en Premiere, After Effects, Final Cut Pro, Sony Vegas o qualsevol altre programa de vídeo.
En l'apartat anterior, hem començat definint i diferenciant els conceptes de contenidor multimèdia i còdec. En el pròxim apartat, tornarem sobre el concepte de còdec, aprofundint una mica més en la seva anàlisi, per continuar seguidament amb altres termes clau relacionats amb el procés d'exportació i conversió de vídeo digital. Ens centrarem en els còdecs i processos relacionats amb la part de vídeo, deixant de banda la part de codificació i compressió d'àudio, atès que ja es veu extensament en una altra assignatura del grau.
8.2.1.Còdecs
Com hem vist, un còdec de vídeo és un algoritme, la finalitat del qual, per norma general, és la de reduir la mida d'un arxiu de vídeo o un flux de dades digitals. Però, per què són tan importants els còdecs? Més concretament, per què és necessari comprimir vídeo utilitzant còdecs? Una imatge digital de dimensions 1920 × 1080 a 24 bits (color real) sense comprimir requereix unes 5.93 MB d'espai d'emmagatzemament. Per tant, un vídeo amb 25 fotogrames per segon, requerirà 148.25 MB per segon, i una pel·lícula d'una hora i mitja de durada uns 781 GB. Com és fàcilment deduïble, aquests valors dificultarien molt l'emmagatzemament i complicaria molt –per no dir que impossibilitaria en molts casos– processos com la transmissió de vídeo digital en temps real. Així que, en la majoria de casos, és necessari fer servir un còdec per reduir aquests valors, però sense perdre qualitat, o perdent-ne la mínima.
Per començar, hem de tenir clar que no hi ha un còdec o configuració òptima per a totes les situacions. La finalitat del vídeo pot condicionar el còdec: no és el mateix crear un vídeo destinat a la seva distribució –i que normalment està molt comprimit– que un vídeo en un pas intermedi d'una cadena de postproducció, que pot arribar fins i tot a no estar comprimit. A més, com veurem, el contingut mateix del vídeo també pot condicionar l'elecció del còdec i la seva configuració.
Si el vídeo ha de ser distribuït a la xarxa, una bona idea és començar cercant si la plataforma escollida té alguna pàgina amb indicacions sobre còdecs i configuracions recomanades. Vimeo, YouTube i les principals plataformes de distribució de continguts multimèdia acostumen a detallar aquesta informació i és, sens dubte, un bon lloc per on començar.
Sobre els còdecs en particular, sense entrar en una anàlisi detallada, podem dir que l'estàndard H.264/AVC, desenvolupat conjuntament entre el ITU-T Video Coding Experts Group (VCEG) i el ISO/IEC Moving Picture Experts Group (MPEG), ha estat, i encara ho és, un dels més utilitzats del mercat. En principi és un bon candidat si el material que cal codificar i comprimir ha de ser distribuït a la xarxa.
El seu successor, l'HEVC/H.265, sembla que li va guanyant terreny a poc a poc, i entre els seus avantatges destaca que és compatible amb la televisió Ultra Hi-Definition, i admet resolucions de fins a 8192 × 4320 píxels –per 4096 × 2304 de l'H.264.
El VP9, estàndard de codi obert de Google, integrat en el seu navegador Chrome i utilitzat per YouTube en els seus vídeos en format 4K, és un dels altres formats de codificació de vídeo més reconeguts pel mercat, si bé s'espera que el seu successor, el VP10, el deixi enrere, ja que s'anuncia que serà capaç de retallar a la meitat la quantitat de dades a transferir en un vídeo en format 4K.
Windows Media Video (WMV) i ProRes són una sèrie de còdecs de Microsoft i Apple, respectivament. El WMV no ha acabat mai de tenir una gran presència en el mercat, excepte en productes Microsoft, evidentment; en canvi, els còdecs Apple ProRes, si bé van ser dissenyats per ser utilitzats durant la postproducció de vídeo (aquests còdecs reben el nom d'intermediate codec), han acabat sent implementats en càmeres i recolzats per diverses companyies de software.
Per acabar, també cal fer referència al «vell» estàndard MPEG-2, molt present en el mercat domèstic, ja que el fa servir el format DVD, i en els estàndards de TDT, satèl·lit i cable en Europa (DVB) i Amèrica (ATSC).
8.2.2.Keyframe o fotograma de referència
Com hem vist en l'apartat anterior, les tècniques de compressió d'imatges es basen en la compressió espacial o temporal, sent aquesta última la que es fa servir en la majoria de sistemes de compressió de vídeo. Aprofitant l'elevat nivell de redundància de dades que hi ha entre fotogrames consecutius, aquest sistema pren un fotograma de referència i codifica només les diferències amb aquest fotograma dels fotogrames posteriors. El valor del keyframe o fotograma de referència indica cada quants fotogrames el còdec pren un nou fotograma de referència.
El valor òptim variarà en funció de cada vídeo. Si es prenen fotogrames de referència molt sovint, la mida de l'arxiu pot acabar resultant molt gran, però si els fotogrames de referència estan molt separats entre si, pot ser que la qualitat del resultat final no sigui bona. Com a norma general, s'aconsella agafar inicialment un fotograma de referència cada segon de vídeo i, en funció del resultat obtingut, anar modificant aquest valor.
8.2.3.Bitrate
Tot i ser un dels conceptes fonamentals en el procés de codificació d'un vídeo digital, és un concepte relativament poc entès. El bitrate o taxa de bits és la quantitat de dades que s'utilitzen per a cada segon de vídeo i es mesura en kilobits per segon (kbps). Per tant, té molta importància per controlar la qualitat i pes final que tindrà el vídeo.
Figura 21. Comparació dels fotogrames d'un vídeo codificat a una baixa i alta taxa de bits. Font: https://vimeo.com/blog/post/video-compression-basics
Figura 21. Comparació dels fotogrames d'un vídeo codificat a una baixa i alta taxa de bits. Font: 
https://vimeo.com/blog/post/video-compression-basics
Aquesta taxa de bits pot ser constant (CBR) o variable (VBR). Una taxa de bits constant fa servir la mateixa quantitat de dades cada segon, mentre que una taxa de bits variable ajusta la quantitat de dades a la complexitat dels canvis que es produeixen entre els fotogrames.
Per norma general, el mètode variable és més ràpid, produeix arxius més petits i amb millor qualitat, ja que, com que no té les limitacions de la taxa de bits constant, pot gestionar millor quins fotogrames necessiten més dades i quins menys per ser codificats. De totes maneres, això no és matemàtic i varia en funció del vídeo, així que sempre s'aconsella fer una prova amb cadascun dels mètodes i comparar el resultat.
8.2.4.Resolució
Anàlogament al que hem vist en imatges, la resolució d'un vídeo indica les seves mides en píxels. Evidentment, com menor sigui la resolució, el pes de l'arxiu també serà menor.
Un vídeo pot tenir qualsevol resolució i relació d'aspecte (aspect ratio). En aquesta taula es poden veure les resolucions i els aspectes més comuns.
Taula 13
Format
Relació d'aspecte
Resolució (px)

Standard Definition (SD)

4:3

640 × 480

Standard Definition (SD)

16:9

640 × 360

720p HD

16:9

1280 × 720

1080p HD

16:9

1920 × 1080

2K

16:9

2560 × 1440

4K

16:9

3840 × 2160

8K

16:9

7680 × 4320

En el cas que el vídeo original i el vídeo exportat no tinguin la mateixa resolució, hem de vigilar que es respecti la relació d'aspecte si no volem obtenir un vídeo deformat o retallat, encara que en alguns casos aquesta pot ser la finalitat del canvi de resolució.
8.2.5.Frame rate
El frame rate és el valor que indica quants fotogrames tindrà cada segon de vídeo. Normalment, els vídeos tenen un valor fix de 23.976, 24, 25, 29.97, 30 o 60 fotogrames per segon (fps, de l'anglès frames per second). És possible també exportar el vídeo amb una frame rate variable. La idea consisteix en què l'algoritme analitzarà el vídeo i incrementarà o reduirà el nombre de fotogrames per segon en funció de la quantitat de moviment que tingui el contingut del vídeo. Si bé, a priori, sembla una molt bona idea, la realitat és que no tots els programes o plataformes de distribució de vídeo accepten aquest format, a banda que també poden haver-hi problemes de sincronització amb l'àudio. Per tant, en general, es desaconsella fer servir un valor de frame rate variable.
També, en general, s'aconsella respectar el valor de frame rate del vídeo original. Canvis en el frame rate, sobretot si són importants, poden provocar alguns efectes indesitjats en el vídeo exportat, encara que, com sempre, dependrà del contingut del vídeo.
8.2.6.Format entrellaçat i progressiu
Existeixen dos mètodes d'escaneig de la imatge: entrellaçat i progressiu. Bàsicament, el vídeo entrellaçat consisteix en dues semiimatges o camps que, junts, o entrellaçats per ser més exactes, formen un únic fotograma.
Aquest sistema fa que l'espectador rebi més impactes visuals (un per cada camp) i té la finalitat de minimitzar l'efecte parpelleig dels antics sistemes analògics. De totes maneres, es pot considerar un mètode obsolet o pràcticament obsolet, ja que la tecnologia actual permet resoldre aquest efecte sense haver de recórrer a aquesta tècnica.
El mètode progressiu, dibuixa el fotograma progressivament, línia a línia i de dalt a baix.
Així doncs, si no és per algun projecte amb característiques molt particulars, per regla general, en exportar o convertir un vídeo, sempre haurem de seleccionar el mètode progressiu.

Bibliografia

Pareja, Emilio (1994). El magnetoscopio digital profesional. Editorial Marcombo.
Pohlmann, Ken C. (2005). Principles of digital àudio. Editorial McGraw Hill.
Rodríguez, Carlos (1989). Magnetoscopios digitales. Editorial IORTV.
Tarrés, Francesc (2000). Sistemas audiovisuales. Televisión analógica y digital. Ediciones UPC.
Watkinson, John (1992). El arte del vídeo digital. Editorial IORTV.
Enllaços d'Internet