Tècniques d'edició i processament digital del so

  • Josep Manuel Berenguer

  • Marc Dalmases i Castellanes

  • Sergi Jordà Puig

PID_00215113
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars del copyright.

Índex

Objectius

  1. Capturar, emmagatzemar i reproduir informació auditiva de manera eficient i eficaç.

  2. Modificar informació digital per a adaptar-la als requisits dels objectius particulars de cada projecte.

Competències
  • 4. Adaptar-se a les tecnologies i als futurs entorns actualitzant les competències professionals.

  • 16. Capturar, emmagatzemar i modificar informació d'àudio, imatge i vídeo digitals aplicant principis i mètodes de realització i composició del llenguatge audiovisual.

  • 22. Atendre adequadament consultes sobre projectes, tecnologies i mercat de productes multimèdia avaluant de manera precisa l'entorn d'aplicació, els recursos i les alternatives tecnològiques disponibles.

Metodologia
La lectura completa del mòdul i la posada en pràctica dels exemples proposats.
El treball personal és fonamental per a integrar els coneixements pràctics en les pròpies normes de conducta quan es treballa amb els nous entorns de programació i gestió de continguts multimèdia. L'estudiant s'ha de prendre el seu temps per fer els exercicis i acceptar que cal reflexionar-hi i, fins i tot, fer-los diverses vegades, amb la finalitat d'automatitzar les accions i interioritzar les formes de pensament pròpies de cada nou context d'operació.

1.Introducció al processament digital

La "manipulació" del so, ja sigui amb finalitats estètiques o amb finalitats pràctiques, no és sens dubte un invent dels ordinadors. Sense anar més lluny, la forma i el material de qualsevol instrument musical acústic incideix directament en la qualitat sonora d'aquest, cosa que ja sabien bé Antonio Stradivarius o altres fabricants italians de violins, que van aconseguir construir, fa gairebé tres segles, instruments que encara avui no han pogut ser superats.
No tan lluny en el temps, i ja en el domini de l'electrònica analògica, podríem esmentar les manipulacions de cinta magnètica que va fer, cap al 1948, el compositor francès Pierre Schaffer (amb les quals s'inicia el corrent musical denominat música concreta), o el pedal wah-wah i altres pedals d'efectes que van popularitzar guitarristes dels anys seixanta com Jimi Hendrix o Frank Zappa.
Però és sens dubte amb la conversió d'un so, procedent de qualsevol font analògica, en dígits, emmagatzemables en la memòria o el disc dur de l'ordinador, tal com s'ha estudiat en altres matèries, quan les possibilitats del processament de so es disparen, ja que aquests dígits seran, efectivament, manipulables mitjançant una infinitud de processos o algoritmes lògics i matemàtics.
En aquest mòdul veurem que mitjançant diversos processos és possible corregir defectes en els sons originals, enaltir-los, eliminar sorolls, modificar-los lleugerament o generar fins i tot sons nous totalment irrecognoscibles, possibilitats que es fonamenten en una disciplina d'investigació que combina l'enginyeria, la física i les matemàtiques, i que té diverses dècades d'existència: el processament digital de senyal.

1.1.Algunes possibilitats del procés digital d'àudio

Mitjançant el processament digital de so és possible, entre altres coses:
  • Tallar, enganxar, eliminar i substituir fragments sonors amb una precisió microscòpica.

  • Corregir els nivells en sons mal gravats.

  • Eliminar sorolls de fons en enregistraments analògics antics, o en enregistraments extrets de vinil o cinta de casset.

  • Eliminar o minimitzar sorolls imprevistos en un enregistrament (com veus de fons, cotxes, etc.).

  • Modificar la freqüència del so convertint el miol d'un gat en el rugit d'un lleó, o la nostra pròpia veu en la veu d'un ogre o d'un barrufet.

  • Obtenir veus murmuradores o bateries contundents a partir d'enregistraments "normalets".

  • Equalitzar qualsevol so d'infinites maneres diferents.

  • Aconseguir efectes típics de ciència-ficció.

  • Afegir ecos, retards i reverberacions a qualsevol enregistrament, com si s'hagués fet en una catedral o al Gran Canyó del Colorado.

  • Simular veraçment l'acústica de qualsevol espai existent, com si l'enregistrament s'hi hagués desenvolupat.

  • Simular trajectòries (cotxes, persones caminant, etc.), i també les posicions espacials (so procedent de la dreta, de dalt, de lluny, de prop, etc.) de les fonts sonores.

  • Accelerar o alentir sons sense modificar-ne la freqüència.

  • Modificar la freqüència de qualsevol so sense modificar-ne la durada.

  • Crear sons híbrids amb què es poden aconseguir, per exemple, "objectes o animals parlants".

1.2.Classificació d'efectes de processament digital d'àudio

Les possibilitats de modificació del so digital són interminables. Un estudi detallat ens portaria a indagar en les complexes equacions de la teoria del processament digital de senyal. Això no és a l'abast d'aquest curs.
Per a estudiar aquestes possibilitats d'una manera pràctica i concisa, però clara i comprensible alhora, s'intentarà establir una taxonomia que ens permeti organitzar aquests efectes d'una manera coherent, explicant somerament alguns dels principis bàsics de processament de senyal involucrats, i comprovant-ne alhora l'aplicació pràctica en un entorn editor d'àudio, com en l'Audition o l'Audacity.
Encara que tot intent de classificació dels efectes més freqüents només pot ser aproximat, ja que molts requereixen una combinació d'operacions que els fa partícips de diverses categories diferents, es mostra a continuació una taula amb els més representatius.
Taula 1. Classificació d'efectes de processament digital d'àudio més freqüents

Efectes simples en el domini temporal, edició

  • Copiar, tallar o enganxar fragments

  • Eliminar i inserir silencis

  • Invertir en el temps

Efectes simples sobre l'amplitud

  • Modificació del guany

  • Envolupants

  • Silenciament de fragments

  • Portes de soroll

  • Normalització

  • Fades in i fades out

  • Correcció del DC OFFSET

  • Inversió

  • Modulació d'amplitud, trèmolo

Efectes simples sobre la freqüència

  • Transposició, modificació de la freqüència de mostreig

  • Pitch Bend

  • Modulació de freqüència, vibrato

Processadors de rang dinàmic

  • Compressor

  • Limitador

  • Expansor

  • Distorsió

  • Reducció de soroll

Filtratge (i efectes basats en filtratge)

  • Filtre passabaix

  • Filtre passaalt

  • Filtre passabanda

  • Filtre rebuig-banda

  • Equalització

Efectes basats en retards

  • Retards i delays

  • Ecos

  • Flanger

  • Phaser

  • Wah-wah

  • Chorus

Reverberació i espacialització

  • Reverberació

  • Espacialització

Altres efectes complexos

  • Simulació d'espais sonors

  • Pitch-shift i comprensió / expansió temporal

  • Hibridació de sons

En aquest primer apartat es començarà estudiant les possibilitats d'edició més senzilles i intuïtives, i en els apartats següents d'aquest mòdul s'aniran introduint gradualment efectes i processos cada vegada més complexos i sofisticats.

1.3.Visualització de la informació temporal i d'amplitud. Nivells de zoom en l'Audition o l'Audacity

Abans d'endinsar-nos en l'edició i el processament del so, indicarem algunes de les maneres com l'Audition o l'Audacity permeten mostrar la informació.
1.3.1.Informació temporal
La informació temporal apareix, a tall de regla graduada, a la part superior de qualsevol finestra que contingui un so, i també en la part inferior esquerra de la finestra.
Figura 1. Representació del temps en l'Audition
Figura 1. Representació del temps en l'Audition
  • La casella de la part inferior situada més a l'esquerra indica la posició actual del cursor (o de l'inici del fragment seleccionat, en cas que n'hi hagués).

  • Les dues caselles restants únicament mostren valors si hi ha un fragment seleccionat, ja que indiquen, respectivament, la posició final d'aquest fragment i la durada.

1.3.2.Canvi d'escala temporal
L'Audition o l'Audacity permeten, igual que altres programes similars, visualitzar la informació utilitzant diferents tipus d'escales o d'unitats.
La informació temporal es pot visualitzar en segons, en nombre de mostres, en compassos musicals, en nombre de fotogrames de vídeo, etc.
Per a canviar aquest mode de visualització, n'hi ha prou clicant amb el botó dret del ratolí en la part superior perquè s'obri un menú contextual, on podrem seleccionar la unitat que volem.
Figura 2. Opcions de visualització de l'escala temporal en l'Audition
Figura 2. Opcions de visualització de l'escala temporal en l'Audition
Les opcions Hms, Decimal i Muestras són les més convenients quan no s'estigui treballant amb vídeo, i són les que s'utilitzaran indistintament en la majoria d'operacions d'aquest mòdul.
1.3.3.Informació de nivells
Els nivells sonors es visualitzen al costat vertical dret de cada finestra d'Audition. L'única unitat disponible és el decibel.
Es mostra el valor en decibels, prenent com a origen (0 dB) els dos valors extrems. Per això tots els altres punts (tant els positius com els negatius) mostraran valors inferiors a 0, i cada vegada més negatius així que ens apropem (des de qualsevol dels dos costats) al punt mitjà del silenci, que presenta un valor de –∞.
1.3.4.Zoom temporal i zoom de nivell
L'Audition o l'Audacity permeten visualitzar qualsevol arxiu de so amb diversos nivells de zoom diferents, tant en l'escala temporal (eix horitzontal) com en l'escala de nivell (eix vertical).
a) L'escala temporal es pot canviar mitjançant els tabuladors, situats en la representació global de la forma d'ona que hi ha a la part superior. Aquests tabuladors tenen un correlat en els de la representació inferior, que només conté una part de la forma d'ona.
Figura 4. Modificació de l'escala temporal
Figura 4. Modificació de l'escala temporal
b) L'escala de nivell es canvia mitjançant les icones de l'extrem dret dels controls situades en l'extrem inferior de la finestra.
Figura 5. Modificació de l'escala d'intensitats
Figura 5. Modificació de l'escala d'intensitats
1.3.5.Com podem invertir temporalment un fragment
L'Audacity permet invertir temporalment el contingut d'un arxiu d'àudio. Per a això cal seleccionar el fragment que volem i triar Efecto > Revertir. El resultat és el mateix que si reproduíssim una cinta magnètica o un disc de vinil al revés.

2.Efectes simples en el domini temporal

En aquest apartat estudiarem accions tan senzilles i evidents com copiar, tallar o enganxar.
Aquest tipus de modificacions ja es feien amb el so abans de l'aparició de l'àudio digital, tallant i enganxant cinta magnetofònica (i així es van continuar fent en el cinema fins fa ben poc). Però és indubtable que la precisió microscòpica que ofereixen programes com l'Audition o l'Audacity, que complementa l'escolta de qualsevol fragment amb la visualització, no té parangó en l'edició analògica.
En l'Audition o l'Audacity aquestes accions bàsiques:
  • Es troben al menú Editar (com en qualsevol programa del Windows estàndard).

  • Utilitzen les tecles acceleradores convencionals (Ctrl + C, Ctrl + X i Ctrl + V).

  • Funcionen com cal preveure: se selecciona un fragment amb el ratolí i s'elimina, o es copia i insereix en un altre lloc.

Malgrat que aquestes operacions oculten pocs secrets, hi ha, tanmateix, algunes consideracions que serà convenient tenir en compte, i que es descriuen a continuació.

2.1.Edició bàsica en l'Audition

2.1.1.Com cal inserir, substituir o crear un nou arxiu
Si una vegada seleccionat i copiat (o tallat) un fragment, activem Paste (enganxar):
  • Si ho fem quan hi ha un altre fragment seleccionat, estarem fent una substitució del nou fragment seleccionat pel fragment copiat.

  • Si ho fem sense que hi hagi cap nou fragment seleccionat, estarem fent una inserció en la posició actual del cursor.

2.1.2.Com cal inserir silencis
Per a inserir un silenci, n'hi ha prou de posicionar el cursor en l'instant que volem i seleccionar el menú Editar > Insertar > Silencio, i després s'obrirà un diàleg en el qual s'indicarà la durada del silenci per inserir. El mateix diàleg també permet inserir silencis a l'inici o al final de l'arxiu. Si se selecciona un fragment d'arxiu, no apareix diàleg i el temps de silenci és igual al de la durada del segment seleccionat.
Figura 6. Inserció de silencis en l'Audition
Figura 6. Inserció de silencis en l'Audition

2.2.Aparició de clics en inserir o eliminar un fragment

Les discontinuïtats breus i brusques en un so produeixen molestos clics, com es pot comprovar en els exemples següents: clic1silence i clic2sinus.
Per a evitar aquests clics o altres sorolls en eliminar o inserir un fragment, no hauríem de deixar una discontinuïtat excessiva entre les noves mostres contigües. La manera més senzilla de preservar aquesta continuïtat és seleccionar fragments amb inici i final nuls. A continuació es mostra una selecció incorrecta (figura 7) i una de correcta (figura 8).
Figura 7. Selecció incorrecta: l'inici i final no són nuls.
Figura 7. Selecció incorrecta: l'inici i final no són nuls.
Figura 8. Selecció correcta: l'inici i final són nuls.
Figura 8. Selecció correcta: l'inici i final són nuls.

2.3.Marcadors i regions en l'Audition

Els marcadors són una utilitat de l'Audition que facilita el treball quan volem seleccionar o mantenir un accés ràpid a diversos fragments o punts d'un so.
  • Per a col·locar un marcador sobre qualsevol punt d'un arxiu de so, n'hi ha prou de posicionar el cursor en el punt que volem, i prémer la tecla * (o seleccionar l'opció de menú Editar > Marcadores > Establecer punto señal de Flash; apareixerà una marca vertical en la posició seleccionada.

  • Un document pot tenir tants marcadors com vulguem.

  • Cada marcador pot ser esborrat per mitjà de la combinació de la tecla Ctrl amb clic sobre el marcador.

  • Els noms dels marcadors i les seves característiques, com, per exemple, la posició temporal al document, poden ser editats al tauler de marcadors.

2.4.Conclusió

Són realment moltes les indicacions i detalls addicionals que es podrien donar respecte a l'edició de blocs i fragments en l'Audition o l'Audacity.
En aquest apartat hem descrit algunes de les prestacions principals, ja que si bé la manipulació i recombinació de fragments sonors no constitueix realment una part del que tradicionalment s'entén com a processament digital d'àudio, sí que dóna algunes de les possibilitats més evidents i simples que els programes per a edició digital de so, com l'Audition o l'Audacity o qualsevol altre similar, ens ofereixen.
D'altra banda, accions com les de tallar i enganxar fragments es duen a terme amb summa freqüència, i els consells bàsics que hem apuntat, com per exemple la manera d'evitar clics en inserir o eliminar un fragment, hauran de ser tinguts sempre molt en compte a l'hora d'editar qualsevol so.

3.Efectes bàsics sobre l'amplitud

3.1.Aplicació d'efectes en l'Audition o l'Audacity

Si en l'apartat anterior hem vist processos que afecten l'estructura temporal dels sons, en aquest estudiarem els efectes que operen modificant l'amplitud. Aquests efectes treballen normalment el so mostra per mostra, modificant el valor de cada una mitjançant multiplicacions.
Abans d'estudiar-los veurem algunes indicacions addicionals sobre l'aplicació d'efectes en l'Audition o l'Audacity.
La majoria d'efectes que estudiarem són accessibles en l'Audition o l'Audacity des dels menús Proceso i Efectos. Si se seleccionen després de l'opció del menú Efectos > Avanzados obren una finestra de diàleg des de la qual podem canviar cada un dels paràmetres disponibles. Tots funcionen d'acord amb els mateixos principis bàsics.
3.1.1.Efectes sobre un fragment o sobre la totalitat
Quan tinguem seleccionat un fragment i obrim un efecte, aquest només s'aplicarà sobre el fragment seleccionat. En el cas que no tinguem cap fragment seleccionat, s'aplicarà sobre la totalitat de l'arxiu. Tots els diàlegs presenten a més un botó Selection que permet modificar aquesta selecció.
3.1.2.Efectes en temps real
Fins fa poc la potència dels ordinadors no permetia l'aplicació d'efectes en temps real. Avui dia això ja és possible en gairebé tots els programes editors d'àudio, encara que la qualitat dels resultats dependrà òbviament de la potència de l'ordinador i de la complexitat de l'efecte per aplicar-hi. Quan la potència de l'ordinador sigui insuficient, podran aparèixer clics i petits silencis intermitents, però amb les màquines actuals hauria de ser suficient per a la majoria d'efectes.
Els programes com l'Audition o l'Audacity no estan estrictament pensats per al temps real, però no hi ha dubte que aquesta possibilitat d'interacció facilita enormement l'ajust correcte dels paràmetres. Si abans era necessari ajustar, processar, escoltar el resultat i, normalment, desfer i reajustar, repetint el cicle diverses vegades, avui tot això es pot fer de manera totalment interactiva. Per a això, en els processos que ho permeten, n'hi ha prou de seleccionar l'opció Vista prèvia disponible a les finestres de diàleg, i anar ajustant els paràmetres mentre escoltem els efectes produïts. Quan es desactiva el botó d'aplicació de l'efecte, s'anul·la totalment l'efecte per a facilitar la comparació entre el so tractat i sense tractar pel procés amb què es treballa.
Convé també tenir en compte que encara que tinguem l'escolta en temps real, l'efecte s'ha d'aplicar a continuació, en diferit, una vegada finalitzat l'ajust. Això es du a terme per mitjà del botó Aplicar a selección en la part inferior esquerra del tauler d'efectes de l'Audition. En prémer aquest botó, desapareix l'efecte seleccionat de la llista d'efectes que es vol aplicar.
Figura 9. Finestra de Vista previa en l'Audition, amb el botó Aplicar a la selección
Figura 9. Finestra de Vista previa en l'Audition, amb el botó Aplicar a la selección
3.1.3.Obrir i desar configuracions
Alguns efectes presenten molts paràmetres i poden ser complicats d'ajustar. Per això hi ha la possibilitat d'obrir i desar presets de configuració. Els presets disponibles per a cada efecte se seleccionen mitjançant la llista desplegable situada a la part dreta del tauler general d'efectes, a la dreta de cada un dels efectes que volem aplicar. Quan desem una configuració pròpia no ens haurem de preocupar del lloc on es desa (com succeeix amb els arxius normals). N'hi haurà prou de donar-li un nom, de manera que quan obrim la llista desplegable la nostra configuració nova s'haurà afegit a les anteriors.
Figura 10. Menú de configuracions d'efectes en l'Audition
Figura 10. Menú de configuracions d'efectes en l'Audition

3.2.Efectes simples sobre l'amplitud 1 (guany, normalització i portes de soroll)

Aquests efectes figuren entre els més senzills. Tots modifiquen l'amplitud dels senyals, i operen fent diverses multiplicacions per a cada una de les mostres d'un fragment. en l'Audition o l'Audacity, la majoria estan disponibles als menús Proceso i Efectos.
3.2.1.Modificació del guany
Modificar el guany consisteix a multiplicar cada una de les mostres per un valor real. Si el valor està comprès entre 0 i 1 el nivell sonor disminueix, mentre que a partir d'1 augmenta. Es pot aplicar per a potenciar sons que s'han gravat amb un nivell excessivament baix (o per a reduir els que són massa intensos).
en l'Audition, l'efecte és accessible a la minifinestra flotant que es pot moure amb l'ajuda del punter del ratolí. Simplement accionant el potenciòmetre, s'augmenta o disminueix el volum. L'opció Procesos > Subir volumen augmenta el volum una quantitat fixa cada vegada que se selecciona.
3.2.2.Guany i distorsió
Sempre que es facin operacions sobre l'amplitud, s'haurà de tenir cura que els nivells resultants no superin el rang permès per a cada mostra, que en el cas de 16 bits correspon a ±32.767. Altrament, es produirà distorsió i saturació.
La saturació es manifesta quan se superen els límits d'emmagatzemament del sistema i aquest no és capaç de representar les característiques de la forma d'ona en els seus extrems, com s'aprecia a la dreta de la figura 12, que mostra el resultat d'aplicar un guany massa gran al fragment de so de l'esquerra (s'ha triat representar un fragment molt breu, amb un nivell de zoom temporal que permeti percebre l'efecte sobre les mostres individuals).
Figura 12. Un fragment de so (esquerra) i el mateix fragment distorsionat (dreta), després d'aplicar-li un guany del 300% (+9,55 dB). La distorsió s'observa perfectament a les puntes retallades de la part superior.
Figura 12. Un fragment de so (esquerra) i el mateix fragment distorsionat (dreta), després d'aplicar-li un guany del 300% (+9,55 dB). La distorsió s'observa perfectament a les puntes retallades de la part superior.
3.2.3.Silenciament
El silenciament és un cas extrem de guany que consisteix simplement a multiplicar per zero la zona seleccionada.
3.2.4.Porta de soroll: Efecte > Compressor
Les portes de soroll s'utilitzen per a silenciar les mostres per sota d'un determinat valor llindar, que s'introdueix com a paràmetre.
En la figura 13 s'esquematitza el procés que es pot utilitzar per a eliminar soroll de fons en els moments de "silenci", assignant un valor llindar lleugerament superior a la intensitat del soroll de fons. Com es veurà més endavant, hi ha formes més sofisticades de reducció de soroll que, a diferència d'aquesta, aconsegueixen eliminar també el soroll de fons fins i tot dels moments en què aquest es mescla amb altres sons.
Figura 13. Portes de soroll. En a es representa un senyal el nivell del qual decreix fins que arriba a ser el mateix que el del soroll de fons, present en tot sistema de tractament de senyal. En b es representa l'efecte d'una porta de soroll aplicada a un senyal.
Figura 13. Portes de soroll. En a es representa un senyal el nivell del qual decreix fins que arriba a ser el mateix que el del soroll de fons, present en tot sistema de tractament de senyal. En b es representa l'efecte d'una porta de soroll aplicada a un senyal.
Les portes de soroll s'utilitzen també sovint amb una funció estètica, especialment per a processar pistes de bateria, amb la qual cosa s'aconsegueixen atacs i decaïments més secs.
Aquest efecte s'aconsegueix en l'Audition ajustant el llindar del compressor. Presenta dos paràmetres addicionals: el temps d'atac i el temps de decaïment, amb els quals es pot aconseguir que l'efecte no soni tan brusc i antinatural.
Es recomana a l'estudiant que experimenti amb aquest efecte variant els diferents paràmetres disponibles, tant amb finalitats estètiques i creatives (un fragment de bateria seria, com hem esmentat, el més oportú), com per a intentar netejar un enregistrament sorollós. Encara que, per a aquesta última comesa, hi ha efectes molt més sofisticats, que s'estudiaran més endavant, que ofereixen resultats molt superiors i són, per tant, els que se solen aplicar en la pràctica.
3.2.5.Normalització: Procés > Normalitzar
Normalitzar és un cas particular de modificació de guany que consisteix a obtenir la màxima amplitud possible sense que es produeixi distorsió. Això s'aconsegueix recorrent la zona seleccionada i desant-ne l'amplitud màxima. Una vegada obtinguda, es multipliquen totes les mostres del fragment pel quocient màxima amplitud possible / màxima amplitud del fragment. Si, per exemple, l'aplicació detectés un màxim de 12.345, totes les mostres de la zona seleccionada es multiplicarien per 2,654273 (32.767 / 12.345 = 2,654273, en què 32.767 és el màxim valor positiu en un so de 16 bits).
La teoria sobre això és així de precisa, però el cert és que les aplicacions pràctiques són cada vegada més sofisticades i ofereixen noves possibilitats de configuració. Aquest és el cas de l'efecte Normalitzar disponible en l'Audition o l'Audacity, que permet a més configurar atacs i diversos paràmetres més.
La normalització és molt útil per a uniformitzar els nivells d'enregistraments de procedències dispars i obtenir la màxima resolució per a cada cas. Però té també els seus perills si s'aplica indiscriminadament, com per exemple en enregistraments o fragments que per raons estètiques requereixin nivells inferiors (seria el cas d'una veu murmuradora).

3.3.Efectes simples sobre l'amplitud 2 (envolupants, foses i modulació d'amplitud)

3.3.1.Aplicació d'envolupants: Procés > Aparéixer / Desaparéixer
Una envolupant és una corba que determina l'evolució temporal de l'amplitud. Programes com l'Audition o l'Audacity permeten que l'usuari controli l'envolupant per mitjà dels processos Aparéixer i Desaparéixer, la forma dels quals es pot controlar arrossegant el punter del ratolí cap a dalt o cap a baix sobre la seva icona, i fan posteriorment el producte de l'envolupant i el senyal seleccionat, generant nous sons d'amplitud més variable en el temps.
Les envolupants s'empren per a afegir més varietat a un so massa estacionari. Així, per exemple, una envolupant com la de la figura 14, que, aplicada al senyal original, contribueix a donar-li un atac ràpid i intens de tres segments (60 ms, 150 ms, 700 ms) per a obligar-lo després a decréixer entre 700 ms i 2.000 ms, permet generar sons percussius a partir de qualsevol so d'amplitud constant.
Figura 14. Envolupant percussiva
Figura 14. Envolupant percussiva
Les envolupants són elements essencials en qualsevol sintetitzador.
3.3.2.Foses: Procés > Aparèixer / Desaparèixer
Amb els termes aparèixer / desaparèixer, que són traducció directa de l'anglès fade in i fade out, però que es podrien traduir com a fosa d'entrada i fosa de sortida, respectivament, es designen dues envolupants particulars, que tenen opcions de menú pròpies, ja que s'utilitzen molt.
La primera (fosa d'entrada), és una envolupant amb valor inicial 0 i valor final 1, que s'aplica a l'inici d'un fragment, mentre que la segona (fosa de sortida), s'inicia amb 1 i acaba amb 0, i s'aplica normalment al final d'un fragment.
Quan un so digital comença bruscament amb un valor massa alt, es produeix una discontinuïtat exagerada al pas del zero al primer valor no nul que té com a resultat un clic perfectament audible.
Les foses d'entrada eliminen fàcilment aquesta incorrecció. Per a això, n'hi ha prou de seleccionar un petit fragment en l'inici i aplicar Aparèixer.
La durada del fragment seleccionat pot variar entre uns quants mil·lisegons, si tan sols volem eliminar el clic, fins a diversos segons, si volem que el so s'iniciï lentament.
Desaparèixer compleix lògicament la mateixa funció, però per al final dels sons, evitant ruptures massa brusques.
3.3.3.Modulació d'amplitud: Efectes > Trèmolo
L'Audacity permet la modulació d'amplitud. Consisteix a multiplicar el fragment per un senyal periòdic, normalment sinusoïdal, cosa que en terminologia musical es denomina trèmolo. Els paràmetres són freqüència i amplitud de la modulació. Aquest efecte s'utilitza per a crear efectes de trèmolo o per a augmentar la intensitat espacial d'un enregistrament, i pot requerir una certa recerca i tempteig abans de trobar els valors adequats de tots dos dos paràmetres.
Convé tenir en compte que per a obtenir un efecte d'oscil·lació de l'amplitud, la freqüència de l'ona moduladora haurà de ser inferior a la freqüència audible, és a dir, per sota dels 20 Hz. Per sobre d'aquest valor el resultat no és ja una variació de l'amplitud sinó un canvi tímbric que afegeix noves freqüències al so original.
3.3.4.Inversió: Efectes > Inversió
L'Audacity permet dur a terme la inversió dels valors de les mostres. Aquesta inversió no s'ha de confondre amb l'opció Invertir, ja que amb aquesta operació es fa una reflexió respecte a l'eix horitzontal (mentre que en el cas anterior la inversió era en el temps, respecte de l'eix vertical centrat just en la meitat de la durada del so contingut a l'arxiu). D'aquesta manera els valors positius passen a ser negatius i viceversa, i s'aconsegueix un canvi de fase. És un efecte molt subtil que es percep millor quan la inversió s'aplica a un únic canal d'un so estèreo. En aquests casos, el resultat es percep més com un canvi de la posició espacial del so que com un canvi de timbre pròpiament dit.

3.4.Efectes simples sobre l'amplitud 3 (mescles)

Per a acabar aquest apartat, esmentarem breument un últim efecte, que a diferència dels anteriors (que operaven multiplicant el senyal per valors propers a 0 o a 1) opera de manera additiva.
Així, per exemple, si es prenen dos arxius de so i sumem els valors de les seves mostres una per una (la primera mostra del so 1 amb la primera mostra del so 2, la segona mostra del so 1 amb la segona mostra del so 2...), estarem obtenint un tercer so que és la suma, o mescla, dels dos anteriors.
3.4.1.Mesclar dos sons: Editar > Inserir > Forma d'ona en arxiu multipista nou
Mesclar sons significa, per tant, sumar dos fragments (d'un mateix arxiu o d'arxius diferents). En la majoria de programes aquesta operació és normalment accessible des dels menús, com un cas especial d'Enganxar, per la qual cosa ha d'anar precedit per l'acció de Copiar un dels dos fragments per mesclar. A continuació, i abans d'executar l'ordre, posicionarem el cursor en l'inici de la zona destinació.
En l'Audition, el mecanisme és el següent:
1) Amb la representació d'un arxiu d'àudio acabat d'obrir en pantalla, seleccionem Editar > Insertar > Forma de onda en archivo multipista nuevo. Això obre la representació d'un arxiu multipista nou.
2) Del tauler d'arxius, arrosseguem un so diferent del primer a l'espai multipista. Una representació d'aquest arxiu s'afegeix a la finestra sota el primer arxiu.
3) Amb els botons de nivell, ajustem la mescla de tots dos sons.
4) Aquesta manipulació es pot dur a terme amb tants arxius d'àudio com vulguem.

4.Detecció de clics

En aquest apartat proposem 3 activitats entorn de la detecció de clics.

4.1.Activitat 1: detecció de clics

  • Obriu l'arxiu clic1silence en l'Audition. Aquest arxiu conté un segon de silenci interromput per tres petits clics, de baix nivell i escasses mostres cada un, però encara així perfectament audibles.

  • Ajusteu al màxim els dos zooms de l'Audition (vertical i horitzontal) per a estudiar aquests clics amb detall, i determinar per a cada un i amb la màxima precisió possible:

Posició
Nombre de mostres
Valor màxim

 

 

 

 

 

 

 

 

 

  • Obriu a continuació l'arxiu clic2sinus, que conté una ona sinusoïdal d'1 s de durada amb diversos clics.

  • Quina és la freqüència de l'ona?

  • Quants clics es perceben?

  • Detecteu la posició de cada un (en segons i en mostres), utilitzant les eines de zoom amb aproximació màxima, per a obtenir la màxima precisió possible.

  • Són tots els clics deguts a la mateixa causa?

  • Expliqueu breument el tipus de discontinuïtat que es produeix en cada un.

Posició del clic
Descripció
Mostres
Segons
 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4.2.Activitat 2: eliminació de clics

Seleccioneu una part de l'arxiu on s'hagi detectat un clic i apliqueu Processos > Eliminació d'espetecs i detonacions. Es comprovarà que no sempre desapareixen tots els defectes, però s'aconsegueixen atenuar bastant. Per desgràcia, sovint l'única manera d'eliminar els clics és tornar a començar amb el procés d'obtenció de l'arxiu.

4.3.Activitat 3: detecció del pols d'un arxiu

En l'Audacity, obriu un arxiu que contingui sons de bateria, com l'arxiu bateria, seleccioneu-lo sencer i apliqueu-li la funció Analitzar > Find beats. En el quadre de diàleg emergent, ajusteu el valor llindar de la intensitat per a detectar com a batement.
Figura 15. Finestra d'ajustos de Find beats en l'Audacity
Figura 15. Finestra d'ajustos de Find beats en l'Audacity
Després de prémer el botó Acceptar, els punts de més intensitat queden marcats a la part inferior de la finestra, com es mostra en la figura 16:
Figura 16. Finestra d'edició en l'Audacity, després de l'ús de Find beats
Figura 16. Finestra d'edició en l'Audacity, després de l'ús de Find beats

5.Efectes simples sobre la freqüència

Hi ha diverses operacions senzilles que comporten modificacions freqüencials. La comprensió de totes és fonamental per a poder treballar amb facilitat amb el so digital.

5.1.Modificacions de la freqüència del so

5.1.1.Modificació de la freqüència de mostreig sense modificar la freqüència del so
En remostrejar modifiquem la freqüència de mostreig d'un arxiu sense alterar la freqüència del so. Això s'aconsegueix normalment eliminant o repetint algunes mostres. Per a passar, per exemple, de 44.100 Hz a 22.050 Hz, s'elimina directament una mostra de cada dues, mentre que per a fer el canvi invers, cada mostra és duplicada. En realitat, per a realitzar una conversió més precisa es fa una interpolació, de manera que si una mostra val 1.000 i la següent 1.020, la que s'afegeix prendrà el valor 1.010 (quan el quocient de les dues freqüències no és un valor sencer, les matemàtiques involucrades es compliquen una mica més, però el principi continua essent el mateix).
En l'Audacity es du a terme aquesta manipulació seleccionant la freqüència de mostreig que volem al menú contextual que apareix en polsar sobre la representació de la freqüència a l'esquerra de la finestra, on es representa la funció d'ona continguda a l'arxiu. Aquesta opció s'empra per a reduir la mida (i la qualitat) d'un arxiu.
Figura 17. Finestra d'ajustos de freqüència de mostreig en l'Audacity
Figura 17. Finestra d'ajustos de freqüència de mostreig en l'Audacity
5.1.2.Modificació de la freqüència de reproducció, modificant la freqüència del so
Suposem que tenim un so digitalitzat a 44.100 Hz. Si decidim que la seva freqüència de mostreig passi a 22.050 Hz sense modificar el so per si mateix, el resultat durarà el doble i sonarà una octava per sota, és a dir, amb la meitat de la seva freqüència original, ja que el programa llegirà les mostres a la meitat de velocitat. En realitat els canvis no es duen ara a terme sobre l'arxiu de so, sinó sobre el descriptor que incorpora cada arxiu.
Aquesta operació equival a visionar una cinta de vídeo amb alentiment o a càmera ràpida (la informació que hi ha sobre la cinta no s'està modificant, tan sols la manera d'interpretar-la) o a reproduir una cinta o un disc de vinil a velocitats diferents de l'original. Un LP de 33 rpm reproduït a 45 rpm puja la freqüència en aproximadament un 136%. Les freqüències superiors fan que el so resultant sigui més agut, mentre que els valors inferiors el fan tornar més greu.
A l'ordinador, aquest efecte s'aconsegueix modificant tan sols el valor de freqüència a la capçalera de l'arxiu, sense modificar per a res les dades. Aquesta operació comporta a més la modificació de la durada del so (a una freqüència doble, el so durarà la meitat).
Per a fer aquesta operació amb l'Audacity cal seleccionar el menú contextual que apareix en prémer la pestanya on es representa el nom de l'arxiu i seleccionar la freqüència que volem.
Figura 18. Menú contextual per a l'ajust de la freqüència de mostreig en l'Audacity
Figura 18. Menú contextual per a l'ajust de la freqüència de mostreig en l'Audacity
Exemple
És possible fer una senzilla prova de l'efecte que s'obté modificant la freqüència de reproducció del so saxo44 passant de 44.100 Hz a 11.025 Hz. En aquest cas, en disminuir la freqüència en un factor 4, estem baixant el so de dues octaves, amb la qual cosa el resultat s'assemblarà més a un contrabaix (o a un saxo baix, instrument poc habitual) que a un saxo alt, que és l'instrument utilitzat en l'enregistrament.
Deseu el so nou amb el nom saxobajo i compareu-ne la mida amb la del so original saxo44. Veureu que totes dues mides són iguals, encara que el segon so dura quatre vegades més. Això és així perquè en el segon so es llegeixen quatre vegades menys mostres per cada segon.

5.2.Transposició

El terme musical transposar s'utilitza en música per a pujar o baixar una nota o una melodia. En el tractament digital de so, transposar significa modificar l'altura, però mantenint la freqüència de reproducció. El resultat sonor és similar al de la modificació de la freqüència de reproducció del subapartat anterior, encara que, com veurem, l'efecte és en realitat una combinació dels dos anteriors.
En desar l'arxiu saxobajo hem obtingut un nou so amb un caràcter totalment diferent de l'original, que podríem voler utilitzar per a obtenir un efecte peculiar. Però ja que el nou arxiu té una freqüència de reproducció diferent, és probable que si el volguéssim utilitzar en combinació amb altres sons per a fer una composició o una petita sonorització, l'hauríem de remostrejar (modificació de la freqüència de mostreig sense modificar la freqüència del so), per a igualar-ne la freqüència a la dels altres sons utilitzats.
D'altra banda, moltes targetes d'àudio suporten tan sols unes quantes freqüències de reproducció (p. ex., 48.000 Hz, 44.100 Hz, 32.000 Hz, 22.050 Hz i 11.025 Hz) per la qual cosa amb el procés utilitzat en saxobajo tan sols tindríem disponibles uns determinats intervals musicals. Per a obtenir els restants hauríem de fer l'operació a dos passos aplicant primer el mètode B per a obtenir el so que volem i a continuació el mètode A per a adaptar l'arxiu a les necessitats del programa o de la targeta de so.
5.2.1.Transposició en l'Audacity: Efectes > Canvia el to
Afortunadament, aquests dos passos estan freqüentment disponibles de manera automatitzada en la majoria de programes d'edició d'àudio. En l'Audacity n'hi ha prou de seleccionar el menú Efectos > Cambiar tono.
Figura 19. Finestra d'ajust de la transposició (cambiar tono) en l'Audacity
Figura 19. Finestra d'ajust de la transposició (cambiar tono) en l'Audacity
El valor de la transposició s'indica mitjançant intervals musicals (pujar dos semitons, etc.), i de manera més precisa mitjançant el percentatge de canvi.
Com s'ha vist, aquestes operacions comporten la variació de la durada del so (més breu com més agut, més llarg com més greu).

6.Processament de rang dinàmic

6.1.Introducció

Recordem que el rang dinàmic d'un fragment sonor està determinat per la diferència (en dB) entre la intensitat més forta i la més feble. Els efectes inclosos en aquest apartat operen directament sobre l'amplitud de les mostres, encara que de maneres més sofisticades que els descrits en l'apartat 2, ja que en lloc d'alterar el nivell de cada mostra d'una manera lineal, ho fan de maneres diferents, depenent del nivell de cada mostra.
Entre aquests efectes, els més importants són els compressors, els expansors i els limitadors, encara que també podríem incloure en aquest apartat les portes de soroll, ja descrites.
Aquests efectes s'han utilitzat extensivament en els estudis d'enregistrament professionals des de fa diverses dècades, inicialment en les seves "versions analògiques" mitjançant diversos i costosos dispositius electrònics.
Una bona manera de caracteritzar aquests processos és per mitjà de la seva funció de transferència, que estableix una correspondència entre les amplituds d'entrada i les amplituds de sortida.
En la figura 38 es mostren diverses funcions d'aquest tipus, juntament amb els efectes que produeixen en un fragment sonor. La funció a és una recta amb una inclinació de 45°, fet que significa que, en aquest cas, no es produeix cap modificació del rang dinàmic (a qualsevol valor d'amplitud d'entrada li correspon el mateix valor a la sortida).
Figura 20. Funcions de transferència de processament de rang dinàmic. A la segona columna es mostra l'efecte produït sobre un mateix so.
Figura 20. Funcions de transferència de processament de rang dinàmic. A la segona columna es mostra l'efecte produït sobre un mateix so.
Alguns programes d'edició d'àudio permeten que l'usuari dibuixi manualment la corba de transferència, per la qual cosa tots els efectes que es descriuen a continuació es poden considerar com a casos particulars d'un procés únic. Aquest no és el cas de l'Audition, les opcions avançades de compressió i dinàmica del qual només ho permeten parcialment. Des d'aquestes és possible crear algunes funcions de transferència, i també carregar inicialitzacions amb configuracions predefinides per a compressors, expansors o limitadors. Tanmateix, sí que és possible configurar corbes d'aquestes característiques a la finestra d'ajustos avançats de l'efecte de distorsió en seleccionar la casella Simétrico.
Figura 21. Finestra d'ajust de l'efecte de distorsió a l'Audition
Figura 21. Finestra d'ajust de l'efecte de distorsió a l'Audition

6.2.Compressors i limitadors

Els compressors s'utilitzen per a reduir el rang dinàmic d'un senyal, ja que aconsegueixen pujar els valors situats per sota d'un mínim, i també reduir els que es troben per sobre d'un valor màxim.
Els limitadors són un cas extrem de compressors, que limiten l'amplitud màxima possible a un valor llindar. Se solen utilitzar en enregistraments de concerts per a evitar que es pugui produir saturació. La seva funció de transferència presenta pendents horitzontals en els extrems. La figura 22 correspon, per tant, a un limitador.
Figura 22. Funció de transferència d'un limitador
Figura 22. Funció de transferència d'un limitador
Interpretació de la figura 22
En l'eix de les abscisses es mostren els valors d'entrada, en aquest cas en dB, encara que també podria estar en valors de la mostra (entre 0 i 32.767, o normalitzats entre 0 i 1), mentre que en les ordenades es mostren els valors de sortida corresponents. Al gràfic, el nivell de 0 dB indica el màxim nivell possible (que en un sistema de 16 bits seria ±32.767).
Estudiant el gràfic s'observa que:
  • Tots els valors d'entrada per sota dels –60 dB passen a tenir –60 dB.

  • Els valors compresos entre –60 dB i –25 dB es mantenen inalterats.

  • Els valors per sobre de –25 dB es redueixen a –25 dB.

El rang dinàmic del senyal queda, per tant, limitat a 35 dB (60-25).
Encara que no ofereix representació gràfica d'aquest comportament, Efectos > Compresión de l'Audition permet configurar funcions de transferència com la que es mostra en la figura. Aquest comportament també pot ser configurat per mitjà de l'opció Efectos > Distorsión.
6.2.1.Portes de soroll
Tenint en compte el que hem estudiat sobre les portes de soroll, com seria la funció de transferència d'una porta de soroll?
Figura 23. Funció de transferència d'una porta de soroll
Figura 23. Funció de transferència d'una porta de soroll
En la figura 23 tots els valors per sota dels –60 dB es redueixen al silenci (infinits dB negatius).
6.2.2.Proporció de compressió
Una manera de definir aquests efectes és a partir de la seva raó o proporció de compressió, que s'obté a partir del quocient nivell entrada/nivell sortida, mesurats tots dos en decibels.
Una raó de 4:1 significa que un canvi de 4 dB en l'entrada només produeix un canvi d'1 dB en la sortida. Com més gran sigui aquesta raó, més gran serà la compressió.

6.3.Expansors

Un expansor és l'oposat d'un compressor. Accentua els canvis, disminuint els nivells febles i augmentant els forts. En un expansor la corba de transferència presenta pendents superiors a la diagonal en els extrems, tal com s'aprecia en la figura 24.
Figura 24. Corba de transferència d'un possible expansor
Figura 24. Corba de transferència d'un possible expansor
En els expansors, la raó de compressió és inferior a 1. Una raó d'1:5 significa que un canvi d'1 dB en l'entrada en produeix un de 5 dB a la sortida.

6.4.Aplicacions

Les aplicacions més comunes són les següents:
  • L'ús de compressors és freqüent en els enregistraments de rock i de música pop. Se solen aplicar a guitarres, baixos i bateries per a obtenir més "pegada". Amb valors de compressió alts (10:1) les guitarres produeixen un so més heavy.

  • També se solen aplicar compressions als enregistraments de parts vocals, ja que en molts casos el senyal emès per la veu i recollit per un micròfon presenta mínims molt febles que es confondrien amb el soroll de fons.

  • Amb una compressió més exagerada (10:1) aplicada a la veu s'aconsegueix un efecte "intimista", ja que s'accentuen els sons de la respiració i dels moviments bucals (llengua, saliva, etc.).

  • Els expansors s'utilitzen per a realçar enregistraments antics que presenten un rang dinàmic estret.

  • La combinació de compressors i portes de soroll (en l'enregistrament) juntament amb expansors (en la reproducció) s'utilitza com a tècnica de reducció de soroll, com per exemple en el sistema Dolby.

6.5.Ús de processadors de rang dinàmic: conclusió

El terme distorsió té connotacions pejoratives, ja que normalment defineix la pèrdua o la degradació inevitables en un senyal, ocasionades pels diferents dispositius o processos (micròfon, enregistrament, amplificador, altaveus) a què es veu sotmès. Tanmateix, tots els efectes descrits anteriorment són, en realitat, casos particulars de distorsió, que, pel seu ús freqüent, reben un nom propi.
I és precisament aquesta distorsió lleugera el que molts productors de pop i rock busquen aplicant la compressió. Però d'altra banda, totes aquestes eines, especialment les que, com l'estudiada en l'Audition, ofereixen a l'usuari tantes possibilitats de personalització, possibiliten qualsevol tipus de distorsió arbitrària i faciliten també moltes distorsions indesitjades.
Finalment, l'oïda serà el jutge suprem, però llevat de quan es busquin explícitament efectes molt exagerats, s'haurà de tractar d'evitar la saturació, que es produeix quan les mostres assoleixen el valor màxim possible. Per aquesta raó serà sempre recomanable provar les configuracions de compressió amb les parts més intenses de l'arxiu o fragment al qual es vulgui aplicar.

7.Teoria i aplicacions dels filtres digitals

7.1.Resposta impulsional i resposta en freqüència

7.1.1.Introducció a filtres analògics i digitals
Els filtres analògics s'han utilitzat profusament en la música des dels primers instruments musicals electrònics, pels anys 1920-1930, mentre que els primers experiments amb filtres digitals es remunten cap a 1950.
De manera rigorosa, qualsevol algoritme o procés computacional que a partir d'una entrada (una seqüència de nombres) generi una sortida (una altra seqüència de nombres), es pot considerar com un filtre digital. Tots els processos que hem comentat fins al moment representen, per tant, casos diferents de filtres digitals, encara que en la pràctica aquest terme s'acostuma a reservar per a aquells dispositius que modifiquen l'espectre d'un senyal.
Penseu que la teoria de filtres digitals pot ocupar tot un curs en una carrera d'enginyeria. Per això no tractarem aquí la forma d'implementació d'aquests filtres digitals, ni les teories matemàtiques sobre les quals es recolzen, desenvolupades totes a partir de 1960, i ens centrarem en els conceptes més bàsics, i també en les aplicacions més freqüents del filtratge.
7.1.2.Resposta impulsional d'un filtre
Hi ha diverses maneres de definir el comportament d'un filtre.
La primera consisteix a indicar la sortida del filtre a partir d'una entrada impulsional (és a dir, d'un impuls d'una sola mostra). Aquesta sortida es denomina resposta impulsional (IR) del filtre i té una representació en el domini temporal (amplitud en funció del temps).
Resposta impulsional d'un filtre en l'Audacity
Se suggereix a continuació una manera aproximada de veure la resposta impulsional d'un filtre qualsevol en l'Audacity:
1) Creeu un so nou i buit (Archivo > Nuevo).
2) Inseriu un segon de silenci (Generar > Silenciar).
3) Afegiu una única mostra amb amplitud propera al màxim i aproximadament al principi de l'arxiu (amb el zoom temporal al màxim i dibuixant un únic punt amb l'eina de llapis).
4) Deseu l'arxiu (per exemple: impulso.wav).
5) Per a comprovar la resposta impulsional de qualsevol filtre, n'hi haurà prou d'obrir l'arxiu i aplicar-li qualsevol efecte basat en filtres, com per exemple un equalitzador (Efecto > Equalización).
7.1.3.Representació freqüencial d'un filtre
L'altra manera de definir-lo és a partir de la representació freqüencial, que es pot entendre com l'espectre resultant després d'haver passat pel filtre un fragment de soroll blanc (soroll que conté totes les freqüències per igual).
En les figures 25, 26 i 27 es mostren aquestes dues representacions per al filtre "Línea telefónica", disponible com a preset en l'Audition a Efectos > EQ Paramétrico avanzado.
Es recomana a l'estudiant que faci tots els passos que s'acaben d'indicar, que apliqui aquest filtre "Phone Line Effect", i que compari els efectes obtinguts amb aquests gràfics.
Figura 25. Configuració per defecte del filtre "Phone Line Effect", que simula la degradació d'un so en escoltar-se a través d'una línia telefònica convencional.
Figura 25. Configuració per defecte del filtre "Phone Line Effect", que simula la degradació d'un so en escoltar-se a través d'una línia telefònica convencional.
Figura 26. Resposta impulsional del filtre "Phone Line Effect" (amb el zoom temporal al màxim) com a resultat de filtrar un impuls d'una sola mostra
Figura 26. Resposta impulsional del filtre "Phone Line Effect" (amb el zoom temporal al màxim) com a resultat de filtrar un impuls d'una sola mostra
Figura 27. Resposta freqüencial del filtre "Phone Line Effect", obtingut a partir d'un fragment de soroll blanc
Figura 27. Resposta freqüencial del filtre "Phone Line Effect", obtingut a partir d'un fragment de soroll blanc
7.1.4.Interpretació de la resposta freqüencial d'un filtre
Encara que els dos gràfics anteriors (figures 26 i 27) ofereixen en principi la mateixa informació sobre el comportament del filtre, no hi ha dubte que la representació freqüencial és més intuïtiva.
S'hi pot observar que el filtre ofereix un màxim per a un valor de freqüència al voltant dels 300-400 Hz (la resolució de la figura 27 no ens permet precisar millor) i que a continuació l'amplitud decreix ràpidament fins a ser pràcticament nul·la per a freqüències superiors als 3.500 Hz.
Aquesta interpretació és més intuïtiva si es compara amb l'espectre del soroll blanc abans de ser filtrat, que es mostra a la figura 28 (com ja hem indicat, el soroll blanc es caracteritza per tenir una distribució de freqüències aproximadament uniforme).
Figura 28. Espectre d'un soroll blanc
Figura 28. Espectre d'un soroll blanc
Corbes de freqüència en dispositius electrònics
La corba de resposta de freqüència no solament s'estudia en el cas dels filtres, o, vist d'una altra manera: qualsevol dispositiu que capti, gravi o reprodueixi so, en suma, qualsevol dispositiu pel qual passi el so, és un filtre.
Cada dispositiu altera inevitablement el so, i té, per tant, una corba de resposta de freqüència que caracteritza aquesta modificació.
Per a cada micròfon, cada amplificador, cada gravador de cassets, cada convertidor A/D o D/A, cada altaveu, se'n pot representar i estudiar la corba. Un micròfon o uns altaveus ideals no haurien de potenciar una determinada zona de l'espectre; en qualsevol d'aquests sistemes, voldríem una corba de freqüència plana, almenys en la zona audible entre els 20 Hz i els 20.000 Hz, la qual cosa significaria que el dispositiu es comporta de manera neutra, sense afectar, modificar o "acolorir" el so.
Però aquest ideal és en realitat inabastable; aquesta és una de les preocupacions dels enginyers i dissenyadors de components electrònics, i un dels factors determinants a l'hora de marcar el preu de qualsevol dispositiu, entenent que com més plana sigui la corba, més s'hi haurà de pagar.

7.2.Tipus bàsics de filtres

Hi ha diverses maneres de classificar i descriure els filtres:
1) La primera, la que utilitzen els enginyers, es basa en les matemàtiques, definint les transformades que els caracteritzen (es parla en aquest cas dels pols i els zeros d'un determinat filtre: de filtres amb un, dos o més pols, etc.).
2) Una altra manera de classificar-los, que igualment tan sols ens limitarem a esmentar, és segons la manera com aquests filtres s'implementen digitalment. Així, es parla de filtres IIR (resposta impulsional infinita) o de filtres FIR (de resposta impulsional finita), segons utilitzin o no equacions recursives.
3) La forma de classificació de filtres que introduirem es basa a esquematitzar la corba de resposta freqüencial. Encara que la corba de resposta en freqüència d'un filtre real pot ser enormement complexa, en principi qualsevol filtre es pot definir a partir de dos filtres de comportaments bàsics: el filtre passabaix i el filtre passaalt.
  • El filtre passabaix deixa passar les freqüències per sota d'un determinat valor, denominat freqüència de tall.

  • El filtre passaalt fa la tasca oposada, ja que únicament deixa passar les freqüències superiors a la freqüència de tall.

En tots dos casos, en un filtre ideal aquestes freqüències de tall haurien de representar una discontinuïtat en la corba de resposta, de manera que tota freqüència d'un costat d'aquest valor de tall s'atenuarà totalment, mentre que totes les de l'altre costat es deixaran igual. A la pràctica, això no és possible, i tots els filtres reals presenten un pendent a la zona propera a la freqüència de tall. Com més inclinat sigui aquest pendent d'atenuació, més precís serà el filtre.
A partir d'aquests dos filtres bàsics, en podem construir dos tipus més molt utilitzats:
  • El filtre passabanda deixa passar una banda de freqüències, i n'elimina la resta. Es defineix a partir de la freqüència central o de ressonància i l'amplada de banda.

  • El filtre de rebuig de banda (o rebuig-banda) actua de manera inversa al de passabanda. Igual com aquest, es caracteritza per la freqüència de ressonància i l'amplada de banda.

En la figura 29 s'esquematitzen les corbes de resposta de freqüència dels quatre filtres bàsics descrits.
Figura 29. Corbes de resposta de freqüència simplificades dels quatre tipus de filtres bàsics
Figura 29. Corbes de resposta de freqüència simplificades dels quatre tipus de filtres bàsics
Efectes d'aplicar els quatre tipus de filtres a un mateix so
Les figures següents (30 a 34) mostren els efectes d'aplicar aquests diferents filtres a un mateix so. En cada una es representa el so en la seva representació temporal (centre), l'espectre de freqüències en representació 3D (a dalt) i l'espectre en l'instant inicial t = 0 (a baix).
Figura 30. So original
Figura 30. So original
7.2.1.Filtres pinta i passatot
Esmentarem molt breument dos tipus més de filtres:
  • Els filtres pinta, denominats així per la peculiar forma de les seves corbes de resposta de freqüència, que semblen les pues d'una pinta. Deixen passar bandes estretes de freqüència separades per buits de freqüència de la mateixa mida.

Figura 35. Filtres pinta
Figura 35. Filtres pinta
  • Els filtres passatot deixen passar totes les freqüències sense modificació del guany però introduint canvis de fase.

Aquests filtres s'utilitzen, entre altres coses, per a construir unitats de reverberació.

7.3.Freqüència de tall, freqüència de ressonància, amplada de banda, Q i guany

7.3.1.Freqüència de tall
En el cas dels filtres passabaix i passaalt, la freqüència de tall determina la zona de freqüència en la qual el guany es comença a atenuar. Ja que aquesta transició no es fa mai bruscament, aquestes freqüències no poden correspondre a un punt precís, i prenen normalment com a valor per a la freqüència de tall el punt en el qual l'amplitud disminueix en 3 dB.
La pendent d'aquesta corba se sol mesurar en decibels per octava (dB/octava) i indica en quants decibels disminueix l'amplitud quan la freqüència canvia en un factor 2. Com més gran sigui aquest valor més accentuat serà el pendent.
7.3.2.Freqüència de ressonància
En els filtres passabanda i de rebuig de banda, aquesta freqüència es denomina freqüència central o de ressonància, i correspon a la freqüència en la qual l'amplitud és respectivament màxima (passabanda) o mínima (rebuig de banda). Per aquest motiu, els filtres passabanda se solen anomenar també filtres ressonants.
7.3.3.Amplada de banda i Q
En aquests filtres se sol utilitzar un paràmetre denominat simplement Q (o qualitat), que es defineix com a:
Q = fcentral / (ftall superiorftall inferior)
en què les freqüències de tall superior i inferior es defineixen, com en el cas anterior, com les freqüències en les quals l'amplitud disminueix en 3 dB.
En mesurar-se en Hz/Hz, Q resulta una variable adimensional. Com més gran sigui aquest valor, més estret serà el pic i més ressonant el filtre. Valors de Q = 5 corresponen, per exemple, a un filtre molt ressonant.
En lloc de la Q, de vegades s'expressa directament l'amplada de banda, que és la diferència entre les freqüències superior i inferior, i se sol mesurar en octaves.
Determinar la Q d'un filtre passabanda
Determinarem la Q del filtre passabanda al gràfic següent:
Figura 36. Determinació de la Q d'un filtre passabanda a partir de la seva representació
Figura 36. Determinació de la Q d'un filtre passabanda a partir de la seva representació
Resposta:
1) La freqüència de ressonància val 250 Hz.
2) En aquest punt, l'amplitud és de +1 dB.
3) Si baixem 3 dB ens trobem en la línia d'amplitud –2 dB.
4) Les freqüències corresponents a aquesta amplitud són respectivament 200 Hz (freqüència de tall inferior) i 300 dB (freqüència de tall superior). La Q valdrà, per tant:
250 / (300 – 200) = 2,5

7.4.Equalitzadors

7.4.1.Equalitzador gràfic
Tots haurem vist alguna vegada un equalitzador gràfic, ja sigui el d'un equip de so professional o dels que incorporen algunes cadenes d'alta fidelitat. Aquests dispositius consten de diversos potenciòmetres, cada un associat a una banda de freqüència, que permeten amplificar o atenuar l'amplitud en cada una d'aquestes zones o bandes. Com més bandes tingui l'equalitzador, més precís serà el control sobre l'espectre harmònic i més radicalment (i amb més precisió) es podrà modificar el timbre dels sons processats.
Un equalitzador gràfic es construeix amb un banc de filtres ressonants en paral·lel, cada un amb una freqüència de ressonància pròpia (i operant per tant en una zona de freqüències diferent) i una amplada de banda fixa (típicament entorn d'un terç d'octava), de manera que l'únic que es pot modificar en qualsevol és el guany.
Les figures 37 i 38 il·lustren aquests conceptes.
Figura 37. Esquema d'un equalitzador gràfic com a banc de filtres ressonants en paral·lel
Figura 37. Esquema d'un equalitzador gràfic com a banc de filtres ressonants en paral·lel
Figura 38. a) Aspecte d'un equalitzador gràfic de 7 bandes, i b) marges de les corbes de resposta de freqüències disponibles
Figura 38. a) Aspecte d'un equalitzador gràfic de 7 bandes, i b) marges de les corbes de resposta de freqüències disponibles
Inicialment els equalitzadors eren dispositius de maquinari que s'implementaven exclusivament amb filtres analògics. Avui dia hi ha bàsicament tres implementacions possibles:
  • Maquinari amb filtres analògics.

  • Maquinari amb filtres digitals (és a dir, amb una interfície amb potenciòmetres però amb un processador digital "ocult").

  • Programari (òbviament, sempre amb filtres digitals).

Convé recordar que, com de costum, les versions digitals i analògiques (o les versions de programari i maquinari) es regeixen exactament pels mateixos principis. La figura 39 mostra una de les versions d'equalitzador que ens ofereix l'Audition, accessible a partir del menú Efectos > EC Graphico.
Figura 39. Equalitzador de 20 bandes en l'Audition
Figura 39. Equalitzador de 20 bandes en l'Audition
El de la figura és un equalitzador de 20 bandes. A cada banda es pot observar la zona de freqüència sobre la qual actua (les zones varien de 31 Hz a 22.000 Hz).
7.4.2.Equalitzador paramètric
Un altre tipus d'equalitzadors són els paramètrics, que presenten menys bandes (típicament dues o tres), però cada una amb una freqüència central i una amplada de banda (o Q) variables. En lloc d'operar sobre 10 o 20 bandes fixes, ho fan, per tant, sobre 2 o 3 bandes totalment configurables, la qual cosa inicialment pot resultar menys intuïtiu. És el tipus d'equalitzador que se sol trobar a les taules de mescles professionals.
La figura 40 mostra l'aspecte d'aquest equalitzador en l'Audition, seleccionable al menú Efectos > EC Paramétrico, en el qual l'usuari pot configurar el tipus de filtre (passaalt, passabaix, passabanda, etc.), la freqüència central, l'amplada d'aquesta banda de freqüència i el guany (positiu o negatiu) en decibels.
Figura 40. Equalitzador paramètric en l'Audition
Figura 40. Equalitzador paramètric en l'Audition
7.4.3.Equalitzadors paragràfics
La flexibilitat de les eines implementades per programari ha propiciat la creació d'un nou grup d'equalitzadors híbrids, denominats paragràfics, que reuneixen en certa forma les virtuts de tots dos tipus, per a aconseguir una potència, flexibilitat i senzillesa d'ús realment sorprenents.
La figura 41 mostra l'equalitzador paragràfic del fabricant Waves, com a connector addicional. Encara que no en comentarem el funcionament, s'intueix que mitjançant els 10 filtres que incorpora, l'usuari pot configurar la corba de resposta de freqüència amb una flexibilitat sorprenent.
Figura 41. Equalitzador paragràfic de Waves Q10
Figura 41. Equalitzador paragràfic de Waves Q10

7.5.Aplicacions dels filtres

Les possibilitats i aplicacions musicals del filtratge digital són moltes. En descriurem a continuació algunes de les més representatives.
a) Tot enginyer i productor sap que l'equalització és un capítol fonamental, l'encarregada d'aportar el "color" necessari en qualsevol enregistrament i producció musical professional.
b) El realçat sonor que s'obté amb una equalització convenient és especialment eficaç i aconsellable amb enregistraments de veu. Penseu que moltes de les veus vellutades i seductores de molts cantants actuals són sovint fruit directe del laboratori. Proveu de potenciar diferents bandes de freqüència amb enregistraments de la vostra pròpia veu (la veu humana té components entre els 100 Hz i els 5.000 Hz aproximadament).
c) El filtrat passabaix s'ha d'aplicar sempre que vulguem reduir la freqüència de mostreig, per a evitar el fenomen de l'aliàsing, pel qual apareixen freqüències fantasma que no hi havia en el so original. Per a evitar l'aliàsing, abans de convertir un arxiu a una freqüència de mostreig inferior, s'haurà d'aplicar un filtre passabaix amb freqüència de tall igual a la meitat de la nova freqüència de mostreig. Si volem passar un arxiu gravat a 44.100 Hz a 22.050 Hz, s'haurà de filtrar el so, eliminant-ne els components freqüencials per sobre de 11.025 Hz. Programes com l'Audition o l'Audacity simplifiquen aquest procés, ja que ofereixen l'opció de filtrar automàticament en passar a una freqüència menor.
d) Ja que cada dispositiu físic té una resposta en freqüència característica, un filtratge selectiu pot emular les característiques sonores de dispositius de baixa qualitat, com telèfons, ràdios antigues, megàfons, etc. Aquests dispositius es caracteritzen per tenir corbes de freqüència bastant estretes. En aquest cas, l'eina més senzilla sol ser l'equalitzador gràfic. Si el programa disposa d'inicialitzacions d'equalització n'hi haurà prou de seleccionar l'escaient. Si no trobeu la inicialització que voleu, una vegada s'hagi configurat convenientment l'equalitzador (pel mètode de tempteig i error), no s'ha d'oblidar desar-la per a un possible ús futur.
e) Els filtres ressonants s'utilitzen molt en tota la música electrònica actual i s'apliquen a tot tipus de sons, des dels més sintètics fins a baixos o bateries.
7.5.1.Alguns consells
Utilitzeu l'anàlisi espectral. Per a no treballar a cegues, l'anàlisi espectral és una eina molt útil que ens pot donar una idea de les qualitats i mancances de qualsevol so. De vegades, s'infiltren en els enregistraments molestos sorolls amb una freqüència fixa, causats per interferències elèctriques. L'anàlisi espectral ens permetrà detectar aquestes freqüències enutjoses per a filtrar-les després.
De la mateixa manera, l'anàlisi ens pot orientar sobre les mancances d'un so (falta de greus, aguts, mitjos, etc.), mancances que podrem dissimular una mica amb l'ajuda de filtres ressonants que amplifiquin aquestes bandes.
El filtratge creatiu és una ciència i un art que permet alterar radicalment la naturalesa de qualsevol so.
7.5.2.Altres possibilitats del filtratge
Molts altres tipus d'efectes, no relacionats directament amb la modificació de l'espectre del so, com poden ser els delays o retards, els flangers, phasers, chorus o les reverberacions mateixes, s'implementen en realitat a partir de filtres digitals.
Així mateix, la flexibilitat i precisió del filtratge digital ha potenciat en els últims anys l'aparició de sofisticades eines que permeten operar amb un control absolut sobre l'espectre de qualsevol so (sistemes avançats de reducció de soroll, estirada de sons sense modificació de la freqüència, etc.) o combinar fins i tot les propietats espectrals de diversos sons (creació de sons híbrids, simulacions d'espais sonors o de dispositius electrònics, etc.).

8.Efectes de so basats en retards

8.1.Efectes de so basats en retards

8.1.1.Percepció dels retards
Molts efectes operen sumant al senyal original diverses còpies retardades i modificades de diverses formes. Entre tots, els més típics són els d'eco i reverberació, encara que, com veurem, no són els únics. Depenent del tipus d'efecte buscat, els temps d'aquests retards poden estar entre les poques mil·lèsimes i els diversos segons, i es poden classificar grosso modo en tres categories.
Taula 1. Tipus d'efectes de retard

Curts

< 10 ms

Modifiquen directament l'espectre de freqüències del so. Produeixen efectes perceptuals preponderantment tímbrics.

Mitjans

10-50 ms

Produeixen sons més "gruixuts i rics".

Llargs

> 50 ms

Es comencen a percebre com a repeticions temporals o ecos.

  • Quin és el retard més breu que es pot obtenir en un sistema d'àudio digital? La resposta depèn evidentment de la freqüència de mostreig, ja que el retard no pot ser inferior a una mostra. A una freqüència de 44.100 Hz el retard més breu possible seran 0,023 ms (ja que cada mostra dura 1/44.100 s).

  • Quin és el retard de l'eco percebut per una persona que crida a 100 m de distància d'una gran paret? La velocitat del so és aproximadament de 330 m/segon (varia lleugerament en funció de la temperatura, la densitat i la pressió de l'aire), per la qual cosa si la paret és a 100 m, el so haurà de recórrer 200 m (anar i tornar). El retard serà d'aproximadament de 600 ms (200/330).

Aquests efectes es poden experimentar fàcilment des del menú Efectos > Retardo avanzado.
Figura 42. Finestra d'ajust del retard analògic en l'Audition
Figura 42. Finestra d'ajust del retard analògic en l'Audition
Tres paràmetres són els més interessants per a experimentar: Secar, Humedecer i Retardo.
L'opció Secar (sortida seca), disponible en molts tipus d'efectes diferents, indica la proporció del so sense processar que s'aplica en la sortida. En estar treballant amb retards, els efectes produïts només seran perceptibles quan el senyal retardat se superposi amb una certa quantitat de senyal sense retardar; per tant, cal que aquest valor (Secar) no sigui nul. Per a simplificar, farem totes les proves amb els valors que l'Audition assigna per defecte, això és, 100%, tant per a Secar (és a dir, reproducció del senyal sense cap modificació) com per a Humedecer (és a dir, reproducció del senyal una vegada processat), cosa que significa que tindrem la mateixa proporció per a tots dos senyals ("seca" sense processar + "humida" processada).
L'Audition ens permet variar els temps de retard entre 0,01 (10 ms) i 8 s.
Valors molt curts afecten el timbre. A partir de 40 ms o 50 ms, els dos sons es comencen a percebre de manera separada.
Quan es treballa amb valors de retard grans (entorn d'un segon o més) és molt freqüent ajustar aquestes durades de manera que coincideixin aproximadament amb el tempo o el patró rítmic del fragment per processar. Si, per exemple, un fragment està a un tempo de 120 (significa que es produeixen 120 pulsacions per minut), cada pulsació durarà 0,5 s. Proveu d'utilitzar llavors retards de 0,125 s, 0,25 s, 0,5 s, 1 s, etc.
8.1.2.La realimentació o el feedback
La realimentació, o feedback en anglès, no és el nom de cap efecte pròpiament dit, sinó una manera de tractar el senyal que s'aplica en molts efectes. La realimentació significa que part del senyal obtingut a la sortida es torna a processar, i s'envia novament a l'entrada. En els sistemes analògics, la realimentació s'aconsegueix simplement interconnectant novament sortida i entrada. En la figura 43 es mostren dos esquemes de retard, el primer sense realimentació i el segon amb realimentació.
Figura 43. Esquemes d'implementació de retards (a) sense realimentació i (b) amb realimentació
Figura 43. Esquemes d'implementació de retards (a) sense realimentació i (b) amb realimentació
Un efecte de retard simple és el de l'arxiu "retardosimple", que s'aplica a una caixa de bateria, seguida d'un charles, primer tancat i després obert. Un efecte que utilitzi realimentació produirà normalment resultats més pronunciats, com el de l'arxiu "retardorealim", que s'aplica sobre el mateix material que l'anterior. Així mateix, amb realimentacions importants és fàcil que l'efecte acumulatiu arribi a produir saturació, per la qual cosa la realimentació s'hauria de manejar amb precaució. Un efecte típic de saturació acústica ocasionada per la realimentació és el del típic acoblament que es produeix quan un micròfon és massa a prop dels altaveus pels quals s'emet el senyal.
La quantitat de realimentació s'expressa freqüentment mitjançant un percentatge que indica la quantitat de so ja processat que es torna a processar (quan aquest valor és del 0% no hi ha realimentació, mentre que el 100% indicaria realimentació màxima).
En el cas dels efectes de retard en l'Audition, la quantitat de realimentació s'indica mitjançant un valor de percentatge, que indica el temps relatiu en què el senyal retardat triga a decaure. Com més llarg sigui aquest decaïment, més vegades tornarà a passar el senyal realimentat i més gran serà, per tant, aquest efecte.

8.2.La reverberació

8.2.1.Naturalesa de la reverberació
En una sala la reverberació es produeix de manera natural perquè els sons que ens arriben a les orelles no procedeixen d'un únic punt emissor, sinó que rebem també "còpies" reflectides per les parets, el sostre, el terra i altres objectes. Com més distants de nosaltres estiguin aquests reflectors, més retardades i també més atenuades rebrem les còpies.
El temps de reverberació d'una sala (o d'un efecte de reverberació digital) es defineix com el lapse que ha de transcórrer perquè el so inicial s'atenuï en 60 dB.
En sales grans, aquest temps de reverberació pot durar diversos segons. Un altre factor que influeix en la reverberació és l'absorció dels materials reflectors. Superfícies poc absorbents, com el vidre, fan créixer el temps de reverberació, mentre que d'altres, com les cortines o el públic mateix, fan que aquest valor disminueixi.
Normalment, l'absorció varia també amb la freqüència (els aguts s'absorbeixen més que els greus). Tot això fa que un bon algoritme digital de reverberació hagi d'incloure molts paràmetres configurables.
Quan aquests retards són prou grans per a sentir-se de manera aïllada es denominen ecos, i només es poden produir en espais molt amplis i amb pocs obstacles (davant una muntanya, etc.). Si estem situats entre dos obstacles distants, el so sofrirà diverses reflexions abans d'extingir-se, per la qual cosa sentirem diversos ecos successius d'intensitats decreixents.
8.2.2.Reverberació digital
Atès que un alt percentatge de la música gravada s'escolta en petites sales particulars amb temps de reverberació molt curts, la majoria d'enregistraments comercials incorporen la reverberació i altres efectes que emulen l'acústica de grans sales i les fan més grates a l'oïda. Però les mesures dels estudis d'enregistrament tampoc no poden oferir reverberacions naturals convincents, per la qual cosa des de fa dècades s'ha investigat molt en sistemes de reverberació artificials.
En els anys seixanta i setanta aquests efectes es reproduïen de manera analògica (utilitzant cintes magnetofòniques) o fins i tot mecànica (mitjançant la disposició de plaques metàl·liques mòbils, micròfons i altaveus), però des de fa uns anys, els ecos i reverberacions digitals han desbancat per complet els sistemes antics.
La reverberació es pot entendre com una sèrie de repeticions retardades i atenuades, per la qual cosa amb un multiretard és perfectament possible simular aquest efecte.
Ara bé, com que l'absorció d'un so varia amb la seva freqüència, els processos digitals destinats a modelitzar les reverberacions es poden tornar molt més complicats. Per això, i per la importància que aquest tipus d'efecte té en la producció musical, les possibilitats de configuració que ofereixen la majoria de programes d'edició d'àudio són realment immenses, i els paràmetres i la interfície poden variar enormement entre un programa i un altre. L'Audition ofereix una reverberació per convolució amb un conjunt d'inicialitzacions molt interessants.
Aquesta diversitat comporta que no hi hagi millor manera de familiaritzar-se amb aquests efectes que anar provant i estudiant les inicialitzacions que incorporen (catedral, sala de concerts, etc.), modificar gradualment els diferents paràmetres i escoltar els resultats. D'altra banda, després d'un període de proves és freqüent trobar les dues o tres configuracions de reverberació que més s'ajustin als nostres gustos i necessitats, i que es passaran a convertir en les nostres favorites.

8.3.Efectes basats en retards variables

Per retards variables ens estem referint a efectes en els quals aquests temps de retard varien de manera contínua. En aquests casos, els valors solen ser breus (mil·lèsimes o pel cap alt centèsimes de segon). Atès que això no succeeix normalment en la naturalesa (emissor i oient s'haurien de desplaçar molt ràpidament un al voltant d'un altre), els efectes obtinguts solen ser bastant "electrònics". Alguns dels més estesos (i cada un amb nom propi) són el flanger, el phaser i el chorus.
8.3.1.Flanger i phaser: Efectos > Coro / Bordeador
Amb els termes flange, flanger o flanging es coneix l'efecte consistent a mesclar el senyal original amb una còpia retardada, amb un retard molt breu, però variable de manera periòdica (normalment sinusoïdal). En l'Audition aquests efectes es troben amb el terme bordeador.
Depenent dels valors de retard i de la freqüència d'oscil·lació triats, l'efecte aconseguit pot recordar als típics sons electrònics de les pel·lícules de ciència-ficció dels anys cinquanta, al so del pop psicodèlic del final dels seixanta (llavors s'aplicava freqüentment a la guitarra i a la bateria) o simular vagament sons escoltats des de sota de l'aigua.
En la dècada dels seixanta, aquests efectes s'aconseguien de manera analògica, mesclant el senyal de dos magnetòfons, i retardant-ne o accelerant-ne lleugerament un (sovint aplicant una lleugera pressió variable, amb el dit, sobre la cinta o la bobina, tal com es mostra en la figura 44). Encara que el control fos també "digital", el cert és que el processament digital de senyal que ens ofereixen els ordinadors actuals han ampliat enormement les possibilitats, i també el control precís sobre aquest tipus d'efectes.
Figura 44. Obtenció manual de l'efecte flanger en els anys seixanta, amb dos magnetòfons de cinta
Figura 44. Obtenció manual de l'efecte flanger en els anys seixanta, amb dos magnetòfons de cinta
En l'"època analògica" el phaser era un efecte semblant però més subtil, però avui dia la diferència no és gaire clara, en part perquè un mateix tipus d'efecte es pot implementar mitjançant diferents algoritmes, i perquè diferents implementacions d'efectes en principi similars (per exemple, de diferents fabricants) presenten també diferents paràmetres per configurar.
En principi, els paràmetres bàsics per configurar haurien de ser:
  • El valor central i el marge de variació del retard (normalment entre pocs mil·lisegons i diverses desenes de mil·lisegons).

  • La freqüència de variació d'aquest retard (normalment entre algunes desenes i diversos hertzs).

  • El percentatge de senyal retardat que s'aplica al so final.

Totes aquestes famílies d'efectes s'apliquen en l'Audition mitjançant la mateixa eina, accessible des d'Efectos > Bordeador. En aquest diàleg s'inclouen dos possibles comportaments diferents: Coro i Bordeador.
Figura 45. Finestra d'ajust de l'efecte Bordeador
Figura 45. Finestra d'ajust de l'efecte Bordeador
8.3.2.Chorus: Efectos > Coro / Bordeador
El chorus és un efecte molt utilitzat, amb el qual s'intenta simular que un sol instrument (o una sola veu) soni com diversos instruments a l'uníson. S'aplica molt als cantants, per a donar més presència a la veu. Hi ha múltiples maneres d'implementar-lo. Les primeres es van construir entorn del 1940, utilitzant retards electromecànics, i es van utilitzar en els primers òrgans Hammond. Les primeres implementacions electròniques (analògiques) són de la dècada dels cinquanta.
Avui dia, una de les maneres d'aconseguir l'efecte digitalment és mitjançant un multiretard en el qual les durades variïn lleugerament (mitjançant una modulació). Per a provar diversos tipus de chorus en l'Audition, es poden utilitzar diverses inicialitzacions en Efectos > Coro / Bordeador, i seleccionar l'opció adequada.
Figura 46. Finestra d'ajust de l'efecte Coro
Figura 46. Finestra d'ajust de l'efecte Coro
Activitat
Figura 47. Representació en dinàmica, freqüència i temps del so "ejemplo203"
Figura 47. Representació en dinàmica, freqüència i temps del so "ejemplo203"
Figura 48. Representació en dinàmica, freqüència i temps del so "ejemplo203bordeador2"
Figura 48. Representació en dinàmica, freqüència i temps del so "ejemplo203bordeador2"
Figura 49. Representació en dinàmica, freqüència i temps del so "ejemplo203coro"
Figura 49. Representació en dinàmica, freqüència i temps del so "ejemplo203coro"

9.Altres tècniques avançades

9.1.Convolució

Com s'ha anat apuntant al llarg d'aquest mòdul, aquests últims anys estan essent especialment actius en l'àrea de processament digital de so (i en el processament d'imatge i de senyal en general), de manera que cada dia podem disposar al nostre PC d'eines noves i més sofisticades, que fa una dècada ni tan sols un obsés de l'estudi d'enregistrament hauria pogut ambicionar.
Molts d'aquests nous desenvolupaments solen involucrar tècniques d'anàlisi basades en la transformada de Fourier i en una operació matemàtica relacionada: la convolució.
La convolució és una operació fonamental en el processament digital de so, encara que sovint s'"oculten" els seus efectes sota altres noms més "populars". La sortida de qualsevol filtre, per exemple, és en realitat una convolució del senyal d'entrada amb la resposta impulsional del filtre. Quan apliquem una reverberació o una equalització, estem fent realment convolucions.
No entrarem aquí en els detalls matemàtics implicats en aquesta operació; n'hi haurà prou d'indicar que la convolució de dos senyals temporals qualssevol (per exemple, dos sons) és el mateix que la multiplicació dels seus espectres. Aquesta fosca afirmació significa que convolucionar dos senyals d'àudio és equivalent a filtrar l'espectre d'un so per l'espectre de l'altre.
Filtrar l'espectre d'un so per un altre espectre es pot entendre grosso modo com filtrar un so a través d'un equalitzador, els nivells de bandes del qual han estat obtinguts a partir de l'anàlisi espectral d'un altre so.
Mitjançant aquesta tècnica es poden crear sons híbrids, a meitat de camí entre els dos sons originals, o simular l'acústica d'una sala determinada, o la de qualsevol micròfon, amplificador o altaveu.
9.1.1.Simulació d'espais i de dispositius electrònics
De manera general, si en una sala en silenci emetem un impuls i gravem l'efecte produït, obtindrem quelcom que es pot considerar com la resposta impulsional de la sala. Si convolucionem aquesta informació que caracteritza i descriu totalment l'acústica de la sala, amb qualsevol so arbitrari, el resultat serà equivalent a haver emès i gravat aquest so a la sala en qüestió.
Amb aquest mecanisme, per tant, podem simular qualsevol espai acústic, sempre que en disposem de la resposta impulsional. I no ens hem de limitar a espais físics; convolucionant la resposta impulsional de qualsevol dispositiu (per exemple, la d'un micròfon M) amb un so arbitrari S1, obtindrem un nou so S2, anàleg al que obtindríem si el nostre so S1 hagués estat gravat amb el micròfon M.
9.1.2.Síntesi creuada
Sota el terme síntesi creuada s'inclouen diverses tècniques diferents que permeten obtenir sons híbrids. Una de les possibilitats d'aconseguir aquest efecte és aplicant la convolució, encara que hi ha altres mètodes relacionats, com el vocoder de fases, o la codificació de predicció lineal (LPC).
La síntesi creuada pot produir, per exemple, efectes sorprenents quan un dels dos sons involucrats correspon a un fragment vocal, ja que permeten aconseguir instruments "parlants", com en els exemples "sonido1", "sonido2" i "sonido3" (exemples de síntesi creuada feta amb el programa SMS).
Obtenir resultats convincents no és, tanmateix, una tasca trivial. La hibridació funciona millor quan els dos sons tenen certes similituds en la seva evolució temporal.

9.2.Compressió i expansió temporal. Modificació de la freqüència d'un so sense alterar-ne la durada

Quan en el quart apartat d'aquest mòdul es van estudiar diverses maneres de modificar la freqüència d'un so, es va comentar també que mitjançant tècniques avançades d'anàlisi espectral avui dia és possible fer aquestes modificacions sense alterar la durada original del so (pitch shifting), i també modificar-ne la durada sense alterar-ne la freqüència (time stretching).
Avui dia hi ha diverses tècniques que permeten fer aquestes operacions, encara que cap no es pot descriure de manera senzilla. Algunes treballen en el domini temporal (tècniques granulars, harmonitzadores, etc.) repetint de manera periòdica petits fragments del so original, però els millors resultats s'obtenen amb tècniques que treballen amb l'espectre del so.
Convé tenir en compte que totes introdueixen, tanmateix, certes alteracions inevitables en el so, menys dissimulables com més gran sigui la correcció aplicada (és a dir, com més difereixin les durades o les freqüències inicials i finals).
Algunes aplicacions:
  • Corregir un fragment instrumental o vocal lleugerament desafinat. Les tècniques descrites en el quart apartat permetrien corregir aquesta desafinació, però a costa de modificar també la durada del fragment, la qual cosa pot no ser desitjable si el fragment està sincronitzat amb altres sons.

  • El cas contrari, és a dir, corregir incorreccions rítmiques preservant l'afinació.

  • Harmonitzar o traslladar diverses vegades un fragment amb intervals diferents i sumar-los tots a l'original per a crear cors o acords.

  • Aquest procés pot funcionar també com un "microscopi sonor". Allargant en diversos factors sons molt curts, descobrireu insospitades sonoritats noves.

En l'Audacity, per a fer un pitch shift n'hi ha prou d'utilitzar l'eina Efectos > Cambiar tono, ja estudiada. En el cas del time stretching, l'opció de menú Efectos > Cambiar ritmo permet introduir la nova durada que vulguem.