Fonaments de psicoacústica

  • Josep Manuel Berenguer

  • Marc Dalmases i Castellanes

  • Sergi Jordà Puig

  • revisor Enric Guaus i Térmens

PID_00220373
Cap part d'aquesta publicació, incloent-hi el disseny general i la coberta, no pot ser copiada, reproduïda, emmagatzemada o transmesa de cap manera ni per cap mitjà, tant si és elèctric com químic, mecànic, òptic, de gravació, de fotocòpia o per altres mètodes, sense l'autorització prèvia per escrit dels titulars del copyright.

Índex

1.El so

L’acústica és la ciència que estudia el so.
En aquest apartat, es defineixen els elements essencials que permeten l’estudi del so.

1.1.Definicions

El so són ones mecàniques que exciten el sentit de l'oïda.
Una ona és la propagació d’una pertorbació en l’espai i el temps. Les ones mecàniques són les que necessiten un medi sobre el qual propagar-se (no passa així, per exemple, amb la llum, que viatja en el buit).
L’oscil·lació provinent de les ones produeix so si i solament si existeix un mitjà (gas, líquid o sòlid) que propagui la pertorbació. En el cas de l'aire, el mitjà més freqüent, els elements en oscil·lació comprimeixen i dilaten l'aire que els rodeja. Aquesta compressió i dilatació es produeix sobreposada a la pressió atmosfèrica estàtica, que en condicions normals serà de:
p 0 =   1   [ atm ]   1   [ bar ]   = 10 5   [ Pa ] . 1.1
En qualsevol cas el so sempre és degut a una variació periòdica de la densitat del mitjà de propagació. Donat que, en l’aire, densitat i pressió estan lligades, les ones sonores en un gas poden considerar-se tant ones de pressió com de densitat.
1.1.1.Velocitat de propagació
La velocitat de propagació ens determina a quina velocitat viatja el so i, per tant, el temps que triga la ona en passar de l’emissor al receptor.
La velocitat de propagació depèn del mitjà en que es produeix, en particular de la seva densitat ρ i del seu mòdul de compressibilitat B. Pel cas d’un medi gasós com és l’aire, es pot calcular amb l’expressió:
v p = γ ·   R   ·   T M [ m s ] 1.2
on R és la constant universal dels gasos (R = 8.314 J/Mol·K), M és la massa d'un mol de gas (en el cas de l'aire M = 29·10-3 Kg/Mol), T és la temperatura absoluta (en kelvins, -k-) i γ és una constant que depèn del tipus de gas (mòdul de compressibilitat, que per l'aire val γ = 1,4).
En diferents condicions atmosfèriques, la velocitat de propagació del so a l'aire és de:
v p = 331   [ m s ]   a   0   ºC 1.3
v p = 337   [ m s ]   a   10   ºC 1.4
v p = 343   [ m s ]   a   30   ºC 1.5
En canvi, a l'aigua a una temperatura de 15 ºC, la vp = 1.450 m/s, i al ferro a una temperatura de 20 ºC, la vp = 5.190 m/s.
1.1.2.Període i freqüència
El període és el temps que triga una molècula en passar dos cops pel mateix punt i en la mateixa direcció.
Es simbolitza amb la lletra T i mesura en segons (s).
La freqüència és el nombre de cicles complerts que realitza una molècula per segon.
Es simbolitza amb la lletra f i es mesura en cicles per segon o Hertz (Hz).
La relació entre període i freqüència és:
f = 1 T [ Hz ] 1.6
Típicament, la oïda humana és capaç de detectar freqüències compreses a l’intèrval f = 20-20.000 Hz, que corresponen als sons de baixa i alta freqüència, respectivament.
1.1.3.Longitud d'ona
El període i la freqüència observen l’evolució de l’ona des del punt de vista temporal a un punt fix de l’espai. En canvi, la longitud d’ona observa l’evolució de l’ona des d’un punt de vista espacial però en un moment concret (per exemple, si féssim una fotografia).
La longitud d'ona és la distància mesurada entre dos punts idèntics de compressió o depressió.
Es simbolitza amb la lletra λ i es mesura en metres (m).
Existeix una relació clara entre el període (o freqüència) i la longitud d'ona. Aquesta relació vé determinada per la velocitat de propagació:
λ =   v p f [ m ] 1.7
La figura 1 mostra la relació entre la freqüència i la longitud d’ona pel cas de la propagació del so a l’aire.
Figura 1. Relació entre la freqüència i la longitud d’ona.
Figura 1. Relació entre la freqüència i la longitud d’ona.
1.1.4.Nivell d'Intensitat
Una font que emet un so es caracteritza per la seva potència acústica.
La potència acústica és una mesura de la quantitat de vibracions acústiques que és capaç de generar la font.
Es mesura en Watts acústics (Wac).
Quan la font emet un so, aquest es propaga i arriba a la nostra oïda amb més o menys dificultats, segons l’entorn. La nostra oïda és capaç de discernir la densitat de potència o intensitat. La intensitat es mesura en W/m2 i ens indica la potència que hi ha en una superfície donada. La oïda humana és sensible a aquesta intensitat, no a la potència, i els seus valors típics oscil·len entre:
I 10 12 ..   1   [ W m 2 ] 1.8
que corresponen al llindar d’audició i llindar del dolor, respectivament.

1.2.La propagació del so

En aquest apartat es descriuen els elements físics que intervenen al procés d’audició: la font sonora, el medi i el receptor, tal i com es mostra a la figura 2.
Figura 2. Sistemes físics que intervenen en l’audició del so.
Figura 2. Sistemes físics que intervenen en l’audició del so.
Els tres elements estan connectats a través de l’ona, ja que el primer la genera, el segon la propaga i el tercer la percep. Analitzem cadascun dels elements per separat.
1.2.1.La font
En la font es distingeixen tres components diferents:
1) La font d'energia o mecanisme d’excitació primari. Generalment es tracta d’una font d’energia contínua, com per exemple:
  • Flux d’aire dels pulmons fins la boca.

  • Desplaçament d’un martellet uns pocs centímetres.

  • Connexió d’unes piles o bateries a un aparell electrònic.

2) L'element vibrant fonamental. És l’encarregat de transformat l’energia contínua en una excitació alterna. Per tant, d'aquest dispositiu depèn l'altura de la nota i els harmònics generats. Per exemple:
  • Les cordes vocals.

  • La corda d’un piano.

  • Un transistor degudament polaritzat.

3) El ressonador. La seva funció és transmetre tan eficientment com sigui possible les oscil·lacions de l'element vibrant cap al medi circumdant. Per exemple:
  • La boca i la cavitat nasal.

  • La taula harmònica.

  • L’altaveu.

1.2.2.El medi
El medi és l’encarregat de transportar l’energia de la font al receptor. Cal notar que, pel cas de les ones sonores, el medi és imprescindible per la propagació, ja sigui sòlid, líquid o gasós. Això no passa, per exemple, amb les ones electromagnètiques que sí que es poden propagar pel buit.
També és important tenir en compte els límits del medi (parets, terra, sostre, la gent), ja que afecten la propagació del so gràcies als mecanismes de reflexió, absorció, difracció i difusió de les ones sonores.
1.2.3.El receptor
En el receptor, tradicionalment un oient, es distingeixen quatre dispositius diferents:
1) L'orella externa, que rep les oscil·lacions de pressió sonora d'arribada a l'orella per a convertir-les en vibracions mecàniques.
2) L'orella mitja, que adapta aquestes vibracions mecàniques per transmetre-les a l'orella interna.
3) L'orella interna, bàsicament la còclea, en l'interior de la qual les vibracions són separades en funció de la seva freqüència per a ser convertides en impulsos nerviosos.
4) El sistema nerviós auditiu, que transmet els senyals nerviosos al cervell, on són processats, identificats i emmagatzemats a la memòria.

1.3.Característiques del so

En aquest apartat s'estudien les característiques del so en funció de la seva experiència perceptiva. Més endavant, s’observa com cap paràmetre físic del so no es correspon totalment amb les dimensions psíquiques en què té lloc aquesta experiència.
En totes les cultures es confirma l'existència de tres sensacions primàries associades a la percepció musical del so. Aquestes són l'altura, la intensitat i el timbre.
1.3.1.Altura
La sensació d'altura es vincula tradicionalment a la freqüència o període de la fonamental. Ens indica si un so és agut o greu. Els greus corresponen als sons amb freqüències més baixes i longituds d’ona més grans, mentre que als sons aguts els hi corresponen freqüències molt elevades i longituds d’ona molt baixes.
Exemple
Els sons greus corresponen a les notes més a l’esquerra d’un teclat de piano o les notes a l’inferior d’un pentagrama mentre que els sons aguts corresponen a les notes més a la dreta d’un teclat de piano o a les notes superiors d’un pentagrama.
1.3.2.Intensitat
La intensitat s'associa a l’amplitud de l’'oscil·lació de l'ona. En els sons de baixa intensitat, les mol·lècules es desplacen unes poques fraccions de mil·límetre mentre que pels sons d’alta intensitat, les mol·lècules es desplacen més. Cal notar que l’amplitud d’aquest desplaçament és independent de la freqüència de vibració.
1.3.3.Timbre
Generalment, el timbre d’un so ve determinat per les diferents amplituds (intensitats) dels seus harmònics. Un so harmònic es caracteritza perquè es pot descomposar com una suma de sons elementals, anomenats harmònics. La freqüència de cadascun d’aquests harmònics depèn d’un d’ells, el primer, al que s’anomena fonamental. Dit d’una altra manera, la fonamental és la freqüència que dóna lloc a la resta de tots els sons harmònics. Si la freqüència fonamental és f0, els harmònics tenen una freqüència que es pot obtenir segons la fórmula:
fn = n · f0
on n és el número d'harmònic.
Exemple
Per exemple, si la freqüència fonamental és de f = 100 Hz, llavors els harmònics que s’obtenen tenen freqüències de f = 200, 300, 400, 500 Hz, etc.
Figura 3. Harmònics per a un Do2 (70 Hz). Representació en notació musical i al teclat del piano
Figura 3. Harmònics per a un Do2 (70 Hz). Representació en notació musical i al teclat del piano
Cada so té la seva composició d'harmònics específica, és a dir, que és possible caracteritzar els sons per la seva composició d'harmònics.
Exemple
El so d’un violí tindrà una composició d’harmònics diferent al so d’un piano. Tot i que els dos instruments toquin la mateixa nota (altura) amb la mateixa intensitat, podrem distingir-los gràcies al seu timbre diferent.
La figura 3 mostra els harmònics que apareixen en tocar una nota Do2 i la corresponent ubicació al teclat d’un piano o partitura.
1.3.4.Els sons reals
A la pràctica, les freqüències dels components dels sons no són exactament múltiples de la fonamental, sinó que s'allunyen una mica d'aquesta relació. Per això, de manera general, es parla de parcials més que d'harmònics.
El timbre s'associa a l'espectre o proporció d'intensitats dels parcials.
A més a més, es constata fàcilment que la sensació d'altura d’un to pur de freqüència estable canvia lleugerament en funció d'una variació d’intensitat. La sensació de l'altura depèn de la freqüència, però també de la seva intensitat.
També és fàcil observar que la sensació d'intensitat d'un so d'intensitat constant canvia en funció de les variacions eventuals de freqüència a què es pugui sotmetre.
D'altra banda, en la superposició de tons d'altura diferent, la sensació d'intensitat no es relaciona de manera simple amb el flux total d'energia del so. Tampoc no és estable per a sons de durada curta. En aquest últim cas depèn directament de la durada de cada so.
Amb tot això, queda clar que la percepció subtil del timbre requereix molta més informació que aquella que porta l'espectre d'un so.
Exemple
Per exemple, en els sons que produeixen els instruments musicals, tan importants són per a aquest efecte les característiques de la manera com els parcials apareixen i desapareixen en els moments inicials, com la composició de parcials específics dels registres que pot oferir un instrument. La composició de parcials en el greu no acostuma a coincidir amb la del registre mitjà ni amb la de l'agut.
Aquestes subtileses de la percepció acústica determinen profundament la integració psíquica dels fets musicals i depenen tant de l'estructura física dels sons que estimulen l'orella com dels detalls formals i funcionals que caracteritzen aquest òrgan.

1.4.Límits de la oïda humana

En física, el terme so s'aplica no solament a aquells fenòmens que tenen lloc en l'aire per a donar lloc a la sensació d'audició, sinó també a tots aquells que es regeixen per principis físics anàlegs.
En un sentit ampli, s'entén per so tota variació de pressió o de velocitat del moviment de partícules que es propaga en un medi elàstic. El so també té lloc en els sòlids, en els líquids i en altres gasos diferents de l'aire.
No tots els sons són susceptibles de ser percebuts per l'orella humana. Tradicionalment s'afirma que aquesta percep variacions periòdiques de pressió entre 20 Hz i 20.000 Hz, però el cert és que oscil·lacions de freqüència inferior als 20 Hz, habitualment denominades infrasons, poden ser percebudes.
Exemple
Entre les ones que es produeixen a freqüències molt baixes, sovint distingides amb el nom d'infrasons, es troben els que caracteritzen l'ona expansiva de l'explosió d'una bomba o, també, els produïts per màquines industrials i vehicles motoritzats. Els primers són perjudicials per la seva capacitat destructiva, especialment dels teixits biològics. Els segons poden causar somnolència.
Els ultrasons, és a dir, les oscil·lacions de freqüència superior als 20.000 Hz, no es perceben directament. Però els ultrasons es produeixen en gran quantitat d'àmbits. Una de les seves aplicacions a l'enginyeria d'àudio és construir altaveus altament direccionals. Els ultrasons poden actuar sobre la matèria orgànica i produir ruptures de les cadenes proteiques i els àcids nucleics. Amb prou intensitat, serien capaços, per tant, de produir mutacions.
Les ones amb prou intensitat per a produir dolor reben el nom de suprasons. Per a un so d’una freqüència de 1.000 Hz, aquesta intensitat és de prop d'1 W/m2.
Les que no són acusades per l'aparell auditiu per no ser prou intenses són anomenades subsons. Per a una variació periòdica de 1.000 Hz la intensitat llindar és de 10-12 W/m2.
Els límits clàssics de l'audició es representen a la figura 4, on la zona d'àudio apareix envoltada de les zones en les quals el so existeix malgrat no manifestar-se al sentit de l'orella humana.
Figura 4. Catalogació de les ones acústiques segons freqüència i intensitat.
Figura 4. Catalogació de les ones acústiques segons freqüència i intensitat.
Si bé els límits de la percepció auditiva es poden emmarcar entre alguns 20 i 20.000 Hz, i entre 10-12 i 1 W/m2, al llarg de la història i fins a l'aparició dels instruments electrònics, l'ús musical del so sempre se n'ha mantingut lluny.
El pianissimo (pppp) dels instruments acústics tradicionals mai no va ser d'intensitat inferior als 10-11 W/m2. En aquest mateix context, el fortissimo (ffff) representa una intensitat màxima de 10-2 W/m2.
En el domini de la freqüència, si el Do1 es produeix quan la vibració té una freqüència de 35 Hz. El Do8 respon per una freqüència de 4.480 Hz. El Sol8, la nota més aguda representada en el sistema MIDI, es dóna per una vibració de 5.600 Hz.
Figura 5. Distribució d’escales d’altura en un teclat de 128 notes.
Figura 5. Distribució d’escales d’altura en un teclat de 128 notes.

1.5.Objectes sonors

El concepte d'objecte sonor tal com l'introdueix Pierre Schaeffer en el Traité des Objets Musicaux, és el que se sent quan s'escolta una font de so sense tenir-ne en compte la identificació.
Això pot ocórrer tant per falta d'informació (el cas d'un so desconegut) com per causa d'un entrenament previ encaminat a espoliar les sensacions sonores dels seus significats habituals.
Es tracta, doncs, d'una cosa radicalment diferent de la font (un violí, un gat o un despertador), diferent també del suport en el qual s’emmagatzema, i diferent, al cap i a la fi, del senyal acústic corresponent codificat en qualsevol suport: cinta magnètica, memòria viva, disc dur, etc. Per a un gos, un nen, un ésser extraterrestre o un ciutadà d'una cultura remota, aquells senyals (el violí, el gat, el despertador) poden adquirir sentits diferents dels que un adult de l'entorn cultural occidental els pugui atribuir.
Un objecte sonor és una imatge sonora generada per l'escolta, feta per un ésser humà, d'una font sonora. L'objecte sonor és relatiu a aquesta activitat d'escolta i està enterament contingut en la consciència perceptiva.
Les manipulacions que puguem fer sobre les codificacions dels objectes sonors emmagatzemats en suport no afecten, doncs, l'objecte sonor en si, que té una existència intrínseca. Tan sols creen altres objectes sonors nous.
Els objectes sonors poden ser descrits i analitzats segons les seves característiques perceptives.
Una vegada l'objecte sonor es desposseeix de la seva significació habitual i apareixen en la consciència les seves particularitats perceptives, és possible utilitzar-lo en contextos musicals i convertir-lo en objecte musical.
Amb l'arribada dels instruments electrònics, el món de tots els sons s'obre a les produccions musicals i artístiques.
1.5.1.Objectes musicals
Un objecte musical és un objecte sonor que, desposseït de les seva significació habitual, s’usa amb finalitats artístiques.
1.5.2.Classificació dels objectes sonors i musicals
Els objectes musicals es poden agrupar de diferents maneres, i usant diferents criteris. Un dels criteris que permet classificar els objectes musicals fa referència a la tipologia de l’objecte, com per exemple:
  • el seu ús (alarma, sensació de relax) o

  • la seva complexitat (únic o conjunt de molts altres objectes).

Un altre criteri per la classificació pot fer referència a la morfologia, com per exemple:
  • el grau d’estabilitat (al llarg del temps) o

  • la fonètica (més o menys articulat).

De fet, hi ha innombrables classificacions d'objectes sonors. De fet, és bo que cada professional tracti de desenvolupar la seva pròpia. Els paràmetres importants d'una classificació és que aquesta es mantingui oberta a nous objectes que es presentin a l'escolta. Per tant, els criteris de classificació han de ser:
1) Manipulables i identificables: Els elements centrals d'aquesta classificació han de constituir bons graons perceptius i no han de ser ni massa elementals ni massa estructurats.
2) Rememorables: L'element central d'una classificació ha de ser fàcilment recordable. Això significa que la seva durada no serà ni gaire llarga ni gaire curta i constituirà una unitat destacable. Cal tenir en compte, tanmateix, que l'elemental no coincideix amb el curt ni el complex amb el llarg.
  • Els objectes sonors són equilibrats si presenten un bon compromís entre el molt estructurat i el molt simple.

  • Els objectes sonors són desequilibrats si són massa complexos o si són massa simples.

3) Originals: El grau d'originalitat d'un objecte sonor és el que sorprèn a la previsió dels esdeveniments que la consciència du a terme durant l'escolta. Un so d'un timbre que es manté estable és menys original que el d'un timbre que et toca una melodia.

2.El sistema auditiu

El sistema auditiu és el conjunt d’òrgans, teixits i terminacions nervioses que, a través del sentit de la oïda, permeten el fenomen de l’audició.
L’orella és un dispositiu complex que en certa manera funciona com si es tractés d’un micròfon extremadament sofisticat, tant, que encara no se n’ha dissenyat un amb tantes prestacions. En la figura 6 es destaquen les parts anatòmques més importants de l’aparell de l’orella.
Figura 6. Esquema anatòmic general de l’aparell auditiu.
Figura 6. Esquema anatòmic general de l’aparell auditiu.
En aquest apartat, estudiarem les parts que el formen, centrats en l’orella externa, l’orella mitja i l’orella interna.

2.1.Descripció formal de l’orella externa

L'orella externa consta del pavelló auricular i del canal auditiu. A grans trets, té l'aspecte d'una trompeta i la seva superfície està esmorteïda per teixit epitelial, que presenta pèls i secrecions en forma de cerumen. Per tant, la seva funció no consisteix, com és el cas de la trompeta, en l'amplificació d'un determinat espectre de freqüències, sinó en l’adaptació progressiva del so desde un espai ampli exterior en medi gasós fins a un sistema mecànic molt concret en medi sòlid que és el timpà.
2.1.1.Pavelló auricular
El pavelló auricular protegeix el timpà de l'acció del vent. Si no hi hagués aquesta estructura, el vent podria generar sons harmònics i sorolls en xocar amb els límits del canal auditiu, com ocorre a l'embocadura d'una flauta. Això emmascararia qualsevol missatge d'entrada. En presència d'un vent fort que vingui de cara o de costat, els racons i plecs del pavelló serveixen per a dirigir el raig d'aire i dividir-lo en diversos filets d'aire. Sembla clar que una de les funcions bàsiques del pavelló auricular és la d'actuar com a paravent.
2.1.2.Canal auditiu
El canal auditiu, de forma tortuosa, sembla dissenyat especialment per a esmorteir. De fet, aquesta forma tortuosa esmorteeix els senyals de baixa freqüència, mentre que els d'alta freqüència, molt més direccionals, arriben amb facilitat al fons del canal i aconsegueixen estimular el timpà.
D'aquesta manera, i juntament amb les tortuositats trobades al pavelló auricular, es pot identificar la direcció en la qual es troba una determinada font de so de freqüència aguda, com són els espetecs, els crits dels animals i cruixits, tots possibles indicadors de situacions de perill. El recobriment absorbent del canal auditiu extern esmorteeix el so mentre eixampla la banda de freqüències perceptibles. La seva funció és la de conferir direccionalitat al sentit de l'oïda, i també d'atenuar les fonts de so no desitjades.

2.2.Descripció formal de l’orella mitja

L’orella mitjana està formada per una cavitat tancada que conté una serie de components com els ossos, membranes i músculs. Està comunicada amb la boca a través de la trompa d’eustaqui. La figura 7 mostra un esquema anatòmic de l’orella mitja.
Figura 7. Esquema anatòmic de l’orella mitja.
Figura 7. Esquema anatòmic de l’orella mitja.
En l'orella mitja les vibracions sonores es transmeten majoritariament a través de dues vies:
1) La via sòlida, formada pel conjunt del timpà i els ossicles –martell, enclusa i estrep–, que acaba a la finestra oval, situada a l'entrada de l'orella interna. El sistema dels ossicles permet transmetre vibracions de freqüències fins a 10.000 Hz.
2) La via gasosa, formada per la part lliure del timpà a sota de la inserció del martell, que estimula l'aire de la cavitat, que, al seu torn, porta la vibració directament a la finestra rodona.
D’altra banda, el sistema auditiu pot rebre vibracions directament sense que aquestes passin per l'orella mitjana. Es tracta de la transmissió òssia, que té lloc, per exemple, quan s'aplica el cap a la via del tren, per a saber si l'arribada és pròxima. S'experimenta transmissió òssia quan s'aplica un diapasó directament sobre un os del cap. La freqüència es percep clarament i no passa a través de l'orella mitjana.
2.2.1.Trompa d’Eustaqui
La trompa d’Eustaqui no intervé directament en el procés d’audició, però té una importància cabdal. Quan la pressió atmosfèrica és superior a la de l'interior de l'orella mitja, el timpà es posa tirant cap a l'interior i dóna lloc a una clara atenuació de la percepció dels sons acompanyada d'una sensació desagradable molt característica. Si la pressió externa és més baixa, el timpà s'infla cap a fora i produeix efectes perceptius semblants.
La funció bàsica de la trompa d'Eustaqui és igualar la pressió de la caixa de l'orella mitja i permetre el funcionament correcte sense dependència de les condicions atmosfèriques externes.
Aquest procés d’igualar pressió es produeix al badallar, tragar saliva, etc.
2.2.2.Timpà
El timpà és la membrana que limita l'orella mitjana en la part externa. És l'encarregat de rebre les vibracions de pressió que arriben a través del canal auditiu extern.
Es tracta d'una membrana esmorteïda. Això constitueix una primera protecció de les delicades estructures de l'orella interna, però també representa un avantatge, pel fet que l'amortiment d'una estructura implica un eixamplament de la banda de freqüències a què pot ressonar. D'aquesta manera, l'espectre de freqüències que l'orella pot processar és més gran. A més, l'atenuació del timpà és també crucial per al poder separador temporal de l'orella. Si no estigués atenuat, se saturaria amb facilitat, ja que mentre vibrés no reaccionaria de manera convenient davant de l'arribada de nous estímuls.
Perquè s'experimenti la sensació de so per mitjà del moviment del timpà, aquest ho ha de fer dins d'uns límits. La mínima amplitud de moviment de la membrana timpànica és de prop de 10–7 cm. El període de vibració més curt perceptible a través del timpà és de 7 · 10–5 s.
2.2.3.Cadena d'ossicles
La cadena d'ossicles, formada pel martell, l'enclusa i l'estrep, és un grup que s'articula com una palanca extremadament complicada i, per mitjà d'una sèrie de músculs que faciliten o impedeixen el moviment de les seves parts, constitueix un segon dispositiu de regulació de la impedància acústica en l'orella mitjana.
Com es pot apreciar a la figura 7, la forma del sistema és irregular, la qual cosa representarà necessàriament la presència de distorsió harmònica.
L'ésser humà viu en un entorn acústic d'intensitats que varien entre un soroll de fons mínim (uns 20 dB) i els sons provinents dels trons o els avions (propers als 120 dB). El sistema auditiu està sotmès a una variació dinàmica de 100 dB, la qual cosa, com es veurà amb més detall, implica variacions extremes d'amplitud en una relació de 1010.
Davant d'estímuls sonors forts, es produeixen contraccions reflexes dels músculs tensors del timpà i de l'estrep. D'aquesta manera, els moviments del martell i de l'estrep es limiten. La limitació del moviment del timpà impedeix que les vibracions fortes no assoleixin el sistema dels ossicles, mentre que la limitació del moviment de l'estrep impedeix la saturació de l'orella interna.

2.3.Descripció formal de l’orella interna

L'orella interna és un òrgan molt fràgil que s'allotja en una cavitat del penyal del temporal, un os molt dur del crani. La cavitat òssia és molt petita. Les seves dimensions són 20 × 10 × 7 mm i la seva forma extremadament complicada, segurament per a evitar l'aparició de zones de ressonància, la qual cosa podria danyar profundament el sistema.
Morfològicament, l'orella interna es compon de dues parts que es distingeixen clarament en el gràfic d'introducció a l'aparell de l'orella (figura 6): el laberint i de la còclea. La figura 8 mostra un esquema anatòmic de l’orella interna, amb els seus sensors i transductors corresponents.
Figura 8. Sensors i transductors en l’aparell auditiu.
Figura 8. Sensors i transductors en l’aparell auditiu.
2.3.1.Laberint
El laberint està format per una cavitat anomenada utricle, sobre la qual es disposen tres ovoides diminuts. Es tracta de les ampul·les. De cada ampul·la parteix un conducte cap a una altra part de l'utricle. Són els canals semicirculars. A la part inferior de l'utricle s'aprecien dues obertures, la finestra oval i la finestra rodona.
A l'utricle hi ha diverses estructures sensibles a les vibracions. Es tracta de la màcula utricular, les cúpules ampul·lars i la màcula sacular.
La màcula utricular és una petita massa gelatinosa aplanada bastant tova, en l'interior de la qual hi ha pedretes, la qual cosa li confereix una mica d'inèrcia. En l'interior de la gelatina s'insereixen els cilis d'un conjunt de cèl·lules sensibles disposats a la paret que dóna suport a la màcula. Quan la màcula s'inclina, les cèl·lules ciliades activen les terminacions nervioses a què estan connectades. Aquest dispositiu és capaç de captar vibracions de fins i tot alguns hertzs. La figura 9 mostra esquemàticament el funcionament de la màcula de l’utricle.
Figura 9. Proposta funcional de la màcula de l'utricle.
Figura 9. Proposta funcional de la màcula de l'utricle.
Les ampul·les de l'utricle també donen suport a unes estructures anomenades cúpules ampul·lars. Estan banyades per l'endolimfa, un líquid de baixa viscositat. Les cúpules allotgen terminacions de cèl·lules ciliades que es fixen a la paret de les ampul·les. La deformació de les cúpules produeix disparaments en les terminacions nervioses connectades a les cèl·lules ciliades associades. Les cúpules ampul·lars són capaces de detectar vibracions entre 5 i 30 hertzs.
La màcula sacular, el paper de la qual no està encara clarament definit, és una massa gelatinosa en la qual s'allotgen cèl·lules ciliades, el cili de les quals està fixat a la paret d'un sac ple d'endolimfa. Es tracta del sàcul. Quan el sàcul, ple d'endolimfa, es deforma, la màcula es contreu i s'expandeix de manera que les cèl·lules ciliades estimulen les seves terminacions nervioses corresponents. El sàcul podria contribuir en la codificació de vibracions de freqüència entre 30 i 1.000 hertzs. La figura 10 mostra esquemàticament el funcionament de la màcula sacular i de la membrana basilar.
Figura 10. Proposta funcional del conjunt de la màcula sacular i de la membrana basilar.
Figura 10. Proposta funcional del conjunt de la màcula sacular i de la membrana basilar.
2.3.2.Còclea
La còclea és un òrgan molt especial, enrotllat en forma de cargol, se suposa que a causa de la necessitat d'economitzar espai.
La figura 11 mostra un esquema funcional de la còclea, en contacte amb l'orella mitjana (cal notar com el conducte coclear, inicialment en forma de cargol, es mostra desplegat).
Figura 11. Esquema de la còclea estirada.
Figura 11. Esquema de la còclea estirada.
El conducte coclear és de 3,2 cm de llarg i apareix dividit en dues cavitats, anomenades rampa timpànica i rampa vestibular. A la figura 12 s'ofereix un detall de les mesures de la còclea.
Figura 12. Distàncies i dimensions a la còclea.
Figura 12. Distàncies i dimensions a la còclea.
A l’interior de la còclea hi trobem la membrana basilar, qui allotja l'òrgan de Corti i les terminacions nervioses corresponents.
2.3.3.Membrana basilar
Totes dues rampes (timpànica i vestibular) resten separades per la membrana basilar però connectades per un petit forat anomenat helicotrema. Ambdues són plenes d'un fluid incompressible: la perilimfa. La secció inferior es tanca per una altra membrana elàstica que rep el nom de finestra rodona.
Les vibracions transmeses per la cadena d'ossicles es converteixen en oscil·lacions del fluid perilimfàtic, la qual cosa, en propagar-se pel conducte coclear, posa en moviment la membrana basilar com si fos una bandera. La figura 13 mostra el moviment de la membrana basilar.
Figura 13. Moviment de la membrana basilar.
Figura 13. Moviment de la membrana basilar.
Per a un to pur donat, les oscil·lacions de màxima amplitud de la membrana basilar es donen en una regió limitada i específica. La situació d'aquesta zona de màxim moviment de la membrana basilar depèn de la freqüència de la nota. Per a cada freqüència hi ha una zona de sensibilitat màxima, que rep el nom de regió de màxima ressonància.
Com més baixa sigui la freqüència del so, la zona estimulada més s'apropa a l'àpex, l'extrem lliure de la membrana basilar. Es tracta del punt on la membrana és més sensible. Com més alta sigui la freqüència, més s'apropa la zona estimulada a la base, lloc on la membrana és més rígida.
2.3.4.Òrgan de Corti
L’òrgan de Corti està allotjat a la membrana basilar. Conté unes 30.000 cèl·lules ciliades disposades en internes i externes al llarg de la membrana basilar. Aquestes cèl·lules capten el moviment i envien senyals a les terminacions nervioses que hi estan en contacte. La figura 14 mostra la disposició d‘aquestes cèl·lules ciliades dins l’òrgan de Corti.
Figura 14. Tall transversal de la còclea.
Figura 14. Tall transversal de la còclea.
La informació primària de freqüència de tons purs és codificada per l'òrgan de Corti en forma de localització espacial de les neurones activades.
La posició espacial al llarg de la membrana basilar de les cèl·lules ciliades i les cèl·lules nervioses associades determina la sensació primària d'altura. Un canvi de freqüència causa un salt de posició de la zona activada.
En funció del grup de neurones activades, l'altura es manifesta alta o baixa. Quan la freqüència d'un so varia una octava, la regió de ressonància corresponent es desplaça una quantitat constant de 3,5 a 4 mm.
En general, si es multiplica la freqüència per un determinat factor, la posició x de la regió de ressonància no es multiplica. Es desplaça una quantitat constant. En la figura 15 s'aprecia una relació logarítmica entre la freqüència i la localització de la zona d'oscil·lació màxima a la membrana basilar.
Figura 15. Distància des de la de base de la membrana basilar a la zona de més moviment de la membrana basilar en funció de la freqüència de l'estímul.
Figura 15. Distància des de la de base de la membrana basilar a la zona de més moviment de la membrana basilar en funció de la freqüència de l'estímul.
De les consideracions anteriors pel que fa a les estructures funcionals de l'orella interna, es dedueix que no hi ha un mecanisme únic de transducció dels senyals mecànics en elèctrics en l'orella humana. Per això, hi ha diverses fibres nervioses que porten informació sonora al cervell, que són nervis ampul·lars, el nervi macular, el nervi sacular i el nervi coclear. La figura 16 mostra la ubicació física d’aquests nervis.
Figura 16. Innervacions del sistema auditiu.
Figura 16. Innervacions del sistema auditiu.

3.Percepció d’altura

Al llarg de tot aquest apartat, parlarem de la percepció d’altura sempre referint-nos a tons purs.
Un to pur és el so generat per una forma d’ona sinusoïdal a una freqüència en concret, i es caracteritza per no tenir cap harmònic. Només existeix la fonamental.
La figura 17 mostra la forma d’ona d’un to pur a la freqüència de 1.000 Hz.
Figura 17. Forma d'ona sinusoïdal de freqüència 1.000 Hz, corresponent a un to pur.
Figura 17. Forma d'ona sinusoïdal de freqüència 1.000 Hz, corresponent a un to pur.
Aquests sons es generen amb instrumentació electrònica adequada. Encara que generalment la música no estigui feta de tons purs, els sons de la flauta, especialment els aguts, s'apropen bastant a la forma d'un so sinusoïdal. En qualsevol cas, ni els sons més purs produïts amb instrumentació electrònica no arriben en estat de puresa total després de recórrer l'espai que hi ha entre l'altaveu i el timpà.

3.1.Percepció de tons purs

A mesura que augmenta la freqüència d'un to pur, augmenta la sensació d'altura. Però això no ocorre de manera lineal. Des dels anys quaranta se sap, pels estudis de S. S. Stevens i J. Volkman, que la relació s'apropa a la llei de Weber-Fechtner en alguns segments del rang d'aplicació d'aquest estímul.
Es defineix arbitràriament la unitat mel de la manera següent: considereu 1.000 mels com la percepció d'altura corresponent a 1.000 Hz a 60 dB. Assigneu, llavors, 2.000 mels a una altura considerada subjectivament de magnitud doble i 500 mels a una altura percebuda com la meitat del patró original.
Figura 18. Relació entre la sensació d'altura expressada en mels i la freqüència de l'estímul que la genera.
Figura 18. Relació entre la sensació d'altura expressada en mels i la freqüència de l'estímul que la genera.
La figura 18 mostra la relació entre la sensació d'altura expressada en mels i la freqüència de l'estímul que la genera.
Exemple
Per exemple, s'observa que per a assolir 3.000 mels és necessària una freqüència de 4.000 Hz.
En l’apartat “El so” d’aquest mòdul es va fer constar que sempre la sensació d'altura també depèn de la intensitat. S'observa que en estímuls de freqüència inferiors a 1.000 Hz la sensació d'altura disminueix quan la intensitat del so augmenta. En sons superiors a 3.000 Hz aquesta relació s'inverteix, mentre que en els sons compresos entre els 1.000 i els 3.000 Hz l'altura sembla que no és afectada per la intensitat.

3.2.Efectes psicoacústics de primer ordre

En aquest apartat s'estudien aquells efectes psicoacústics deguts a la superposició de tons purs, que es generen al líquid coclear i al llarg de la membrana basilar. Reben el nom d'efectes de superposició de primer ordre. Es tracta de fenòmens de fàcil accés a l'experimentació psicoacústica.
El timpà es mou cap a dintre i fora seguint les diferències de pressió que arriben als seus voltants a través del canal auditiu.
3.2.1.Superposició de dos tons purs de la mateixa freqüència
Si es fa oscil·lar amb moviment harmònic simple de freqüència i amplitud donades, se sent un to pur amb certa força i altura. Però si dos tons purs de la mateixa freqüència sonen junts, el timpà reacciona responent alhora a dues vibracions diferents. El moviment resultant al timpà és la suma dels moviments que tindrien lloc si cada so sonés per separat.
El timpà reacciona d'aquesta manera, però també ho fa així el medi i tots els components vibratoris de l'aparell auditiu, sempre que les amplituds dels sons no superin un cert límit en el qual la linealitat desapareix. Es tracta de la superposició lineal de dues vibracions, en què un component de vibració no pertorba l'altre.
  • Interferència constructiva: Quan els dos senyals de la mateixa freqüència i amplitud es sumen en fase, el so resultant és igual a qualsevols d’ells però amb el doble d’amplitud.

  • Interferència destructiva: Quan els dos senyals de la mateixa freqüència i amplitud es sumen en contrafase (o desfasats 180º), el so resultant és la resta d’ells, obtenint un zero com a resultat, és a dir, silenci. Aquest és el principi que apliquen els auriculars cancel·ladors de soroll pensats per escoltar música als avions.

Pel cas de que els dos senyals idèntics es sumin amb fases diferents a 0º (interferència constructiva) o 180º (interferència destructiva), el senyal resultant estarà a un punt entremig del doble de l’original i el silenci.
Finalment, si els senyals no tenen exactament la mateixa amplitud, la interferència constructiva tindrà una amplitud igual a la suma de les dues amplituds (no arriba al doble) i la interferència destructiva tindrà una amplitud igual a la resta de les dues amplituds (no arriba a zero).
3.2.2.Superposició de dos tons purs de freqüències lleugerament diferents
Es tracta ara de verificar el que ocorre en una superposició de dos tons purs amb la mateixa amplitud però amb una diferència de freqüència petita, tal com s'expressa en l'equació:
f2 = f1 + δf
El patró de vibració del timpà està determinat per tots dos components de freqüència alhora. El resultat de la superposició és una oscil·lació de període intermedi entre f1 i f2, amb una amplitud modulada suaument. El canvi suau de fase entre els dos components és notable: comencen en fase i es desfasen gradualment fins a arribar a l'oposició total en 180º. La diferència de fase continua creixent fins a arribar a 360º, moment en què es torna a fer nul·la.
Figura 19. Patró de vibració del timpà davant dels dos tons de freqüències molt pròximes.
Figura 19. Patró de vibració del timpà davant dels dos tons de freqüències molt pròximes.
La figura 19 mostra el resultat d’aquest canvi successiu entre una interferència constructiva i destructiva. Aquest canvi suau i continu de la fase és responsable del canvi d'amplitud de l'oscil·lació resultant al timpà, consistent en un únic patró de vibració que es transmet al fluid coclear i mou dues regions de ressonància diferents a la membrana basilar.
Si la diferència de freqüències (δf) és prou gran, les regions de la membrana basilar estan separades. Cada una vibra amb la freqüència del component que representen i així se senten dos components de freqüència totalment diferenciats, corresponents a cada un dels tons originals.
Ara bé: Si la diferència de freqüències (δf) és petita, no es pot tractar com a dues ones totalment diferenciades. La capacitat de la còclea consistent en la separació dels components originals d'un patró de vibració complex en l'àmbit de la membrana basilar es diu discriminació de freqüència. Es tracta d'un fenomen mecànic degut a les propietats hidrodinàmiques i elàstiques dels constituents de l'orella interna. Si la diferència de freqüències (δf) és menor que una certa quantitat, les regions de ressonància de la membrana basilar es trepitgen i llavors se sent només una nota d'altura intermèdia amb força modulada o batent.
En aquest cas la regió de ressonància de la membrana basilar segueix un patró de vibració essencialment idèntic al del timpà i és així que la modulació de l'amplitud del patró de vibració causa la modulació de força percebuda. Aquest fenomen es diu batement de primer ordre.
La freqüència del patró de vibració (també anomenada freqüència portadora) resultant de dos tons de freqüència molt similar és el valor mitjà entre les dues freqüències:
f p = f 1 + f 2   2 = f 1 + δ f 2 1.9
D’altra banda, la freqüència a la que es produeixen els canvis (també anomenada freqüència moduladora) entre el màxim d’amplitud (hi ha interferència constructiva) i els mínims d’amplitud (hi ha inferferència destructiva) vé definit per la diferència de freqüències:
fm = f2f1
Noteu com pel cas particular (i una mica absurd) que tinguem dos tons purs de la mateixa freqüència f1 = f2 = f, la freqüència portadora (la nota que sentim) i la moduladora (el ritme dels batements) queda:
f p = f 1 + f 2 2 = f + f 2 = 2 f 2 = f 1.10
fm = f2f1 = ff = 0
Finalment, s’ha comentat que quan la diferència de freqüències és prou gran, la percepció és la de dos tons purs independents, sense cap complicació, mentre que quan la diferència de freqüències és prou petita, es produeixen els batements. Ens preguntem ara què passa al cas límit entre les dues situacions.
Quan la diferència de freqüències superi els 15 Hz (δf ≥ 15 Hz), la sensació de batement es transforma en una nova sensació molt característica de rugositat, que alguns pretenen desagradable. Molt després de sobrepassar un nou límit anomenat banda crítica (δBCf), la sensació de rugositat desapareix gradualment.
Figura 20. Sensacions experimentades durant l'estimulació de dos tons purs evolucionant en la proximitat de la banda critica.
Figura 20. Sensacions experimentades durant l'estimulació de dos tons purs evolucionant en la proximitat de la banda critica.
La figura 20 mostra les diferents sensacions experimentades segons la diferència de freqüències entre els dos tons purs, relacionades amb l’amplada de la banda crítica BC.
El límit de discriminació de freqüència depèn molt de la freqüència mitjana (f2f1) / 2, anomenada també freqüència central. No depèn de l'amplitud i està sotmès a àmplies variacions individuals.
Figura 21. Evolució del límit de discriminació de freqüència i banda crítica en funció de la freqüència.
Figura 21. Evolució del límit de discriminació de freqüència i banda crítica en funció de la freqüència.
La figura 21 mostra el límit de discriminació que és més gran que el semitò i de vegades, fins i tot, més gran que el to. En el registre alt la banda crítica és entre un to, considerat tradicionalment com a dissonància, i la tercera menor, una consonància, també segons la tradició. En el registre greu, la discriminació de freqüència i la banda crítica és fins i tot més gran que la tercera menor. Segurament aquesta és la raó per la qual les terceres menors s'han usat poc en el registre greu al llarg de la tradició musical occidental.
Del que s’ha vist fins ara es conclou que el límit de la discriminació de freqüència és unes 30 vegades més gran que la diferència mínima apreciable.
La figura 21 també mostra que si els tons purs de freqüències f1 i f2 es fan sonar assignats independentment a auriculars diferents, de manera que el to de freqüència f1 estimula una orella i el de freqüència f2 l'altra, els batements no es presenten. Ocorre així fins i tot per sota del límit de discriminació de freqüència (δDf).
El fenomen del batement de primer ordre és important en música. Els batements de primer ordre són processats pel cervell i donen sensacions que van del desgrat al plaer, depenent de la freqüència de batement i de les circumstàncies musicals individuals.
Exemple
Un instrument mal afinat amb la resta produeix sensació de desgrat en part per la generació de batements de primer ordre. El so entre curiós i divertit d'una pianola es deu als batements generats per la desafinació entre les cordes dels ordres corresponents a les notes dels registres mitjà i agut. D'altra banda, és de domini comú considerar un instrument afinat en el moment que els batements desapareixen. Molt sovint les guitarres s'afinen d'aquesta manera.
La banda crítica també té un paper important en música. Independentment de la freqüència central, la banda crítica es correspon anatòmicament amb una extensió gairebé constant de 1.300 cèl·lules ciliades receptores –allotjades a l'òrgan de Corti, a l'interior de la membrana basilar. Per això un estímul sonor complex amb components amb freqüències en l'interior de la banda crítica de la seva fonamental causa una sensació subjectiva totalment diferent del cas en què la freqüència dels components s'estén en un rang més gran que la banda crítica de la seva fonamental.
L'existència de la banda crítica condiciona la percepció de la qualitat dels sons i permet establir les bases d'una teoria psicoacústica de la consonància i la dissonància dels intervals musicals.
3.2.3.Tons de combinació
Quan f2 supera els límits de la banda crítica de f1 mentre aquesta es manté constant, es manifesta una nova categoria d'efectes psicoacústics de primer ordre, coneguda com a tons de combinació. Es tracta de sensacions addicionals d'afinació que es donen quan dos tons purs de freqüències f1 i f2 sonen simultàniament. Es perceben fàcilment quan el nivell d'intensitat és alt i són sensacions que podrien ser generades per estímuls de freqüència igual a la diferència entre f2 i f1. I per això reben també el nom de tons diferencials.
Però no són presents en el so original i es produeixen a causa d'una distorsió no lineal que té lloc en l'orella quan l'amplitud dels senyals supera determinats límits.

3.3.Efectes psicoacústics de segon ordre

Els efectes psicoacústics de segon ordre es generen en el sistema nerviós, a un nivell més elevat, doncs, de la membrana basilar i de l'òrgan de Corti. No tenen, doncs, una explicació mecànica immediata. Sovint són també molt menys evidents i estudiar-los resulta més complicat.
3.3.1.Batements de segon ordre
Sigui una situació experimental semblant a la descrita en els casos anteriors, en què mentre un to pur es manté amb freqüència constant f1, un altre de freqüència f2 varia lentament. Per a obtenir els millors resultats, el to de freqüència f2 ha de ser d'amplitud lleugerament inferior. Per a evitar confusions amb els tons de combinació, és bo no excedir-se massa en els nivells d'intensitat. En aquest cas, la freqüència f2 varia al costat de l'octava de f1. És a dir, que:
f2 = 2 · f1 + δf
en què δf és un nombre enter de valor absolut petit, que representa alguns hertzs.
En evolucionar lentament cap a dalt la freqüència de f2 en aquest rang veí de 2 · f1 s'aprecia amb claredat una sensació de batement bastant característica, totalment diferent del batement de primer ordre que es produeix quan f1 i f2 són molt pròxims. En assolir f2 l'octava de f1, el batement desapareix, i a mesura que es desafina l'octava i va augmentant novament la freqüència de f2, la sensació de batement torna a aparèixer. La freqüència de batement es correspon amb δf. No és fàcil identificar què és el que bat. No es tracta de la intensitat del so, però tampoc no es pot dir que el que bati sigui l'altura. Per a alguns, el que oscil·la és la qualitat del so. En realitat el que varia és el patró de vibració en virtut del desfasament de periodicitat δ que té lloc. És important fer ressaltar el fet que en aquest cas no hi ha canvi macroscòpic en l'amplitud del patró de vibració, al contrari del que ocorre en el batement de primer ordre. Això posa de manifest el fet que l'orella és sensible a lents canvis de fase.
Dit d'una altra manera, l'orella és capaç de percebre canvis cíclics en la forma del patró de vibració, és a dir, la forma d'ona.
Aquest efecte, que només té lloc quan f1 i f2 es mantenen per sota dels 1.500 Hz, rep el nom de batement de segon ordre. També es pot dir batement subjectiu. Si els tons de freqüències f1 i f2 s'envien separadament a una parella d'auriculars, de manera que el de freqüència f1 afecti només una orella i el de freqüència f2 només l'altra, el batement de segon ordre es continua sentint. S'experimenta llavors una sensació de rotació espacial de la imatge del so en l'interior del cap.
Mentre que per a la música tradicional, especialment aquella que es recolza majorment en qüestions vinculades a la melodia, els batements de segon ordre no són de massa importància, l'interès dels batements de segon ordre ha augmentat a mesura que l'estètica musical s'ha anat basant en altres aspectes del so, més vinculats al color que a la freqüència, i a l'ús de dispositius informàtics i electrònics.
3.3.2.Reconstrucció de la fonamental
Per explicar l’efecte psicoacústic de segon ordre conegut com a reconstrucció de la fonamental, cal recordar el concepte de fonamental i harmònics explicat anteriorment. Cal recordar també que es tracta d’un efecte psicoacústic i que no es produeix per la interacció de les ones a l’aire, sinó pel comportament del cervell. La idea bàsica rau en el fet que l’ésser humà és capaç de percebre una freqüència fonamental, tot i que aquesta no existeixi realment, com a fruit de la combinació de diferents harmònics.
Exemple
Per exemple, a l´escoltar una conversa telefònica, tot i ser practicament impossible que l’altaveu del dispositiu generi les freqüències baixes corresponents a la fonamental de la veu del nostre interlocutor, les podem percebre i identificar-ne el locutor i el caràcter de la seva veu.
El fenomen es basa en dos fenòmens:
1) Fenòmen matemàtic: la superposició de dues ones de dos harmònics successius dins la serie harmònica genera una nova ona amb període igual al de la fonamental reconstruïda. La figura 22 mostra la creació i resultat d’aquesta superposició.
Figura 22. Patró de vibració resultant per a dos tons de freqüències múltiples d’una fonamental (f2 = 2 f1, f3 = 3 f1) i generació de la fonamental (f1).
Figura 22. Patró de vibració resultant per a dos tons de freqüències múltiples d’una fonamental (f2 = 2 f1, f3 = 3 f1) i generació de la fonamental (f1).
2) Fenòmen cognitiu: la membrana basilar és capaç de memoritzar els patrons de vibració ja des de que naixem, generant patrons de vibració preestablerts. D’aquesta manera, l’aparició parcial d’un d’aquests patrons provoca la sensació d’escoltar el patró sencer.
La reconstrucció de la fonamental té gran importància musical, ja que es tracta del dispositiu que permet a l'orella humana assignar una única sensació d'altura a estímuls complexos formats per diversos tons purs, com és el cas dels instruments musicals tradicionals.

4.Percepció de la intensitat. Sonoritat

En aquest apartat s'estudia un conjunt de fenòmens que ajuden a comprendre la manera com el flux d'energia acústica condiciona la sensació d’intensitat sonora.
Anteriorment s’ha explicat que per a un so pur l'amplitud de la vibració del timpà porta a la sensació de força del so. Aquesta amplitud està directament relacionada amb la variació de pressió (Δp) del so entrant, i per tant amb el flux d'energia acústica o intensitat (I).
El rang d'intensitats dels tons purs a què és sensible l'orella depèn de la freqüència del so i presenta variabilitat interindividual.
Per a un individu donat, hi ha dos límits de sensibilitat a un so d'una freqüència donada:
1) Un límit inferior d'escolta, que representa la mínima intensitat audible també anomenat llindar d’audició.
2) Un límit superior d'escolta, mes allà del qual es produeix dolor fisiològic, la qual cosa implica dany al mecanisme de l'orella.
La distància més gran entre aquests límits es dóna aproximadament quan la freqüència està entorn dels 1.000 Hz. De forma genèrica, s’estableix que per a un so de 1.000 Hz els límits inferior i superior són 10–12 W/m2 i 1 W/m2, respectivament.
La taula 1 mostra la sensació d'intensitat sonora –en notació musical tradicional– associada a una escala d'intensitats.
Taula 1. Percepció de la intensitat i sonoritat.
Intensitat (W/m2)
Sensació d’intensitat

1

(dolor)

10-1

fffff

10-2

ffff

10-3

fff

10-4

ff

10-5

f

10-6

mf

10-7

mp

10-8

p

10-9

pp

10-10

ppp

10-11

pppp

10-12

ppppp (llindar d’audició)

La notació musical serveix en aquest cas per a donar una idea de gradació uniforme en la sensació d'intensitat. Noteu, tanmateix, que l'elecció de la notació musical com a representant d'una mesura absoluta de la força del so és arbitrària. De fet, és possible percebre pianissimos i fortissimos fins i tot quan el potenciòmetre de volum de l'amplificador és molt baix i les intensitats i les seves relacions no es corresponen amb les de la taula 1.
Això significa que la sensació relativa d'intensitat està relacionada a més amb altres característiques físiques del so. D'altra banda, se sap que la interpretació de la notació musical de la força és altament dependent de l'instrument i del registre.

4.1.Llei de Weber-Fechner

A causa del gran rang d'intensitats a què manifesta sensibilitat l'orella, la unitat W/m2 no és pràctica.
Hi ha, tanmateix, una altra raó per a això, i és d'ordre psicofísic. Es va deixar intuir prèviament que el llindar diferencial (LD) d'un estímul donat és un bon paràmetre per a tenir en compte en l'elecció d'una unitat per a la magnitud física corresponent a l'estímul.
L'LD per a la intensitat de so és gairebé proporcional a la intensitat del so.
Una unitat psicofísica apropiada ha d'incrementar gradualment a mesura que l'increment d'intensitat descrigui increments de la sensació. Això resulta molt complicat en la sensació de força sonora llevat que s'introdueixi una magnitud diferent que sigui una funció apropiada de la intensitat (I).
La introducció d'una nova magnitud ha d'estar dirigida al següent:
  • La "compressió" del marge audible de l'escala d'intensitats a un marge més petit de valors.

  • A l'ús de valors relatius (el llindar, per exemple).

  • Ajustar la taxa de canvi d'estímul d'intensitat de so més properament al mínim canvi perceptible de la intensitat del so (LD).

En la taula 1 el que sembla més relacionat amb la sensació d'intensitat de so és l'exponent al qual s'eleva 10, com s'expressa en la taula 2.
Taula 2. Percepció de la Intensitat i sonoritat (2).
Exponent de la Intensitat (W/m2)
Sensació d’intensitat

1

(dolor)

-1

fffff

-2

ffff

-3

fff

-4

ff

-5

f

-6

mf

-7

mp

-8

p

-9

pp

-10

ppp

-11

pppp

-12

ppppp (llindar d’audició)

Es posa així de manifest una relació logarítmica entre el nivell d'intensitat sonora i la seva percepció.
Per a definir la nova magnitud cal introduir un punt de referència arbitrari. Per conveniència s'adopta el llindar d'audició a 1.000 Hz (10–12 W/m2) com a intensitat de referència, que se simbolitza per I0, i s'usa per a definir arbitràriament el nivell d'intensitat de so com a:
I L = 10 · log 10 ( I I 0 ) 1.11
En la terminologia anglosaxona el nivell d'intensitat se simbolitza per IL (1) .
La unitat de nivell d'intensitat IL és el decibel, que se simbolitza per dB.
De l'aplicació directa de l'equació anterior resulta que per al llindar d'audició (I0), quan I / I0 = 1, IL0 = 0 dB, ja que:
IL0 = 10 × log10 (I/I0) = 10 × log10 1 = 10 × 0 = 0 dB
De la mateixa manera, per al límit de dolor, quan I/I0 = 1012, IL = 120 dB.
ILdolor = 10 × log10 (Idolor/I0) = 10 × log10 ((1 Watt/m2)/(10−12 Watt/m2)) = 120 dB
El nivell d'intensitat corresponent a un forte (f) són 70 dB:
ILf = 10 × log10 (If/I0) = 10 × log10 ((10−5 Watt/m2)/(10−12 Watt/m2)) = 70 dB
El d'un pianissimo (ppp) són 20 dB:
ILppp = 10 × log10 (Ippp/I0) = 10 × log10 ((10−10 Watt/m2)/(10−12 Watt/m2)) = 20 dB
Noteu que es tracta d'una mesura relativa respecte a un valor de referència, en aquest cas el llindar d'audició. S'hauria pogut tractar d'un altre valor de referència diferent. L'interès de l'elecció d'aquest valor de referència concret és que a la intensitat que indica ocorren fets fàcilment constatables, a saber, que un to pur de 1.000 hertzs comença a ser percebut pel dispositiu auditiu humà.
És important entendre que IL és una definició i que, per tant, triar-la, com ocorre amb la de qualsevol patró de mesura, respon a criteris arbitraris.
La definició del nivell d'intensitat en els termes anteriors té bastants avantatges. Un és que aritmetitza un sistema de valors que d'altra manera tindria característiques exponencials.
Exemple
Per exemple, quan la intensitat es multiplica per un valor de 10 se sumen 10 dB a IL. En multiplicar per 100, s'afegeixen 20 dB a IL i en dividir per 100, se li resten.
La taula 3 ofereix algunes relacions interessants.
Taula 3. Relacions numèriques entre les operacions logarítmiques i linals.
Canvi en el nivell d’intensitat IL
Canvi en la intensitat

Sumar o restar 1 dB a IL

Multiplicar o dividir I per 1,26

Sumar o restar 3 dB a IL

Multiplicar o dividir I per 2

Sumar o restar 10 dB a IL

Multiplicar o dividir I per 10

Sumar o restar 30 dB a IL

Multiplicar o dividir I per 1.000

Sumar o restar 70 dB a IL

Multiplicar o dividir I per 10.000.000

4.2.Nivell de pressió sonora

La mesura de la intensitat del so és difícil. Resulta molt més senzilla la mesura de la pressió mitjanap). D’acord amb les regles de la termodinàmica pels processos adiabàtics, i per un cas de propagació d’ones esfèriques progressives, la relació entre la intensitat i la pressió mitjana d'una forma d'ona associada. Està determinada per:
I = 0,00234 × (Δp)2 (en Watt/m2)
en què la pressió mitjana ha d'estar expressada en N/m2.
Per tant, és possible expressar la intensitat sonora en termes de variació de pressió. Aplicant l'expressió anterior a I0 a 1.000 Hz, li correspon aproximadament una variació mitjana de la pressió de:
Δp0 = 2 × 10−5 Newton/m2
Com I és proporcional al quadrat de Δp, és possible escriure:
log10 I/I0 = log10 (Δp/Δp0)2 = 2 × log10 (Δp/Δp0)
D'on s'introdueix la quantitat:
SPL = 20 × log10 (Δp/Δp0)
en què SPL és l'anomenat nivell de pressió sonora, anàloga a IL = 10 × log10 I/I0 sempre que hi hagi flux d'energia, és a dir, propagació d’ona sonora.
Al contrari, el concepte de variació de pressió en un punt de l'espai manté el sentit i amb aquest, el de nivell de pressió sonora (SPL). En la major part de casos, les ones sonores que tenen lloc en un espai es desplacen i, per tant, té sentit parlar de flux d'energia. És per aquesta raó que normalment s'utilitza més la relació SPL que la IL.
Noteu que les definicions d'IL i SPL no impliquen per a res la freqüència de l'ona sonora. Encara que sigui amb referència a I0 res no impedeix definir el nivell d'intensitat de so (IL) i o el nivell de pressió sonora (SPL) per a qualsevol freqüència arbitrària.
El que sí que depèn de la freqüència, i molt fortament, són els límits subjectius de l'escolta. I en general, això ocorre, com es veurà, amb la sensació subjectiva de força sonora.
Quan se superposen dos sons de la mateixa freqüència i en fase ocorren coses que poden semblar estranyes en els nivells d'intensitat del so (IL) i de pressió sonora (SPL).
Considereu a l'efecte del que segueix la taula 3. En sumar (barrejar) dues notes de la mateixa intensitat –que es multiplica per 2–, tan sols se li afegeixen 3 dB al nivell d'intensitat del so original, per a tot valor d'IL.
La superposició de 10 notes iguals, en igual fase, només incrementen 10 dB l'IL resultant.
Per a superar en 1 dB un determinat nivell d'intensitat sonora (IL) cal multiplicar la intensitat per 1,26. Això implica que cal afegir una nota d'intensitat 0,26 vegades la del so original.
El mínim canvi en SPL requerit per a detectar un canvi en la sensació de força del so –el llindar diferencial per a la sensació de força del so– és gairebé constant i d'uns 0,2 a 0,4 dB en els rangs musicalment rellevants d'afinació i sonoritat.
La unitat d'IL o SPL té, doncs, una mida raonable, propera a l'LD.

4.3.Nivell de sonoritat

Tot l'anterior conflueix en la definició d'una nova magnitud psicofísica: la sonoritat del so associada a un SPL donat.
El sistema perceptiu humà presenta la capacitat d'establir nivells de força per a dues sensacions del mateix tipus. Per a la força sonora, els judicis de quan dos tons purs sonen igualment fort mostren una dispersió molt baixa entre els diferents individus. La dificultat apareix quan es pregunta com de més fort és un so en relació amb un altre. Per a aconseguir-ho cal entrenar els subjectes d'anàlisi, però encara en aquest cas, els resultats variaran molt d'un subjecte a l'altre.
En general, es verifica que sons purs de freqüència diferent i amb el mateix SPL produeixen sensacions de força sonora diferent.
Per això, quan interessa comparar tons de freqüència diferent, l'SPL no és una bona mesura de la força del so, anomenada normalment sonoritat.
En els anys trenta es van dur a terme gran nombre d'experiències per a establir corbes de força igual, i es va prendre l'SPL a 1.000 Hz com a referència. El resum és el mostrat a la figura 23.
Figura 23. Corbes de sonoritat igual (Fletcher i Munson, 1933) en un diagrama que relaciona la sonoritat amb la intensitat i la freqüència.
Figura 23. Corbes de sonoritat igual (Fletcher i Munson, 1933) en un diagrama que relaciona la sonoritat amb la intensitat i la freqüència.
En l'eix vertical centrat en 1.000 Hz, cap a tots dos costats es dibuixen corbes que corresponen als SPL dels sons que es jutgen amb igual sensació de sonoritat que el so de referència de 1.000 Hz.
S'aprecia, per exemple, que mentre un so de 1.000 Hz a un IL de 60 dB (10–6 W/m2) és perfectament audible, un so de 60 Hz amb el mateix SPL ja el no és.
De la inspecció de la figura 23 es dedueix clarament que per a produir una sensació de força a baixes freqüències es necessita una intensitat major que a 1.000 Hz.
La corba inferior representa el llindar d'audició per a diferents freqüències. S'observa que la màxima sensibilitat es troba vora els 3.000 Hz, on, per l'augment de la depressió de la corba, s'aprecia que la intensitat necessària perquè el so sigui audible està per sota dels 10–12 W/m2. A aquesta freqüència, l'orella humana pot captar moviments de l'aire de 10–8 mm, més petit que la mida d'una molècula d'hidrogen.
Noteu que perquè un to pur de 100 Hz es faci audible cal que la intensitat creixi fins als 10–8 W/m2 (40 dB més que el so de referència).
La forma de la corba del llindar d'audició està influïda per les característiques del canal auditiu i per les propietats mecàniques dels ossicles de l'orella mitjana.
Definim el nivell de sonoritat (LL) d'un to de freqüència f està determinat per l'SPL d'un to de 1.000 Hz que es jutja igualment fort. La unitat de nivell de sonoritat és el fon.
Les corbes gruixudes del gràfic de Fletcher i Munson (vegeu la figura 23) indiquen nivells de sonoritat igual per a sons de freqüència diferent. Reben el nom d'isofòniques i indiquen un nivell de sonoritat constant. S'usen per a trobar el nivell de sonoritat d'un determinat so d'SPL i freqüència coneguts.
Sigui, per exemple, un so de 40 dB SPL a 200 Hz. La línia isofònica que passa pel punt determinat per la freqüència i el nivell especificats talla la línia dels 1.000 Hz a 20 dB. El nivell de sonoritat (LL) d'un so de 40 dB SPL a 200 Hz és de 20 fons. Els nombres situats en la línia de 1.000 Hz representen el nivell d'intensitat corresponent a les corbes de sonoritat constant.

4.4.Sonoritat subjectiva

Però LL continua essent una magnitud física més que psicològica. Encara que representa aquelles intensitats d'SPL que sonen igualment fort, no dóna informació absoluta sobre la sensació de sonoritat. Noteu que un to amb LL el doble de gran no sona simplement dues vegades més fort. Cal introduir una nova magnitud per a donar compte del comportament de la sonoritat en termes absoluts. Es tracta de la sonoritat subjectiva i es representa per la lletra L.
Figura 24. Sonoritat subjectiva L en funció del nivell de sonoritat LL.
Figura 24. Sonoritat subjectiva L en funció del nivell de sonoritat LL.
La línia gruixuda de la figura 24 representa la relació experimental entre la magnitud psicològica de la intensitat i el nivell de sonoritat. La línia fina representa la relació entre la sonoritat subjectiva i la intensitat o la variació mitjana de pressió que la genera.
Com es pot veure a la figura 24, divergeixen. La s és una relació no lineal, perquè les unitats de les ordenades s'incrementen molt més ràpidament que les de les abscisses. La sonoritat subjectiva, que es representa per la línia de traç fosc, es descriu ens sons.
La relació entre la sonoritat subjectiva i el nivell de sonoritat és tal que un increment del nivell de sonoritat (LL) de 10 fons dobla la sonoritat subjectiva (L).
El cas en el qual les freqüències dels tons siguin diferents implica la consideració d'altres factors. Hi ha tres possibilitats:
1) Si les freqüències dels tons integrants són dins de la banda crítica de la freqüència central, la sonoritat subjectiva resultant es manté directament relacionada amb el flux total d'intensitat.
2) Quan el camp de freqüències supera la banda crítica, la sensació de força és més gran que la que s'obté per la simple suma de les intensitats, s'incrementa amb la separació de freqüències i tendeix a un valor límit que està determinat per la suma de les forces individuals.
3) Finalment, quan la distància entre les freqüències dels tons és gran, la situació es complica. Apareixen problemes per a definir el que significa la sonoritat subjectiva total. Es tendeix en aquests casos a centrar l'atenció en un dels components.

4.5.Mescla de sons

D'acord amb el que hem dit anteriorment, la suma de forces és més eficaç quan les freqüències estan molt separades i s'estenen mes enllà de la banda crítica de la freqüència mitjana. Una orquestra de corda, per exemple, sona menys forta en l'uníson que quan l'acord cobreix diverses octaves.
Inversament, per més piano que toqui un grup de violins mai no ho podrà fer tan suaument com un de sol. Això pot ser utilitzat per a regular el nivell de so d'una formació orquestral sense necessitat de fer indicacions de dinàmica.

4.6.Emmascarament

Tirant una mica enrere, cal dir que hi ha una manera alternativa d'estudiar el llindar diferencial (LD) per a la intensitat del so. En lloc de preguntar-se sobre quin valor ha de tenir la variació de la intensitat per a obtenir un efecte apreciable, és possible plantejar una qüestió totalment equivalent.
Es tracta d'investigar quina és la intensitat mínima I2 que ha de tenir una segona nota de la mateixa freqüència i fase, per a ser apreciada en presència d'una primera, la intensitat de la qual, I1, roman constant.
Aquest valor mínim rep el nom de llindar de màscara (ML). El so original amb intensitat I1 rep el nom d'emmascarador, mentre que el so addicional de I2 és l'emmascarat.
La màscara té un paper fonamental en música, però potser l'experiència més comuna i coneguda d'emmascarament és aquella en la qual no és possible seguir una conversa en presència d'un gran soroll de fons.
Si les freqüències són iguals, aquest llindar està determinat pel nivell de màscara (ML). Si les seves freqüències difereixen podem determinar el nivell d'emmascarament com la mínima intensitat de so que el to emmascarat ha d'ultrapassar per a ser independitzat i sentit separadament en presència d'un to emmascarador.
El llindar d'intensitat de tons purs aïllats canvia si altres notes són presents. En particular, augmenta.
Figura 25. Nivell d'emmascarament d'una nota de freqüència f en presència d'un altre to pur de característiques fixes (450 Hz i nivell d'intensitat (IL)).
Figura 25. Nivell d'emmascarament d'una nota de freqüència f en presència d'un altre to pur de característiques fixes (450 Hz i nivell d'intensitat (IL)).
La figura 25 representa, per a diversos nivells d'intensitat del to emmascarador, el nivell de màscara (ML) al qual ha de ser elevat el to emmascarat per sobre del llindar normal de nivell d'intensitat donades les característiques del to emmascarat.
La falta de simetria que es manifesta a alts nivells d'intensitat es deu a la generació d'harmònics aurals, les sensacions d'altura que apareixen en l'escolta d'un to pur de nivell d'intensitat molt alt, sempre de més freqüència que el to original (2 × f, 3 × f...). Per això es justifica un fenomen molt comprovat:
un to de freqüència donada emmascara més eficientment els tons de freqüència superior que els de freqüència inferior.
L'emmascarament té un paper de gran importància en la música polifònica i en l'orquestració. De la mateixa manera que unes combinacions d'instruments realcen el color del so, la introducció d'altres en determinats contextos no té cap sentit, ja que pot ser que no s'arribin a sentir.
Exemple
Aquest últim és el cas de l'addició de línies melòdiques d'instruments febles, com el fagot o l'oboè, en passatges on sonen els metalls amb gran intensitat.

4.7.Sonoritat subjectiva de tons purs de curta durada

Per tenir una sensació complerta de sonoritat (o sonoritat subjectiva) la durada del so també és important.
Hi ha una durada mínima que un so pur donat ha de tenir per a produir una sensació de to. És d'uns 10 a 15 ms, cosa que equival a 2 o 3 cicles si la freqüència està per sota dels 50 Hz.
Els tons de menys durada es perceben com a clics i no tenen altura. Els sons que duren més de 15 ms poden ser percebuts com a tons amb una certa altura i una certa sonoritat.
La sonoritat subjectiva depèn de la durada del to, però no de l'altura. Si la intensitat del to es manté constant, com més curt és el so, més fluix sona.
Quan la durada del to supera el mig segon, la força del to assoleix un valor màxim que és independent de la durada.
Figura 26. Variació de la sonoritat relativa en funció de la durada per a tons purs de diferents freqüències.
Figura 26. Variació de la sonoritat relativa en funció de la durada per a tons purs de diferents freqüències.
La figura 26 mostra la variació de la sonoritat relativa en funció de la durada per a tons purs de diferents freqüències.

5.Aproximació musical de la percepció del timbre

El timbre és una sensació difícil de definir. Normalment es diu del timbre que és aquella característica de la sensació auditiva per la qual és possible jutjar si dos sons són o no diferents quan es presenten a l'orella en condicions similars d'altura i a sonoritat.
Sovint es relaciona el timbre amb l'espectre de l'estímul o amb la seva forma d'ona, però tots els paràmetres físics del so afecten aquesta capacitat de diferenciar a la qual gairebé totes les definicions de timbre al·ludeixen.
El timbre és la qualitat de la percepció del so. És el so mateix, si per so s'entén el fenomen que s'experimenta i no el senyal físic que el genera. És l'objecte sonor.

5.1.Alguns detalls d'interès sonor sobre l'espectre dels sons

Des dels estudis de Von Helmholtz se sap que la percepció de la part estable dels sons està profundament determinada pel patró de vibració de la variació de pressió.
Fourier va mostrar que un fenomen periòdic qualsevol podia ser descompost en una suma de sinusoides elementals amb freqüències respectives múltiples enters del component més greu.
Com hem vist en la introducció, el component més greu s'anomena fonamental, i els altres, harmònics.
Si la freqüència de la fonamental és f0, els harmònics tenen freqüències:
f1 = 2 x f0
f2 = 3 x f0
f3 = 4 x f0
...
fi = (i + 1) x f0
Així, donat un determinat patró de vibració d'un to complex, de forma complexa, no sinusoïdal, hi ha un conjunt infinit de tons sinusoïdals la suma dels quals és equivalent.
Per exemple, una oscil·lació periòdica de pressió amb la forma de la figura 27 rep el nom de dent de serra (2) , i es correspon amb una suma d'infinits harmònics, l'amplitud dels quals decreix de manera inversament proporcional al número d'harmònic.
Figura 27. Ona en dent de serra.
Figura 27. Ona en dent de serra.
Figura 28. Dinou primers harmònics d'una forma d'ona en dent de serra; f0 és la fonamental.
Figura 28. Dinou primers harmònics d'una forma d'ona en dent de serra; f0 és la fonamental.
Una variació de pressió com la de la figura 29 rep el nom d'ona quadrada i és equivalent a una suma infinita d'harmònics de rang senar, les amplituds dels quals decreixen inversament al nombre d'harmònics, de manera que només hi ha harmònics senars.
Figura 29. Ona quadrada.
Figura 29. Ona quadrada.
Figura 30. Dinou primers harmònics corresponents a una ona quadrada; f0 és la fonamental.
Figura 30. Dinou primers harmònics corresponents a una ona quadrada; f0 és la fonamental.
Noteu que a la figura 30 f1, f3, f5 ..., es consideren parells: f1 = 2 x f0, f3 = 4 x f0, f5 = 6 x f0, etc., i que l'amplitud és zero.
Una forma sinusoïdal té com a espectre una única línia que representa l'amplitud del seu únic component, i l'amplitud dels restants harmònics infinits és 0.
Figura 31. Espectre d'una ona de forma sinusoïdal; f0 és la fonamental.
Figura 31. Espectre d'una ona de forma sinusoïdal; f0 és la fonamental.
L'Audacity permet la generació de sons d'aquestes característiques. Això es du a terme amb la funció del menú Generar > To > Sinusoide > Dent de serra / Quadrada.
Podeu sintetitzar sons amb diferents formes d'ona i experimentar les sensacions tímbriques generades.
Amb l'ajuda de la funció Analitzar > Anàlisi d'espectre es pot verificar l'anterior.
Exemples: sonogrames de diferents sons
Quan un violinista manté una nota amb la mínima variació possible, la forma d'ona generada per la corda és molt pròxima a una dent de serra. La caixa fa ressonar uns harmònics i n'atenua d'altres. És el que es representa a la figura 32, el nom genèric de la qual és sonograma.
Figura 32. Sonograma d'una nota de violí produïda de manera estable. En les abscisses es representa el temps. En les ordenades, el número d'harmònic. La grossor del traç representa l'amplitud del parcial corresponent.
Figura 32. Sonograma d'una nota de violí produïda de manera estable. En les abscisses es representa el temps. En les ordenades, el número d'harmònic. La grossor del traç representa l'amplitud del parcial corresponent.
La forma d'ona d'un so llarg de clarinet s'aproxima a la forma d'ona quadrada. Per això, l'espectre, tal com es representa en el sonograma, té els harmònics senars a nivell molt baix.
Figura 33. Sonograma d'un so llarg de clarinet.
Figura 33. Sonograma d'un so llarg de clarinet.
La forma d'ona d'un piano és més complexa i el seu espectre està determinat pel sonograma de la figura 34.
Figura 34. Sonograma d'una nota produïda per un piano.
Figura 34. Sonograma d'una nota produïda per un piano.
Per la seva part, la flauta és l'instrument tradicional d'espectre més simple.
Figura 35. Sonograma d'una nota llarga sense variacions d'intensitat produïda per una flauta.
Figura 35. Sonograma d'una nota llarga sense variacions d'intensitat produïda per una flauta.
Una campana presenta components amb freqüències que no tenen cap relació entera. El so de campana forma part d'una categoria de sons anomenats inharmònics.
Figura 36. Sonograma d'un so de campaneta.
Figura 36. Sonograma d'un so de campaneta.
Un cop sobre una fusta té un espectre en el qual es poden apreciar gairebé totes les freqüències. En el sonograma s'aprecia que en l'atenuació tendeixen a quedar ressonant uns components, mentre que d'altres s'esmorteeixen abans.
Figura 37. Sonograma d'un cop sobre una superfície de fusta.
Figura 37. Sonograma d'un cop sobre una superfície de fusta.
Si el cop es dóna sobre una planxa de metall, l'atenuació resulta més llarga i es poden apreciar millor els parcials que queden ressonant.
Figura 38. Sonograma d'un cop sobre una planxa de metall.
Figura 38. Sonograma d'un cop sobre una planxa de metall.
Figura 39. a) Sonograma d'un cop en el qual queden ressonant components greus. b) Sonograma d'un cop en el qual queden ressonant les freqüències mitjanes. c) Sonograma d'un buf amb components aguts. d) Sonograma d'un buf amb components greus.
Figura 39. a) Sonograma d'un cop en el qual queden ressonant components greus. b) Sonograma d'un cop en el qual queden ressonant les freqüències mitjanes. c) Sonograma d'un buf amb components aguts. d) Sonograma d'un buf amb components greus.

5.2.Envers una definició multidimensional de timbre

De la inspecció dels sonogrames del subapartat anterior se segueix que l'amplitud dels parcials varia en funció del temps. És clar, llavors, que l'espectre no es manté estable en aquestes condicions.
Figura 40. Comportament d'amplitud en funció del temps dels deu primers harmònics d'un so de clarinet de 25 s de durada.
Figura 40. Comportament d'amplitud en funció del temps dels deu primers harmònics d'un so de clarinet de 25 s de durada.
Es pot imaginar l'enorme variabilitat espectral que implica un comportament dinàmic com el de la figura 41.
Figura 41. Comportament dinàmic dels parcials d'un so en funció del temps. En les abscisses es representa l'amplitud. En les ordenades, el temps. En el tercer eix, el número de parcial.
Figura 41. Comportament dinàmic dels parcials d'un so en funció del temps. En les abscisses es representa l'amplitud. En les ordenades, el temps. En el tercer eix, el número de parcial.
En realitat, l'espectre dels sons és totalment variable en el temps. Fent instantànies de l'espectre d'un so des del principi fins que acaba es poden aconseguir gràfics com el de la figura 42.
Figura 42. Comportament de la freqüència de la fonamental d'un so de clarinet durant els quatre primers segons.
Figura 42. Comportament de la freqüència de la fonamental d'un so de clarinet durant els quatre primers segons.
Per a complicar les coses respecte de les característiques que influeixen en la percepció del so, resulta que la freqüència dels parcials que componen un so complex tampoc no és estable.
Aquestes característiques i altres que no es tenen en compte per motius d'extensió contribueixen a la sensació de timbre.
A la figura 43 es presenta un espai de tres dimensions que constitueix una primera aproximació a la idea de multidimensionalitat del timbre i, per tant, de l'objecte sonor, ja que, com s'ha vist anteriorment, es tracta de conceptes equivalents.
Figura 43. Diferents plans en els quals poden ocórrer canvis capaços d'evocar sensacions tímbriques.
Figura 43. Diferents plans en els quals poden ocórrer canvis capaços d'evocar sensacions tímbriques.
En el pla corresponent al color tenen lloc les projeccions espectrals –amplitud enfront de freqüència–, la importància de les quals ja ha estat tractada.
El pla de la forma dinàmica recull les projeccions corresponents a les variacions que cada component del so presenta en funció del temps. És evident que en el reconeixement d'un determinat so té a veure el seu comportament dinàmic habitual. Un clarinet no és un clarinet si no comença o acaba com un clarinet. És una altra cosa.
El pla de la micromelodia dóna compte de les variacions de freqüència que cada un dels parcials experimenta en funció del temps.