La percezione uditiva


Disclaimer: Il contenuto di questo post è un estratto della mia tesi di laurea, realizzata nel 2006. Alcuni esempi potrebbero risultare obsoleti, tuttavia la componente teorica resta un buon riferimento per chi deve approcciarsi alla materia.


I suoni che percepiamo ogni giorno nascono da interazioni tra oggetti (un martello che colpisce un metallo, una moneta che cade) o da cambiamenti nelle proprietà di un singolo oggetto (come un palloncino che scoppia). Ma siamo in grado di riconoscere tali eventi fisici e le loro proprietà solo sulla base del suono prodotto? Per rispondere a questa domanda sono stati svolti numerosi studi, utilizzando diversi approcci. Uno di questi consiste nel dividere l’oggetto di studio in tre livelli:

  • livello fisico;
  • livello acustico;
  • livello percettivo.

L’analisi delle relazioni tra il livello percettivo e il livello fisico permette di capire se le caratteristiche di un evento vengono riconosciute propriamente o vengono scalate; l’analisi delle relazioni tra livello fisico e livello acustico ci dice come variano le proprietà del segnale sonoro in base alle proprietà fisiche dell’evento; infine dall’analisi delle relazioni tra livello acustico e percettivo si capisce se e come i segnali acustici influenzano il riconoscimento e la classificazione delle proprietà dell’evento in esame.

Le caratteristiche del segnale audio possono essere raggruppate in due categorie:

  • caratteristiche studiate dalla ricerca classica sulla percezione sonora, come ampiezza, durata, tonalità, timbro e attacco;
  • caratteristiche della sorgente sonora.

Durante l’ascolto la nostra attenzione viene rivolta a l’una o l’altra classe di proprietà. In base a ciò è possibile dire che le persone assumono due tipi di comportamenti durante l’ascolto dei suoni (Gaver, W. W., 1993):

  • l’ascolto di tipo musicale porta a riconoscere i suoni assieme alle loro proprietà;
  • l’ascolto di tutti i giorni porta a riconoscere gli eventi e le sorgenti sonore piuttosto che le proprietà del suono.

La maggior parte della nostra esperienza nell’ascolto degli eventi può essere classificata come ascolto di tutti i giorni: ascoltiamo ciò che avviene attorno a noi, imparando cosa è importante evitare e cosa invece può offrirci una possibilità di interazione. Le dimensioni percettive e gli attributi considerati sono quelli dell’evento che produce il suono, e non quelli del suono di per sé; tale esperienza è molto diversa dall’ascolto di tipo musicale, e non può essere studiata pienamente utilizzando gli approcci tradizionali all’acustica. E’ anche vero che i suoni musicali non sono rappresentativi della classe di suoni che regolarmente sentiamo:

  • i suoni musicali sono armonici, hanno un’evoluzione temporale semplice, non rivelano molte informazioni riguardo alla loro sorgente e variano lungo dimensioni come tonalità e ampiezza;
  • i suoni di tutti i giorni sono inarmonici o rumorosi, hanno un’evoluzione temporale complessa, spesso rivelano molte informazioni riguardo alla loro sorgente e variano lungo molte dimensioni.

Per studiare quest’ultima tipologia di suoni è necessario espandere la psicoacustica in due modi: considerando le dimensioni del suono e della sua sorgente e trattando alcune variabili complesse come elementari. Tali assunzioni guidano lo sviluppo dell’approccio ecologico alla percezione uditiva.

In questo tipo di approccio gli stimoli elementari non necessariamente corrispondono a dimensioni fisiche altrettanto elementari, ma in alcuni casi sono costituite da eventi complessi; per questo, secondo l’approccio ecologico, lo studio della percezione deve essere rivolto a scoprire le dimensioni rilevanti per la percezione e le informazioni relative a queste.

Dall’evento all’esperienza

L'esempio dell'automobile come sorgente di onde sonore; alcune onde
raggiungono l'orecchio umano immutate, altre invece vengono modificate
dall'ambiente.
L’esempio dell’automobile come sorgente di onde sonore; alcune onde raggiungono l’orecchio umano immutate, altre invece vengono modificate dall’ambiente.

Immaginiamo di sentire l’avvicinarsi di un’automobile. Possiamo considerare tale evento come una propagazione continua di energia dalla sorgente al soggetto; lungo il percorso che questo flusso di energia compie si trovano vari ostacoli, ognuno con le sue caratteristiche ed ognuno influenzante la propagazione.

Nel caso in esame, la prima fonte di informazione è l’automobile (la sorgente): il suono dipende da svariati fattori, come il movimento dei cilindri del motore, lo sfregamento degli ingranaggi e le vibrazioni della carrozzeria. Vengono così determinate le onde di pressione che si propagano radialmente dalla sorgente (contrariamente alla luce radiante, la propagazione radiale del suono ha una struttura ricca e fornisce molte informazioni riguardo la sua sorgente).

Successivamente il suono viene modificato dagli ostacoli che incontra nell’ambiente circostante; in particolare il suono perde energia man mano che si allontana dalla sorgente, specialmente alle alte frequenze (anche se non sono presenti ostacoli), e ciò fornisce un’informazione riguardo alla localizzazione della sorgente; se la sorgente si muove si avverte un cambio di frequenze (effetto Doppler) e un cambiamento nell’ampiezza del suono indica un’allontanamento o avvicinamento della sorgente stessa. Dato che il sistema uditivo umano è mobile, possiamo girare la testa al fine di cogliere i cambiamenti nei pattern e migliorare la localizzazione. Vediamo così come un suono dia informazioni circa un’interazione tra materiali in un certo luogo e in un determinato ambiente.

Ulteriori studi (Gaver, W. W., 1993) hanno portato alla distinzione dei suoni di tutti i giorni in tre grandi categorie: solidi, liquidi e aerodinamici, in quanto raramente queste classi vengono confuse tra di loro. Ogni classe viene poi suddivisa in base al tipo di interazione tra i materiali: ad esempio i suoni generati da solidi vibranti sono divisi in suoni di rotolamento, di sfregamento, di impatto e di deformazione. Queste classi costituiscono gli eventi base che producono dei suoni.

Vibrazioni dei solidi

Questa classe comprende eventi come la rottura di un vetro, una porta che sbatte o un’automobile in moto. Gli oggetti vibrano quando su di essi una forza viene impressa e rilasciata, portando il sistema fuori dal suo stato di equilibrio; tale forza deforma l’oggetto dalla sua configurazione originale, mentre la forza che l’oggetto oppone alla deformazione viene trasformata in energia potenziale nella nuova configurazione. Quando la forza smette di agire, l’oggetto cerca di tornare nella posizione di riposo, l’energia potenziale si trasforma in energia cinetica e l’oggetto vibra. Le vibrazioni continuano fino a quando tutta l’energia accumulata viene persa e l’oggetto torna nella posizione iniziale o trova un nuovo equilibrio. Il tipo di interazione (un urto, uno sfregamento o un rotolamento) determina sia la variazione nel tempo dell’ampiezza che lo spettro della vibrazione; la forza invece determina l’ampiezza complessiva della vibrazione. Il pattern di vibrazione è determinato anche dal tipo di materiale di cui è costituito l’oggetto, quindi dalla sua rigidità. La dimensione determina la più bassa frequenza di vibrazione, mentre la forma determina frequenza e pattern spettrale prodotto.

Tutti i parametri considerati possono essere raggruppati in due domini: il dominio della frequenza e il dominio temporale. Dal momento che la frequenza è il reciproco del tempo, è difficile separare questi due domini dal punto di vista fisico; tuttavia sono separabili dal punto di vista psicologico: i parametri nel dominio della frequenza influenzano le vibrazioni dell’oggetto, mentre i parametri nel dominio del tempo provocano effetti che diventano evidenti solo dopo alcuni cicli di vibrazioni. Gli attributi dell’oggetto (densità, dimensioni) hanno effetti sul suono nel dominio della frequenza, mentre gli attributi dell’interazione (tipo e forza) influenzano i parametri nel dominio temporale.

Eventi aerodinamici

I suoni aerodinamici vengono prodotti quando una sorgente modifica l’attuale pressione atmosferica circostante (come quando esplode un palloncino). La variazione di pressione si propaga come un’onda, la quale, se raggiunge l’orecchio e possiede particolari proprietà, può essere avvertita come suono. La maggior parte delle informazioni viene data dalla banda di frequenza del suono, dipendente dalla forza e dalla quantità della variazione di pressione. Le componenti in alta frequenza indicano la velocità nel cambiamento di pressione, mentre le componenti in bassa frequenza dipendono dal gas coinvolto.

Un altro tipo di evento aerodinamico si verifica quando un cambiamento nella pressione imprime energia ad un oggetto provocando una sua vibrazione.

Liquidi

Gli eventi che coinvolgono liquidi dipendono da una deformazione iniziale come nella vibrazione dei solidi, ma la vibrazione non influisce sull’aria circostante in modo da provocare un suono; il suono invece è il risultato della formazione e variazione di cavità risonanti nella superficie del liquido. Per rendersene conto, basta pensare ad un piccolo oggetto che cade in un bicchiere d’acqua: al momento del contatto il liquido viene spostato dall’oggetto, formando una cavità che risuona ad una frequenza caratteristica, amplificando e modificando l’onda di pressione creata dall’impatto. Successivamente la pressione del liquido lo porta a chiudere la cavità, immergendo completamente l’oggetto. Un tale suono è quindi caratterizzato da un breve impulso seguito da altri brevi impulsi di frequenza più alta. I dettagli del suono sono determinati da massa, dimensione, velocità dell’oggetto e dalla viscosità del liquido.

Eventi che producono suoni complessi

Molti suoni dipendono da pattern complessi degli eventi descritti, o una combinazione di questi. Anche se la fisica non descrive tali eventi complessi, esistono attributi di alto livello che producono importanti effetti sul loro suono. Un esempio di attributo è l’intervallo tra eventi successivi: una sequenza di passi possono essere avvertiti come una camminata se gli intervalli tra un passo e l’altro cadono all’interno di un certo intervallo; altro esempio è la presenza di vincoli tra gli oggetti coinvolti nell’evento (sarebbe strano sentire il cigolio di una porta che si chiude lentamente accompagnato dal forte suono di una porta che viene chiusa con forza).

In tutti questi casi le sorgenti sonore possono essere considerate annidate (si pensi al suono di un’automobile, del suo motore e dei cilindri); in tal caso, un evento base può essere definito come un evento composto da una singola interazione e un singolo oggetto che produce il suono. Gli eventi complessi possono essere considerati allora combinazioni di eventi base, nelle quali la struttura della combinazione aggiunge informazioni importanti a quelle già fornite dagli eventi base. Infine, è proprio questa struttura più complessa che permette di estrarre più facilmente informazioni.

In base alla struttura delle combinazioni possiamo distinguere tre tipi di eventi complessi:

  • gli eventi definiti da un pattern temporale di eventi base (come il rimbalzo di una palla è composto da un pattern di impatti);
  • gli eventi residui, dati dalla sovrapposizione di diversi eventi base;
  • gli eventi ibridi, dati dall’interazione tra diversi tipi di materiale.

Ognuno di questi eventi complessi potenzialmente produce lo stesso profilo di sorgente sonora, più eventualmente altre proprietà specifiche: ad esempio una serie di impatti spaziati opportunamente nel tempo può portare ad individuare il rimbalzo di una palla, dando anche informazioni sul materiale e sulla simmetria della palla stessa.

Il suono prodotto da questi eventi varia in base a molte dimensioni fisiche di base; tuttavia spesso non percepiamo la variazione del suono in ogni singola dimensione, bensì avvertiamo una variazione lungo una nuova dimensione (fittizia) che incorpora tutte le altre.

Descrivere gli eventi

Gerarchia degli eventi
Gerarchia degli eventi

Mentre i suoni vengono descritti in base ad attributi come frequenza, ampiezza e durata, più difficile è trovare degli attributi che permettano di descrivere gli eventi di tutti i giorni.

Una possibilità è quella di classificare questi eventi in base al contesto nel quale si verificano. Ciò può essere utile se si vuole trovare un suono all’interno di una classificazione di tale tipo, ma non permette una descrizione efficiente di ciò che sentiamo, in quanto le classi non sono mutuamente esclusive (uno stesso evento può verificarsi in contesti diversi). Più interessante sembra essere una descrizione di tipo gerarchico: in questo modo gli eventi che si trovano ad un livello superiore nella gerarchia danno informazioni utili sul tipo di eventi di livello subordinato, mentre dimensioni e caratteristiche servono a descrivere le differenze tra i membri di una stessa categoria.

In base a quanto detto possiamo quindi classificare i suoni di tutti i giorni come riportato in figura: al più alto livello tutti gli eventi sono visti come interazione di materiali; al livello successivo invece vengono divisi in vibrazioni di solidi, aerodinamici e liquidi; al terzo livello la distinzione è tra eventi base.

Percezione e psicofisica

Come per la percezione aptica, anche la percezione sonora è un processo che si articola in tre livelli: livello fisico, neurale e mentale. In più, nel riconoscimento dei suoni le persone cercano di trarre vantaggio dall’esperienza acquisita nel passato (anche se non è possibile effettuare una stima di tale esperienza).

Esiste una differenza, nella nostra percezione uditiva, tra ciò che è e ciò che sentiamo:

  • siamo in grado di sentire suoni che non esistono (la fondamentale mancante);
  • non riusciamo a sentire suoni che esistono (mascheramento);
  • sentiamo due diversi eventi con lo stesso insieme di stimoli (ritmi reversibili);
  • possiamo sentire suoni che sono prodotti da sorgenti inesistenti nell’ambiente (musica elettronica o qualsiasi manipolazione spettrale di suoni reali).

L’uomo agisce in base a ciò che sente, non in base a ciò che esiste.

Ascoltare e riconoscere la sorgente

Dire che l’uomo “sente” la sorgente del suono può essere corretto se si considera un ambiente naturale: se ad esempio ci troviamo vicino ad un violinista che suona, possiamo dire che sentiamo il violino suonare. Ma ascoltando il suono di un violino proveniente da un impianto hi–fi non ci verrebbe mai in mente di dire che stiamo sentendo il cono dell’altoparlante (anche se ciò è vero); piuttosto continuiamo a sostenere che stiamo sentendo un violino. E’ opportuno quindi dire che l’uomo non sente la sorgente del suono, bensì l’uomo “rappresenta” la sorgente.

Il riconoscimento del suono e della sua sorgente è però un concetto diverso rispetto alla percezione:

  1. si può avere percezione senza riconoscimento;
  2. il riconoscimento può avvenire a vari livelli: è possibile riconoscere un rumore ma non una tonalità, il rombo di un’auto ma non quello di una motocicletta;
  3. si possono verificare riconoscimenti fasulli: più precisamente un riconoscimento è sempre “vero” all’inizio, ma può diventare “falso” dopo aver percepito ulteriori informazioni sull’evento (come quando si pensa di sentire la pioggia e invece si tratta del rumore delle foglie mosse dal vento);
  4. ci sono riconoscimenti ambigui (ad esempio quando non siamo in grado di identificare una voce come maschile o femminile);
  5. lo stesso stimolo acustico può dare vita a diversi riconoscimenti a seconda che si verifichi da solo o che si ripeti (un singolo colpo di pistola viene identificato come tale, mentre una sequenza veloce di tali colpi fa pensare ad una mitragliatrice);
  6. a volte la sorgente che viene riconosciuta è immateriale (si pensi all’accelerazione o decelerazione di un ritmo);
  7. alcuni riconoscimenti avvengono in tempo reale, mentre altri possono avvenire “in ritardo”, riguardando suoni già sentiti e memorizzati nella nostra mente.

I modelli fisici

I modelli fisici hanno lo scopo di sintetizzare, tramite un modello matematico, le proprietà degli oggetti reali; in particolare tramite i modelli audio si cerca di riprodurre i suoni associati a determinati eventi.

I modelli sono però sempre delle idealizzazioni, e quindi non possono rappresentare fedelmente i fenomeni che si verificano in natura. Inoltre gli stimoli provenienti da sorgenti reali variano lungo molte dimensioni, ma non tutte possono essere sintetizzate: è possibile ad esempio riprodurre le variazioni di ampiezza, timbro, durata, e dinamica; ma diventa molto difficile sintetizzare proprietà come presenza, brillantezza e contenuto espressivo. Inoltre, nella fisica reale sono presenti molti oggetti che vibrano simultaneamente, mentre l’orecchio riceve una unica onda sonora; è necessario così estrarre da quest’ultima i segnali o le caratteristiche che possano ricreare la molteplicità di oggetti, la loro disposizione, il percorso dell’onda sonora ed eventuali ostacoli lungo il suo cammino.

Riferimenti

  1. Gaver, W. W. (1993). What in the world do we hear? An ecological approach to auditory event perception. Ecological Psychology5(1), 1–29.

Related Posts