02 maggio 2011

Ecco la radio 3D: spazialità sonora con sole due casse

Pochi giorni fa gli ascoltatori del programma Studio 360 trasmesso ogni venerdì da Kurt Andersen sulle frequenze di WNYC di New York e sul circuito NPR hanno potuto seguire in anteprima i risultati delle tecniche di trasmissione sonora tridimensionale applicate da Edgar Choueiri, direttore dell'Electric propulsion and plasma dynamics Lab di Princeton. In futuro la radiofonia 3D potrebbe rappresentare uno sviluppo molto interessante per la sua capacità di ricostruire il suono spazialmente, in modo che l'ascoltatore possa rendersi effettivamente conto della posizione della sorgente sonora, così come il nostro orecchio riesce a calcolare istantaneamente nella realtà. Ma il vero obiettivo di questi lavori è il mondo del cinema, dove le immagini 3D sono spesso accompagnate da un suono incongruamente "piatto".
Come spiega Choueiri in questa intervista, il suono 3-D non è propriamente uguale al suono surround, creato da un insieme di altoparlanti posti a raggiera intorno a chi ascolta (senza che quest'ultimo possa andare oltre a una ricostruzione parziale della generica direzione delle sonorità). Gli algoritmi del ricercatore americano riescono a ottenere una impressionante precisione spaziale nelle registrazioni sonore riprodotte da due soli altoparlanti. Il segreto sta nell'applicazione di filtri adattativi che eliminano il fenomeno del "cross talk" tipico dell'ascolto di un segnale stereofonico senza le cuffie: le informazioni che distinguono le due sorgenti audio dei canali A e B arrivano in realtà a entrambe le orecchie distruggendo l'effetto voluto. I filtri sviluppati dal laboratorio di Choueiri, come spiega lo stesso ricercatore, riescono in pratica a costruire un muro tra i due orecchi e la tridimensionalità risulta di colpo evidente. Provate ad ascoltare l'intervista qui di seguito (e gli esempi che essa contiene) ponendovi esattamente al centro degli altoparlanti del computer. Il risultato è davvero suggestivo.



Potete ascoltare l'intera puntata di Studio 360 a questo indirizzo. Riporto qui il file esemplificativo con il suono 3D di una cascata d'acqua nelle due versioni per l'ascolto - rispettivamente - in altoparlante e in cuffia:

(altoparlanti:)


(cuffie:)


Sul blog di Studio 360 professor Choueiri racconta di aver tratto ispirazione per le sue ricerche sui filtri anti-cross talk dall'ascolto della Messa in mi minore di Johan Sebastian Bach:

7 commenti:

marco barsotti ha detto...

mmmhhh.....

mmm...

Senti, quando avevo 12 anni ero appassionato della quadrifonia, promossa dalla rivista Audiovisione di quel pazzo del professor Marino Mariani.
Ho ascoltato molte cose in QS, SQ. Successivamente nei primi dolby surround, e successivamente pro logic e poi Digital.
Nel frattempo vari sistemi si sono proposti di riprodurre il suono in 3d, non usando 4 altoparlanti (anche se ne basterebbero tre), ma con due.

Tutti, e questo incluso, mi danno la sensazione di mandare fuori fase qualcosa, e non di mettere il suono in 3D.

Inoltre nella spiegazione del professore c'e' un gap logico: se registri con due microfoni piazzati dove sono le orecchie di un ascoltatore (mi pare la chiamassero testa artificiale anni fa), e successivamente riproduci senza mixaggi o altri tricks i due canali in cuffia, non hai bisogno di alcun filtro anti cross-talk, perche' questo cross talk non ha modo di prodursi.

o sbaglio ?

Andrea Lawendel ha detto...

Credo che in questo caso tu ti stia sbagliando. La registrazione avviene attraverso i due microfoni in corrispondenza delle orecchie, questo è vero, ma la riproduzione avviene da due altoparlanti posti in posizioni del tutto diverse. Gli algoritmi che ricostruiscono l'effetto 3D devono effettuare una trasformata nello spazio ed è questa l'informazione che rischia di andare perduta con il crosstalk nel caso di ascolto in altoparlante. Diversa è la situazione per l'ascolto in cuffia.

marco barsotti ha detto...

E invece no.

Al minuto 2,0 del video, il professore spiega che la mancata riproduzione 3D nella stereofonia tradizionale e' dovuta al fatto che l'orecchio (ed esempio) destro percepisce anche parte del segnale dell'altoparlante sinistro, che era pero' registrato solo dal microfono sinistro e destinto all'orecchio sinistro esclusivamente.

In cuffia (di quelle chiuse) questo problema non sussiste, e quindi non dovrebbe essere necessario nessun filtro anti cross-talk, e neppure dovrebbe poter esistere una versione "per cuffia" dei brani musicali.

Quindi o la spiegazione e' incompleta, o e' errata.

Comunque ho una domanda: tu li senti in 3D questi brani?

Io li ho ascoltati come segue:
A)Cuffiia sennheiser
B) via altoparlanti MONRIO collegati a ampli Sony, distranziati tra loro 2,5 mt e a circa altrettanta distanza dalle mie orecchie, in sala ragionevolmente fonoassorbente.
e...
sento solo il consueto effetto di sfasamento, assente nelle registrazioni quadrafoniche del prof. Mariani.

Andrea Lawendel ha detto...

Mi permetto di continuare a dissentire. Gli algoritmi anti cross-talk sono ovviamente destinati - lo ribadisco - all'ascolto dall'altoparlante, *non* per le cuffie ("for you to sit in front of two speakers and two speakers only..."). La differenza tra il suono 3D e la stereofonia surround, precisa anche il ricercatore, è che nella seconda non c'è alcun tentativo di ricostruire una immagine tridimensionale del suono come verrebbe percepito dalle orecchie ma la semplice volontà di "immergerti" in un suono che ha origini da numerose sorgenti circostanti.
Per rispondere alla tua domanda sì, l'effetto 3D lo percepisco molto nettamente seduto davanti al mio iMac e dai suoi diffusori laterali, non vorrei che il tuo setup con gli altoparlanti così distanziati fosse troppo diverso da quello pensato per quei file. E' un po' il problema dei nuovi display 3D dove l'effetto di profondità è rilevabile senza occhialini (la nuova Nintendo 3DS lo usa). La posizione della testa dell'osservatore rispetto allo schermo è fondamentale perché l'effetto sia percepibile.

cristian ha detto...

L'effetto mi è sembrato buono ma definirlo 3D mi pare troppo. Nel breve esempio io percepivo la direzione del suono ma questo proveniva sempre davanti a me...ho anche provato ad ascoltare mettendomi tra le casse ma non ho tutti gli effetti sembrano solo a 180°. Per me 3D è quanto il suono può arrivare da qualsiasi punto a 360°, quindi questo lo chiamerei un super-stereo ma servono varie prove ed anche altri esempi audio.
Il tentativo di fare effetti 3D con le cuffie non è nuovo, a questo proposito l'effetto SRS presente anche in alcuni netbook mi sembra già molto buono, la vera novità mi sembra il fatto di utilizzare 2 sole casse, in questo caso mi ricordo solo tentativi con stereo-wide e poco altro...

cristian ha detto...

chiedo venia ho letto ora la tua preecisazione
"La differenza tra il suono 3D e la stereofonia surround, precisa anche il ricercatore, è che nella seconda non c'è alcun tentativo di ricostruire una immagine tridimensionale del suono come verrebbe percepito dalle orecchie ma la semplice volontà di "immergerti" in un suono che ha origini da numerose sorgenti circostanti."

Se lo scopo è questo allora ci siamo, perché infatti ho notato subito questi limiti, ma io lo chiamerei con altro nome, non 3D proprio per non generare confusione...anche se avrei certamente preferito il tentativo di arrivare ad un suono surround o almeno pseudo-surround visto che come scrivevo prima con le cuffie ci sono stati ottimi risultati in merito.

marco barsotti ha detto...

Durante il corso di Body Pump in palestra riflettevo su questa faccenda e penso di aver capito perche' tu percepisci il suono "3D",cosi' come funziona nella dimostrazione del video, ma il metodo non puo' funzionare nel caso generale.

Anche se non ho trovato spiegazioni della teoria dei filtri, questi non possono lavorare che mandando su uno dei canali un segnale modificato dell'altro, in modo da annullarne l'ascolto dall'orecchio "sbagliato" (mi pare le chiami "negative sound waves", dunque sfasate di 180 gradi).

Ora la cosa ha funzionato nel tuo caso, in quanto avendo ascoltato dagli altoparlantini del pc eri probabilmente molto vicino ad essi, tanto da annullare l'effetto delle onde riflesse.

E - ed e' questo che mi colpisce - funziona nel caso della dimostrazione del video (il tipo che riesce ad indicare dove sono le persone nell'altra sala) in quanto...si trova in una camera anecoica!

Nel mio caso, che e' poi il caso generale, la stanza di ascolto non puo' essere anecoica, e dunque le negative sound waves fanno a tempo a riflettersi qui e la, cambiando nuovamente di fase. E dando quel fastidioso senso di sfasamento che percepivo io.

E' un po come il mito delle tv 3D senza occhiali: possono funzionare solo se chi guarda e' in determinati punti, e non si muove. E questo sara' sempre vero con schermi LCD e plasma, indipendentemente da chi afferma che in futuro le cose potranno essere diverse.

In ogni caso questa e' la mia teoria, ho provato a scrivere a Giulio Cesare Ricci, vediamo se avra' il tempo di analizzare al cosa e darci un suo parere.

Ciao e grazie per gli interessantissimi articoli che pubblichi.