Le vere misure del digitale | prima parte

09.12.2011

Nell'era digitale tutto è scienza dei numeri.

Tutti hanno sentito parlare di bit e delle elaborazioni matematiche alla base dei nostri giocattoli preferiti: cellulari, computer, TV digitali, riproduttori portatili...

Tutto, almeno sul piano commerciale, cominciò qualche anno fa, più precisamente nell'agosto del 1982. In quel fatidico mese nasceva infatti il Compact Disc, ufficialmente da una joint venture tra Philips e Sony, dopo l'abbandono per "divergenze di interessi" da parte del primo partner di Philips, la DuPont.

Il CD divenne possibile grazie a molte diverse conquiste tecnologiche, alcune risalenti addirittura agli anni ‘60, ma soprattutto grazie alle tecniche di campionamento e digitalizzazione.

Una registrazione analogica consiste semplicemente nella rilevazione di un segnale che varia in analogia a un parametro fisico. Ciò che il nostro sistema orecchio-cervello riconosce come musica corrisponde in fisica a onde meccaniche di compressione e decompressione dell'aria. Quando tutto questo avviene spostando un diaframma collegato a un sistema che converte il movimento in segnali elettrici, disponiamo di un microfono. Analogamente lo è anche un altoparlante, che, al contrario, traduce un segnale elettrico nel movimento di un diaframma che torna a produrre onde meccaniche di compressione e decompressione dell'aria, cioè suoni.

La registrazione delle variazioni del segnale può essere analogica, come accade per i nastri magnetici o i solchi di un vinile. O può essere digitale. Il segnale analogico può essere soggetto a un campionamento: il segnale, che varia in modo continuo nel tempo, viene "campionato", se ne rileva cioè un campione a intervalli di tempo regolari, e questo lo trasforma in un segnale discreto, di cui viene registrata l'ampiezza, operazione complessiva definita "quantizzazione". I numeri che definiscono il segnale possono essere registrati grazie al sistema numerico binario, sistema molto più "conveniente" in informatica per rappresentare numeri rispetto al classico sistema numerico decimale. In elettronica è infinitamente più semplice realizzare elementi a due possibili stati (acceso/spento; +5 volt/0 volt), piuttosto che con dieci stati differenti, oltre che per la coincidenza con i valori logici di vero e falso.

Oltre alla frequenza di campionamento, che intuitivamente mostra una precisione proporzionale alla frequenza, dovremmo porre attenzione alla "precisione" dei campioni. Un bit è una cifra binaria, l’inglese binary digit, che definisce uno stato logico come vero/falso, e che può essere rappresentato da uno stato fisico, per esempio in un circuito. Se raccogliamo sequenze di bit, queste possono assumere valori in intervalli molto più vasti: così, un singolo campione con “profondità” di 1 bit può assumere solo il valore zero oppure quello di uno. Se la profondità è di 8 bit, cioé 28 = 256 possibili valori (da 0 a 255).

Nel 1958 si era esplorata la possibilità di memorizzare, tramite un fascio laser, dati analogici e digitali su supporti ottici.

Il LaserDisc, ad esempio, superò la fase di prototipo: consisteva in un supporto, grande come un disco in vinile, in cui potevano essere registrate tracce video analogiche e/o tracce audio analogiche, come quelle che si utilizzano nei televisori analogici, o tracce audio digitali. Ma c'era l'esigenza di mercato, non tecnica, di far nascere un nuovo supporto per la riproduzione del suono: affidabile, facile da trasportare, che non si rovinasse con l'uso, economico da produrre, idoneo alla riscossione di royalty e in forma protetta dalla copia. Gli LP, al tempo, si copiavano con le Compact Cassette, altra invenzione Philips.

Il primo problema con il quale si scontrarono Philips e Sony fu la dimensione del supporto, che non poteva essere più grande di una cassetta audio. I Walkman e l'ascolto in auto erano già diffusi, una tendenza poi esplosa tanto da far ritenere pressoché obsoleto l'ascolto casalingo. La tecnologia già prospettava sistemi portatili con CD. Nello stesso tempo alla scelta del digitale contribuì la necessità di garantire una qualità audio sufficientemente elevata, priva dei difetti del vinile: il nuovo supporto doveva risultare resistente ai graffi e insensibile alla polvere.

Gli studi pionieristici sul digitale furono condotti dalla Bell e riguardavano la intelligibilità dei suoni nel campo della telefonia. Si doveva garantire una comprensione accettabile della voce umana. L'applicazione di tecniche di registrazione digitale alla registrazione e alla riproduzione musicale portò a una sperimentazione per il calcolo della frequenza di campionamento e della profondità di bit "necessarie e sufficienti". E la verifica sperimentale mostrò che sarebbero bastati 16 bit di profondità e 44,1 Khz di frequenza di campionamento per poter riprodurre la musica in maniera “perfetta”.

Quando la Philips commercializzò il suo primo CD player, il mitico modello CD 101, avevo ventuno anni. Dopo averlo ascoltato rimasi pietrificato: il suono era incredibile, squillante e dettagliato, non c'era il rumore di fondo del vinile e nei silenzi mi sentivo solo... Ma qualcosa non riusciva a convincere la mia mente: il suono era strano, freddo, privo di coinvolgimento, a volte mi sembrava di ascoltare una scatoletta magica.

Nel 1986 mi regalarono la versione CD di The dark side of the moon dei Pink Floyd, una versione non in vendita, ad uso interno della casa discografica. Nel ricordo posso rivedere la scena: ho davanti a me un giradischi Thorens TD-160 MKII con la mitica Grado GT super, lettore CD Sony CDP-701 ES, pre-finale Luxman M-05/C-05, casse Bower & Wilkins 802. Con tutte le cautele del caso, magari mi trovavo di fronte ad una rimasterizzazione, tento un confronto vinile/CD. Inizio l'ascolto con il vinile: poco dopo il battito del cuore simulato sul disco c'è l'attacco strumentale e i piatti della batteria, ed è qui che parte il battito del mio cuore, un'emozione infinita... passo al CD, con stessi livelli sui VU meter, e via col battito sul disco... Non male, penso tra me e me… Inizio della parte strumentale e… disastro! Ecco i famigerati alti metallici e striduli, il coinvolgimento nullo e un fastidio così grande da dover spegnere l'impianto.

D'accordo: ci abbiamo messo anni e abbiamo imparato a costruire convertitori molto, molto migliori di quelli dei primi anni ‘80... Ma che cosa faceva sì che il suono "perfetto per sempre", lo slogan pubblicitario di quegli anni, non fosse altro che una ridicola bugia?

 

In elettronica il teorema Nyquist-Shannon è alla base della teoria dei segnali e mette in relazione il contenuto di un segnale campionato con la frequenza di campionamento, definendo così la minima frequenza necessaria per campionare un segnale analogico senza perdere informazioni.

In particolare, il teorema afferma che, date opportune ipotesi, in una conversione analogico-digitale la minima frequenza di campionamento necessaria per evitare ambiguità e perdita di informazione nella ricostruzione del segnale analogico originario, ovvero nella riconversione digitale-analogica, con larghezza di banda finita e nota, è pari al doppio della sua frequenza massima.

La frase che mi ha sempre lasciato un dubbio è “date opportune ipotesi“...

Mi sono chiesto a cosa specificatamente questa frase si riferisse e ho trovato la risposta cercando tra i miei vecchi appunti di elettronica. Il teorema Nyquist-Shannon è vero solo a patto che i segnali siano sinusoidali o riconducibili a un sistema di segnali sinusoidali complessi.

 

I sistemi di conversione Analogico-Digitale trasformano le informazioni analogiche in una sequenza di bit, per essere più precisi il sistema legge il valore di un segnale più volte nell'unità di tempo a intervalli predefiniti. Per fare un esempio si può immaginare una telecamera che registra un balletto. Le telecamere memorizzano le immagini come la sequenza di singoli fotogrammi. Se guardiamo la sequenza del balletto, fotogramma per fotogramma, ci accorgiamo che tra un'immagine e l'altra è passato del tempo e la posizione dei ballerini è cambiata. Se, ad esempio, vediamo nella prima immagine il braccio alzato del ballerino e nella seconda il braccio abbassato, immaginiamo il movimento. Ma se il ballerino, tra un'immagine e l'altra, saluta la sua fidanzata tra il pubblico, noi non possiamo rendercene conto, manca un'informazione. Questo perché tra un'immagine e l'altra passa del tempo in cui l'informazione non è registrata.

 

Le onde sonore pure (sinusoidi) si misurano in Hertz (Hz) è sono il numero di alternanza tra una spinta di pressione e un vuoto di pressione. A scuola spesso si metteva il righello sull'orlo del banco per poi farlo vibrare: il numero di alternanze al secondo risponde al nome di frequenza e viene misurata in Hertz (Hz).

Noi ufficialmente ascoltiamo con il nostro apparato uditivo frequenze che spaziano tra 20 Hz e 20.000 Hz, questa sensibilità però varia da persona a persona e in particolare varia con l'età.

Ma c'è un altro parametro che dovremmo prendere in considerazione ed è importante quanto le frequenze che udiamo. Questo parametro è la differenza temporale minima tra l'orecchio destro ed il sinistro che è di 20 microsecondi, 20 milionesimi di secondo: un parametro direttamente riconducibile con la localizzazione dei segnali.

 

Tutto ciò fino ad ora descritto è funzione della risposta in frequenza del nostro impianto musicale, ovvero di quanto il nostro sistema musicale è fedele nel riprodurre la moltitudine di onde che si accavallano durante l'ascolto della musica.

 

Orbene, i segnali musicali sono la somma di una moltitudine di segnali di vario genere (sinusoidi, impulsi ecc.) che si sommano o si sottraggono tra loro in un tempo definito. Provate a immaginare il mare e le onde che si propagano. Le onde sono una buona approssimazione dei segnali singoli sinusoidali a bassa frequenza. Ma se tra le onde passa un motoscafo questo crea una serie di onde più ravvicinate, per noi approssimabili a un segnale ad alta frequenza. A questo punto sull'acqua si creano delle nuove onde che sono la somma delle onde prodotte dal mare e dall'impatto del motoscafo con l'acqua.

Le onde saranno di due tipi diversi: quelle più lontane dal motoscafo saranno la somma delle sinusoidi dell'acqua del mare e del motoscafo; quelle più vicine avranno una componente in più, la cresta dovuta all'impatto della prua del motoscafo con l'acqua. Le creste saranno altissime, ripide e anche molto veloci.

I suoni che ascoltiamo sono anch'essi formati da più componenti. Nello specifico, il colpo di un martelletto su di un pianoforte, lo scorrere dell'archetto sul violino, la distorsione della chitarra elettrica, il colpo secco sul bordo della batteria o il clash dei piatti orchestrali che collidono, creano una parte iniziale del suono che ha ripidissime creste e in seguito un sommarsi di onde quasi sinusoidali. Il nostro orecchio percepisce le parti iniziali di questi suoni con particolare sensibilità e questa parte iniziale del suono viene chiamata “parte formantica”.

Questa è la parte più difficile da riprodurre con sistemi sia digitali che analogici ed è strettamente legata alla risposta in frequenza. Ma, mentre con i sistemi analogici è relativamente semplice riuscire a ottenere una risposta in frequenza più ampia (non è l'unico parametro ma è di sicuro il più importante), con i sistemi digitali la cosa si complica e riprodurre segnali complessi diventa impossibile, se non aumentando la quantità di informazioni disponibili per portarle al limite delle caratteristiche di udibilità.

 

Ecco come fare le misure:

 

Qui sotto, invece, quello in verde è l’impulso generato dal generatore di segnali, quello in giallo l’impulso generato dal DAC:

 

Di seguito le immagini lette con un oscilloscopio dei segnali all'uscita del generatore ed all'uscita del sistema AD-DA con conversione a 44.1 Khz e un segnale sinusoidale ad 1Khz a 0 dB. In verde le immagini del generatore di segnali ed in giallo l’uscita del convertitore:

 

Di seguito le immagini lette con un oscilloscopio dei segnali all'uscita del generatore ed all'uscita del sistema AD-DA con conversione a 44Khz e un segnale triangolare ad 1Khz con 600mV 0 dB:

 

Di seguito le immagini lette con un oscilloscopio dei segnali all'uscita del generatore ed all'uscita del sistema AD-DA con conversione a 44Khz e un segnale onda quadra ad 1Khz con 600mV 0 dB:

 

Normalmente tutto questo è già sufficiente per la maggior parte degli audiofili. Si può facilmente notare che i segnali sono molto simili, a parte una leggera ondulazione sull'onda quadra, che è comunque una distorsione dalla notevole influenza sul suono, anche se la differenza si sente solo su alcuni strumenti. Ma questo lo analizzeremo meglio in seguito.

 

Di seguito le immagini lette con un oscilloscopio dei segnali all'uscita del generatore ed all'uscita del sistema AD-DA con conversione a 44Khz e un segnale sinusoidale, ad onda quadra, a dente di sega e triangolare ad una frequenza di 20 Hz:

 

 

 

 

Le immagini parlano chiaro, sono pressoché perfette. Ogni singola onda viene riprodotta in modo corretto e preciso, nessuna esitazione e non ci sono neanche quelle orripilanti ondulazioni.

 

In realtà la verità è ben altra. Nelle immagini del prossimo articolo vedrete come il paradossale comportamento di un convertitore a 5.000 Hz, ovvero ancora nel pieno dell’udibilità...

 

Continua

Torna su

Pubblicità

KingSound banner
DiDiT banner
Vermöuth Audio banner
Omega Audio Concepts banner

Is this article available only in such a language?

Subscribe to our newsletter to receive more articles in your language!

 

Questo articolo esiste solo in questa lingua?

Iscriviti alla newsletter per ricevere gli articoli nella tua lingua!

 

Iscriviti ora!

Pubblicità