AAC: il successore dell’MP3 stenta a decollare

Pubblichiamo un guest post di Raffaele Fanizzi

E’ fuor di dubbio che il formato MP3 abbia portato forti innovazioni nel mondo dell’audio digitale, non tanto in termini algoritmici, visto che gli studi alla sua base erano noti e già disponibili in forma meno raffinata nel meno conosciuto formato MP2, ma soprattutto per il cambiamento commerciale e sociale che ha comportato, la cui genesi è stata descritta in un precedente intervento.

Alla pari di qualsiasi algoritmo esistente nei nostri computer, anche l’Mpeg 1 Layer 3 ha i suoi limiti e, esattamente come per tutto ciò che concerne l’informatica (CPU, schede video, sistemi operativi, applicazioni, ecc…), esistono dei presunti “successori” che irrompono prepotentemente con la promessa di superarli.

Il successore designato dell’MP3, battezzato senza troppa fantasia Advanced Audio Coding (AAC), è stato sviluppato da un consorzio di aziende tra le quali figurano l’onnipresente (quando si parla di compressione audio) Fraunhofer IIS, Sony , AT&T Bell, Dolby Laboratories e Nokia.

Il suo sviluppo è immediatamente successivo a quello dell’MP3 e nel 1997 viene dichiarato standard internazionale dal Moving Pictures Experts Group. In particolare l’AAC è stato incluso nella sua prima incarnazione nello standard MPEG-2 come Part 7 (ogni standard MPEG è suddiviso in più sezioni), mentre un suo aggiornamento è stato inserito nello standard MPEG-4 Part 3.

Come anticipato, l’obiettivo dichiarato dell’AAC è quello di succedere all’MP3 proponendo una qualità superiore a parità di bitrate e, auspicabilmente, la medesima qualità ad un bitrate inferiore. Parlo di auspicio perché nel campo della compressione audio l’incremento della qualità non è lineare con quello del bitrate e, pertanto, non si può parlare di conseguenze automatiche. In aggiunta al miglioramento qualitativo l’AAC vuole anche imporsi come standard di riferimento per lo streaming audio e per la codifica audio multi-canale.

Per raggiungere il suo scopo l’Advanced Audio Coding abbatte molte delle limitazioni “di forma” del suo predecessore. Innanzitutto il bitrate massimo passa da 320 kbit/s a 512 kbit/s, mentre la frequenza di campionamento massima supportata arriva a ben 96 kHz, contro i 48 kHz dell’MP3. Inoltre l’AAC consente di immagazzinare ben 48 canali per l’intero spettro di banda (fino a 96 kHz), 16 LFE (low frequency effects, fino a 120 Hz) e 16 generici data streams. A confronto l’MP3 arriva ad una massimo di due canali nella sua specifica MPEG-1.

Come l’MP3, l’Advanced Audio Coding si basa su un modello psicoacustico per quantizzare il suono e decidere quali informazioni tagliare e quali conservare. Notevoli, tuttavia, sono le migliorie apportate nell’implementazione dell’algoritmo. Senza entrare eccessivamente nel dettaglio, vi basti sapere che nella conversione del segnale audio dal dominio del tempo a quello delle frequenze, l’MP3 utilizza un banco dei filtri polifasico necessario per mantenere la retrocompatibilità con lo standard MP2. Questa soluzione denominata “Hybrid Filter Bank” introduce imprecisioni non eliminabili nelle fasi successive dell’elaborazione. L’AAC, invece, rompe la retrocompatibilità utilizzando la più semplice ed efficace Trasformata Coseno Discreta Modificata (MDTC).

Un’ulteriore differenza nell’implementazione algoritmica tra MP3 e AAC è nella dimensione dei blocchi di campionamento: in presenza di un segnale stazionario, cioè di un flusso audio che non varia eccessivamente nel tempo, l’AAC prende in considerazione blocchi da 1024 campioni, contro i 576 campioni dell’MP3, il che gli consente di rappresentare questo genere di segnale audio con maggiore efficienza, cioè minore quantità di informazione. Inoltre, in caso di un segnale audio transiente, cioè che varia nel tempo in modo non prevedibile, l’AAC è in grado di spezzare il blocco da 1024 campioni in 8 blocchi da 128 campioni, raggiungendo una granularità descrittiva decisamente superiore all’MP3 che, invece, non può scendere sotto i 192 campioni.

Concludiamo questa piccola disquisizione tecnica citando altre due interessanti miglioramenti introdotti nella specifica MPEG-4 Part 3 dell’AAC, denominato High Efficiency AAC (HE-AAC). Parliamo del Spectral Band Replication (SPR) e del Parametric Stereo. L’obiettivo del primo è di riutilizzare le informazioni relative alle armoniche di un flusso audio presenti alle frequenze medio-basse, per descrivere anche le frequenze più alte. Il secondo, invece, esegue il downmix di un segnale audio stereo a mono conservando alcune informazioni aggiuntive che descrivono le differenze di intensità del segnale tra i due canali. Ciò consente di sfruttare il bitrate a disposizione per comprimere con una qualità maggiore il segnale audio derivato in quanto non bisognerà più rappresentarne entrambi i canali, ma solo uno. Entrambe queste tecniche sono rivolte all’ottimizzazione della qualità audio nei casi in cui il bitrate a disposizione è molto basso (16 – 32 kbit/s).

Naturalmente, con tutte queste innovazioni che promettono una qualità superiore all’MP3, ci si sarebbe aspettata una diffusione a macchia d’olio dell’AAC ed invece è sufficiente andare su Amazon per rendersi conto che uno dei più importati siti di e-commerce al mondo vende la musica in formato MP3 a 256 kbit/s. L’unica azienda che ha puntato sull’AAC fin da subito con convinzione è Apple attraverso il suo Apple Store ed i suoi iPod/iPhone. Anche se personalmente non penso che sia lo stesso caso, per un attimo mi è tornata in mente l’antica guerra Betamax vs VHS: il migliore tecnicamente non sempre vince nel mondo commerciale.

A mio avviso esistono differenti spiegazioni a questo fenomeno. L’MP3 sicuramente beneficia dell’effetto novità che gli ha dato un forte impulso iniziale e che ha fatto avvicinare ai PC tante persone fino ad allora poco interessate a mouse e tastiere. Conseguenza di ciò è che ormai si è diffusa l’uguaglianza MP3 = musica e probabilmente non è così semplice far passare lo stesso concetto anche per l’AAC, che tra l’altro è non poco confuso in termini di estensioni dei file visto che se ne possono trovare mp4, m4a, m4v, ecc…

Probabilmente non ha giocato a favore dell’AAC neanche l’associazione, ormai decaduta, con il DRM, voluta a suo tempo sempre da Apple, così come la mancata retrocompatibilità con gli MP3 che obbliga a chi vuole usare il nuovo formato a cambiare il proprio lettore MP3… ops volevo dire il proprio lettore audio portatile.

Press ESC to close