Keopz - La nouvelle plate-forme de la musique libre et gratuite
News / Actu Artistes Styles Concerts Interviews Dossiers Matériel Coups de Coeur Les plus écoutés Podcasts Objectifs Keopz

Les formats de compression audio

LE MP3

Un peu d'histoire...

Le MP3, qui est l'abréviation de MPEG 1/2 audio layer 3 est un algorithme de compression utilisé dans la compression des fichiers audio. D'une très grande popularité, il a été le premier qui a permis le transfert de fichiers audio sur internet. On retrouve les esquisses du MP3 en 1987, qui faisait partie d'un programme de recherche EUREKA, une initiative française destinée à améliorer la compétitivité industrielle européenne. Deux formats virent le jour nommés ASPEC et MUSICAM. Par la suite, le groupe PHILIPS associé à TDF et FhG, ainsi que l'institut Fraunhofer et Thomson firent évolué le format pour créer le format MP3, et c'est en 1995 que le groupe MPEG lança la norme MPEG-2.

L'encodage MP3

La compression audio en MP3 permet une compression variable en fonction du débit linéaire (bitrate en anglais). Plus le taux sera élevé (320 kbits/s), plus la qualité d'écoute sera proche du format non compressé communément appelée « qualité CD audio ». A l'inverse, plus le taux est petit (16 kbits/s), plus la qualité se détériore. On estime que la compression à 128 kbits/s représente un bon compromis entre qualité et compression. A ce taux de compression, un fichier audio ne prendra que douze fois moins d'espace disque que le fichier original non compressé. On comprend aisément le succès d'un tel format tant au niveau du stockage que du transfert (via la web spécialement).

La compression d'un fichier audio est une compression destructive comme d'autres formats de compression dont on parlera plus loin. La compression recalcule le spectre des fréquences et notamment les fréquences aigues, d'où la perte de qualité. Cette perte de fréquence sera d'autant plus audible sur notamment, la musique classique. Un fichier audio une fois compressé en MP3 ne pourra pas subir l'opération inverse, qui consisterait à revenir à un format audio sans perte (lossless) comme le WAV, l'AAC ou l'AIF. Elle est impossible dans le sens ou elle sera inefficace et ne restituera pas la qualité perdue lors de la compression.

La taille d'un fichier qui a subi une compression au format MP3 peut variée en utilisant le débit variable (VBR). Il consiste à encoder les échantillons comportant le moins d'informations comme les silences par exemple, à un taux plus faible. Donc, ne vous affolez si vous voyez un bitrate changeant tous les dixièmes de seconde dans votre lecteur, cela signifie simplement que le format est du MP3 VBR.

Métadonnées et ID3

Une autre particularité du MP3 est sa capacité à contenir des informations autres que la musique. Ces données ou plus couramment appelées métadonnées (metadata), sont enregistrées au format ID3. Elles permettent de contenir des informations comme le nom de l'artiste, le titre, l'auteur-compositeur et bien plus encore. Ces informations étaient limitées en taille dans la version 1 qui ne supportait que 128 octets mais avec la version 2, cet espace n'est plus limité et permet de stocker tout type d'information, même des images (pochette d'album).

Exemple d'informations que peuvent contenir les métadonnées (ID3) :

Edition ID3 d'un fichier MP3

Ayant de plus en plus de détracteurs au profit d'autres technologies de compression, on retiendra cependant la très grande compatibilité de ce format notamment sur le matériel hifi, les baladeurs numériques et les lecteurs DVD de salon.

LES AUTRES FORMATS DESTRUCTIFS OU "LOSSY"

WMA (Windows Media Audio)

Windows Media Audio

Comme son nom le laisse deviner, ce format a été crée par Microsoft et a été lancé en 1999. Cette initiative est une tentative pour concurrencer le MP3 qui connaît alors un succès grandissant. Tout comme le format MP3, le WMA est une compression destructive en ce sens qu'elle entraîne une perte de l'information. Le calcul de compression est supposé restituer de meilleure façon la qualité du son que le MP3 pour un débit linéaire (bitrate) équivalent. La perte d'information due à la compression est mieux gérée car l'algorithme utilisé est conçu pour respecter au mieux les fréquences entendues par l'oreille humaine. Microsoft assure qu'un morceau de musique compressé et encodé au format WMA à 192 kbits/s ne peut pas se distinguer du format numérisé non compressé (wav). Si l'on estime que la qualité d'un fichier mp3 encodé à 128 kbits/s est équivalente à la qualité d'un WMA encodé à 96 kbits/s, on obtient donc un gain de place (espace disque) de 25%.

On trouvera le WMA sous 2 formats ; le Standard et le Pro. Le premier est de loin le plus répandu est possède l'avantage d'être compatible avec un bon nombre de baladeurs numériques. Le format Pro est très peu courant mais prétend à une qualité encore au-dessus du format standard. L'encodage en WMA possède tout comme le mp3 la capacité à encoder en débit variable (VBR). A noter que le bitrate sera exprimé en pourcentage théorique (10, 50, 90, etc.), et que 100 représente la qualité sonore du fichier non compressé. Pour information, VBR 98 correspond à un débit linéaire de 320 kbits/s et VBR 50 correspond à un débit linéaire de 72 kbits/s.

Le format WMA est un format gratuit et sa diffusion est facilitée par le codec (codeur/décodeur) intégré au Media Player de Windows. D'autres lecteurs sont aussi compatibles avec le format WMA comme Winamp, Sonique et bien d'autres encore. De nombreux appareils hifi intègrent également la lecture de ce format (baladeurs numériques, platines, etc.) ce qui en fait un format d'une bonne compatibilité.

L'autre particularité du WMA qui est une raison pour laquelle il est utilisé dans la distribution numérique commerciale réside en sa gestion du DRM (Digital Right Management) qui permet de contrôler et de limiter l'utilisation du fichier dans la durée et d'en limiter la copie.

LE MP3 PRO

MP3 Pro

Le format MP3 qui date de 1990 a du faire face à la concurrence et s'adapter aux formats plus récents comme le WMA qui a vu le jour 10 ans après. C'est pour ça qu'en 2001, Thomson Multimédia lance le MP3 Pro pour concurrencer le WMA. Son avantage: C'est la taille qui est réduite de moitié par rapport au mp3. On estime qu'un fichier encodé en MP3 Pro à 64kbit/s est équivalent au niveau de la qualité du son qu'un même fichier encodé en mp3 à 128 kbits/s. Deux minutes de musique compressée en MP3 Pro ne prendront qu'un méga Octet (1 MO) d'espace disque. Son inconvénient : Même si le format MP3 Pro peut être lu par pratiquement tous les lecteurs, l'encodage en MP3 Pro qui permet le gain de place n'est pas gratuit et nécessite un codec payant.

AAC (Advanced Audio Coding)

AAC

Le Format Advanced Audio Coding ou AAC, crée par Fraunhofer en collaboration avec Sony et Dolby s'appuie sur le format MPEG-2 avec un amélioration considérable et baptisé MPEG-4. Technologie toujours destructrice qui se base sur un encodage modulaire, elle offre cependant un bon compromis entre la taille et la qualité. On estime que pour un fichier compressé, la qualité du CD Audio est obtenu à seulement 96 kbits/s en débit, ce qui réduit considérablement la taille du fichier. Autre particularité du Format AAC est la fonction « Gapless », qui permet ne plus avoir de coupure entre 2 morceaux. Chose qui n'était pas possible avec le mp3. Compatible avec beaucoup de lecteurs comme Winamp et Windows Media Player (qui nécessiteront un plugin tout de même), il le sera aussi avec iTunes car Apple en a fait son format de prédilection et l'utilise pour distribuer la musique numérique car la gestion des DRM est également prise en charge. La compatibilité est donc aussi assurée pour les baladeurs numériques iPod.

OGG VORBIS

OGG Vorbis

Fruit d'une technologie sensiblement différente du MP3, WMA et autres formats de compression avec perte d'information, le format Ogg Vorbis permet un rapport qualité sonore/compression assez comparable au format WMA, à savoir qu'on atteint le qualité CD audio pour une compression à 128 kbits/s, mais le dépasse au niveau qualité surtout dans les fréquences aigues. Sa particularité se trouve surtout dans le fait que le format Ogg Vorbis s'inscrit dans le cadre du mouvement du logiciel libre. En effet, la fondation Xiph.org voulait créer un format libre de tout brevet, ce qui n'est pas le cas des autres formats de compression. L'Ogg Vorbis est donc un format ouvert dont les codes sources sont accessibles à tous, et peut donc être modifié et utilisé librement. Cette particularité en fait un format en évolution permanente car toute une communauté de programmeurs peut donc apporter sa contribution au développement du logiciel.

Le seul inconvénient majeur du format Ogg Vorbis est sans doute sa compatibilité encore faible avec les produits du marché. De gros progrès ont déjà été faits car il n'y a pas si longtemps, le format Ogg Vorbis n'était lisible que par un ordinateur car le décodage, relativement complexe, ne pouvait pas être pris en charge par les unités possédant de trop faibles capacités de calcul (ex: baladeurs numériques). Mais depuis, des constructeurs comme Samsung et iRiver ont considérablement développé les performances de leurs produits et la compatibilité avec le format Ogg Vorbis est désormais assurée. Seul ombre au tableau qui empêche le développement et le succès que ce format mériterait d'avoir, est la non-prise en charge du format par les baladeurs numériques iPod de chez Apple.

Vous trouverez les lecteurs sous toutes les plates-formes, Windows, Mac, Linux et autres, ainsi que les codes sources ici http://www.vorbis.com/setup/

MPC (MUSEPACK)

MusePack MPC

Egalement appelé MP+, le format MPC qui fait aussi partie des formats destructifs, est basé sur le format MPEG-2. De plus en plus répandu, il offre une grande qualité sonore bien supérieure au MP3 ou à l'Ogg, et possède aussi, comme le format AAC, le « GapLess », qui permet de ne pas faire de coupure entre 2 morceaux. L'utilisation de ce format est à conseiller pour une compression a fort bitrate (à partir de 170 kbits/s ) et n'est pas adaptée pour un bitrate plus faible. Le bitrate est variable et se définit par les modes standard, extrême, insane et braindead qui correspondent respectivement à un bitrate de 170, 200, 240 et 260 kbits/s. L'encodage à 170 kbits/s représente un bon compromis avec une très bonne qualité d'écoute. La transparence absolue qui permet de ne plus distinguer le fichier compressé en MPC du fichier non compressé s'obtientra à partir de 240 kbits/s. Ce choix est à faire dans le cas où la réduction de taille n'est pas une priorité. Pour la lecture, Winamp s'en chargera très bien après l'installation du plugin MPC que vous pouvez télécharger ici. Sinon, choisissez Foobar 2000, qui est un logiciel très adapté au format MPC et ne nécessite aucun plugin.

Pour résumer les caractéristiques du format MPC, on notera la grande qualité d'écoute pour ceux qui veulent privilégier la qualité à la taille, sa fonction Gapless et son utilisation gratuite. On regrettera par contre sa très faible compatibilité avec les appareils hifi et baladeurs numériques.

LES AUTRES FORMATS NON DESTRUCTIFS OU SANS PERTE (LOSSLESS)

Qu'est ce qu'un format "Lossless" ?

Pour les puristes du son, compresser un fichier audio dans un format destructif (lossy) est un inconvénient majeur. Seul problème, stocker sa musique en format qualité CD audio de type .wav prend une place considérable en espace disque. Une solution consiste à utiliser des formats sans perte dits "lossless" qui n'altèrent pas la qualité car aucune modification du spectre des fréquences n'est appliquée. La compression lossless à travers les différents formats que nous allons vous présenter, consiste à pouvoir retrouver le fichier original suite à une décompression d'un format lossless, chose qui n'est évidemment pas possible avec les formats avec perte. La taille d'un fichier compressé dans un format lossless sera bien entendu plus grande qu'avec une compression destructive mais gagner de l'espace disque, tout en conservant la qualité sonore de sa musique peut s'avérer très pratique.

TTA ( True Audio Encoder )

TTA

Résultant d'un développement d'un format de compression de données mené par A. Djourik et P. Zhilin, le format TTA voit le jour en 2000 mais devra attendre 2004 pour être opérationnel. C'est une compression audio lossless qui encode en mode multicanal de 8 à 32 bits qui ne propose qu'un seul mode d'encodage. A la manière du format Ogg Vorbis, le TTA est également en Open Source ce qui signifie que les codes sources sont libres d'accès, de modification et d'utilisation. Le taux de compression obtenu, qui reste du coup le seul critère de qualité car le son n'est pas modifié, varie entre 25 et 30% du fichier original, ce qui n'en fait pas un outil des plus efficaces pour le gain de d'espace disque.

Les fichiers TTA pourront être lus à l'aide de plugins avec les logiciels Winamp, Foobar 2000 et d'autres encore. L'encodage au format TTA quant à lui, pourra se faire avec TAU Producer, téléchargeable sur le site de true-audio.com, ainsi qu'avec EAC.

WAVPACK (WP)

WavPack

Le format WavPack, développement que l'on doit à David Bryant durant l'année 1998 a connu un bon nombre d'améliorations depuis la version 1.0 jusqu'à la version 4.x qui est la plus récente. Beaucoup de fonctionnalités y ont été ajoutées car longtemps mis de coté par les utilisateurs à cause de la lenteur du logiciel et de l'ergonomie. Une particularité est apparue lors de la version 3: le mode « hybride », qui se traduit par une compression sans perte qui est combinée avec une compression destructive (lossy). Cette dernière accompagne le premier fichier lossless, et comporte les corrections et modifications qui permettront une restitution parfaite du signal d'origine. Cette fonctionnalité qui reste optionnelle pour l'utilisateur sera choisie quand la qualité du son reste la priorité, et pourra être désactivée si l'on recherche plus un gain d'espace et de ressources. A noter que ce fichier de correction nécessite peu d'espace disque et pourra donc être ajouter au fichier compressé sans augmentation significative de sa taille (entre 1 et 2 %). Ce mode de compression représente un avantage intéressant du format wavpack.

Le mode lossless peut également être utilisé avec un compromis qualité / taille assez compétitif car on obtiendra généralement un gain d'espace de 50%, voire près de 75% dans certains cas. Quant au mode lossy (avec perte), il s'avérera un bon choix pour un débit linéaire d'au moins 200 kbits/s et rivalisera aisément avec un fichier MP3 encodé en 320 kbits/s. La technologie de compression wavpack s'appuie sur une approche différente de l'encodage des formats MP3, Ogg ou AAC car elle utilise une modulation différentielle d'impulsion-code adaptatif dite ADPCM.

A noter aussi que le format wavpack est un format libre. Son code est accessible à tous car Open-Source également.

MONKEY'S AUDIO (APE / MAC)

Monkey''s Audio

Sans cesse en amélioration depuis son premier lancement en 2000, le format Monkey's Audio (MAC) est aujourd'hui un format très performant car sa technologie a su combiner les avantages des formats destructifs au niveau de la taille des fichiers et ceux de la compression sans perte qui elle, préserve la qualité du son intacte. Les améliorations ont en autres, contribué à rendre le format Monkey's Audio multi plate-forme, ce qui n'était pas le cas au début car ce format avait été conçu uniquement pour Windows.

Le format Monkey's Audio arrive en tête au niveau des performances, tant au niveau du gain d'espace, qu'au niveau de la rapidité d'encodage. On trouvera 5 modes de compression qui agiront surtout sur la vitesse d'encodage car rappelons qu'il s'agit d'un format lossless. Le mode "normal" représente un très bon compromis entre rapidité d'encodage et compression.

La lecture pour s'effectuer avec Winamp par l'intermédiaire d'un plugin. Kéopz vous conseille Foobar 2000 qui lui, lira vos fichiers monkey's audio directement. L'encodage de vos CD Audio en format Monkey's Audio pourra être réaliser avec EAC (Exact Audio Copy). On regrettera qu'il n'existe encore aucun support hifi. L'autre inconvénient de ce format qui a considérablement ralenti son expansion est le fait qu'il ne soit pas libre.

FLAC (Free Lossless Audio Codec)

FLAC

Le format FLAC, développé par Josh Coalson sorti en 2000, est le format audio lossless le plus répandu, surtout sur les plates-formes Windows. Il est néanmoins compatible sur les plates-formes MacOSX et Linux. Même si l'on estime que la compression au format FLAC est moins performante que celle de Monkey's Audio, le format FLAC possède des avantages qui en font un format attractif.

Tout d'abord, une compatibilité présente en hardware et en hifi, notamment chez Kenwood avec quelques modèles de platines (MusicReg) qui lisent le format FLAC. La décompression se faisant par blocs, une fonction de streaming est également possible avec ce format, ce qui le rend utilisable sur Internet à condition d'avoir une connexion le permettant au niveau du débit. Les métadonnées sont gérées grâce au logiciel d'édition des métadonnées : METAFLAC. Vous pourrez donc gérer vos tags à la manière d'un fichier MP3. Grande rapidité dans la vitesse de décodage, beaucoup moins performant à l'encodage par contre (loin derrière Monkey's Audio). En 2003, FLAC rejoint le groupe Xiph.org, développeur d'Ogg Vorbis, car comme ce dernier, FLAC est un format en Open Source, libre d'utilisation et de modification ce qui conduit à beaucoup de développements par la communauté des programmeurs.

Au niveau du gain d'espace disque, on obtiendra des performances bien en dessous de ce que Monkey's Audio ou Wavpack peut faire, mais les autres avantages cités plus haut en font quand même un format de qualité qu'on ne peut que vous conseiller. Quant à la lecture, ce format étant très répandu, tous les lecteurs comme Winamp, Windows Média Player, ou Foobar le liront sans problème avec un plugin si nécessaire. Utiliser EAC une fois encore, pour l'encodage et pour ripper vos CD Audio.

Vous trouverez les codes-sources sur toutes les plates-formes ici : http://flac.sourceforge.net/

LA (Lossless Audio)

Ce format de compression spécialisé pour la musique, crée par Michael Bevin a vu le jour en 2002. Incontestablement, c'est avec lui que l'on peut obtenir le meilleur gain de place pour une qualité toujours sans perte. Ce point fort entraîne aussi ce qui est son point faible, la ressource processeur. En effet, pour la lecture du format LA, la charge CPU de votre ordinateur sollicitée sera d'environ 10 fois supérieure à la lecture d'un autre format lossless. La vitesse d'encodage/décodage auparavant assez lente est désormais correcte vu les nombreuses améliorations qu'a connues ce format. Gratuit d'utilisation, le format LA n'est cependant pas en Open Source. Pour la lecture, après l'installation des plugins nécessaires, le format LA pourra être lu avec Winamp, Windows Média Player et Foobar.

Vous trouverez les codecs et d'autres informations sur le site officiel : http://www.lossless-audio.com/

OptimFROG (OFR)

Le format OptimFROG est relativement plus ancien que les autres formats Lossless car il est paru pour la première fois en 1996. Développé par Florin Ghido, le format OFR utilisa une technologie différente basée sur la dé-corrélation stéréo. Avec la compression OFR, on obtient un gain d'espace disque d'environ 50% par rapport au fichier original, qui le place en bonne position parmi les formats lossless.

En juin 2003, un mode DualStream est ajouté à la compression OFR à la manière du format Wavpack et son mode Hybride, qui consiste en la présence d'un second fichier qui contient les modifications apportées à un fichier compressé en mode « lossy ». Ce mode permet de réduire considérablement la taille d'un fichier compressé en lossless.

Autre particularité, ce format est lisible en streaming et gère les métadonnées (tags ID3 v.1, ID3 v.2, et APE v.2). Coté ergonomie, on regrettera que l'encodage ne possède pas d'interface graphique par défaut, qui rend l'utilisation de ce format assez délicat pour les novices en informatique. Cependant, pour palier à cet inconvénient, on pourra toujours utiliser ce format via l'interface graphique d'autres logiciels comme Kermit. (http://members.home.nl/w.speek/kermit.htm).

Vous trouverez sur le site officiel (http://losslessaudio.org) les plugins requis pour pouvoir lire les fichiers OptimFROG avec vos lecteurs.

SHORTEN (SHN)

FLAC

Encore plus ancien que le format OFR car son développement remonte en 1993, le format lossless Shorten (SHN), dont la version de base a été développé par Tony Robinson, est un des plus rapides pour l'encodage / décodage, dû à sa faible complexité de calcul de compression. Cependant, on ne retiendra pas ce format dans la catégorie des formats sans perte les plus performants, car son plus gros défaut tient à une très faible réduction du fichier original. On notera les 2 modes possibles du format Shorten, à savoir avec ou sans perte.

Vous pourrez lire vos fichiers SHN avec Winamp, Foobar et bien d'autres lecteurs avec les plugins requis. Vous trouverez des informations sur le site officiel de softsound : http://www.softsound.com/shorten.html

Conclusion

Nous avons volontairement exclus les formats tels que BONK, LPAC (Lossless Predictive Audio Compression) et RKAU (RK Audio), qui n'ont pas connu assez de développement et ne sont d'actualité comparés aux autres formats lossless.




Par Marco, le 20/06/2006


Pop-Rock


David Law N'The Arkitekts - Les Parfums Du Silence



David Law N'The Arkitekts - Les Parfums Du Silence

David Law n'The Arkitekts est un trio Indépendant Rock Pop fondé pour le meilleur en Novembre 2003, qui réunit David Law (guitare/chant) - à Vortex (batterie), plus de 10...

Ecouter / Télécharger

World / Reggae


Inna Crisis - The Time Is Now



Inna Crisis - The Time Is Now

"The time is now" Premier album du groupe! 14 titres à découvrir dont 2 en téléchargement. Enregistré au BBM Studio de Lausanne par Totor, et mixé par...

Ecouter / Télécharger




Diffusez votre musique sur Keopz

News / Actu Artistes Styles Concerts Interviews Dossiers Matériel Coups de Coeur Les plus écoutés Podcasts Annuaire Objectifs Keopz RSS de l'actu de la musique libre