
En coulisse
Le son 8-bits : quésaco ?
par David Lee
En ce qui concerne la qualité du MP3, c’est surtout le débit binaire qui compte, mais pas seulement. Le logiciel utilisé joue également un rôle. Et celui-ci s’est amélioré au fil du temps. J’ai essayé des encodeurs du millénaire dernier et je les ai comparés aux modèles actuels.
Beaucoup de gens se forgent une opinion sur un thème une fois pour toutes et n’en changent plus jamais. Par exemple : si vous ne pouvez pas distinguer le MP3 de la musique non compressée, vous avez des problèmes d’audition.
Exprimé de manière aussi générale, c’est certainement faux. Tous les MP3 ne se valent pas. Cela dépend en premier lieu du débit binaire utilisé. Au niveau de qualité le plus élevé de 320 kilobits par seconde (kbit/s), le MP3 est considéré comme transparent. Cela signifie qu’aucune différence n’est audible par rapport à l’original non compressé. On le sait depuis de nombreuses années, voire des décennies, grâce à des études en aveugle. Il est même amusant de constater que c’est l’inverse : seules les personnes souffrant d’une déficience auditive peuvent entendre une différence dans la qualité la plus élevée du MP3.
D’où vient donc l’opinion selon laquelle le MP3 provoque généralement le cancer de l’oreille ? Je suppose qu’elle date du dernier millénaire. Je me souviens que mes premières expériences avec le MP3 étaient négatives. Cela était probablement dû en grande partie aux faibles débits binaires qui étaient courants à l’époque. 128 kbit/s, c’était le maximum, et c’est déjà un niveau critique. Tout ce qui se trouve en dessous de ce seuil a un son nettement différent de celui de la musique non comprimée.
Ce qui est intéressant, c’est qu’il y avait aussi des MP3 à 128 kbit/s dont le son était clairement mauvais. Cela pourrait s’expliquer par le fait que les encodeurs MP3 étaient autrefois moins performants et ont ainsi scellé la mauvaise réputation du MP3.
Pour savoir si mon hypothèse est correcte, je veux créer le même MP3 avec un ancien et un nouvel encodeur, puis comparer. Pour le nouvel encodeur, j’utilise une version actuelle de LAME, qui est depuis longtemps la norme et considérée comme étant de haute qualité.
Pour les anciens encodeurs, je dois voir ce que je peux faire fonctionner. J’ai un Mac et Apple ne croit pas beaucoup à la rétrocompatibilité. Après plusieurs installations de logiciels qui ont échoué, je sors mon ancien Powerbook de 2002 de la cave pour créer des fichiers MP3 avec iTunes. Cela prend énormément de temps avec cet appareil.
Pour les fichiers créés par iTunes, une voix féminine se fait entendre au début de chaque morceau, disant : « Encoded by N2MP3. » C’est apparemment l’encodeur utilisé par mon ancien iTunes.
Mais 2002 est apparemment déjà trop moderne, je n’entends en tout cas pas de différence de qualité évidente avec l’encodeur actuel. Ceci à 128 kbit/s. Je ne peux pas choisir une qualité inférieure.
Je me tourne maintenant vers les logiciels Windows. Après tout, Windows fonctionne aussi sur mon Mac M1. Je découvre rapidement un candidat intéressant pour mon expérience : AudioCatalyst 2.1. Cet extracteur de CD date de 1999, mais il fonctionne toujours sous Windows 11. Il utilise l’encodeur MP3 Xing qui convient parfaitement pour mon projet. Car Xing a la réputation (en allemand) d’être très rapide, mais aussi qualitativement insatisfaisant.
La différence dépend aussi du morceau de musique. J’entends le mieux les pertes de qualité dans les hautes fréquences de la batterie ou des percussions. Ou en cas de grandes différences de volume au sein du morceau. Pour cet essai, j’utilise cinq morceaux qui couvrent les styles pop, rock, funk, jazz et classique.
À ma grande surprise, Xing génère des fichiers MP3 tout à fait décents à 128 kbit/s. Je ne peux pas les distinguer de manière fiable des fichiers produits par LAME. Pour le rock et le funk, je tape juste en aveugle, pour le classique, je me trompe et pour le jazz, je n’entends tout simplement aucune différence.
Je réduis donc la qualité à 64 kbit/s. L’écoute des MP3 de cette qualité n’est agréable à personne, quel que soit le logiciel utilisé pour les produire. Mais au moins, je devrais être en mesure d’entendre les différences entre les encodeurs. En fait, je peux clairement les identifier : les fichiers de l’encodeur Xing ont toujours un son étouffé. Xing coupe simplement les hautes fréquences à 64 kbit/s pour économiser des données. L’encodeur actuel contient également de hautes fréquences. Mais le son n’est pas meilleur dans tous les cas. En effet, il doit économiser les données ailleurs pour atteindre le débit binaire extrêmement bas. En conséquence, les artefacts typiques du MP3 sont plus audibles.
Les différences sont si nettes que je peux même vous les démontrer dans une vidéo YouTube, bien que YouTube compresse également le son une nouvelle fois. Les artefacts sont particulièrement flagrants dans un MP3 que j’ai créé en l’exportant depuis le logiciel GarageBand.
Je peux donc retenir ceci : même avec le même débit binaire et le même fichier original, tous les MP3 ne sont pas les mêmes. Tout dépend de l’encodeur. Mais cela ne devient vraiment audible qu’à des débits binaires très bas.
Mais cela ne répond pas à la question initiale : pourquoi le son des anciens MP3 était-il aussi pauvre ? J’ai ici quelques vieux morceaux du groupe U2 provenant de « canaux de distribution non officiels », encodés à 128 kbit/s. Pour des raisons de droits d’auteur, je ne peux pas vous les montrer, mais je jure sur ma cochlée que leur son est très mauvais. Avec quel encodeur ont-ils été créés ?
L’outil en ligne de commande mp3guessenc analyse les fichiers MP3 pour le savoir. Je ne sais pas si c’est fiable, mais je vais l’essayer.
Pour les morceaux de U2 en question, mp3guessenc indique « Xing (old) » comme encodeur. Par contre, pour les fichiers que j’ai créés avec AudioCatlyst 2.1, mp3guessenc signale « Xing (new) ».
1999 est en fait déjà nouveau pour Xing. Le logiciel a été développé à partir de 1995 et vendu à RealNetworks en 1999. Il n’y a qu’une chose à faire : j’ai besoin d’un encodeur encore plus ancien pour mes recherches.
Je télécharge donc l’encodeur Xing 3.0 de 1997. Il s’agit d’un petit outil en ligne de commande de 83 Ko pour Windows. Et là, on peut effectivement entendre de nettes différences, notamment dans le morceau pop Look at This. Le son de la batterie est plus sourd sur l’ensemble du morceau que dans un MP3 avec un encodeur moderne. De plus, il manque de dynamique et, plus grave encore, il y a même parfois de petites coupures.
Un MP3 avec le même débit binaire résonnera différemment selon l’encodeur utilisé pour le créer. Avec un débit binaire de 128 kbit/s, je dois toutefois remonter jusqu’en 1997 pour trouver un encodeur dont les fichiers sont clairement moins bons. Pour les encodeurs testés datant de 1999 et 2002, les différences sont déjà si minimes que je ne peux pas les identifier clairement lors d’un test à l’aveugle. En général, les différences sont bien audibles à 64 kbit/s, mais cela ne joue aucun rôle dans la pratique, car personne n’écoute dans une qualité aussi médiocre.
Le choix de l’encodeur a probablement joué un rôle au début de l’ère MP3. Il existe toutefois toute une série d’autres explications possibles pour la qualité parfois inférieure des MP3 issus des bourses d’échange. Les débits binaires étaient généralement plus faibles qu’aujourd’hui. Les MP3 n’ont pas non plus toujours été créés à partir de CD originaux. J’ai moi-même gravé des CD à partir de fichiers MP3. Si on extrait ces derniers à nouveau, un fichier déjà compressé est à nouveau compressé. Il en va de même pour la musique enregistrée à partir de stations de radio Internet.
Même après cet essai, je reste persuadé que le MP3 doit sa mauvaise réputation à ses débuts. Les encodeurs n’étaient certainement pas le problème.
Mon intéret pour l'informatique et l'écriture m'a mené relativement tôt (2000) au journalisme technique. Comment utiliser la technologie sans se faire soi-même utiliser m'intéresse. Dans mon temps libre, j'aime faire de la musique où je compense mon talent moyen avec une passion immense.