
En coulisse
Brève explication : 8bit vs. 10bit ou appareil photo système coûteux contre smartphone
par Manuel Wenk
La compression audio, MP3 par exemple, entraîne une perte de qualité. Mais l’entend-on? Où se situe la frontière entre ouïe fine et pures croyances? Pour tenter de lever le voile sur ce mystère, nous avons mené un blindtest auquel vous pouvez vous aussi participer.
La majeure partie de la musique que nous écoutons est comprimée, mais le traitement des signaux audio est difficile à comprendre si l’on ne travaille pas dans le domaine et ne détient pas une formation correspondante. J’ai d’ailleurs l’impression que la majeure partie des gens s’en fichent, ou alors ils diabolisent la technologie MP3 et tout ce qui a trait à la compression.
Nous privons-nous d’un vrai plaisir en écoutant uniquement de la musique sur Spotify ou YouTube? Remarque-t-on la différence par rapport à une musique de qualité exceptionnelle?
Il existe plusieurs manières de mesurer la qualité du son, mais à quoi font-elles référence exactement? J’ai tenté de vous en donner un aperçu aussi clair que possible.
1. Le bitrate
Le bitrate correspond au nombre de bits traités par seconde. On le nomme également «débit de transmission de données» ou «bande passante».
Évidemment, plus le nombre de données transmises est élevé, plus la qualité du son augmente. Le bitrate est l’unité de mesure la plus commune, mais elle fournit en elle-même peu d’informations sur la qualité du son.
Les bitrates peuvent être variables ou constants. À l’heure actuelle, on utilise généralement des bitrates variables (abrégés VBR). Dans les séquences plus «silencieuses», le son peut être comprimé davantage sans perte audible, alors que les séquences plus complexes nécessitent l’enregistrement d’un plus grand volume de données. Résultat: une meilleure qualité de son pour une même taille de fichier. Les bitrates variables sont calculés à partir d’une moyenne, ou parfois du maximum autorisé.
2. Le processus de compression
Le codec AAC comprime les données de manière plus efficace que le MP3. Il fournit une qualité de son supérieure au MP3 pour un même bitrate. Il en va de même du format Ogg Vorbis, utilisé par Spotify.
Le logiciel de compression, l’encodeur, influence lui aussi la qualité. À l’apparition de la technologie MP3, les morceaux avaient souvent un son affreux à 128 kbit/s. Elle a nettement été améliorée, et les mauvais encodeurs ne sont plus utilisés.
3. La profondeur de bit
La profondeur de bit indique le nombre de bits que possède un échantillon. Elle est d’ailleurs aussi appelée «profondeur d’échantillonnage». Un nombre de bits par échantillon élevé permet d’enregistrer un grand nombre de niveaux de volume.
Ce terme vous rappelle peut-être la photo ou la vidéo, où la profondeur de bit est une notion similaire.
Un CD possède 16 bits par canal stéréo. Les MP3 et les autres données audio comprimées ne possèdent pas une profondeur de bits déterminée. Celle-ci ne joue un rôle essentiel que lors d’un enregistrement audio. 24 bits sont parfois aussi utilisés afin d’améliorer le traitement du son. À la fin de l’enregistrement, la musique est redescendue à 16 bits car, selon les experts en acoustique (en anglais), la différence est à peine perceptible.
Si le consommateur lambda s’est mis à parler de profondeur de bit, c’est à cause de Neil Young. La légende du folk commercialise un lecteur audio du nom de Pono, qui possède 24 bits. Ce site (en anglais) diffuse un morceau de Neil Young en 16 bits et en 8 bits (pas 24!). Testez-le: la différence est déjà difficilement audible. Ne comparons même pas 16 et 24 bits!
4. Le taux d’échantillonnage
Le taux d’échantillonnage (aussi appelé «fréquence d’échantillonnage») n’a pas non plus grande importance, sauf si vous souhaitez comprendre comment fonctionne l’enregistrement du son numérique. Un CD a un taux d’échantillonnage de 44 100 Hz, ou 44,1 kHz. Le hertz est une unité de mesure qui indique, si l’on veut, la «fréquence par seconde». En termes d’échantillonnage audio, cela signifie que le niveau sonore est mesuré 44 100 fois par seconde. Ici aussi, des valeurs plus élevées sont préférables en studio, mais pas au format final.
Le théorème de Nyquist: beaucoup de gens pensent que la musique numérique a subi une perte générale par rapport aux «vraies» ondes sonores (analogues). Ce sujet a déjà été abordé par les snobs de l’audio à l’invention du CD; ils le dénigraient et le considéraient comme inférieur au vinyle. Leurs idées sont toutefois réfutables. En effet, selon le théorème de Nyquist, il est possible de reconstruire entièrement une courbe audio à partir de ses échantillons individuels sans perte, pour autant que le taux d’échantillonnage soit suffisamment élevé. Il énonce également qu’il doit être deux fois plus élevé que la bande passante. Étant donné que notre ouïe ne perçoit pas plus de 20 000 Hz, c’est à peu près cette bande passante qui est choisie. Le taux d’échantillonnage est donc d’un peu plus de 40 000 Hz.
5. Les autres facteurs
N’oublions pas que les meilleures valeurs ne servent à rien si le son a mal été enregistré dès le départ. Si, par exemple, l’ingénieur du son n’a pas réglé le volume sonore suffisamment haut, la dynamique est perdue. Le son grésillera si l’auditeur monte ensuite le volume. Si le volume sonore de départ est trop élevé, le résultat est encore pire: l’enregistrement est saturé, le son affreux. Un compresseur peut aussi ruiner la dynamique sonore. Les mauvais enregistrements sont omniprésents sur YouTube. Ils sont aussi vendus sous forme de CD. C’est notamment le cas de vieux enregistrements ou de concerts live.
La qualité de votre casque d’écoute ou de vos enceintes joue également un rôle important. Contrairement à des modèles de qualité, sur de mauvaises mini-enceintes, vous n’entendrez quasiment pas la différence entre des données MP3 à 128 kbit/s et de la musique non comprimée.
Pour cet article, j’ai soumis dix collaboratrices et collaborateurs de digitec à un blindtest. Certains n’accordent pas grande importance à la qualité audio de la musique qu’ils écoutent, d’autres sont très exigeants.
Mes participants sont deux femmes et huit hommes. 7 des 10 testeurs sont âgés de 25 à 30 ans, le plus vieux a 40 ans. Je pars donc du principe que je peux exclure tout trouble de l’audition lié à l’âge. J’ai un bon mélange d’auditeurs moyens, d’experts de l’audio et de musiciens. La plupart ont utilisé mon casque d’écoute HD 449. L’un d’entre eux a voulu utiliser son propre casque, une collègue a fait mon blindtest avec le micro-casque de Logitech que nous utilisons d’ordinaire au bureau.
Je leur ai fait écouter trois extraits de styles différents (classique, jazz, pop/rock) d’une durée de 30 à 45 secondes. J’ai à chaque fois divisé les fichiers .wav de qualité CD (1411 kbit/s, 16 bits PCM) avec LAME ou l’encodeur AAC d’Apple en divers degrés de compression:
J’ai reconverti les fichiers en WAV/PCM afin que les données ne soient pas différenciables au premier coup d’œil. Les fichiers sont tous de la même taille.
Testez vous-même: il vous suffit de télécharger les fichiers. Pour que ce soit vraiment un blindtest, extrayez le dossier ZIP avant de l’ouvrir, car les tailles de fichiers ne sont identiques qu’une fois le dossier décompressé.
J’avais prévu de présenter rapidement chaque participant et ses résultats, mais ça aurait finalement été très ennuyeux. Peu importe que la personne soit une fan de son ou pas, le résultat était toujours le même.
Tous mes cobayes ont su rapidement identifier la pire qualité (MP3 avec VBR à 65 kbit/s). Seules deux personnes n’ont pas réussi en écoutant du classique. Ils ont confondu les quatre autres niveaux de qualité et ont tous avoué ne pas être sûrs ou n’avoir aucune idée duquel ils écoutaient. Les taux de réussite étaient à chaque fois d’environ 20%.
Je trouve intéressant de noter que l’avant-dernier fichier en termes de qualité n’a pas été plus souvent identifié correctement que les trois meilleurs. Les soi-disant experts n’étaient pas meilleurs que ceux qui se considéraient comme des auditeurs ordinaires. Je ne m’attendais pas à ça. D’après tout ce que j’avais lu, ce niveau aurait dû être encore reconnaissable. Dans la plupart des cas, on considère que les bitrates (variables) moyens de 192 kbit/s et plus élevés au format MP3 (VBR) ne peuvent être distingués de la (source (en anglais) originale. À env. 130 kbit/s VBR, notre avant-dernier niveau de qualité est bien inférieur à ces valeurs.
Je n’ai pas indiqué à mes participants ce à quoi ils devaient prêter attention durant l’écoute. Les résultats auraient peut-être été meilleurs, mais je voulais simuler le quotidien. Durant nos temps libres, nous écoutons de la musique parce qu’elle nous plaît, pas parce que nous voulons identifier les pertes de qualité dues à la compression du son.
Vous pouvez bien sûr me reprocher de ne pas avoir mené mon test dans des conditions optimales. Avec un casque d’écoute à la fine pointe de la technologie, un appareil de lecture spécial et un silence parfait, les différences se font sans doute mieux entendre. Mais mon idée était de tester les sons tels qu’on les entend dans la vie de tous les jours. J’ai donc fait exprès de choisir des conditions ordinaires. Bien sûr, si vous ne jurez que par de la musique non compressée, utiliser les fichiers correspondants ne suffit pas. Il vous faut opter pour des casques, enceintes, amplificateurs et appareils de lecture, voire des câbles, de qualité supérieure.
Le format AAC 128 kbit/s est utilisé dans la plupart des vidéos sur YouTube. Cela suffit, car mes cobayes n’ont même pas pu identifier les fichiers MP3 avec le même bitrate, et le codec AAC est bien meilleur. J’entends pourtant une différence entre la musique de mon disque dur et de nombreuses vidéos sur YouTube. J’imagine que ces fichiers audio ont été convertis plusieurs fois. Le fichier est généralement déjà compressé lorsqu’on importe le son dans l’éditeur de vidéos avant d’exporter la vidéo. Et le fichier comprimé l’est à nouveau lorsque la vidéo est publiée sur YouTube.
J’ai tenté de tester le son sur YouTube en faisant une vidéo dotée d’un son WAV et d’un MP3 moyen. J’ai veillé à ce que le son ne soit pas compressé lors de l’exportation. J’ai utilisé les mêmes fichiers que ceux du blindtest, que vous pouvez télécharger. Je ne perçois aucune différence claire, mais écoutez par vous-même.
Les procédés de compression sont sans cesse améliorés. Des bitrates variables, de meilleurs codecs et des encodeurs optimisés garantissent une qualité de son extrêmement difficile, voire impossible, à différencier des fichiers comprimés conventionnels de qualité CD.
Minimisez les risques en achetant des fichiers auprès d’Amazon ou d’Apple. Vous n’entendrez aucune différence, et vous aurez même encore de la marge. Même chose si vous streamez de la musique sur Spotify, à la meilleure qualité possible. Voici quelques détails. Comme je l’ai déjà mentionné, le codec Ogg Vorbis utilisé est meilleur que MP3. Même 96 kbit/s sont acceptables.
C’est le matériel compressé qui pose problème lorsqu’il est à nouveau compressé. Après mon test sur YouTube, je ne suis finalement plus certain que ce soit grave. Dans tous les cas, il vaut mieux que vous convertissiez vos fichiers musicaux MP3 au format AAC, tout simplement parce que ce codec est meilleur. Veillez aussi à disposer de versions non comprimées de vos propres enregistrements et à ne les exporter en format MP3 ou AAC que pour les écouter. La technologie Bluetooth comprime elle aussi les données déjà comprimées. Mais elle a fait de gros progrès en la matière ces dernières années. Un fichier de qualité comprimé avec un bon codec Bluetooth ne devrait pas subir de perte audible.
Après avoir fait mon test, je ne m’inquiète plus des pertes dues à la compression, sauf pour ce qui est de la double compression. Je ne vois plus l’intérêt de me prendre la tête avec des fichiers FLAC si, en plus, il ne fonctionnent toujours pas sur mon smartphone. Je crois que la «génération Spotify» a raison de ne pas s’en faire. À l’heure actuelle, le format MP3 est suffisant dans sa qualité usuelle, et il est libre de droits partout dans le monde depuis avril 2017.
Mon intéret pour l'informatique et l'écriture m'a mené relativement tôt (2000) au journalisme technique. Comment utiliser la technologie sans se faire soi-même utiliser m'intéresse. Dans mon temps libre, j'aime faire de la musique où je compense mon talent moyen avec une passion immense.