L’audio à haut débit est exagéré : La qualité CD est toujours excellente

Tout le monde veut de l’audio de qualité, mais parfois nos quêtes d’amélioration nous mènent dans des couloirs vraiment sombres et… stupides. Comme c’est le cas pour de nombreuses disciplines, avec la musique, un peu de connaissances permet d’aller loin. Vous avez peut-être vu des discussions en ligne sur la profondeur de bit et les taux d’échantillonnage, mais ce que vous ne savez probablement pas, c’est qu’il n’existe pas de réglage magique qui permet d’obtenir un meilleur son. C’est parce que la musique numérique telle qu’elle est aujourd’hui a déjà laissé nos limites de perception dans le rétroviseur. Vous n’avez pas besoin de fichiers de qualité folle, sauf si vous créez de la musique qui nécessite un montage lourd.

Si je ne suis pas étranger à l’annonce de mauvaises nouvelles, comme tout bon journaliste, je montre mes preuves. La vérité est que les humains ne peuvent tout simplement pas percevoir la différence entre les fichiers à un certain point, et vous ne devriez pas vous laisser entraîner par le battage marketing si c’est plus cher que ce que vous avez déjà. Bien que je ne doute pas que des formats comme MQA soient technologiquement impressionnants, la plupart des gens ne seront pas vraiment en mesure d’apprécier la fidélité accrue. Les chances sont proches de 100% que votre bibliothèque actuelle soit parfaitement bien.

Vous n’avez besoin que d’une fréquence d’échantillonnage de 44,1kHz

Si vous avez regardé l’onglet d’information de votre lecteur de musique, vous avez peut-être remarqué que certaines de vos chansons ont des fréquences d’échantillonnage de 44,1kHz, ou 48kHz. Vous pouvez également remarquer que votre DAC ou un téléphone comme le LG V30 prennent en charge des fichiers avec des taux d’échantillonnage allant jusqu’à 384kHz.

C’est excessif. Personne sur la Terre verte de Dieu ne va savoir ou se soucier de la différence parce que nos oreilles ne sont tout simplement pas si sensibles. Vous ne me croyez pas ? Il est temps de faire des maths. Pour comprendre quelle est la limite de la perception humaine pour les taux d’échantillonnage, nous devons identifier trois choses :

  1. La limite des fréquences que vous pouvez entendre
  2. Quel est le taux d’échantillonnage minimum nécessaire pour respecter cette plage (2 x la plus haute fréquence audible en Hz)
  3. Le taux d’échantillonnage de vos fichiers musicaux dépasse-t-il ce nombre ?

Ça semble assez simple, et ça l’est. La gamme la plus courante de l’audition humaine plafonne à environ 20kHz, soit 20 000 périodes par seconde. Pour les besoins de l’argumentation, étendons cette gamme aux limites les plus élevées de ce que nous savons être possible : 22kHz. Si vous voulez vérifier les limites de votre audition, utilisez cet outil pour trouver les limites supérieures de votre perception. Veillez simplement à ne pas régler le volume trop fort avant de le faire. Si vous avez plus de 20 ans, ce nombre devrait être d’environ 16-17kHz, plus bas si vous avez plus de 30 ans, et ainsi de suite.

Si votre audition ne peut rien atteindre de plus haut que 22,05kHz, alors le fichier 44,1kHz peut outresolver la gamme de fréquences que vous pouvez entendre.

En utilisant le théorème d’échantillonnage de Nyquist-Shannon, nous savons qu’une fréquence d’échantillonnage qui fournit deux échantillons par période est suffisante pour reproduire un signal (dans ce cas, votre musique). 2 x 22 000 = 44 000, soit un peu moins que les 44 100 échantillons par seconde offerts par une fréquence d’échantillonnage de 44,1 kHz. Tout ce qui dépasse ce nombre ne vous offrira pas beaucoup d’amélioration, car vous ne pourrez tout simplement pas entendre les fréquences qu’une fréquence d’échantillonnage accrue débloquerait pour vous.

Un diagramme montrant la gigue résultant d'une insuffisance de la fréquence d'échantillonnage audio.

Toute fréquence d’échantillonnage qui dépasse le double de la fréquence sera parfaitement représentée (ci-dessus). Ce n’est que lorsque la fréquence d’échantillonnage descend en dessous de ce point que les problèmes surviennent (ci-dessous).

En outre, les fréquences que vous entendez au plus haut niveau diminuent avec le temps, à mesure que vous vieillissez, que vous avez des infections de l’oreille ou que vous êtes exposé à des sons forts. Par exemple, je n’entends rien au-dessus de 16kHz. C’est pourquoi, pour les oreilles plus âgées, la musique présente moins de distorsion audible si vous utilisez un filtre passe-bas pour éliminer le son que vous n’entendez pas – votre musique sonnera mieux même si elle n’est pas techniquement aussi « haute définition » que le fichier original. Si votre audition ne peut pas atteindre quelque chose de plus haut que 22,05 kHz, alors le fichier 44,1 kHz peut facilement sursolliciter la gamme de fréquences que vous pouvez entendre.

L’audio 16 bits convient à tout le monde

L’autre mythe de la qualité audio est que l’audio 24 bits débloquera une sorte de nirvana audiophile parce qu’il est beaucoup plus dense en données, mais en termes d’audio perceptif, toute amélioration sera perdue sur les oreilles humaines. Capturer plus de données par échantillon a effectivement des avantages pour la plage dynamique, mais ces avantages sont à peu près exclusivement dans le domaine de l’enregistrement.

S’il est vrai qu’un fichier 24 bits aura une plage dynamique beaucoup plus importante qu’un fichier 16 bits, 144dB de plage dynamique sont suffisants pour résoudre un moustique à côté d’un lancement de fusée Saturn V. Tout cela est bien beau, mais vos oreilles n’entendent pas cette différence de son en raison d’un phénomène appelé « masquage auditif ». Votre physiologie fait en sorte que les sons les plus faibles soient atténués par les plus forts, et plus leur fréquence est proche, plus ils sont masqués par votre cerveau. Avec des améliorations comme le tramage, l’audio 16 bits peut « simplement » résoudre le moustique susmentionné à côté d’un décollage de réacteur à 120 dB. C’est quand même dramatiquement excessif.

Un spectrogramme montrant à quoi ressemble un fichier musical 24 bits sans qu'aucune donnée n'en soit supprimée.

Voici à quoi ressemble un fichier musical 24 bits avant qu’aucune donnée ne soit supprimée. La fréquence est l’axe des ordonnées, le temps est l’axe des abscisses et l’intensité est la couleur.

Cependant, ce sont les sons plus calmes qui, selon de nombreux audiophiles, constituent la grande différence, et c’est partiellement vrai. Par exemple, une gamme dynamique plus large vous permet d’augmenter le volume plus loin sans augmenter le bruit audible, et c’est le gros point d’achoppement ici. Là où les fichiers 24 et même 32 bits ont leur place dans la cabine de mixage, offrent-ils un quelconque avantage pour les fichiers MP3, FLAC ou OGG ?

Hé les enfants, essayez ça chez vous !

Alors que mon collègue Rob d’Android Authority l’a déjà prouvé avec un oscilloscope et des recherches acharnées, nous allons réaliser une expérience que vous pouvez faire vous-même – ou simplement lire si les spoilers ne vous dérangent pas. Après avoir parcouru le web, j’ai trouvé quelques fichiers sur Bandcamp qui ont été effectivement publiés en fichiers 24 bits sans perte. Beaucoup de ceux que j’ai trouvés sur des sites prétendument « HD Audio » étaient simplement upconvertis à partir de 16 bits, ce qui signifie qu’ils étaient identiques en tout point, sauf le prix. Ensuite, j’ai suivi cette procédure :

  1. Faire une copie du fichier 24 bits original
  2. Ouvrir dans le programme d’édition audio de votre choix (je suggère Audacity), et inverser le fichier ; enregistrer en 16 bits/44.1kHz WAV
  3. Ouvrir à la fois le fichier parent et votre fichier nouvellement édité, et l’exporter comme une seule piste
  4. Ouvrir la piste mixée dans n’importe quel programme qui vous permet de visualiser ce qu’on appelle un spectrogramme
  5. Gigger pour vous-même en dépensant beaucoup d’argent pour l’audio haute résolution

Essentiellement, ce que nous venons de faire ici est de prendre un fichier 96kHz/24 bits, puis de soustraire toutes les données que vous pouvez entendre dans une version de qualité CD de lui-même. Ce qui reste est la différence entre les deux ! C’est exactement le même principe sur lequel se base la suppression active du bruit. Voici le résultat que j’ai obtenu :

Un spectrogramme montrant la différence de son entre des fichiers 24 bits/96kHz et des fichiers musicaux 16 bits/44,1kHz de qualité CD.

Bien que ces petits bits violets soient visibles dans le spectrogramme, ils sont bien en dessous du seuil d’audibilité en présence de musique.

Ok, il y a donc un peu de différence dans les parties les plus hautes du fichier, mais c’est hors de portée de l’audition humaine. En fait, vous devriez probablement juste filtrer cela de toute façon. Montrons donc ce qu’un être humain peut réellement entendre en appliquant un passe-bas à 20 kHz, juste pour couvrir nos bases. Et voilà : un pic final de… -85dB au mieux. D’accord, nous frôlons un peu les limites de l’audibilité ici, mais voici le problème : pour entendre réellement une partie de ces données supplémentaires, vous devez le faire :

  1. Écouter de la musique à un niveau dangereux à écouter pendant plus d’une minute (96+dB)
  2. Avoir des microphones pour les oreilles

Bien que ce dernier point puisse sembler un peu narquois, nous savons que votre cerveau filtre les sons qui sont proches en fréquence les uns des autres (voir : le masquage auditif, lié ci-dessus). Ainsi, lorsque vous écoutez de la musique, vous n’entendez pas tous les sons en même temps, vous entendez seulement ce que votre cerveau a séparé pour vous. Ainsi, pour entendre la différence entre des fichiers 24 bits/96 kHz et un son de qualité CD : les sons individuels ne peuvent occuper qu’une plage de fréquences très étroite, être très forts, et les autres notes qui se produisent dans le même laps de temps doivent être très éloignées en termes de fréquence.

Il n’existe pas de niveau d’écoute sûr pour entendre la différence entre ces fichiers.

Si nous avons appris quelque chose de ce fiasco Yanny/Laurel, une voix humaine ne répond pas à ces critères (NDLR : c’est « Laurel »). Donc, en réalité, les endroits les plus probables où vous pourriez entendre les différences entre les deux sont les notes de basse fréquence avec des harmoniques quelque peu atténuées. Mais il y a un hic : Les humains sont très mauvais pour entendre les sons à basse fréquence. Pour entendre ces notes à un volume égal à celui des notes de fréquence plus élevée, il faut une puissance supplémentaire de 10 à 40 dB. Ainsi, ces pics à -87dB dans les gammes de 20 à 90 Hz peuvent tout aussi bien être de -97 à -127dB, ce qui est en dehors de la gamme de l’audition humaine. Il n’y a pas de niveau d’écoute sûr pour entendre la différence entre ces fichiers.

Cool, hein ? Il est toujours bon de savoir que toute personne qui vient vous dire que votre collection de musique doit être rachetée parce qu’elle n’est pas assez « haute définition » a manifestement tort. Si vous êtes un audiophile en herbe, vous devez vous détendre : nous sommes à l’âge d’or de l’audio – la qualité des CD est plus que suffisante, profitez simplement de votre musique ! Si certains recherchent une qualité audio supérieure, ce n’est pas nécessaire si tout ce que vous voulez faire est d’écouter de la bonne musique.