Hoge bitrate audio is overkill: CD-kwaliteit is nog steeds geweldig

Iedereen wil geweldige audio, maar soms leiden onze zoektochten naar verbetering ons door een aantal echt donkere en… domme… gangen. Zoals het met veel disciplines gaat, geldt ook voor muziek dat je met een beetje kennis een heel eind komt. Misschien heb je online discussies gezien over bitdiepte en sample rates, maar wat je waarschijnlijk niet weet is dat er niet een of andere magische instelling is die alles beter laat klinken. Dat komt omdat digitale muziek zoals we die nu kennen onze perceptuele grenzen al in de achteruitkijkspiegel heeft laten liggen. Je hebt geen bestanden van waanzinnig hoge kwaliteit nodig, tenzij je muziek maakt die zwaar bewerkt moet worden.

Hoewel het mij niet vreemd is om slecht nieuws te brengen, toon ik, zoals elke goede journalist, mijn bewijzen. De waarheid is dat mensen op een bepaald punt het verschil tussen bestanden niet meer kunnen waarnemen, en je moet je niet laten meeslepen in de marketinghype als het duurder is dan wat je al hebt. Hoewel ik er niet aan twijfel dat formaten als MQA technologisch indrukwekkend zijn, zullen de meesten de verhoogde natuurgetrouwheid niet echt kunnen waarderen. De kans is bijna 100% dat uw huidige bibliotheek prima in orde is.

U hebt alleen een sample-rate van 44.1kHz nodig

Als u op het tabblad informatie van uw muziekspeler hebt gekeken, is het u misschien opgevallen dat sommige nummers een sample-rate van 44.1kHz of 48kHz hebben. Het kan je ook zijn opgevallen dat je DAC of een telefoon zoals de LG V30 bestanden ondersteunt met sample rates tot 384kHz.

Dat is overkill. Niemand op Gods groene aarde zal het verschil weten of er iets om geven, omdat onze oren gewoon niet zo gevoelig zijn. Geloof je me niet? Het is tijd voor wat wiskunde. Om te begrijpen wat de grens is van de menselijke perceptie voor sample rates, moeten we drie dingen vaststellen:

  1. De grens van de frequenties die je kunt horen
  2. Wat is de minimale sample rate die nodig is om aan dat bereik te voldoen (2 x de hoogst hoorbare frequentie in Hz)
  3. Overschrijdt de sample rate van je muziekbestanden dat getal?

Klinkt simpel genoeg, en dat is het ook. Het meest voorkomende bereik van het menselijk gehoor ligt rond 20kHz, dat is 20.000 perioden per seconde. Laten we omwille van het argument dat bereik eens uitbreiden tot de uiterste grens van wat we weten dat mogelijk is: 22kHz. Als u de grenzen van uw gehoor wilt nagaan, kunt u dit hulpmiddel gebruiken om de bovenste grenzen van uw waarneming te vinden. Zorg er wel voor dat je het volume niet te hard zet voordat je het doet. Als je ouder bent dan 20, moet dat getal ongeveer 16-17kHz zijn, lager als je ouder bent dan 30, enzovoort.

Als je gehoor niets hoger dan 22,05kHz kan bereiken, dan kan het 44,1kHz-bestand het bereik van de frequenties die je kunt horen te boven gaan.

Uitgaande van de Nyquist-Shannon bemonsteringstheorie weten we dat een bemonsteringsfrequentie die twee monsters per periode levert voldoende is om een signaal (in dit geval uw muziek) te reproduceren. 2 x 22.000 = 44.000, of net onder de 44.100 samples per seconde die een 44.1kHz sample rate biedt. Alles boven dat getal zal niet veel verbetering opleveren, omdat je de frequenties die een hogere sample-rate voor je zou ontsluiten, simpelweg niet kunt horen.

Een diagram dat jitter laat zien als gevolg van een te lage audio sample-rate.

Elke sample-rate die hoger is dan twee keer de frequentie zal perfect worden gerepresenteerd (hierboven). Pas als de sample-rate onder dat punt zakt, ontstaan er problemen (onder).

Daar komt nog bij dat de frequenties die je op het hoogste niveau hoort, na verloop van tijd afnemen naarmate je ouder wordt, oorontstekingen krijgt of wordt blootgesteld aan harde geluiden. Ik kan bijvoorbeeld niets meer horen boven 16 kHz. Daarom is er voor oudere oren minder vervorming hoorbaar als je een laagdoorlaatfilter gebruikt om het geluid weg te halen dat je niet kunt horen – je muziek klinkt dan beter, ook al is het technisch gezien niet zo “high-def” als het originele bestand. Als je gehoor niet hoger is dan 22,05kHz, dan kan het 44,1kHz-bestand het bereik van frequenties die je wel kunt horen ruimschoots overtreffen.

16-bit audio is prima voor iedereen

De andere mythe over audiokwaliteit is dat 24-bit audio een soort audiofiel nirwana zal ontsluiten omdat het zoveel meer data bevat, maar in termen van perceptuele audio zal elke verbetering verloren gaan voor menselijke oren.

Hoewel het waar is dat een 24-bit bestand een veel groter dynamisch bereik heeft dan een 16-bit bestand, is 144 dB dynamisch bereik genoeg om een mug op te lossen naast een Saturn V raketlancering. Dat is allemaal mooi en aardig, maar je oren horen dat verschil niet door een verschijnsel dat auditieve maskering wordt genoemd. Je fysiologie zorgt ervoor dat zachtere geluiden worden gedempt door hardere, en hoe dichter ze bij elkaar liggen in frequentie: hoe meer ze worden gemaskeerd door je hersenen. Met verbeteringen zoals dithering, kan 16-bit audio “slechts” de bovengenoemde mug oplossen naast het opstijgen van een 120dB straalmotor. Nog steeds een dramatische overkill.

Een spectrogram dat laat zien hoe een 24-bit muziekbestand eruitziet zonder dat er gegevens uit zijn verwijderd.

Zo ziet een 24-bit muziekbestand eruit voordat er gegevens uit zijn verwijderd. Frequentie is de Y-as, tijd is de X-as, en intensiteit is kleur.

Het zijn echter de stillere geluiden waarvan veel audiofielen beweren dat dit het grote verschil is, en dat is gedeeltelijk waar. Met een groter dynamisch bereik kun je bijvoorbeeld het volume verder opvoeren zonder hoorbare ruis te veroorzaken, en dat is hier het grote knelpunt. Waar 24- en zelfs 32-bit bestanden hun plaats hebben in de mengcabine, bieden ze enig voordeel voor MP3-, FLAC- of OGG-bestanden?

Hey kids, probeer dit thuis!

Terwijl mijn collega Rob van Android Authority dit al heeft bewezen met een oscilloscoop en wat hardcore onderzoek, gaan we nu een experiment uitvoeren dat je zelf kunt doen – of gewoon kunt lezen als je geen bezwaar hebt tegen spoilers. Na het afspeuren van het web, vond ik een paar bestanden op Bandcamp die daadwerkelijk waren uitgebracht in 24-bit lossless bestanden. Veel van de bestanden die ik vond op zogenaamde “HD Audio” sites waren gewoon geupconverteerd van 16-bit, wat betekent dat ze identiek waren in elk opzicht, behalve de prijs. Vervolgens heb ik de volgende procedure gevolgd:

  1. Maak een kopie van het originele 24-bit bestand
  2. Openen in het audiobewerkingsprogramma van je keuze (ik stel Audacity voor), en inverteer het bestand; sla op als 16-bit/44.1kHz WAV
  3. Open zowel het oorspronkelijke bestand als je nieuwe bewerkte bestand, en exporteer het als één spoor
  4. Open het gemixte spoor in een programma waarmee je een zogenaamd spectrogram kunt bekijken
  5. Glimlach in jezelf over het feit dat je veel geld hebt uitgegeven aan Hi-res audio

Wat we hier in wezen hebben gedaan is een 96kHz/24-bit bestand nemen, en dan alle data er van aftrekken die je kunt horen in een CD-kwaliteit versie van zichzelf. Wat overblijft is het verschil tussen die twee! Dit is precies hetzelfde principe waarop Active Noise Canceling is gebaseerd. Dit is het resultaat dat ik kreeg:

Een spectrogram dat het verschil in geluid laat zien tussen 24-bit/96kHz bestanden en CD-kwaliteit 16-bit/44.1kHz muziekbestanden.

Ze kleine paarse bits zijn weliswaar zichtbaar in het spectrogram, maar liggen ver onder de drempel van hoorbaarheid in de aanwezigheid van muziek.

Okee, er is dus een beetje verschil in de hoogste regionen van het bestand, maar dat ligt buiten het bereik van het menselijk gehoor. In feite, zou je dat er waarschijnlijk toch uit moeten filteren. Dus laten we eens zien wat een mens kan horen door een laagdoorlaat toe te passen op 20kHz, gewoon om onze basis te beschermen. Et voila: een uiteindelijke piek van… -85dB op zijn best. Goed, we schurken hier tegen de grens van hoorbaarheid aan, maar het probleem is dat je deze extra gegevens alleen kunt horen als je ze ook echt hoort:

  1. Muziek beluisteren op een niveau dat onveilig is om langer dan 1 minuut naar te luisteren (96+dB)
  2. Microfoons als oren hebben

Terwijl dat laatste punt een beetje snarky lijkt, weten we dat je hersenen geluiden uitfilteren die dicht bij elkaar liggen in frequentie (zie: auditieve maskering, hierboven gelinkt). Dus als je naar muziek luistert, hoor je eigenlijk niet al het geluid tegelijk, je hoort alleen wat je hersenen voor je hebben uitgefilterd. Dus om het verschil te horen tussen 24-bit/96kHz bestanden en audio van CD-kwaliteit: de individuele geluiden kunnen slechts een zeer smal frequentiebereik beslaan, zeer luid zijn, en de andere noten die in dezelfde tijdsperiode voorkomen moeten qua frequentie ver uit elkaar liggen.

Er is geen veilig luisterniveau om het verschil tussen deze bestanden te horen.

Als we iets hebben geleerd van dit Yanny/Laurel-fiasco, dan is het wel dat een menselijke stem niet aan deze criteria voldoet (noot van de redacteur: het is “Laurel”). Dus de meest waarschijnlijke plaatsen waar je de verschillen tussen de twee zou kunnen horen zijn in lage frequentie noten met ietwat gedempte harmonischen. Maar er is een addertje onder het gras: Mensen zijn heel slecht in het horen van laagfrequente geluiden. Om deze tonen even luid te kunnen horen als tonen met een hogere frequentie, heb je tussen de 10 en 40 dB extra vermogen nodig. Dus die pieken van -87dB in het bereik van 20-90Hz kunnen net zo goed -97 tot -127dB zijn, en dat ligt buiten het bereik van het menselijk gehoor. Er is geen veilig luisterniveau om het verschil tussen deze bestanden te horen.

Cool, hè? Het is altijd goed om te weten dat iemand die je komt vertellen dat je je muziekcollectie opnieuw moet kopen omdat ze niet “high-def” genoeg is, het aantoonbaar mis heeft. Als u een audiofiel in de dop bent, moet u zich vooral ontspannen: we bevinden ons hier in een gouden audiotijdperk – cd-kwaliteit is meer dan prima genoeg, geniet gewoon van uw muziek! Hoewel sommigen misschien op zoek zijn naar audio van hogere kwaliteit, is dat niet nodig als je alleen maar naar goede muziek wilt luisteren.