Vysoký datový tok zvuku je přehnaný: Kvalita CD je stále skvělá

12 června, 2021admin

Každý chce skvělý zvuk, ale někdy nás naše snahy o zlepšení vedou opravdu temnými a… hloupými chodbami. Stejně jako v mnoha jiných oborech, i v hudbě platí, že trocha znalostí je na dlouhou trať. Možná jste na internetu viděli diskuse kolem bitové hloubky a vzorkovacích frekvencí, ale pravděpodobně nevíte, že neexistuje nějaké kouzelné nastavení, díky kterému bude všechno znít lépe. Je to proto, že digitální hudba v dnešní podobě již opustila naše percepční limity ve zpětném zrcátku. Nepotřebujete soubory se šíleně vysokou kvalitou, pokud netvoříte hudbu, která vyžaduje náročné úpravy.

Ačkoli mi není cizí přinášet špatné zprávy, jako každý dobrý novinář ukazuji důkazy. Pravdou je, že lidé prostě od určitého okamžiku nedokážou vnímat rozdíly mezi soubory a neměli byste se nechat zlákat marketingovým humbukem, pokud je to dražší než to, co už máte. Ačkoli nepochybuji o tom, že formáty jako MQA jsou technologicky působivé, většina nebude schopna zvýšenou věrnost skutečně ocenit. Je téměř stoprocentní šance, že vaše současná knihovna je naprosto v pořádku.

Potřebujete pouze vzorkovací frekvenci 44,1 kHz

Pokud jste se podívali na informační kartu svého hudebního přehrávače, možná jste si všimli, že některé vaše skladby mají vzorkovací frekvenci 44,1 kHz nebo 48 kHz. Možná jste si také všimli, že váš převodník nebo telefon, jako je LG V30, podporují soubory se vzorkovací frekvencí až 384 kHz.

To je přehnané. Nikdo na zelené Zemi nepozná rozdíl nebo se o něj nebude zajímat, protože naše uši prostě nejsou tak citlivé. Nevěříte mi? Je čas na trochu matematiky. Abychom pochopili, jaká je hranice lidského vnímání pro vzorkovací frekvence, musíme určit tři věci:

Hranice frekvencí, které slyšíte
Jaká je minimální vzorkovací frekvence potřebná k dosažení tohoto rozsahu (2 x nejvyšší slyšitelná frekvence v Hz)
Přesahuje vzorkovací frekvence vašich hudebních souborů toto číslo?

Zní to dost jednoduše a je to tak. Nejběžnější rozsah lidského sluchu vrcholí přibližně na 20 kHz, což je 20 000 period za sekundu. Pro představu rozšiřme tento rozsah na horní hranici toho, co známe jako možné: 22 kHz. Pokud chcete zjistit hranice svého sluchu, použijte tento nástroj pro zjištění horní hranice svého vnímání. Jen si předtím dejte pozor, abyste nenastavili příliš vysokou hlasitost. Pokud je vám více než 20 let, mělo by být toto číslo přibližně 16-17 kHz, nižší, pokud je vám více než 30 let, a tak dále.

Pokud váš sluch nedosáhne na nic vyššího než 22,05 kHz, pak 44,1kHz soubor může překonat rozsah frekvencí, které můžete slyšet.

Pomocí Nyquist-Shannonova vzorkovacího teorému víme, že k reprodukci signálu (v tomto případě vaší hudby) stačí vzorkovací frekvence, která poskytuje dva vzorky na periodu. 2 x 22 000 = 44 000, tedy necelých 44 100 vzorků za sekundu, které nabízí vzorkovací frekvence 44,1 kHz. Cokoli nad toto číslo vám nenabídne velké zlepšení, protože jednoduše neuslyšíte frekvence, které by vám zvýšená vzorkovací frekvence odemkla.

Diagram znázorňující chvění v důsledku nedostatečné vzorkovací frekvence zvuku.

Každá vzorkovací frekvence, která překročí dvojnásobek frekvence, bude dokonale reprezentována (výše). Teprve při poklesu vzorkovací frekvence pod tuto hranici vznikají problémy (níže).

Díky stárnutí, ušním infekcím nebo vystavení hlasitým zvukům se navíc časem snižují frekvence, které slyšíte na nejvyšším konci. Já například neslyším nic nad 16 kHz. Proto má hudba pro starší uši méně slyšitelné zkreslení, pokud se pomocí dolnopropustného filtru zbavíte zvuku, který neslyšíte – hudba tak bude znít lépe, i když technicky nebude mít tak „vysoké rozlišení“ jako původní soubor. Pokud váš sluch nedosáhne na nic vyššího než 22,05 kHz, pak 44,1kHz soubor hravě překoná rozsah frekvencí, které slyšíte.

16bitový zvuk je v pořádku pro každého

Dalším mýtem o kvalitě zvuku je, že 24bitový zvuk odemkne jakousi audiofilskou nirvánu, protože je o tolik hustší na data, ale z hlediska vnímání zvuku se jakékoli zlepšení v lidských uších ztratí. Zachycení většího množství dat na jeden vzorek má sice výhody pro dynamický rozsah, ale tyto výhody se týkají v podstatě výhradně oblasti nahrávání.

Je sice pravda, že 24bitový soubor bude mít mnohem větší dynamický rozsah než 16bitový soubor, ale 144 dB dynamického rozsahu je dost na to, abyste vyřešili komára vedle startu rakety Saturn V. To je sice dobře, ale vaše uši tento rozdíl ve zvuku neslyší kvůli jevu zvanému sluchové maskování. Vaše fyziologie způsobuje, že tišší zvuky jsou tlumeny těmi hlasitějšími, a čím blíže jsou si frekvenčně: tím více jsou vaším mozkem maskovány. Díky vylepšením, jako je dithering, může 16bitový zvuk „pouze“ rozlišit výše zmíněného komára vedle 120dB vzletu proudového motoru. I tak je to ale dramatický overkill.

Spektrogram ukazuje, jak vypadá 24bitový hudební soubor, aniž by z něj byla odstraněna jakákoli data.

Takto vypadá 24bitový hudební soubor před odstraněním jakýchkoli dat. Frekvence je osa Y, čas je osa X a intenzita je barva.

Však právě tišší zvuky jsou podle mnoha audiofilů tím velkým rozdílem, a to je částečně pravda. Například širší dynamický rozsah umožňuje zvýšit hlasitost dále, aniž by se zvýšil slyšitelný šum, a to je zde velký kámen úrazu. Tam, kde mají 24 a dokonce i 32bitové soubory své místo v mixážním pultu, přinášejí nějakou výhodu pro soubory MP3, FLAC nebo OGG?“

Hej děti, zkuste si to doma!“

Přestože to kolega Rob z Android Authority již dokázal pomocí osciloskopu a tvrdého výzkumu, provedeme experiment, který můžete provést sami – nebo si ho jen přečíst, pokud vám nevadí spoilery. Po prohledání webu jsem na Bandcampu našel několik souborů, které byly skutečně vydány ve 24bitové bezztrátové podobě. Mnoho z těch, které jsem našel na údajných stránkách „HD Audio“, bylo jednoduše upkonvertováno z 16bitových, což znamená, že byly identické ve všech ohledech kromě ceny. Dále jsem postupoval takto:

Vytvořte si kopii původního 24bitového souboru
Otevřete jej ve zvoleném programu pro úpravu zvuku (doporučuji Audacity) a soubor invertujte; uložte jej jako 16bitový/44. Poté jej uložte do formátu 16 bitů.1kHz WAV
Otevřete mateřský soubor i nově upravený soubor a exportujte je jako jednu stopu
Otevřete smíchanou stopu v libovolném programu, který umožňuje zobrazit takzvaný spektrogram
Pochvalte si, že jste utratili spoustu peněz za zvuk v Hi-res

V podstatě jsme právě udělali to, že jsme vzali 96kHz/24bitový soubor, pak odečetli všechna data, která můžete slyšet v jeho verzi v kvalitě CD. To, co zůstane, je rozdíl mezi nimi! To je přesně stejný princip, na kterém je založeno aktivní potlačení šumu. Toto je výsledek, který jsem získal:

Spektrogram zobrazující rozdíl ve zvuku mezi 24bitovými/96kHz soubory a 16bitovými/44,1kHz hudebními soubory v kvalitě CD.

Ty malé fialové bity jsou sice na spektrogramu vidět, ale jsou hluboko pod prahem slyšitelnosti v přítomnosti hudby.

Okay, takže v nejvyšších pásmech souboru je trochu rozdíl, ale to je mimo rozsah lidského sluchu. Ve skutečnosti byste to pravděpodobně měli stejně odfiltrovat. Ukažme tedy, co člověk skutečně slyší, a použijme dolní propust na frekvenci 20 kHz, abychom si pokryli základy. Et voila: konečná špička… -85 dB v nejlepším případě. Dobře, tady se tak trochu pohybujeme na hraně slyšitelnosti, ale je tu problém – abyste skutečně slyšeli nějaká další data, musíte:

Poslouchat hudbu na úrovni, kterou není bezpečné poslouchat déle než 1 minutu (96+ dB)
Mít místo uší mikrofony

Ačkoli se poslední bod může zdát trochu chraplavý, víme, že váš mozek filtruje zvuky, které jsou si frekvenčně blízké (viz: sluchové maskování, odkaz výše). Takže když posloucháte hudbu, ve skutečnosti neslyšíte všechny zvuky najednou, ale jen to, co pro vás mozek oddělil. Abyste tedy slyšeli rozdíl mezi soubory 24 bitů/96 kHz a zvukem v kvalitě CD: jednotlivé tóny mohou zaujímat jen velmi úzký frekvenční rozsah, být velmi hlasité a ostatní tóny, které se vyskytují ve stejném časovém úseku, se musí frekvenčně lišit.

Neexistuje žádná bezpečná úroveň poslechu, která by umožnila slyšet rozdíl mezi těmito soubory.

Pokud jsme se z tohoto fiaska Yanny/Laurel něco naučili, lidský hlas těmto kritériím nevyhovuje (pozn. redakce: je to „Laurel“). Takže opravdu nejpravděpodobnější místa, kde byste skutečně mohli slyšet rozdíly mezi oběma, jsou nízkofrekvenční tóny s poněkud utlumenými harmonickými. Má to však háček: Lidé opravdu špatně slyší nízkofrekvenční zvuky. Abyste tyto tóny slyšeli stejně hlasitě jako tóny s vyššími frekvencemi, budete potřebovat 10 až 40 dB výkonu navíc. Takže tyto špičky na úrovni -87 dB v rozmezí 20-90 Hz mohou mít hodnotu -97 až -127 dB, což je mimo rozsah lidského sluchu. Neexistuje žádná bezpečná poslechová úroveň, která by umožnila slyšet rozdíl mezi těmito soubory.

Cool, huh? Vždy je dobré vědět, že každý, kdo přijde a řekne vám, že si svou hudební sbírku musíte koupit znovu, protože nemá dostatečně „vysoké rozlišení“, se prokazatelně mýlí. Pokud jste začínající audiofil, musíte si z toho odnést hlavně klid: jsme ve zlatém věku audia – kvalita CD je více než dostatečná, jen si užívejte hudbu! Někteří sice mohou usilovat o vyšší kvalitu zvuku, ale pokud chcete jen poslouchat dobrou hudbu, není to nutné.