Wysoki bitrate audio to przesada: Jakość CD jest wciąż świetna
Każdy chce mieć świetne audio, ale czasami nasze dążenia do poprawy prowadzą nas w naprawdę ciemne i… głupie… korytarze. Jak to jest z wieloma dziedzinami, tak i w przypadku muzyki, odrobina wiedzy prowadzi bardzo daleko. Być może widziałeś w sieci dyskusje na temat głębi bitowej i częstotliwości próbkowania, ale to o czym prawdopodobnie nie wiesz to fakt, że nie ma jakiegoś magicznego ustawienia, które sprawi, że wszystko będzie brzmiało lepiej. Dzieje się tak dlatego, że muzyka cyfrowa w swojej obecnej formie pozostawiła już nasze percepcyjne ograniczenia we wstecznym lusterku. Nie potrzebujesz szalenie wysokiej jakości plików, chyba że tworzysz muzykę, która wymaga ciężkiej edycji.
Chociaż nie jestem obcy w dostarczaniu złych wiadomości, jak każdy dobry dziennikarz pokazuję swoje dowody. Prawda jest taka, że ludzie po prostu nie są w stanie dostrzec różnicy między plikami w pewnym momencie i nie powinieneś dać się wciągnąć w marketingowy szum, jeśli jest to droższe niż to, co już masz. Choć nie mam wątpliwości, że formaty takie jak MQA są technologicznie imponujące, większość nie będzie w stanie docenić zwiększonej wierności. Szanse są bliskie 100%, że twoja obecna biblioteka jest całkowicie w porządku.
Potrzebujesz tylko częstotliwości próbkowania 44.1kHz
Jeśli spojrzałeś na zakładkę informacyjną twojego odtwarzacza muzycznego, możesz zauważyć, że niektóre z twoich utworów mają częstotliwości próbkowania 44.1kHz, lub 48kHz. Możesz również zauważyć, że Twój DAC lub telefon taki jak LG V30 obsługuje pliki z częstotliwością próbkowania do 384kHz.
To już przesada. Nikt na zielonej Ziemi nie będzie wiedział lub dbał o różnicę, ponieważ nasze uszy nie są aż tak wrażliwe. Nie wierzysz mi? Czas na trochę matematyki. Aby zrozumieć jaka jest granica ludzkiej percepcji dla częstotliwości próbkowania, musimy zidentyfikować trzy rzeczy:
- Granica częstotliwości które możesz usłyszeć
- Jaka jest minimalna częstotliwość próbkowania potrzebna do spełnienia tego zakresu (2 x najwyższa słyszalna częstotliwość w Hz)
- Czy częstotliwość próbkowania twoich plików muzycznych przekracza tą liczbę?
Brzmi dość prosto, i tak jest. Najbardziej powszechny zakres ludzkiego słuchu kończy się na około 20kHz, co daje 20,000 okresów na sekundę. Dla dobra argumentacji, rozszerzmy ten zakres do najwyższych granic tego, co wiemy, że jest możliwe: 22kHz. Jeśli chcesz sprawdzić granice swojego słuchu, użyj tego narzędzia, aby znaleźć górne granice swojej percepcji. Upewnij się tylko, że nie ustawiasz zbyt dużej głośności zanim to zrobisz. Jeśli masz ponad 20 lat, ta liczba powinna wynosić około 16-17kHz, niżej jeśli masz ponad 30 lat, i tak dalej.
Jeśli twój słuch nie może osiągnąć nic wyższego niż 22.05kHz, wtedy plik 44.1kHz może rozwiązać zakres częstotliwości, które możesz usłyszeć.
Używając twierdzenia Nyquista-Shannona o próbkowaniu, wiemy, że częstotliwość próbkowania, która zapewnia dwie próbki na okres jest wystarczająca do odtworzenia sygnału (w tym przypadku, Twojej muzyki). 2 x 22,000 = 44,000, lub nieco poniżej 44,100 próbek na sekundę oferowanych przez częstotliwość próbkowania 44.1kHz. Cokolwiek powyżej tej liczby nie zaoferuje nam dużej poprawy, ponieważ po prostu nie będziemy w stanie usłyszeć częstotliwości, które zwiększona częstotliwość próbkowania mogłaby dla nas odblokować.
Każda częstotliwość próbkowania, która przekracza dwukrotność częstotliwości będzie doskonale reprezentowana (powyżej). Dopiero, gdy częstotliwość próbkowania spadnie poniżej tego punktu, pojawiają się problemy (poniżej).
Dodatkowo, częstotliwości, które słyszysz na najwyższym poziomie zmniejszają się z czasem, gdy się starzejesz, dostajesz infekcji ucha lub jesteś narażony na głośne dźwięki. Na przykład, ja nie słyszę nic powyżej 16kHz. Z tego powodu dla starszych uszu muzyka ma mniej słyszalne zniekształcenia, jeśli użyjesz filtra dolnoprzepustowego, aby pozbyć się dźwięku, którego nie słyszysz – dzięki temu muzyka będzie brzmiała lepiej, nawet jeśli technicznie nie jest tak „high-def” jak oryginalny plik. Jeśli twój słuch nie jest w stanie dotrzeć do niczego powyżej 22.05kHz, wtedy plik 44.1kHz może z łatwością przewyższyć zakres częstotliwości, które możesz usłyszeć.
16-bitowe audio jest w porządku dla każdego
Innym mitem dotyczącym jakości dźwięku jest to, że 24-bitowe audio odblokuje jakiś rodzaj audiofilskiej nirwany, ponieważ jest o wiele bardziej gęste od danych, ale w kategoriach percepcji dźwięku jakakolwiek poprawa będzie stracona dla ludzkich uszu. Przechwytywanie większej ilości danych na próbkę ma korzyści dla zakresu dynamiki, ale korzyści te są prawie wyłącznie w domenie nagrywania.
Choć prawdą jest, że plik 24-bitowy będzie miał znacznie większy zakres dynamiki niż plik 16-bitowy, to 144dB zakresu dynamiki wystarczy, aby rozwiązać problem komara obok startu rakiety Saturn V. Choć wszystko to jest w porządku, Twoje uszy nie usłyszą tej różnicy w dźwięku z powodu zjawiska zwanego maskowaniem słuchowym. Twoja fizjologia sprawia, że cichsze dźwięki są wyciszane przez głośniejsze, a im bliższe są one sobie pod względem częstotliwości, tym bardziej są maskowane przez Twój mózg. Z ulepszeniami takimi jak dithering, 16-bitowy dźwięk może „tylko” rozwiązać wspomniany komar obok 120dB startu silnika odrzutowego. Nadal jest to dramatyczna przesada.
Tak wygląda 24-bitowy plik muzyczny przed usunięciem jakichkolwiek danych. Częstotliwość to oś Y, czas to oś X, a intensywność to kolor.
Jednakże, to właśnie cichsze dźwięki są według wielu audiofilów największą różnicą, i jest to częściowo prawda. Na przykład, szerszy zakres dynamiki pozwala zwiększyć głośność dalej bez podnoszenia słyszalnego hałasu, i to jest główny punkt sporny tutaj. Gdzie 24 i nawet 32-bitowe pliki mają swoje miejsce w kabinie mikserskiej, czy oferują jakiekolwiek korzyści dla plików MP3, FLAC lub OGG?
Hej dzieciaki, spróbujcie tego w domu!
Podczas gdy mój kolega Rob z Android Authority już to udowodnił za pomocą oscyloskopu i kilku hardcorowych badań, my przeprowadzimy eksperyment, który możecie zrobić sami – lub po prostu przeczytać, jeśli nie macie nic przeciwko spoilerom. Po przeszukaniu sieci, znalazłem kilka plików na Bandcampie, które rzeczywiście zostały wydane w 24-bitowych bezstratnych plikach. Wiele z tych, które znalazłem na rzekomych stronach „HD Audio” było po prostu up-converted z 16-bitów, co oznacza, że były identyczne pod każdym względem, poza ceną. Następnie wykonałem następującą procedurę:
- Zrób kopię oryginalnego 24-bitowego pliku
- Otwórz w wybranym programie do edycji audio (sugeruję Audacity), i odwróć plik; zapisz jako 16-bit/44.1kHz WAV
- Otwórz zarówno plik macierzysty, jak i nowo wyedytowany i wyeksportuj je jako jedną ścieżkę
- Otwórz zmiksowaną ścieżkę w dowolnym programie, który pozwala na wyświetlenie tak zwanego spektrogramu
- Pomachaj sobie, że wydałeś mnóstwo pieniędzy na dźwięk Hi-res
Podstawowo to, co właśnie zrobiliśmy, to wzięcie pliku 96kHz/24-bit, następnie odejmujemy wszystkie dane, które można usłyszeć w wersji o jakości CD. To co pozostało to różnica pomiędzy tymi dwoma plikami! To jest dokładnie ta sama zasada, na której opiera się Aktywna Redukcja Hałasu. Oto wynik jaki otrzymałem:
Jakkolwiek te małe fioletowe bity są widoczne na spektrogramie, są one znacznie poniżej progu słyszalności w obecności muzyki.
Okay, więc jest trochę różnicy w najwyższych partiach pliku, ale to jest poza zakresem ludzkiego słuchu. W rzeczywistości, prawdopodobnie powinieneś po prostu odfiltrować to tak czy inaczej. Pokażmy więc, co człowiek może usłyszeć, stosując filtr dolnoprzepustowy przy 20kHz, tak dla pewności. Et voila: ostateczny szczyt… -85dB w najlepszym przypadku. Ok, trochę omijamy krawędzie słyszalności, ale problem w tym, że aby usłyszeć jakiekolwiek z tych dodatkowych danych, musisz to zrobić:
- Słuchać muzyki na poziomie, który jest niebezpieczny do słuchania przez dłużej niż 1 minutę (96+dB)
- Mieć mikrofony w uszach
Choć ten ostatni punkt może wydawać się nieco snarky, wiemy, że twój mózg filtruje dźwięki, które są blisko siebie pod względem częstotliwości (patrz: maskowanie słuchowe, link powyżej). Więc kiedy słuchasz muzyki, w rzeczywistości nie słyszysz wszystkich dźwięków na raz, słyszysz tylko to, co twój mózg wyodrębnił dla ciebie. Tak więc, aby usłyszeć różnicę między plikami 24-bit/96kHz a dźwiękiem o jakości CD: poszczególne dźwięki mogą zajmować tylko bardzo wąski zakres częstotliwości, być bardzo głośne, a inne nuty, które występują w tym samym czasie muszą być bardzo odległe od siebie pod względem częstotliwości.
Nie ma bezpiecznego poziomu odsłuchu, aby usłyszeć różnicę między tymi plikami.
Jeśli nauczyliśmy się czegoś z tego fiaska Yanny/Laurel, ludzki głos nie pasuje do tych kryteriów (uwaga redaktora: to „Laurel”). Więc naprawdę, najbardziej prawdopodobne miejsca, w których faktycznie będzie można usłyszeć różnice między nimi są w niskich częstotliwości notatek z nieco wyciszonych harmonicznych. Ale jest pewien haczyk: Ludzie są naprawdę kiepscy w słyszeniu dźwięków o niskich częstotliwościach. Aby usłyszeć te dźwięki z taką samą głośnością jak dźwięki o wyższej częstotliwości, będziesz potrzebował od 10 do 40dB dodatkowej mocy. Tak więc te szczyty na poziomie -87dB w zakresie od 20-90Hz mogą równie dobrze wynosić od -97 do -127dB, co jest poza zakresem ludzkiego słuchu. Nie ma bezpiecznego poziomu odsłuchu, aby usłyszeć różnicę pomiędzy tymi plikami.
Cool, huh? Zawsze dobrze jest wiedzieć, że każdy, kto przychodzi i mówi ci, że twoja kolekcja muzyki musi być kupiona ponownie, ponieważ nie jest wystarczająco „high-def”, jest ewidentnie w błędzie. Jeśli jesteś początkującym audiofilem, rzecz, którą powinieneś z tego wynieść to relaks: jesteśmy w złotej erze audio – jakość CD jest więcej niż wystarczająco dobra, po prostu ciesz się swoją muzyką! Podczas gdy niektórzy mogą poszukiwać wyższej jakości dźwięku, nie jest to konieczne, jeśli wszystko, co chcesz zrobić, to słuchać dobrej muzyki.