Audio cu bitrate mare este exagerat: Calitatea CD-ului este încă grozavă

iunie 12, 2021admin

Toată lumea își dorește un sunet excelent, dar uneori căutările noastre de îmbunătățire ne conduc pe niște coridoare foarte întunecate și… proaste… Așa cum se întâmplă în cazul multor discipline, în cazul muzicii, un pic de cunoaștere duce departe. Este posibil să fi văzut discuții online în legătură cu adâncimea de biți și ratele de eșantionare, dar ceea ce probabil nu știți este că nu există o setare magică care va face ca totul să sune mai bine. Acest lucru se datorează faptului că muzica digitală, așa cum este ea astăzi, a lăsat deja limitele noastre de percepție în oglinda retrovizoare. Nu aveți nevoie de fișiere de o calitate nebună de înaltă calitate decât dacă creați muzică ce necesită o editare intensă.

Chiar dacă nu sunt străin să dau vești proaste, ca orice jurnalist bun, arăt dovezile mele. Adevărul este că, la un moment dat, oamenii pur și simplu nu pot percepe diferența dintre fișiere, iar tu nu ar trebui să te lași atras de campania de marketing dacă este mai scump decât ceea ce ai deja. Deși nu mă îndoiesc că formatele precum MQA sunt impresionante din punct de vedere tehnologic, cei mai mulți nu vor putea aprecia cu adevărat fidelitatea sporită. Șansele sunt aproape de 100% ca biblioteca dvs. actuală să fie perfect în regulă.

Aveți nevoie doar de o rată de eșantionare de 44,1kHz

Dacă v-ați uitat la fila de informații a playerului dvs. muzical, este posibil să observați că unele dintre melodiile dvs. au rate de eșantionare de 44,1kHz, sau 48kHz. De asemenea, este posibil să observați că DAC-ul dvs. sau un telefon, cum ar fi LG V30, acceptă fișiere cu rate de eșantionare de până la 384kHz.

Acestea sunt exagerate. Nimeni pe Pământul verde al lui Dumnezeu nu va ști sau nu-i va păsa de diferență, deoarece urechile noastre nu sunt atât de sensibile. Nu mă credeți? Este timpul pentru niște calcule matematice. Pentru a înțelege care este limita percepției umane pentru frecvențele de eșantionare, trebuie să identificăm trei lucruri:

Limita frecvențelor pe care le puteți auzi
Care este frecvența minimă de eșantionare necesară pentru a satisface această gamă (2 x cea mai mare frecvență audibilă în Hz)
Frecvența de eșantionare a fișierelor dvs. muzicale depășește acest număr?

Sună destul de simplu, și este. Cea mai comună gamă a auzului uman atinge maximul la aproximativ 20kHz, ceea ce înseamnă 20.000 de perioade pe secundă. De dragul discuției, să extindem această gamă până la limitele cele mai înalte a ceea ce știm că este posibil: 22kHz. Dacă doriți să verificați limitele auzului dumneavoastră, utilizați acest instrument pentru a găsi limitele superioare ale percepției dumneavoastră. Asigură-te doar că nu setezi volumul prea tare înainte de a face acest lucru. Dacă aveți peste 20 de ani, acest număr ar trebui să fie de aproximativ 16-17kHz, mai mic dacă aveți peste 30 de ani, și așa mai departe.

Dacă auzul dumneavoastră nu poate atinge nimic mai sus de 22,05kHz, atunci fișierul de 44,1kHz poate depăși gama de frecvențe pe care le puteți auzi.

Utilizând teorema de eșantionare Nyquist-Shannon, știm că o rată de eșantionare care oferă două eșantioane pe perioadă este suficientă pentru a reproduce un semnal (în acest caz, muzica dvs.). 2 x 22.000 = 44.000, sau puțin sub cele 44.100 de eșantioane pe secundă oferite de o rată de eșantionare de 44,1kHz. Orice depășire a acestui număr nu vă va oferi prea multe îmbunătățiri, deoarece pur și simplu nu puteți auzi frecvențele pe care o rată de eșantionare crescută le-ar debloca pentru dumneavoastră.

O diagramă care arată jitterul ca rezultat al insuficienței ratei de eșantionare audio.

Orice rată de eșantionare care depășește dublul frecvenței va fi perfect reprezentată (mai sus). Doar atunci când rata de eșantionare scade sub acest punct apar probleme (mai jos).

În plus, frecvențele pe care le auziți la capătul cel mai înalt se diminuează în timp, pe măsură ce îmbătrâniți, aveți infecții ale urechii sau sunteți expus la sunete puternice. De exemplu, eu nu pot auzi nimic peste 16kHz. Acesta este motivul pentru care, pentru urechile mai în vârstă, muzica are mai puțină distorsiune audibilă dacă folosiți un filtru trece-jos pentru a scăpa de sunetele pe care nu le puteți auzi – va face ca muzica să sune mai bine, chiar dacă, din punct de vedere tehnic, nu este la fel de „high-def” ca fișierul original. Dacă auzul dvs. nu poate atinge nimic mai sus de 22,05kHz, atunci fișierul de 44,1kHz poate depăși cu ușurință gama de frecvențe pe care le puteți auzi.

Audio pe 16 biți este bun pentru toată lumea

Un alt mit al calității audio este acela că audio pe 24 de biți va debloca un fel de nirvana audiofilă, deoarece este mult mai densă din punct de vedere al datelor, dar în ceea ce privește percepția audio, orice îmbunătățire va fi pierdută pentru urechile umane. Capturarea mai multor date pe eșantion are beneficii pentru gama dinamică, dar beneficiile sunt destul de mult exclusiv în domeniul înregistrării.

Chiar dacă este adevărat că un fișier pe 24 de biți va avea o gamă dinamică mult mai mare decât un fișier pe 16 biți, 144dB de gamă dinamică este suficient pentru a rezolva un țânțar lângă o lansare de rachetă Saturn V. Deși acest lucru este foarte bine, urechile dvs. nu pot auzi această diferență de sunet datorită unui fenomen numit mascare auditivă. Fiziologia dvs. face ca sunetele mai silențioase să fie înăbușite de cele mai puternice și, cu cât sunt mai apropiate ca frecvență una de cealaltă, cu atât mai mult sunt mascate de creier. Cu îmbunătățiri cum ar fi dithering-ul, sunetul audio pe 16 biți poate rezolva „pur și simplu” țânțarul menționat mai sus alături de decolarea unui motor cu reacție de 120dB. Tot o exagerare dramatică.

O spectrogramă care arată cum arată un fișier muzical pe 24 de biți fără să fie eliminate datele din el.

Aceasta este modul în care arată un fișier muzical pe 24 de biți înainte de a fi eliminate datele. Frecvența este axa Y, timpul este axa X, iar intensitatea este culoarea.

Cu toate acestea, sunetele mai silențioase sunt cele despre care mulți audiofili susțin că reprezintă marea diferență, iar acest lucru este parțial adevărat. De exemplu, o gamă dinamică mai largă vă permite să ridicați volumul mai mult fără a crește zgomotul audibil, iar acesta este marele punct de suspensie aici. În timp ce fișierele pe 24 și chiar 32 de biți își au locul lor în cabina de mixaj, oferă ele vreun beneficiu pentru fișierele MP3, FLAC sau OGG?

Ei, copii, încercați asta acasă!

În timp ce colegul meu Rob de la Android Authority a demonstrat deja acest lucru cu un osciloscop și cu niște cercetări dure, noi vom efectua un experiment pe care îl puteți face singur – sau doar citi dacă nu vă deranjează spoilerele. După ce am răscolit internetul, am găsit câteva fișiere pe Bandcamp care au fost de fapt lansate în fișiere lossless pe 24 de biți. Multe dintre cele pe care le-am găsit pe site-urile pretins „HD Audio” erau pur și simplu upconvertite de pe 16 biți, ceea ce înseamnă că erau identice din toate punctele de vedere, cu excepția prețului. În continuare, am urmat această procedură:

Faceți o copie a fișierului original pe 24 de biți
Deschideți în programul de editare audio ales (sugerez Audacity) și inversați fișierul; salvați-l ca 16-bit/44.1kHz WAV
Deschideți atât fișierul părinte, cât și fișierul nou editat și exportați-l ca o singură piesă
Deschideți piesa mixată în orice program care vă permite să vizualizați ceea ce se numește spectrogramă
Râdeți în sinea dvs. de faptul că ați cheltuit o grămadă de bani pe audio Hi-res

În esență, ceea ce tocmai am făcut aici este să luăm un fișier de 96kHz/24 biți, apoi să scădem toate datele pe care le puteți auzi într-o versiune de calitate CD a sa. Ceea ce a rămas este diferența dintre cele două! Acesta este exact același principiu pe care se bazează Active Noise Canceling. Acesta este rezultatul pe care l-am obținut:

O spectrogramă care arată diferența de sunet între fișierele pe 24 de biți/96kHz și fișierele muzicale pe 16 biți/44,1kHz la calitate de CD.

În timp ce acei mici biți purpurii sunt vizibili în spectrogramă, ei sunt cu mult sub pragul de audibilitate în prezența muzicii.

Bine, deci există o mică diferență în zonele cele mai înalte ale fișierului, dar aceasta este în afara domeniului de audiție umană. De fapt, ar trebui probabil să filtrați asta oricum. Așa că haideți să arătăm ce poate auzi de fapt un om, aplicând o trecere joasă la 20kHz, doar pentru a ne acoperi bazele. Et voila: un vârf final de… -85dB în cel mai bun caz. Bine, ne apropiem de limitele audibilității, dar iată care este problema – pentru a auzi aceste date suplimentare, trebuie să le auziți:

Să ascultați muzică la un nivel care nu este sigur de ascultat pentru mai mult de 1 minut (96+dB)
Aveți microfoane pentru urechi

În timp ce acest ultim punct poate părea un pic răutăcios, știm că creierul dumneavoastră filtrează sunetele care sunt apropiate în frecvență una de cealaltă (vezi: mascarea auditivă, legată mai sus). Așadar, atunci când ascultați muzică, de fapt nu auziți toate sunetele deodată, ci doar ceea ce creierul dumneavoastră a separat pentru dumneavoastră. Așadar, pentru a auzi diferența dintre fișierele pe 24 biți/96kHz și cele audio de calitate CD: sunetele individuale pot ocupa doar o gamă foarte îngustă de frecvențe, pot fi foarte puternice, iar celelalte note care apar în aceeași perioadă de timp trebuie să fie foarte îndepărtate din punct de vedere al frecvenței.

Nu există un nivel de ascultare sigur pentru a auzi diferența dintre aceste fișiere.

Dacă am învățat ceva din acest fiasco Yanny/Laurel, o voce umană nu se potrivește acestor criterii (Nota redacției: Este „Laurel”). Așa că, într-adevăr, cele mai probabile locuri în care ați putea auzi cu adevărat diferențele dintre cele două sunt în notele de frecvență joasă cu armonice oarecum înăbușite. Dar există o capcană: Oamenii nu se pricep deloc să audă sunetele de frecvență joasă. Pentru a auzi aceste note la o intensitate egală cu cea a notelor de frecvență înaltă, veți avea nevoie de o putere suplimentară cuprinsă între 10 și 40dB. Așadar, acele vârfuri de -87dB în gamele de 20-90Hz ar putea la fel de bine să fie între -97 și -127dB, ceea ce se află în afara domeniului de audiție umană. Nu există un nivel de ascultare sigur pentru a auzi diferența dintre aceste fișiere.

Chiar, nu-i așa? Este întotdeauna bine de știut că oricine vine și vă spune că colecția dvs. de muzică trebuie să fie cumpărată din nou pentru că nu este suficient de „high-def” se înșeală în mod demonstrabil. Dacă sunteți un audiofil în devenire, ceea ce trebuie să rețineți de aici este să vă relaxați: ne aflăm într-o epocă de aur a audio – calitatea CD-urilor este mai mult decât bună, bucurați-vă de muzică! În timp ce unii pot căuta o calitate audio superioară, nu este necesar dacă tot ceea ce vreți să faceți este să ascultați muzică bună.