Przewodnik: dźwięk cyfrowy od A do Z

Czy jakieś określenia stosowane w opisach sprzętu audio wywołują u Ciebie dezorientację? Pomoże Ci ten przygotowany przez nas krótki przewodnik.


Podstawy: sposób rejestracji dźwięku cyfrowego

Rzeczywiste brzmienie stale podlega zmianom, dlatego nagrania cyfrowe stanowią tylko pewne przybliżenie pełnego spektrum dźwięków spotykanych w naturze. Jednak postępy w technice nagraniowej poszerzają nieustannie zakres i precyzję tego, co można zarejestrować cyfrowo.

Podczas cyfrowego nagrywania sygnału dźwiękowego pochodzącego ze źródła analogowego, np. koncertu na żywo lub utworów wykonywanych przez muzyków w studiu nagraniowym, dźwięk jest próbkowany w regularnych odstępach czasu. Amplituda dźwięku jest rejestrowana w formie określonej liczby, przez co cyfrowe nagranie analogowego sygnału dźwiękowego ma postać ciągu liczb.

To, jak wiele ze źródłowego sygnału analogowego uda się uchwycić w nagraniu cyfrowym zależy głównie od częstotliwości próbkowania (liczby próbek rejestrowanych w ciągu sekundy) i głębi bitowej (ilości informacji zawartej w każdej próbce).

Zapisywanie i przechowywanie cyfrowych nagrań dźwiękowych

Po dokonaniu nagrania cyfrowego można je przechowywać w wielu różnych formatach. Każdy z nich cechuje się innym kompromisem między jakością dźwięku a rozmiarem wynikowego pliku cyfrowego, np. nagrania o najwyższej jakości nie sprawdzały się zwykle ze względów praktycznych w małych, przenośnych odtwarzaczach muzycznych.

Jednak wraz ze zwiększaniem pojemności pamięci masowej w odtwarzaczach przenośnych, która sięga już wielu gigabajtów, dźwięk cyfrowy o bardzo wysokiej jakości staje się łatwo dostępny dla milionów użytkowników.

Alfabetyczny przewodnik po funkcjach dźwiękowych

5.1-kanałowy
7.1-kanałowy
Analogowy
Głębia bitowa
Kodek
Kompresja
Cyfrowy
Dolby Digital
Dolby True HD
DSD
DSEE HX
DTS Digital Surround
DTS Master Audio
Dźwięk o wysokiej rozdzielczości
LDAC
LFE
Bezstratny
Stratny
LPCM
S-Master HX
SA-CD
Częstotliwość próbkowania
SBC
Subwoofer
Dźwięk przestrzenny
Poprawa jakości

5.1-kanałowy

Sposób odtwarzania dźwięku przestrzennego zapewniający wrażenia zbliżone do znanych z sali kinowej. Wokół słuchacza rozmieszczonych jest pięć głośników, którym towarzyszy jeden subwoofer, przy czym do każdego głośnika dociera sygnał innego kanału dźwiękowego:

  1. dwa kanały przednie,
  2. jeden przedni kanał centralny,
  3. dwa kanały „dźwięku przestrzennego”,
  4. jeden kanał efektów niskoczęstotliwościowych (ang. low frequency effects, LFE).

Subwoofer (czyli głośnik subniskotonowy), który odbiera sygnał kanału LFE, można ustawić w pokoju w dowolnym miejscu. Zapewnia to oszczędność miejsca w porównaniu z zestawami dźwięku przestrzennego pozbawionymi subwoofera: wszystkie sygnały niskich częstotliwości są kierowane do subwoofera, więc pozostałe głośniki mogą mieć mniejsze wymiary, gdyż nie odtwarzają zakresu basowego. Patrz również 7.1-kanałowy

7.1-kanałowy

7.1-kanałowy zestaw dźwięku przestrzennego składa się z 7 głośników i subwoofera. Jest podobny do zestawu 5.1-kanałowego, ale ma dwa dodatkowe „tylne kanały dźwięku przestrzennego”.

Analogowy

Nagrywanie analogowe polega na rejestracji dźwięku źródłowego poprzez modyfikowanie stanu nośnika fizycznego, np. taśmy magnetycznej lub płyty winylowej. Odbiega to od sposobu rejestracji nagrań cyfrowych.

Głębia bitowa

Głębia bitowa nagrania cyfrowego wyznacza ilość informacji służącą do zapisu każdej próbki sygnału analogowego. Standardowa głębia bitowa w przypadku nagrań na płytach audio CD wynosi 16 przy częstotliwości próbkowania ustalonej na 44,1 kHz. Oznacza to rejestrowanie w ciągu każdej sekundy 44 100 próbek zawierających po 16 bitów informacji. Ogólnie im większa głębia bitowa, tym lepsza jakość dźwięku, ale też większy rozmiar pliku.

Dźwięk o wysokiej rozdzielczości cechuje się głębią bitową wynoszącą co najmniej 24 bity przy częstotliwości próbkowania co najmniej 96 kHz.

Kodek

Dźwięk zarejestrowany w postaci cyfrowej musi zawsze przechodzić przez koder-dekoder, nazywany w skrócie „kodekiem”. Jest to składnik oprogramowania lub urządzenia, który przyjmuje analogowy sygnał dźwiękowy i „koduje” go w formacie cyfrowym możliwym do zapisania w postaci elektronicznej. Natomiast w przypadku odtwarzania kodek „dekoduje” plik cyfrowy umożliwiając reprodukcję dźwięku analogowego.

Każdy kodek dźwiękowy korzysta z innej metody kodowania sygnału analogowego, więc cechuje się własnym zestawem wad i zalet w odniesieniu do przechowywania i odtwarzania dźwięku.

Kompresja

Nagrywanie dźwięku cyfrowego może powodować powstawanie plików o bardzo dużych rozmiarach, co ogranicza ich praktyczne zastosowania, np. liczbę utworów, jaką można zmieścić w cyfrowym odtwarzaczu muzycznym. Z tego powodu w większości formatów plików dźwiękowych stosuje się jakiś rodzaj kompresji, która pomija część informacji o dźwięku na rzecz zmniejszenia rozmiaru przechowywanego pliku.

Sposób kompresji dźwięku i jego późniejszej dekompresji przy odtwarzaniu wpływa na ostateczną jakość brzmienia. Formaty plików, w których przypadku kompresja prowadzi do utraty części informacji, nazywa się stratnymi. Formaty plików, które zachowują wszystkie informacje o dźwięku lub umożliwiają ich rekonstrukcję podczas odtwarzania, nazywa się bezstratnymi.

Cyfrowy

W odróżnieniu od nagrań analogowych cyfrowa rejestracja dźwięku powoduje jego zamianę w ciąg liczb, który można przechowywać elektronicznie (np. na płycie CD czy na dysku twardym), a następnie przekształcać ponownie w dźwięk podczas odtwarzania. Popularnym cyfrowym formatem plików jest np. MP3.

Dolby Digital

Standardowy stratny format audio stosowany na płytach DVD oraz jako format podstawowy na płytach Blu-ray. Mimo że jest formatem stratnym, zapewnia jakość wystarczającą do użycia w kinach. Wprawdzie brzmienie jest nieco gorsze w porównaniu z formatem DTS Digital Surround, ale wyższy stopień kompresji oznacza mniejszy rozmiar plików i z tego powodu format Dolby Digital jest bardziej rozpowszechniony.

Dolby True HD

Bezstratny format kompresji dźwięku zbliżony do DTS Master Audio. Oba są stosowane na płytach Blu-ray jako opcjonalne formaty dźwięku.

DSD (Direct Stream Digital)

Direct Stream Digital (DSD) to metoda cyfrowego nagrywania dźwięku z wyjątkowo dużą częstotliwością próbkowania, która przekracza nawet stosowaną w przypadku dźwięku o wysokiej rozdzielczości oraz jest 64-128 razy większa od obowiązującej na płytach audio CD. Niektórzy inżynierowie dźwięku są zdania, że pliki cyfrowe zapisane tą metodą zapewniają brzmienie najbardziej zbliżone do źródłowego sygnału analogowego. Niektóre urządzenia firmy Sony do reprodukcji dźwięku o wysokiej rozdzielczości umożliwiają odtwarzanie formatu DSD.

DSEE HX

Digital Sound Enhancement Engine (DSEE) HX to unikatowa, opracowana przez firmę Sony technologia poprawy jakości. Podczas odtwarzania cyfrowego dźwięku w formacie z kompresją algorytm DSEE HX rekonstruuje na bieżąco utracone wysokie częstotliwości, zapewniając jakość zbliżoną do dźwięku o wysokiej rozdzielczości. Poprawa brzmienia dotyczy całego sygnału dźwiękowego odtwarzanego przez urządzenia wyposażone w technologię DSEE HX, dzięki czemu można poczuć się jak w studiu nagraniowym lub na sali koncertowej.

DTS Digital Surround

Standardowy stratny format audio stosowany na płytach DVD oraz jako format podstawowy na płytach Blu-ray. Zapewnia lepszą jakość brzmienia niż Dolby Digital, ale jest mniej rozpowszechniony ze względu na większy rozmiar zapisywanych w nim plików.

DTS Master Audio

Bezstratny format kompresji dźwięku zbliżony do Dolby True HD. Oba są stosowane na płytach Blu-ray jako opcjonalne formaty dźwięku.

Dźwięk o wysokiej rozdzielczości

Określenie „dźwięk o wysokiej rozdzielczości” (ang. Hi-Res Audio) odnosi się zwykle do nagrań cyfrowych o częstotliwości próbkowania co najmniej 96 kHz i głębi bitowej przynajmniej 24 bity. Takie parametry zapewniają znacznie lepszą jakość brzmienia niż uzyskiwana w przypadku płyt CD i plików MP3 — standardowa płyta audio CD cechuje się parametrami 44,1 kHz/16 bitów.

Obecność logo Hi-Res Audio na produkcie firmy Sony gwarantuje, że został on zaprojektowany pod kątem maksymalnego wykorzystania zalet dźwięku o wysokiej rozdzielczości. Bogaty asortyment produktów Hi-Res Audio firmy Sony umożliwia zbudowanie kompletnego systemu do odtwarzania dźwięku o wysokiej rozdzielczości: od przenośnych odtwarzaczy muzycznych i słuchawek aż po kolumny głośnikowe i pełne zestawy kina domowego.

Więcej informacji na temat dźwięku o wysokiej rozdzielczości

LDAC

LDAC to kodek audio firmy Sony, który umożliwia bezprzewodowe odtwarzanie dźwięku o wysokiej jakości za pośrednictwem połączenia Bluetooth.

Podczas przesyłania dźwięku przez Bluetooth stosowany jest zwykle standardowy kodek Bluetooth SBC, który może powodować utratę jakości. Kodek LDAC zapewnia przesyłanie 3-krotnie większej ilości danych niż SBC, zachowując wysoką jakość brzmienia przy korzystaniu z Bluetooth i zwiększając komfort bezprzewodowego słuchania wszelkich rodzajów muzyki.

LFE

Kanał efektów niskoczęstotliwościowych (ang. Low-Frequency Effects, LFE) to osobna ścieżka dźwiękowa z najniższą częścią pasma materiału dźwiękowego z zakresu 3-120 Hz, który zawiera np. dudniące efekty akustyczne znane z filmowych ścieżek dźwiękowych. W zestawie dźwięku przestrzennego sygnał tego kanału jest zwykle kierowany do subwoofera.

Bezstratny

Bezstratny format audio, który umożliwia zapis dźwięku cyfrowego w sposób zapewniający albo zachowanie całości oryginalnych informacji cyfrowych, albo ich pełną rekonstrukcję podczas odtwarzania. Do bezstratnych formatów audio należą:

  1. DSD (DFF),
  2. DSD (DSF),
  3. WAV,
  4. AIFF,
  5. FLAC,
  6. ALAC.

Stratny

W przypadku stratnego formatu audio część informacji z oryginalnego nagrania cyfrowego jest usuwana w celu zaoszczędzenia miejsca na nośniku, natomiast podczas odtwarzania wszystko podporządkowane jest maksymalnemu zbliżeniu się do jakości brzmienia oryginału. W przypadku każdego formatu zdecydowano się na inny kompromis między stopniem kompresji decydującym o oszczędności miejsca na nośniku a zachowaniem informacji wpływających w największym stopniu na jakość brzmienia.

Do stratnych formatów audio należą:

LPCM

Liniowa impulsowa modulacja kodowa (ang. Linear Pulse Code Modulation, LPCM) stanowi podstawę cyfrowego nagrywania dźwięku. Sygnał analogowy jest próbkowany w regularnych odstępach czasu, a jego amplituda rejestrowana w formie punktu na skali liczbowej. Brak przetwarzania i kompresji danych umożliwia wprawdzie uzyskanie jakości brzmienia identycznej z profesjonalnymi nagraniami studyjnymi, ale pliki w formacie LPCM mają bardzo duże rozmiary, więc są niepraktyczne w codziennych zastosowaniach.

Częstotliwość próbkowania decyduje o dokładności oryginalnego strumienia cyfrowego.

S-Master HX

Opracowana przez firmę Sony technologia budowania wzmacniaczy cyfrowych specjalnie na potrzeby dźwięku o wysokiej rozdzielczości w celu obniżenia poziomu szumów i zniekształceń w szerokim zakresie częstotliwości. Układ S-Master bezpośrednio wzmacnia sygnały cyfrowe — zamiast wcześniejszego przeprowadzania ich konwersji do postaci analogowej — więc zachowuje czystość oryginalnego sygnału w celu wierniejszej reprodukcji dźwięku.

SA-CD

Super Audio CD to format płyt opracowany przez firmę Sony na potrzeby nagrań dźwiękowych w formacie DSD, które znacznie przekraczają możliwości płyt CD pod względem dynamiki. W przypadku standardowych płyt audio CD dynamika wynosi 96 db, a dla płyt SA-CD — aż 120 db. Częstotliwość próbkowania dźwięku na płytach SA-CD wynosi 2,8 MHz, czyli 64 razy więcej niż w przypadku standardowych płyt CD.

W odróżnieniu od zwykłych płyt audio CD na dyskach SA-CD można rejestrować nie tylko dźwięk 2-kanałowy (stereofoniczny), ale również 5.1-kanałowy dźwięk przestrzenny. Dane audio na płytach SA-CD są szyfrowane w celu ochrony przed kopiowaniem, co oznacza, że można je odtwarzać za pośrednictwem przewodów analogowych, i-Link i HDMI, ale nie przy użyciu cyfrowych przewodów optycznych i elektrycznych (koncentrycznych).

Częstotliwość próbkowania

Podczas cyfrowego nagrywania sygnału dźwiękowego pochodzącego ze źródła analogowego częstotliwość próbkowania wyznacza odstępy czasu pomiędzy kolejnymi próbkami, a im większa jest jej wartość, tym mniej traci się z pierwotnego materiału audio. Na przykład w przypadku płyt audio CD standardowa częstotliwość próbkowania wynosi 44,1 kHz, co oznacza rejestrowanie 44 100 próbek w ciągu każdej sekundy.

Ogólnie im wyższa częstotliwość próbkowania, tym lepsza jakość nagrań. Dźwięk o wysokiej rozdzielczości cechuje się częstotliwością próbkowania co najmniej 96 kHz oraz głębią bitową wynoszącą przynajmniej 24 bity.

SBC

Standardowy kodek audio do przesyłania dźwięku cyfrowego za pośrednictwem połączenia Bluetooth. W jego przypadku efektywność korzystania z dostępnej przepustowości łącza potraktowano priorytetowo kosztem jakości brzmienia, więc nie najlepiej nadaje się on do przesyłania dźwięku o wysokiej jakości. Opracowany przez firmę Sony kodek LDAC zapewnia przesyłanie 3-krotnie większej ilości danych niż SBC, zachowując wysoką jakość brzmienia przy korzystaniu z Bluetooth.

Subwoofer

W 5.1- oraz 7.1-kanałowych zestawach dźwięku przestrzennego subwoofer (czyli głośnik subniskotonowy) odtwarza tylko dźwięki o niskiej częstotliwości lub sygnał z osobnego kanału LFE. Nasz aparat słuchu słabo radzi sobie z określaniem kierunku, z jakiego docierają dźwięki o niskiej częstotliwości, więc subwoofer można ustawić w pokoju w dowolnym miejscu.

Wszystkie sygnały niskich częstotliwości są kierowane do subwoofera, dzięki czemu pozostałe głośniki mogą mieć mniejsze wymiary, a zatem cały zestaw zajmuje mniej miejsca.

Dźwięk przestrzenny

W przypadku 5.1- i 7.1-kanałowych zestawów dźwięku przestrzennego sygnały osobnych kanałów audio są kierowane do głośników rozmieszczonych wokół słuchacza, co uatrakcyjnia odbiór materiału dźwiękowego. Składnik .1 odnosi się do użycia subwoofera, czyli dodatkowego głośnika niskotonowego.

Poprawa jakości

Podczas odtwarzania cyfrowych nagrań dźwiękowych zapisanych w formacie stratnym można czasami wypełnić pewne „luki” w skompresowanym materiale audio poprzez matematyczne oszacowanie danych, które powinny występować w sygnale źródłowym. Nazywa się to „poprawą jakości”, ponieważ proces ten polega na polepszaniu nagrań o niskiej jakości do szacunkowego poziomu brzmienia nagrań o wysokiej jakości.

Opracowany przez firmę Sony, unikatowy algorytm DSEE HX podnosi jakość dotychczasowych źródeł dźwięku niemal do poziomu brzmienia dźwięku o wysokiej rozdzielczości.