Filtracja Dźwięku WAV: Metody i Zastosowania

W dziedzinie dźwięku, dithering odgrywa istotną rolę w procesie obróbki audio. Dithering to proces stosowany w dziedzinie dźwięku w celu poprawy jakości dźwięku i redukcji artefaktów.

Czym jest Dithering?

Dithering polega na dodawaniu szumu o niskiej amplitudzie do sygnału audio, aby zminimalizować artefakty kwantyzacyjne powstające podczas konwersji cyfrowo-analogowej lub redukcji bitowej. Pozwala on na zmniejszenie zakłóceń wynikających z kwantyzacji sygnału audio i poprawę rozdzielczości.

Głównym powodem zastosowania ditheringu jest redukcja artefaktów kwantyzacyjnych, które mogą pojawić się podczas konwersji cyfrowo-analogowej lub redukcji bitowej. Dodatkowo, dithering może również poprawić rozdzielczość sygnału audio, szczególnie w przypadku sygnałów o niskim poziomie.

Dithering ściśle łączy się z zagadnieniem próbkowania i częstotliwości Nyquista. Dithering powinien być wykonywany tylko raz - w ostatnim etapie produkcji - ponieważ wielokrotne ditheringi kumulują szum. Niektóre programy DAW oferują automatyczne stosowanie ditheringu przy eksporcie, ale warto upewnić się, że jest on włączony tylko przy zmniejszaniu bit‑depth.

Dithering polega na dodaniu kontrolowanego szumu do sygnału audio w celu zminimalizowania zniekształceń kwantyzacji przy konwersji do niższego bitu; dzięki temu brzmienie pozostaje naturalne, zwłaszcza w cichszych fragmentach. Technika ta jest kluczowa, gdy eksportujesz nagranie z 24‑bitowego zapisu do 16‑bitowego formatu CD.

Przeczytaj także: Definicja i pomiar filtracji kłębuszkowej

Warto wspomnieć, że dither stosuje się także przy publikacji utworów w formatach stratnych (MP3, AAC), by zachować naturalne wybrzmienie.

Metody Ditheringu

Proces ditheringu polega na dodaniu szumu o niskim poziomie do sygnału audio przed przeprowadzeniem kwantyzacji. Poprzez wprowadzenie szumu ditheringowego, sygnał audio staje się bardziej losowy, co przyczynia się do zmniejszenia słyszalności artefaktów kwantyzacyjnych.

Istnieją różne typy szumów ditheringowych - np. równomiernie rozłożony (rectangular), trójkątny (triangular) i z ważeniem psychoakustycznym (noise shaping). Istnieje kilka różnych metod ditheringu, z których każda oferuje unikalne cechy i efekty.

Poniżej przedstawiono tabelę z opisem różnych metod ditheringu:

Metoda DitheringuOpis
Równomierny szumProsta metoda, która polega na dodaniu równomiernego szumu do sygnału audio. Jest to najbardziej podstawowa i powszechnie stosowana metoda ditheringu.
Triangular Noise ShapingTa metoda wykorzystuje tzw. „kształtowanie szumu”, aby przenieść szum poza słyszalne pasmo częstotliwości. Pozwala to skupić energię szumu w wyższych częstotliwościach, minimalizując jego słyszalność.
High-Pass Noise ShapingMetoda ta polega na filtracji szumu ditheringowego za pomocą filtru dolnoprzepustowego. Pozwala to skoncentrować energię szumu w niższych częstotliwościach, co może być korzystne w niektórych sytuacjach.
Noise Shaping z wykorzystaniem algorytmów psychoakustycznychTa zaawansowana metoda ditheringu wykorzystuje informacje dotyczące percepcji dźwięku przez ludzkie ucho.

Wybór odpowiedniej metody ditheringu zależy od preferencji i potrzeb realizatora dźwięku. Ważne jest, aby eksperymentować z różnymi metodami i dostosować ustawienia ditheringu do konkretnego projektu.

Przeczytaj także: Webber AP8400 - wymiana filtrów

Zastosowanie Ditheringu

Dithering, czyli proces dodawania losowego szumu do sygnału audio, ma szerokie zastosowanie w branży muzycznej i filmowej. W kontekście nagrywania i miksowania dźwięku oraz procesu masteringu, dithering odgrywa istotną rolę w zapewnieniu jak najwyższej jakości dźwięku.

Podczas nagrywania i miksowania dźwięku, dithering odgrywa ważną rolę w procesie konwersji cyfrowej. Kiedy sygnał audio jest zapisywany na nośniku cyfrowym, dochodzi do kwantyzacji, czyli zaokrąglania wartości sygnału do najbliższej wartości reprezentowanej przez bitowość danego formatu (np. 16-bit, 24-bit). Dithering polega na dodaniu niewielkiego sygnału szumowego o niskim poziomie do sygnału audio przed procesem kwantyzacji. Ten dodatkowy szum losowy maskuje artefakty kwantyzacyjne, sprawiając, że są one mniej słyszalne dla ludzkiego ucha.

W procesie masteringu, dithering ma za zadanie poprawę rozdzielczości sygnału audio przed finalnym etapem konwersji do niższego poziomu bitowości (np. 16-bit, 24-bit) dla ostatecznego zapisu na nośniku lub dystrybucji online. Przed dokonaniem konwersji do niższej bitowości, zastosowanie ditheringu może pozytywnie wpłynąć na dynamikę i szczegółowość dźwięku, szczególnie w cichych fragmentach.

Pamiętaj, że wybór odpowiedniej metody ditheringu oraz odpowiednie dostosowanie poziomu ditheringu do konkretnego projektu są kluczowe dla uzyskania najlepszych rezultatów. Praktyczne zastosowanie ditheringu wymaga również zrozumienia innych aspektów produkcji dźwięku, takich jak próbkowanie i częstotliwość nyquista.

Filtracja Częstotliwościowa w Odtwarzaczach MP3 na ARM

Dyskusja dotyczy implementacji filtracji częstotliwościowej sygnału audio w odtwarzaczu MP3 opartego na procesorach ARM7/9. Porównano dwie metody: filtrację w dziedzinie częstotliwości za pomocą FFT, mnożenia i IFFT oraz klasyczne filtry FIR/IIR z wcześniej obliczonymi współczynnikami.

Przeczytaj także: Optymalne rozcieńczenie bimbru

Analizy wydajności wskazują, że choć FFT/IFFT jest teoretycznie bardziej złożone obliczeniowo, to w praktyce na procesorach ARM7/9 może być porównywalne pod względem zużycia cykli do filtrów FIR/IIR. Jednakże, ze względu na zniekształcenia i komplikacje związane z przetwarzaniem blokowym FFT (np. zakładkowanie, nakładanie), metoda ta nie jest zalecana do filtracji dźwięku w zastosowaniach takich jak equalizer.

Filtry FIR i IIR, szczególnie IIR, są prostsze, bardziej stabilne i efektywne obliczeniowo, co potwierdzają benchmarki biblioteki DSP dla STM32. Przykładowo, filtr FIR 32-tapowy i IIR 4-biquad na 32 próbkach zajmują od 2000 do 3700 cykli, co jest znacznie mniej niż pełne FFT/IFFT.

W praktyce na ARM moc obliczeniowa potrzebna do filtracji FIR/IIR jest niewielka w porównaniu do wymagań dekodera MP3.

Strojenie Kodeków Audio w Systemach Wbudowanych

Projektanci starają się uzyskać dźwięk o wysokiej jakości poprzez użycie kodeków audio w projektach systemów wbudowanych opartych na mikrokontrolerach. W tym celu muszą nauczyć się, jak dostroić kodek audio do konkretnego zastosowania. Bez tego uzyskane brzmienie może być płaskie lub słabej jakości, nawet w przypadku dobrego kodeka i głośnika.

Rozwiązaniem umożliwiającym dostrojenie systemu odtwarzania dźwięku jest wykorzystanie własnych cyfrowych bloków filtrujących kodeka audio zamiast użycia filtrowania sprzętowego. Każdy kodek posiada taki blok, aby umożliwić deweloperom filtrowanie wyjścia za pomocą filtrów górnoprzepustowych, dolnoprzepustowych i pasmowo-przepustowych.

To, jak dźwięk wychodzący z systemu będzie brzmiał zależy od kilku różnych czynników. Po dokładnym rozważeniu tych czynników, deweloper szybko zdaje sobie sprawę, że dostrajanie systemu audio ma sens dopiero na końcowym etapie produkcyjnym. Jeśli zespół mechaników odpowiednio zaprojektował obudowę i mocowanie systemu, główną cechą, której deweloper musi uważnie się przyjrzeć, jest odpowiedź częstotliwościowa głośnika.

Patrząc na odpowiedzi częstotliwościowe poszczególnych głośników, jasne jest, że musi nastąpić pewnego rodzaju filtrowanie i dostrajanie, ponieważ istnieją częstotliwości, na których głośnik nie powinien być sterowany. Jedną z metod, która była używana w przeszłości do pozbywania się niechcianych częstotliwości, jest budowanie filtrów sprzętowych na dojściu do głośnika.

Na przykładowym schemacie blokowym 24-bitowego kodeka audio AKM Semiconductor AK4637 zaznaczono blok filtra cyfrowego. Deweloperzy mogą wybierać potrzebne im funkcje i włączać lub wyłączać blok lub kierować przez niego sygnał z mikrofonu bądź odtwarzany dźwięk.

W większości zastosowań dźwiękowych filtr górnoprzepustowy jest używany do usuwania niższych częstotliwości, a filtr dolnoprzepustowy jest do eliminowania częstotliwości wyższych. Do wygładzenia krzywej odpowiedzi częstotliwościowej lub do podkreślenia pewnych tonów można użyć korektora.

Deweloperzy zwykle nie mogą ot tak określić częstotliwości wejściowej kodeka. Zamiast tego istnieje równanie filtra służące do obliczania jego współczynników, które są następnie programowane w rejestrach kodeka w celu utworzenia filtra o żądanej częstotliwości.

Bloki filtrów cyfrowych zawarte w kodeku audio są często dość elastyczne i wydajne. Nawet niedrogi kodek audio zapewnia deweloperom narzędzia niezbędne do generowania dźwięku o wysokiej jakości.

Należy upewnić się, że głośnik jest zamontowany w obudowie odpowiedniej do zastosowania. Nieprawidłowo zaprojektowana obudowa głośnika może łatwo zrujnować doskonały system odtwarzania. Nie należy dostrajać bloków filtrów audio kodeka, do czasu pełnego montażu systemu w konfiguracji przeznaczonej do produkcji. W przeciwnym razie parametry strojenia mogą ulec zmianie.

Zakres częstotliwości należy wybierać w oparciu o dźwięk, który będzie odtwarzany. Należy użyć bloku balansu cyfrowego, aby skompensować pasmo charakterystyki częstotliwościowej głośnika. Niektóre częstotliwości będą naturalnie brzmiały głośniej i wyraźniej i mogą wymagać stłumienia, podczas gdy inne mogą wymagać wzmocnienia. Należy użyć tonów testowych, aby ocenić odpowiedź częstotliwościową systemu.

Dodanie kodeka audio do systemu wbudowanego nie gwarantuje, że będzie on brzmiał dobrze dla użytkownika końcowego. Każdy system odtwarzania dźwięku wymaga starannego dostrojenia. Aby uzyskać to dostrojenie, można użyć filtrów zewnętrznych, ale kodeki audio mają wbudowane funkcje filtrowania cyfrowego i równoważenia. Można ich używać do podawania do głośnika tylko tych częstotliwości, do których jest on najlepiej dostosowany. Dzięki dokładnej analizie i zastosowaniu ustawień filtrów deweloperzy mogą uzyskać czysty dźwięk, którego użytkownicy końcowi oczekują od swoich urządzeń.

tags: #filtracja #dźwięku #wav #metody

Popularne posty: