odnawianie_nagran_1.pdf

(130 KB) Pobierz
cichy komputer.qxd
TECHNOLOGIA Odnawianie starych nagrań
Odnawiianiie starych nagrañ (1)
Czy mo¿na zrobiiæ to (jjeszcze) llepiiejj?
Dr in¿. Janusz Biliñski
jak... umyć starannie organ pomiarowy – czyli
parę własnych uszu – i rozpocząć pracę. Szersze
omówienie pewnych zagadnień przybliży mecha-
nizmy obróbki dźwięku z tego zakresu, a ilustra-
cją będą elementy opisu profesjonalnego systemu
studyjnego Cedar Cambridge. Jest to specjalizo-
wane narzędzie przeznaczone do realizacji zadań
tego typu. System składa się z procesora
w panelu 4U z kartą I/O i czytnikiem CD-ROM.
Komunikację z urządzeniami zewnętrznymi
zapewniają dwa porty USB, dwa porty szere-
gowe, karta sieciowa i jeden port równoległy.
(Część sprzętowa systemu to w zasadzie specjal-
nie skonfigurowany komputer z dwoma proceso-
rami Pentium 4 i systemem operacyjnym Win-
dows XP Pro – przyp. red.)
macji. Co więcej, efekt działania takiego algo-
rytmu pociąga za sobą dodatkową utratę infor-
macji o procesie degradacji, bowiem większość jej
po prostu usuwa. To skądinąd oczywiste stwier-
dzenie wiąże się z poważnymi implikacjami dla
procesu odnawiania: zawsze lepiej jest dokony-
wać obróbki nagrania oryginalnego, niż podda-
nego wcześniej jakiejkolwiek obróbce. Jako przy-
kład można tu przytoczyć usuwanie pojedyn-
czego trzasku z płyty winylowej 78obr/min.
Sygnał nagrany może mieć pasmo z zakresu
12kHz, zakłócenie jest słyszalne w całym paśmie
odtwarzania aparatury elektronicznej, tak więc
filtracja (która może dać subiektywną poprawę
jakości dźwięku) usuwa dużo informacji, wyko-
rzystywanej przez zaawansowany algorytm
odnawiania.
Ostatecznym testem dla każdego stosowanego
algorytmu jest ludzkie ucho. Pytania, na które
należy odpowiedzieć to:
• czy algorytm wpływa na odczucie jakości
sygnału?
• dla jakiego zakresu materiału jego działanie
jest skuteczne?
• czy zakłócenia zostały usunięte/zredukowane?
• czy pojawiły się artefakty będące wynikiem
obróbki?
• czy osiągnięto akceptowany kompromis dla
przedstawionych powyżej punktów?
Jeżeli ucho nie akceptuje wyników i traktuje je
jako nieodpowiednie dla założonego celu, wów-
czas należy powtórnie określić algorytm.
Pojawiiaj¹ce siiê na ³³amach lliisty dyskusyj-
nej od czasu do czasu pytaniia o wp³yw
karty dŸwiiêkowej na jjakoœæ odnawiianiia
dŸwiiêku, sposoby odszumiianiia, usuwaniia
trzasków, sk³onii³y mniie do przedstawiieniia
kiillku zagadniieñ z pograniicza teoriiii
ii praktykii (bardziiej teoriiii).
Pierwsze pytanie brzmi – od czego zacząć? Tu
zwykle pada propozycja dwóch kroków wstęp-
nych. Pierwszym krokiem jest sprawdzenie czy
dana płyta nie została wydana w postaci cyfro-
wej na podstawie zremasterowanych taśm
– matek. Nawet, jeżeli ów „biały kruk” wymaga
sprowadzenia z krajów zamorskich, to warto
spróbować. Cena materiału najwyższej jakości
jest wielokrotnie mniejsza niż nakład pracy, jaki
trzeba poświęcić na obróbkę materiału analogo-
wego. Można przy tym wyeliminować ryzyko
porażki, a zaoszczędzony czas spędzić dużo przy-
jemniej niż przed konsolą czy klawiaturą, wpa-
trując się na zmianę w ekran i monitory bliskiego
pola. Jeżeli jednak materiał jest unikalny, wyjąt-
kowy, jednostkowy – nie pozostaje nic innego
Projektowanie algorytmu
Sygnał muzyczny w swojej istocie jest sygna-
łem losowym, podobnie jak większość procesów
degradujących. Teoria informacji wskazuje, że
zmieszanie dwóch losowych sygnałów to utrata
informacji, w związku z czym nie jest możliwa
idealna restauracja sygnału. Algorytm odnowy
powinien wygenerować sygnał jak najbardziej
bliski oryginałowi na podstawie dostępnej infor-
Przy prostych zadaniach zwi¹zanych z odnawianiem
nagrañ rozwi¹zania analogowe s¹ najtañsze, jednak
wiêkszoœæ zadañ wymaga rozwi¹zania zagadnieñ
metodami matematyki wy¿szej.
Dlaczego obróbka cyfrowa?
Słuchacze zaaprobowali już dźwięk przetwa-
rzany cyfrowo i debaty dotyczące wyższości tech-
niki analogowej nad cyfrową i odwrotnie nie są
już tak frapujące. Jednak przy projektowaniu pro-
cesora dźwięku należy wziąć pod uwagę kilka
czynników. Przy prostych zadaniach rozwiązanie
analogowe jest zwykle najtańsze, jednak więk-
szość zadań wymaga rozwiązania zagadnień
metodami matematyki wyższej. Do jej zastoso-
wań rozwinięto specjalnie cyfrową technologię
obróbki dźwięku (DSP).
Pierwsze komputery i ich dyski twarde umożli-
wiały zastosowanie algorytmów odnawiania
dźwięku, ale odbywało się to off line. Ponieważ
tylko aplikacje czasu rzeczywistego umożliwiają
wykorzystanie bezpośredniego sprzężenia zwrot-
nego słuchu inżyniera dźwięku i parametrów
Dwa rysunki obrazuj¹ce przyk³adowy proces obróbki restau-
rowanego nagrania oraz proces starzenia i degradacji zapisa-
nego materia³u dŸwiêkowego.
94
Estrada i Studio • lipiec 2004
147960123.006.png 147960123.007.png
Odnawianie starych nagrań TECHNOLOGIA
algorytmu, które są regulowane przez użytkow-
nika, dlatego szybkość odnowienia ścieżki ma
niebagatelne znaczenie w zastosowaniach
komercyjnych.
wykryte kliknięcie – wyciszy oba kanały i w ten
sposób ograniczy efekt akustyczny. Minimalny
czas trwania wyciszenia (przy dużej szybkości
obu zboczy) wynosi typowo 2,5ms i w każdym
przypadku musi być dłuższy niż czas trwania
zakłócenia. W przeciwnym razie nawet mała
Cedar Audio Ltd.
Cedar uwa¿any jest za wiod¹cego producenta w dziedzinie
urz¹dzeñ i systemów komputerowych do restauracji
dŸwiêku. Algorytmy opracowane przez Cedar zosta³y w³¹-
czone (w postaci wtyczek) do systemów SADiE, Pyramix,
Soundscape i AMS Neve. Dla potrzeb radia i telewizji Cedar
produkuje wolnostoj¹cy dynamiczny eliminator zak³óceñ
DNS1000 i dedykowany dla systemów Pro Tools – DNS2000.
Systemy te s¹ równie¿ z powodzeniem stosowane w tych
dziedzinach, gdzie istnieje potrzeba szybkiej identyfikacji
tekstu i oddzielenia sygna³u od zak³óceñ (na przyk³ad w s¹-
downictwie – Cedar Forensic). Niedawno firma wprowa-
dzi³a na rynek Cedar Cambridge, 8-kana³owy system pracu-
j¹cy z dŸwiêkiem o parametrach 24 bity/96kHz, u¿ywaj¹cy
zupe³nie nowych algorytmów.
Który proces pierwszy?
Porządek, w którym
dokonywane są kolejne
etapy odnawiania
dźwięku, posiada niezwy-
kle istotne znaczenie dla
jakości uzyskiwanych
wyników. Właściwa kolej-
ność procesów to usunię-
cie kliknięć (declick), usu-
nięcie trzasków (decrac-
kle), usunięcie przydźwię-
ków (debuzz) i usunięcie
szumu (dehiss). Z powodu
wpływu długich kliknięć trudno jest usunąć
drobne kliknięcia i trzaski tworzące zakłócenia
pochodzące od powierzchni nośnika, przydźwięk
i inne tego typu problemy. Ponadto, jeżeli wystę-
pują kliknięcia, to zakłócają proces usuwania
szumu i generują pozamuzyczne efekty uboczne.
I na odwrót, jeżeli usuwa się szum na początku,
to później jest prawie niemożliwa identyfikacja
i usunięcie kliknięć i trzasków.
Usuwanie trzasków powinno być druga fazą
procesu obróbki, bowiem małe trzaski mogą
także spowodować problemy podczas usuwania
szumu. Podobnie usunięcie przydźwięku (o ile
zachodzi taka potrzeba) powinno zostać doko-
nane w odpowiednim momencie obróbki – ogól-
nie rzecz biorąc po usunięciu kliknięć i najczę-
ściej po usunięciu trzasków. Konsekwentnie, usu-
wanie szumu powinno być ostatnim procesem
w łańcuchu odnawiania materiału dźwiękowego.
Najprostszym sposobem na usunięcie klik-
nięć jest zastosowanie układu wyciszającego,
który – dokładnie w chwili, gdy zostanie
Czêœæ sprzêtowa systemu Cedar Cambridge, czyli specjalizo-
wany komputer zamkniêty w obudowie 4U oraz czêœæ progra-
mowa – widok g³ównego okna edytora, w którym konfiguru-
jemy modu³y.
liczba wyciszeń poważnie wpłynie na odczucie
jakość dźwięku. Metoda ta ukierunkowana jest
wyłącznie na uczynienie kliknięć mniej natręt-
nymi i w żaden sposób nie odnawia sygnału
źródłowego. Ponadto można ją stosować
w sytuacji, gdy energia akustyczna kliknięcia
jest o kilka rzędów wielkości większa niż ener-
gia sygnału użytecznego.
Bardziej zaawansowanym algorytmem analo-
gowego usuwania kliknięć jest przełącznik
(switcher). Wykorzystuje on dwa źródła prawie
identycznego sygnału (przeciwległe ścianki rowka
płyty monofonicznej odtwarzanej przez gramofon
stereofoniczny) monitorując, który z sygnałów
jest sygnałem mniej zniekształconym (o mniejszej
energii). Na wyjście podawany jest sygnał
z kanału o mniejszych zniekształceniach,
a kanały są przełączane „w locie”. Metoda ta
usuwa duże kliknięcia, lecz podobnie jak wszyst-
kie rozwiązania analogowe, nie potrafi rozróżnić
małych kliknięć od oryginalnych składowych
sygnału użytecznego. Ponadto przełącznik
147960123.008.png
TECHNOLOGIA Odnawianie starych nagrań
zakłada istnienie idealnego sygnału monofo-
nicznego. W przypadku, gdy sygnały obu kana-
łów (ścian rowka) różnią się znacząco lub są tak
samo zniekształcone, wówczas przyjęte założe-
nie (i w konsekwencji odnowienie sygnału)
ponosi fiasko.
Technika przetwarzania cyfrowego usuwa sze-
reg ograniczeń metod analogowych i umożliwia
zastosowanie innych metod. Jedną z nich jest
technika próbkowania (sample & hold – S&H),
która przypomina pod każdym względem algo-
rytm stosowany w idealnym systemie wycisza-
nia. Jednakże zamiast stworzenia idealnie pła-
skiego sygnału zerowego, w metodzie tej jest
tworzony sygnał o poziomie jak najbliższym do
ostatniej poprawnej próbki sygnału. S&H usuwa
najpoważniejsze efekty kliknięć i trzasków, lecz
w jej wyniku fala dźwiękowa zawiera nieprzy-
jemne dla ucha zniekształcenia oraz wiele sły-
szalnych zakłóceń („bumps”, „pops”). Zakłócenia
takie o małej amplitudzie są bardziej akcepto-
wane niż kliknięcia o dużej amplitudzie, lecz
sygnał będzie posiadał przerwy, jeżeli są liczne
kliknięcia. Wielu słuchaczy skarży się na te arte-
fakty i efekty uboczne (jak na przykład zastoso-
waną korekcję błędów w domowych odtwarza-
czach CD) jako bardziej dokuczliwe niż kliknięcia,
które zostały usunięte czy zastąpione.
Następnym etapem jest interpolacja liniowa
(linear interpolation). O ile technika próbkowa-
nia S&H przyjmuje założenie, że jedna dobra
próbka sąsiaduje z trzaskiem, to przy interpola-
cji liniowej rozważa się dwie sąsiednie dobre
próbki i zmierzony czas pomiędzy nimi.
W tym algorytmie uszkodzone dane są zastępo-
wane przez linię prostą łączącą ostatnią dobrą
próbkę z następną dobrą próbką (patrz ilustracje
poniżej). Jest wysoce niepraktyczne stosowanie
tej metody w dziedzinie analogowej, ale stosun-
kowo proste w dziedzinie cyfrowej. Efekt aku-
styczny zastosowania tej metody jest mniej inwa-
W praktyce modu³ do usuwania klikniêæ i trzasków, wykorzystuj¹cy bardzo skomplikowany algorytm, ma stosunkowo prosty inter-
fejs. Na ilustracji pokazano modu³ Declickle z systemu Cedar. U¿ytkownik nastawia tu tylko kilka parametrów. Mo¿na okreœliæ
najlepszy tryb detekcji dla danego materia³u, poziom okreœlaj¹cy czu³oœæ procesu i decyduj¹cy ile i jakie klikniêcia bêd¹ usu-
niête oraz wartoœæ modeluj¹c¹, okreœlaj¹c¹ sposób, w jaki usuwanie klikniêæ zachowuje siê wobec wy¿szych harmonicznych
sygna³u wejœciowego.
zyjny niż techniki próbkowania, lecz jest obar-
czony artefaktami o niskich częstotliwościach
i ograniczeniem pasma akustycznego w obsza-
rze, gdzie została dokonana interpolacja.
W przypadku zastosowań sprzętu w pełni pro-
fesjonalnego, takiego jak interpolator firmy
Cedar, stosowana jest technika modelowania
sygnału. Na podstawie analizy obszaru obejmu-
jącego kilkaset milisekund tworzony jest model
„podstawowego brzmienia (underlying reso-
nant)” sygnału, a następnie ta informacja jest
wykorzystywana do zastąpienia każdego kliknię-
cia sygnałem interpolowanym, odpowiadającym
temu modelowi brzmienia. Z kolei panel do usu-
wania kliknięć (declicker), stosujący jeden z naj-
nowszych tego typu algorytmów połączony
z zaawansowanym detektorem kliknięć, pozwala
na usunięcie do 2500 kliknięć na każdy kanał
w czasie rzeczywistym. W praktyce oznacza to,
iż w większości przypadków nie sposób stwier-
dzić, w których miejscach sygnał był zniekształ-
cony zakłóceniami.
Pojęcie „usuwanie trzasków” w przypadku
zaawansowanych profesjonalnych algorytmów
jest trochę mylące, bowiem algorytm usuwania
trzasków, na przykład taki jak w aparaturze
Cedar, usuwa szereg addytywnych zakłóceń
impulsowych o dużej gęstości, małej amplitudzie
i krótkim czasie trwania. Występowanie takich
zakłóceń objawia się różnorodnymi efektami
degradacji dźwięku.
Jeżeli zaburzenia mają charakter losowy,
wówczas degradacja jest słyszana jako trzask
lub dźwięk zbliżony do odgłosu smażenia fry-
tek. Istnieje nawet rodzaj grzyba, który odży-
wia się składnikiem pochodzenia roślinnego
zawartym w starych płytach 78obr/min. Pozo-
stawia on niezliczone punktowe ślady na
powierzchni płyty. To właśnie one odpowiadają
za zaburzenia impulsowe w odtwarzanym
dźwięku, nadając tym płytom charaktery-
styczne trzeszczące brzmienie, pochodzące
z powierzchni płyty.
Jeżeli zakłócenia impulsowe są okresowe
o regularnym odstępie, wówczas degradacja
brzmi jak brzęczenie czy przydźwięk. Na przykład
Trzaski i zniekszta³cenia posiadaj¹ szerok¹ obwiedniê
spektraln¹, z tego te¿ wzglêdu mo¿na próbowaæ zasto-
sowania spektralnych technik usuwania szumu.
Ró¿ne algorytmy korygowania klikniêæ w materiale Ÿród³owym: ilustracja procesu „sample & hold”, interpolacja liniowa wykonana przez algorytm detekcji klikniêæ oraz interpolacja wy¿szego rzêdu
wykonana dziêki zaawansowanemu algorytmowi detekcji klikniêæ.
96
Estrada i Studio • lipiec 2004
147960123.009.png 147960123.001.png 147960123.002.png 147960123.003.png 147960123.004.png
Odnawianie starych nagrań TECHNOLOGIA
sterowniki używane do regulacji natężenia oświe-
tlenia „wycinają” część przebiegu sinusoidy prądu
zasilającego. Strome zbocza tego przebiegu gene-
rują liczne harmoniczne. Jeżeli w pobliżu znajduje
się słabo ekranowana aparatura nagłaśniająca,
wówczas harmoniczne te mogą indukować regu-
larne kliknięcia, słyszane jako brzęczenie.
Jeżeli zaburzenia impulsowe są skorelowane
z sygnałem użytecznym, wówczas degradacja
dźwięku jest odbierana jako zniekształcenie.
(Łagodne obcięcie wierzchołków sygnału cyfro-
wego może być traktowane jako zaburzenie
impulsowe zsumowane z sygnałem oryginalnym
w taki sposób, że wynik wypełnia dostępną prze-
strzeń wartości sygnału).
Trzaski i zniekształcenia posiadają szeroką
obwiednię spektralną, z tego też względu
można próbować zastosowania spektralnych
technik usuwania szumu. Odwrotnie ma się
sprawa przydźwięku, który z reguły w swoim
spektrum posiada regularne wierzchołki, tak
więc dotychczas preferowane metody polegały
na zastosowaniu dużej liczby filtrów pasmo-
wych. Filtry te usuwają pojedynczy szczyt
w obwiedni razem z każdym sygnałem, który
także znajduje się w tym paśmie częstotliwo-
ści. Z uwagi na fakt, że każdy impuls jest pre-
cyzyjnie zlokalizowany w czasie, przeważnie
tylko 10% sygnału użytecznego podlega wpły-
wowi tych impulsów. W konsekwencji pozo-
stałe 90% sygnału pozostaje niezakłócone i fil-
trowanie czy jakikolwiek inny proces wpływa-
jący na niezakłócony sygnał jest całkowicie
nieodpowiednie.
Niestety, interpolacja każdego impulsu przy
pomocy usuwania kliknięć także nie jest zado-
walająca z uwagi na podstawową naturę trza-
sku. Standardowy algorytm detekcji kliknięć
zwykle pomija impulsy i nie poradzi sobie przy
dużej gęstości tych impulsów. Co więcej, algo-
rytm usuwania kliknięć przyjmuje, że kliknięcie
lub trzask całkowicie zniszczyło sygnał aku-
styczny i w związku z tym sygnał nie ma uży-
tecznej informacji o sygnale w czasie trwania
kliknięcia czy trzasku. Usuwanie kliknięć
z sygnału zawierającego dużo trzasków powo-
duje odrzucenie dużej ilości informacji użytecz-
nej, którą można wykorzystać. W profesjonal-
nych systemach Cedar Cambridge optymalny
proces usuwania trzasków rozkłada zakłócony
trzaskami sygnał na dwie składowe. Pierwsza
zawiera istotę „czystego”, czyli niezakłóconego
sygnału. Druga składowa wydzielona (tak
zwany sygnał „split”) zawiera wszystkie znie-
kształcenia plus pozostałość sygnału niezakłó-
conego. Dzięki uzyskaniu składowej wydzielo-
nej detektor trzasków ma dużo większą szansę
zidentyfikowania niepożądanych zakłóceń. Po
przeprowadzeniu detekcji można zastosować
odpowiednio zoptymalizowaną interpolację dla
trzasków o dużej gęstości w celu usunięcia
zakłóceń z sygnału wydzielonego. Nie wpływa
Modu³y systemu Cedar Cambridge
Po zainstalowaniu oprogramowania dostêpne s¹ nastêpu-
j¹ce modu³y: modu³ zobrazowania dwukana³owego
(2 Channel tools) , modu³ usuwania przydŸwiêku (De-
buzz) , modu³ usuwania trzasków i klikniêæ (Declickle) ,
modu³ regeneracji obciêtych wierzcho³ków sygna³u (De-
clip) , modu³ usuwania szumu szerokopasmowego o sta³ej
charakterystyce (Dehiss-3) , modu³ kszta³towania szumu
(Dither and noise shaping) , modu³ filtracji szumu t³a
akustycznego ( Dialogue Noise Suppression DNS) ,
modu³ korektora liniowego (EQ-Linear) , modu³ korek-
tora precyzyjnego (EQ- Precision) , modu³ regulacji
wzmocnienia (Gain) , modu³ pomiarowy (Metering) , mo-
du³ usuwania szumu szerokopasmowego (Broadband
Noise Reduction NR-4) , modu³ korektora fazy
(Phase corrector) oraz modu³ analizy spektralnej
(Spectrum analyser) .
to na podstawowy sygnał audio. Po przepro-
wadzeniu interpolacji na sygnale wydzielonym
może on zostać połączony z sygnałem podsta-
wowym w celu jego odświeżenia, lecz już bez
trzasków. Dzięki takiemu postępowaniu można
utrzymać informację użyteczną, zawartą
w sygnale oryginalnym, nawet podczas
interpolacji. E i S
Za miesiąc omówimy proces usuwania przy-
dźwięku. Do potrzeb artykułu wykorzystano
materiały firmy Cedar (www.cedar-audio.com)
udostępnione przez oficjalnego dystrybutora na
terenie Polski, Dave s.c. (tel. 022 826-49-12,
dave@dave.com.pl).
147960123.005.png
Zgłoś jeśli naruszono regulamin