W tym rozdziale:
· Próbkowanie i jakość dźwięku
· Częstotliwość próbkowania i rozdzielczość bitowa
· Obliczanie rozmiaru plików dźwiękowych
· Formaty plików dźwiękowych
Ten rozdział jest wprowadzeniem do podstawowych zagadnień związanych z dźwiękiem. Odpowiednie zastosowanie dźwięku w projekcie Flasha może dodać wyrazu i zwiększyć atrakcyjność prezentacji. Wynika to z faktu, że dźwięk angażuje kolejny zmysł widza. W połączeniu z formą wizualną i ruchem, dźwięk pogłębia wrażenia wywierane na widzu i jego odbiór filmu Flasha. Uważne planowanie i przywiązanie wagi do szczegółów technicznych może sprawić, że dźwięk stanie się jednym z głównych elementów przekazu. Zwykle dźwięk dodaje się do prezentacji jako ostatni element, lecz postaramy się namówić cię do innego podejścia, polegającego na zaplanowaniu spójnej prezentacji, będącej multimedialną ucztą zarówno dla wzroku jak i dla słuchu odbiorcy. W tym rozdziale wyjaśnimy pewne zagadnienia techniczne związane z dźwiękiem cyfrowym, takie jak częstotliwość próbkowania czy rozdzielczość bitowa. Omówimy też kwestię rozmiarów plików dźwiękowych oraz formaty tych plików, obsługiwane przez Flasha.
Zanim zaczniesz stosować dźwięk w swoich projektach Flasha, powinieneś zdobyć podstawową wiedzę na temat dźwięku cyfrowego. W tym podrozdziale zapoznamy cię z zagadnieniami próbkowania, rozdzielczości bitowej i rozmiaru pliku dźwiękowego — oraz ich związkiem z dźwiękiem we Flashu.
Słuch jest jednym z pięciu głównych zmysłów człowieka. Dźwięk słyszymy wówczas, gdy drgania powietrza docierają do ucha. Głośność odbieranego dźwięku wynika z amplitudy, czyli intensywności tych drgań. Wysokość słyszanego dźwięku zależy od częstotliwości drgań. Częstotliwość drgań jest wyrażana w hercach (Hz).
W pełni sprawne ludzkie ucho rejestruje dźwięki w zakresie częstotliwości od 20 Hz do 20 000 Hz. Ta skala częstotliwości odpowiada słyszalnej skali dźwiękowej — od najniższych basów po wysokie soprany. Już tutaj zwróćmy uwagę na często popełniany błąd pojęciowy — częstotliwość dźwięku jest często mylona z częstotliwością próbkowania dźwięku cyfrowego, choć te dwa pojęcia dotyczą dwóch zupełnie różnych spraw.
Gdy umieszczasz dźwięki w filmie Flasha, powinieneś zwrócić uwagę na kilka ich parametrów wpływających na jakość dźwięku i rozmiar pliku. Jakość dźwięku jest ważna z tego względu, że wpływa na estetykę wrażeń słuchowych, z kolei rozmiar pliku jest nierozerwalnie związany z czasem jego przesyłania w Internecie. Najważniejszymi parametrami dźwięku wpływającymi na jakość dźwięku i rozmiar pliku są częstotliwość próbkowania i rozdzielczość bitowa.
Próbkowanie dźwięku polega na przetwarzaniu analogowego sygnału dźwiękowego na sygnał cyfrowy, czyli serię liczb opisujących chwilowe wartości sygnału. Pojedynczą liczbę reprezentującą chwilową wartość sygnału dźwiękowego nazywamy próbką. Częstotliwość próbkowania, wyrażana w hercach (Hz), określa liczbę próbek sygnału dźwiękowego pobieranych i występujących w ciągu jednej sekundy dźwięku. We wczesnych latach 40. dwudziestego wieku Harry Nyquist i Claude Shannon opracowali teorię, zgodnie z którą częstotliwość próbkowania musi być dwa razy większa od najwyższej częstotliwości próbkowanego sygnału. Im wyższa jest częstotliwość próbkowania, tym wyższą częstotliwość można odwzorować w sygnale cyfrowym i tym dokładniej są odwzorowywane niższe częstotliwości. Zgodnie z teorią Nyquista-Shannona, aby zapisać sygnał dźwiękowy o zakresie częstotliwości od 20 Hz do 20 000 Hz w postaci serii próbek cyfrowych, sygnał ten trzeba spróbkować z częstotliwością nie mniejszą niż 40 000 Hz, czyli 40 kHz. Właśnie dlatego dźwięk na płytach kompaktowych — który bardzo dokładnie reprezentuje pierwotny sygnał dźwiękowy — cechu się częstotliwością próbkowania 44,1 kHz.
(((uwaga))) Próbka dźwiękowa to pojedyncza wartość liczbowa, reprezentująca chwilową wartość analogowego sygnału dźwiękowego. Plik dźwiękowy to seria takich próbek, reprezentująca przebieg nagranego sygnału dźwiękowego.
Im niższa jest częstotliwość próbkowania, czyli im mniej próbek sygnału jest pobieranych lub odtwarzanych w ciągu jednej sekundy, tym bardziej dźwięk cyfrowy odbiega od pierwotnego dźwięku analogowego. Obniżenie częstotliwości próbkowania posiada jednak pewną zaletę — proporcjonalnie do obniżenia częstotliwości próbkowania zmniejsza się też rozmiar pliku dźwiękowego. Na przykład 300-kilobajtowy plik dźwiękowy o częstotliwości próbkowania 44,1 kHz, po obniżeniu częstotliwości próbkowania do 22,05 kHz zmniejszy się do rozmiaru 150 kB. Tabela 14.1 zawiera dokładne zestawienie typowych częstotliwości próbkowania dźwięku i odpowiadających im jakości.
Tabela 14.1.Częstotliwości próbkowania i jakość dźwięku
Częstotliwość próbkowania
Jakość
Zastosowania
48 kHz
Jakość studyjna
Dźwięki i muzyka zapisywane na nośnikach cyfrowych, takich jak miniDV, DAT, DVCam itp.
44,1 kHz
Jakość płyt kompaktowych
Wysoka wierność odtwarzanego dźwięku i muzyki.
32 kHz
Jakość zbliżona do CD
Kamery cyfrowe wysokiej klasy.
22,05 kHz
Jakość radiowa (fale ultrakrótkie)
Krótkie klipy muzyczne wysokiej jakości .
11,025 kHz
Akceptowalna dla muzyki
Dłuższe klipy muzyczne, wysokiej jakości głos, dźwiękowe efekty specjalne.
5 kHz
Akceptowalna dla głosu lektora
„Płaski” głos mówiony, proste dźwięki dla przycisków.
Typową częstotliwością próbkowania dźwięku, stosowaną przez większość komputerowych kart dźwiękowych jest częstotliwość 44,1 kHz. Z tego względu dźwięk przeznaczony do odtwarzania na komputerach powinien mieć częstotliwość próbkowania będącą wielokrotnością częstotliwości 11,025. Dlatego zalecamy stosowanie częstotliwości próbkowania takich jak 44,1 kHz, 22,05 kHz i 11,025 dla wszelkich dźwięków komputerowych. (Choć dźwięki o częstotliwościach próbkowania innych niż częstotliwości 11,025 kHz, mogą dawać dobre wyniki na komputerze, na którym je przygotowujesz i na wielu innych komputerach, na niektórych mogą występować problemy. Stosowanie tej prostej zasady pozwoli ci uniknąć narzekań dotyczących trzasków i zniekształceń dźwięku). Stosowanie tej zasady jest jeszcze ważniejsze w przypadku pracy z dźwiękiem we Flashu. Gdy zaimportujesz do Flasha dźwięk o częstotliwości nie będącej wielokrotnością częstotliwości 11,025 kHz, program automatycznie zmienia częstotliwość próbkowania tego dźwięku, co wpływa odtwarzanie dźwięku niższego lub wyższego od pierwotnego. Ta sama zasada dotyczy eksportowania dźwięku, którym to zagadnieniem zajmiemy się w dalszej części rozdziału. Dodajmy również, że choć w interfejsie Flasha pojawiają się częstotliwości próbkowania takie jak 11 kHz, 22 kHz i 44 kHz, jest to po prostu skrótowy zapis częstotliwości próbkowania 11,025 kHz, 22,05 kHz i 44,1 kHz.
Drugim kluczowym czynnikiem wpływającym na jakość dźwięku jest rozdzielczość bitowa. Rozdzielczość bitowa określa liczbę bitów opisujących każdą próbkę dźwięku (czyli każdą liczbę reprezentującą chwilową wartość sygnału). Rozdzielczość bitowa rośnie wykładniczo, czyli 8-bitowy dźwięk może zawierać 28, czyli 256 różnych poziomów wartości, zaś dźwięk 16-bitowy może ich zawierać już 216, czyli 65 536. Z tego względu cyfrowy dźwięk 16-bitowy zawiera znacznie więcej informacji o pierwotnym sygnale niż dźwięk 8-bitowy o tej samej długości. W rezultacie, dzięki dodatkowej informacji zawartej w dźwięku 16-bitowym jest zredukowany szum występujący w tle, zaś sam dźwięk jest bogatszy i czystszy. Ten sam dźwięk nagrany z rozdzielczością 8-bitową jest zaszumiony i „płytki”.
Trzeba również pamiętać, że 16-bitowy plik dźwiękowy jest dwa razy większy od tego samego dźwięku zapisanego z jakością 8-bitową. Wynika to z konieczności zapisania dwa razy większej liczby w pliku wyższej jakości. Co jednak zrobić, gdy plik dźwiękowy jest zbyt duży? Dźwięk o wyższej rozdzielczości bitowej można skonwertować na dźwięk o niższej rozdzielczości; można też poprzez konwersję zredukować częstotliwość próbkowania dźwięku. W profesjonalnych studiach muzycznych tego typu konwersje wykonuje się za pomocą zaawansowanego sprzętu, jednak można je wykonać na komputerze osobistym za pomocą programu do edycji dźwięku. Więcej informacji na temat obniżania częstotliwości próbkowania i rozdzielczości bitowej znajdziesz w rozdziale 32., „Programy do edycji dźwięku”.
(((wskazówka))) Jeśli masz trudności ze zrozumieniem zagadnienia rozdzielczości bitowej dźwięku, zaś znasz się na skanowaniu obrazów fotograficznych, pomyśl o różnicy między 8‑bitowym obrazem w skali szarości a 24-bitowym obrazem kolorowym. Pliki 8‑bitowych obrazów w skali szarości (na przykład czarno-białych zdjęć) są znacznie mniejsze niż pliki obrazów o 24-bitowym kolorze (na przykład kolorowe fotografie), jednak 8-bitowe obrazy czarno-białe nie zawierają zbyt wielu informacji — jedynie 256 poziomów szarości. Z drugiej strony, 24-bitowe obrazy kolorowe zawierają 256‑poziomowe kanały R, G i B, co daje w sumie paletę 16,7 miliona kolorów. Próbki dźwiękowe przeznaczone dla ucha ludzkiego nie wymagają aż tylu różnych poziomów wartości. 16-bitowe próbki dźwiękowe dają zakres dynamiczny składający się z ponad 64000 wartości — znacznie więcej, niż może rozróżnić ucho ludzkie.
W tabeli 14.2 porównujemy różne, najczęściej stosowane rozdzielczości bitowe dźwięku i ich zastosowania.
Tabela 14.2.Rozdzielczości bitowe dźwięku i ich zastosowania
Rozdzielczość bitowa
16 bitów
Jakość płyty kompaktowej
Wysoka wierność dźwięków i muzyki.
12 bitów
Jakość bliska CD
8 bitów
Jakość radiowa FM
Krótkie klipy muzyczne wysokiej jakości.
4 bity
Dłuższe klipy muzyczne, wysokiej jakości głos lektora, dźwiękowe efekty specjalne.
Przeanalizuj rysunki 14.1 i 14.2, by porównać przebiegi sygnałów dźwiękowych z próbkowaną z różnymi częstotliwościami próbkowania i rozdzielczościami bitowymi. Oba rysunki prezentują przebieg dźwięku pochodzącego z tego samego źródła, lecz na każdym z nich dźwięk został spróbkowany z innymi parametrami. Przebieg dźwięku 16-bitowego o częstotliwości próbkowania 44,1 kHz zawiera dwa razy więcej „punktów” — czyli próbek — niż 8-bitowy dźwięk o częstotliwości próbkowania 11,025 kHz. Ponieważ dźwięk o wyższej częstotliwości próbkowania zawiera więcej próbek, odstępy czasowe pomiędzy poszczególnymi próbkami nie są tak wielkie jak w przypadku drugiego przebiegu. Więcej próbek zapewnia dokładniejszą reprezentację przebiegu dźwiękowego i czystszy, wierniejszy dźwięk.
Rysunek 14.1. Ten przebieg reprezentuje dźwięk o częstotliwości próbkowania 44 100 Hz i rozdzielczości 16-bitowej
Rysunek 14.2. Ten przebieg preprezentuje ten sam dźwięk, który pokazano na rysunku 14.1, jednak teraz jego częstotliwość próbkowania wynosi 11 025 Hz, a rozdzielczość jest 8-bitowa
(((wskazówka))) Błędem często popełnianym przez nowicjuszy jest założenie, że dźwięk 8-bitowy jest akceptowalny ze względu na fakt, że mieści się w dwa razy mniejszym pliku niż dźwięk 16-bitowy. Założenie to jest błędne z dwóch powodów. Po pierwsze, dźwięk 8-bitowy cechuje się znacznie gorszą jakością brzmienia niż dźwięk 16-bitowy. Po drugie, taka oszczędność jest nieopłacalna, ponieważ większość kompresorów dźwięku może operować jedynie na dźwięku 16-bitowym.
Wszystkie pliki dźwiękowe są albo stereofoniczne (zawierają lewy i prawy kanał stereo), albo monofoniczne (zawierają pojedynczy kanał). Pliki dźwięków stereo są dwa razy większe od plików dźwięków mono, gdyż zawierają one dwa razy więcej informacji. W większości aplikacji przeznaczonych do przetwarzania i edycji dźwięków można zapisać lub wyeksportować dźwięk, który pierwotnie jest dźwiękiem stereofonicznym, w postaci jednokanałowego dźwięku monofonicznego, powstającego poprzez połączenie (zmieszanie) obu kanałów. Możliwe jest również zapisanie tylko prawego bądź tylko lewego kanału dźwięku stereo jako oddzielnego pliku .WAV lub .AIF.
W przypadku zaawansowanych aplikacji do wielościeżkowej edycji dźwięku, takich jak Deck II, ProTools czy AudioLogic, można edytować dźwięk zawierający nawet osiem lub więcej ścieżek — w zależności od konfiguracji systemu. Takie aplikacje dają muzykom szerokie pole do popisu w trakcie komponowania i miksowania klipów dźwiękowym. Aby takie klipy można było umieścić we Flashu, trzeba je zmiksować do postaci pliku stereo- lub monofonicznego i zapisać w formacie WAV lub AIF. Więcej szczegółów na temat tego procesu znajdziesz w rozdziale 32, „Programy do edycji dźwięku”.
Rozmiary plików dźwiękowych powinny cię interesować z kilku powodów.
· Pliki dźwiękowe zajmują dużo miejsca na dysku twardym.
· Przetwarzanie dużych plików dźwiękowych i importowanie ich do Flasha może być żmudne i czasochłonne.
· Czasy przesyłania dużych plików dźwiękowych w Internecie (nawet po wydajnym skompresowaniu ich podczas eksportowania filmu Flasha) mogą być istotnym czynnikiem decydującym o oglądalności twojej prezentacji, nawet w przypadku szybkich połączeń z Internetem.
Pracując z klipami dźwiękowymi, powinieneś starać się tworzyć jak najkrótsze klipy dźwiękowe. Oznacza to odcinanie wszelkich fragmentów przebiegu dźwiękowego, które są niepotrzebne, szczególnie na początku i na końcu klipu. Proces ten omawiamy dokładnie w rozdziale 15., „Import i edycja dźwięku we Flashu”, w odniesieniu do narzędzi dźwiękowych we Flashu, a następnie w rozdziale 32., „Programy do edycji dźwięku”, gdzie omawiamy zewnętrzne aplikacje służące do edycji dźwięku.
Jeśli planujesz umieścić w projekcie ścieżkę muzyczną, która będzie odtwarzana w tle, zastanów się nad możliwością utworzenia krótkiego klipu dźwiękowego, który można zapętlić. Zapętlanie klipów dźwiękowych również omawiamy w rozdziale 15., „Import i edycja dźwięku we Flashu”, i 32., „Programy do edycji dźwięku”.
Oto prosty wzór, na podstawie którego możesz obliczyć rozmiar pliku dźwiękowego w bajtach:
czas trwania dźwięku w sekundach × częstotliwość próbkowania w Hz × liczba kanałów ×(rozdzielczość bitowa / 8) = rozmiar pliku
* rozdzielczość bitową dzielimy przez 8, ponieważ w jednym bajcie mieści się 8 bitów.
Zgodnie z tym wzorem, 20-sekundowy stereofoniczny klip dźwiękowy i rozdzielczości 8-bitowej i częstotliwości próbkowania 11 kHz zmieści się w pliku o wielkości:
20 s ×11 025 Hz ×2 kanały × (8 bitów/8) = 441 000 Bajtów = 430 kB
Na temat doboru idealnej jakości plików dźwiękowych na potrzeby Flasha istnieją dwie szkoły. Szkoły te dzieli przede wszystkim fakt posiadania lub nieposiadania wysokiej jakości narzędzi do edycji dźwięku. Aby nie pokrzywdzić reprezentantów żadnej z tych szkół, przedstawiamy oba podejścia:
· Jeśli nie dysponujesz wysokiej jakości narzędziami do edycji dźwięku, prawdopodobnie znajdziesz się wśród tych, którzy preferują rozpoczęcie pracy z plikami źródłowymi o możliwie najwyższej jakości (w idealnym przypadku 16 bitów i 44,1 kHz) i następnie użycie parametrów dźwiękowych Flasha z celu uzyskania optymalnej kompresji podczas eksportowania filmu. Szczegółowe informacje na temat parametrów dźwiękowych, ustawianych przed publikają filmu Flasha, znajdziesz w rozdziale 16., „Optymalizacja dźwięku”.
· Jeśli dysponujesz wysokiej jakości narzędziami do edycji dźwięku, wówczas prawdopodobnie zechcesz samodzielnie przygotowywać klipy dźwiękowe dla swoich klientów i raczej nie będziesz korzystał z formatu MP3 przed zaimportowaniem dźwięku do Flasha. Możesz również nie zgodzić się z osobami twierdzącymi, że należy importować do Flasha dźwięk o możliwie najwyższej jakości, przed jego optymalizacją. Ta różnica w podejściu może wynikać z ogromu możliwości oferowanych przez zewnętrzne narzędzia do edycji dźwięku. Jeden ze znanych nam inżynierów dźwięku konwertuje swoje klipy dźwiękowe do 16-bitowych, monofonicznych dźwięków o częstotliwości próbkowania 22,1 kHz, redukując przy tym niskie częstotliwości basowe, przed zaimportowaniem ich do Flasha. Więcej informacji na temat wysokiej jakości narzędzi do edycji dźwięku znajdziesz w rozdziale 32., „Programy do edycji dźwięku”.
do składu> W oryginale długi akapit na górze strony 397 zawiera opis dwóch różnych podejść, dlatego rozbiłem ten opis na dwa punkty (co wygląda bardziej przejrzyście).
·
W p...
paradoks24h