Wpływ typu rejestratora na rozmieszczenie formatów sygnału mowy.pdf

(109 KB) Pobierz
rzeszot.qxd
Z PRAKTYKI
Wp³yw typu rejestratora
na rozmieszczenie formantów sygna³u mowy
Rozwój myœli technicznej w dzie-
dzinie nagrywania i odtwarzania
dŸwiêku z wykorzystaniem noœników
magnetycznych, zapocz¹tkowany
przez Valdemara Poulsena ponad sto
lat temu [1], by³ jedn¹ z przes³anek
powstania pó³ wieku póŸniej dzia³u
kryminalistyki o nazwie „fonoskopia”
(³ac. fono – dŸwiêk, skopeo – pa-
trzeæ). Przedmiotem badañ fonosko-
pijnych s¹ dzisiaj analizy wszelkich
zapisów sygna³ów akustycznych bez
wzglêdu na typ noœnika i rejestratora.
Utworzenie pierwszej w Polsce
placówki fonoskopii niemal zbieg³o
siê w czasie ze skonstruowaniem
w 1963 r. przez firmê Philips pierwo-
wzoru kasety magnetofonowej typu
Compact [4]. By³ to krok milowy
w upowszechnianiu rejestracji ma-
gnetycznej dŸwiêku, który przez lata
stanowi³ najbardziej popularny no-
œnik, obecnie wypierany przez gene-
racjê cyfrow¹.
Zarówno w przypadku techniki
analogowej, jak i cyfrowej rynek za-
akceptowa³ ca³y szereg noœników,
pocz¹wszy od wspomnianej kasety
typu Compact, przez mikrokasetê
(ró¿nych formatów, zale¿nie od pro-
ducenta), liczne typy i standardy ka-
set wideo rejestruj¹cych œcie¿kê
dŸwiêkow¹, do taœm DAT, dyktafo-
nów cyfrowych z wbudowanymi lub
wymiennymi pamiêciami pó³prze-
wodnikowymi flash, komputerowych
dysków twardych itd. Przedmiotem
zleconych badañ fonoskopijnych mo-
g¹ byæ nagrania dokonane na
wszystkich typach dostêpnych noœni-
ków dŸwiêku. W zakres takich badañ
najczêœciej wchodzi spisanie treœci
rozmowy dowodowej, badanie auten-
tycznoœci nagrania i identyfikacja
mówców.
Jednym z etapów identyfikacji
mówców jest analiza rozmieszczenia
formantów w widmie sygna³u mowy.
Ich uk³ad jest bowiem zale¿ny m.in.
od anatomicznego ukszta³towania
struktur zaanga¿owanych w mówie-
nie [3]. Silna korelacja rozmieszcze-
nia formantów w wypowiedziach do-
wodowych i porównawczych to jedno
z kryteriów (przy identyfikacji mówcy
oprócz analizy formantowej przepro-
wadza siê tak¿e analizê struktury jê-
zykowej wypowiedzi), pozwalaj¹ce
na sformu³owanie wniosku, ¿e auto-
rem obydwu porównywanych wypo-
wiedzi jest ten sam mówca. W prak-
tycznych zastosowaniach analizy for-
mantowej korelacja ta nigdy jednak
nie osi¹ga wartoœci zupe³nej (wspó³-
czynnik korelacji r=1). Wp³ywa na ni¹
bowiem szereg czynników, takich jak
subtelne ró¿nice pomiêdzy poszcze-
gólnymi realizacjami s³ownymi tych
samych ci¹gów alofonów, ró¿nica ja-
koœci nagrania dowodowego i porów-
nawczego czy b³¹d
pomiaru [5]. W prak-
tyce badañ fonosko-
pijnych do utrwalenia
wypowiedzi porów-
nawczych wykorzy-
stuje siê profesjonal-
ne urz¹dzenia reje-
struj¹ce mowê, po-
nadto czynnoϾ ta
najczêœciej odbywa
siê w warunkach
zbli¿onych do studyj-
nych. Zapisy dowo-
dowe realizowane s¹
z u¿yciem ró¿nych
typów rejestratorów
analogowych i cyfro-
wych, przy czym wiêkszoœæ rejestra-
torów cyfrowych wykorzystuje zjawi-
sko kompresji, w tym tak¿e tzw. kom-
presji stratnej (w celu wyd³u¿enia
czasu nagrywania), która w zale¿no-
œci od zastosowanego stopnia wp³y-
wa na jakoœæ utrwalanego sygna³u
mowy. Powsta³a zatem koniecznoœæ
rozstrzygniêcia w¹tpliwoœci, czy sto-
sowanie ró¿nych rejestratorów ma
wp³yw na rozmieszczenie formantów
w widmie sygna³u dowodowego i po-
równawczego. Celem wyjaœnienia ni-
niejszego problemu przeprowadzono
stosowny eksperyment w warunkach
izolacji akustycznej.
Materia³ i metody
Materia³ do badañ stanowi³y wy-
powiedzi mê¿czyzny, utrwalane rów-
noczeœnie przez piêæ rejestratorów.
Dobór warunkowany by³ chêci¹ prze-
œledzenia ewentualnych zmian roz-
k³adu formantów – w odniesieniu do
zapisu analogowego – przy ró¿nych
typach rejestratorów cyfrowych. Wy-
korzystano:
Ryc. 1. Rozmieszczenie mikrofonów urz¹dzeñ rejestruj¹cych
Fig. 1. Placement of microphones connected to recording devices
Analogowy magnetofon repor-
terski firmy Marantz, model CP 430;
prêdkoœæ przesuwu taœmy – 4,75 cm/s,
taœmê kompaktow¹ firmy TDK typu
D60. Do urz¹dzenia pod³¹czono dwa
mikrofony pojemnoœciowe firmy
72
PROBLEMY KRYMINALISTYKI 253/06
278440067.013.png
Z PRAKTYKI
Dysk twardy komputera. Zapis
na dysku odbywa³ siê w nastepuj¹cy
sposób: sygna³ z mikrofonu stoj¹ce-
go firmy Creative (bez oznaczeñ,
charakterystyka kierunkowa) poprzez
zewnêtrzn¹ kartê dŸwiêkow¹ (USB)
Exdigy Sound Blaster firmy Creative
transmitowany by³ z u¿yciem sieci in-
ternetowej i komputerowego oprogra-
mowania o nazwie „Skype”, s³u¿¹ce-
go do internetowych rozmów telefo-
nicznych w standardzie VoIP (ang.
Voice over Internet Protocol). Na-
stêpnie na drugim zestawie kompute-
rowym, poprzez wewnêtrzn¹ kartê
AC97 firmy ASUS, rejestrowano
sygna³ zwrotny, wykorzystuj¹c
oprogramowanie Cool Edit Pro
w wersji 2.0 firmy Syntrillium.
Telefon komórkowy firmy Sie-
mens, model SL45i (urz¹dzenie nie
by³o po³¹czone z sieci¹ telefonii ko-
mórkowej – usuniêto kartê SIM). Da-
ne audio zapisywane s¹ w pamiêci
telefonu, z w³asn¹ kompresj¹ stratn¹,
do plików w formacie .vmo.
nijny ³ad”. W celu eliminacji przypad-
kowych b³êdów jêzykowych, samo-
g³oski i kwestie zdaniowe powtórzo-
no trzykrotnie. Zgromadzony materia³
dŸwiêkowy zosta³ nastêpnie zarchi-
wizowany na dysku twardym kompu-
tera w postaci plików .wav z kodowa-
niem Windows PCM, o czêstotliwoœci
próbkowania 44,1 kHz i rozdzielczo-
œci 16 bitów.
Kolejnym etapem eksperymentu
by³a analiza widmowa dla wszystkich
nagrañ pod k¹tem wyznaczenia po³o-
¿enia poszczególnych formantów
w odpowiadaj¹cych sobie alofonach.
Na wstêpie, z wykorzystaniem kom-
puterowego oprogramowania Cool
Edit Pro w wersji 2.1. firmy Syntril-
lium, przeprowadzono analizê spek-
traln¹ struktury zarejestrowanego sy-
gna³u. Badanie wyko-
nano na tym samym
dla wszystkich próbek
odcinku czasowym,
zawieraj¹cym ciszê.
Nastêpnie przyst¹pio-
no do pomiarów sy-
gna³u mowy. Przepro-
wadzono je dwuetapo-
wo. Najpierw za pomo-
c¹ komputerowego
oprogramowania Praat
(wersja 4.2.04) zosta³y
zmierzone wartoœci
formantów dla poje-
dynczych samog³osek
oraz dla samog³osek
w otoczeniu fonetycz-
nym. Dobór i wartoœci
po³o¿enia formantów realizowano
tzw. sposobem rêcznym. Drugim eta-
pem by³a analiza spektralna sygna³u,
a do jej przeprowadzenia wykorzy-
stano wy¿ej opisane oprogramowa-
nie Cool Edit Pro (ustawienia: FFT-
16384, okno Hanninga). W tej czêœci
eksperymentu zliczano maksima am-
plitud zaznaczone uprzednio w tych
samych miejscach po³o¿enia samo-
g³osek i o tej samej d³ugoœci czaso-
wej dla wszystkich analizowanych
próbek. Uzyskane wyniki badañ ze-
stawiono w formie tabelarycznej i na
Przebieg eksperymentu
Spiker (mê¿czyzna, 30 lat) znajdo-
wa³ siê w komorze bezechowej,
bêd¹cej w wyposa¿eniu Akademii
Górniczo-Hutniczej w Krakowie. W³a-
snoœci komory: objêtoœæ 60 m 3 , po-
ziom ciœnienia akustycznego (SPL)
ok. 16 dB w charakterystyce A. Przed
mówc¹, w odleg³oœci ok. 1 m od ust,
na wyœcie³anym stoliku umieszczono
mikrofony pod³¹czone do opisanych
Cyfrowy dyktafon firmy Olym-
pus, model DW-90, tryb SP (Nor-
mal), czêstotliwoœæ próbkowania
11 kHz. Urz¹dzenie rejestruje
z kompresj¹ bezstratn¹ w postaci
plików WAVE.
Portadisc (MiniDisc) firmy
HHB, model MDP500. Urz¹dzenie
zapisuje dŸwiêk na noœnikach mi-
nidisc w postaci PCM, czêstotli-
woœæ próbkowania – 44,1 kHz, roz-
dzielczoœæ 16 bitów, z wykorzysta-
niem kodu ATRAC 4.5. Jest to sys-
tem stratnej kompresji dŸwiêku,
w którym dane ulegaj¹ redukcji
w proporcji 5:1 z wykorzystaniem fi-
zjologicznych w³asnoœci s³yszenia
(np. maskowanie tonów cichych
przez wspó³brzmi¹ce tony g³oœne
o s¹siednich czêstotliwoœciach), co
jest wykorzystywane przez liczne al-
gorytmy kompresji stratnej [2]. Do
urz¹dzenia pod³¹czono dwa mikrofo-
ny pojemnoœciowe firmy Schoeps;
pierwszy o symbolu CCM40 i charak-
terystyce kardioidalnej, a drugi
o symbolu BLM03C i charakterystyce
dookólnej.
Ryc. 2. Widok pomieszczenia badawczego – komory bezechowej
Fig. 2. Examination room
powy¿ej rejestratorów. Ze wzglêdu
na poziom generowanych zak³óceñ
zestaw komputerowy znajdowa³ siê
na zewn¹trz pomieszczenia badaw-
czego.
Eksperyment rozpoczêto od od-
czytania samog³osek w kolejnoœci: a,
e, y, o, u, i. Nastêpnie mówca wypo-
wiedzia³ wczeœniej dobrane s³owa
i zdania: „mama”, „by³em”, „borsuk”,
„kino”, „umizgi”, „wymyty”, „bolo”,
„bergen”, „lufa”, „gaderypoluki” oraz
„Jaka ³adna dziœ pogoda”, „Du¿y dom
sta³ daleko”, „Muzyka buduje harmo-
PROBLEMY KRYMINALISTYKI 253/06
73
Schoeps, symbol CMC6U (P12-48),
z koñcówk¹ MK-4 o charakterystyce
kardioidalnej. Para rozstawiona
(ustawienie A–B). Wykorzystano
przedwzmacniacz firmy SONOSAX
typu SX-M2.
278440067.014.png 278440067.015.png
Z PRAKTYKI
ich podstawie przeprowadzono anali-
zê.
Wyniki i dyskusja
Ryc. 3. Spektrogram wypowiedzi testowej utrwalonej z u¿yciem rejestratora Marantz
Fig. 3. Spectrogram of test utterance recorded with Marantz device
Analiza korelacji po³o¿enia for-
mantów zosta³a przeprowadzona
w odniesieniu do zapisu analogowe-
go, uzyskanego z u¿yciem magneto-
fonu firmy Marantz, model CP 430.
Prezentowane poni¿ej wykresy kore-
lacji to odniesienie uzyskanych wyni-
ków dla nagrañ cyfrowych do pomia-
rów rozk³adu formantów w zapisie
analogowym.
Zaprezentowano równie¿ spektro-
gramy przedstawiaj¹ce rozk³ad ener-
gii w tej samej wypowiedzi, utrwalo-
nej z wykorzystaniem szeœciu torów
transmisji.
W wyniku analizy po³o¿enia for-
mantów ka¿dorazowo uzyskano bar-
dzo wysoki, zbli¿ony do 1, wspó³-
czynnik korelacji. Ma to istotny wp³yw
na praktykê fonoskopijn¹, gdy¿ wyko-
rzystanie tak ró¿nych urz¹dzeñ reje-
struj¹cych nie wprowadzi³o istotnych
ró¿nic w rozk³adzie maksimów lokal-
nych w widmie sygna³u mowy,
uwzglêdnianym w procesie identyfi-
kacji mówców. Dla bieg³ych i techni-
ków kryminalistyki konkluzja ta ozna-
cza, ¿e do utrwalenia wypowiedzi po-
równawczych nie jest wymagane
u¿ycie takiego samego rejestratora
jak dowodowy. Zakres przeprowa-
dzonego eksperymentu nie uprawnia
do wnioskowania o wp³ywie na po³o-
¿enie formantów transmisji telefo-
nicznej czy innych nietestowanych
urz¹dzeñ.
Odwo³anie siê do praktyki fono-
skopijnej pozwala dostrzec, ¿e uzy-
skana wysoka korelacja po³o¿enia
formantów w obrêbie rejestratorów
u¿ytych do eksperymentu jest silniej-
sza ni¿ w realiach kryminalistycz-
nych. W nagraniach dowodowych do-
datkowo pojawiaj¹ siê bowiem czyn-
niki, które nie wyst¹pi³y w ekspery-
mencie, jak np. odmienny stan emo-
cjonalny mówcy w trakcie wypowie-
dzi dowodowych i porównawczych,
r=9997
Ryc. 4. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów Marantz i portadisc (mikrofon
kardioidalny). Poni¿ej spektrogram wypowiedzi testowej utrwalonej z u¿yciem rejestratora portadisc (mi-
krofon kardioidalny).
Fig. 4. Correlation of utterances recorded with Marantz devices and portadisc (cordioidal microphone).
Below: spectrogram of test utterance recorded with portadisc (cardioidal microphone)
4500
4000
3500
3000
2500
2000
1500
1000
r=9996
500
0
0
1000 2000 3000 4000
minidisc-dook
Ryc. 5. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów Marantz i portadisc (mikrofon
dookólny). Poni¿ej spektrogram wypowiedzi testowej utrwalonej z u¿yciem rejestratora portadisc (mikro-
fon dookólny).
Fig. 5. Correlation of utterances recorded with Marantz devices and portadisc (surround microphone).
Below: spectrogram of test utterance recorded with portadisc (surround microphone)
74
PROBLEMY KRYMINALISTYKI 253/06
278440067.016.png 278440067.001.png 278440067.002.png 278440067.003.png 278440067.004.png 278440067.005.png 278440067.006.png 278440067.007.png
Z PRAKTYKI
4500
4000
4000
3500
3500
3000
3000
2500
2500
2000
2000
1500
1500
1000
1000
500
r=9994
500
r=9993
0
0
0
1000 2000 3000 4000
olympus
0
1000 2000 3000 4000
siemens
Ryc. 6. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów
Marantz i Olympus. Poni¿ej spektrogram wypowiedzi testowej utrwalonej
z u¿yciem rejestratora Olympus.
Fig. 6. Correlation of utterances recorded with Marantz and Siemens
devices. Below: spectrogram of test utterance recorded with Olympus
recorded
Ryc. 7. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów
Marantz i Siemens. Poni¿ej spektrogram wypowiedzi testowej utrwalonej
z u¿yciem rejestratora Siemens.
Fig. 7. Correlation of utterances recorded with Marantz and Siemens
devices. Below: spectrogram of test utterance recorded with Siemens
recorder
4000
sposób rejestracji
i dobór próbek za-
wsze wp³ywa na
os³abienie korela-
cji rozk³adu for-
mantów, tak ¿e
nie jest ona rów-
na 1.
– uogólnienie uzyskanych wyni-
ków na nagrania utrwalone z wyko-
rzystaniem transmisji telefonicznej
wymaga przeprowadzenia kolejnego
eksperymentu.
3500
3000
2500
2000
1500
1000
500
r=9995
Grzegorz Œlusarczyk
Jacek Rzeszotarski
Tadeusz Sikora
Jacek Wierzbicki
zdj.: autorzy
0
0
1000 2000 3000 4000
voip
Wnioski
Na podstawie
przeprowadzo-
nych badañ sfor-
mu³owano nastê-
puj¹ce wnioski:
– sposób zapi-
su rejestratorów
cyfrowych u¿y-
tych w ekspery-
mencie nie wp³y-
wa w istotny spo-
sób na rozmiesz-
czenie formantów w widmie sygna³u
mowy;
– identyfikacja mówców w oparciu
o analizê formantow¹ nie wymaga
wiernego odwzorowania specyfiki za-
pisu dowodowego w nagraniu porów-
nawczym;
BIBLIOGRAFIA
Ryc. 8. Stopieñ korelacji wypowiedzi utrwalonych z u¿yciem rejestratorów
Marantz i VoIP. Poni¿ej spektrogram wypowiedzi testowej utrwalonej z u¿y-
ciem rejestratora VoIP.
Fig. 8. Correlation of utterances recorded with Marantz and VolP devices.
Below: spectrogram of test utterance recorded with VolP recorder
1. Blair Benson K.: Audio Engine-
ering Handbook, McGraw-Hill Book Com-
pany, 1988.
2. Haines R.: Cyfrowe przetwarzanie
dŸwiêku, Wydawnictwo MIKOM, Warsza-
wa 2002.
3. Jassem W.: Podstawy fonetyki aku-
stycznej, Pañstwowe Wydawnictwo Na-
ukowe, Warszawa 1973.
4. Kominek M.: Zaczê³o siê od fono-
grafu, Polskie Wydawnictwo Muzyczne,
Kraków 1986.
5. Rzeszotarski J., Witkowska-Pa-
wlak W.: Identyfikacja mówców w obrêbie
materia³u dowodowego, „Problemy Kry-
minalistyki” 2004, nr 246, s. 15–18.
nie zawsze pe³na zgodnoœæ ci¹gów
alofonów w badanych samog³o-
skach.
Odrêbne zagadnienie stanowi
b³¹d pomiaru po³o¿enia formantów.
Nale¿y przyj¹æ, ¿e jest to jeden
z czynników, który bez wzglêdu na
PROBLEMY KRYMINALISTYKI 253/06
75
278440067.008.png 278440067.009.png 278440067.010.png 278440067.011.png 278440067.012.png
Zgłoś jeśli naruszono regulamin