Podstawy_Metod_Probabilistycznych_czII_JS.doc

(281 KB) Pobierz

Podstawy Metod Probabilistycznych i Statystyki 2012/13

Janusz Szczepański ( http://www.ippt.gov.pl/~jszczepa )

Notatki do wykładu na UKW

Część II

Przypomnienie pojęć z poprzednich wykładów (dokładniej przedstawione jest to w Części I) :

Doświadczenie losowe

Przestrzeń probabilistyczna = (Zbiór zdarzeń elementarnych, Sigma-ciało, Prawdopodobieństwo)

Przypomniałem o bardzo ważnym doświadczeniu, mianowicie o

Doświadczeniu zwanym Schematem Bernoulliego. Jest to

n-krotne powtórzenie w sposób niezależny tego samego doświadczenia, którego

wykonanie może dać dwa możliwe wyniki:

S – sukces z prawdopodobieństwem p,

P – porażka z prawdopodobieństwem 1-p = q.

Na ciągach (zdarzeniach elementarnych) o długości n określamy w sposób naturalny (jak iloczyn odpowiednich potęg liczb p i q) prawdopodobieństwo.

Pojęcie zmiennej losowej

Bardzo!!! ważne pojęcie RP.

Zmienna losowa to funkcja X: , która jest mierzalna.

Przypomniałem co to jest Rozkład Prawdopodobieństwa zmiennej losowej:

przeniesienie funkcji prawdopodobieństwa P z na zbiór wartości zmiennej losowej, tzn. na liczby rzeczywiste a precyzyjniej na zbiorów borelowskich w , tzn. biorąc przeciwobrazy otrzymuje miarę probabilistyczną na określoną następująco:

innymi słowy

Do jednoznacznego opisu Rozkładu Prawdopodobieństwa służy Dystrybuanta

Dystrybuanta odpowiadająca zmiennej losowej X to funkcja : określona następująco:

Własności dystrybuanty:

a) dystrybuanta jest funkcją niemalejącą,

b) granica w –nieskończoności jest 0 a w +nieskończoności jest 1,

c) jest prawostronnie ciągła.

Przypomniałem pojęcie gęstości rozkładu prawdopodobieństwa.

Przypomniałem typy zmiennych losowych:

a) o rozkładzie dyskretnym (zbiór wartości zmiennej jest przeliczalny),

b) zmienna o rozkładzie ciągłym (posiada funkcje gęstości),

c) zmienna o rozkładzie osobliwym (zbiór tzw. punktów wzrostu ma miarę Lebesgue’a zero).

Przypomniałem Tw. Lebesguea o rozkładzie dowolnej dystrybuanty.

Uwaga. Wszystkie powyższe pojęcia i fakty są dokładnie opisane w poprzednim pliku cz_I.

Nowy fakt

Niech X będzie zmienna losowa o rozkładzie ciągłym z gęstością f.

Związek miedzy dystrybuanta a gęstością:

Ponadto, prawie wszędzie (tzn. wszędzie poza być może zbiorem miary Lebesguea zero) zachodzi związek

Na poprzednich wykładach wprowadziłem charakterystyki liczbowe zmiennej losowej, tzn. wartość średnią i wariancję.

Podałem ich podstawowe własności.

Przypomniałem co to jest odchylenie standardowe!

NOWE POJĘCIA I TWIERDZENIA

A. Rozkłady gęstości najczęściej spotykane w praktyce

ROZKŁAD NORMALNY !!!!!!

B. Współczynnik korelacji

Rozpatrzmy dwie zmienne losowe:

Jak zbadać czy istnieje pomiędzy nimi związek funkcyjny ?

Współczynnik korelacji mierzy właśnie taką zależność (liniową) dwóch zmiennych od siebie.

Zmienną losową Z nazywamy standaryzowaną gdy i . Każdą zmienną losową X można przy pomocy przekształcenia liniowego sprowadzić do postaci standaryzowanej , :

, .

DEFINICJA WSPÓŁCZYNNIKA KORELACJI (wg. książki Borowkowa)

Współczynnik korelacji to liczba obliczana następująco

Własności współczynnika korelacji:

b) jeżeli zmienne losowe X, Y są niezależne to (ale niekoniecznie w drugą stronę)

c) wtedy i tylko wtedy gdy istnieją takie liczby i b, ze . Czyli pomiędzy zmiennymi X i Y jest wówczas związek liniowy.

Dowody poniżej, ale najpierw przykład.

Przykład

Niech zmienna losowa X będzie wielkością pewnego sygnału. W wyniku zaburzeń odbiornika, odbierana jest pewna wielkość (która jest zmienną losową) ( - współczynnik wzmocnienia, który jest liczbą, - zaburzenie, które jest zmienną losową). Załóżmy, że zmienne losowe X i są niezależne. Niech będzie . Obliczmy współczynnik korelacji zmiennych losowych X i Y:

Zauważmy, że jeżeli odchylenie standardowe zaburzenia jest wielkie w porównaniu ze wzmocnieniem , to współczynnik korelacji jest bliski zeru i sygnał otrzymany Y praktycznie nie zależy od X (więc trudno go odtworzyć). Jeżeli zaś jest małe w porównaniu z , to jest bliskie 1 i łatwo jest na podstawie Y odtworzyć X.

Definicja

Współczynnikiem kowariancji dwóch zmiennych losowych X, Y określonych na tej samej przestrzeni probabilistycznej, tzn. nazywamy liczbę

. Od korelacji różni się brakiem czynnika normalizacyjnego.

Dowód na własności współczynnika korelacji

Rzeczywiście, mamy

i stąd teza.

b) Jeżeli zmienne losowe X, Y są niezależne to zmienne też są niezależne.

Niech . Oznaczmy i ; wówczas

Niech teraz . Na przykład . Wówczas

Stąd

i stąd mamy liniowy związek pomiędzy X i Y.

Jeśli to rozpatrując otrzymujemy

C. Nierownosc Czebyszewa i Prawo wielkich Liczb

Cel: Oszacowanie prawdopodobieństwa rozrzutu (mierzonego w odchyleniach standardowych) wartości zmiennej losowej wokół jej wartości średniej.

Twierdzenie

Niech z prawdopodobieństwem 1. Wówczas dla każdego zachodzi

(*) .

Dowód. Z własności całki Lebesque’a i faktu, że mamy .

Wniosek

Dla dowolnej zmiennej losowej X zachodzi Nierówność Czebyszewa

Dowód. Stosujemy nierówność (*) do zmiennej losowej .

Za pomocą tej nierówności możemy ocenić prawdopodobieństwo różnych odchyleń zmiennej X znając EX i VX. Widzimy, że mała wariancja VX oznacza mały rozrzut wartości zmiennej losowej wokół wartości średniej.

Przykład (Borowkow)

Przypuśćmy, że chcemy zmierzyć średnicę tarczy księżyca za pomocą teleskopu. Z powodu zakłóceń atmosferycznych pomiary dokonane w różnym czasie dadzą różne wyniki. Niech

oznacza odchylenie pomiaru od wartości prawdziwej, równej a. Niech będzie EX=a i . Dokonajmy kolejno n niezależnych pomiarów opisanych realizacjami zmiennych losowych i oznaczmy przez ich wartość średnią.

Zauważmy, że

Wykorzystując teraz niezależność!!! zmiennych losowych mamy

Tak więc wariancja średniej arytmetycznej wszystkich obserwacji zmniejsza się wraz ze wzrostem liczby obserwacji. Dlatego, jest rzeczą naturalną oceniać wartość a za pomocą mierzenia/analizy wartości średniej, tzn. . Powstaje pytanie:

Ile należy dokonać obserwacji, aby z prawdopodobieństwem większym od 0.99 było

Chcemy więc, aby zachodziła nierówność

czyli przechodząc do zdarzeń przeciwnych musimy sprawdzić dla jakich n zachodzi

Na podstawie nierówności Czebyszewa zastosowanej do mamy

gdzie i . Podstawiając te wartości mamy

Trzeba więc wybrać n tak aby to wówczas warunek na żądaną wielkość prawdopodobieństwa będzie spełniony. Stąd otrzymujemy .

PRAWO WIELKICH LICZB

Założenia/oznaczenia

Przypuśćmy, że wykonujemy ciąg doświadczeń w każdym z których pewne zdarzenie A pojawia się z prawdopodobieństwem p niezależnie od wyników innych doświadczeń. Utwórzmy ciąg zmiennych losowych w następujący sposób:

jeżeli w k-tym doświadczeniu zdarzenie A zaszło, w przypadku przeciwnym. Zatem ciąg , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie Bernoulliego:

, .

Rozpatrzmy nową zmienną losową jest to po prostu liczba pojawień się zdarzenia A w n pierwszych doświadczeniach. Mamy, z własności E oraz V i powyższych faktów:

...