Janusz Szczepański ( http://www.ippt.gov.pl/~jszczepa )
Notatki do wykładu na UKW
Część II
Przypomnienie pojęć z poprzednich wykładów (dokładniej przedstawione jest to w Części I) :
Doświadczenie losowe
Przestrzeń probabilistyczna = (Zbiór zdarzeń elementarnych, Sigma-ciało, Prawdopodobieństwo)
Przypomniałem o bardzo ważnym doświadczeniu, mianowicie o
Doświadczeniu zwanym Schematem Bernoulliego. Jest to
n-krotne powtórzenie w sposób niezależny tego samego doświadczenia, którego
wykonanie może dać dwa możliwe wyniki:
S – sukces z prawdopodobieństwem p,
P – porażka z prawdopodobieństwem 1-p = q.
Na ciągach (zdarzeniach elementarnych) o długości n określamy w sposób naturalny (jak iloczyn odpowiednich potęg liczb p i q) prawdopodobieństwo.
Pojęcie zmiennej losowej
Bardzo!!! ważne pojęcie RP.
Zmienna losowa to funkcja X: , która jest mierzalna.
Przypomniałem co to jest Rozkład Prawdopodobieństwa zmiennej losowej:
przeniesienie funkcji prawdopodobieństwa P z na zbiór wartości zmiennej losowej, tzn. na liczby rzeczywiste a precyzyjniej na zbiorów borelowskich w , tzn. biorąc przeciwobrazy otrzymuje miarę probabilistyczną na określoną następująco:
innymi słowy
.
Do jednoznacznego opisu Rozkładu Prawdopodobieństwa służy Dystrybuanta
Dystrybuanta odpowiadająca zmiennej losowej X to funkcja : określona następująco:
Własności dystrybuanty:
a) dystrybuanta jest funkcją niemalejącą,
b) granica w –nieskończoności jest 0 a w +nieskończoności jest 1,
c) jest prawostronnie ciągła.
Przypomniałem pojęcie gęstości rozkładu prawdopodobieństwa.
Przypomniałem typy zmiennych losowych:
a) o rozkładzie dyskretnym (zbiór wartości zmiennej jest przeliczalny),
b) zmienna o rozkładzie ciągłym (posiada funkcje gęstości),
c) zmienna o rozkładzie osobliwym (zbiór tzw. punktów wzrostu ma miarę Lebesgue’a zero).
Przypomniałem Tw. Lebesguea o rozkładzie dowolnej dystrybuanty.
Uwaga. Wszystkie powyższe pojęcia i fakty są dokładnie opisane w poprzednim pliku cz_I.
Niech X będzie zmienna losowa o rozkładzie ciągłym z gęstością f.
Związek miedzy dystrybuanta a gęstością:
Ponadto, prawie wszędzie (tzn. wszędzie poza być może zbiorem miary Lebesguea zero) zachodzi związek
Na poprzednich wykładach wprowadziłem charakterystyki liczbowe zmiennej losowej, tzn. wartość średnią i wariancję.
Podałem ich podstawowe własności.
Przypomniałem co to jest odchylenie standardowe!
B. Współczynnik korelacji
Rozpatrzmy dwie zmienne losowe:
Jak zbadać czy istnieje pomiędzy nimi związek funkcyjny ?
Współczynnik korelacji mierzy właśnie taką zależność (liniową) dwóch zmiennych od siebie.
Zmienną losową Z nazywamy standaryzowaną gdy i . Każdą zmienną losową X można przy pomocy przekształcenia liniowego sprowadzić do postaci standaryzowanej , :
, .
Współczynnik korelacji to liczba obliczana następująco
Własności współczynnika korelacji:
a)
b) jeżeli zmienne losowe X, Y są niezależne to (ale niekoniecznie w drugą stronę)
c) wtedy i tylko wtedy gdy istnieją takie liczby i b, ze . Czyli pomiędzy zmiennymi X i Y jest wówczas związek liniowy.
Dowody poniżej, ale najpierw przykład.
Przykład
Niech zmienna losowa X będzie wielkością pewnego sygnału. W wyniku zaburzeń odbiornika, odbierana jest pewna wielkość (która jest zmienną losową) ( - współczynnik wzmocnienia, który jest liczbą, - zaburzenie, które jest zmienną losową). Załóżmy, że zmienne losowe X i są niezależne. Niech będzie . Obliczmy współczynnik korelacji zmiennych losowych X i Y:
Zauważmy, że jeżeli odchylenie standardowe zaburzenia jest wielkie w porównaniu ze wzmocnieniem , to współczynnik korelacji jest bliski zeru i sygnał otrzymany Y praktycznie nie zależy od X (więc trudno go odtworzyć). Jeżeli zaś jest małe w porównaniu z , to jest bliskie 1 i łatwo jest na podstawie Y odtworzyć X.
Współczynnikiem kowariancji dwóch zmiennych losowych X, Y określonych na tej samej przestrzeni probabilistycznej, tzn. nazywamy liczbę
. Od korelacji różni się brakiem czynnika normalizacyjnego.
Dowód na własności współczynnika korelacji
Rzeczywiście, mamy
i stąd teza.
b) Jeżeli zmienne losowe X, Y są niezależne to zmienne też są niezależne.
c)
Niech . Oznaczmy i ; wówczas
Niech teraz . Na przykład . Wówczas
Stąd
i stąd mamy liniowy związek pomiędzy X i Y.
Jeśli to rozpatrując otrzymujemy
C. Nierownosc Czebyszewa i Prawo wielkich Liczb
Cel: Oszacowanie prawdopodobieństwa rozrzutu (mierzonego w odchyleniach standardowych) wartości zmiennej losowej wokół jej wartości średniej.
Niech z prawdopodobieństwem 1. Wówczas dla każdego zachodzi
(*) .
Dowód. Z własności całki Lebesque’a i faktu, że mamy .
Dla dowolnej zmiennej losowej X zachodzi Nierówność Czebyszewa
Dowód. Stosujemy nierówność (*) do zmiennej losowej .
Za pomocą tej nierówności możemy ocenić prawdopodobieństwo różnych odchyleń zmiennej X znając EX i VX. Widzimy, że mała wariancja VX oznacza mały rozrzut wartości zmiennej losowej wokół wartości średniej.
Przykład (Borowkow)
Przypuśćmy, że chcemy zmierzyć średnicę tarczy księżyca za pomocą teleskopu. Z powodu zakłóceń atmosferycznych pomiary dokonane w różnym czasie dadzą różne wyniki. Niech
oznacza odchylenie pomiaru od wartości prawdziwej, równej a. Niech będzie EX=a i . Dokonajmy kolejno n niezależnych pomiarów opisanych realizacjami zmiennych losowych i oznaczmy przez ich wartość średnią.
Zauważmy, że
Wykorzystując teraz niezależność!!! zmiennych losowych mamy
Tak więc wariancja średniej arytmetycznej wszystkich obserwacji zmniejsza się wraz ze wzrostem liczby obserwacji. Dlatego, jest rzeczą naturalną oceniać wartość a za pomocą mierzenia/analizy wartości średniej, tzn. . Powstaje pytanie:
Ile należy dokonać obserwacji, aby z prawdopodobieństwem większym od 0.99 było
?
Chcemy więc, aby zachodziła nierówność
czyli przechodząc do zdarzeń przeciwnych musimy sprawdzić dla jakich n zachodzi
Na podstawie nierówności Czebyszewa zastosowanej do mamy
gdzie i . Podstawiając te wartości mamy
Trzeba więc wybrać n tak aby to wówczas warunek na żądaną wielkość prawdopodobieństwa będzie spełniony. Stąd otrzymujemy .
PRAWO WIELKICH LICZB
Przypuśćmy, że wykonujemy ciąg doświadczeń w każdym z których pewne zdarzenie A pojawia się z prawdopodobieństwem p niezależnie od wyników innych doświadczeń. Utwórzmy ciąg zmiennych losowych w następujący sposób:
jeżeli w k-tym doświadczeniu zdarzenie A zaszło, w przypadku przeciwnym. Zatem ciąg , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie Bernoulliego:
,
Rozpatrzmy nową zmienną losową jest to po prostu liczba pojawień się zdarzenia A w n pierwszych doświadczeniach. Mamy, z własności E oraz V i powyższych faktów:
...
Esta15