Podstawy_Metod_Probabilistycznych_czII_JS.doc

(281 KB) Pobierz
ZB
Podstawy Metod Probabilistycznych i Statystyki                              2012/13

Janusz Szczepański  ( http://www.ippt.gov.pl/~jszczepa )

Notatki do wykładu na UKW

 

Część II

 

Przypomnienie pojęć z poprzednich wykładów (dokładniej przedstawione jest to w Części I) :

 

Doświadczenie losowe

 

Przestrzeń probabilistyczna = (Zbiór zdarzeń elementarnych, Sigma-ciało, Prawdopodobieństwo)

 

Przypomniałem o bardzo ważnym doświadczeniu, mianowicie o

Doświadczeniu zwanym Schematem Bernoulliego. Jest to

n-krotne powtórzenie w sposób niezależny tego samego doświadczenia, którego

wykonanie może dać dwa możliwe wyniki:

S – sukces z prawdopodobieństwem p,

P – porażka z prawdopodobieństwem 1-p = q.

Na ciągach (zdarzeniach elementarnych) o długości n określamy w sposób naturalny (jak iloczyn odpowiednich potęg liczb p i q) prawdopodobieństwo.

 

 

Pojęcie zmiennej losowej

Bardzo!!! ważne pojęcie RP.

 

Zmienna losowa to funkcja X: , która jest mierzalna.

 

Przypomniałem co to jest Rozkład Prawdopodobieństwa zmiennej losowej:

przeniesienie funkcji prawdopodobieństwa P z na zbiór wartości zmiennej losowej, tzn. na liczby rzeczywiste a precyzyjniej na zbiorów borelowskich w , tzn. biorąc przeciwobrazy otrzymuje miarę probabilistyczną na określoną następująco:

innymi słowy

.

 

Do jednoznacznego opisu Rozkładu Prawdopodobieństwa służy Dystrybuanta

Dystrybuanta odpowiadająca zmiennej losowej X to funkcja : określona następująco:

 

 

 

Własności dystrybuanty:

a)      dystrybuanta jest funkcją niemalejącą,

b)     granica w –nieskończoności jest 0 a w +nieskończoności jest 1,

c)      jest prawostronnie ciągła.

 

Przypomniałem pojęcie gęstości rozkładu prawdopodobieństwa.

 

Przypomniałem typy zmiennych losowych:

a)      o rozkładzie dyskretnym (zbiór wartości zmiennej jest przeliczalny),

b)     zmienna o rozkładzie ciągłym (posiada funkcje gęstości),

c)      zmienna o rozkładzie osobliwym (zbiór tzw. punktów wzrostu ma miarę Lebesgue’a zero).

 

Przypomniałem Tw. Lebesguea o rozkładzie dowolnej dystrybuanty.

 

Uwaga. Wszystkie powyższe pojęcia i fakty są dokładnie opisane w poprzednim pliku cz_I.

 

Nowy fakt

 

Niech X będzie zmienna losowa o rozkładzie ciągłym z gęstością f.

Związek miedzy dystrybuanta a gęstością:

 

.

 

Ponadto, prawie wszędzie (tzn. wszędzie poza być może zbiorem miary Lebesguea zero) zachodzi związek

.

 

Na poprzednich wykładach wprowadziłem charakterystyki liczbowe zmiennej losowej, tzn. wartość średnią i wariancję.

Podałem ich podstawowe własności.

 

Przypomniałem co to jest odchylenie standardowe!

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

NOWE POJĘCIA I TWIERDZENIA

 

A. Rozkłady gęstości najczęściej spotykane w praktyce

 

 

 

 

 

ROZKŁAD NORMALNY  !!!!!!

 

                                       

 

 

 

 

 

 

 

 

 

 

 

B. Współczynnik korelacji

 

Rozpatrzmy dwie zmienne losowe:

 

 

Jak zbadać czy istnieje pomiędzy nimi związek funkcyjny ?

Współczynnik korelacji mierzy właśnie taką zależność (liniową) dwóch zmiennych od siebie.

 

Zmienną losową Z nazywamy standaryzowaną gdy i . Każdą zmienną losową X można przy pomocy przekształcenia liniowego sprowadzić do postaci standaryzowanej , :

 

, .

 

DEFINICJA WSPÓŁCZYNNIKA KORELACJI (wg. książki Borowkowa)

Współczynnik korelacji to liczba obliczana następująco

                                                          .

 

 

Własności współczynnika korelacji:

 

a)   

b) jeżeli zmienne losowe X, Y są niezależne to (ale niekoniecznie w drugą stronę)

c)  wtedy i tylko wtedy gdy istnieją takie liczby i b, ze . Czyli pomiędzy zmiennymi X i Y jest wówczas związek liniowy.

 

Dowody poniżej, ale najpierw przykład.

 

Przykład

Niech zmienna losowa X będzie wielkością pewnego sygnału. W wyniku zaburzeń odbiornika, odbierana jest pewna wielkość (która jest zmienną losową) ( - współczynnik wzmocnienia, który jest liczbą, - zaburzenie, które jest zmienną losową). Załóżmy, że zmienne losowe X i są niezależne. Niech będzie . Obliczmy współczynnik korelacji zmiennych losowych X i Y:

 

Zauważmy, że jeżeli odchylenie standardowe zaburzenia jest wielkie w porównaniu ze wzmocnieniem , to współczynnik korelacji jest bliski zeru i sygnał otrzymany Y praktycznie nie zależy od X (więc trudno go odtworzyć). Jeżeli zaś jest małe w porównaniu z , to jest bliskie 1 i łatwo jest na podstawie Y odtworzyć X.

 

Definicja

Współczynnikiem kowariancji dwóch zmiennych losowych X, Y określonych na tej samej przestrzeni probabilistycznej, tzn. nazywamy liczbę

. Od korelacji różni się brakiem czynnika normalizacyjnego.

 

 

Dowód na własności współczynnika korelacji

 

a)

Rzeczywiście, mamy

 

i stąd teza.

b) Jeżeli zmienne losowe X, Y są niezależne to zmienne też są niezależne.

 

c)

Niech . Oznaczmy i ; wówczas

.

 

Niech teraz . Na przykład . Wówczas

Stąd

i stąd mamy liniowy związek pomiędzy X i Y.

Jeśli to rozpatrując otrzymujemy

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

C. Nierownosc Czebyszewa i Prawo wielkich Liczb

 

Cel: Oszacowanie prawdopodobieństwa rozrzutu (mierzonego w odchyleniach standardowych) wartości zmiennej losowej wokół jej wartości średniej.

 

 

Twierdzenie

Niech z prawdopodobieństwem 1. Wówczas dla każdego zachodzi

 

(*)                                                     .

 

Dowód.  Z własności całki Lebesque’a  i faktu, że mamy .

 

Wniosek

Dla dowolnej zmiennej losowej X zachodzi Nierówność Czebyszewa

 

.

Dowód. Stosujemy nierówność (*) do zmiennej losowej .

 

Za pomocą tej nierówności możemy ocenić prawdopodobieństwo różnych odchyleń zmiennej X znając EX i VX. Widzimy, że mała wariancja VX oznacza mały rozrzut wartości zmiennej losowej wokół wartości średniej.

 

Przykład (Borowkow)

Przypuśćmy, że chcemy zmierzyć średnicę tarczy księżyca za pomocą teleskopu. Z powodu zakłóceń atmosferycznych pomiary dokonane w różnym czasie dadzą różne wyniki. Niech

oznacza odchylenie pomiaru od wartości prawdziwej, równej a. Niech będzie EX=a i . Dokonajmy kolejno n niezależnych pomiarów opisanych realizacjami zmiennych losowych i oznaczmy przez  ich wartość średnią.

Zauważmy, że

 

 

Wykorzystując teraz niezależność!!! zmiennych losowych mamy

.

Tak więc wariancja średniej arytmetycznej wszystkich obserwacji zmniejsza się wraz ze wzrostem liczby obserwacji. Dlatego, jest rzeczą naturalną oceniać wartość a za pomocą mierzenia/analizy wartości średniej, tzn. . Powstaje pytanie:

Ile należy dokonać obserwacji, aby z prawdopodobieństwem większym od 0.99 było

?

Chcemy więc, aby zachodziła nierówność

 

czyli przechodząc do zdarzeń przeciwnych musimy sprawdzić dla jakich n zachodzi

 

.

Na podstawie nierówności Czebyszewa zastosowanej do mamy

gdzie i . Podstawiając te wartości mamy

.

Trzeba więc wybrać n tak aby to wówczas warunek na żądaną wielkość prawdopodobieństwa będzie spełniony. Stąd otrzymujemy .

 

 

PRAWO WIELKICH LICZB

 

Założenia/oznaczenia

Przypuśćmy, że wykonujemy ciąg doświadczeń w każdym z których pewne zdarzenie A pojawia się z prawdopodobieństwem p niezależnie od wyników innych doświadczeń. Utwórzmy ciąg zmiennych losowych  w następujący sposób:

jeżeli w k-tym doświadczeniu zdarzenie A zaszło, w przypadku przeciwnym. Zatem ciąg , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie Bernoulliego:

,  

, .

Rozpatrzmy nową zmienną losową  jest to po prostu liczba pojawień się zdarzenia A w n pierwszych doświadczeniach. Mamy, z własności E oraz V i powyższych faktów:

 

.

 

 

 

...

Zgłoś jeśli naruszono regulamin