Podstawy_Metod_Probabilistycznych_III_JS.doc

(454 KB) Pobierz

NOTATKI DO WYKŁADU

PODSTAWY METOD PROBABILISTYCZNYCH I STATYSTYKI

Materiał ten został przygotowany w oparciu o zalecane książki: Borowkowa, Jakubowskiego i Hellwiga. Szczegółowe dane tych książek wysłałem po pierwszym wykładzie.

cz. III

Na wstępie wykładu przypomniany został szereg pojęć fundamentalnych dla teorii prawdopodobieństwa:

Pojęcie zmiennej losowej jako

funkcji mierzalnej X: .

Pojęcie Rozkładu Prawdopodobieństwa zmiennej losowej X. Przeniesienie funkcji prawdopodobieństwa z na zbiór wartości , a precyzyjniej na zbiorów borelowskich w , tzn. otrzymanie miary probabilistycznej na określonej następująco:

innymi słowy

Do jednoznacznego opisu Rozkład Prawdopodobienstwa służy Dystrybuanta.

Niech X będzie zmienna losowa o rozkładzie ciągłym z gęstością f.

Związek między dystrybuanta a gęstością:

Ponadto, „prawie wszędzie” (tzn. wszędzie poza być może zbiorem miary Lebesgue’a zero) zachodzi zwiazek

Pojęcie współczynnika korelacji

Mamy dwie zmienne losowe.

Współczynnik mierzy zależność liniową dwóch zmiennych od siebie.

Zmienna losowa Z nazywamy standaryzowana gdy i . Każdą zmienna losowa X można standaryzować:

Współczynnik korelacji definiuje się następująco: .

Przypomniałem nierówność Czebyszewa:

pozwala ona na oszacowanie prawdopodobieństwa rozrzutu (mierzonego w odchyleniach standardowych) wartości zmiennej losowej wokół jej wartości średniej.

Przypomniałem także wynikające z niej Prawo Wielkich Liczb.

PRAWO WIELKICH LICZB

Przypuśćmy, że wykonujemy ciąg doświadczeń w każdym z których pewne zdarzenie A pojawia się z prawdopodobieństwem p niezależnie od wyników innych doświadczeń. Utwórzmy ciąg zmiennych losowych w następujący sposób:

jeżeli w k-tym doświadczeniu zdarzenie A zaszło, w przypadku przeciwnym. Wówczas ciąg , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie Bernoulliego:

, , mamy

, .

Rozpatrzmy nową zmienną losową która jest to prostu liczbą pojawień się zdarzenia A w n pierwszych doświadczeniach. Mamy

Twierdzenie

Dla każdego

gdy .

Dowód

Na mocy nierówności Czebyszewa zastosowanego do zmiennej losowej mamy

i prawa strona dąży do zera gdy n dąży do nieskończoności.

Komentarz

Sens tego Twierdzenia polega na tym, że wprowadzone określenie prawdopodobieństwa odpowiada intuicyjnemu rozumieniu prawdopodobieństwa jako granicy częstości pojawienia się zdarzenia. Przecież można uważać jako częstość pojawienia się zdarzenia A dla którego P(A) = p. Okazało się, że w podanym w Twierdzeniu sensie zbliża się nieograniczenie do p.

Przypomniane zostały typy zbieżności zmiennych losowych

Wszystkie pojęcia powyżej zostały dokładniej opisane w poprzednich Notatkach do wykładu.

NOWE POJĘCIA I TWIERDZENIA

IDEA PRAW WIELKICH LICZB

Rozważany jest ciąg zmiennych losowych określonych na tej samej przestrzeni probabilistycznej. (to jest tzw. „milczące” założenie). Znajomość tej przestrzeni nie jest konieczna aby móc stosować prawa wielkich liczb czy też twierdzenia graniczne.

Założenia

dotyczą niezależności, rozkładu (wartości średniej, wariancji, typu rozkładu) tych zmiennych.

Teza

dotyczy własności rozkładu granicznego średniej arytmetycznej sumy zmiennych losowych (wartości średniej, postaci rozkładu). Ważny jest typ zbieżności do rozkładu granicznego.

==============================================================

Na przykład Problem

Jak znaleźć w Schemacie Bernoulliego ?

Dla dużych n wzór ten jest bardzo niewygodny do obliczeń. W związku z tym powstaje pytanie asymptotycznego zachowania się prawdopodobieństwa dla .

(Ja używam notacji ale często się pisze dla oznaczenia tej zmiennej losowej, od słowa ang. success, .)

Odpowiedzią jest

Twierdzenie Moivre’a-Laplace’a

Rozpatrzmy ciąg niezależnych zmiennych losowych o jednakowym rozkładzie Bernoulliego (oczywiście określonych na tej samej przestrzeni probabilistycznej), tzn. , , , .

Rozpatrzmy zmienną losową oraz zmienną losową standaryzowaną

Zachodzi

. tu wykorzystujemy niezależność!!!

Zauważmy, że i .

Niech a i b będą dowolnymi ustalonymi liczbami.

Wówczas

TEZA

gdzie jest dystrybuantą rozkładu normalnego o parametrach (0,1), tzn.:

Oszacowanie błędu przybliżenia dla Twierdzenie Moivre’a-Laplace’a

Przy oznaczeniach jak powyżej.

Niech A i B będą liczbami całkowitymi,

Twierdzenie

Niech b>a, . Wówczas, jeśli , ,

to zachodzi:

gdzie dla i=1,2.

Z tej formuły wynika, że przybliżenie Moivre’a Laplace’a dobrze przybliża, gdy wariancja np. jest duża. Wówczas błąd jest rzędu , a zatem rzędu (dokładniej ).

Prawo wielkich liczb w Postaci Chinczyna

Twierdzenie

Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, mających wartość oczekiwaną . Niech .

Wówczas

przy . (Czyli tutaj jest zbieżność według prawdopodobieństwa.)

Mocne prawo wielkich liczb Kolmogorowa

Twierdzenie

Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie.

Na to, aby

, p.n. ( )

potrzeba i wystarcza (wtedy i tylko wtedy), aby istniała wartość oczekiwana .

(Czyli tutaj jest zbieżność prawie na pewno).

CENTRALNE TWIERDZENIE GRANICZNE dla zmiennych losowych o jednakowym rozkładzie.

Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, mających wartość oczekiwaną . Ponadto, dla każdego k istnieje wariancja . Niech i niech będzie dystrybuantą rozkładu normalnego z parametrami (0,1). Zauważmy, że

, (czyli odchylenie standardowe ).

Określmy ciąg zmiennych losowych standaryzowanych następująco:

. Zauważmy, że oraz

i .

Wówczas, jeżeli , to przy zachodzi

jednostajnie względem x .

Ciąg nazywamy asymptotycznie normalnym. .

Czyli zmienna losowa ma rozkład normalny dla dużych n (precyzyjniej: można jej rozkład przybliżać rozkładem normalnym).

CENTRALNE TWIERDZENIE GRANICZNE dla dowolnych ciągów niezależnych zmiennych losowych.

Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych. Załóżmy istnienie wartości oczekiwanych i wariancji . Wprowadźmy następujące oznaczenia

Wówczas jeśli spełniony jest następujący warunek (tzw. warunek Lindeberga):

dla każdego przy

to ciąg jest asymptotycznie normalny (czyli rozkładem granicznym jest rozkład normalny).

Warunek Lindeberga żąda, aby części wariancji zmiennych losowych po obszarze wykraczającym poza granice sumarycznego odchylenia standardowego dawały w sumie zanikającą małą wielkość.

Ogólnie, stosujemy następujące oznaczenie .

PROCESY STOCHASTYCZNE

Procesem stochastycznym nazywamy rodzinę zmiennych losowych określonych na tej samej przestrzeni probabilistycznej

i zależnych od parametru t przyjmującego wartości z pewnego zbioru T. Proces stochastyczny będziemy oznaczać symbolem .

Przestrzeń T często nazywana jest czasem.

Przypomnienie

Zmienna losowa X odwzorowującą zbiór w zbiór liczb rzeczywistych R nazywamy funkcją mierzalną, gdy dla dowolnego zbioru borelowskiego przeciwobraz jest zbiorem należącym do -ciała M.