NOTATKI DO WYKŁADU
Materiał ten został przygotowany w oparciu o zalecane książki: Borowkowa, Jakubowskiego i Hellwiga. Szczegółowe dane tych książek wysłałem po pierwszym wykładzie.
cz. III
Na wstępie wykładu przypomniany został szereg pojęć fundamentalnych dla teorii prawdopodobieństwa:
Pojęcie zmiennej losowej jako
funkcji mierzalnej X: .
Pojęcie Rozkładu Prawdopodobieństwa zmiennej losowej X. Przeniesienie funkcji prawdopodobieństwa z na zbiór wartości , a precyzyjniej na zbiorów borelowskich w , tzn. otrzymanie miary probabilistycznej na określonej następująco:
innymi słowy
Do jednoznacznego opisu Rozkład Prawdopodobienstwa służy Dystrybuanta.
Niech X będzie zmienna losowa o rozkładzie ciągłym z gęstością f.
Związek między dystrybuanta a gęstością:
.
Ponadto, „prawie wszędzie” (tzn. wszędzie poza być może zbiorem miary Lebesgue’a zero) zachodzi zwiazek
Pojęcie współczynnika korelacji
Mamy dwie zmienne losowe.
Współczynnik mierzy zależność liniową dwóch zmiennych od siebie.
Zmienna losowa Z nazywamy standaryzowana gdy i . Każdą zmienna losowa X można standaryzować:
Współczynnik korelacji definiuje się następująco: .
Przypomniałem nierówność Czebyszewa:
pozwala ona na oszacowanie prawdopodobieństwa rozrzutu (mierzonego w odchyleniach standardowych) wartości zmiennej losowej wokół jej wartości średniej.
Przypomniałem także wynikające z niej Prawo Wielkich Liczb.
PRAWO WIELKICH LICZB
Przypuśćmy, że wykonujemy ciąg doświadczeń w każdym z których pewne zdarzenie A pojawia się z prawdopodobieństwem p niezależnie od wyników innych doświadczeń. Utwórzmy ciąg zmiennych losowych w następujący sposób:
jeżeli w k-tym doświadczeniu zdarzenie A zaszło, w przypadku przeciwnym. Wówczas ciąg , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie Bernoulliego:
, , mamy
, .
Rozpatrzmy nową zmienną losową która jest to prostu liczbą pojawień się zdarzenia A w n pierwszych doświadczeniach. Mamy
Twierdzenie
Dla każdego
gdy .
Dowód
Na mocy nierówności Czebyszewa zastosowanego do zmiennej losowej mamy
i prawa strona dąży do zera gdy n dąży do nieskończoności.
Komentarz
Sens tego Twierdzenia polega na tym, że wprowadzone określenie prawdopodobieństwa odpowiada intuicyjnemu rozumieniu prawdopodobieństwa jako granicy częstości pojawienia się zdarzenia. Przecież można uważać jako częstość pojawienia się zdarzenia A dla którego P(A) = p. Okazało się, że w podanym w Twierdzeniu sensie zbliża się nieograniczenie do p.
Przypomniane zostały typy zbieżności zmiennych losowych
Wszystkie pojęcia powyżej zostały dokładniej opisane w poprzednich Notatkach do wykładu.
Rozważany jest ciąg zmiennych losowych określonych na tej samej przestrzeni probabilistycznej. (to jest tzw. „milczące” założenie). Znajomość tej przestrzeni nie jest konieczna aby móc stosować prawa wielkich liczb czy też twierdzenia graniczne.
Założenia
dotyczą niezależności, rozkładu (wartości średniej, wariancji, typu rozkładu) tych zmiennych.
Teza
dotyczy własności rozkładu granicznego średniej arytmetycznej sumy zmiennych losowych (wartości średniej, postaci rozkładu). Ważny jest typ zbieżności do rozkładu granicznego.
==============================================================
Jak znaleźć w Schemacie Bernoulliego ?
Dla dużych n wzór ten jest bardzo niewygodny do obliczeń. W związku z tym powstaje pytanie asymptotycznego zachowania się prawdopodobieństwa dla .
(Ja używam notacji ale często się pisze dla oznaczenia tej zmiennej losowej, od słowa ang. success, .)
Odpowiedzią jest
Rozpatrzmy ciąg niezależnych zmiennych losowych o jednakowym rozkładzie Bernoulliego (oczywiście określonych na tej samej przestrzeni probabilistycznej), tzn. , , , .
Rozpatrzmy zmienną losową oraz zmienną losową standaryzowaną
Zachodzi
. tu wykorzystujemy niezależność!!!
Zauważmy, że i .
Niech a i b będą dowolnymi ustalonymi liczbami.
Wówczas
TEZA
gdzie jest dystrybuantą rozkładu normalnego o parametrach (0,1), tzn.:
Oszacowanie błędu przybliżenia dla Twierdzenie Moivre’a-Laplace’a
Przy oznaczeniach jak powyżej.
Niech A i B będą liczbami całkowitymi,
Niech b>a, . Wówczas, jeśli , ,
to zachodzi:
,
gdzie dla i=1,2.
Z tej formuły wynika, że przybliżenie Moivre’a Laplace’a dobrze przybliża, gdy wariancja np. jest duża. Wówczas błąd jest rzędu , a zatem rzędu (dokładniej ).
Prawo wielkich liczb w Postaci Chinczyna
Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, mających wartość oczekiwaną . Niech .
przy . (Czyli tutaj jest zbieżność według prawdopodobieństwa.)
Mocne prawo wielkich liczb Kolmogorowa
Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie.
Na to, aby
, p.n. ( )
potrzeba i wystarcza (wtedy i tylko wtedy), aby istniała wartość oczekiwana .
(Czyli tutaj jest zbieżność prawie na pewno).
CENTRALNE TWIERDZENIE GRANICZNE dla zmiennych losowych o jednakowym rozkładzie.
Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych o jednakowym rozkładzie, mających wartość oczekiwaną . Ponadto, dla każdego k istnieje wariancja . Niech i niech będzie dystrybuantą rozkładu normalnego z parametrami (0,1). Zauważmy, że
, (czyli odchylenie standardowe ).
Określmy ciąg zmiennych losowych standaryzowanych następująco:
. Zauważmy, że oraz
i .
Wówczas, jeżeli , to przy zachodzi
jednostajnie względem x .
Ciąg nazywamy asymptotycznie normalnym. .
Czyli zmienna losowa ma rozkład normalny dla dużych n (precyzyjniej: można jej rozkład przybliżać rozkładem normalnym).
CENTRALNE TWIERDZENIE GRANICZNE dla dowolnych ciągów niezależnych zmiennych losowych.
Niech , k=1,2,… będzie ciągiem niezależnych zmiennych losowych. Załóżmy istnienie wartości oczekiwanych i wariancji . Wprowadźmy następujące oznaczenia
Wówczas jeśli spełniony jest następujący warunek (tzw. warunek Lindeberga):
dla każdego przy
to ciąg jest asymptotycznie normalny (czyli rozkładem granicznym jest rozkład normalny).
Warunek Lindeberga żąda, aby części wariancji zmiennych losowych po obszarze wykraczającym poza granice sumarycznego odchylenia standardowego dawały w sumie zanikającą małą wielkość.
:=
Ogólnie, stosujemy następujące oznaczenie .
Procesem stochastycznym nazywamy rodzinę zmiennych losowych określonych na tej samej przestrzeni probabilistycznej
i zależnych od parametru t przyjmującego wartości z pewnego zbioru T. Proces stochastyczny będziemy oznaczać symbolem .
Przestrzeń T często nazywana jest czasem.
Przypomnienie
Zmienna losowa X odwzorowującą zbiór w zbiór liczb rzeczywistych R nazywamy funkcją mierzalną, gdy dla dowolnego zbioru borelowskiego przeciwobraz jest zbiorem należącym do -ciała M.
Zbiór jest borelowski, gdy należy do najmniejszego (w sensie relacji zawierania) -ciała zawierającego wszystkie zbiory otwarte w R.
Na wykładzie będziemy rozpatrywać procesy stochastyczne z czasem dyskretnym, tzn. przyjmujemy T = N (zbiór liczb naturalnych).
...
Esta15