1. 4 znaczenia statystyki:
- jako zbiór informacji (roczniki statystyczne)
- jako proces zbierania informacji
- jako parametr statystyczny ( liczba która syntetycznie opisuje pewien zbiór informacji np.: średnica arytmetyczna)
- jako nauka zajmuje się ona badaniem procesów masowych opisując je najczęściej za pomocą liczb w ustaleniu prawidłowości charakteryzujących te procesy.
Procedura sprawdzania informacji , analizy oraz ustalania prawidłowości nosi nazwę badania statystycznego
Jednostka – każdy pojedynczy element podlegający badaniu( osoba , rzecz , zjawisko)
Zbiorowość – zbiór wszystkich rzeczy podlegających badaniu.
Etapy badania
statystycznego:
1. programowanie badania:
Etap o charakterze przygotowawczym obejmujący następujące czynności:
- sformułowanie celu badania statystycznego
- - określenie zakresu rzeczowego badania
- określenie zakresu czasowego badania
- określenie zakresu przestrzennego badania
- określenie cech statystycznych , ze względu na które będzie prowadzone badanie
- wybór metody badania statystycznego
- wybór sposobu gromadzenia informacji i ewentualnie opracowanie formularzy.
2. gromadzenie danych:
Etap zazwyczaj najbardziej pracochłonny. Odbywa się właściwe gromadzenie informacji. Powinno być ono zakończone kontrolą kompletności i wiarygodności.
3. opis statystyczny:
następuje opracowanie zgromadzonego materiału w celu określenia prawidłowości
Klasyfikacja zbiorowości: (do punktu 2)
1. – statyczne ( zbiorowość badana na określony moment czasowy)
-dynamiczna (zbiorowość badana w pewnym przedziale czasowym)
2. – skończenie liczne (składa się z przeliczonej liczby jednostek)
- nieskończenie liczna ( nieskończona liczba jednostek)
3. – proste (składa się z jednostek tego samego typu)
- złożone (jednostki zróżnicowane jakościowo)
4. – całkowita (jest zbiór wszystkich jednostek tworzących taką zbiorowość)
- częściowa ( próba statystyczna) wyodrębniona część zbiorowości całkowitej.
Moment czasowy lub przedział badania zależy od charakteru badania.
Z jakiego obszaru pochodzi badana zbiorowość.
Cecha statystyczna- właściwość zbiorowości podlegająca badaniu statystycznemu
Klasyfikacja cech statystycznych: (do p. 2)
- ze względu na podział zapisu wartości cechy:
a. opisowe (ich wartości zapisywane są słownie)
b. liczbowo (ich wartości zapisywane są liczbami)
- ze względu na mierzalność wartości cechy:
a. mierzalne (takie których wartości są wynikiem pomiaru za pomocą odpowiednich urządzeń lub aparatu)
b. pośrednio mierzalne (takie których wartości są wyrażone liczbowo ale liczby te są jedynie wynikiem oszacowania lub oceny)
- niemierzalne = opisowe
- ze względu na liczebność zbioru wartości cechy:
a. stałe( zbiór wartości cechy jest jednoelementowy , wszystkie jednostki cechy posiadają ten sam wariant cechy)
b. zmienne (zbiór wartości cechy jest co najmniej dwu elementowy ), jednostki różnią się między sobą , dlatego też badanie statystyczne dotyczy cech ( zmiennych)
- dotyczy cech opisowych:
a. dwuwariantowe (przyjmuje tylko dwie wartości)
b. wielowariantowe
- dotyczy cech liczbowych
a. skokowe (takie które przyjmują wartości ze zbioru liczb naturalnych )
b. ciągłe ( wartości ze zbioru liczb rzeczywistych)
Klasyfikacja metod opisu: (do punktu 3)
- ze wzgl. na postać opisu :
a. tabelaryczny (zgromadzone informacje umieszczane w postaci szeregów lub tablic statystycznych)
b. graficzny (zgromadzone inf. Prezentowane w postaci wykresu)
c. parametryczne (zgromadzone informacje zastępujemy zestawem określonych parametrów statystycznych)
2. - ze wzgl. na cel opisu:
a. struktury zbiorowości ze wzgl. na określoną cechę.
b. współzależności między wybranymi cechami charakterystycznymi badanej zbiorowości.
c. opis dynamiki w którym dokonujemy analizy tendencji rozwojowej określonego zjawiska.
4. wnioskowanie statystyczne:
Występuje dodatkowo tylko w badaniu częściowym. Zwane jest inaczej wnioskowaniem statystycznym.
Badaniem obejmujemy próby statystyczne i na podstawie prawidłowości ustalonych dla tej próby wnioskujemy o prawidłowościach występujących w zbiorowości całkowitej.
Szereg rozdzielczy punktowy (eliminuje wartości powtarzające)
X – cecha staty. ; x – wartość cechy ; N – liczebność ogólna zbiorowości ; n – liczebność wariantów ; k – liczba klas
Szereg rozdzielczy z podziałami klasowymi- przy badaniu tego typu szeregu należy rozstrzygnąć kilka problemów:
1. ustalenie liczby przedziałów klasowych ( zależy od liczebności badanej zbiorowości ) może być ustalana z wzór 1
2. ustalenie rozpiętości przedziałów klasowych:
- wskazane jest tworzenie klas o jednakowych rozpiętościach, gdyż znacznie ułatwia to dalszą analizę materiału statystycznego.
- w szeregu nie mogą występować klasy puste.
- rozpiętość klas ustalana jest jako iloraz rozpiętości wartości cechy i przyjętej liczby klas. R(x) = x max. - x mini
rozpiętość klasy: wzór.2
- w przypadku cech typu ciągłego łączne
rozpiętość klas musi przekraczać rozpiętość wartości cech.
3. W przypadku cech typu ciągłego należy ustalić zasady zamykania przedziałów klasowych.
Częstość – odsetek lub udział procentowy
Wzór. 3 i 4
Zbiorowość jest opisywana ze wzgl. Na dwie lub więcej cech tablicą statystyczną.
Elementy składowe tablicy statystycznej:
- tytuł tablicy( zakres rzeczowy , zakres czasowy , zakres przestrzenny, cechy staty.)
- materiał tablicy ( wiersze i kolumny , tytuły wierszy i kolumn , informacje statystyczne zawarte w tablicy, ewentualne znaki umowne )
- źródło danych zawartych w tablicy
Znaki umowne:
- zjawisko nie występuje
X - wypełnienie danego pola jest niemożliwe lub bezcelowe
• - brak danych lub brak danych wiarygodnych
0 – (zero) zjawisko występuje w niewielkich ilościach zbliżonych do zera
w tym : - zapisem takim wyróżniamy pewną część badanej zbiorowości
Opis graficzny: stanowi zwykle uzupełnienie opisu tabelarycznego i parametrycznego. Wykorzystuje on różnego rodzaju wykresy statystyczne. Najczęściej wykorzystywane typy to:
- wykres powierzchniowy - które wykorzystują różnego rodzaju figury geometryczne (prostokątny , kołowy) Za pomocą tego rodzaju wykresów prezentujemy zwykle szeregi strukturalne.
- Liniowe – Najpopularniejszy diagram. Prezentuje on najczęściej rozwój zjawisk w czasie – tzw. szeregi dynamiczne
- Bryłowe- wykorzystują takie bryły jak sześcian prostopadłościan. Prezentują szeregi strukturalne.
- Mapowe – wykorzystywane są do prezentacji przestrzennego rozmieszczenia zjawisk.
Najbardziej wykorzystywane;
Obrazkowe, kombinowane
Wykres słupkowy ( histogram :
Należy do grupy wykresów powierzchniowych
Wykres1
Diagram nanoszony na histogram
Wkres 2
Opis parametryczny wykorzystuje parametry i momenty statystyczne. Jest to najbardziej zsyntetyzowana forma opisu statystycznego.
Parametr statystyczny to liczba, przy pomocy której opisujemy określoną własność badanej zbiorowości.
Możemy opisywać:
- przeciętność (średnia wielkość)
- zmienność
- skośność
- koncentrację
3. Do opisu określonego typu własności wykorzystujemy odpowiednią grupę parametrów statystycznych:
1.Miary/parametry średnie:
Przy pomocy tych parametrów opisujemy średni poziom wartości.
Dzielimy je na:
- klasyczne – ustalane są na podstawie wszystkich wartości cechy. Dają więc one bardzo wiarygodny i precyzyjny opis całej zbiorowości.
- Pozycyjne – ustalane są na podstawie jedynie niektórych wartości cechy, tzn. takich, które zajmują określoną pozycję w szeregu statystycznym.
Do miar średnich klasycznych zaliczamy:
- średnia harmoniczna
- średnia arytmetyczna
- średnia geometryczna
- średnie potęgowe
Do pozycyjnych:
- wartość środkową
- wartość dominującą
- kwartyle
2.Miary/parametry zmienności (zróżnicowania, rozproszenia)
Przy pomocy tych miar mierzymy poziom zróżnicowania wartości cechy.
Dzielimy:
- absolutne (mianowane)
- względne (niemianowane)
Absolutne:
- klasyczne (wariancja, odchylanie, odchylanie przeciętne)
- pozycyjne
względne: – współczynnik zmienności
3.Miary skośności (asymetrii)
Badamy nimi poziom odchylenia rozkładu cechy od rozkładu symetrycznego ( miary asymetrii)
- absolutne (mianowane):
a. różnica między wartością średnią a wartością dominującą
b. trzeci moment centralny
- względne:
a. współczynnik skośności (asymetrii)
b. trzeci moment centralny standaryzowany
4.Miary koncentracji:
Koncentracja może być dwojako interpretowana:
1. Oznacza skupienie wartości cechy wokół ich średniej arytmetycznej. Tak rozumianą koncentrację mierzymy za pomocą miary kurtozy, czyli, czwartego momentu centralnego standaryzowanego.
2. Oznacza nierównomierne rozłożenia globalnego funduszu wartości cechy wśród jednostek statystycznych badanej zbiorowości. Mierzymy ją za pomoc ą współczynnika koncentracji.
Średnia arytmetyczna:
1). szereg szczegółowy: wzór 5 ; 2). szereg rozdzielczy-pónktowy : wzór 6 ; 3). Szereg z przedziałami klasowymi: wzór 7
Własności:
1.średnia arytm. Jako parametr klasyczny liczona jest na podstawie wszystkich wartości cechy
2.suma odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej wynosi zawsze zero wzór 8:
3.suma kwadratów odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej jest najmniejsza z możliwych. Wzór 9:
4.suma wartości cechy dla badanej zbiorowości jest równa i iloczynowi liczebności tej zbiorowości oraz średniej aryt. Wzór 10
5.Jeśli w szeregu rozdzielczym wszystkie liczebności pomnożymy lub podzielimy przez ten sam czynnik (q) to średnia arytmetyczna nie ulegnie zmianie
6.Jeśli wszystkie wartości cechy pomnożymy lub podzielimy przez ten sam czynnik (q) to średnia arytmetyczna tak zmienionych wartości cechy będzie q-krotnie większa lub mniejsza od średniej pierwotnej
7.Jeżeli do wszystkich wartości cechy dodamy lub odejmiemy tę samą wielkość (q) to średnia arytmetyczna tak zmienionych wartości cechy będzie o wielkość q większa / mniejsza od średniej pierwotnej
8.Jeśli badaną zbiorowość podzielimy na kilka podzbiorowości to średnia arytm. dla cechy zbiorowości może być liczona jako średnia ze średnich dla tych zbiorowości
Średniej arytmetycznej nie wyznaczamy kiedy:
a. .w szeregu występują otwarte przedziały klasowe.
b .w szeregu występuje skrajna asymetria (skośność) tzn wyraźnie dominuje jedna z klas krańcowych w takiej sytuacji korzystamy z dominanty
4. Wartość najczęstsza (dominata, wartość modalna, dominująca) – 0(x)
To wartość cechy, która występuje najliczniej w badanej zbiorowości
Sposoby wyznaczania:
- w szeregu szczegółowym i rozdzielczym punktowym wskazując wartość cechy występującej najczęściej.
Dominata nie zawsze musi występować
- w szeregu rozdzielczym z podziałem klasowym
wyznaczamy ją 2 metodami
- graficzną: wykres 3
- analityczną: wzór 11
xD – dolna granica przedziału dominanty
hD - rozpiętość przedziału dominanty
nD - liczebn...
sote12