podstawowe zagadnienia statystyki 2.doc

(70 KB) Pobierz
4 znaczenia statystyki:

1.    4 znaczenia statystyki:

- jako zbiór informacji (roczniki statystyczne)

- jako proces zbierania informacji

- jako parametr statystyczny ( liczba która syntetycznie opisuje pewien zbiór informacji np.: średnica arytmetyczna)

- jako nauka zajmuje się ona badaniem procesów masowych opisując je najczęściej za pomocą liczb w ustaleniu prawidłowości charakteryzujących te procesy.

 

Procedura sprawdzania informacji , analizy  oraz ustalania prawidłowości nosi nazwę badania statystycznego

 

Jednostka – każdy pojedynczy element podlegający badaniu( osoba , rzecz , zjawisko)

Zbiorowość – zbiór wszystkich rzeczy podlegających badaniu.

 

Etapy badania

statystycznego:

1. programowanie badania:

Etap o charakterze przygotowawczym obejmujący następujące czynności:

- sformułowanie celu badania statystycznego

- - określenie zakresu rzeczowego badania

- określenie zakresu czasowego badania 

- określenie zakresu przestrzennego badania

- określenie cech statystycznych , ze względu na które będzie prowadzone badanie

- wybór metody badania statystycznego

- wybór sposobu gromadzenia informacji i ewentualnie opracowanie formularzy.

2. gromadzenie danych:

Etap zazwyczaj najbardziej pracochłonny. Odbywa się właściwe gromadzenie informacji. Powinno być ono zakończone kontrolą kompletności i wiarygodności.

3. opis statystyczny:

następuje opracowanie zgromadzonego materiału w celu określenia prawidłowości

 

Klasyfikacja zbiorowości: (do punktu 2)

1. – statyczne ( zbiorowość badana na określony moment czasowy)

-dynamiczna (zbiorowość badana w pewnym przedziale czasowym)

2. – skończenie liczne (składa się z przeliczonej liczby jednostek)

- nieskończenie liczna ( nieskończona liczba jednostek)

3. – proste (składa się z jednostek tego samego typu)

- złożone (jednostki zróżnicowane jakościowo)

4. – całkowita (jest zbiór wszystkich jednostek  tworzących taką zbiorowość)

- częściowa ( próba statystyczna) wyodrębniona część zbiorowości całkowitej.

Moment czasowy lub przedział badania zależy  od charakteru badania.

Z jakiego obszaru pochodzi badana zbiorowość.

 

Cecha statystyczna- właściwość zbiorowości podlegająca  badaniu statystycznemu

 

Klasyfikacja cech statystycznych: (do p. 2)

- ze względu na podział  zapisu wartości cechy:

a. opisowe (ich wartości zapisywane są słownie)

b. liczbowo (ich wartości zapisywane są liczbami)

- ze względu na mierzalność  wartości cechy:

a. mierzalne (takie których wartości są wynikiem  pomiaru za pomocą odpowiednich urządzeń lub aparatu)

b. pośrednio mierzalne (takie których wartości są wyrażone liczbowo ale liczby te są jedynie  wynikiem oszacowania lub oceny)

- niemierzalne = opisowe

- ze względu na liczebność zbioru wartości cechy:

a. stałe( zbiór wartości cechy jest jednoelementowy , wszystkie jednostki cechy posiadają ten sam wariant cechy)

b. zmienne (zbiór wartości cechy jest co najmniej dwu elementowy ), jednostki różnią się między sobą , dlatego też badanie statystyczne dotyczy cech  ( zmiennych)

- dotyczy cech opisowych:

a. dwuwariantowe (przyjmuje tylko dwie wartości)

b. wielowariantowe

- dotyczy cech liczbowych

a. skokowe (takie które przyjmują wartości ze zbioru liczb naturalnych )

b. ciągłe ( wartości ze zbioru liczb rzeczywistych)

 

Klasyfikacja metod opisu: (do punktu 3)

- ze wzgl. na postać opisu :

a. tabelaryczny (zgromadzone informacje umieszczane  w postaci szeregów lub tablic statystycznych)

b. graficzny (zgromadzone inf. Prezentowane w postaci wykresu)

c. parametryczne (zgromadzone informacje zastępujemy zestawem określonych parametrów statystycznych)

2.        - ze wzgl. na cel opisu:

a. struktury zbiorowości ze wzgl. na określoną cechę.

b. współzależności między wybranymi cechami charakterystycznymi badanej zbiorowości.

c. opis dynamiki  w którym dokonujemy analizy tendencji rozwojowej określonego zjawiska.

4. wnioskowanie statystyczne:

Występuje  dodatkowo tylko w badaniu częściowym. Zwane jest inaczej wnioskowaniem statystycznym.

Badaniem obejmujemy próby statystyczne i na podstawie prawidłowości ustalonych dla tej próby wnioskujemy o prawidłowościach występujących  w zbiorowości całkowitej.

 

Szereg rozdzielczy  punktowy (eliminuje wartości powtarzające)

X – cecha staty. ;  x – wartość cechy ;  N – liczebność ogólna zbiorowości ; n – liczebność wariantów ; k – liczba klas

Szereg rozdzielczy z podziałami klasowymi- przy badaniu tego typu szeregu należy  rozstrzygnąć kilka problemów:

1. ustalenie liczby przedziałów klasowych ( zależy od liczebności badanej zbiorowości ) może być ustalana z wzór 1

2. ustalenie rozpiętości przedziałów klasowych:

- wskazane jest tworzenie klas o jednakowych rozpiętościach, gdyż znacznie ułatwia to dalszą analizę materiału statystycznego.

- w szeregu nie mogą występować klasy puste.

- rozpiętość klas ustalana jest jako iloraz rozpiętości wartości cechy i przyjętej liczby klas.  R(x) = x max. - x mini

rozpiętość klasywzór.2

- w przypadku cech typu ciągłego łączne

rozpiętość klas musi przekraczać rozpiętość wartości cech.

3. W przypadku cech typu ciągłego należy ustalić zasady zamykania przedziałów klasowych.

 

Częstość – odsetek lub udział procentowy

Wzór. 3 i 4

 

Zbiorowość jest opisywana ze wzgl. Na dwie lub więcej cech tablicą statystyczną.

Elementy składowe tablicy statystycznej:

- tytuł tablicy( zakres rzeczowy , zakres czasowy , zakres przestrzenny, cechy staty.)

- materiał tablicy ( wiersze i kolumny , tytuły wierszy i kolumn , informacje statystyczne zawarte w tablicy, ewentualne znaki umowne )

- źródło danych zawartych w tablicy

 

Znaki umowne:

- zjawisko nie występuje

X  - wypełnienie danego pola jest niemożliwe lub bezcelowe

•  - brak danych lub brak danych wiarygodnych

0 – (zero) zjawisko występuje w niewielkich ilościach zbliżonych do zera 

w tym : -  zapisem takim wyróżniamy pewną część badanej zbiorowości

 

Opis graficzny:  stanowi zwykle uzupełnienie opisu tabelarycznego i parametrycznego. Wykorzystuje on różnego rodzaju wykresy statystyczne. Najczęściej wykorzystywane typy to:

- wykres powierzchniowy  - które wykorzystują różnego rodzaju  figury geometryczne (prostokątny , kołowy) Za pomocą tego rodzaju wykresów prezentujemy zwykle szeregi strukturalne.

- Liniowe – Najpopularniejszy diagram. Prezentuje on najczęściej rozwój zjawisk w czasie – tzw. szeregi dynamiczne

- Bryłowe- wykorzystują takie bryły jak sześcian prostopadłościan. Prezentują szeregi strukturalne.

- Mapowe – wykorzystywane są do prezentacji przestrzennego rozmieszczenia zjawisk.

 

Najbardziej wykorzystywane;

Obrazkowe, kombinowane

Wykres słupkowy ( histogram :

Należy do grupy wykresów powierzchniowych

Wykres1

Diagram nanoszony na histogram

Wkres 2

 

Opis parametryczny wykorzystuje parametry i momenty statystyczne. Jest to najbardziej zsyntetyzowana forma opisu statystycznego.

 

Parametr statystyczny to liczba, przy pomocy której opisujemy określoną własność badanej zbiorowości.

Możemy opisywać:

-   przeciętność (średnia wielkość)

-   zmienność

-   skośność

-   koncentrację

 

 

3.            Do opisu określonego typu własności wykorzystujemy odpowiednią grupę parametrów statystycznych:

1.Miary/parametry średnie:

Przy pomocy tych parametrów opisujemy średni poziom wartości.

Dzielimy je na:

-   klasyczne – ustalane są na podstawie wszystkich wartości cechy. Dają więc one bardzo wiarygodny i precyzyjny opis całej zbiorowości.

-   Pozycyjne – ustalane są na podstawie jedynie niektórych wartości cechy, tzn. takich, które zajmują określoną pozycję w szeregu statystycznym.

Do miar średnich klasycznych zaliczamy:

-           średnia harmoniczna

-           średnia arytmetyczna

-           średnia geometryczna

-           średnie potęgowe

Do pozycyjnych:

-           wartość środkową

-           wartość dominującą

-           kwartyle

2.Miary/parametry zmienności (zróżnicowania, rozproszenia)

Przy pomocy tych miar mierzymy poziom zróżnicowania wartości cechy.

Dzielimy:

-   absolutne (mianowane)

-   względne (niemianowane)

Absolutne:

-           klasyczne (wariancja, odchylanie, odchylanie przeciętne)

-           pozycyjne

względne:  – współczynnik zmienności

3.Miary skośności (asymetrii)

Badamy nimi poziom odchylenia  rozkładu cechy od rozkładu symetrycznego ( miary asymetrii)

Dzielimy je na:

-           absolutne (mianowane):

a. różnica między wartością średnią a wartością dominującą

b. trzeci moment centralny

-           względne:

a. współczynnik skośności (asymetrii)

b. trzeci moment centralny standaryzowany

4.Miary koncentracji:

Koncentracja może być dwojako interpretowana:

1. Oznacza skupienie wartości cechy wokół ich średniej arytmetycznej. Tak rozumianą koncentrację mierzymy za pomocą miary kurtozy, czyli, czwartego momentu centralnego standaryzowanego.

2. Oznacza nierównomierne rozłożenia globalnego funduszu wartości cechy wśród jednostek statystycznych badanej zbiorowości. Mierzymy ją za pomoc ą współczynnika koncentracji.

 

Średnia arytmetyczna:

1). szereg szczegółowy: wzór 5 ; 2). szereg rozdzielczy-pónktowy : wzór 6 ; 3). Szereg z przedziałami klasowymi: wzór 7

Własności:

1.średnia arytm. Jako parametr klasyczny liczona jest na podstawie wszystkich wartości cechy

2.suma odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej wynosi zawsze zero   wzór 8:

3.suma kwadratów odchyleń poszczególnych wartości cechy od ich średniej arytmetycznej jest najmniejsza z możliwych. Wzór 9:

4.suma wartości cechy dla badanej zbiorowości jest równa i iloczynowi liczebności tej zbiorowości oraz średniej aryt.   Wzór 10

5.Jeśli w szeregu  rozdzielczym wszystkie liczebności pomnożymy lub podzielimy przez ten sam czynnik (q) to średnia arytmetyczna nie ulegnie zmianie

6.Jeśli wszystkie wartości cechy pomnożymy lub podzielimy przez ten sam czynnik (q) to średnia arytmetyczna tak zmienionych wartości cechy będzie q-krotnie większa lub mniejsza od średniej pierwotnej

7.Jeżeli do wszystkich wartości cechy dodamy lub odejmiemy tę samą wielkość (q) to średnia arytmetyczna tak  zmienionych wartości cechy będzie o wielkość q większa / mniejsza od średniej pierwotnej

8.Jeśli badaną zbiorowość podzielimy na kilka podzbiorowości to średnia arytm. dla cechy zbiorowości może być liczona jako średnia ze średnich dla tych zbiorowości

 

Średniej arytmetycznej nie wyznaczamy kiedy:

a.  .w szeregu występują otwarte  przedziały klasowe.

b   .w szeregu występuje skrajna asymetria (skośność) tzn wyraźnie dominuje jedna z klas krańcowych w takiej sytuacji korzystamy z dominanty

 

 

 

 

4.    Wartość najczęstsza (dominata, wartość modalna, dominująca) – 0(x)

To wartość cechy, która występuje najliczniej w badanej zbiorowości

Sposoby wyznaczania:

- w szeregu szczegółowym i rozdzielczym punktowym wskazując wartość cechy występującej najczęściej.

Dominata nie zawsze musi występować

- w szeregu rozdzielczym z podziałem klasowym

wyznaczamy ją 2 metodami

- graficzną: wykres 3

-           analityczną: wzór 11

xD dolna granica przedziału dominanty

hD - rozpiętość przedziału dominanty

nD - liczebn...

Zgłoś jeśli naruszono regulamin