Statystyka 27.03.2009.doc

(215 KB) Pobierz
Kiniuś™

 

Kiniuś™

 

Statystyka

Dr Elżbieta Grabowska

(notatki z wykładu 4)

27.03.2009 (piątek)

 

ŚREDNIA DLA INDYWIDUALNYCH DANYCH ILOŚCIOWYCH

 

     lub        

                                                                               

( powyższy przykład do danych z poprzedniego wykł. ile długopisów…)

 

jest najdokładniejszą miarą położenia i tendencji centralnej zbioru danych, ale jako miara klasyczna (wynik zależy od wszystkich pomiarów) jest wrażliwa na wyniki przypadkowe, wyniki nietypowe, nietypowy rozkład danych.

 

  - średnia zawsze zawiera się między minimalną a maksymalną wartością zbioru danych

 

  - zawsze dąży do zera

 

 

Średnia dla nietypowego rozkładu danych

 

1. Rozkład ekstremalnie skośny

 

1, 1, 1, 1, 1, 1, 1, 1, 30, 50.

 

Me -1

D - 1

- 8,8 - niewiarygodna średnia  

 

(firma ma 10 pracowników 8 z nich zarabia po 1 tys. złotych, jeden pracownik zarabia 30 tys. i jeden 50 tys. Średnia to 8,8 tys. Ale to nie znaczy że każdy pracownik zarabia po ok.8,8 tys.)

 

2. Rozkład siodłowy

 

dla danych siodłowych jest niewiarygodne i jej liczenie nie ma sensu…



 

Oglądalność programu ‘ziarno’

średnia arytmetyczna wieku to 20,8.

Jak widać na wykresie około 20 roku życia oglądalność tego programu jest najmniejsza – średnia nie wiarygodna.

 

 

 

 

 

 

Kiniuś™

 

3. Rozkład normalny

 

Jeżeli rozkład danych jest typowy to mediana równa jest dominancie i średniej.

Me = D =

 

Im bardziej rozkład danych jest nietypowy tym bardziej wartości tych miar się rozbiegają.

 

 

WSKAŹNIKI POŁOŻENIA DLA DANYCH ILOŚCIOWYCH POGRUPOWANYCH W SZEREG PUNKTOWY

 

 

 

Średnia dla danych punktowych

 

Jeżeli danych jest dużo, a cecha ma charakter skokowy to wyniki grupujemy w szereg rozdzielczy, punktowy.

 

.

0

1

2

3

2

2

7

4

0

2

14

12

 

15

28

              - warianty cechy

              - liczba przypadków każdego wariantu

             

              mierzona cecha: liczba posiadanych zwierząt domowych.

                           

              D2  (7 osób posiada 2 zwierzątka domowe)

                                                             

(suma ni równa jest liczebności próby)

 

    lub   

 

 

Wniosek:

Przeciętnie na jedną osobę z badanej grupy przypada 1,87 zwierzaka domowego.

 

 

Dominanta dla danych punktowych

 

Dominantą jest wariant cechy, który

wskazuje największą liczebność cząstkową.

 

  1

2

3

4

7

7

8

7

  1

2

3

4

2

3

3

2

 

ß Dominanta to 3 ! 

 

  Brak dominanty à

 

 

 

Kiniuś™

 

Mediana dla danych punktowych

 

1) Wyznaczamy pozycję mediany

 

Uwaga!!!

Przy dużych danych przyjęte jest:

dla danych nieparzystych

      dla danych parzystych

 

2) Kumulujemy szereg liczebności

 

3) Wskazujemy palcem medianę

 

Wariant cechy na wysokości którego pozycja mieści się w liczebności skumulowanej

 

Przykład 1

ncum

 

0

1

2

3

 

2

2

7

4

 

2

4

11

15

 

N=15

 

 

ncum – liczebność skumulowana, liczona narastająco

 

Poz.Me=8 mieści się w 11, czyli Me=2

 

Prawidłowe skumulowanie gdy:

Ostatnia pozycja w szeregu skumulowanym, jest równa liczebności próby.

Wniosek:

Połowa grupy ma, co najwyżej 2 zwierzaki domowe (2 lub mniej), i połowa grupy ma co najmniej 2 zwierzaki domowe (2 lub więcej).

 

 

Przykład 2

.

ncum

2

3

4

5

10

3

3

3

20

9

12

15

 

10

13

16

10

 

N=19

56

 

 

 

Poz.Me=10  mieści się w 10, czyli Me=2

 

 

 

 

Uwaga! Dane ujęte jako indywidualne i dane ujęte w szereg punktowy, daja identyczne wskaźniki.

 

 

 

 

 

...

Zgłoś jeśli naruszono regulamin