Kiniuś™
Statystyka
Dr Elżbieta Grabowska
(notatki z wykładu 4)
27.03.2009 (piątek)
ŚREDNIA DLA INDYWIDUALNYCH DANYCH ILOŚCIOWYCH
lub
( powyższy przykład do danych z poprzedniego wykł. ile długopisów…)
jest najdokładniejszą miarą położenia i tendencji centralnej zbioru danych, ale jako miara klasyczna (wynik zależy od wszystkich pomiarów) jest wrażliwa na wyniki przypadkowe, wyniki nietypowe, nietypowy rozkład danych.
- średnia zawsze zawiera się między minimalną a maksymalną wartością zbioru danych
- zawsze dąży do zera
Średnia dla nietypowego rozkładu danych
1. Rozkład ekstremalnie skośny
1, 1, 1, 1, 1, 1, 1, 1, 30, 50.
Me -1
D - 1
- 8,8 - niewiarygodna średnia
(firma ma 10 pracowników 8 z nich zarabia po 1 tys. złotych, jeden pracownik zarabia 30 tys. i jeden 50 tys. Średnia to 8,8 tys. Ale to nie znaczy że każdy pracownik zarabia po ok.8,8 tys.)
2. Rozkład siodłowy
dla danych siodłowych jest niewiarygodne i jej liczenie nie ma sensu…
Oglądalność programu ‘ziarno’
średnia arytmetyczna wieku to 20,8.
Jak widać na wykresie około 20 roku życia oglądalność tego programu jest najmniejsza – średnia nie wiarygodna.
3. Rozkład normalny
Jeżeli rozkład danych jest typowy to mediana równa jest dominancie i średniej.
Me = D =
Im bardziej rozkład danych jest nietypowy tym bardziej wartości tych miar się rozbiegają.
WSKAŹNIKI POŁOŻENIA DLA DANYCH ILOŚCIOWYCH POGRUPOWANYCH W SZEREG PUNKTOWY
Średnia dla danych punktowych
Jeżeli danych jest dużo, a cecha ma charakter skokowy to wyniki grupujemy w szereg rozdzielczy, punktowy.
.
0
1
2
3
7
4
14
12
15
28
- warianty cechy
- liczba przypadków każdego wariantu
mierzona cecha: liczba posiadanych zwierząt domowych.
D – 2 (7 osób posiada 2 zwierzątka domowe)
(suma ni równa jest liczebności próby)
Wniosek:
Przeciętnie na jedną osobę z badanej grupy przypada 1,87 zwierzaka domowego.
Dominanta dla danych punktowych
Dominantą jest wariant cechy, który
wskazuje największą liczebność cząstkową.
8
ß Dominanta to 3 !
Brak dominanty à
Mediana dla danych punktowych
1) Wyznaczamy pozycję mediany
Uwaga!!!
Przy dużych danych przyjęte jest:
dla danych nieparzystych
dla danych parzystych
2) Kumulujemy szereg liczebności
3) Wskazujemy palcem medianę
Wariant cechy na wysokości którego pozycja mieści się w liczebności skumulowanej
Przykład 1
ncum
11
N=15
ncum – liczebność skumulowana, liczona narastająco
Poz.Me=8 mieści się w 11, czyli Me=2
Prawidłowe skumulowanie gdy:
Ostatnia pozycja w szeregu skumulowanym, jest równa liczebności próby.
Połowa grupy ma, co najwyżej 2 zwierzaki domowe (2 lub mniej), i połowa grupy ma co najmniej 2 zwierzaki domowe (2 lub więcej).
Przykład 2
5
10
20
9
13
16
N=19
56
Poz.Me=10 mieści się w 10, czyli Me=2
Uwaga! Dane ujęte jako indywidualne i dane ujęte w szereg punktowy, daja identyczne wskaźniki.
...
chomik-lukasz2