Dzielą się na dwie grupy: średnie klasyczne i pozycyjne. Do średnich klasycznych należą: średnia arytmetyczna, średnia harmoniczna oraz średnia geometryczna. Najczęściej wykorzystywanymi średnimi pozycyjnymi są: dominanta (wartość najczęstsza) oraz kwantyle. Wśród kwantyli wyróżniamy – kwartyle (dzielące zbiorowość na cztery części), kwintyle (pięć części), decyle (dziesięć części) oraz centyle [percentyle] (sto części).
Średnie klasyczne są obliczane na podstawie wszystkich wartości szeregu. Średnie pozycyjne są wartościami konkretnych wyrazów szeregu (pozycji) wyróżniających się pod pewnym względem. Obie grupy wzajemnie się uzupełniają, każda opisuje poziom wartości zmiennej z innego punktu widzenia.
Średnią arytmetyczną nazywamy sumę wartości zmiennej wszystkich jednostek badanej zbiorowości podzieloną przez liczbę tych jednostek.
- symbol średniej arytmetycznej;
xi – warianty cechy mierzalnej;
N – liczebność badanej zbirowości.
Średnią określoną powyższym wzorem nazywa się średnią arytmetyczną nieważoną.
Jeżeli warianty średniej występują z różną częstotliwością, to oblicza się średnią arytmetyczną ważoną. Wagami są liczebności odpowiadające poszczególnym wariantom. Z tego typu sytuacją mamy do czynienia w szeregach rozdzielczych i przedziałowych.
Średnią arytmetyczną z szeregów przedziałowych oblicza się następująco:
(n=1,2,…,k) – liczebność jednostek odpowiadająca poszczególnym wariantom zmiennej;
N – suma tych liczebności
(S - suma)
W szeregach rozdzielczych przedziałowych wartości zmiennej w każdej klasie nie są jednoznacznie określone, ale mieszczą się w pewnym przedziale. Dlatego też w celu obliczenia średniej arytmetycznej w przypadku tego typu szeregów należy wcześniej wyznaczyć środki przedziałów. Środki przedziałów otrzymuje się jako średnią arytmetyczną dolnej i górnej granicy każdej klasy. Oznacza się ją symbolem .
Wzór na średnią arytmetyczną z szeregu rozdzielczego przedziałowego:
Jeżeli w obliczeniach możemy wykorzystać wyłącznie procentowe wskaźniki struktury (odsetki całości) to wzór wygląda następująco:
gdzie
Ćwiczenie 1
Tab. 1 Wyniki badań testowych dotyczących wiedzy teoretycznej ze statystyki
Wiedza ze statystyki
(w punktach)
Liczba studentów
Obliczenia pomocnicze
20-30
30-40
40-50
50-60
60-70
70-80
2
10
7
9
12
25
35
45
55
65
75
50
350
315
495
780
750
4,0
20,0
14,0
18,0
24,0
100,0
700,0
630,0
990,0
1560,0
1500,0
Razem
x
2740
5480,0
- środek klasy
- odsetek ogółu
Oblicz średnią arytmetyczną.
Metoda 1:
Metoda 2:
„Za pomocą procentowych wskaźników struktury”
Wyniki są równoważne, ponieważ wartość średniej arytmetycznej nie zależy od liczebności poszczególnych klas, ale od proporcji między nimi.
Jeżeli znamy średnie arytmetyczne dla pewnych grup, a chcemy obliczyć średnią arytmetyczną dla wszystkich grup łącznie korzystamy ze wzoru:
gdzie:
- średnia ze średnich;
- średnia arytmetyczna i-tej grupy;
- suma liczebności grupy;
Średnia arytmetyczna jest miarą prawidłową tylko w odniesieniu do zbiorowości jednorodnych, o niewielkim stopniu zróżnicowania wartości zmiennej. W miarę wzrostu asymetrii i zróżnicowania rozkładu, a także w rozkładach bimodalnych i wielomodalnych średnia arytmetyczna traci swoje znaczenie. Nie można jej obliczyć dla szeregu o otwartych przedziałach, jeżeli przedziały te mają duże liczebności. (Przyjmuje się, że otwarte przedziały klasowe przedziały można zamykać, jeżeli liczba jednostek w tych przedziałach nie przekracza 5% liczebności zbiorowości.)
Jeżeli wartości zmiennej podane są w jednostkach względnych, np. km/godz, kg/osobę, wagi zaś w jednostkach liczników tych jednostek względnych (prędkość pojazdu – zmienna: km/godz.; waga: w km; gęstość zaludnienia – zmienna: w osobach/km2, waga: w osobach; spożycie artykułu X na 1 osobę – zmienna: w litrach, waga: na osobę), to stosuje się średnią harmoniczną.
Średnia harmoniczna jest odwrotnością średniej arytmetycznej z odwrotności wartości zmiennych.
W przypadku szeregów wyliczających oblicza się ją ze wzoru:
H – symbol średniej harmonicznej.
Dla obliczenia średniej harmonicznej z szeregów rozdzielczych (punktowych lub przedziałowych) zachodzi konieczność zastosowania wag (uwzględnienia liczebności). Stosuje się wzór:
Dla szeregów rozdzielczych przedziałowych średnią harmoniczną obliczamy według powyższego wzoru, z tym, że konkretne warianty cechy (xi) zastępujemy środkami przedziałów ().
Ćwiczenie 2
Gęstość zaludnienia w dwu 100-tysięcznych miastach wynosi odpowiednio 300 osób/km2 i 900 osób km2. Oblicz przeciętną gęstość zaludnienia.
Stosując średnią arytmetyczną dla obliczenia powyższego zadania otrzymalibyśmy:
CO NIE JEST PRAWDĄ!
Każde z miast zajmuje odpowiednio:
100 000 : 300 osób km2 = 333,33 km2
100 000 : 900 osób km2 = 111,11 km2
Z czego wynika, że oba miasta zajmują powierzchnię – 444,44 km2.
Wobec tego średnia gęstość zaludnienia w tych miastach wynosi:
200 000 osób : 444,44 km2 = 450 osób/km2.
Ten sam rezultat uzyskamy wzór na średnią harmoniczną dla szeregów rozdzielczych punktowych:
Jeżeli zachodzi konieczność zbadania średniego tempa zmian zjawiska, stosuje się średnią geometryczną. (Więcej na ten temat przy analizie dynamiki zjawisk).
- symbol średniej geometrycznej;
- znak iloczynu
Dominantą (modalna, wartość najczęstsza) nazywamy taką wartość zmiennej, która w danym rozkładzie empirycznym występuje najczęściej. (Wynika z tego, że dominantę można wyznaczyć tylko w rozkładach jednomodalnych).
W szeregach wyliczających i rozdzielczych punktowych dominanta jest wartością cechy, której odpowiada największa liczebność.
W szeregach rozdzielczych przedziałowych bezpośrednio można określić tylko przedział, w którym znajduje się dominanta – jest to przedział o największej liczebności. Konkretną wartość liczbową należącą do tego przedziału, która jest dominantą wyznacza się w następujący sposób:
- symbol dominanty;
- dolna granica klasy, w której znajduje się dominanta;
- liczebność przedziału dominanty;
- liczebność przedziału poprzedzającego przedział dominanty;
- liczebność przedziału następującego po przedziale dominanty;
- interwał, czyli rozpiętość przedziału dominanty.
Z szeregów rozdzielczych przedziałowych dominantę można wyznaczyć metodą rachunkową (patrz wyżej) lub graficzną.
Ćwiczenie 3.
Na podstawie tabeli wyznacz dominantę danego szeregu.
Tab. Rozwody w Polsce w 1977 r. wg wieku kobiet w momencie wniesienia powództwa.
Wiek kobiet
(w latach)
Liczba kobiet
Odsetek kobiet
Do 19
20-24
25-29
30-34
35-39
40-49
50 i więcej
314
6979
11440
6391
5412
8450
4200
aneciakurczaczek