O_niewlasciwym_stos_metod_statyst.pdf

StatSoft Polska, tel. (12) 4284300, (601) 414151, info@statsoft.pl, www.statsoft.pl

O NIEWŁAŚCIWYM STOSOWANIU METOD STATYSTYCZNYCH

Andrzej Sokołowski

Akademia Ekonomiczna w Krakowie, Katedra Statystyki; StatSoft Polska Sp. z o.o.

Inspiracją do przygotowania tego opracowania była książka Phillipa I. Gooda i Jamesa

W. Hardina pt. „Common Errors in Statistics (and How to Avoid Them)” wydana przez

wydawnictwo John Wiley & Sons w 2003 roku, sama również nie wolna od błędów.

Zwrócimy uwagę na szereg nieścisłości i błędów spotykanych w stosowaniu metod

statystycznych wykorzystywanych w badaniach naukowych i rozwiązywaniu problemów

praktycznych. Porządek prezentacji będzie odpowiadał typowemu kursowi ze statystyki,

jakkolwiek nie będziemy się tu zajmowali błędami popełnianymi przez studentów,

o których można by napisać osobną książkę w konwencji humoru z zeszytów szkolnych.

Część pierwsza książki Gooda i Hardina ma prowokujące motto „Don’t think – use the

computer” (Nie myśl – używaj komputera) . Współczesne programy komputerowe przygo-

towane dla potrzeb stosowania metod statystycznych pozwalają wykonywać obliczenia,

przy których dawniej trzeba było spędzić wiele pracowitych godzin lub w ogóle ich nie

podejmowano. Niestety jednocześnie pojawiło się niebezpieczeństwo bezmyślnego

stosowania metod w sytuacji, gdy prawie wszystko daje się obliczyć.

Podstawowe pojęcia statystyczne

Statystyka to nauka o metodach badania prawidłowości występujących w zjawiskach

masowych. Większość uczonych w swych poszukiwaniach stara się odkryć prawidłowości.

Warto więc najpierw uświadomić sobie, dlaczego one występują. Na każde zjawisko

oddziałują dwa rodzaje przyczyn: główne i uboczne. Te pierwsze wynikają z istoty

zjawiska, działają w sposób trwały i ukierunkowany, jednakowo na wszystkie elementy

badanej zbiorowości i one właśnie powodują powstawanie prawidłowości , nazywanych

niekiedy składnikiem systematycznym . Przyczyny uboczne (czyli losowe) oddziałują różnie

na poszczególne elementy zbiorowości, działają różnokierunkowo i w sposób nietrwały.

One powodują odchylenia od prawidłowości , są źródłem składnika losowego . Należy

koniecznie przed wykorzystywaniem metod statystycznych dobrze zrozumieć problem

badawczy, poznać jego teorię i próbować zidentyfikować przyczyny główne oraz

przyczyny uboczne.

Kopiowanie lub powielanie w jakikolwiek sposób bez zgody StatSoft Polska Sp. z o.o. zabronione

StatSoft Polska, tel. (12) 4284300, (601) 414151, info@statsoft.pl, www.statsoft.pl

Wydaje się oczywiste, że statystyk nigdy nie może pracować sam. On ma znać metody, ich

uwarunkowania, założenia, sposób działania, zakres wyników, ale to wszystko to są tylko

narzędzia. Bez znajomości merytorycznej strony zagadnienia można uzyskać wyniki łatwe

do obalenia i wyśmiania przez fachowców z danej dziedziny. Statystyka jest nauką

służebną, a ostateczna weryfikacja wyników jej metod następuje w dziedzinie, w której

metody te zastosowano. Oczywiście nie mówimy tu o statystykach teoretycznych, którzy

proponują nowe metody, wykorzystując dowody matematyczne lub badania symulacyjne,

ale o statystykach „praktycznych”, którzy stosują metody statystyczne w różnych

dziedzinach nauk empirycznych.

Praktyczne zastosowanie statystyki ma sens, jeżeli na podstawie części populacji zwanej

próbą , wnioskujemy o populacji. To dwupoziomowe widzenie problemu jest niezbędne.

Warto dbać o rozłączność oznaczeń (duże litery – małe litery), rozłączność pojęć

(np. wartość przeciętna – średnia arytmetyczna) i precyzyjne definiowanie.

Zarówno populacja, jak i próba powinny być jednorodne . Większość badaczy dobrze

rozumie pojęcie jednorodności, traktując je jednak raczej intuicyjnie. Precyzyjnie można

definiować, że zbiorowość jest jednorodna wtedy, gdy wszystkie jej elementy pozostają

pod wpływem działania tych samych przyczyn głównych. Na ogół jednorodność ocenia się

merytorycznie, ale warto pamiętać, że statystyka dostarcza – w ramach metod

taksonomicznych – wielu procedur umożliwiających kontrolę jednorodności, lub podział

zbiorowości na jednorodne części.

Cechy statystyczne

Cechy statystyczne to właściwości jednostek statystycznych. Denerwujące jest nazywanie

ich atrybutami – bo to w języku angielskim funkcjonuje nazwa attributes . Tradycyjnie

cechy statystyczne dzielono na jakościowe i ilościowe. Formalnie tylko cechy ilościowe

powinny być nazywane zmiennymi , ale przyjmuje się też określenie zmienne jakościowe.

Dla porządku warto pamiętać, że cechy ilościowe mają wartości , natomiast cechy

jakościowe – warianty .

Podstawowe znaczenie dla późniejszego wyboru metod ma precyzyjne zdefiniowanie cech

statystycznych oraz określenie skal pomiaru. Szeroko akceptowane jest rozróżnienie

czterech skal pomiaru: nominalnej, porządkowej, przedziałowej i ilorazowej. Skala

pomiaru determinuje na przykład wybór metody przy analizie współzależności zjawisk.

Trzeba pamiętać, że rangi, które są efektem pomiaru w skali porządkowej, nie pozwalają

na liczenie odległości (a więc również różnic) i średnich. Przykładem łamania tej zasady

jest rangowa metoda porządkowania obiektów wielocechowych (stosowana w jednym ze

znanych rankingów szkół wyższych) oraz (o zgrozo)... współczynnik korelacji rangowej

Spearmana.

Błąd terminologiczny, który prawdopodobnie jest nie do wyplenienia - przykładowo ze

środowiska medycznego - to nazywanie cech statystycznych parametrami. Mówi się więc

o takich parametrach chorego jak: wiek, poziom hemoglobiny itp. A to wszystko to są

Kopiowanie lub powielanie w jakikolwiek sposób bez zgody StatSoft Polska Sp. z o.o. zabronione

StatSoft Polska, tel. (12) 4284300, (601) 414151, info@statsoft.pl, www.statsoft.pl

cechy statystyczne. Parametry to niektóre charakterystyki liczbowe zmiennych losowych,

które są modelami opisującymi kształtowanie się cech statystycznych w zbiorowości

obiektów. Parametry w tym sensie to wartość przeciętna, wariancja, mediana itp.

Szeregi statystyczne

Za sprawą tragicznego sposobu spolszczenia MS Excela upowszechniła się wadliwa nazwa

szeregu statystycznego jako serii (??). Tymczasem angielski wyraz series powinien być

w tym kontekście zdecydowanie tłumaczony jako szereg . Seria w statystyce (jest nią na

przykład ciąg odchyleń o tym samym znaku w teście serii) w języku angielskim nazywa

się run .

Pewne nieporozumienia napotkać można przy budowie szeregów rozdzielczych dla

ciągłych cech ilościowych. Klasycznym przykładem jest tu rozkład populacji według

wieku. Wielu badaczy uparcie lansuje klasy szeregu w stylu: 0-4, 5-9, 10-14, 15-19 itd.,

zawierające „dziury”. Przecież wiek jest cechą jak najbardziej ciągłą i sposób podawania

go z dokładnością do całych lat nie zmienia charakteru cechy. Przy przejściu na poprawne

klasy: 0-5, 5-10, 10-15 itd. pojawiają się pytania, co robić z osobami, które mają wiek

równy dokładnie granicy klasy. Niepisana umowa (wynikająca wszakże ze „wschod-

nioeuropejskiej” definicji dystrybuanty) powiada, że przedziały klasowe są lewostronnie

domknięte, a prawostronnie otwarte. Tak właśnie budowany jest szereg rozdzielczy

w programie STATISTICA .

Graficzna prezentacja danych statystycznych

To zagadnienie w zasadzie pomijamy odsyłając czytelnika do małej, ale znakomitej i sław-

nej książeczki Darrella Huffa (z zabawnymi ilustracjami Irvinga Geisa) How To Lie With

Statistics (Jak kłamać przy pomocy statystyki) , wydanej trzykrotnie (1954, 1982 i 1993)

przez wydawnictwo W.W. Norton & Company. Pokazano tam sposoby manipulowania

wykresami dla wywołania błędnego wrażenia czytelnika na przykład o znaczeniu trendu.

Typowe błędy spotykane dzisiaj to brak rozróżnienia pomiędzy wykresem słupkowym

(dotyczy cechy jakościowej i jego słupki są oddzielone od siebie) a histogramem (dotyczy

cechy ilościowej i słupki przylegają do siebie), łączenie punktów na diagramie korela-

cyjnym oraz rozpoczynanie osi pionowej w wykresie przeżyć od liczby większej od zera

(to świetny przykład manipulowania wrażeniem – często nieświadomego), a kończenie na

liczbie większej od 1 (co, jak w znanym dowcipie o Studium Wojskowym dopuszcza, że

w warunkach bojowych prawdopodobieństwo może być większe od jedności).

Kopiowanie lub powielanie w jakikolwiek sposób bez zgody StatSoft Polska Sp. z o.o. zabronione

StatSoft Polska, tel. (12) 4284300, (601) 414151, info@statsoft.pl, www.statsoft.pl

Losowy dobór próby

W każdym podręczniku statystyki znajdujemy na poczesnym miejscu wymóg losowości

i reprezentatywności próby. Próba jest reprezentatywna, jeżeli jej struktura jest identyczna

lub bardzo zbliżona do struktury zbiorowości ogólnej. Dzięki działaniu prawa wielkich

liczb ta reprezentatywność „zapewni się sama”, jeżeli próba została dobrze wylosowana.

Warunek dobrego losowania jest teoretycznie prosty – każdy element zbiorowości ogólnej

powinien mieć takie samo prawdopodobieństwo wejścia do próby. Praktyczne zapewnienie

realizacji tej zasady jest niekiedy bardzo trudne. Wielu badaczy wydaje się nie dostrzegać

istnienia dyscypliny zwanej metodą reprezentacyjną , w ramach której opublikowano wiele

podręczników.

W wielu badaniach losowanie próby powierzane jest wyspecjalizowanym instytutom

badawczym, podobnie jak proces ankietowania. Na ogół zadania te wykowywane są po-

prawnie, choć nie zawadzi przeprowadzenie kontroli losowości próby już po jej pobraniu.

Przy losowaniu próby bardzo łatwo jest popełnić błędy prowadzące do niereprezenta-

tywności. Przykładem mogą tu być ankiety telefoniczne i internetowe, których wyniki nie

mogą być uogólniane na całe społeczeństwo, a tylko odpowiednio na posiadaczy telefonów

lub osoby posiadające dostępu do Internetu. Szczegółowe problemy reprezentatywności

próby są rozważane w wielu tekstach z zakresu metodologii badań społecznych, socjolo-

gicznych i psychologicznych.

Specyficzne kłopoty z losowością próby mają lekarze i ekonomiści. Czy pacjenci leczeni

w naszym szpitalu na konkretną chorobę mogą być uważani za próbę losową? To bardzo

często zadawane pytanie. Na ogół odpowiedź jest twierdząca. Trzeba tylko rozważyć, czy

populacja zamieszkująca teren, z którego mamy pacjentów mniej więcej odpowiada

tzw. ogółowi, oraz czy na tym terenie nie ma zewnętrznych czynników mogących zakłócać

przeciętną zachorowalność i przebieg leczenia danego schorzenia. Odmienna od prze-

ciętnej struktura wieku nie stanowi tu problemu, gdyż istnieje możliwość wykorzystywania

tzw. standaryzacji według wieku (to samo dotyczy badań demograficznych).

O wiele większe kłopoty teoretyczne sprawiają ilościowe badania makroekonomiczne lub

regionalne. W wielu badaniach ekonomicznych trudno jest zapewnić spełnienie losowości

próby. Analizując dane statystyczne dotyczące województw Polski, bierzemy przecież pod

uwagę wszystkie województwa, a nie ich próbę. W tej sytuacji niektórzy negują wręcz

istnienie tutaj relacji „populacja – próba”. Warto więc, obok pojęć zbiorowość , populacja ,

wprowadzić jeszcze mechanizm ekonomiczny jako cel badań statystycznych i ekono-

metrycznych. Badając kształtowanie się bezrobocia i jego czynników w Polsce, na pod-

stawie danych wojewódzkich, w danych statystycznych mamy obecny wspomniany efekt

działania przyczyn głównych (efekt systematyczny, strukturalny) oraz efekt oddziaływania

przyczyn ubocznych (efekt losowy, przypadkowy, zakłócenia).

Wymagana liczebność próby – to kolejne częste pytanie zadawane statystykom. Dla

udzielenia precyzyjnej odpowiedzi statystyk musi „odbić piłeczkę”, zadając własne

pytania: do czego ta próba ma służyć (estymacja, testowanie), o jakim parametrze mamy

wnioskować (próba do wnioskowaniu o strukturze musi być zazwyczaj wielokrotnie

Kopiowanie lub powielanie w jakikolwiek sposób bez zgody StatSoft Polska Sp. z o.o. zabronione

StatSoft Polska, tel. (12) 4284300, (601) 414151, info@statsoft.pl, www.statsoft.pl

większa niż do wnioskowania o poziomie zjawiska), jaka jest zmienność zjawiska

i wreszcie jaki poziom ufności zakłada badacz. Często występuje strach przed małą próbą;

obawa o negatywną ocenę recenzentów. Jednak przy bardzo kosztownych eksperymentach

badawczych, krótkich szeregach czasowych lub rzadkich chorobach, alternatywą

wnioskowania na podstawie małych prób jest zaniechanie analiz w ogóle. Trzeba tylko

zdawać sobie sprawę z wpływu liczebności próby na wyniki wnioskowania. Przy małej

próbie „trudno” jest udowodnić hipotezy badawcze, natomiast przy bardzo dużej próbie

można wręcz wykazać istotność każdej różnicy. Większość statystyk testowych da się

przekształcić w ten sposób, że po lewej stronie znajdzie się n , a wynik powie, ile potrzeba

obserwacji, aby wykazać, że różnica, którą obserwujemy, jest istotna statystycznie.

Prawdopodobieństwo

Aksjomatyczna definicja prawdopodobieństwa sformułowana przez Andrieja Kołmogoro-

wa powiada (w uproszczeniu), że prawdopodobieństwo to liczba z przedziału [0,1] przypo-

rządkowana każdemu zdarzeniu losowemu. W wielu dziedzinach pozamatematycznych

uważa się, że prawdopodobieństwo to liczba z przedziału [0,100], wyrażona w procentach,

co z jednej strony jest pokłosiem częstościowej definicji prawdopodobieństwa, a z drugiej

jest bardziej intuicyjne. Formalnie ta maniera jest bardzo denerwująca dla statystyków, lecz

trudno jest skutecznie walczyć z wieloletnimi przyzwyczajeniami całych środowisk.

Zmienne losowe

Popularna definicja zmiennej losowej powiada, że jest to taka wielkość, która w wyniku

„doświadczenia” może przyjmować różne wartości, przy czym przed doświadczeniem nie

można z absolutną pewnością przewidzieć, jaka wartość właśnie się zrealizuje. Błędne

rozumienie zmiennej losowej zasadza się na sądzie, jakoby w zmiennej losowej występo-

wały tylko przyczyny losowe. Uważa się, że coś jest losowe, jeżeli jest „czysto losowe” –

czyli wyniki gier liczbowych, rzutu kostką, monetą, karty, jakie otrzymujemy „na ręce”,

wynik losowania kul z urny. Tymczasem wystarczy tylko „trochę” tej losowości, aby

absolutnie pewne prognozowanie zjawiska było niemożliwe – i już mamy zmienną losową.

Niestarannością, która utrudnia lekturę wielu prac, jest niestosowanie się do raczej

powszechnej konwencji, która przewiduje, że nazwy zmiennych losowych piszemy

wielkimi literami (najczęściej końcowymi alfabetu), natomiast realizacje, czyli wartości

zmiennych losowych – odpowiednimi literami małymi. Nieodróżnianie zmiennej losowej

od jej realizacji to niestety dość częsty błąd.

Ze zmiennymi losowymi wiąże się jeszcze jeden dość częsty błąd. Parametrem położenia

jest wartość przeciętna – czyli przeciętny wynik danej zmiennej losowej. W języku

angielskim parametr ten nazywa się expected value , więc polskie tłumaczenie wartość

oczekiwana jest jak najbardziej poprawne językowo, podobnie jak piękny polski

odpowiednik – nadzieja matematyczna . Niestety pojęcia te prowadzą do błędnego

Kopiowanie lub powielanie w jakikolwiek sposób bez zgody StatSoft Polska Sp. z o.o. zabronione

Plik z chomika:

Inne pliki z tego folderu:

Inne foldery tego chomika: