statystyka_skrypt_1.pdf

(2466 KB) Pobierz
(Microsoft Word - Materia\263y dla Student\363w_cz.1)
Materiały dla Studentów – laboratoria ze statystyki 2010
Część 1. WPROWADZENIE DO PRACY Z DANYMI I ZMIENNYMI W SPSS, OBLICZENIA NA
WARTOŚCIACH ZMIENNYCH, REKODOWANIE
Jak wiemy, aby wnioskować o jakichkolwiek zależnościach między zmiennymi czy różnicach
pomiędzy grupami osób badanych w poziomie interesującej nas cechy, należy zebrane na
drodze empirycznej dane poddać analizie statystycznej. Tylko wtedy bowiem, gdy różnice
między grupami lub związek miedzy zmiennymi okaże się być istotny statystycznie –
uprawnione będzie odnoszenie interpretacji wyniku z próby badanych do całej populacji.
Pakiet SPSS jest programem umożliwiającym wprowadzanie, porządkowanie, opisywanie i
analizowanie danych, które zostały zebrane w badaniach psychologicznych (lub
socjologicznych i innych).
Pracę z programem SPSS rozpocznijmy od zapoznania się z podstawowymi jego funkcjami i
możliwościami, zanim przystąpimy do nauki wykorzystania najważniejszych narzędzi
statystycznych służących analizie danych.
Otwierając po raz pierwszy program SPSS (nie otwierając żadnego konkretnego pliku z
danymi) naszym oczom ukazuje się taki oto pusty arkusz:
1
249162673.008.png
Materiały dla Studentów – laboratoria ze statystyki 2010
W lewym dolnym rogu widać dwie zakładki, między którymi możemy się przemieszczać:
„Dane” i „Zmienne” (wyróżniona zakładka to ta, w której aktualnie się znajdujemy).
Ta pierwsza to właśnie arkusz, gdzie wprowadzamy uzyskane dane. W drugiej musimy
scharakteryzować kontrolowane przez nas zmienne.
Załóżmy, że przeprowadziliśmy badania przy pomocy kilku testów, mierzyliśmy także czas
wykonania różnych zadań mierzących poziom określonych zdolności, a także pytaliśmy
badanych o wielkość miejsca zamieszkania, wykształcenie i wiek. Zapisywaliśmy również płeć
badanych. Zebrawszy dane, należy je teraz wprowadzić do arkusza SPSS, aby można je było
następnie poddać analizom.
Każdy wiersz arkusza (w zakładce „Dane”) to miejsce na dane jednej osoby badanej.
Natomiast każda kolumna to miejsce na wartości uzyskane przez całą zbadaną próbę w
ramach jednej zmiennej:
W kolejnych kolumnach
należy wpisać wartości
uzyskane w ramach
kolejnych interesujących
nas zmiennych. Każda
kolumna to jedna zmienna
Aktywna komórka (ta, w której obecnie
jesteśmy i możemy edytować jej zawartość)
W każdym wierszu wpisuje się dane
uzyskane (w ramach różnych
zmiennych) przez kolejne osoby
badane, a więc każdy wiersz to jedna
osoba badana
Na początek jednak, zanim zaczniemy wprowadzać dane, warto nazwać wszystkie
interesujące nas zmienne oraz scharakteryzować je (określić ich parametry).
2
249162673.009.png 249162673.010.png 249162673.011.png
Materiały dla Studentów – laboratoria ze statystyki 2010
Przechodzimy w tym celu do zakładki ze zmiennymi (klikamy na nią) i wprowadzamy ich
nazwy do pierwszej kolumny („Nazwa”):
Warto wiedzieć, że nazwy powinny być krótkie i
kojarzące się z tym, czego dotyczy dana zmienna,
jak również to, że nazwa zmiennej nie może
zawierać pewnych znaków, np. - , . ; : ” ‘ ( ) + = * / %
^ & | < > ?, nie można tez używać spacji (w razie,
gdybyśmy o tym zapomnieli, program nam o tym
przypomni informując, że użyliśmy niedozwolonego
znaku)
Co wpisujemy natomiast w pozostałe kolumny?
(zob. dalej)
Zwróćmy uwagę, że w zakładce „Zmienne” układ jest w pewnym sensie odwrócony: tym
razem każdy wiersz - to jedna zmienna, zaś w kolejnych kolumnach precyzujemy
charakterystyki dotyczące każdej zmiennej.
Po wpisaniu naszych przykładowych zmiennych zawartość zakładki „Zmienne” będzie
wyglądać mniej więcej w ten sposób:
3
249162673.001.png 249162673.002.png
Materiały dla Studentów – laboratoria ze statystyki 2010
Zauważmy, że program SPSS w sposób domyślny określa charakterystyki poszczególnych
zmiennych po wpisaniu ich nazw (np. wszystkie zmienne są tu wpisane jako ilościowe),
dlatego kolejnym krokiem jest określenie parametrów każdej zmiennej (zmiana domyślnych
ustawień lub pozostawienie ich).
Kolejna kolumna w zakładce zmiennych, obok nazwy, to „Typ”. Określamy tu, jakiego typu
jest nasza zmienna. Nie chodzi tu jednak o to, czy jest to np. zmienna jakościowa czy
ilościowa. Określa się tu format zmiennej, a więc to czy wartości zmiennej będą wyrażone
numerycznie, tekstowo czy za pomocą daty, itd. Klikając na komórkę w kolumnie „Typ” w
wierszu dotyczącym określonej zmiennej pojawia nam się kwadracik z trzykropkiem:
Klikając na niego otworzymy następujące okno:
Jak widać, mamy kilka możliwości do
wyboru, najczęściej jednak
wprowadzamy wartości wszystkich
zmiennych w formie numerycznej,
chyba że wpisujemy np. nazwiska
lub pseudonimy badanych – wtedy
należy wybrać typ tekstowy. Jeżeli
zaś chcemy kolejne potęgi tysiąca
oddzielać kropką i miejsca dziesiętne
przecinkiem – wybieramy typ „z
kropką”, itd.
W oknie tym możemy również
określić szerokość kolumny dla danej
zmiennej oraz to ile miejsc po
przecinku ma być widocznych w
arkuszu. Te charakterystyki można
jednak ustawić także w innym
miejscu (zob. dalej)
Kolejna kolumna w zakładce zmiennych to „Szerokość”. Chodzi tu o określenie tego, ile
znaków będzie mieć w kolumnie arkusza wartość danej zmiennej. Jeżeli np. wiemy, że
wartości danej zmiennej uzyskane przez naszych badanych to liczby z wieloma cyframi po
przecinku a jednocześnie określiliśmy w kolumnie „Dziesiętne” wyświetlanie np. sześciu
miejsc po przecinku, to szerokość kolumny nie może wynosić np. 3, ponieważ program
wyświetli komunikat, że „liczba miejsc dziesiętnych jest zbyt duża dla tej szerokości pola”.
4
249162673.003.png 249162673.004.png 249162673.005.png
Materiały dla Studentów – laboratoria ze statystyki 2010
W kolumnie „Dziesiętne” – jak już
wspomniano – określamy ile miejsc po
przecinku będzie widocznych w komórkach
arkusza dotyczących danej zmiennej. Jeżeli
wiemy, że wartości danej zmiennej to liczby z
pięcioma cyframi po przecinku – ustalając w
kolumnie „Dziesiętne” wartość 2 – program
zaokrągli te liczby do dwóch miejsc po
przecinku i widoczne będą tylko te liczby
zaokrąglone
Aczkolwiek warto wiedzieć, że te ustalone przez nas parametry dotyczą tylko tego, co widać
w arkuszu. Program dokonując późniejszych analiz statystycznych i tak posługuje się pełnymi
wartościami wprowadzonymi do komórek (czyli niezaokrąglonymi).
Dalej na prawo jest bardzo ważna kolumna: „Etykieta”. Tu w sposób bardziej opisowy,
rozwinięty określamy czym jest dana zmienna. Jak pamiętamy – sama nazwa musi być
krótka, zaś etykieta zmiennej informuje nas o tym, że np. jest to wynik osoby badanej na
skali werbalnej w teście inteligencji Wechslera (przy nazwie zmiennej „IQ”), albo wyjaśniamy,
że pod tajemniczą nazwą zmiennej „kreat” kryje się wynik osoby badanej uzyskany w teście
twórczego myślenia Urbana-Jellena. Jest to szczególnie ważne, gdy mamy kilka zmiennych
podobnie się nazywających i musimy pamiętać, która dotyczyła jakiego pomiaru (np. jedna to
poziom asertywności przed treningiem, druga – poziom asertywności bezpośrednio po
treningu, zaś trzecia – to poziom tej zmiennej zmierzony rok po treningu).
Przykładowe etykiety zmiennych mogą wyglądać w ten sposób:
5
Powinniśmy zatem proporcjonalnie zwiększyć szerokość do takiej liczby znaków, z ilu
składają się uzyskane wartości zmiennych.
249162673.006.png 249162673.007.png
Zgłoś jeśli naruszono regulamin