Spis zagadnień egzaminacyjnych
rok akademicki 2005/2006
1. Omów cechy charakterystyczne testów psychologicznych
Jest to sytuacja stworzona specjalnie do testów , sztuczna , a te zachowania są wskaźnikami interesującej nas cechy , że osoba badana jest świadoma faktu iż jest poddawana ocenie .
2. Jakie znasz przykłady testów psychologicznych?
Chodzi nie o konkretne testy ale o kategorie testów : testy obiektywne vs nieobiektywne , standaryzowane vs niestandaryzowane , zorientowane na normy vs zorientowane na kryterium , testy mocy ( osoba badana ma szansę zmierzyć się z każdą pozycją ) i testy szybkości ( mierzy poziom posiadanej cechy i tempo pracy )
3. Jakie są kryteria dobrego testu?
Święta 6 : obiektywność , standaryzacja , rzetelność , trafność , normalizacja i adaptacja ( jeżeli jest ważna ) .
4. Dlaczego standaryzacja testu jest zabiegiem szczególnie ważnym? Wskaż przynajmniej dwa aspekty w procedurze badania testem, które wymagają wystandaryzowania. Dlaczego?
Dlatego , że : odtwarza warunki badania testem jakie obowiązywały w trakcie opracowywania norm , co oznacza , że każda osoba badana ma mieć takie same warunki i na porównywaniu wyników testowych między sobą , dlatego wtedy możemy korzystać z norm . Instrukcja ( zakres pomocy udzielanej osobie badanej ) – należy wiernie ją przeczytać i nie przekraczać warunków , pomoce testowe zawsze powinny być takie same à uwaga : arkusz odpowiedzi – nie robić kser , powinny być takie same ; standaryzacja
5. Jaka jest różnica pomiędzy testem obiektywnym a testem wystandaryzowanym?
Test obiektywny à jego wyniki nie zależą od tego kto je interpretuje ( ślepa diagnoza à że bez kontaktu z osoba badaną interpretuje się wyniki ) . Test wystandaryzowany à jednolitość czyli niezależność wyników od sytuacji , w której badanie ma miejsce ( zasady badania ) à chodzi o jednolitośc w obu testach .
6. Opisz swoimi własnymi słowami co rozumiesz przez "rzetelność testu".
To powtarzalność wyników testowych .
7. Podaj i objaśnij podstawowe równanie klasycznej teorii testów H. Gulliksena.
Jedyna techniczna sprawa à mówiąc o rzetelności
Np. x = t + e , t-największe albo najmniejsze
e-najwieksze albo najmniejsze ( zmniejszyć błąd do którego prowadzi pomiar
testowy )
8. Podaj definicję rzetelności testu.
Jest to definicja operacyjna à jest to wielkość współczynnika korelacji pomiędzy wynikami dwukrotnego badania tej samej grupy osób tym samym testem , a to się równa kwadratowi korelacji pomiędzy wynikiem obserwowanym a wynikiem prawdziwym .
Np. korelacje między dwoma wynikami tym samym testem = 0,80 ( to już jest kwadrat korelacji między wynikiem obserwowanym a prawdziwym ) à to oznacza , że błąd wynosi 20% , 36% … 40% à prawidłowa odpowiedź to 20% ( interpretujemy wprost ) .
A rzetelność opisuje ( mówi o podobieństwie ) à im wyższy dodatni wynik tym większe podobieństwo : + 0,20 , + 0,56 , - 0,40 , - 0 ,96
9. Jakie są trzy podstawowe sposoby rozumienia rzetelności testu?
a) jako stabilność ( spójność w czasie à wpływ czasu )
b) jako zgodność ( wpływ treści )
c) jako homogeniczność ( wpływ róznych wymiarów )
10. Co to są testy równoległe?
Mierzą to samo i dokładnie tak samo i w sensie formalnym są to metody , które w tej samej grupie osób dają takie same średnie wyniki , takie same odchylenia standardowe i tak samo korelują z innym testem ( a różnią się treścią pozycji testowych ) .
11. Jakie są wady technik obliczania rzetelności opartych na dwukrotnym testowaniu tej samej grupy osób?
Wady : a) zapamiętywanie ( prowadzi do przeszacowania współczynnika rzetelności )
b) czynniki o charakterze rozwojowym czyli uczenie się ( prowadzi do niedoszacowa-
nia współczynnika rzetelności ) .
12. Co to jest błąd standardowy pomiaru i do czego służy?
Mówi nam o tym jaka jest wielkość błędu , który powinniśmy wziąć pod uwagę przy interpretacji wyniku indywidualnego i służy do budowania przedziału ufności dla wyniku otrzymanego .
13. Jak należy interpretować przedział ufności dla wyniku otrzymanego?
Jest to przedział budowany wokół wyniku otrzymanego , jest to przedział w którym z założoną ufnością mieści się wynik prawdziwy osoby badanej ; każdy wynik wpadający do przedziału ufności jest tak samo prawdopodobny .
14. W jaki sposób wykorzystuje się informacje o błędzie standardowym różnicy? Jakie decyzje diagnostyczne wymagają uwzględnienia błędu standardowego różnicy?
a) pozwala nam określić jaka jest minimalna wartość różnicy pomiędzy dwoma wynikami , która jest istotna statystycznie ; jeżeli ta różnica jest istotna statystycznie między 2 wynikami to ma ona znaczenie diagnostyczne , w przeciwnym wypadku różnicy się nie interpretuje .
b) przede wszystkim sytuacje selekcji ( jak wybieramy najlepszego z kandydatów ) i sytuacji zmiany wyników ( terapii ) à czy terapia pomogła , czy po niej wyniki spadły , czy terapia okazała się skuteczna np. obniżyła poziom lęku ?
15. Czy interpretując wyniki testowe można się odwoływać do innych źródeł niż podręcznik testowy? Wypowiedź uzasadnij.
należy , tak , jak najbardziej tak ( dot. to zwiększenia informacji na temat trafności metody )
16. Wyjaśnij różnice w rozumieniu następujących pojęć: trafność wewnętrzna, trafność kryterialna, trafność teoretyczna, trafność fasadowa.
Trafnośc wewnętrzna à treściowa , logiczna , mówi nam o tym ile treść testu ( jaka próbka ) pokrywa uniwersum treści , które da się sformułować dla mierzonego konstruktu ; test powinien być reprezentatywny dla danego konstruktu tzn. proporcjonalny ( powinien proporcjonalnie wyczerpywać uniwersum treści )
Trafność kryterialna à mówi o tym , o jakich zachowaniach poza testowych możemy wnioskować na podstawie wyników testu ; rozszerza możliwości interpretacyjne testu ; ma 2 aspekty :
1) trafność kryterialna diagnostyczna – na podstawie wyników testu orzekać o innych cechach aktualnie występujących u osoby badanej ; np. uszkodzenie CUN i test odwzorowywania figur geometrycznych
2) trafność kryterialna prognostyczna – możemy przewidywać cechy , które mogą się pojawić w przyszłości ; np. test do mierzenia temperamentu i mierzymy nim alkoholików
3) trafność teoretyczna – mówi o tym czy test mierzy to co z założenia miał mierzyć , na ile udało się zrealizować stawiane cele , czy np. test inteligencji mierzy to co miał mierzyć ? ; jest 6 różnych metod badania jej à pkt 19
4) trafność fasadowa – mówi o tym co o teście myśli osoba badana , co test wydaje się mierzyć z punktu widzenia osoby badanej ; nie mierzy cechy testu ale to tylko co myśli osoba badana , może zwiększać lub zmniejszać motywację
17. Jakie znasz sposoby wyeliminowania zjawiska kontaminacji kryterium?
Kontaminacja kryterium à jest to zanieczyszczenie kryterium ; błąd bierze się z tego , gdy ta sama osoba ocenia poziom wykonania w teście i poziom wykonania w zmiennej kryterialnej ( gdy robią to te same osoby ) ; podstawową metodą unikania jest rozdzielenie tych dwóch funkcji à robienie dwóch zespołów ludzi
18. Jakie znasz rodzaje trafności kryterialnej?
Diagnostyczna
Prognostyczna
19. W jaki sposób można oszacować trafność teoretyczną testu?
Jest 6 grup metod : pierwsza metoda to badanie różnic grupowych ( głównie na to zwrócić uwagę , pozostałe metody nieważne ) – np. Apis mierzy inteligencję skrystalizowaną , im ktoś się więcej uczył tym lepiej powinien go rozwiązać à osoby z wykształceniem średnim a wykształceniem wyższym ; hipoteza wynika z teorii o różnicy a weryfikujemy odwołując się do wyników .
20. Wyjaśnij pojęcie normy statystycznej?
Opisuje typowy poziom rozwiązania testu w grupie odniesienia à to norma statystyczna .
21. Dlaczego normy powinny być aktualne, adekwatne i reprezentatywne?
Bo istotą reprezentacji normatywnej jest określenie stopnia podobieństwa osoby badanej do grupy odniesienia ; zawsze opisujemy osobę badaną na tle grupy odniesienia , dlatego to tło musi być a jest nim :
- aktualność – że nie są przestarzałe , max. 15 letnie
- adekwatność – tzn że mają być obliczane dla takiej grupy do której należy osoba badana , oceniane to jest pod kątem demograficznym : płeć , wykształcenie , miejsce zamieszkania itp.
- reprezentatywność – mówi o stopniu uogólniania naszych wniosków
22. Co oznacza termin normy lokalne? Czy normy te różnią się od norm ogólnokrajowych?
Normy lokalne są obliczane dla wąskich grup i stopień ich reprezentatywności jest mały a normy ogólnokrajowe są obliczane dla prób reprezentatywnych , dla populacji całego kraju .
23. Próba normalizacyjna dla testu wiadomości składała się z maturzystów liceów ogólnokształcących z 1964 roku. Określ przydatność norm dla: a) maturzystów z 1965 roku; b) absolwentów szkoły dla głuchoniemych z 1964 roku; c) maturzysty z 1964 roku, który dwukrotnie powtarzał klasę; d) ucznia, który ze względu na wybitne zdolności ukończył szkołę w wieku o dwa lata niższym.
a) dobre
b) b) niedobre ( wszystko zależy od tego co mierzymy à bo może chodzi o to jak dzieci głuchonieme wypadają na tle osób nie głuchoniemych ? )
c) dobre
d) dobre
24. Jakie informacje należy podać o normach, aby można je było właściwie wykorzystywać i dlaczego?
- rok powstania
- skład grupy normalizacyjnej
- sposób pobrania próby ( czy była reprezentatywna czy nie ? )
- kiedy , kto i jak pobrał próbę ?
25. Czy wynik testowy równy 80T równy jest 80 centylowi? Dlaczego?
Nie jest równy bo : T- to skala standardowa
C – to skala wentylowa
Powierzchnia pod rozkładem , która odpowiada > 80 T ( mieści się ok. 3 odchyleń standardowych tj 3% osób tu się mieści ) a > 80 C ( centyl oznacza wyniki osób , które otrzymały poniżej , tu się mieści 20% osób )
26. Dlaczego skalę T stosuje się głównie w testach przeznaczonych do diagnozowania patologii?
Bo jest to skala bardzo długa i sięga od -5 do +5 odchyleń standardowych .
27. Dlaczego standardowe skale norm są tak bardzo popularne?
Bo są one skalami interwałowymi , co oznacza , że pozwalają na określenie różnic między badanymi osobami ( mówi o wielkości różnic , każdy uzyskał inny czas , o ile był szybszy ) . A skala C à porządkowa wskazuje jedynie porządek , informacje na którym miejscu znalazł się dany np. zawodnik . Centyle to miejsca 1,2,3 à ale nie podaje poziomu nasilenia cechy ( dobre w siatkach centylowych dot. rozwoju dziecka ) .
28. Dlaczego normalizacja rozkładu jest krokiem niezbędnym przy przeliczaniu wyników surowych na którąś ze skal standardowych?
Dlatego , że do interpretacji wyników wykorzystujemy właściwości rozkładu normalnego , czyli wyniki w zakresie : -1 à +1 – wyniki przeciętne
1 à 2 – wyniki wysokie
2 à 3 wyniki bardzo wysokie
-1 à -2 – wyniki niskie
-2 à -3 – wyniki bardzo niskie jest to niezbędne J
-3 à -4 – wyniki skrajnie niskie
Pytanie dot znajomości skal standardowych ( nie ma go tu ) : wyniki T , steny , staniny ( średnia 5 odchyleń standardowych 2 ) , IQ ( średnia 100 odchyleń standardowych 15 ) , tetrony ( średnia 10 odchyleń standardowych 4 )
29. Dlaczego obliczamy moc dyskryminacyjną przed włączeniem zadań do ostatecznej wersji testu?
Bo do ostatecznej wersji testu powinniśmy włączyć pozycje testowe różnicujące badane osoby pod względem mierzonej cechy .
30. Jakich specyficznych informacji dostarcza analiza zadań?
Dostarcza 3 rodzaji informacji à czy pozycje testowe są :
1) poprawne rzeczowo ( czy są wskaźnikami mierzonych właściwości )
2) o poprawności językowej ( czy zostały skonstruowane poprawnie językowo )
3) o właściwościach statystycznych poszczególnych pozycji )
31. Jakie znasz sposoby szacowania wielkości mocy dyskryminacyjnej zadań? Czym one się różnią między sobą?
Testy właściwości poznawczych
Testy właściwości afektywnych
Wskaźnik trudności à średnia trudność całego testu ; plus minus 50% ( optymalna decyzja gdy różnicujemy grupę , w testach selekcyjnych ; im niższy wskaźnik trudności tym trudniejszy test – 10% to bardzo trudny test a 90% to test bardzo łatwy ; specyficzna selekcja – dot sytuacji selekcyjnych , chcemy odsiać 10% to robimy taki test a test który max różnicuje to wtedy 50% ; mechanizmem który bierze tu udział jest zgadywanie
Wskaźnik dyskryminacji à testy dwukategorialne , test T-studenta , testy wielokategorialne ; korelacja wyniku danej pozycji z ogólnym wynikiem w teście – to są 3 metody ; np. przy testach 2 kategorialnych wskaźnik dyskryminacji się nie nadaje
32. Co to są style odpowiadania i jak można sobie radzić z tym źródłem błędu w pomiarze testowym?
Są to stałe , trwałe dyspozycje do odpowiadania w sposób pozatreściowy à to są style odpowiadania jak sobie radzić – że są pewne metody gdy możemy działać na poziomie konstrukcji kwestionariusza albo na poziomie interpretacji wyników ( skale kontrolne ) .
33. Na czym polega empiryczna procedura konstrukcji testu?
Polega na sprawdzeniu na jakie pozycje testowe inaczej odpowiadają osoby z tzw grupy kryterialnej ( posiadają cechy ) i grupy kontrolnej ( nie posiadają cech ) ; istotą tej procedury jest znalezienie kryterium pozwalającej odróżnić te 2 grupy między sobą .
mimi_mimi66