Psychometria_Zawadzki.DOC

(568 KB) Pobierz
Podstawy pomiaru psychometrycznego

 

 

 

2

BOGDAN ZAWADZKI

 

 

PSYCHOMETRIA I METODA TESTÓW

 

 

KONSPEKT WYKŁADU (30 GODZIN)

 

PSYCHOMETRIA I METODA TESTÓW

 

Wykład 1. Test jako narzędzie diagnozy psychologicznej - podstawowe pojęcia: pojęcie testu psychologicznego: definicja, zastosowanie, podstawowe wymogi stawiane testom psychologicznym (standaryzacja, obiektywność, rzetelność, trafność i znormalizowanie); pojęcie cechy - ujęcie psychologiczne i psychometryczne.

Wykład 2. Rodzaje testów psychologicznych - demonstracja wybranych metod: historia testów w zarysie; rodzaje testów psychologicznych; przegląd i demonstracja wybranych metod.

Wykład 3. Podstawowe problemy stosowania testów: diagnoza psychologiczna za pomocą testów: aspekt psychologiczny, psychometryczny, metodologiczny i etyczny, ich charakterystyka i konsekwencje dla diagnozy psychologicznej.

Wykład 4. Pomiar różnicowy w psychologii - podstawowe założenia; rozkład normalny oraz podstawowe miary tendencji centralnej i dyspersji; wynik testowy jako suma wyników poszczególnych zadań: średnia wyników jako suma średnich pozycji oraz wariancja wyniku testowego jako suma wariancji pozycji i ich kowariancji; wynik testowy jako suma ważonych i nieważonych odpowiedzi testowych, zalety i wady ważenia odpowiedzi.

Wykład 5. Rzetelność pomiaru testem - podstawowe pojęcia: źródła błędu przy pomiarze psychologicznym, definicja pojęcia rzetelności pomiaru, dwa aspekty rzetelności: rzetelność jako wiarygodność i rzetelność jako stabilność; podstawy teorii rzetelności testów psychologicznych w ujęciu Gulliksena oraz Lorda i Novicka: pojęcie wyniku otrzymanego, wyniku prawdziwego i błędu pomiaru, standardowy błąd pomiaru (Sbp) i standardowy błąd estymacji wyniku prawdziwego (Sbe) oraz standardowy błąd różnicy (Sbr) i ich zastosowanie przy szacowaniu wyniku prawdziwego oraz ocenie istotności różnic wewnątrzosobniczych;

Wykład 6. Rzetelność pomiaru testem - metody szacowania rzetelności: zgodność wewnętrzna, stabilność względna i bezwzględna oraz metoda testów równoległych; zależność rzetelności od jednorodności próby i długości testu.

Wykład 7. Trafność pomiaru testem: pojęcie trafności pomiaru, trafność a rzetelność, rodzaje trafności: trafność treściowa (oraz trafność fasadowa), trafność kryterialna (diagnostyczna i prognostyczna).

Wykład 8. Trafność pomiaru testem (cd): trafność teoretyczna i metody jej oceny: badanie związków między konstruktem a zachowaniem (metoda różnic międzygrupowych, metoda zmian nieprzypadkowych, badanie procesu rozwiązywania testu) oraz analiza macierzy korelacji testu z innymi testami (metoda badania wewnętrznej struktury testu, analiza korelacji i analiza czynnikowa eksploracyjna i konfirmacyjna - trafność czynnikowa, analiza macierzy Wielu Cech-Wielu Metod: pojęcie trafności zbieżnej i różnicowej).

Wykład 9. Podstawowe problemy konstruowania testów: strategie konstruowania testów: indukcyjna, teoretyczna i kryterialna - ich cele oraz specyfika; procedura konstrukcji testów: zasady generowania pozycji testowych (forma pozycji testowych i liczba opcji odpowiedzi), wstępna selekcja pozycji (analiza logiczno-językowa pozycji, analiza trafności treściowej) oraz instrukcja i klucz testowy.

Wykład 10. Podstawowe problemy konstruowania testów: procedura konstrukcji testów (cd) - dobór pozycji do ostatecznej wersji testu na podstawie wskaźników psychometrycznych: moc dyskryminacyjna - pojęcie mocy dyskryminacyjnej pozycji oraz statystyczne metody szacowania mocy dyskryminacyjnej (współczynniki korelacji biseryjnej, punktowo-biseryjnej punktowo-czteropolowej, tj. phi oraz skorygowany współczynnik korelacji pozycja-skala); ładunek czynnikowy: pojęcie ładunku czynnikowego oraz zasady doboru pozycji - wskaźniki różnicowe; wskaźnik rzetelności a wskaźnik trafności pozycji: testy kryterialne; pojęcie krzywej charakterystycznej oraz jej parametry; założenia IRT i możliwości wykorzystania do konstrukcji testów psychologicznych.

Wykład 11. Czynniki zniekształcające wyniki testowe: czynniki zakłócające pomiar kwestionariuszowy: style odpowiadania, tendencja do symulowania oraz aprobata społeczna - ich pojęcia, uwarunkowania osobowościowe i sytuacyjne oraz sposoby kontrolowania, przykłady skal kontrolnych; czynniki zakłócające pomiar testami zdolności: zgadywanie, kontrolowanie tendencji do zgadywania przez instrukcję testową oraz wprowadzenie poprawki na zgadywanie do korekty wyników indywidualnych.

Wykład 12. Podstawowe problemy adaptowania testów: strategie adaptowania testów: transkrypcja, translacja, trawestacja, parafraza, rekonstrukcja - ich cele, specyfika oraz przykłady testów; pojęcie adaptacji demograficznej (płeć, wiek, rasa, status społeczno-ekonomiczny).

Wykład 13. Normalizacja wyników testu: transformacja liniowa (jednostki standaryzowane "z") i nieliniowa wyników surowych na skale o rozkładzie prostokątnym (skala centylowa i decylowa) oraz znormalizowane skale standardowe (wartości znormalizowane "z", skala stenowa, staninowa, tetronowa, tenowa, dewiacyjny iloraz inteligencji); kryteria wyboru właściwej skali standardowej i porównywanie wyników wyrażonych w jednostkach różnych skal.

Wykład 14. Interpretacja wyników testowych: różnice międzyosobnicze i wewnątrzosobnicze (analiza intraprofilowa oraz interprofilowa), sposoby wnioskowania - kliniczny i statystyczny. Zasady przygotowywania i korzystania z podręczników testowych: informacja o teście zawarta w podręczniku testowym, dokumentacja danych psychometrycznych: procedury i statystyki.

Wykład 15. Użyteczność standardowych metod diagnostycznych w praktyce psychologicznej - wyniki metaanaliz dotyczące wybranych metod oraz podsumowanie wykładów.

 

LITERATURA OBOWIĄZKOWA DO EGZAMINU:

 

Ciechanowicz, A., Jaworowska, A. i Szustrowa, T. (1996). Testy Prawo Praktyka. Warszawa: Pracownia Testów Psychologicznych PTP.

Hornowska, E. (2001). Testy psychologiczne. Teoria i praktyka. Warszawa: Wydawnictwo Naukowe Scholar.

Strelau, J. (red.)(2000). Psychologia. Podręcznik akademicki. Gdańsk: GWP (tom I, rodz. 11 i 12).

 

LITERATURA UZUPEŁNIAJĄCA:

(w języku polskim)

Anastasi, A i Urbina, S. (1999). Testy psychologiczne. Warszawa: Pracownia Testów Psychologicznych Polskiego Towarzystwa Psychologicznego.

Brzeziński, J. (1997). Metodologia badań psychologicznych (wyd. 2). Warszawa: Wydawnictwo Naukowe PWN (rozdz. 6, 15-20)

Magnusson, D. (1981). Wprowadzenie do teorii testów. Warszawa: PWN (rozdz. 5-11,14-16).

Zawadzki, B. (2002). Temperament - geny i środowisko. Porównania wewnątrz – i międzypopulacyjne. Gdańsk: GWP (rozdz. 3).

 

(w języku angielskim)

Murphy, K. R. & Davidshofer, C. O. (1998). Psychological testing. Principles and applications (IV edition). Upper Saddle River, N.J.: Prentice-Hall, Inc.

Walsh, W. B. & Betz, N. E. (1995). Tests and assessment (IIIrd edition). Englewood Cliffs, N.J.: Prentice-Hall, Inc.

 

 


Wykład 1.

DIAGNOZA PSYCHOLOGICZNA ZA POMOCĄ TESTÓW STANDARDOWYCH: PODSTAWOWE POJĘCIA

Przedmiotem wykładu są standardowe metody diagnostyczne. W istocie jednak wykład ten będzie dotyczył problemów diagnostyki psychologicznej, realizowanej za pomocą testów standaryzowanych. Metoda testów standaryzowanych zawsze budziła sporo emocji społecznych i przez wiele lat narosło wokół niej z jednej strony wiele mitów, obaw, uprzedzeń, z drugiej zaś wiele - równie nieuzasadnionych - oczekiwań czy nadziei. Można sądzić, że w postawach tych najmniej jest realnej i obiektywnej wiedzy. Wina za to przypada w dużym stopniu osobom zajmującym się diagnostyką i psychometrią, które mało aktywnie przeciwdziałały negatywnym zjawiskom związanym z nadużywaniem testów i jednocześnie nie kształtowały odpowiedniej kultury diagnozowania za pomocą testów. Jednym z jej przejawów jest fakt autonomizacji testów w świadomości ludzkiej (jeszcze gorzej kiedy dotyczy to psychologów), tj. utożsamiania testu z samym materiałem testowym. Spróbujmy zatem zacząć od początku w dobrej kolejności, tj. najpierw odpowiedzieć sobie na kilka podstawowych pytań: co to są testy? do czego służą?, co mierzą?, jakie wymogi muszą spełniać? jakie są ich rodzaje? oraz zastosowania praktyczne?

Do czego służą testy?

Testy są metodami psychologicznymi, służącymi do zbierania informacji o człowieku. Testy jednak służą czemuś więcej niż tylko zbieraniu danych o ludziach - stosowanie ich musi być związane z próbą udzielenia odpowiedzi na pewne pytania psychologiczne, np. o przyczyny określonego zachowania się człowieka, a uzyskana dzięki nim informacja musi służyć formułowaniu wniosków psychologicznych, np. dotyczących terapii, poradnictwa zawodowego, itp. Nie zbieramy zatem danych o człowieku za pomocą testów, tylko dlatego, żeby dane te zbierać - testów nie stosujemy tylko dlatego, żeby je stosować - bez problemu psychologicznego, uzasadniającego zastosowanie testu i wybór właśnie tego testu, a nie innego. W przeciwnym razie uzyskana dzięki niemu informacja będzie całkowicie bezwartościowa dla psychologa, a może nawet być szkodliwa dla osoby badanej. Należy przy tym pamiętać, że sam wynik testowy jest tylko stwierdzeniem określonego faktu psychologicznego - sam go jednak nie wyjaśnia, ani nie uzasadnia. Diagnoza niskiego poziomu inteligencji jest tylko stwierdzeniem niskiej sprawności umysłowej - nie wyjaśnia jakie są przyczyny obniżenia sprawności (organiczne uszkodzenie mózgu, psychoza, defekt genetyczny czy zaniedbania środowiskowe?). Test nie zastępuje więc myślenia psychologicznego, więcej, wynik testowy sam wymaga przyczynowej interpretacji psychologicznej i może być źródłem dalszych hipotez badawczych i zabiegów diagnostycznych. Innymi słowy testy są narzędziami, służebnymi wobec potrzeb diagnozy psychologicznej - stosowanie ich jest wyznaczone dokładnie poprzez wymagania i problemy procesu diagnostycznego. Takie ujęcie funkcji testów jest zbieżne z celami diagnozy psychologicznej.

Diagnoza psychologiczna jest zazwyczaj definiowana (Paluchowski, 1991) jako proces aktywnego poszukiwania danych potrzebnych do podjęcia decyzji o działaniach, zmierzających do zmiany aktualnego stanu (położenia) psychospołecznego ludzi (w efekcie terapii, porady, itp.). Diagnoza jest więc przetwarzaniem informacji, jakie niosą zachowania człowieka, a nie tylko ich rejestrowaniem, jest sprawdzaniem określonych hipotez, a nie tylko prostym zapisywaniem faktów. Diagnoza jest także modelowaniem poznawczym - modelowaniem osobowości czy intelektu danej osoby oraz modelowaniem konsekwencji działań terapeutycznych, poradniczych, itd. Diagnoza, zmierzając do ustalenia pewnych faktów psychologicznych, musi bazować na użyciu określonych narzędzi, umożliwiających rejestrację tych faktów czy inaczej mówiąc, umożliwiających zbieranie informacji o człowieku. Do narzędzi tych należą testy, należy przy tym jednak zauważyć, że istnieją także inne nietestowe metody pozwalające na zbieranie informacji o człowieku, np. eksperyment patopsychologiczny. Informacja rejestrowana przez testy wykazuje jednak daleko idącą specyfikę - powstaje zatem pytanie, jaką informację zbierają testy, a więc co testy mierzą?

Co mierzą testy?

Testy psychologiczne służą do rejestracji faktów psychologicznych z życia człowieka, tj. informacji o jego zachowaniu: przeszłym lub obecnym, typowym (najczęstszym) lub chwilowym (ograniczającym się do "tu i teraz"). Korzystając z pojęć psychologii różnic indywidualnych, w ramach której wypracowano teoretyczne podstawy testów, można powiedzieć, że mierzą one stany lub cechy osobnicze, przy czym zazwyczaj psychologowie w procesie diagnostycznym koncentrują uwagę na bardziej trwałych właściwościach osobowościowych czy intelektualnych, a zatem na cechach. Na marginesie mówiąc, niektóre rodzaje testów służą do badania nie tylko cech albo stanów, ale całych syndromów cech lub stanów. Do takich konstruktów należą przykładowo stan zdrowia psychicznego czy powodzenie zawodowe w określonym zawodzie. Ich specyfika polega na tym, że badają nie tyle jednorodne cechy (lub stany), ile całe syndromy cech (albo inaczej kryteria). Testy te wykazują daleko idącą specyfikę - dotyczy ona tak wykorzystywanego modelu psychometrycznego w procesie konstrukcji testu, uzyskiwanego rozkładu wyników, jak i własności psychometrycznych testu. Z tego względu te rodzaje testów będziemy traktowali jedynie marginalnie, koncentrując się na podstawowych narzędziach, przeznaczonych do badania jednorodnych cech albo stanów.

Przez stan rozumie się właściwość zachowania, wykazującą międzyosobniczą stałość oraz wewnątrzosobniczą zmienność międzysytuacyjną i czasową, wyznaczaną przez zmienne warunki biologiczne i/lub środowiskowe organizmu (czyli sytuacje). Przez cechę rozumie się natomiast taką właściwość zachowania, która wykazuje międzyosobniczą zmienność oraz wewnątrzosobniczą stałość: międzysytuacyjną i czasową. Mechanizmem warunkującym te formalne własności cechy są pewne stałe warunki biologiczne i/lub środowiskowe organizmu. Cechy mają status opisowy, są efektem istnienia względnej stałości zachowania jednostki w różnych sytuacjach. Cechy są pojęciami psychologicznymi - nie istnieją realnie (są to zmienne latentne, utajone). Odwołując się zatem do pojęć z psychologii różnic indywidualnych można powiedzieć, że testy rejestrują różnice między ludźmi oraz stałość osobniczą: czasową i sytuacyjną w zakresie danej formy zachowania. Testy bazują zatem na wykorzystywaniu różnic w zachowaniu się ludzi oraz na regularnościach tych różnic, tzn. stałości zachowania poszczególnych jednostek.

Przez różnice międzyosobnicze rozumie się zróżnicowanie ludzi pod względem jakiegoś aspektu zachowania (różnice te opisuje krzywa Gaussa - krzywa normalna). Przez różnice wewnątrzosobnicze rozumie się stałość-zmienność zachowania danej jednostki w różnych sytuacjach (stałość-zmienność sytuacyjna) oraz w różnych momentach czasu w tych samych sytuacjach (stałość-zmienność czasowa). Zmienność międzyosobnicza jest przy tym pochodną stałości wewnątrzosobniczej (zmienność między ludźmi jest efektem stałości zachowania poszczególnych jednostek). Zmienność międzyosobnicza i stałość wewnątrzosobnicza: sytuacyjna i czasowa, są ponadto warunkami formalnymi konstytuującymi cechę psychologiczną. Każda zatem cecha - czy to osobowości czy też intelektu - musi te wymagania spełniać, żeby mogła być uznana za cechę.

Testy zatem są metodami do pomiaru cech człowieka (lub okazjonalnie stanów). Testy są metodami rejestrującymi różnice w zachowaniu ludzi oraz stałość czasową i sytuacyjną zachowania danego człowieka. Powstaje w tym kontekście pytanie, czy każda rejestracja zachowania człowieka i czy każdego zachowania jest już testem psychologicznym? W istocie jest to zatem pytanie, co składa się na test i czym się test, jako metoda pozwalająca na pomiar cech człowieka, charakteryzuje, a więc: co to jest test?

Co to jest test?

Standardy Amerykańskiego Towarzystwa Psychologicznego (APA; 1986) definiują test jako procedurę diagnozowania. Może on być zbiorem zadań lub pytań, które - w standardowych warunkach (tj. stałych, jednakowych dla wszystkich) - mają wywoływać - określone rodzaje zachowań i dostarczać wyników o pożądanych własnościach psychometrycznych, tj. posiadających wysoką rzetelność i wysoką trafność. Choynowski (1971) definiuje test natomiast jako przyrząd, zbiór pytań lub sytuacji służących do badania psychologicznych właściwości jednostki lub grup ludzkich przez wywoływanie w nich określonych obserwowalnych reakcji werbalnych lub niewerbalnych, będących w miarę możliwości reprezentatywnymi próbkami ich zachowania się. Testy muszą spełniać szereg kryteriów "dobroci" pomiaru, jak rzetelność, trafność, obiektywność, znormalizowanie, itd. i dostarczać wyników ilościowych. Funkcją testów jest więc stwarzanie standaryzowanych sytuacji bodźcowych wywołujących reakcje, w których wyrażają się interesujące nas cechy. Ponieważ na wszystkie o.b. działają te same bodźce w tej samej sytuacji zakłada się, że zmienność reakcji zależy wyłącznie od cechy osób badanych. Wystąpienie określonego zachowania w sytuacji testowej świadczy zatem o istnieniu określonej cechy - wnioskuje się o niej na podstawie zachowania. Pomiar testowy więc to pomiar zmiennej latentnej (cechy) za pomocą pomiaru zmiennej jawnej - obserwowalnej (zachowania). Podobnie ujmują testy definicje psychometryczne, ale operują one bardziej technicznym językiem, a więc nie będą tu cytowane.

W stosunku do badań eksperymentalnych badania diagnostyczne wykazują pewną istotną specyfikę. W obu rodzajach badań standaryzacja ma celu minimalizację wpływu czynników ubocznych, ale w badaniach diagnostycznych standaryzacja dotyczy także głównej zmiennej niezależnej (materiał testowy, jak i wszystkie inne aspekty procedury testowej są identyczne dla każdej osoby badanej). W badaniach eksperymentalnych z kolei główna zmienna niezależna jest obiektem manipulacji (materiał badawczy albo jakiś inny ważny aspekt procedury badania jest różny dla poszczególnych osób badanych). W efekcie różnice w zachowaniu przypisujemy: w badaniach diagnostycznych - w różnicom wewnątrznym pomiędzy poszczególnymi osobami badanymi, zaś w badaniach eksperymentalnych – różnicom sytuacyjnym (zewnętrznym).

Istotę testu najlepiej charakteryzują elementy wspólne tych wszystkich definicji:

1). test psychologiczny zawiera próbki zadań - czyli określone standardowe bodźce; test psychologiczny jednak to nie tylko materiał testowy (chociaż jest on bardzo ważny), to przede wszystkim sama sytuacja badania: test to specyficzna forma interakcji między osobą badającą a osobą badaną, która to interakcja zachodzi w określonych warunkach czasowych, fizycznych i psychologicznych - jak w definicji Standardów APA: test to procedura diagnozy (procedura, a nie tylko sam materiał). Wynik testowy jest więc zawsze produktem całej sytuacji, a nie tylko materiału testowego.

2). test psychologiczny zawiera skalę lub skale standardowe, rejestrujące wywołane przez bodźce reakcje; nie każde zachowanie jest przy tym przedmiotem rejestracji w teście, a tylko takie które:

a). jest deskrypcją cechy (a więc spełnia określone kryteria teoretyczne i psychometryczne),

b). w teście rejestrowany jest określony aspekt zachowania jednostki, a nie całe jej zachowanie; ta własność zachowania musi spełniać następujące kryteria: (-) jest to aspekt typowy (nawet w przypadku maksymalnego wykonania), (-) jest to aspekt specyficzny dla występującego bodźca, (-) jest to aspekt ilościowy, a nie jakościowy.

3). test psychologiczny dostarcza reguł dochodzenia do wyniku oraz jego oceny, w dwóch aspektach: (a) indywidualnym - informuje o nasileniu danej cechy u danej jednostki (wynik liczbowy, ujmowany na tle grupy odniesienia wraz z szacunkową oceną możliwego błędu) oraz znaczeniu wyniku dla obecnego lub przyszłego zachowania tejże jednostki; (-) pomiarowym - umożliwia zwrotnie oszacowanie parametrów charakteryzujących "dobroć" pomiaru testem.

Testy zatem są skalami pomiarowymi, dostarczającymi informacji o określonych aspektach zachowania, stanowiącej podstawę do ilościowego oszacowania danej cechy psychologicznej u człowieka. Oszacowanie to ujęte jest w postaci wyniku liczbowego danej osoby na tle grupy odniesienia. W testach przeznaczonych do diagnozy wielu cech (tzw. testach wielowymiarowych) uzyskujemy informację w postaci profilu, tj. oszacowania wszystkich cech, mierzonych skalami zawartymi w teście (każda cech jest mierzona przez oddzielną, "własną" skalę). Profile mogą być hierarchiczne (gdy generowany jest wynik globalny, będący sumą wyników poszczególnych skal) lub równorzędne. Na podstawie profilu dokonywana jest diagnoza strukturalna, tj. porównywane jest nasilenie poszczególnych cech i formułowana diagnoza typologiczna (specyficzne konfiguracje cech, tworzące typ psychologiczny) lub różnicowa (ocena różnic w zakresie poszczególnych cech, wskazująca na istnienie określonych problemów psychologicznych). Na podstawie oszacowania cech u danej osoby możliwy jest: a). jej opis psychologiczny, tj. charakterystyka osobowości, zdolności, inteligencji, itp. tej osoby, b). przewidywanie jej powodzenia życiowego (szkolnego, zawodowego) oraz c). przewidywanie jej stanu zdrowia (zaburzeń funkcjonowania).

Nie wszystkie zatem materiały czy zbiory zadań są testami, nawet jeśli ich konstruktorzy bardzo sobie tego życzą. Wniosek ten ma podstawowe znaczenie tak dla oceny testów, jak i ich odpowiedzialnego stosowania. Czym zatem musi charakteryzować się test, jakie musi spełniać warunki, aby mógł być uznany za test?

Jakie wymogi muszą spełniać testy?

Testy muszą być tak skonstruowane, aby ich zastosowanie do pomiaru cech człowieka, charakteryzowało się odpowiednio wysoką rzetelnością, trafnością, obiektywnością, standaryzacją i znormalizowaniem.

Kryterium standaryzacji badania testem wiąże się z taką formą opracowania procedury badania testem, by stosowanie go było za każdym razem identyczne, tj. stałe niezależnie od osoby badającej i osoby badanej. Standaryzacja wymaga więc, by test zawierał ścisłą instrukcję, precyzującą zasady zachowania się osoby badającej w trakcie badania (np. zakres je dopuszczalnych zachowań) oraz wymagania stawiane osobie badanej (np. w jaki sposób ma udzielać odpowiedzi na pytania testowe). Standaryzacja wymaga też by instrukcja testowa określała warunki, w jakich badanie ma być przeprowadzane (np. warunki fizyczne - głośność, oświetlenie) oraz przeznaczenie testu - do jakich celów test może być stosowany, a do jakich nie. Standaryzacja ma na celu zminimalizowanie wpływu czynników ubocznych lub zakłócających (zewnętrznych w stosunku do osoby badanej, np. hałasu lub wewnętrznych, np. jej napięcie emocjonalne, zmęczenie) na wyniki testowe. Standaryzacja ma zagwarantować, że w powtarzalnych warunkach (ten sam cel badania, te same warunki badania) osoba badana będzie uzyskiwała te same wyniki. Należy przy tym odróżnić standaryzację na poziomie zewnętrznym i wewnętrznym. Założenie podstawowe obu pojęć jest takie same – oznacza ono, że dana procedura powinna odwoływać się do identycznych procesów u każdej osoby badanej, które wyznaczają sposób i jakość rozwiązywania testu. Mają one jednak inne znaczenie faktyczne. Standaryzacja zewnętrzna oznacza, że oczekujemy, że efekt ten zostanie osiągnięty w przypadku, gdy wszystkie osoby badane będą pracowały w jednakowych warunkach zewnętrznych. Standaryzacja wewnętrzna z kolei oznacza, że aby efekt ten został osiągnięty, to każda z badanych osób powinna pracować w warunkach dopasowanych do różnych swoich właściwości, a zatem warunkach zewnętrznie zupełnie odmiennych. Standaryzacja na poziomie zewnętrznym nie oznacza, że osiągnięta została standaryzacja na poziomie wewnętrznym (choć zwykle w pewnym substancjalnym stopniu tak właśnie jest). O wystąpieniu niezgodności świadczy przede wszystkim niewystarczająca trafność testu - im bardziej standaryzacja na poziomie wewnętrznym odbiega od standaryzacji na poziomie zenętrznym, tym bardziej pomiar testowy jest nietrafny – badamy rożne zmienne u poszczególnych osób. Z tego względu niekiedy standaryzacja zewnętrzna jest łamana, ale prowadzi to do uzyskania wyniku danej osoby badanej o nieznanych parametrach psychometrycznych, nieporównywalnego z innymi wynikami. Złamanie standaryzacji zewnętrznej określane jest mianem niestandardowego zastosowania standardowej metody diagnostycznej, ale uwagi na trudności porównywania wyników poszczególnych osób jego zastosowanie jest dopuszczalne tylko w wyjątkowych przypadkach diagnostycznych. Wniosek – zamiast łamać procedurę badania w celu uzyskania zgodności między standaryzacją zewnętrzną i wewnętrzną należy raczej konstruować testy, które minimalizują rozbieżności obu aspektów standaryzacji.

Kryterium obiektywności badania testem wiąże się natomiast z taką formą opracowania procedury interpretacji wyników badania testem, by stosowanie jej było za każdym razem identyczne, tj. stałe niezależnie od osoby badającej. Obiektywność wymaga więc, by test zawierał klucz odpowiedzi, precyzujący zasady oceny odpowiedzi osoby badanej oraz zasady przyporządkowywania tym odpowiedziom wyników liczbowych i przekształcania tych wyników na określone wyniki znormalizowane (tj. odnoszenia tych wyników do norm - oceniania jednostki na tle określonej grupy odniesienia). Obiektywność ma na celu zminimalizowanie wpływu osoby badającej na wyniki testowe. Obiektywność ma zagwarantować, że różne osoby badające dokonają identycznej oceny wyników danej osoba badanej.

Kryterium normalizacji wyników badania testem wiąże się natomiast z koniecznością opracowania procedury przekształcania wyników liczbowych, uzyskanych przez osobę badaną w wyniki różnicowe, umożliwiające lokalizację cechy danej osoby na tle reprezentatywnej populacji. W języku technicznym wiąże się to z przeliczaniem tzw. wyników surowych na skale standaryzowane, tj. skale o ustalonej średniej i odchyleniu standardowym, bazujące na rozkładzie normalnym (np. skale stenowe, tenowe, staninowe) lub prostokątnym (np. skale centylowe, decylowe). Normalizacja wymaga więc, by test zawierał odpowiednie normy, tj. wyniki dużej grupy osób, przeliczone na daną skalę standardową, dające możliwość interpretacji ilościowej wyników danej osoby badanej. Normy umożliwiają więc interpretację różnicową wyników osoby badanej - ocenę czy i na ile nasilenie cechy u tej osoby odbiega od średniej (przeciętnej) w populacji (a więc czy i jak bardzo osoba ta różni się pod danym względem od innych, reprezentatywnych dla niej osób). Normalizacja ma na celu zminimalizowanie błędu związanego z oceną faktycznego nasilenia danej cechy u określonej osoby, a więc błędnej diagnozy psychologicznej.

Kryterium rzetelności pomiaru testem wiąże się z wymogiem takiego opracowania testu (materiału testowego i procedury badania), by maksymalizował on dokładność pomiaru cechy badanej przez test. Kryterium rzetelności pomiaru testem (rzetelności pomiaru, a nie testu) ma dwa aspekty:

(a) wiąże się z oczekiwaniem jego stabilności, oznaczającym, że wyniki danej osoby badanej nie będą się zmieniały w czasie -pomiar cechy będzie się charakteryzował stałością czasową, a więc powtarzalnością (powtórny pomiar danej cechy w porównywalnych warunkach powinien prowadzić do uzyskania identycznych wyników); (b) konsystencji (czy inaczej zgodności wewnętrznej) - wiąże się z oczekiwaniem jego precyzji, oznaczającym, że pomiar cechy danej osoby nie jest obciążony błędem, że zmierzono tę cechę z maksymalną dokładnością.

Rzetelność pomiaru testem często nazywa się też wiarygodnością - oznacza bowiem zaufanie, jakim osoba badająca może obdarzyć wyniki testowe, a więc i w konsekwencji pewność, z jaką może formułować diagnozę psychologiczną. Kryterium rzetelności wymaga więc, by test dawał wyniki dokładne i powtarzalne i może być oszacowana matematycznie. Wymóg rzetelności pomiaru testowego ma na celu zminimalizowanie błędu związanego z oceną faktycznego nasilenia danej cechy u określonej osoby, a więc błędnej diagnozy psychologicznej.

Kryterium trafności pomiaru testem wiąże się z wymogiem takiego opracowania testu (materiału testowego i procedury badania), by maksymalizował on stopień, w jakim test mierzy daną cechę. Kryterium trafności pomiaru testowego (trafności pomiaru, a nie testu) ma dwa aspekty: (a) dotyczy tego, co test mierzy i jak dobrze to mierzy - w jakim stopniu (jaka cecha jest mierzona i w jakim stopniu jest mierzona, np. czy mierzone są przy okazji także inne cechy) oraz (b) dotyczy tego, co możemy przewidywać na podstawie wyników testowych (na podstawie cechy, zmierzonej u danego człowieka). Mówiąc inaczej, trafność pomiaru testem stanowi wymóg określający poprawność wniosków, jakie można postawić na podstawie wyników badania testem. Wnioski te mogą dotyczyć przedmiotu pomiaru - cech, jakie wykazuje dany człowiek (trafność teoretyczna pomiaru testem) lub możliwości przewidywania innych zachowań tegoż człowieka na podstawie, zmierzonych u niego danym testem, cech (trafność kryterialna). Ten aspekt trafności odnosi się do możliwości diagnozy innych zachowań (lub cech) człowieka w danym czasie (np. diagnoza problemów szkolnych, diagnoza nerwicy) lub przewidywania tych zachowań w przyszłości (np. wystąpienia problemów zawodowych, symptomów nerwicowych), a więc trafności diagnostycznej i prognostycznej.

Kryterium trafności wymaga więc, by test dawał odpowiednie możliwości interpretacyjne - pozwalał na postawienie trafnej diagnozy psychologicznej, a więc: pozwalał na pełne oszacowanie właśnie tych, a nie innych cech psychologicznych oraz przewidywanie określonych zachowań pozatestowych czy realnych kryteriów, tj. na formułowanie wniosków diagnostycznych o realnym życiu jednostki (zdarzeniach obecnych i przyszłych). Wymóg trafności pomiaru testowego ma na celu zmaksymalizowanie możliwości interpretacyjnych testu.

!Test zatem musi gwarantować możliwość dokonywania maksymalnie rzetelnego, trafnego, obiektywnego, wystandaryzowanego i znormalizowanego pomiaru, by mógł być stosowany, i żeby mógł być nazwany testem. Jakie zatem metody testowe spełniają te kryteria? Jakie są rodzaje testów? Zagadnienia te omówimy na następnym wykładzie.


Wykład 2.

RODZAJE TESTÓW PSYCHOLOGICZNYCH

Jakie są rodzaje testów?

Podział testów zależy od specyfiki badanego konstruktu oraz specyfiki sposobu zbierania informacji. Zazwyczaj testy dzielone są na testy dostarczające próbek zachowań (testy standaryzowane) oraz znaków (informujących o ukrytych procesach wewnętrznych, tzw. testy projekcyjne). Niektórzy zresztą uważają testy projekcyjne za bardziej użyteczne narzędzia diagnostyczne osobowości i zdolności niż techniki ustrukturowane, bo badany nie jest w stanie manipulować wynikiem. Należy przy tym pamiętać, że pomimo wysiłków autorów nie udaje się testów projekcyjnych do końca wystandaryzować - ich stosowanie nadal jest więc sztuką, a nie nauką. W trakcie wykładu skoncentrujemy się zatem na tradycyjnej diagnostyce za pomocą pomocą testów standaryzowanych czy ustrukturowanych.

Pod względem specyfiki zbierania informacji rozróżniamy następujące testy:

1). Test, w którym jednostka wykonuje specyficzne zadanie - test ten wymaga maksymalnego wykonania (testy inteligencji, zdolności, wiadomości, sprawności psychomotorycznej). Testy maksymalnego wykonania mogą być @ testami mocy (wskaźnikiem jest liczba rozwiązanych zadań, bez względu na czas pracy - jednostka ma możliwość dotarcia do wszystkich zadań), @testami szybkości (wskaźnikiem jest czas rozwiązania) lub @testami z ograniczeniem czasowym (wskaźnikiem jest liczba rozwiązanych zadań w określonym czasie - jednostka ma tylko potencjalne szanse dotarcia do wszystkich zadań, zazwyczaj udaje się jej dotrzeć tylko do części zadań). Testy inteligencji i wiadomości różnią się między sobą zakresem badanej sprawności - testy wiadomości są sondażem (w założeniu wyczerpującym) wiedzy z bardzo wąskiej dziedziny, testy inteligencji - wiedzy ogólnej, erudycji w szerokim zakresie lub wręcz sprawności myślenia i działania na materiale sztucznym, nie mającym zastosowania w rzeczywistości. Testy wiadomości dotyczą zawsze materiału i wiedzy realnej, testy inteligencji często zaś materiału abstrakcyjnego, sztucznego, co do którego jednostka nie ma specyficznych doświadczeń. Uważa się, że tylko takie narzędzia zasługują na miano testu - dają one bowiem stosunkowo małą możliwość zniekształcania wyników przez osoby badane (w grę wchodzi tylko symulacja - nie można dysymulować upośledzenia umysłowego, można je tylko symulować - i z taką sytuacją mamy najczęściej do czynienia, gdy o.b. zależy na dobrym wyniku - poza stosunkowo rzadkimi sytuacjami, gdy o. b. zależy na złym wyniku, np. przy ocenie poziomu inteligencji ważnym dla kwalifikacji odpowiedzialności za czyn przestępczy czy możliwości pełnienia służby wojskowej).

2). Test, w którym jednostka sama opisuje swoje zachowanie - test rejestruje samoopis typowego zachowania (inwentarze, ankiety, arkusze biograficzne). Testy osobowości/temperamentu oraz testy stanów - wykorzystujące samoopis - są wysoko standaryzowanymi narzędziami zakładającymi odpowiedź o.b. na szereg pozycji (bodźców) opisujących zwyczajowe zachowania lub samopoczucie w określonej sytuacji. Jak wszystkie metody samopisu uważane są za mniej wartościowe niż testy - stąd określenie inwentarze - bo są podatne na zniekształce...

Zgłoś jeśli naruszono regulamin