Ważność testu: 6 typów

Następujące sześć typów ważności jest popularnie stosowane, mianowicie., Ważność w Face, Ważność treści, Predictive validity, Concurrent, Construct i Factorial validity. Spośród nich ważna jest zawartość, przewidywanie, współbieżność i konstruktywność w dziedzinie psychologii i edukacji.

Są one omówione poniżej:

Wpisz # 1. Ważność powierzchni:

Twarz Ważność w zakresie, w jakim wydaje się, że test mierzy to, co ma zostać zmierzone.

Ważność twarzy odnosi się do tego, czy test wydaje się być poprawny, czy też nie, tj. Od zewnętrznego wyglądu, czy elementy wydają się mierzyć wymagany aspekt, czy nie. Jeśli test mierzy to, co testodawca chce zmierzyć, mówimy, że test ma ważność twarzy. Zatem ważność twarzy odnosi się nie do tego, co mierzy test, ale do tego, co test "wydaje się mierzyć". Treść testu nie powinna oczywiście wydawać się nieodpowiednia, nieistotna.

Na przykład test mierzący "Umiejętność dodatkowo" powinien zawierać tylko elementy dodane. Kiedy przejdziemy przez przedmioty i czujemy, że wszystkie przedmioty wydają się mierzyć dodatkowo umiejętność, to można powiedzieć, że test jest walidowany przez twarz.

Chociaż nie jest to skuteczna metoda oceny ważności testu i jako taka nie jest zwykle używana w dalszym ciągu, może być wykorzystana jako pierwszy krok w walidacji testu. Po sprawdzeniu poprawności testu możemy przystąpić do dalszego obliczania współczynnika ważności.

Co więcej, ta metoda pomaga producentowi testowemu w poprawianiu elementów testowych w celu zgodnym z przeznaczeniem. Kiedy test ma być wykonany szybko lub gdy istnieje pilna potrzeba testu i nie ma czasu ani zakresu, aby ustalić ważność innymi skutecznymi metodami, można określić ważność twarzy.

Ten rodzaj ważności nie jest odpowiedni, ponieważ działa na poziomie twarzy i dlatego może być stosowany jako ostateczność.

Wpisz # 2. Ważność treści:

Treść Ważność proces dopasowywania elementów testowych do celów instruktażowych.

Ważność treści jest najważniejszym kryterium przydatności testu, w szczególności testu osiągnięć. Nazywa się go również Racjonalną Ważnością lub Ważnością Logiczną lub Ważnością lub Ważnością Wewnętrzną lub Istotną Ważnością.

Ważność treści odnosi się do stopnia lub zakresu, w jakim test składa się z elementów reprezentujących zachowania, które testujący chce zmierzyć. Zakres, w jakim elementy testu są prawdziwe, reprezentatywne dla całej treści i celów nauczania, nazywany jest trafnością treści testu.

Ważność treści jest szacowana poprzez ocenę trafności pozycji testowych; tzn. przedmioty testowe muszą należycie obejmować całą zawartość i obszary behawioralne mierzonej cechy. Daje to pojęcie o przedmiocie lub zmianie zachowania.

W ten sposób ważność treści odnosi się do zakresu, w jakim test zawiera elementy reprezentujące zachowanie, które będziemy mierzyć. Elementy testu powinny zawierać wszystkie istotne cechy całego obszaru treści i celów we właściwej proporcji.

Przed skonstruowaniem testu, twórca testu przygotowuje dwukierunkowy spis treści i celów, popularnie zwany "Tabelą specyfikacji".

Załóżmy, że przygotowany jest test osiągnięć z matematyki. Musi zawierać elementy z algebry, arytmetyki, geometrii, menuracji i trygonometrii, a ponadto przedmioty muszą mierzyć różne cele behawioralne, takie jak wiedza, zrozumienie, umiejętności, zastosowanie itd. Konieczne jest zatem nadanie odpowiedniej wagi poszczególnym obszarom treści i celom.

Przykład "tabeli specyfikacji" w matematyce przedstawiono w poniższej tabeli:

Tabela odzwierciedla próbkę mierzonych zadań uczenia się. Im bliżej badane elementy odpowiadają określonej próbce, tym większa jest możliwość zadowalającej ważności treści. Dlatego pożądane jest, aby przedmioty w teście były sprawdzane przez zespół ekspertów. Powinni sprawdzić, czy rozmieszczenie różnych elementów w komórkach tabeli jest właściwe i czy wszystkie komórki tabeli mają odpowiednią liczbę elementów.

Adekwatność należy oceniać w kategoriach wagi przypisanej różnym tabelom według treści według zespołu ekspertów, którzy opracowali program nauczania.

Kilka ogólnych punktów dotyczących zapewnienia ważności treści podano poniżej:

1. Test powinien służyć wymaganemu poziomowi studentów, ani powyżej, ani poniżej ich poziomu.

2. Język powinien być do poziomu uczniów.

3. Wszystko, czego nie ma w programie nauczania, nie powinno być włączane do przedmiotów testowych.

4. Każdej części programu należy nadać odpowiednią wagę. Więcej przedmiotów powinno być wybranych z ważniejszych części programu nauczania.

Ograniczenia:

1. Waga, jaką należy nadać różnym częściom treści, jest subiektywna.

2. Trudno jest skonstruować idealny test obiektywny.

3. Ważność treści nie jest wystarczająca ani adekwatna do testów Inteligencji, Osiągnięć, Postawy i do pewnego stopnia testów Osobowości.

4. Waga podawana przy różnych zmianach zachowania nie jest obiektywna.

Wpisz # 3. Predictive Validity:

Przewidywalność Ważność, w jakim test przewiduje przyszłe wyniki uczniów.

Ważność predykcyjna dotyczy predyktywności testu. Wskazuje skuteczność testu w prognozowaniu lub prognozowaniu przyszłych wyników w określonym obszarze. Użytkownik testowy chce przewidzieć przyszłe wyniki danej osoby. Wyniki testów mogą być wykorzystywane do przewidywania przyszłego zachowania lub wydajności i dlatego są określane jako predykcyjne.

W celu znalezienia trafności prognostycznej tester koreluje wyniki testu z kolejnym osiągnięciem testee'a, technicznie znanym jako "kryterium". Kryterium jest niezależną, zewnętrzną i bezpośrednią miarą tego, co test ma przewidzieć lub zmierzyć. W związku z tym jest również znany jako "Ważność kryterialna".

Wartość predykcyjna lub empiryczna została zdefiniowana przez Curetona (1965) jako oszacowanie współczynnika korelacji między wynikami testu a prawdziwym kryterium.

Przykład może lepiej wyjaśnić tę koncepcję.

Przykład:

Medyczny test wstępny jest skonstruowany i podawany wybranemu kandydatowi do udziału w kursach MBBS. Na podstawie wyników uzyskanych przez kandydatów na tym teście przyjmujemy kandydatów.

Po ukończeniu kursu pojawiają się na ostatnim egzaminie MBBS. Punktem końcowym egzaminu MBBS jest kryterium. Wyniki testu wstępnego i egzaminu końcowego (kryterium) są skorelowane. Wysoka korelacja oznacza wysoką predykcyjną trafność.

Podobnych przykładów, takich jak inne testy rekrutacyjne lub testy wstępne w rolnictwie, inżynierii, bankowości, kolejnictwie itp. Można tu przytoczyć, które muszą mieć wysoką predykcyjną trafność.

Oznacza to, że testy stosowane do rekrutacji, klasyfikacji i egzaminu wstępnego muszą mieć wysoką predykcyjną trafność. Ten rodzaj ważności jest czasami określany jako "Empiryczna poprawność" lub "Statystyczna trafność", ponieważ nasza ocena jest przede wszystkim empiryczna i statystyczna.

Ograniczenie:

Jeśli otrzymamy odpowiednie kryterium-miarę, z którą nasze wyniki badań mają być skorelowane, możemy określić predyktywność testu. Ale bardzo trudno jest uzyskać dobre kryterium. Co więcej, możemy nie uzyskać miar kryterium dla wszystkich rodzajów testów psychologicznych.

Wpisz # 4. Ważność współbieżna:

Współbieżność Ważność korelująca wyniki testu z innym zestawem wyników kryteriów.

Ważność współbieżna odnosi się do stopnia, w jakim wyniki testu odpowiadają już ustalonej lub zaakceptowanej wydajności, znanej jako kryterium. Aby poznać ważność nowo skonstruowanego testu, jest on skorelowany lub porównany z niektórymi dostępnymi informacjami.

W ten sposób test jest walidowany w odniesieniu do niektórych jednocześnie dostępnych informacji. Wyniki uzyskane z nowo skonstruowanego testu są skorelowane z wcześniej ustaloną wydajnością testu. Załóżmy, że przygotowaliśmy test inteligencji.

Zarządzamy nim dla grupy uczniów. Test Stanford-Binet jest również podawany do tej samej grupy. Teraz wyniki testów wykonane na nowo skonstruowanych testach i wynikach testów przeprowadzonych przez uczniów w teście inteligencji Stanford-Binet są skorelowane. Jeśli współczynnik korelacji jest wysoki, nasz test inteligencji ma wysoką współbieżność.

Słownikowe znaczenie terminu "współbieżny" to "istniejący" lub "wykonany w tym samym czasie". W związku z tym termin "ważność współbieżna" jest używany do wskazania procesu walidacji nowego testu poprzez skorelowanie jego wyników z pewnym istniejącym lub dostępnym źródłem informacji (kryterium), który mógł zostać uzyskany krótko przed lub wkrótce po wydaniu nowego testu.

Aby potwierdzić równoczesną ważność świeżo skonstruowanego testu osiągnięć, jego wyniki są skorelowane z punktacją uzyskaną przez tych samych studentów podczas ostatniego badania pierwszego lub końcowego terminalu. W ten sposób test jest walidowany w odniesieniu do niektórych jednocześnie dostępnych informacji. Aby uzyskać kryterium kryterium, nie musimy czekać długo.

Ważność predyktywna różni się od trafności współbieżnej w tym sensie, że w poprzedniej ważności czekamy na przyszłość, aby uzyskać miarę kryterium. Ale z łatwością równoczesnej ważności nie musimy czekać na dłuższe przerwy.

Termin "współbieżny" oznacza tutaj następujące cechy:

1. Dwa testy - ten, którego ważność jest badana, a którego ważność jest sprawdzona - mają obejmować ten sam obszar treści na danym poziomie i tym samym celu;

2. Populacja dla obu testów pozostaje taka sama, a dwa testy są przeprowadzane w niemal podobnych środowiskach; i

3. Dane dotyczące osiągów obu testów można uzyskać prawie jednocześnie.

Ten rodzaj ważności jest również znany jako "Ważność zewnętrzna" lub "Ważność funkcjonalna". Ważność równoczesna jest istotna dla testów używanych do diagnozy, a nie dla przewidywania przyszłego sukcesu.

Wpisz # 5. Zbuduj ważność:

Stwórz Ważność, w jakim stopniu można powiedzieć, że test mierzy teoretyczną konstrukcję lub zmienną psychologiczną.

Konstrukcja jest głównie psychologiczna. Zwykle odnosi się do cechy lub procesu mentalnego. Walidacja konstrukcji to proces określania stopnia, w jakim określony test mierzy konstrukcje psychologiczne, które testujący zamierza zmierzyć.

Wskazuje, w jakim stopniu test mierzy abstrakcyjne atrybuty lub cechy, które nie są zdefiniowane operacyjnie.

Gronlund i Linn twierdzą, że "weryfikacja konstruktów może być zdefiniowana jako proces określania zakresu, w jakim wyniki testu mogą być interpretowane pod kątem jednego lub więcej konstruktów psychologicznych".

Ebel i Frisbie opisują: "Walidacja konstrukcji jest procesem zbierania dowodów na poparcie twierdzenia, że ​​dany test rzeczywiście mierzy psychologiczny konstrukt, który testerzy zamierzali zmierzyć."

Trafność konstrukcji jest również znana jako "Ważność psychologiczna" lub "Ważność funkcji" lub "Ważność logiczna". Stwierdzenie trafności oznacza, że ​​wyniki testu są badane pod kątem konstruktu. Bada konstrukt lub cechy psychologiczne, które mierzy test.

Zakres, w jakim test mierzy cechy osobowości lub procesy mentalne zdefiniowane przez testującego jest znany jako trafność konstrukcji testu.

Podczas konstruowania testów na inteligencję, postawę, zdolności matematyczne, krytyczne myślenie, umiejętności uczenia się, lęk, logiczne rozumowanie, czytanie ze zrozumieniem, itp., Musimy przejść do trafności konstruktywnej. Weźmy na przykład "test szczerości".

Przed skonstruowaniem tego typu testów testujący musi skonfrontować się z pytaniami:

1. Jaka powinna być definicja terminu szczerość?

2. Jakiego rodzaju zachowania można oczekiwać od osoby, która jest szczera?

3. Jakiego rodzaju zachowanie odróżnia szczerość od nieszczerości?

Każdy konstrukt ma podstawową teorię, którą można zastosować do opisu i przewidywania zachowania ucznia.

Gronlund (1981) sugeruje następujące trzy etapy określania ważności konstruktu:

(i) Zidentyfikować konstrukty, które zakładają wykonanie testu.

(ii) Wyprowadzić hipotezy dotyczące wydajności testu z teorii leżącej u podstaw każdego konstruktu.

(iii) Weryfikuj hipotezy metodami logicznymi i empirycznymi.

Należy zauważyć, że ważność konstrukcji jest wnioskowa. Jest stosowany przede wszystkim wtedy, gdy inne rodzaje ważności są niewystarczające do wskazania ważności testu. Istotność konstruktywna jest zwykle związana z takimi nawykami uczenia się, uznaniem, uczciwością, stabilnością emocjonalną, współczuciem itp.

Typ # 6. Factorial Validity:

Factorial Validity stopień korelacji różnych czynników z całym testem.

Ważność czynnikowa jest określana za pomocą techniki statystycznej znanej jako analiza czynnikowa. Wykorzystuje metody wyjaśniania współzależności w celu identyfikacji czynników (które mogą być zwerbalizowane jako umiejętności) stanowiących test.

Innymi słowy, metody oceny współzależności i inne metody statystyczne są wykorzystywane do oszacowania trafności czynnikowej. Korelacja testu z każdym czynnikiem jest obliczana w celu określenia wagi przypisanej przez każdy taki czynnik do całkowitej wydajności testu.

To mówi nam o obciążeniach czynnikowych. Ta zależność różnych czynników z całym testem nazywana jest siłą czynnikową. Guilford (1950) zasugerował, że ważność czynnikowa jest najjaśniejszym opisem tego, co test ma mierzyć i za pomocą wszelkich środków, powinno mieć pierwszeństwo przed innymi typami ważności.