Testy psychologiczne w przemyśle: cechy, typy i normy

Samo złożenie partii pytań nie daje testu psychologicznego. Test najlepiej zdefiniować jako pomiar znormalizowanej próbki ludzkiego zachowania. Jako taki musi spełniać pewne podstawowe wymagania. Po pierwsze, próba zachowania powinna być zarówno wystarczająco duża, jak i reprezentatywna dla klasy zachowania, które mierzymy, aby umożliwić nam generalizację i przewidywanie wyników testu.

Po drugie, wymagając standaryzacji testu, mamy na myśli, że seria pytań lub zadań powinna być jednolicie podawana, gdy przedmioty poddawane są testowi. Wreszcie, wszystkie testy psychologiczne muszą mieć charakterystykę wstępną ważności, niezawodności i norm.

Zrzucenie serii pytań niezależnie od tego, czy dotyczą zagadnień psychologicznych, nie podnosi ich do poziomu testów psychologicznych. Na przykład wiele gazet i popularnych książek odmiany 88 gier towarzyskich przedstawia serię pytań; osoba otrzymuje odpowiedzi i ocenia siebie jako "doskonałą", "dobrą", "złą" lub "okropną". Nie są to testy psychologiczne; to tylko kilka pytań.

Oczywiście, dana osoba często ma przytłaczającą ciekawość, aby dowiedzieć się czegoś potajemnie, a więc plan samokontroli jest bardzo popularny. Tematyka tych testów zwykle ma szeroki urok. Na przykład kolumna może poprosić Cię o określenie, czy jesteś wybitnym mężem, odpowiadając na kilka pytań. Osoba może mieć niezbadaną mądrość, ale jedyny sposób, w jaki może rozwinąć test mierzący takie cechy, to mieć szereg pytań, na które odpowiedzi odpowiedzieli w pewnym sensie mężowie sukcesu (kimkolwiek są) iw znacznie inny sposób - nieudane. mężowie.

Normy testowe:

Temat norm testowych ma duże znaczenie i wymaga dodatkowych wyjaśnień. Normy powinny być rozwijane jako źródło odniesienia we wszystkich testach stosowanych w selekcji. Norma jest standardem odniesienia; umożliwia zrozumienie znaczenia wyniku testu. W zależności od testu, surowy wynik może być raportowany na różne sposoby: Łączny czas na zaliczenie testu, liczba poprawnych elementów lub liczba wybranych elementów to kilka z surowych wyników uzyskanych podczas testów.

W rzeczywistości, surowy wynik na testach psychologicznych jest zwykle wartością bez znaczenia. Na przykład w jednym teście wynik 240 sekund może być słaby, podczas gdy w innym teście wynik 75 sekund może być wyjątkowy. Problem jest jeszcze bardziej skomplikowany, gdy wynik 180 sekund musi być porównany z wynikiem 95 punktów. Bez użycia normy takie porównania byłyby niemożliwe; w najlepszym przypadku przypominałyby próbę porównania jabłek i brzoskwiń.

Dwoma najszerzej stosowanymi systemami norm są percentyle i standardowe wyniki. Oba środki pośrednio dostarczają informacji o wynikach testów osób w stosunku do znanej populacji. Pokazują także względną pozycję jednej osoby w grupie do grupy jako całości.

W teście mierzącym zdolność stenograficzną surowy wynik jednostki może wynosić 105 słów na minutę z jednym błędem w transkrypcji. O ile nie mieliśmy informacji o zakresie prędkości opartym na wielu ludziach, nie moglibyśmy wiedzieć, czy ta prędkość była dobra czy słaba. Jeśli jednak ten test zostanie podany 155 zatrudnionym stenografom, a wynik tej osoby umieścił ją w 90. percentylu, bylibyśmy w stanie oszacować jej zdolność do stenografowania jako "wyjątkowego", ponieważ przekracza 9 na 10 krótka prędkość.

Jeśli ta sama osoba pisze z prędkością 45 słów na minutę, a wynik ten "jest równy 20 percentylowi, moglibyśmy wywnioskować, że 8 na 10 zatrudnionych stenotypistów jest szybszych maszynistek. W rzeczywistości można porównać stenografię i szybkość pisania. Na podstawie dostępnych norm możemy bezpośrednio porównać wyniki tej dziewczyny z tymi dwoma testami, a nasze wnioski, że jest bardzo dobra w przyjmowaniu dyktanda, ale kiepska w pisaniu jest uzasadniona. To, czy zostanie zatrudniona, zależy od potrzeb danej pracy; najprawdopodobniej będzie musiała poprawić szybkość pisania, zanim będzie można złożyć ofertę pracy.

Dla niektórych zadań biurowych bardzo ważna jest szybkość, ale w innych ważniejsza jest dokładność. Na przykład prędkość, a nie dokładność mogą być poszukiwane dla adresowania okólników. Z drugiej strony niezwykle ważna byłaby konieczność złożenia ważnych dokumentów. Czasami potrzebne są oddzielne normy dotyczące szybkości i dokładności, a także normy oparte na kombinacji dwóch miar.

Przy ustanawianiu norm powinny być dostępne szczegółowe informacje nie tylko na temat wielkości mierzonej grupy, ale także na temat takich faktów jak poziom wiekowy, czy grupa jest zatrudniona zarobkowo, czy jest to populacja uczelni i czy składa się ona z normalne niewybrane próbki.

Na przykład osoba, która testuje w 70. percentylu normalnej populacji test inteligencji, może być uważana za osobę o ponadprzeciętnej inteligencji. Jednak jego prawdopodobny sukces w szkole wyższej lub w szkole wyższej byłby wątpliwy. Innymi słowy, norma ma sens tylko wtedy, gdy znana jest charakterystyka populacji, na której jest oparta.

Rodzaje testów:

Testy psychologiczne można podzielić na różne grupy, w zależności od konkretnego celu systemu klasyfikacji. Zanim przejdziemy dalej, warto rozważyć niektóre z tych systemów klasyfikacji.

Typ mierzonego zachowania:

Prawdopodobnie najczęściej stosowany system klasyfikacji opiera się na typie zachowania, które testy mają mierzyć. Tak więc znajdziemy testy oznaczone jako testy inteligencji, testy osobowości, testy zainteresowań, testy wizyjne, testy muzyczne, testy plastyczne, testy mechaniczne, testy słowne itp., Gdzie każda grupa jest dość specyficzna dla zachowania.

Testy osiągnięć i umiejętności:

Bardzo często autorzy będą rozróżniać testy umiejętności i testy osiągnięć. Ta pierwsza jest podobno miarą potencjału danej osoby na danym obszarze, podczas gdy ta ostatnia jest miarą bieżącej umiejętności lub zdolności danej osoby w momencie testowania. Ponieważ ten sam test często może być uznany zarówno za test osiągnięć, jak i test umiejętności w zależności od zastosowania, ten system klasyfikacji jest często nieostry.

Dzięki wielu testom można:

(1) Zmierz ilość obecnej umiejętności, i

(2) Użyj aktualnego wyniku, aby przewidzieć przyszłe wyniki.

Testy papierowe i ołówkowe oraz testy wydajności:

Wiele testów dotyczy wersji papier-ołówek:

Osoba testowana otrzymuje po prostu papier testowy lub drukowaną książeczkę zawierającą pytania testowe, a jego odpowiedzi zapisuje w sposób pisemny w arkuszu odpowiedzi, który zwykle jest dostarczany. Wiele innych testów nie wymaga jednak pisemnej odpowiedzi - raczej dotyczą one pewnego rodzaju czynności manipulacyjnych, takich jak obsługa kołków lub bloków lub montaż mechanicznych obiektów. Te ostatnie testy są określane jako testy wydajności.

Próby prędkości i mocy:

Niektóre testy są tak skonstruowane, że każdy element jest bardzo łatwy - zadaniem jest ukończenie jak największej liczby przedmiotów w krótkim czasie. Kiedy działanie testu opiera się głównie na prędkości, z jaką działa, test jest określany jako test prędkości. Drugą skrajnością byłby test, w którym przedmioty byłyby trudne, a dana osoba miała tyle czasu, ile potrzeba, aby ukończyć przedmioty. W takich testach punktacja osoby opiera się wyłącznie na jego zdolności do prawidłowego odpowiadania na pytania, bez względu na to, jak długo (w granicach rozsądku, oczywiście) to zajmuje. Ten rodzaj testu nazywa się testem mocy.

Testy indywidualne i grupowe:

Istnieje wiele testów, które są zaprojektowane do indywidualnego podawania; to znaczy, nie mogą być wydawane jednocześnie przez dwie osoby lub więcej przez jednego egzaminatora. Przykładem może być Skala Inteligencji Stanforda-Bineta. Bardzo często do oceny klinicznej stosuje się indywidualne testy. Testy grupowe to te, które mogą być podejmowane przez wiele osób w tym samym czasie. W przypadku testów przemysłowych zazwyczaj preferowane są testy grupowe, ponieważ są one bardziej ekonomiczne w stosowaniu.

Testy językowe i pozajęzykowe:

Czasami ważne jest rozróżnienie między testami wymagającymi znajomości konkretnego języka (np. Angielskiego) w celu zrozumienia instrukcji testu lub samych elementów testowych. Wszystkie takie testy są nazywane testami językowymi, ponieważ ich wydajność zależy częściowo od zdolności językowej testowanego, niezależnie od tego, na jaką zdolność ma być mierzony test.

W niektórych przypadkach jest pożądane lub konieczne, aby uniknąć błędu językowego testu. Na przykład, aby przetestować zdolność mechaniczną osób, które są analfabetami przy użyciu testu, który implikował pisemne instrukcje, byłoby całkiem niewłaściwe. Aby rozwiązać ten problem, przeprowadzono testy w niektórych obszarach, które są testami bez języka. Nie wymagają umiejętności językowych ze strony testowanego. Są one określane jako testy pozajęzykowe.

Testy a inne urządzenia do selekcji:

W tym artykule naszą uwagę poświęcamy wyłącznie badaniu testów psychologicznych. Jednak testy nie są jedynym narzędziem predykcyjnym stosowanym przez psychologa w sytuacji selekcji. Inne standardowe pomoce selekcyjne to listy polecające, puste pola aplikacyjne i wywiady. Kompleksowe programy selekcji wykorzystają je oprócz testów jako część całego procesu selekcji.

Studium kontrowersji:

Być może żaden pojedynczy test lepiej nie ilustruje kontrowersyjnych problemów związanych z testami przemysłowymi niż analiza aktywności. Krótki przegląd kontrowersji wokół tego urządzenia oceny powinien służyć zilustrowaniu niektórych z tych trudności. Locke i Hulin (1962) dokonali kompleksowego przeglądu wykorzystania tego testu jako przemysłowego urządzenia do selekcji. Ocenili łącznie 18 badań, z których 17 miało związek z wartością AVA w przemyśle. Większość z tych badań dotyczyła jednak typu współbieżności, w którym AVA została przyznana obecnym pracownikom.

Locke i Hulin poinformowali, że istnieją dowody na to, że można rozróżnić:

1. Menedżerowie i pracownicy produkcyjni

2. Kierownictwo i mieszana grupa pracowników

3. Siedem różnych grup zawodowych, od operatorów maszyn po prezesów firm

4. Dobrzy i słabi pracownicy w kilku różnych zawodach

Jednak we wszystkich obecnych badaniach pracowników uzyskano ważność poprzez opracowanie klucza opartego na tej próbce, a następnie zastosowanie klucza z powrotem do próbki, na której został opracowany klucz - procedura znana jako walidacja. Rzadko kiedy podejmowano jakąkolwiek próbę przeprowadzenia niezbędnego procesu wzajemnej walidacji na innej grupie obecnych pracowników. Locke i Hulin uważają, że zbyt często autorzy badań AVA przekraczali przyjęte granice w omawianiu wartości ich wyników, często pozostawiając czytelnika z wrażeniem, że ich ważność świadczy o predyktywnej sile testu.

Tylko w jednym z badań, w opinii Locke'a i Hulina, zastosowano procedurę prawdziwej oceny trafności, w której uprzednio opracowany klucz scoringowy został podany przed zatrudnieniem, a następnie sprawdzony pod kątem ważności. W tym przypadku nie uzyskano poprawności.

Wydaje się, że decyzja, że AVA ma wartość prognostyczną, musi zostać co najmniej odroczona, zanim dostępne będą bardziej istotne dowody. Chodzi tu jednak nie tylko o rzeczywistą wartość testu, ale także o rozbieżność pomiędzy twierdzeniami dotyczącymi jego wartości a faktycznymi ustaleniami empirycznymi. Locke i Hulin nie są jedynymi osobami, które podejmują działania AVA w oparciu o błędne przedstawienie wyników badań. Dunnette i Kirchner (1962) zdecydowanie protestowali przeciwko "kolorowemu" raportowaniu danych AVA przez Merandę i Clarke'a (1959).

Bennett, w swojej recenzji AVA for the Euro "The Fifth Mental Measurement Yearbook" (1959), jest również dość niepochlebny, stwierdzając: "Mumbo-jumbo rzekomo wyrafinowanych procedur statystycznych nie może zastąpić dowiedzionej słuszności." Zainteresowany czytelnik może cieszyć się Artykuł Dunnette'a i Kirchnera (1962) oraz odpowiadająca mu odpowiedź Merandy i Clarke'a w tym samym numerze Journal of Applied Psychology.

Przegląd testów osobowości w przemyśle:

Ghiselli i Barthol (1953) dokonali przeglądu 113 badań dotyczących ważności inwentaryzacji osobowości w selekcji pracowników. Ich wyniki zestawiono w tabeli 4.3. Stwierdzają, że w pewnych okolicznościach wyniki w zakresie inwentaryzacji osobowości są lepiej skorelowane z biegłą znajomością zawodów o większej różnorodności, niż można się było spodziewać. Autorzy uznają zarówno potencjalną wartość testów osobowości w przemyśle, jak i potrzebę znacznego zwiększenia i poprawy badań i rozwoju.