Problemy i procedury związane z wyborem pracy

Przed przystąpieniem do badania podstawowych modeli wyboru, które są dostępne dla psychologa, konieczne jest zajęcie się krótkim spojrzeniem na ogólny model przewidywania wielokrotnego. Model ten jest zwykle określany jako model regresji wielokrotnej. W paradygmacie prognoz ogólnych opracowujemy linię regresji dopasowaną do zbioru punktów danych zdefiniowanych przez wyniki osób na predyktorze (oś x lub odcięta) oraz na kryterium ( oś y lub rzędna).

Rysunek 3.1 pokazuje taką sytuację. Linia regresji na rysunku 3.1 jest linią prostą i jest usytuowana w taki sposób, że suma "odstrzelonych odległości od każdego punktu do linii (biegnącej równolegle do osi y) jest tak mała, jak to tylko możliwe. Używamy najlepiej dopasowanej linii prostej, ponieważ przyjęliśmy liniową zależność między x i y.

Podstawową formułą dla linii prostej jest

y = a + bx

Gdzie y = przewidywany wynik na kryterium

a = stała wskazująca punkt, w którym linia regresji przecina oś y

b = nachylenie linii, reprezentowane przez Δy / Δx, lub zmiana y obserwowanej dla odpowiedniej zmiany w x

x = obserwowany wynik na predykatorze

W ten sposób pojawia się podstawowy model linii regresji, jak pokazano na rysunku 3.2.

Zauważ, że na rysunku 3.2 linia regresji przecina oś Y na wartości 2. Tak więc a = 2. Należy również zauważyć, że dla każdego wzrostu o 2 jednostki x występuje odpowiedni wzrost o 1 jednostkę w y. Zatem Δy / Δx = 1/2 = 0, 5 = b. Równanie regresji staje się wtedy

y = 2 + 0, 5 x

Biorąc pod uwagę dowolną wartość x, mamy linię regresji, która pozwala nam przewidzieć odpowiedni wynik, odpowiadający jej. Na przykład, jeśli x wynosi 8, to

y = 2 + 0, 5 (8)

= 2 + 4

= 6

Podsumowując: W przypadku pojedynczego predyktora oblicza się najlepiej dopasowaną linię prostą do obserwowanych punktów, gdzie termin "najlepsze dopasowanie" oznacza sumę kwadratów odchyleń obserwowanych wartości wokół linii, co stanowi minimum.

Formuły niezbędne do obliczenia stałych a i b, które definiują tę najlepiej pasującą linię, są nazywane formułami "najmniejszych kwadratów" i są następujące:

Wzór na b jest stosunkiem kowariancji między predyktorem a kryterium i całkowitą zmiennością w predyktorze. Gdy wariancja kryterium i wariancja predyktorów są równe, wówczas b = r lub nachylenie linii regresji jest równe współczynnikowi korelacji.

Dwa predyktory:

Logiczne jest założenie, że jeśli predyktor X 1 może przyczynić się do pomyślnego prognozowania wyników kryterialnych, a predyktor X 2 może również przyczynić się do pomyślnego prognozowania wyników kryterialnych, wówczas użycie obu predyktorów łącznie powinno umożliwić lepsze ogólne przewidywanie niż użycie albo predykator indywidualnie. Jednak stopień, w jakim te dwa predyktory (w połączeniu) poprawią przewidywalność, zależy od kilku czynników, z których najważniejszą jest korelacja między tymi dwoma predykatorami.

Rozważmy na przykład sytuację, w której dwa predyktory korelują zasadniczo z kryterium, ale nie korelują ze sobą w następujący sposób:

Oczywiście, dużą część dodatkowej wariancji kryterium można wyjaśnić za pomocą predyktora 2 wraz z predyktorem 1. Połączona zależność między dwoma lub większą liczbą predyktorów i kryterium jest nazywana korelacją wielokrotną i ma symbol R. Podobnie jak w przypadku r 2, wartość R "oznacza całkowitą ilość wariancji kryterium, którą można wyjaśnić za pomocą kilku predyktorów. Gdy predyktory 1 i 2 nie są ze sobą skorelowane, współczynnik kwadratowej korelacji wielokrotnej można wykazać jako funkcję addytywną indywidualnych kwadratowych współczynników korelacji, lub

R 2 c . 12 = r 2 1c + r 2 2c (3.1)

Tak więc, gdy (wzajemna korelacja predyktorów) wynosi zero, to kwadratowa wielokrotność ważności jest sumą kwadratów indywidualnych ważności.

Kiedy dwa predyktory są skorelowane ze sobą, rzeczy stają się nieco bardziej złożone. Rozważmy sytuację (jak na poniższym diagramie), gdzie każdy predykator ma istotną indywidualną ważność, ale gdzie r 12 jest również dość duży.

Ze względu na wzajemną korelację między tymi predyktorami, diagram pokazuje, że ilość nakładania się predyktora 2 i kryterium można podzielić na dwie części: ten obszar jest unikalny dla predyktora 2 i ten obszar współdzielony z predyktorem 1. Tak więc, wykorzystanie drugi predyktor w tej sytuacji pozwala nam uwzględnić większą wariancję kryterium, niż byłoby to możliwe przy użyciu samego predyktora 1, ale cała wariancja kryterium przewidziana przez 2 nie jest nową wariancją. Można zatem określić ogólną zasadę dotyczącą wielu predyktorów.

Wszystkie inne rzeczy są sobie równe, im wyższa korelacja między predyktorami, tym mniej ogólna prognoza zostanie poprawiona przez użycie obu predyktorów łącznie. Skrajnym przypadkiem byłaby oczywiście sytuacja, w której czynniki predykcyjne byłyby doskonale skorelowane i nie uwzględnilibyśmy dodatkowej wariancji kryterium przez dodanie predyktora 2 do naszej baterii selekcyjnej.

W przypadku dwóch predyktorów, które są ze sobą skorelowane, możemy wyrazić R 2 jako funkcję oddzielnych ważności i wielkości wzajemnej korelacji między predyktorami o wzorze 2

R 2 c . 12 = r 2 1c + r 2 2c - 2r 12 r 1c r 2c / 1 - r 2 12 (3.2)

zauważ, że jeśli r 12 = 0, wówczas formuła 3.2 redukuje się do

R 2 c . 12 = r 2 1c + r 2 2c

który jest formułą 3.1.

Bardziej jednoznaczną ilustrację wpływu korelacji predykcyjnej na wielkość współczynników korelacji wielokrotnej można uzyskać z tabeli 3.1, gdzie podano przykłady wartości R i R2 dla par predyktorów mających ważność 0, 30, 0, 50 i 0, 70 w hipotetycznych warunkach wzajemnej korelacji 0, 00, 0, 30 i 0, 60. Rysunek 3.3 pokazuje ogólny trend wykorzystujący dane podane w tabeli 3.1. Morał dla psychologa jest dość oczywisty - unikaj używania predyktorów, które mogą być wysoce powiązane ze sobą.

Równania prognozowania:

Równanie predykcji w sytuacji dwóch predyktorów jest rozszerzeniem modelu jednego predyktora. Ogólna postać równania jest

y = a + b 1 x 1 + b 2 x 2 (3.3)

Jest to równanie dla płaszczyzny zamiast linii prostej. Dla czytelnika zaznajomionego z geometrią, rysunek 3.4 przedstawia trójwymiarowy rysunek zależności między zmiennymi x 1, x 2 i y odpowiadającymi równaniu 3.3. Dostępne są formuły, które pozwalają na obliczenie stałych a, b i które będą skutkować najlepiej dopasowaną płaszczyzną regresji. Po ustaleniu tych stałych, uzyskane równanie może następnie zostać wykorzystane do określenia prognoz wydajności dla nowych kandydatów do pracy, biorąc pod uwagę ich wyniki na oddzielnych predyktorach.

Aby to zilustrować, załóżmy, że dane są dostępne dla 100 mężczyzn zatrudnionych do pracy X w danym miesiącu, które obejmują wyniki w dwóch testach, a także dane kryterialne po upływie sześciu miesięcy. Dane te można analizować w celu określenia wartości a, b 1 i bi, które najlepiej opisują zależności między zmiennymi.

Załóżmy, że następujące równanie było wynikiem końcowym:

y = 2 + 0, 5 x 1 + 0, 9 x 2 (3.4)

To równanie mówi, że najbardziej prawdopodobny wynik kryterium dla każdego nowego wypożyczenia będzie równy połowie jego wyniku w teście 1 plus dziewięć dziesiątych jego wyniku w teście 2 plus dwa. Tak więc, jeśli nowy kandydat uzyska 20 punktów w teście 1 i 30 w teście 2, jego przewidywane wyniki kryterium pod koniec sześciu miesięcy od czasu najmu będą

= 2 + 0, 5 (20) + 0, 9 (30)

= 2-t-10 + 27

= 39

Rozszerzenie modelu dwóch predyktorów na model predyktora k, gdzie k to pewna duża liczba potencjalnych predykcji sukcesu zawodowego, nie jest zbyt trudne koncepcyjnie. Nasz model rozszerza się do formy

y = a + b 1 x 1 + b 2 x 2 + b 3 x 3 + ... + b k x k (3.5)

Jednak procedury obliczeniowe do obliczania wartości najmniejszych kwadratów wszystkich stałych w takim równaniu stają się dość złożone, chyba że dostępne są urządzenia komputerowe. Czytelnik jest również ostrzegany, aby pamiętać, że we wszystkich poprzednich dyskusjach istniało ukryte, założenie świata liniowego, tj. Wszystkie relacje między parami zmiennych są liniowe. Możliwe jest zmodyfikowanie modelu regresji wielokrotnej, aby uniknąć tego założenia, ale wykracza to poza zakres tej książki.

Moderatorzy:

Jednym z ważniejszych pojęć w teorii wyboru i umieszczania jest koncepcja zmiennej moderatora. Czasami określana jako zmienna kontrolująca populację, zmienna moderatora może być postrzegana jako dowolna zmienna, która, gdy zmienia się systematycznie, ma wpływ na wielkość związku między dwiema lub większą liczbą innych zmiennych.

Być może hipotetyczny przykład (rysunek 3.15) tego, w jaki sposób moderator mógłby funkcjonować, posłuży zilustrowaniu jego wpływu na proces selekcji. Górny wykres punktowy ilustruje ogólną ważność wynoszącą 0, 50 między predyktorem a kryterium. Jednak "populacja" reprezentowana w scatter-plot to taka, która obejmuje obie płci, a mianowicie, zarówno mężczyźni, jak i kobiety są zgrupowani w celu ustalenia ważności. Nawet przypadkowa inspekcja górnego wykresu punktowego wskazuje (jeśli mężczyźni i kobiety są inaczej zakodowane, jak to tutaj zrobiono), że wzór wyników obserwowany dla mężczyzn różni się od tego obserwowanego dla kobiet.

Aby uzyskać jaśniejszy obraz tego, jak się różnią, dwa niższe wykresy rozproszenia na Rysunku 3.15 pokazują relacje między kryterium predyktora a kryterium osobno dla mężczyzn i kobiet. Teraz różnica jest uderzająca. Dla mężczyzn obserwujemy wysoki pozytywny związek - taki, który daje wartość 0, 80. Z drugiej strony, dla kobiet, widzimy, że praktycznie nie ma związku między predyktorem a kryterium. Ważność dla kobiet wynosi 0, 05.

Zmienna moderatora w powyższym przykładzie jest oczywiście zmienną płci. Na zależność między predyktorem a kryterium drastycznie wpływa zmiana moderatora. Pytanie "jaka jest trafność mojego predyktora" staje się wyraźnie bardziej złożone. To, co początkowo wydawało się umiarkowanym szacunkiem, zmieniło się teraz w dwie zupełnie odrębne i ważne wartości - jedną bardzo wysoką i jedną bardzo niską.

Jedna nazwa tych ostatnich ważności może być warunkowymi wartościami ważności, to jest trafnością predyktora, biorąc pod uwagę, że populacja składa się z kobiet lub biorąc pod uwagę, że populacja składa się z mężczyzn. Interesującą cechą zmiennych moderatora jest to, że moderator nie musi mieć żadnego bezpośredniego związku z predyktorem lub zmienną kryterium (tj. R ym i r im = 0).

Przykłady moderatorów:

Aktualne przykłady moderatorów zostały znalezione w wielu badaniach. Vroom (1960) znalazł na przykład dość wyraźne efekty moderatora, wykorzystując stopień motywacji menedżerów i nadzorców pierwszej linii jako zmienną moderującą. Wszyscy badani mężczyźni byli pracownikami w fabryce w Chicago lub w Nowym Jorku, firmy świadczącej usługi dostawy krajowej, która specjalizowała się w dostarczaniu małych paczek i paczek z działów i innych sklepów detalicznych do prywatnych rezydencji. Dane z badania, które najlepiej ilustrują koncepcję moderatora, podano w tabeli 3.4.

Wszyscy przełożeni zostali podzieleni na trzy grupy w oparciu o oszacowany stopień motywacji za pomocą złożonego z kilku wskaźników motywacyjnych uzyskanych w badaniu. Walidacje dla testu zdolności rozumowania niewerbalnego uzyskano dla każdego z czterech różnych typów ocen nadzorczych tych mężczyzn.

Dokonano tego osobno na każdym poziomie motywacji. Jak pokazuje tabela 3.4, test był prawdopodobnie słusznym predyktorem tego, jak wysoki mężczyzna byłby oceniany przez swojego przełożonego, gdyby rozważano tylko mężczyzn o wysokiej motywacji. Jeśli systematycznie zmieniamy motywację, przechodząc do grup o jedynie umiarkowanych lub niskich poziomach motywacji, widzimy odpowiednią systematyczną zmianę relacji między testem a kryterium. Im niższa motywacja pracownika, tym mniej prawdopo- dobieństwo czynnika predykcyjnego jest prawdą, a ważność staje się nawet ujemna dla grup o niskiej motywacji.

Inne przykłady moderatorów można znaleźć w badaniach Dunnette'a i Kirchnera (1960) oraz Ghiselli'ego i jego współpracowników (1956, I960). Praca Dunnette'a i Kirchnera została skierowana przede wszystkim na zidentyfikowanie moderatorów związanych z pracą, które grupują ludzi w miejsca pracy, które są podobne pod względem ich obowiązków, aby uzyskać maksymalne przewidywania w każdej grupie stanowisk.

Metoda Ghiselli'ego może być nazywana "bezzmiennym" systemem moderatora, ludzie są pogrupowani po prostu na podstawie tego, jak dobrze ich sukces można przewidzieć bez bezpośredniego odniesienia do dowolnej zmiennej zewnętrznej. Fredericksen i Gilbert (I960) również przeprowadzili badania nad moderatorami, aby określić stopień, w jakim efekt moderatora będzie spójny w miarę upływu czasu. Odkryli, że moderator zidentyfikowany w badaniu z 1954 roku (Fredericksen i Melville, 1954) nadal działał w obserwacji I960.

Nowoczesna i tradycyjna teoria wyboru:

Koncepcja zmiennej moderatora może najlepiej ilustruje modalny trend w selekcji i umieszczaniu nacisku. Tradycyjnie selekcja i walidacja były problemami, które uznano za najlepiej rozwiązane, po prostu ustanawiając kryterium, które wydawało się wiarygodne, oraz predyktor, który najlepiej może przewidzieć to kryterium.

Nacisk był prawie całkowicie na ustanowienie wysokiej ważności z niewielką lub żadną myślą o odkrywaniu wielu dodatkowych zmiennych, które, gdy są zróżnicowane, mogą dodawać lub odejmować od uzyskanej korelacji. Ogólną dewizą, która zbyt często była typologią metodologii selekcji, było hasło "Jeśli działa, użyj go!"

Bez wątpienia polityka ta była odpowiedzialna za zupełnie inne zmiany w psychologii przemysłowej. Po pierwsze, prawdopodobnie przyczyniło się to do stopnia, w jakim psychologowie zostali przyjęci do przemysłu. Zarządzanie jest zasadniczo zorientowane na pozytywne wyniki, co stanowi poprawiona selekcja i nie jest zbytnio związane z tym, jak jest ono osiągane.

Niestety, ta orientacja jest prawdopodobnie również odpowiedzialna za to, że ważność przewidywań nie wzrosła (w ogóle) w ciągu ostatnich 50 lat - raczej niepokojący komentarz do wysiłków psychologów zaangażowanych w ten rodzaj pracy.

W przeglądzie dużej liczby badań ważności z roku 1955 Ghiselli (1955) wskazał, że jest to naprawdę niezwykłe wydarzenie, aby uzyskać współczynnik ważności równy 0, 50 lub lepszy. Rysunek 3.16 przedstawia rozkłady częstotliwości przedstawione przez Ghiselli'ego o współczynnikach ważności o różnych wielkościach dla różnych rodzajów zadań. Zauważ, że tylko w rozkładzie ważności dla pracowników biurowych używających testów wywiadowczych jako predyktorów i mierników biegłości jako kryteriów istnieje duża liczba ważności powyżej 0, 50.

Obecne zainteresowanie moderatorami jest reprezentatywne dla szerszego i nieco bardziej wyrafinowanego podejścia do selekcji. Można to prześledzić, kiedy Toops (1948) skierował apel do psychologów, aby rozważyli możliwość, że poprzez stratyfikację ludzi (na przykład pracowników) systematycznie według zmiennych osobistych, należy być w stanie poprawić prognozy. Jego metoda klasyfikacji, którą określił jako procedurę dodawania, jest zwiastunem moderatorów.

Model wyboru Dunnette'a:

Być może obecne podejście do metodologii selekcji można najlepiej przedstawić za pomocą modelu wyboru zaproponowanego przez Dunnette'a (1963). Model ten przedstawiono na schemacie przedstawionym na rysunku 3.17 i ma on na celu wskazanie labiryntu złożoności i wzajemnych powiązań występujących w sytuacji selekcji. Model ten może być postrzegany nie tylko jako próba wskazania dynamicznej natury selekcji - stanowi również apel do psychologów o skorzystanie z tej dynamiki i wykorzystanie ich w celu uzyskania jak najlepszej przewagi w celu poprawy przewidywalności.

Prawdopodobnie można zrozumieć punkt widzenia reprezentowany przez model pod względem dokładnego opisu zastosowanego przez Dunnette'a (1963, s. 318):

Należy zauważyć, że zmodyfikowany model predykcji uwzględnia złożone interakcje, które mogą wystąpić między predyktorami i różnymi kombinacjami predykcyjnymi, różnymi grupami (lub typami) jednostek, różnymi zachowaniami w miejscu pracy i konsekwencjami tych zachowań w stosunku do celów organizacji. . Model pozwala na różną użyteczność predyktorów do przewidywania zachowań różnych podgrup osób.

Co więcej, pokazuje to, że podobne zachowania w pracy mogą być przewidywalne dzięki zupełnie innym wzorcom interakcji między grupami predyktorów i osób, a nawet, że ten sam poziom wydajności na predyktorach może prowadzić do zasadniczo różnych wzorców zachowań w pracy dla różnych osób. Wreszcie, model rozpoznaje irytującą rzeczywistość, że te same lub podobne zachowania mogą, po przejściu przez filtr sytuacyjny, prowadzić do zupełnie innych konsekwencji organizacyjnych.

Obecny trend selekcji reprezentowany przez świadomość moderatorów i model doboru Dunnette'a powinien skutkować postępem zarówno pod względem zwiększonej efektywności selekcji, jak i stopnia zrozumienia dynamiki dokładnych przewidywań.

Zmienne tłumiące:

Żadna dyskusja wyboru nie byłaby kompletna bez wspominania o zmiennych supresorowych. W pewnym sensie zmienna supresorowa jest podobna do zmiennej moderatora w tym sensie, że definiowana jest jako "zmienna, która może mieć wpływ na wielkość danego stosunku kryterium prognostycznego, nawet jeśli ma niewielki związek lub nie ma go wcale w stosunku do samej zmiennej kryterium. "

Dynamikę zmiennej supresorowej w predykcji najlepiej zrozumieć poprzez ponowne przeanalizowanie pojęcia korelacji cząstkowej i jej powiązanej miary, korelacji pół-cząstkowej. Jeśli jeden miał dwa predyktory i kryterium, które były wzajemnie skorelowane, jak pokazano tutaj, to częściowa korelacja między kryterium a predyktorem x, którym jest r 1c. 2, została zdefiniowana jako korelacja między x 1 i C po tym, jak efekty x 2 zostały częściowo usunięte z obu, więc

Załóżmy, że chcemy tylko usunąć efekty X2 z kryterium przed obliczeniem korelacji. Taka korelacja nazywana jest korelacją częściową lub częściową. Na przykład, możemy być zainteresowani korelacją między wynikami testu inteligencji (nasz predyktor x 1 ) a ostatecznym poziomem umiejętności pod koniec programu szkoleniowego typowania (kryterium) x 2 może reprezentować początkowy poziom umiejętności wszystkich pracowników pod względem szybkość pisania na klawiaturze przed podjęciem szkolenia. W związku z tym chcemy wyeliminować wpływ początkowego poziomu umiejętności na końcową wydajność przed obliczeniem ważności naszego testu inteligencji.

Nasza pół-cząstkowa korelacja staje się teraz:

Mechanizm zmiennej supresorowej jest identyczny z przedstawionym powyżej, z wyjątkiem (1) ogólnie, zmienna x 2 ma tylko niewielką (jeśli w ogóle) związek z kryterium i (2) jest zainteresowana usunięciem jej skutków z predyktora x 1 .

Ogólną sytuację można zatem przedstawić jako:

Nie można z całkowitą pewnością stwierdzić, czy korelacje częściowe czy pół-cząstkowe będą większe lub mniejsze od prostej korelacji istniejącej między zmiennymi, ponieważ na proces partycjonowania wpływa zarówno wielkość licznika, jak i mianownika. Jedyny raz tak nie jest, gdy zmienna, której dotyczy część, jest powiązana tylko z jedną z dwóch innych zmiennych, tak jak w przypadku supresora. W takiej sytuacji wpływa się następnie tylko na mianownik (wariancja jest usuwana), a wynikowa korelacja pół-cząstkowa jest większa niż prosta nie-osobnicza korelacja między zmiennymi.

Cross-Validation:

Jedną z cech większości systemów selekcji predykcyjnej jest to, że w ich rozwoju zazwyczaj wykorzystuje się zmienność przypadku, która istnieje w próbie pracowników wykorzystywanych do celów walidacji. Jest to szczególnie prawdziwe w przypadku modelu regresji wielokrotnej, ale dotyczy również procedury wielokrotnego odcinania. Ponieważ model regresji wielokrotnej ma właściwości najmniejszych kwadratów, tzn. Celowo minimalizujemy błędy w przewidywaniu naszej konkretnej próbki, jest prawdopodobne, że jeśli teraz zastosujemy nasze równanie do nowej próbki (z tej samej populacji), nie znajdziemy naszej prognozy tak wydajny jak wcześniej.

Tak więc nasza obliczona R 2 jest przeceniana, co może być przyszłością systemu prognozowania, ponieważ użycie naszego równania do celów przewidywania automatycznie zakłada zastosowanie go do nowych próbek pracowników. Oczekiwany spadek R 2 znany jest w statystykach jako problem skurczu i najlepiej można go zilustrować analizując rysunek 3.18.

Na rysunku 3.18 mamy dwie próbki osobników. Każda reprezentuje losową próbkę pochodzącą z tej samej populacji lub należącą do tej samej populacji. Na przykład próbka A może reprezentować wszystkie osoby ubiegające się o pracę w ramach zadania X w miesiącach nieparzystych, a próba B może reprezentować wszystkie osoby ubiegające się o pracę w miesiącach parzystych w danym roku.

Byłoby bardzo nietypowe, nawet w przypadku bardzo dużej liczby wnioskodawców w każdej próbie, aby dwie próbki były identyczne pod względem powierzchni rozproszonej. Ponieważ można oczekiwać, że ich wykresy rozrzutu będą się różnić z powodu błędu próbkowania, można się spodziewać, że korelacja między predyktorem a kryterium (trafność) będzie nieco się różnić, podobnie jak równanie regresji obliczone dla każdej próbki.

Załóżmy, że przyjęliśmy równanie regresji obliczone na próbce A i użyliśmy go do przewidywania wyników z próbki B. Oczywiście nie mogliśmy wykonać tak dobrej pracy w minimalizowaniu przy użyciu linii A z próbką B, jak moglibyśmy użyć linii regresji B - w końcu linia B z definicji minimalizuje Σd 2 dla tej próbki. Każda inna linia będzie więc miała większy błąd z nią związany. Zatem R2 musi być odpowiednio zredukowany.

Dostępne są formuły do ​​oszacowania wielkości skurczu, jakiego można się spodziewać podczas stosowania tego równania na nowej próbce. Jedną z takich formuł jest

R 2 8 = 1 - [(1 - R2) n-1 / n - k - 1]

Gdzie

R 2 = skrócona korelacja wielokrotna do kwadratu

R 2 = kwadrat wielokrotnej korelacji uzyskany z próbki walidacyjnej

n = liczba osób w próbie walidacyjnej

k = liczba predyktorów w równaniu regresji

Najlepiej jest jednak zweryfikować krzyżowo równanie, pobierając drugą próbkę i wypróbowując ją, aby sprawdzić, jak dobrze ona przewiduje. Jeśli wydaje się, że jest bardzo duży spadek, można zrewidować równanie (być może przez połączenie obu próbek w jednej grupie). Duży skurcz występuje najczęściej, gdy wielkość próbki jest mała i / lub liczba predyktorów jest duża w stosunku do wielkości próbki.

Mosier (1951) omówił wiele rodzajów walidacji krzyżowej, które można przeprowadzić w zależności od projektu badania i czy chodzi o uogólnienie jedynie na nową próbkę, czy też pożądane są szersze uogólnienia, zgodne z przewidywaniem równania predykcji (np., dla różnych płci, różnych kryteriów itd.). Ten pierwszy nazywa się generalizacją ważności; ta ostatnia jest przypadkiem przedłużenia ważności. Oczywiście w tym ostatnim przypadku można się spodziewać większego skurczenia, a wzór 3.9 na% dotyczy przypadków generalizacji ważności.