Prognozowanie sukcesu pracy (z diagramem i statystykami)

Przewidywanie sukcesu pracy polega na określeniu stopnia, w jakim predyktor jest powiązany z kryterium. Załóżmy na przykład, że ktoś był zainteresowany skonfigurowaniem programu selekcji, aby zatrudnić nowych pracowników. Przypuśćmy ponadto, że zdecydowano się na test umiejętności biurowych i ołówkowej jako potencjalnego predyktora wydajności zbioru dokumentów, i że wydajność powinna być określona przez oceny nadzorców. Tabela 2.3 pokazuje kilka hipotetycznych danych dla tej założonej sytuacji, dając wyniki dla dwunastu urzędników ds. Plików zarówno w teście urzędniczym, jak i miary kryterium efektywności. Rysunek 2.5 pokazuje wykres danych w tabeli 2.3.

Zauważ, że wydaje się, że istnieje systematyczny trend. Ogólnie rzecz biorąc, im wyższa jest osoba oceniona w teście pisarskim, tym wyższa zdobyła na miarę biegłości w zawodzie. Możemy zatem wywnioskować, że istnieje określona zależność między wynikami testu (predyktor) a poziomem biegłości zawodowej (kryterium). Możemy również wywnioskować, że jeśli wybieramy osoby, które osiągają wyższe wyniki w teście, jesteśmy bardziej skłonni zatrudnić ludzi, którzy będą bardziej biegli, niż gdybyśmy zatrudniali ludzi niezależnie od wyniku testu.

Ustanowienie stopnia związku:

Stopień zależności między dowolnymi dwiema zmiennymi można zdefiniować jako stopień, w jakim te dwie zmienne różnią się razem w sposób systematyczny. Bardziej technicznym określeniem tego jest stopień kowariancji istniejący między zmiennymi. Formalna miara stopnia kowariancji pomiędzy dowolnymi dwoma zestawami ocen jest dostarczana przez statystykę zwaną współczynnikiem korelacji. Kiedy dwa zestawy wyników są bardzo powiązane, mówimy, że są one silnie skorelowane. Najczęstszą miarą korelacji jest współczynnik korelacji Pearsona Momentu produktu oznaczony symbolem r.

Jako miarę zależności, r zmienia się między + 1, 00 i -1, 00. Gdy r wynosi + 1, 00, dwa zbiory punktów są pozytywnie i doskonale ze sobą powiązane. Gdy r wynosi -1.00, dwa zbiory wyników są negatywnie i doskonale ze sobą powiązane. Gdy r = 0, 00, dwa zbiory punktów nie mają w ogóle żadnego związku. Rysunek 2.6 pokazuje wykresy o różnej wielkości r.

Przy przewidywaniu sukcesu zadania znak współczynnika korelacji nie jest ważny, ale wielkość jest. Im większy bezwzględny rozmiar r, tym lepsze przewidywanie wyników kryterialnych na podstawie informacji uzyskanych z predyktora.

Aby zrozumieć racjonalne uzasadnienie korelacji, pomocne może być rozważenie obrazowego przedstawienia kowariancji i jej związku z r. Każdy zestaw ocen będzie miał pewną zmienność - w rzeczywistości, jak już widzieliśmy, liczba osób o wielu cechach jest zgodna z rozkładem normalnym z małą liczbą bardzo wysokich wyników, małą liczbą bardzo niskich wyników i najbardziej wyników występujących w środku rozkładu.

Załóżmy, że reprezentujemy tę wariancję w zestawie wyników kryteriów, jak pokazano powyżej, gdzie całkowita powierzchnia jest zdefiniowana jako 1, 00. Możemy to zrobić, ponieważ możliwe jest przekształcenie dowolnego zestawu wyników surowych, tak aby ich wariancja stała się równa 1, 00 przy użyciu tak zwanej transformacji wyniku az.

Podobnie, przypuśćmy, że mamy zestaw wartości predykcyjnych, które również różnią się i są normalnie rozłożone, i ponownie obszar jest zdefiniowany jako równy ilości 1.00. Możemy teraz reprezentować r geometrycznie jako związany z ilością nakładania się (kowariancji) dwóch zbiorów wyników.

Bardziej precyzyjna definicja r jako statystyki jest taka, że ​​jest to stosunek ilości kowariancji między dwiema zmiennymi do pierwiastka kwadratowego iloczynu odpowiednich wariancji (czasami nazywanej średnią geometryczną), który można przedstawić w sposób pokazany poniżej:

Wracając do danych podanych w Tabeli 2.3, można obliczyć korelację między tymi dwoma zestawami ocen za pomocą formuły

Czytelnik jest informowany, że r nie może być interpretowany jako procent. Jeśli r = 0, 50, nie oznacza to, że 50 procent wariancji w kryterium jest przewidywalne ze zmiennej selekcji. Kwadrat r można jednak tak interpretować. Korelacja 0, 50, przy podniesieniu do kwadratu, daje r 2 = 0, 25, co można interpretować jako procent wariancji w kryterium przewidywanym przez zmienną selekcyjną.

Statystyka r 2 jest czasami nazywana współczynnikiem determinacji, ponieważ reprezentuje wielkość wariancji w jednej zmiennej, którą można "określić", znając wyniki na drugiej zmiennej. Rysunek 2.7 pokazuje zależność między r (miarą zależności) a r 2 . Należy zauważyć, że możliwe jest uzyskanie r o dość znacznych rozmiarach i nadal stanowią one jedynie niewielką część wariancji kryterium.

Regresja:

Jak widzieliśmy, współczynnik korelacji r mierzy stopień zależności między dwiema zmiennymi. Sam w sobie jednak nie dostarcza nam procedury, dzięki której możemy przewidzieć jeden zestaw wyników z innego zestawu. Technika, w której się to odbywa, nazywa się analizą regresji. Regresję można uważać za powiązaną z korelacją w następujący sposób: Korelacja mierzy wielkość lub stopień zależności między dwiema zmiennymi, natomiast regresja podaje opis zależności między zmiennymi, które z kolei można wykorzystać do prognozowania.

Aby zilustrować regresję, należy wziąć pod uwagę wyniki przedstawione na rysunku 2.8a. Oczywiście istnieje istotny pozytywny związek między predyktorem a kryterium w tym przypadku. Niestety, rysunek 2.8a nie dostarcza nam żadnych informacji na temat dokładnego związku innego niż fakt, że jest on liniowy (r zawsze mierzy tylko stopień liniowej, w przeciwieństwie do krzywoliniowej zależności, pomiędzy dwiema zmiennymi). Jeśli chcemy przewidzieć wyniki kryteriów z jakiegoś urządzenia selekcyjnego, jasne jest, że musimy opisać zaobserwowany związek między predyktorem a kryterium bardziej szczegółowo.

Osiąga się to przez znalezienie linii lub funkcji, która najlepiej opisuje punkty danych. Jest to nazywane dopasowywaniem "linii najlepszego dopasowania" do danych. Ponieważ zakładamy, że relacja ma charakter liniowy (użyliśmy r, aby zmierzyć jej wielkość), typ linii, której używamy, musi być prosty, tzn. Żadne zakrzywione linie nie są dozwolone. Ta najlepiej pasująca linia prosta nazywana jest linią regresji i może być używana do przewidywania kryterium z predyktora.

Rysunek 2.8b pokazuje dwie różne linie najlepszego dopasowania, które można uzyskać, gdybyśmy poprosili dwie różne osoby o zbadanie danych, a następnie narysowali linię przez punkty, które ich zdaniem najlepiej opisują trend lub związek między zmiennymi. Podczas gdy ogólny trend jest podobny, okazuje się, że dwoje ludzi nie zgadza się w pełni z oszacowaniem związku.

Ta niezgodność z kolei doprowadziłaby do niezgody w przewidywanym wyniku kryterium, w zależności od tego, która z użytych linii regresji została wykorzystana. Biorąc pod uwagę osobę ubiegającą się o pracę z wynikiem x na instrumencie wyboru, przewidywalibyśmy wynik kryterium 1 dla tego wnioskodawcy, gdybyśmy skorzystali z linii regresji pierwszej osoby; jeśli użylibyśmy linii regresji drugiej osoby, przewidywalibyśmy, że y 2 jest najbardziej prawdopodobnym wynikiem kryterium. Która regresja jest poprawna?

Jest to trudne pytanie, na które należy odpowiedzieć, chyba że istnieją podstawy do decydowania o tym, jakie jest "najlepsze dopasowanie". Na szczęście statystycy ogólnie zgodzili się, że najlepiej dopasowana linia to taka, która przechodzi przez punkty, tak aby zminimalizować sumę kwadratów odległości (w wymiarze y) punktów z linii, jak pokazano na rysunku 2.9.

Linia, która osiąga minimalizację Σd 2, nazywana jest linią regresji "najmniejszych kwadratów". Takie linie regresji są matematycznie bezpośrednio związane z r. Zastosowanie metody najmniejszych kwadratów w celu uzyskania naszej linii predykcyjnej zapewni, że różne osoby znajdą się w tej samej linii (zakładając, że nie popełniają błędów w obliczeniach). Podobnie, przewidywany wynik kryterium dla każdej konkretnej wartości x nie będzie różnił się w zależności od tego, kto pasuje do linii predykcyjnej (patrz Rysunek 2.8c).

W tym momencie czytelnik może zapytać: "Dlaczego musimy przewidywać wyniki kryteriów, kiedy już je mamy?" Odpowiedź jest dość prosta. Początkowy pomiar zakresu zależności między predyktorem a kryterium oczywiście wymaga obu zestawów wyników, inaczej nie można by ustalić związku. Jeśli narzędzie selekcji okaże się przydatne, można je wykorzystać w przypadku wszystkich nowych kandydatów, u których można uzyskać wynik przewidywania, ale dla których nie istnieje punktacja kryterialna.

Naszym celem jest przewidywanie wyników przyszłych kandydatów. Jeśli nowy kandydat uzyska wysoką ocenę z testu, który ma wysoki pozytywny związek z tym kryterium, powinniśmy oczekiwać, że ma on wysokie prawdopodobieństwo, że okaże się sukcesem.