Testy nieparametryczne: koncepcje, środki ostrożności i zalety

Po przeczytaniu tego artykułu dowiesz się o: - 1. Koncepcjach testów nieparametrycznych 2. Założeniach testów nieparametrycznych 3. Środki ostrożności 4. Niektóre testy nieparametryczne 5. Zalety 6. Wady.

Pojęcia testów nieparametrycznych:

Nieco później dostrzegliśmy rozwój wielu technik wnioskowania, które nie zawierają licznych lub ścisłych założeń dotyczących populacji, z której pobraliśmy próbki danych. Te techniki dystrybucji lub nieparametryczne prowadzą do wniosków, które wymagają mniejszej liczby kwalifikacji.

Po skorzystaniu z jednego z nich moglibyśmy powiedzieć: "Bez względu na kształt populacji (-ów) możemy dojść do wniosku, że ...".

Dwie alternatywne nazwy często podawane w tych testach to:

Bezpłatna dystrybucja:

Testy nieparametryczne są "wolne od dystrybucji". Nie zakładają one, że analizowane wyniki pochodzą z populacji podzielonej w określony sposób, np. Z populacji o normalnej dystrybucji.

Podczas przeprowadzania testów istotności różnicy między dwoma środkami (na przykład w przypadku CR lub t) przyjmujemy, że wyniki, na których opierają się nasze statystyki, są zwykle rozkładane w populacji. To, co faktycznie należy zrobić - w ramach hipotezy zerowej - polega na oszacowaniu na podstawie statystyk próbnych prawdopodobieństwa prawdziwej różnicy między tymi dwoma parametrami.

Gdy N jest niewielkie lub dane są źle wypaczone, więc założenie o normalności jest wątpliwe, "metody parametryczne" mają wątpliwą wartość lub w ogóle nie mają zastosowania. W takich przypadkach potrzebujemy technik, które umożliwią nam porównywanie próbek i wnioskowanie lub testy istotności bez konieczności przyjmowania normalności w populacji.

Takie metody są nazywane nieparametrycznymi lub nie zawierają dystrybucji. Na przykład test X-testów na kostkach kwadratowych jest techniką nieparametryczną. Znaczenie X 2 zależy tylko od stopni swobody w tabeli; nie należy przyjmować założenia co do formy dystrybucji dla zmiennych zaklasyfikowanych do kategorii tabeli X 2 .

Współczynnik korelacji rangowo-różnicy (rho) jest również techniką nieparametryczną. Gdy p jest obliczane z wyników uszeregowanych w kolejności zgodnej z wartością, rozkład, z którego pobierane są wyniki, może być źle przekrzywiony, a N jest prawie zawsze mały.

Testy rankingowe:

Alternatywnie, wiele z tych testów określa się jako "testy rankingowe", a ten tytuł sugeruje ich drugą zasadniczą zaletę: techniki nieparametryczne mogą być stosowane z wynikami, które nie są dokładne w żadnym znaczeniu liczbowym, ale które w rzeczywistości są po prostu rankingami.

Założenia testów nieparametrycznych:

Nieparametryczny test statystyczny opiera się na modelu, który określa tylko bardzo ogólne warunki i nie dotyczy żadnej konkretnej formy rozkładu, z której pobrano próbkę.

Niektóre założenia są powiązane z większością nieparametrycznych testów statystycznych, a mianowicie:

1. Że obserwacje są niezależne;

2. Badana zmienna ma ciągłość;

3. Procedury nieparametryczne, które nie mają innej hipotezy na temat populacji niż procedury parametryczne;

4. W przeciwieństwie do testów parametrycznych istnieją testy nieparametryczne, które można odpowiednio zastosować do danych mierzonych w skali porządkowej, a inne do danych w skali nominalnej lub kategorycznej.

Środki ostrożności podczas korzystania z testów nieparametrycznych:

Podczas korzystania z nieparametrycznych testów uczeń jest ostrzegany przed następującymi błędami:

1. W przypadku pomiarów w zakresie skali interwałów i skali, przekształcenie pomiarów na skalach nominalnych lub porządkowych doprowadzi do utraty dużej ilości informacji. Dlatego w miarę możliwości w takich sytuacjach należy stosować testy parametryczne. Używając nieparametrycznej metody jako skrótu, wyrzucamy dolary, aby zaoszczędzić grosze.

2. W sytuacjach, w których założenia leżące u podstaw testu parametrycznego są spełnione i można zastosować testy parametryczne i nieparametryczne, należy wybrać test parametryczny, ponieważ większość testów parametrycznych ma większą moc w takich sytuacjach.

3. Testy nieparametryczne bez wątpienia stanowią sposób na uniknięcie założenia o normalności dystrybucji. Jednak metody te nie robią nic, aby uniknąć założeń niezależności w zakresie homoscedastyczności wszędzie tam, gdzie ma to zastosowanie.

4. Naukowiec behawioralny powinien określić hipotezę zerową, hipotezę alternatywną, test statystyczny, rozkład próbkowania i poziom istotności przed zbieraniem danych. Poszukiwanie danych statystycznych po zebraniu danych prowadzi do zmaksymalizowania efektów ewentualnych różnic, które faworyzują jeden test na drugim.

W rezultacie, znacznie mniejsza jest możliwość odrzucenia hipotezy zerowej, gdy jest ona prawdziwa (błąd typu I). Jednak ta uwaga dotyczy zarówno testów parametrycznych, jak i nieparametrycznych.

5. Nie mamy problemu z wyborem testów statystycznych dla zmiennych kategorycznych. Same nieparametryczne testy są odpowiednie dla danych enumeratywnych.

6. Testy F i t są generalnie uważane za rzetelny test, ponieważ naruszenie podstawowych założeń nie unieważnia wniosków.

Zwyczajowo uzasadnia się stosowaniem normalnego testu teoretycznego w sytuacji, gdy normalności nie można zagwarantować, argumentując, że jest on odporny na nietypowość.

Niektóre testy nieparametryczne:

Omówimy kilka typowych testów nieparametrycznych.

1. Test znaków:

Test znaków jest najprostszym ze wszystkich statystyk pozbawionych dystrybucji i ma bardzo wysoki poziom ogólnej użyteczności. Ma zastosowanie w sytuacjach, w których krytyczny stosunek, t, test dla skorelowanych próbek nie może być użyty, ponieważ nie są spełnione założenia normalności i homoskedastyczności.

Uczniowie zdają sobie sprawę z tego, że pewne warunki w trakcie eksperymentu wprowadzają element relacji między dwoma zestawami danych.

Warunki te są na ogół sytuacją przed testem, po teście; sytuacja testu i ponownej próby; testowanie jednej grupy badanych w dwóch testach; tworzenie "dopasowanych grup" poprzez parowanie na niektóre zewnętrzne zmienne, które nie są przedmiotem badań, ale które mogą wpływać na obserwacje.

W teście znakowym testujemy znaczenie znaku różnicy (jako plus lub minus). Ten test stosuje się, gdy N jest mniejsze niż 25.

Poniższy przykład pozwoli nam wyjaśnić test znaku:

Przykład:

Oceny często podlegają dwóm różnym warunkom, A i B podano poniżej. Zastosuj test znaku i przetestuj hipotezę, że A ma przewagę nad B.

Z wyłączeniem 0 (zero) mamy dziewięć różnic, z których siedem to plus.

Musimy teraz rozwinąć dwumian, (p + q) 9

(p + q) 9 = p 9 + 9 p 8 q + 36 p 7 q 2 + 84 p 6 q 3 + 126 p 5 q 4 + 126 p 4 q 5 + 84 p 3 q 6 + 36 p 2 q 7 + 9 pq 8 + q 9 .

Całkowita liczba kombinacji wynosi 2 9 lub 512. Dodając pierwsze 3 terminy (czyli p 9 + 9p 8 q + 36 p 7 q 2 ), mamy w sumie 46 kombinacji (tj. 1 z 9, 9 z 8 i 36 z 7), które zawierają 7 lub więcej znaków plus.

Około 46 razy w 512 próbach 7 lub więcej plus znaki z 9 nastąpi, gdy średnia liczba znaków + pod hipotezą zerową wynosi 4, 5. Prawdopodobieństwo wystąpienia 7 lub więcej znaków wynosi 46/512 lub 0, 09 i nie jest znaczące.

Jest to test jednostronny, ponieważ nasza hipoteza stwierdza, że ​​A jest lepsza niż B. Jeśli hipoteza na wstępie była taka, że ​​A i B różnią się bez określenia, która jest lepsza, mielibyśmy test dwustronny, dla którego P = .18.

Dostępne są tabele, które podają liczbę znaków potrzebnych dla istotności na różnych poziomach, gdy N ma różny rozmiar. Gdy liczba par jest równa 20, normalna krzywa może być użyta jako przybliżenie ekspansji dwumianowej lub zastosowanego testu x2.

2. Test medianowy:

Mediana testu jest używana do porównania wydajności dwóch niezależnych grup, jak na przykład grupa eksperymentalna i grupa kontrolna. Najpierw obie grupy są rzucane razem i obliczana jest wspólna mediana.

Jeśli dwie grupy zostały losowo wybrane z tej samej populacji, 1/2 wyników w każdej grupie powinno znajdować się powyżej i 1/2 poniżej wspólnej mediany. Aby przetestować tę hipotezę zerową, musimy sporządzić tabelę 2 x 2 i obliczyć x 2 .

Metoda jest pokazana w następującym przykładzie:

Przykład:

Psycholog kliniczny chce zbadać wpływ leku uspokajającego na drżenie ręki. Czternastu pacjentów psychiatrycznych otrzymuje lek, a 18 innych pacjentów otrzymuje nieszkodliwą dawkę. Pierwsza grupa to eksperymentalna, druga grupa kontrolna.

Czy lek zwiększa sztywność - co pokazują niższe wyniki w grupie eksperymentalnej? Ponieważ jesteśmy zaniepokojeni tylko wtedy, gdy lek zmniejsza drżenie, jest to test jednostronny.

Mediana testu została zastosowana do grup eksperymentalnych i kontrolnych. Znaki plus wskazują na wyniki powyżej wspólnej mediany, minus wyniki poniżej wspólnej mediany.

N = 14 N = 18

Wspólna mediana = 49, 5

Wspólna mediana to 49, 5. W grupie eksperymentalnej wyniki 4 są powyżej, a 10 poniżej wspólnej mediany zamiast 7 powyżej i 7 poniżej, których można się spodziewać przypadkowo. W grupie kontrolnej 12 punktów jest powyżej, a 6 poniżej wspólnej mediany zamiast oczekiwanych 9 w każdej kategorii.

Częstotliwości te podano w poniższej tabeli, a X 2 oblicza się za pomocą wzoru (podanego poniżej) z poprawką na ciągłość:

AX 2c 3, 17 z 1 stopniem swobody daje ap, który leży w .08 około połowy między .05 i .10. Chcieliśmy się dowiedzieć, czy mediana grupy eksperymentalnej była znacząco niższa od mediany (co wskazuje na większą stabilność i mniejsze drżenie).

W przypadku tej hipotezy test jednostronny, p / 2, wynosi w przybliżeniu .04, a X 2c jest istotny na poziomie 0, 5. Gdybyśmy przyjęli naszą hipotezę, że obie grupy różnią się bez określenia kierunku, mielibyśmy test dwustronny, a X 2 byłby oznaczony jako nieistotny.

Nasz wniosek, nieco niejasny, polega na tym, że lek powoduje pewne zmniejszenie drżenia. Ale dzięki niewielkim próbkom i brakowi wysoce znaczącego odkrycia, psycholog kliniczny niemal na pewno powtórzyłby eksperyment - być może kilka razy.

X 2 ma ogólne zastosowanie w teście mediany. Jednak gdy N 1 i N 2 są małe (np. Mniej niż około 10), a test X 2 nie jest dokładny i należy zastosować dokładną metodę obliczania prawdopodobieństwa.

Zalety testów nieparametrycznych:

1. Jeżeli wielkość próby jest bardzo mała, nie może istnieć alternatywa dla zastosowania nieparametrycznego testu statystycznego, chyba że charakter rozkładu populacji jest dokładnie znany.

2. Testy nieparametryczne zazwyczaj zawierają mniej założeń dotyczących danych i mogą być bardziej odpowiednie dla konkretnej sytuacji. Ponadto hipoteza testowana za pomocą testu nieparametrycznego może być bardziej odpowiednia dla badania.

3. Nieparametryczne testy statystyczne są dostępne do analizy danych, które są z natury w szeregach, a także danych, których pozornie numeryczne wyniki mają siłę rang. Oznacza to, że naukowiec może jedynie mówić o swoich poddanych, że ma mniej lub więcej cech niż inny, nie będąc w stanie powiedzieć, o ile bardziej lub mniej.

Na przykład, badając taką zmienną, taką jak lęk, możemy stwierdzić, że podmiot A jest bardziej zaniepokojony niż podmiot B, nie wiedząc w ogóle dokładnie, o ile bardziej niepokojący jest A.

Jeżeli dane są z natury w szeregach lub nawet jeśli można je zaklasyfikować tylko jako plus lub minus (mniej więcej, lepiej lub gorzej), można je traktować metodami nieparametrycznymi, podczas gdy nie można ich traktować metodami parametrycznymi, chyba że są one niepewne i być może, nierealistyczne założenia dotyczące bazowych dystrybucji.

4. Dostępne są metody nieparametryczne do przetwarzania danych, które są po prostu klasyfikacyjne lub kategoryczne, tj. Są mierzone w skali nominalnej. Do takich danych nie ma zastosowania technika parametryczna.

5. Istnieją odpowiednie nieparametryczne testy statystyczne do badania próbek składających się z obserwacji pochodzących z różnych populacji. Testy parametryczne często nie są w stanie obsłużyć takich danych, nie wymagając od nas pozornie nierealistycznych założeń lub wymagających skomplikowanych obliczeń.

6. Nieparametryczne testy statystyczne są zazwyczaj łatwiejsze do nauczenia i zastosowania niż testy parametryczne. Ponadto ich interpretacja często jest bardziej bezpośrednia niż interpretacja testów parametrycznych.

Wady testów nieparametrycznych:

1. Jeżeli wszystkie założenia parametrycznej metody statystycznej są faktycznie spełnione w danych, a hipoteza badawcza może zostać przetestowana za pomocą testu parametrycznego, wówczas nieparametryczne testy statystyczne są nieekonomiczne.

2. Stopień marnotrawstwa jest wyrażany przez sprawność energetyczną testu nieparametrycznego.

3. Kolejnym zarzutem wobec nieparametrycznych testów statystycznych jest to, że nie są one systematyczne, podczas gdy parametryczne testy statystyczne zostały usystematyzowane, a różne testy są po prostu wariacjami na temat centralny.

4. Kolejny sprzeciw wobec nieparametrycznych testów statystycznych ma związek z wygodą. Tabele niezbędne do wdrożenia testów nieparametrycznych są rozproszone szeroko i pojawiają się w różnych formatach.