Błąd standardowy średniej

Po przeczytaniu tego artykułu dowiesz się o standardzie średniej.

Wnioskowanie statystyczne pomaga nam również przetestować hipotezę, że "statystyki oparte na próbce nie różnią się istotnie od parametru populacji, a różnica, jeśli jakikolwiek odnotowano, wynika jedynie z przypadkowej zmienności" .

Błąd standardowy średniej (SE M lub σ M )

Błąd standardowy średniej (SE M ) jest dość ważny, aby przetestować reprezentatywność lub wiarygodność lub znaczenie średniej.

Załóżmy, że obliczyliśmy średni wynik 200 chłopców z 10 klasy Delhi w teście umiejętności numerycznych na 40. W ten sposób 40 jest średnią z tylko jednej próbki pobranej z populacji (wszyscy chłopcy czytający w klasie X w Delhi).

Równie dobrze możemy pobrać różne losowe próbki 200 chłopców z populacji. Załóżmy, że losowo wybieramy 100 różnych próbek, każda próbka składa się z 200 chłopców z tej samej populacji i oblicza średnią każdej próbki.

Chociaż "n" wynosi 200 w każdym przypadku, 200 chłopców wybranych losowo w celu utworzenia różnych próbek nie jest identycznych, a zatem z powodu fluktuacji pobierania próbek uzyskalibyśmy 100 wartości średnich z tych 100 różnych próbek.

Te średnie wartości będą się różnić od siebie i tworzą serię. Wartości te tworzą rozkład próbkowania środków. Można wyrazić matematycznie, że te środki próbki są rozmieszczone normalnie.

100 średnich wartości (w naszym przykładzie) spadnie do normalnego rozkładu wokół M pop, gdzie Mp pop jest średnią z rozkładu próbkowania średnich. Odchylenie standardowe tych 100 próbek oznacza SE M lub błąd standardowy średniej, który będzie równy standardowemu odchyleniu populacji podzielonemu przez pierwiastek kwadratowy z (wielkość próbki).

SE M pokazuje rozproszenie środka próbki wokół M pop . Zatem SE M jest miarą zmienności próbek. Jest to miara rozbieżności średnich próbek od M pop . SE M jest również zapisywane jako σ M.

Błąd standardowy średniej (SE M lub σ M ) oblicza się za pomocą wzoru (dla dużych próbek)

(A) Obliczanie SE M w dużych próbkach :

gdzie σ = odchylenie standardowe populacji i

n = liczba przypadków uwzględnionych w próbie

(Ponieważ rzadko możemy mieć SD populacji, dla σ używamy wartości SD z próbki).

Przedział ufności:

Obydwa przedziały ufności, tj. 95% i 99%, są w powszechnym użyciu. RA Fisher określa granice przedziału ufności, który zawiera parametr "limity powiernicze" i nazwał zaufanie umieszczone w przedziale jako prawdopodobieństwo powiernictwa.

(a) 95% przedziału ufności:

Odnosząc się do tabeli obszaru pod krzywą normalną, stwierdzamy, że 95% przypadków leży między M ± 1, 96 SE M. Że jesteśmy w 95% pewni lub poprawni, aby powiedzieć, że M pop znajdzie się w przedziale M + 1, 96 SE M i M + 1, 96 SE M, a my 5% myli się twierdzenie, że M pop będzie leżeć poza tym interwale.

Innymi słowy prawdopodobieństwo, że M pop będzie w zakresie M ± 1, 96 SE M wynosi 95% (lub .95), a prawdopodobieństwo, że M pop będzie poza zakresem, wynosi 5% (lub .05). Wartość 1, 96 jest wartością krytyczną na poziomie istotności 0, 05.

(b) 99% przedziału ufności:

Odnosząc się do tabeli obszaru pod krzywą normalną, stwierdzamy, że 99% przypadków leży między M ± 2, 58 SE. Że jesteśmy w 99% pewni lub poprawni, aby powiedzieć, że M pop leżeć będzie w przedziale M - 2, 58 SE M i M + 2, 58 SE M, a my jesteśmy 1% błędnie powiedzieć, że pop M będzie leżeć poza tym interwałem.

Innymi słowy prawdopodobieństwo, że M pop jest w zakresie M ± 2, 58 SE M wynosi 99% (lub .99), a prawdopodobieństwo, że M pop poza zakresem wynosi 1% (lub .01). Wartość 2, 58 jest wartością krytyczną na poziomie istotności 0, 01.

Tutaj stwierdzamy, że poziom istotności jest odwrotnie proporcjonalny do zakresu precyzji. Na poziomie istotności 05 bylibyśmy dokładni w 95% przypadków, a przy poziomie istotności 0, 01 bylibyśmy dokładni w 99% przypadków.

Poniższa tabela poprzedzi Cię jeszcze bardziej:

Przykład 1:

Średnia i SD 225 chłopców klasy XII Delhi w teście zdolności liczbowej wyniosły odpowiednio 48 i 6. Jak dobrze to oznacza reprezentują M pop lub oszacuj M pop . (n = 225, σ = 6, średnia = 48]

Odnosząc się do tabeli rozkładu normalnego (tabela A) stwierdzamy, że wszystkie najbardziej (99, 7) przypadki leżą w ± 3σ. W przypadku naszego przykładu wszystkie próbki będą znajdować się między M pop + 3σ m i M pop - 3σ M. Tak więc każda średnia próbki będzie najlepsza o 3σ m mniej niż M pop na 3σ M więcej niż M pop .

Zatem jeśli znamy wartość σ M, możemy wnioskować o M pop z naszej średniej próbki. Tutaj 4 jest standardowym odchyleniem rozkładu próbek, którego średnia wynosi jeden. Wszystkie próbki, które są normalnie rozmieszczone wokół M pop, będą leżały między M pop + 3 SE M i M pop - 3 SE M.

3 SE M = 3 x .4 = 1, 2

Chociaż nie znamy dokładnej wartości M pop możemy przynajmniej powiedzieć z przekonaniem, że M pop leży pomiędzy

(48 -1, 2) i (48 + 1, 2) lub 46, 8 → 49, 2

Z tabeli A wynika, że ​​95% przypadków leży w zakresie od ± 1, 96 σ. W przypadku naszego przykładu 95% przedział ufności dla M pop wynosi od M - 1, 96 SE M do M + 1, 96 SE M.

Teraz 1, 96 SE M = 1, 96 x 0, 4 = 0, 78

. . . M-1, 96 SE M = 48 - 0, 78 = 47, 22 i M + 1, 96 SE M = 48 + 0, 78 = 48, 78

. . . 95% przedział ufności wynosi od 47, 22 do 48, 78. 99% przedział ufności dla M pop wynosi od M - 2, 58 SE M do M + 2, 58 SE M.

Teraz 2, 58 SE M = 2, 58 X .4 = 1, 03

. . . M-2, 58 SE M = 48 -1, 03 = 46, 97 i M + 2, 58 SE M = 48 + 1, 03 = 49, 03

. . . 99% przedział ufności dla M pop wynosi od 46, 97 do 49, 03.

Przykład 2:

Stwierdzono średnią i SD 400 studentów w teście na poziomie 42 i 8. Czy można oszacować średni wynik populacji z 99% do 95% przedziału ufności?

Rozwiązanie:

(i) 95% przedział ufności dla M pop wynosi od M - 1, 96 SE M do M + 1, 96 SE M.

Teraz 1, 96 SE M = 1, 96 x 0, 4 = 0, 784

. . . M-1, 96 SE M = 42-.784 = 41, 22

i M + 1, 96 SE M = 42 + .784 = 42, 78 (do dwóch miejsc po przecinku).

Zatem 95% przedział ufności wynosi od 41, 22 do 42, 78. Jesteśmy w 95% zgodni, że M pop wynosi od 41, 22 do 42, 78.

(ii) 99% przedział ufności dla M pop wynosi od M - 2, 58 SE M do M + 2, 58 SE M

Teraz 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M - 2, 58 SE M = 42-1, 03 = 40, 97

i M +2, 58 SE M = 42 + 1, 03 = 43, 03

Tak więc 99% przedział ufności wynosi od 40, 97 do 43, 03. Jesteśmy w 99% przekonani, że M pop leży między 40.97 a 43, 03.

Przykład 3:

Średnie i odchylenie standardowe próbki 169 chłopców w teście zdolności liczbowej wynoszą odpowiednio 50 i 6:

(i) Określić przedział 95% średniej populacji i zinterpretować ją.

(ii) Określić dopuszczalny błąd próbkowania na poziomie istotności 0, 05 i .01.

(iii) Określić 99% przedział ufności dla M pop .

Rozwiązanie:

M = 50

(i) 95% przedział ufności dla Mp 0p waha się od M - 1, 96 SE M do M + 1, 96 SE M.

Teraz 1, 96 SE m = 1, 96 x 0, 46 = 0, 90

Tak więc M-1, 96 SE M = 50-.90 = 49, 10

i M + 1, 96 SE M = 50 +, 90 = 50, 90

. . . 95% przedział ufności dla M pop wynosi od 49, 10 do 50, 90. Z próbnego środka 50 my szacujemy, że M pop ma pewną stałą wartość pomiędzy 49, 10 a 50, 90, a mówiąc, mamy 95% pewności.

Innymi słowy, nasza średnia próbka wynosząca 50 nie przeoczy M popu o więcej niż .90 i będzie to prawdą dla 95 przypadków na 100. Alternatywnie, tylko w 5 przypadkach na 100, nasza średnia próbka wynosząca 50 będzie pomijać M pop więcej niż .90.

(ii) Wartość krytyczna na poziomie .05 istotności = 1, 96

Wartość krytyczna na poziomie .01 istotność = 2, 58

"Błąd pobierania próbek = wartość krytyczna x SE M "

Zatem błąd próbkowania na poziomie 0, 05 wynosi 1, 96 SE M, a na poziomie 0, 01 jest 2, 58 SE M

Dopuszczalny błąd próbkowania na poziomie 0, 05 = 1, 96 SE M = 1, 96 x 0, 46 = 0, 90

Dopuszczalny błąd próbkowania na poziomie 0, 01 = 2, 58 SE M = 2, 58 X 0, 46 = 1, 19

(iii) 99% przedział ufności wynosi od M - 2, 58 SE M do M + 2, 58 SE M

Teraz 2, 58 SE M = 2, 58 X 0, 46 = 1, 19

Tak więc M-2, 58 SE M = 50-1, 19 = 48, 81

i M + 2, 58 SE M = 50 + 1, 19 = 51, 19

99% przedział ufności wynosi od 48, 81 do 51, 19.

Przykład 4:

Dla danej grupy 500 żołnierzy średni wynik AGCT wynosi 95, 00, a SD 25.

(ii) Określić przedział ufności .99 dla prawdziwej średniej.

(ii) Jest mało prawdopodobne, aby prawdziwy środek był większy niż wartość?

Rozwiązanie:

(i) 99% przedział ufności wynosi od M - 2, 58 SE M do M + 2, 58 SE M.

Teraz 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Tak więc M-2, 58 SE M = 95, 0-2, 89 = 92, 11

i M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . 99% przedział ufności wynosi od 92, 11 do 97, 89.

Z naszych próbnych środków wynoszących 95, 0 szacujemy, że prawdziwa średnia ma być wartością stałą pomiędzy 92, 11 i 97, 89, a więc mamy 99% pewności.

(ii) Nasza średnia próbka wynosząca 95, 0 nie przeoczy prawdziwej średniej o więcej niż 2, 89, tj. prawda nie jest większa niż 97, 89.

(B) Obliczanie SE M w małej próbce:

Tradycyjnie nazywa się każdą próbkę większą niż 30 jako dużą próbkę. Gdy N jest duże, nie warto dokonywać korekty. Ale kiedy N jest "mały" (mniej niż 30), wskazane jest użycie (N - 1) i jest to konieczne, gdy N jest dość małe - powiedzmy, mniej niż 10.

Student musi pamiętać (i), że teoretycznie (N - 1) powinno zawsze być używane, gdy SD ma być oszacowaniem populacji a; oraz że (ii) rozróżnienie między "dużą próbką statystyczną" a "niską próbką statystyczną" w kategoriach punktu cięcia N = 30 jest arbitralne i częściowo jest kwestią wygody.

Gdy N jest mniejsze niż około 30, wzór na σ M lub SE M powinien brzmieć:

Przykład 5:

Po pięciu studentów uzyskało wyniki w teście:

Określić granice 95% limitu ufności dla średniej populacji.

Wyniki są następujące: 11, 13, 9, 12, 15:

Rozwiązanie:

M = 12

Tutaj df = n-1 = 5-1 = 4

Odnosząc się do tabeli D, przy df = 4, wartość t na poziomie istotności 0, 05 (tj. Poziom ufności 95%) wynosi 2, 78.

95% przedział ufności definiuje M ± 2, 78 SE M

2, 78 SE M = 2, 78 x 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 x1, 0 = 9, 22 i

M + 2, 78 SE M = 12 + 2, 78 x1, 0 = 14, 78

. . . Granice 95% przedziału ufności wynoszą 9, 22 i 14, 78.

Oznacza to, że P = .95, że M pop znajduje się w przedziale od 9.22 do 14.78.

Przykład 6:

Dziesięć miar czasu reakcji na światło pochodzi od praktykującego obserwatora. Średnia to 175, 50 ms (milisekundy), a S to 5, 82 ms. Określ przedział ufności .95 dla M pop ; przedział ufności .99.

Rozwiązanie:

n = 10, S = 5, 82 ms, M = 175, 50 ms

Df (stopnie swobody) dostępne do określenia t to (n - 1) lub (10 - 1) = 9

(i) Określanie 95% (lub 95) przedziału ufności:

Wprowadzając tabelę D z 9 df, czytamy, że t = 2, 26 przy punkcie .05.

95% przedział ufności dla M pop wynosi od M - 2, 26 SE M do M + 2, 26 SE M.

Teraz 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Tak więc M - 2, 26 SE M = 175, 50 - 4, 16 = 171, 34

i M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . 95% przedział ufności dla M pop wynosi od 171, 34 do 179, 66. P wynosi 0, 95, a więc M pop nie jest mniejsze niż 171, 34 ani nie przekracza 179, 66. Jeśli wyciągniemy wniosek, że M pop leży w tym przedziale, przez długą serię eksperymentów powinniśmy mieć prawo 95% czasu i niewłaściwe 5%.

(ii) Określanie przedziału ufności 99% (lub .99):

Wprowadzając tabelę D z 9 df, odczytujemy, że t = 3, 25 przy 0, 01 punktu. 99% przedział ufności dla M pop wynosi od M - 3, 25 SE M do M + 3, 25 SE M.

Teraz 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Tak więc M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52

i M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . 99% przedział ufności dla M pop wynosi od 169, 52 do 181, 48.

P jest równe .99, że wartość M pop jest nie mniejsza niż 169, 52 ani większa niż 181, 48. Jeśli wnioskujemy, że M pop leży w tym przedziale, przez długą serię eksperymentów powinniśmy mieć rację -99% czasu i zła 1%.

Wnioski dotyczące innych statystyk:

Ponieważ wszystkie statystyki mają rozkłady próbek i błędy standardowe, znaczenie mediany, odchylenia kwartyli, odchylenia standardowego, wartości procentowych i innych statystyk można interpretować podobnie jak średnią i możemy oszacować parametr.

(i) Błąd standardowy mediany (lub SE Mdn -):

Pod względem SD i Q wartości SE dla mediany dla dużych próbek można obliczyć za pomocą następujących wzorów:

w którym σ = SD próbki, n = wielkość próbki i Q = Odchylenie ćwiartkowe próbki.

Przykład ilustruje użycie i interpretację wzorów:

Przykład 7:

W skali języka Trabue A 801 jedenastoletni chłopcy dokonali następującego zapisu:

Mediana = 21, 40 i Q = 4, 90. Jak dobrze ta mediana reprezentuje medianę populacji, z której pobierana jest ta próbka?

Rozwiązanie:

n = 801, Mdn = 21, 40, Q = 4, 90.

Stosując drugą formułę:

Ponieważ N jest duże, można przyjąć, że rozkład próbek jest normalny, a przedział ufności ustalony na podstawie ostatniego wiersza w tabeli D. Odsetek ufności .99 dla popu Mdn wynosi 21, 40 ± 2, 58 x 0, 32 lub 21, 40 ± 0, 83.

Możemy być pewni, że mediana populacji nie będzie mniejsza niż 20, 57 ani większa niż 22, 23. Ten wąski zakres wykazuje wysoki stopień wiarygodności w medianie próbki.

(ii) Błąd standardowy odchylenia standardowego (SE σ ):

Standardowy błąd odchylenia standardowego, taki jak SE M, można znaleźć obliczając prawdopodobną rozbieżność próbki SD z jej parametru (populacja SD). Wzór na SE σ to

Przykład 8:

n = 400, σ = 6

Jak dobrze to SD reprezentuje SD populacji, z której pobierana jest próbka?

Rozwiązanie:

Gdy próbki są duże i losowo wybrane z ich populacji, powyższy wzór może być stosowany i interpretowany w taki sam sposób, jak SE M.

Ponieważ N jest duże, przedział ufności .99 dla SD pop może być bezpiecznie wykonany przy granicach ± ​​2, 58 σ σ . Podstawiając σ σ, mamy 6 ± 2, 58 x .21, czyli limity między (6 - .54) i (6 + .54) lub 5, 46 i 6, 54.

Jeśli przyjmiemy, że SD SD leży pomiędzy limitami 5.46 a 6.54, powinniśmy mieć rację w 99% przypadków i nieprawidłowo 1%.

(iii) Błąd standardowy odchylenia kwartylowego (lub SE Q lub σ q ):

SE Q można znaleźć w formułach:

Przykład 9:

n = 801, Q = 4, 90

Jak dobrze to Q reprezentuje odchylenie ćwiartkowe populacji?

Rozwiązanie:

Stosując formułę

Przedział ufności .99 dla Q pop wynosi 4, 90 ± 2, 58 x 0, 203, czyli od 4, 38 do 5, 42. Ten zakres pokazuje, że próbka Q jest wysoce niezawodną statystyką.

(iv) Standardowy błąd procentowy (lub SE% lub σ%):

Podaj procentowe występowanie zachowania, często pojawia się pytanie, na ile pewności możemy umieścić na rysunku. Jak niezawodny jest nasz wskaźnik procentowy zachowań, którymi jesteśmy zainteresowani? Aby odpowiedzieć na to pytanie,

Musimy obliczyć SE procentowo według wzoru:

w którym

p = procentowe występowanie zachowania, q = (1 - p)

n = liczba przypadków.

Przykład 10:

W badaniu oszukiwania wśród dzieci w wieku szkolnym, 100 lub 25% z 400 dzieci z domów o wysokim statusie społeczno-ekonomicznym okazało się oszukiwać na różnych testach. Jak dobrze reprezentuje procent populacji?

Rozwiązanie:

p = 25% (procent występowania)

q = 75% (100% - 25%)

99% przedział ufności dla procentowego odsetka populacji od

25% ± 2, 58 x 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

i 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%

Możemy przyjąć z 99% pewnością, że dzieci w wieku szkolnym o wysokim statusie społeczno-ekonomicznym oszukują co najmniej 19, 4% i nie będą większe niż 30, 60%.

(v) Błąd standardowy współczynnika korelacji (SE r lub σ r ):

Klasyczna formuła SE-a

(SE współczynnika korelacji r, gdy N jest duże)

Przykład 11:

n = 120, r = .60.

Jakie są granice 99% przedziału ufności dla populacji r.?

Rozwiązanie:

99% przedział ufności

= r ± 2, 58 SE r = .60 ± 2, 58 SE r

= 0, 60 ± 0, 15 lub 0, 45 do 0, 75

Ważne warunki statystyczne:

(i) Poziomy:

.05:

Prawdopodobieństwo wystąpienia błędu w 5 próbkach na 100 próbek.

.01:

Prawdopodobieństwo wystąpienia błędu w 1 próbce na 100 próbek.

(ii) Zaufanie:

Na poziomie .05 eksperymentator ma 95% pewności, że dane muszą reprezentować populację.

Na poziomie istotności .01 eksperymentator ma 99% pewności, że statystyka próbki musi reprezentować populację.

(iii) Poziomy istotności:

Zanim przetestujemy hipotezę, musimy zdecydować o kryteriach, z którymi chcemy przyjąć lub odrzucić hipotezę zerową. Musimy ustalić poziom istotności przed testem. Istotne są dwa poziomy ważności, mianowicie poziom .05 i poziom .01.

(a) .05 poziom istotności:

Z tabeli A wynika, że ​​95% przypadków w normalnym rozkładzie mieści się w granicach ± ​​1, 96 SE M. Jeżeli przyjmujemy granice określone przez M ± 1, 96 SE M, definiujemy przedział, dla którego poziom ufności wynosi 0, 95. Opierając się na naszej ocenie jako wielkości M na tych limitach, mamy rację w 95% przypadków i niesłuszne 5%.

Obszar pomiędzy - 1, 96 SE M a + 1, 96 SE M jest znany jako obszar akceptacji H o, a obszar poza - 1, 96 SE M i + 1, 96 SE M jest znany jako obszar odrzucenia. Jeżeli jakakolwiek próba leży w obszarze akceptacji, akceptujemy H o . Odrzucając H o, przyznajemy, że średnia próby może wykraczać poza ± 1.96 SE M.

Tak więc, odrzucając H0, popełniamy błąd 5%, ponieważ w 5% ze 100 przypadków taka średnia może wystąpić. Jesteśmy gotowi wziąć aż 5% ryzyka odrzucając H o, gdy to jest prawdą. Zatem kryteria odrzucania H o zaostrzają poziom istotności.

(b) .01 poziom istotności:

Z tabeli A wynika, że ​​99% przypadków normalnego rozkładu mieści się w granicach ± ​​2, 58 SE M. Jeśli pomijamy granice określone przez M ± 2, 58 SE M, definiujemy przedział, dla którego poziom ufności wynosi 0, 99. Opierając naszą ocenę co do wielkości M pop na tych limitach, mamy rację w 99% przypadków i niesłusznie 1%.

Obszar od - 2, 58 SE M do + 2, 58 SE M byłby obszarem akceptacji H 0, a obszar poza nim byłby obszarem odrzucenia H o . Jesteśmy skłonni przyjąć aż 1% ryzyka w odrzuceniu HO, kiedy to się dzieje.

.01 poziom istotności jest bardziej wymagający niż poziom 0, 05, ponieważ na poziomie .01 błąd w odrzuceniu H o wynosi 1%, natomiast w poziomie 0, 05 taki błąd wynosi 5%.

(iv) t-dystrybucja:

Ilekroć N jest mniejsze niż około 30, tj. Gdy próbka jest mała, rozkład próbkowania nazywa się " t- dystrybucja".

Rozkład t nie różni się znacznie od normalnego, chyba że N jest dość mały. Wraz ze wzrostem N rozkład t zbliża się coraz bardziej do normalnej formy.

Właściwości rozkładu t:

1. Wygląda jak krzywa w kształcie dzwonu. Ale jego rozkład jest bardziej zmienny przy zerowej skośności i "Ku" większym niż 3.

2. Jest symetryczny względem linii t = 0.

3. Jest unimodalny z maksymalną rzędną w t = 0.

4. Gdy N jest małe, rozkład t leży pod krzywą normalną, ale ogony lub końce krzywej są wyższe niż odpowiadające części krzywej normalnej.

5. Jednostki wzdłuż linii bazowej t- dystrybucji to w rzeczywistości σ, czyli

(v) Stopnie swobody (df):

Pojęcie stopni swobody jest bardzo ważne w przypadku małych statystyk dotyczących próbek. Ma to również kluczowe znaczenie w analizie wariancji i innych procedur. Stopnie swobody oznaczają swobodę w różnicowaniu się.

Wybierzmy pięć wyników, z których średnia ma wynosić 15. Przypuśćmy teraz, że cztery wyniki to 18, 10, 20, 15. Aby średnia była równa 15, piąta ocena musi wynosić 12. Oczywiście mamy wolność wyboru dowolnych czterech wyników.

Ale nie mamy żadnej swobody w wyborze piątego wyniku, ponieważ piąty wynik powoduje zmiany w wariacji spowodowane przez pierwsze cztery wyniki i przy założeniu, że średnia będzie wynosiła 15. Tutaj N = 5 i jedno ograniczenie jest nałożone, tj. średnia musi wynosić 15. Dlatego stopień swobody wynosi N - 1 lub 4.

Jeśli mamy 5 punktów 5, 6, 7, 8 i 9, średnia wynosi 7; a odchylenia naszych ocen od 7 to - 2, - 1, 0, 1 i 2. Suma tych odchyleń wynosi zero. Spośród 5 odchyleń, tylko 4 (N - 1) można wybrać "dowolnie", ponieważ warunek równości zerowej natychmiast ogranicza wartość odchylenia piątego.

SD jest oczywiście oparty na kwadratach odchyleń wykonanych wokół średniej. Istnieje N df do obliczenia średniej, ale tylko (N - 1) dostępna dla "S" (SD) jako jedna df jest tracona przy obliczaniu średniej.

W innym przykładzie, gdzie N = 10, wartość df dostępna do oszacowania M pop została podana jako 9 lub (N - 1), tj. O jeden mniej niż liczba obserwacji, a mianowicie 10. Jeden df jest tracony przy obliczaniu M i odpowiednio tylko 9 zostało do oszacowania pop- M przez "S" i rozkład t.

Ilekroć do oszacowania parametru wykorzystywana jest statystyka, reguła jest taka, że ​​dostępny df równa się N minus liczba parametrów już oszacowanych na podstawie próbki. M jest oszacowaniem M popu, a obliczając go tracimy 1 df .

Przy szacowaniu niezawodności r, na przykład (która zależy od odchyleń od dwóch środków), df są (N - 2). W przypadku testów chi-kwadrat i analizy wariancji stosuje się odrębne procedury przy ustalaniu wartości df .

(vi) Hipoteza zerowa:

Hipoteza zerowa jest użytecznym narzędziem do testowania znaczenia różnic. Ta hipoteza twierdzi, że nie ma prawdziwej różnicy pomiędzy dwoma populacjami, a różnica między próbnymi środkami jest zatem przypadkowa i nieważna.

Hipoteza zerowa wiąże się z zasadą prawną, że "człowiek jest niewinny, dopóki nie zostanie udowodniony winnym". Stanowi wyzwanie, a funkcją eksperymentu jest dać fakty szansę obalenia (lub nie uronić) tego wyzwania.

Aby to zilustrować, przypuśćmy, że twierdzi się, że "standardy instruktażowe szkół z jedną zmianą są lepsze niż szkoły z podwójną zmianą". Hipoteza ta jest niejasno stwierdzona i nie można jej dokładnie przetestować.

Jeśli stwierdzimy, że "szkoły jednokierunkowe nie dają lepszych standardów nauczania niż szkoły dwudzielne" (prawdziwa różnica wynosi zero). Ta hipoteza zerowa jest dokładna i może być testowana. Jeśli nasza hipoteza zerowa nie podlega opodatkowaniu, musi zostać odrzucona. Instrukcja "bez różnicy" zakłada, że ​​obie grupy zostaną przetestowane i uznane za równe.

Forma zerowa jest preferowana przez większość doświadczonych pracowników badawczych. Ta forma oświadczenia łatwiej definiuje model matematyczny do wykorzystania w teście statystycznym hipotezy.

Hipoteza zerowa nigdy nie jest udowodniona ani podważona. Może być przyjęty lub odrzucony z pewnym stopniem zaufania (lub na pewnym poziomie istotności).

Przed testowaniem hipotezy musimy wziąć pod uwagę następujące kwestie:

1. Czy próbka jest duża czy mała.

2. Jaki jest poziom znaczenia.

3. Czy test jest testem dwustronnym, czy jednostronnym.

(vii) Błędy w sporządzaniu wniosków:

Akceptując lub odrzucając hipotezę zerową, istnieje możliwość popełnienia dwóch rodzajów błędów i żądzy, z którymi borykają się pracownicy naukowi.

Błędy zwane typem I i typem II można wyjaśnić poniżej:

Błędy typu I:

Takie błędy są popełniane, gdy odrzucamy hipotezę zerową, zaznaczając różnicę znaczącą, chociaż nie ma prawdziwej różnicy. Załóżmy, że różnica między dwiema populacjami oznacza (M pop - M pop = 0) jest równa zero. (Na przykład chłopcy i dziewczęta mogą być uważani za osoby o tej samej populacji w odniesieniu do większości testów psychicznych). Jeżeli testowanie znaczenia dwóch próbek oznacza fakt, że różnica w średnich populacji jest znacząca, popełniamy błąd typu I.

Błędy typu II:

Tego typu błędy są popełniane, gdy akceptujemy hipotezę zerową, zaznaczając różnicę nieistotną, chociaż istnieje prawdziwa różnica. Załóżmy, że istnieje prawdziwa różnica między tymi dwoma populacjami.

Jeśli nasz test istotności zastosowany do dwóch próbek oznacza, że ​​różnica w liczbie ludności nie jest znacząca, popełniamy błąd typu II.

Można podjąć różne środki ostrożności, aby uniknąć obu rodzajów błędów. Jeśli ustawimy niski poziom istotności (P jest większy niż .05), zwiększamy prawdopodobieństwo błędów typu I; mając na uwadze, że jeśli ustanowimy wysoki poziom istotności (P jest mniejszy niż 0, 05), błędy typu I będą mniejsze. Możliwość wyciągania błędnych wniosków o sortowaniu typu II jest zwiększana, gdy ustalamy bardzo wysoki poziom istotności.

(viii) dwustronne i jednostronne testy istotności:

W hipotezie zerowej różnice pomiędzy uzyskanymi środkami (tj. M 1 - M 2 ) mogą być plus lub minus. Przy określaniu prawdopodobieństw bierzemy oba ogony rozkładu próbkowania.

(ix) Współczynnik krytyczny (CR):

Współczynnik krytyczny (CR) wyznacza się, dzieląc różnicę między próbnymi środkami przez ich standardowy błąd (CR = D / SE D ). Gdy wartości N próbek są duże (30 lub więcej jest "duże"), rozkład CR jest normalny wokół rzeczywistej różnicy między średnimi populacji, t jest krytycznym współczynnikiem, w którym dokładniejsze oszacowanie σ D jest używany. Rozkład próbkowania t nie jest normalny, gdy N jest mały (mniej niż 30, powiedzmy), t oznacza CR; ale wszystkie CR nie są t.

Test dwustronny:

1. W teście dwustronnym bierzemy pod uwagę oba ogony krzywej normalnej.

2. W przypadku nietypowej hipotezy alternatywnej wykonujemy test dwustronny.

3. Przykład:

Test odsetkowy jest udzielany niektórym chłopcom w zawodzie. Klasa treningowa i niektórzy chłopcy w klasie latynoskiej. Czy średnia różnica między dwiema grupami jest znacząca na poziomie .05?

4. Średnia próbka odbiega od M pop w dowolnym kierunku + lub -.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Wartość za istotną:

1, 96 na poziomie .05

2, 58 na poziomie .01

7. Obszar odrzucania dzieli się na obu końcach (ogony) krzywej normalnej (tj. 05 do .025 i .025, 01 do .005 i .005).

Test jednostronny:

1. Musimy wziąć jeden wysoki, tj. Po lewej stronie lub prawej stronie krzywej normalnej pod uwagę.

2. W przypadku kierunkowej alternatywnej hipotezy wykonujemy test jednostronny, M 1 > M 2 . W takim przypadku kierunek jest bardzo wyraźny - jednostronny.

3.Przykład:

Dziesięć przedmiotów otrzymuje 5 kolejnych śladów po teście z symbolem cyfry, w którym pokazano tylko wyniki dla tras 1 i 5. Czy średni zysk z początkowego do ostatecznego badania jest znaczący?

4. Średnia próbka odbiega od średniej populacji w jednym kierunku.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 lub M 1 <m 2

6. Wartość za istotną:

1, 62 na poziomie .05

2, 33 na poziomie .01

7. Jest jeden obszar odrzucania na prawym ogonie rozkładu lub lewy ogon rozkładu.