Koncepcja testu Chi-Square

W tym artykule omówimy koncepcję testu chi-kwadrat.

Test chi-kwadrat został użyty do sprawdzenia, że ​​allele segregują według zasad Mendla. Wymagane jest porównanie liczb oczekiwanych i obserwowanych. Jest używany w statystykach do oceny znaczenia danych do pobierania próbek. Prof. Fisher opracował test chi-kwadrat. Symbolicznie zapisany jako X 2 (wymawiane jako Ki-kwadrat).

Jest to miara statystyczna, za pomocą której można ocenić istotność różnicy między obserwowanymi liczbami genotypowymi (częstotliwościami) a oczekiwanymi liczbami (częstotliwościami) uzyskanymi z pewnego hipotetycznego wszechświata.

Czy eksperymentalny i przewidywany współczynnik jest w dobrej zgodności, czy nie. Można to przetestować za pomocą testu Chi Square. Test ten określa, że ​​w trakcie każdej procedury eksperymentalnej dotyczącej danych ilościowych, pewną zmianę, zwaną "błędem eksperymentalnym", można przypisać samemu błędowi przypadkowemu.

Można to obliczyć za pomocą następującej formuły:

X 2 = Σ = (obserwowana wartość - oczekiwana wartość) 2 / oczekiwana wartość

Weźmy przykład proporcji fenotypu i genotypu eksperymentów prowadzonych przez Mendla. Dzięki zastosowaniu X 2 wyniki pokazują, że obserwowane częstotliwości są zgodne z przewidywanymi stosunkami. Dane rzeczywistych eksperymentów Mendla podano w poniższej tabeli. Różnice w oczekiwanym i przewidywanym współczynniku wynikają wyłącznie z błędu eksperymentalnego.

Mendel zaobserwował w swoim eksperymencie stosunek 9: 3: 3: 1 w dihybrid cross w generacji F 2, podczas gdy stosunek w monohybrydowym krzyżu w generacji F 2 wynosił 1: 2: 1. Znalazł 315 rund, żółte nasiona, 101 rundy, zielone nasiona, 108 zmarszczek, żółte nasiona i 32 zmarszczki, zielone nasiona.

Tak więc spodziewane liczby każdego fenotypu to 556 (9/16) = 312, 75 okrągłych, żółtych nasion; 556 (3/16) = 104, 25 rundy. Zielone nasiona; 556 (3/16) = 104, 25 zmarszczek, żółte nasiona i 556 (1/16) = 34, 75 zmarszczek, zielone nasiona. Chi-kwadrat pokaże, czy różnica między faktycznym a przewidywanym współczynnikiem wynika z błędu eksperymentalnego, czy też nie.

Obliczona wartość chi-kwadrat to 0, 470, którą uzyskuje się, stosując następującą formułę:

X 2 = Σ = (obserwowana wartość - oczekiwana wartość) 2 / oczekiwana wartość

Stopień swobody jest wymagany do obliczenia X 2, liczba niezależnych ograniczeń określona liczbą stopni swobody (lub df). Stopień swobody jest miarą liczby zmiennych niezależnych obecnych w danym eksperymencie.

Stwierdzono, że szanse na błąd dotyczą tylko jednej zmiennej niezależnej. W eksperymentach Mendelsa powyżej powyższe zmienne mają tylko 4, więc stopień swobody wynosi 4 -1 = 3. Liczba trzech dowolnych klas fenotypowych jest określona, ​​liczba czwartej klasy jest ustalona.

Aby dowiedzieć się, jakie jest prawdopodobieństwo, musimy sprawdzić tabelę Chi-kwadrat.

Tabela jest podana jako:

Hipoteza nigdy nie jest zgodna lub nie zgadza się z wartością P. Wyniki badacza, które są akceptowalne lub niedopuszczalne w odniesieniu do hipotezy, oceniają wyniki obserwacji Chi-kwadrat. 5 punktów procentowych (0-05) na stole jest zwykle wybierane jako arbitralny standard do określania znaczenia lub dobroci dopasowania.

Wartość tablicowa X 2 dla 3 stopni swobody na poziomie 5% wynosi 7, 82, a wartość chi-kwadrat wynosi 0, 47, co jest wartością niższą od wartości tabeli, stąd jest poprawna. Innymi słowy, można powiedzieć, że prawdopodobieństwo na poziomie istotności 5% wynosi 7, 82, co oznacza, że ​​hipoteza jest poprawna. Jeśli jest mniejszy niż 5%, to odrzucony.

Weźmy inny przykład, aby zrozumieć zastosowanie testów chi-kwadrat. Teoria genetyczna stwierdza, że ​​dzieci mające jednego rodzica z grupą krwi A i inne z grupy krwi B zawsze będą należeć do jednego z trzech typów A, AB, B i że proporcja tych trzech typów będzie średnio wynosić 1: 2 : 1. Pobrano próbkę 300 dzieci - 30% okazało się być typem A, 45% - typem AB, a pozostałe - typem B.

Wartość stołu X 2 dla (3 - 1) 2d.f. przy 5% (0, 05) poziomie istotności wynosi 5, 99. Obliczona wartość chi-square wynosi 4, 5, co jest wartością niższą od wartości tabeli i można ją przypisać z powodu przypadkowego błędu eksperymentu. Potwierdza to teoretyczną hipotezę teorii dziedziczenia (segregacji alleli), że A, AB i B stoją w proporcji 1: 2: 1.

Inny przykład w tym związku jest następujący:

Udział ziarna w czterech grupach, a mianowicie A, B, C i D, powinien wynosić 9: 3: 3: 1. Rolnik zasiał 1600 fasoli. Wyniki jego eksperymentu pokazują, że w czterech grupach dane to 882 313 287 i 118. Czy wynik eksperymentu potwierdza teorię, że są one w stosunku 9: 3: 3: 1?

Biorąc hipotezę zerową, że wyniki eksperymentu wspierają teorię, spodziewane częstotliwości to:

9/10 x 1600, 3/16 x 1600, 3/16 x 1600, 1/16 x 1600 = 900, 300, 300, 100

A zatem:

Wartość tabelaryczna X 2 dla 3 df przy poziomie istotności 5% = 7, 815.

Ponieważ obliczona wartość X 2 jest mniejsza niż wartość tabeli, hipoteza może zostać zaakceptowana, a wyniki są zgodne z teorią.

Test Chi-kwadrat służy również do określenia, czy populacja znajduje się w równowadze Hardy'ego-Weinberga.

Jednym z zastosowań metody Hardy'ego-Weinberga jest przewidywanie częstości występowania pojedynczej homozygotycznej względem szkodliwego allelu recesywnego. Autorzy ci odkryli, że losowo kojarzona populacja (panmictic) bez mutacji, bez presji selekcyjnej, bez dryfu genetycznego i bez migracji, względne częstotliwości każdego genu (allelu) mają tendencję do pozostawania niezmiennymi z pokolenia na pokolenie.

Prawo mówi częstotliwość genotypów do częstotliwości genu w losowo krążącej populacji, allele segregujące w dowolnym danym locus mogą łatwo obliczyć spodziewane częstotliwości genotypów w tej populacji. Jest to znane jako prawo Hardy'ego-Weinberga lub często określane jako prawo równowagi populacji.

Kiedy już znamy częstotliwości alleli w populacji, można obliczyć częstotliwości, z którymi genotyp będzie obecny u potomstwa z tego pokolenia. Populacja rozmnażających się płciowo organizmów diploidalnych w locus z dwoma allelami o częstotliwościach p i q, po jednej generacji losowego krycia, częstotliwości genotypu to AA, Aa i aa będą p 2, 2pq, q 2 .

Weźmy przykład, że dwa allele genu AA dominują, podczas gdy allele są genem recesywnym. Zgodnie z prawem odziedziczonym przez Mendla stosunek genotypu wynosiłby 25% AA (homozygotyczna dominanta), 50 byłaby Aa (heterozygotyczna), a 25% byłaby aa (homozygotyczna recesywna).

Formuła statystyczna dla tego prawa to p 2 + 2pq + q 2 . Zgodnie z Prawami Mendla, następujące elementy powinny być kombinacją genetyczną.

To pokazuje, że allele pozostają niezmienne z pokolenia na pokolenie.

Zastosowanie testu chi-kwadrat jest nieco inne, gdy staramy się o prawo Hardy'ego-Weinberga, ponieważ dotyczy raczej częstotliwości oczekiwanego genotypu niż liczb. Stopień swobody przyjmuje się n-2 zamiast n-1.