Proces przewidywania i liczenia genów

Proces przewidywania i liczenia genów!

Annonation to proces, który identyfikuje geny, ich sekwencje regulatorowe i możliwe funkcje. Annonacja oznacza geny kodujące niebiałkowe, kodujące geny dla RNA r, RNA t i RNA jądrowe, ruchome elementy genetyczne i powtarzalne rodziny sekwencji obecne w genomie.

Zadanie annonacji rozpoczyna się dopiero po uzyskaniu sekwencji genomu. Prognozowanie genów jest ważnym problemem w biologii obliczeniowej i istnieją różne logarytmy, które można wykorzystać do prognozowania genów wykorzystując zidentyfikowane geny jako zbiór danych treningowych.

Zliczanie genów staje się trudne ze względu na znajomość pozycji genów w genomie. Obecność zachodzących na siebie genów i wariantów splicingowych utrudnia to zadanie. Trudno jest przewidzieć, które części DNA należy uznać za te same lub wiele różnych genów.

Ryc.6.70. Mapa SNP

Wiele genów w eukariotach ma wzór eksonów (regionów kodujących), po których następują introny (regiony niekodujące). Z tego powodu geny nie są zorganizowane jako ciągłe ORF (otwarte ramki odczytu). ORF ma serię kodonów, które określają sekwencję aminokwasów.

Drugie geny w eukariontach są zwykle szeroko rozstawione, dzięki czemu mają więcej szans na zlokalizowanie fałszywych genów. Ale nowe techniki oprogramowania do skanowania ORF dla genów eukariotycznych sprawiają, że skanowanie jest bardziej wydajne. Teraz możemy zliczyć geny organizmu (z pewnym błędem eksperymentalnym).

Mówi się, że około 99, 8% z 3, 2 miliarda par zasad między dwoma ludźmi jest takie samo i tylko 0, 2% różne. Na każde 500 nukleotydów tylko jeden nukleotyd różni się między dwoma osobnikami. Oznacza to, że zmienność w kilku miejscach w sekwencji DNA może prowadzić do ciężkiej choroby i różnych postaci u ludzi.

Podobieństwo genomu, SNP i genomika porównawcza:

Jak już powiedziałem, 99, 8% każdego ludzkiego genomu jest podobne do jakiegokolwiek innego ludzkiego genomu i 0, 2% różne. Oznacza to, że dwie osoby różnią się jedynie 6 milionami lokalizacji z 3, 2 miliarda lokalizacji.

Jeśli te lokalizacje mają niewielki wpływ, to dwie istoty ludzkie będą identyczne. Ludzie są w ponad 98% podobni do szympansów. Różnica w kilku miejscach DNA prowadzi do tego, że indywidualizacja staje się wyjątkowa. Na każde 500-1000 nukleotydów jeden nukleotyd różni się między dwoma osobnikami.

Ważnymi zmianami w poszczególnych genomach są polimorfizmy pojedynczego nukleotydu lub SNP, które obserwowano zarówno w regionach kodujących jak i niekodujących genomu. SNP są w zasadzie zmianami w pojedynczej bazie tj. A, C, G lub T prowadzącymi do zmian DNA prowadzących do istnienia różnych liter w takich pozycjach. Rodzaj nukleotydów lub zasad obecnych w danej lokalizacji na chromosomie może się różnić u różnych osób.

Mówi się, że 90% zmienności sekwencji u ludzi wynika z obecności SNP. W ten sposób SNP zapewniają marker molekularny, który jest obecny w dużej gęstości.

W odciskach palców DNA w szczególnie niekodujących częściach genomu wykorzystuje się takie różnice genetyczne u różnych ludzi.

Takie zmiany genetyczne są również odpowiedzialne za pogorszenie choroby i reakcję organizmu na leczenie. Pojedyncza podstawowa różnica w genie Apo E prowadzi do choroby Alzheimera, a delecja w obrębie CCRS (gen receptora chemokin) odpowiada za oporność na HW i AIDS.

SNP są używane do mapowania genów zaangażowanych w choroby ludzi. Używając SNP jako markerów, można zmapować każdy gen w ludzkim genomie. SNP są zlokalizowane w obrębie genu lub mogą wykazywać ścisłe połączenie.

Dane sekwencji są przechowywane w bazach danych i są analizowane w celu poznania SNP. W celu identyfikacji SNP opracowano chipy DNA i mikromacierze. Lekarze za pomocą próbek DNA pacjentów mogą identyfikować wzór profilu genotypu SNP. W ten sposób są w stanie określić reakcję pacjentów na określony typ leku.

Dział medycyny, który bada wpływ zmienności genetycznej na podatność na choroby i odpowiedź na leki, nazywa się farmakogenomiką.

Ponieważ niewiele SNPs różnią się częstotliwością w różnych populacjach, analiza SNP może być wykorzystana do badania genetyki populacyjnej.

Warto zauważyć, że genomy myszy i człowieka bardzo przypominają się nawzajem (około 97, 5%). Szympans i ludzki genom różnią się tylko w stosunku 1 - 3%. Można więc wywnioskować, że to ze względu na dzielenie wspólnego przodka 100 milionów lat temu i nie zaszło wiele zmian w genomie.

Z tych drobnych różnic genetycznych wynika ludzka odmiana, taka jak różnice wzroku, koloru włosów, wielkości stopy itp. Niektóre z SNP są powiązane z konkretnymi ludzkimi populacjami i dostarczają informacji o ludzkich migracji, które miały miejsce kilka lat temu i o bardziej odległej ewolucyjnej przeszłości .