Задача по расшифровке генетического кода

advertisement
Задача по расшифровке генетического кода
М.С.Гельфанд
Перед Вами данные, доступные исследователям генетического кода на начало 1960 г.,
непосредственно перед опытом по прямому анализу аминокислот, кодируемых кодонами
(нуклеотидными триплетами). Эти данные слегка идеализированы: удалены недостоверные
данные и добавлено небольшое количество данных, полученных при проверки уже открытого
кода. Тем не менее ситуация сильно напоминает ту, в которой оказались первые исследоваетли,
пытавшиеся расшифровать генетический код.
Представлены четыре типа данных. Первый – последовательности полипептидов,
кодируемые регулярной нуклеотидной последовательностью с известной структурой. Второй –
смеси полипептидов, кодируемые нерегулярной нуклеотидной последовательностью с
известным соотношением нуклеотидов (обратите внимание: эти данные неполные, для
нуклеотидной послеовательности могут быть представлены не все пептиды, получающиеся из
нее.) Третий тип данных – мутации в генах, вызываемые азотистой кислотой. Такие мутации
могут менять A на G и C на U, приводя к изменениям в кодонах и, соответственно, в
аминокислотных последовательностях, кодируемых данными генами. Четвертый вариант –
результаты спонтанных (случайных) мутаций (эти данные могут быть использованы для
проверки правильности расшифровки генетического кода.)
Ваша задача – реконструировать таблицу генетического кода, выяснив соответсвие
между кодонами и аминокислотами. Представленные данные не позволяют расшифровать
генкод полностью, но Вы должны стремиться разгадать значение как можно большего числа
кодонов.
Данные:
1a. Следующие регулярные полинуклеотиды дают следующие полипептиды
1
2
3
4
5
6
7
8
9
короткое
название
polyU
polyA
polyC
polyUC
polyUG
polyAC
polyAG
polyUUAC
polyUAUC
нуклеотидная
последовательность
…UUUUUUUUUUUUU…
…AAAAAAAAAAAAA…
…CCCCCCCCCCCCC…
…UCUCUCUCUCUCU…
…UGUGUGUGUGUGU…
…ACACACACACACA…
…AGAGAGAGAGAGA…
…UUACUUACUUACU…
…UAUCUAUCUAUCU…
аминокислотная последовательность(и)
…-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-…
…-Lys-Lys-Lys-Lys-Lys–Lys-Lys–Lys-Lys-…
…-Pro-Pro-Pro-Pro-Pro-Pro-Pro-Pro-Pro-…
…-Leu-Ser-Leu-Ser-Leu-Ser-Leu-Ser-Leu-…
…-Val-Cys-Val-Cys-Val-Cys-Val-Cys-Val-…
…-Thr-His-Thr-His-Thr-His-Thr-His-Thr-…
…-Arg-Glu-Arg-Glu-Arg-Glu-Arg-Glu-Arg-…
…-Leu-Leu-Thr-Tyr-Leu-Leu-Thr-Tyr-Leu-…
…-Tyr-Leu-Ser-Ile-Tyr-Leu-Ser-Ile-Tyr-…
1b. Следующие регулярные полинуклеотиды кодируют следующие регулярные полипептиды
10 polyAAG
11 polyUAC
12 polyGUA
13 polyAUC
14 polyGAU
15 polyUUG
16 polyCAA
17 polyUUC
…AAGAAGAAGAAGA… …-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-…
…-Lys-Lys-Lys-Lys-Lys-Lys-Lys-Lys-Lys-…
…-Glu-Glu-Glu-Glu-Glu-Glu-Glu-Glu-Glu-…
…UACUACUACUACU… …-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-…
…-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-…
…-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-…
…GUAGUAGUAGUAG… …-Val-Val-Val-Val-Val-Val-Val-Val-Val-…
…-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-…
…AUCAUCAUCAUCA… …-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-…
…-Ile-Ile-Ile-Ile-Ile-Ile-Ile-Ile-Ile-…
…-His-His-His-His-His-His-His-His-His-…
…GAUGAUGAUGAUG… …-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-…
…-Met-Met-Met-Met-Met-Met-Met-Met-Met-…
…UUGUUGUUGUUGU… …-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-…
…-Val-Val-Val-Val-Val-Val-Val-Val-Val-…
…-Cys-Cys-Cys-Cys-Cys-Cys-Cys-Cys-Cys-…
…CAACAACAACAAC… …-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-…
…-Asn-Asn-Asn-Asn-Asn-Asn-Asn-Asn-Asn-…
…-Gln-Gln-Gln-Gln-Gln-Gln-Gln-Gln-Gln-…
…UUCUUCUUCUUCU… …-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-…
…-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-…
…-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-…
1c. Два регулярных полинуклеотида, которые не дают длинных пептидов (в основном
продуцируются пептиды длиной в три аминокислоты):
18
19
polyGUAA
polyGAUA
…GUAAGUAAGUAAGUAAG…
…GAUAGAUAGAUAGAUAG…
2. Следующие нерегулярные полинуклеотиды (фракция преобладающего нуклеотида 80%)
продуцируют нерегулярные полипептиды указанного состава:
1
2
преобладающий
нуклеотид.
U
U
остальные
нуклеотиды.
C
A
преобладающая
аминокислота
Phe
Phe
3
U
G
Phe
4
5
6
A
A
A
U
G
C
Lys
Lys
Lys
редкая(ие)
аминокислота(ы)
Ser, Leu
Leu, Ile,
Tyr
Cys, Val,
Leu
Asn, Ile
Arg, Glu
Asp, Gln,
Thr
очень редкая(ие)
аминокислота(ы)
Pro
Asn
Gly, Trp
Leu, Tyr
Gly
His, Pro
3. Мутации в белке оболочки вируса табачной мозаики, вызванные превращениями AG и
CU:
Было
Ala
Asp
Glu
Ile
Lys
Met
Asn
Pro
Gln
Arg
Ser
Thr
Tyr
Стало
Val
Gly
Gly
Val,
Arg
Val
Ser
Leu,
Arg
Gly
Gly,
Ala,
Cys
Met
Ser
Leu, Phe
Met, Ile
Та же таблица в другом формате:
Было
Thr
Tyr
Ser
Glu,
Thr
Pro,
Thr,
Lys,
Asn,
Ile,
Arg, Asp, Ser
Ser
Ile
Gln
Pro
Met, Ala
Стало
Ala
Cys
Phe
Gly
Ile
Leu
Met
Arg
Ser
Val
4. Сводные данные по спонтанным мутациям в различных белках (триптофан-синтаза
Escherichia coli и гемоглобин человека)
Было
Ala
Cys
Asp
Glu
Phe
Gly
His
Ile
Lys
Leu
Asn
Pro
Gln
Arg
Ser
Thr
Val
Tyr
Стало
Asp,
Gly
Gly,
Gln,
Leu
Val,
Tyr,
Thr,
Glu,
Arg,
Lys,
Gln
Glu,
Ile,
Arg,
Ile,
Ala,
Cys
Val, Glu
Ala, Asn
Val, Stop, Gly, Ala, Asp, Lys
Glu,
Arg,
Ser,
Asn,
Phe
Ser
Arg
Gly,
Leu,
Lys,
Gly,
Arg, Asp, Cys
Asp, Asn
Asn
Gln
Thr,
Phe,
Asn,
Asp,
Ser
Thr
Ser
Glu
Существуют два общепринятых формата таблицы генетического кода . Я уже заполнил
наиболее очевидные клетки.
аминоксилота
Аланин
Аргинин
Аспарагин
Аспартат (аспарагиновая кислота)
Валин
Гистидин
Глицин
Глутамат (глутаминовая кислота)
Глутамин
Изолейцин
Лейцин
Лизин
Метионин
Пролин
Серин
Тирозин
Треонин
Триптофан
Фенилаланин
Цистеин
UUU
UUC
UUA
UUG
CUU
CUC
CUA
CUG
AUU
AUC
AUA
AUG
GUU
GUC
GUA
GUG
Phe
UCU
UCC
UCA
UCG
CCU
CCC
CCA
CCG
ACU
ACC
ACG
ACA
GCU
GCC
GCA
GCG
Pro
трехбуквенное
обозначение
Ala
Arg
Asn
Asp
Val
His
Gly
Glu
Gln
Ile
Leu
Lys
Met
Pro
Ser
Tyr
Thr
Trp
Phe
Cys
UAU
UAC
UAA
UAG
CAU
CAC
CAA
CAG
AAU
AAC
AAA
AAG
GAU
GAC
GAA
GAG
однобуквенное
обозначение
A
R
N
D
V
H
G
E
Q
I
L
K
M
P
S
Y
T
W
F
C
Lys
UGU
UGC
UGA
UGG
CGU
CGC
CGA
CGG
AGU
AGC
AGA
AGG
GGU
GGC
GGA
GGG
кодон(ы)
AAA
CCC
UUU
Download