Задача по расшифровке генетического кода М.С.Гельфанд Перед Вами данные, доступные исследователям генетического кода на начало 1960 г., непосредственно перед опытом по прямому анализу аминокислот, кодируемых кодонами (нуклеотидными триплетами). Эти данные слегка идеализированы: удалены недостоверные данные и добавлено небольшое количество данных, полученных при проверки уже открытого кода. Тем не менее ситуация сильно напоминает ту, в которой оказались первые исследоваетли, пытавшиеся расшифровать генетический код. Представлены четыре типа данных. Первый – последовательности полипептидов, кодируемые регулярной нуклеотидной последовательностью с известной структурой. Второй – смеси полипептидов, кодируемые нерегулярной нуклеотидной последовательностью с известным соотношением нуклеотидов (обратите внимание: эти данные неполные, для нуклеотидной послеовательности могут быть представлены не все пептиды, получающиеся из нее.) Третий тип данных – мутации в генах, вызываемые азотистой кислотой. Такие мутации могут менять A на G и C на U, приводя к изменениям в кодонах и, соответственно, в аминокислотных последовательностях, кодируемых данными генами. Четвертый вариант – результаты спонтанных (случайных) мутаций (эти данные могут быть использованы для проверки правильности расшифровки генетического кода.) Ваша задача – реконструировать таблицу генетического кода, выяснив соответсвие между кодонами и аминокислотами. Представленные данные не позволяют расшифровать генкод полностью, но Вы должны стремиться разгадать значение как можно большего числа кодонов. Данные: 1a. Следующие регулярные полинуклеотиды дают следующие полипептиды 1 2 3 4 5 6 7 8 9 короткое название polyU polyA polyC polyUC polyUG polyAC polyAG polyUUAC polyUAUC нуклеотидная последовательность …UUUUUUUUUUUUU… …AAAAAAAAAAAAA… …CCCCCCCCCCCCC… …UCUCUCUCUCUCU… …UGUGUGUGUGUGU… …ACACACACACACA… …AGAGAGAGAGAGA… …UUACUUACUUACU… …UAUCUAUCUAUCU… аминокислотная последовательность(и) …-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-… …-Lys-Lys-Lys-Lys-Lys–Lys-Lys–Lys-Lys-… …-Pro-Pro-Pro-Pro-Pro-Pro-Pro-Pro-Pro-… …-Leu-Ser-Leu-Ser-Leu-Ser-Leu-Ser-Leu-… …-Val-Cys-Val-Cys-Val-Cys-Val-Cys-Val-… …-Thr-His-Thr-His-Thr-His-Thr-His-Thr-… …-Arg-Glu-Arg-Glu-Arg-Glu-Arg-Glu-Arg-… …-Leu-Leu-Thr-Tyr-Leu-Leu-Thr-Tyr-Leu-… …-Tyr-Leu-Ser-Ile-Tyr-Leu-Ser-Ile-Tyr-… 1b. Следующие регулярные полинуклеотиды кодируют следующие регулярные полипептиды 10 polyAAG 11 polyUAC 12 polyGUA 13 polyAUC 14 polyGAU 15 polyUUG 16 polyCAA 17 polyUUC …AAGAAGAAGAAGA… …-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-Arg-… …-Lys-Lys-Lys-Lys-Lys-Lys-Lys-Lys-Lys-… …-Glu-Glu-Glu-Glu-Glu-Glu-Glu-Glu-Glu-… …UACUACUACUACU… …-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-… …-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-… …-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-Tyr-… …GUAGUAGUAGUAG… …-Val-Val-Val-Val-Val-Val-Val-Val-Val-… …-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-… …AUCAUCAUCAUCA… …-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-… …-Ile-Ile-Ile-Ile-Ile-Ile-Ile-Ile-Ile-… …-His-His-His-His-His-His-His-His-His-… …GAUGAUGAUGAUG… …-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-Asp-… …-Met-Met-Met-Met-Met-Met-Met-Met-Met-… …UUGUUGUUGUUGU… …-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-… …-Val-Val-Val-Val-Val-Val-Val-Val-Val-… …-Cys-Cys-Cys-Cys-Cys-Cys-Cys-Cys-Cys-… …CAACAACAACAAC… …-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-Thr-… …-Asn-Asn-Asn-Asn-Asn-Asn-Asn-Asn-Asn-… …-Gln-Gln-Gln-Gln-Gln-Gln-Gln-Gln-Gln-… …UUCUUCUUCUUCU… …-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-Ser-… …-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-Leu-… …-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-Phe-… 1c. Два регулярных полинуклеотида, которые не дают длинных пептидов (в основном продуцируются пептиды длиной в три аминокислоты): 18 19 polyGUAA polyGAUA …GUAAGUAAGUAAGUAAG… …GAUAGAUAGAUAGAUAG… 2. Следующие нерегулярные полинуклеотиды (фракция преобладающего нуклеотида 80%) продуцируют нерегулярные полипептиды указанного состава: 1 2 преобладающий нуклеотид. U U остальные нуклеотиды. C A преобладающая аминокислота Phe Phe 3 U G Phe 4 5 6 A A A U G C Lys Lys Lys редкая(ие) аминокислота(ы) Ser, Leu Leu, Ile, Tyr Cys, Val, Leu Asn, Ile Arg, Glu Asp, Gln, Thr очень редкая(ие) аминокислота(ы) Pro Asn Gly, Trp Leu, Tyr Gly His, Pro 3. Мутации в белке оболочки вируса табачной мозаики, вызванные превращениями AG и CU: Было Ala Asp Glu Ile Lys Met Asn Pro Gln Arg Ser Thr Tyr Стало Val Gly Gly Val, Arg Val Ser Leu, Arg Gly Gly, Ala, Cys Met Ser Leu, Phe Met, Ile Та же таблица в другом формате: Было Thr Tyr Ser Glu, Thr Pro, Thr, Lys, Asn, Ile, Arg, Asp, Ser Ser Ile Gln Pro Met, Ala Стало Ala Cys Phe Gly Ile Leu Met Arg Ser Val 4. Сводные данные по спонтанным мутациям в различных белках (триптофан-синтаза Escherichia coli и гемоглобин человека) Было Ala Cys Asp Glu Phe Gly His Ile Lys Leu Asn Pro Gln Arg Ser Thr Val Tyr Стало Asp, Gly Gly, Gln, Leu Val, Tyr, Thr, Glu, Arg, Lys, Gln Glu, Ile, Arg, Ile, Ala, Cys Val, Glu Ala, Asn Val, Stop, Gly, Ala, Asp, Lys Glu, Arg, Ser, Asn, Phe Ser Arg Gly, Leu, Lys, Gly, Arg, Asp, Cys Asp, Asn Asn Gln Thr, Phe, Asn, Asp, Ser Thr Ser Glu Существуют два общепринятых формата таблицы генетического кода . Я уже заполнил наиболее очевидные клетки. аминоксилота Аланин Аргинин Аспарагин Аспартат (аспарагиновая кислота) Валин Гистидин Глицин Глутамат (глутаминовая кислота) Глутамин Изолейцин Лейцин Лизин Метионин Пролин Серин Тирозин Треонин Триптофан Фенилаланин Цистеин UUU UUC UUA UUG CUU CUC CUA CUG AUU AUC AUA AUG GUU GUC GUA GUG Phe UCU UCC UCA UCG CCU CCC CCA CCG ACU ACC ACG ACA GCU GCC GCA GCG Pro трехбуквенное обозначение Ala Arg Asn Asp Val His Gly Glu Gln Ile Leu Lys Met Pro Ser Tyr Thr Trp Phe Cys UAU UAC UAA UAG CAU CAC CAA CAG AAU AAC AAA AAG GAU GAC GAA GAG однобуквенное обозначение A R N D V H G E Q I L K M P S Y T W F C Lys UGU UGC UGA UGG CGU CGC CGA CGG AGU AGC AGA AGG GGU GGC GGA GGG кодон(ы) AAA CCC UUU