Глава 5
Теоретические основы
молекулярной биологии
и биоинформатики. Методы
5.1
ВВЕДЕНИЕ
Проект «Геном человека» после своего завершения стал одной из самых
важных вех в истории науки. Человеческий геном содержит информацию, необходимую для развития и сохранения человека, и может служить
для изучения процессов, происходящих на клеточном или молекулярном
уровне как в здоровом организме, так и при различных заболеваниях.
Геном представляет собой полный набор ДНК организма и несет всю информацию о строении любого белка, продуцируемого клеткой. Понимание того, что ДНК лежит в основе жизнедеятельности клетки, привело к
бурному развитию молекулярной биологии. Сегодня молекулярная биология воспринимается не просто как очень важная информативная область биологической науки, а как необходимое средство для исследования
и описания очень сложных биологических процессов. Развитие методов
и технологий для изучения процессов на молекулярном уровне привело
к появлению новых мощных методов выделения и анализа нуклеиновых
кислот, а также их применений. Более того, лавина поступающей биологической информации вызвала появление новой области науки — биоинформатики, которая уже играет очень важную роль в современной биологической науке. Завершение проекта «Геном человека» и многих других
проектов привело к развитию новых очень интересных областей биологии — биотехнологии, геномного картирования, молекулярной медицины
и генной терапии.
Прежде чем перейти к их рассмотрению, следует познакомиться с основами структуры нуклеиновых кислот. Ведь именно структура определяет функции нуклеиновых кислот in vivo и in vitro. Действительно,
многие методы молекулярной биологии имитируют в некотором смысле природные функции нуклеиновых кислот, такие как репликация и
транскрипция. Эта глава представит нам обзор особенностей структуры
и функций нуклеиновых кислот; здесь будут описаны некоторые методы
их выделения и анализа.
190
Глава 5. Теоретические основы молекулярной биологии. Методы
5.2
СТРУКТУРА НУКЛЕИНОВЫХ КИСЛОТ
5.2.1
Первичная структура нуклеиновых кислот
ДНК и РНК представляют собой макромолекулярные структуры, построенные из нуклеотидов по аналогии с регулярными полимерами.
Нуклеотиды, строительные блоки нуклеиновых кислот, образованы из
нуклеозидов, которые состоят из двух остатков: пятичленного сахара
пентозы (2-дезоксирибоза в ДНК и рибоза в РНК) и азотистого основания. При нумерации атомов углерода в остатке сахара используют
цифры со штрихом (1', 2', 3' и т. д.), чтобы отличить их от атомов углерода азотистых оснований (пуринов и пиримидинов). Нуклеотид, или
нуклеозидфосфат, образуется при присоединении фосфата по 5'-положению нуклеозида эфирной связью (рис. 5.1). Нуклеотиды могут быть
соединены посредством еще одной эфирной связи в результате реакции
между концевой фосфатной группой одного нуклеотида и 3'-гидроксильной группой другого, при этом между соседними сахарами образуется
5' 3'-фосфодиэфирная связь; этот процесс может повторяться многократно, в результате возникает длинная молекула полинуклеотида
(рис. 5.2). ДНК содержит две такие полинуклеотидные цепи: каждая
цепь имеет свободную 5'-гидроксильную группу на одном конце и свободную 3'-гидроксильную группу на другом, поэтому каждая цепь имеет
полярность, или направленность. Полярности каждой из двух цепей одной молекулы ДНК противоположны; таким образом, ДНК представляет собой «антипараллельную» структуру (pис. 5.3).
Рис. 5.1. Нуклеозиды и нуклеотиды
Структура нуклеиновых кислот
191
При многократном
повторении образуется
полинуклеотид
Рис. 5.2. Полинуклеотид
Рис. 5.3. Антипараллельные цепи ДНК. Одна цепь двойной спирали направлена от
5'-конца к 3'-концу, другая цепь — в противоположном направлении, от 3'- к 5'-концу.
Цепи удерживаются вместе водородными связями между основаниями
192
Глава 5. Теоретические основы молекулярной биологии. Методы
Пуриновые основания (конденсированная структура из пяти- и шестичленных колец) аденин (А) и гуанин (G), а также пиримидиновое основание (одно шестичленное кольцо) цитозин (С) обнаруживаются как в ДНК,
так и в РНК. Другие пиримидины встречаются только в одном типе нуклеиновой кислоты: урацил (U) — в РНК, тимин (Т) — в ДНК. Таким образом,
можно отличить РНК от ДНК по присутствию рибозы и урацила в РНК и
дезоксирибозы и тимина в ДНК. Однако именно последовательность оснований отличает одну молекулу ДНК (или РНК) от другой. Принято записывать
последовательность оснований нуклеиновой кислоты, начиная от 5'-конца
молекулы, используя заглавную букву для каждого основания, например
CGGATCT. Важно отметить, что нет необходимости указывать сахарные
или фосфатные группы, так как они идентичны на протяжении всей молекулы. Концевые фосфатные группы (англ. phosphate) могут быть обозначены, где это необходимо, буквой «р»; таким образом, запись 5'-рCGGATCT-3'
указывает на наличие фосфата на 5'-конце молекулы.
5.2.2
Вторичная структура нуклеиновых кислот
Две полинуклеотидные цепи в ДНК обычно свернуты в правозакрученную
двойную спираль, в которой азотистые основания обеих цепей направлены в центр молекулы, а сахаро-фосфатный остов выставлен наружу. Важной
особенностью этой двунитевой (двухцепочечной, двухтяжевой) структуры
является то, что последовательность оснований в одной цепи комплементарна последовательности оснований в другой цепи. Пуриновое основание,
присоединенное к сахарному остатку в одной цепи, всегда связано водородной связью с пиримидиновым основанием, присоединенным к сахарному
остатку в другой цепи. Более того, аденин (А) всегда образует пару с тимином (Т) (или урацилом (U) в РНК) с помощью двух водородных связей,
а гуанин (G) — с цитозином (С) с помощью трех водородных связей
(рис. 5.4). Когда эти условия соблюдены, образуется устойчивая двунитевая
структура, в которой остовы двух цепей (тяжей) находятся в среднем на
одинаковом расстоянии друг от друга. Таким образом, если известна последовательность одной из цепей, можно определить последовательность
другой цепи. Цепи обозначаются «плюсом» (+) и «минусом» (–); в процессе транскрипции происходит синтез молекулы РНК, комплементарной
«минус» цепи ДНК (разд. 5.5.3). Последовательность оснований может вызвать значительные локальные вариации в трехмерной структуре молекулы ДНК, и эти вариации являются жизненно важными для специфических
взаимодействий между ДНК и различными белками. Хотя трехмерная
структура ДНК может изменяться, в целом in vivo она сохраняет структуру
двойной спирали, именуемую В-формой или B-ДНК. Существуют также
другие формы правозакрученной ДНК, такие как А и С, которые образуются из нитей ДНК при различном уровне влажности (табл. 5.1).
Основная особенность В-ДНК состоит в том, что один виток двойной
спирали содержит 10 оснований; кроме того, в молекуле можно идентифицировать большой и малый желобки (рис. 5.5). В определенных условиях,
когда встречаются повторяющиеся последовательности, ДНК может при-
Структура нуклеиновых кислот
193
,
Рис. 5.4. Спаривание оснований в ДНК.
— углерод в 1'- положении дезоксирибозы
Таблица 5.1. Различные формы ДНК
Форма ДНК
Влажность,
%
Направление
спирали
Число оснований
на виток спирали
Диаметр
спирали, Å
В
А
С
Z
92
75
66
(Ру-Рu)n
ПЗ
ПЗ
ПЗ
ЛЗ
10
11
9,3
12
19
23
19
18
ПЗ — правозакрученная спираль; ЛЗ — левозакрученная спираль; Pu — пурин; Py — пиримидин. Различные формы ДНК могут быть получены при разном значении относительной
влажности. В-форма является наиболее общей формой ДНК, тогда как А- и С-формы были
получены в лабораторных условиях. Z-форма может быть создана последовательностью ДНК,
образованной чередующимися пуриновыми и пиримидиновыми нуклеотидами.
нимать форму левозакрученной спирали — так называемая Z-ДНК. Эта
форма была впервые синтезирована в лаборатории и, по всей вероятности,
не существует in vivo. Наличие различных форм ДНК говорит о том, что
это не статичная, а динамичная структура — постоянно изменяющаяся молекула, которая может быть свернута, согнута или искривлена при определенных условиях. Хотя РНК почти всегда существует как одноцепочечная
молекула, она часто содержит комплементарные последовательности, ко-
194
Глава 5. Теоретические основы молекулярной биологии. Методы
Рис. 5.5. Двойная спираль ДНК
торые при сближении в результате изгиба молекулы могут образовывать
шпильки. Известным примером является транспортная РНК (тРНК), которая свернута таким образом, что образует вторичную структуру в виде
листа клевера (рис. 5.6).
5.2.3
Денатурация двухцепочечной ДНК
Две антипараллельные цепи ДНК удерживаются вместе только слабыми водородными связями между комплементарными основаниями и частично гидрофобными взаимодействиями между соседними стопками
пар оснований (так называемый стэкинг оснований). Чтобы разделить несколько пар оснований, необходимо затратить немного энергии,
и в этот момент короткие участки ДНК существуют в одноцепочечной
конформации. Однако при комнатной температуре такие участки немедленно снова образуют пары, так что в целом молекула остается двухнитевой.
Однако, если раствор ДНК нагревать до 90 °C или выше, кинетическая энергия будет достаточной, чтобы полностью денатурировать ДНК,
приводя к разделению на одноцепочечные молекулы. За процессом денатурации можно наблюдать спектрофотометрически по поглощению све-
Структура нуклеиновых кислот
195
Рис. 5.6. Вторичная структура дрожжевой тРНКPhe. Последовательность из 76 рибонуклеотидов образует четыре двухцепочечные области («стебли») благодаря попарному
связыванию оснований в комплементарных последовательностях. Антикодон связывается с UUU или UUC (оба являются кодонами для фенилаланина), фенилаланин присоединяется к 3'-концу с помощью специфической аминоацил-тРНК-синтетазы. Присутствуют некоторые необычные основания: D — дигидроуридин; Т — риботимидин;
— псевдоуридин; Y — очень сильно модифицированное, непохожее ни на одно «нормальное» основание. mX означает метилирование основания Х (m2Х означает диметилирование); Хm означает метилирование рибозы в положении 2'
та при 260 нм. Спаренные основания двухцепочечной ДНК поглощают
свет хуже, чем свободные основания в одноцепочечной молекуле, поэтому
поглощение при 260 нм увеличивается при денатурации ДНК. Это явление называют гиперхромным эффектом.
196
Глава 5. Теоретические основы молекулярной биологии. Методы
Можно построить график зависимости поглощения при 260 нм от температуры раствора ДНК (рис. 5.7). Из графика видно, что слабая денатурация начинается уже около 70 °C, но дальнейший подъем температуры
приводит к значительной денатурации. В конечном итоге достигается такая температура, при которой образец становится полностью денатурированным, или расплавленным. Температура, при которой расплавлено 50%
ДНК, называется температурой плавления (Тпл); Тпл зависит от природы ДНК (рис. 5.7). Было обнаружено, что Тпл выше для тех молекул ДНК,
которые содержат больше цитозина и гуанина, таким образом, Тпл может
быть использована для определения доли C+G в образце ДНК. Эта связь
между Тпл и содержанием С+G объясняется тем, что пары цитозин+гуанин
образуются за счет трех водородных связей, тогда как тимин+аденин образуют только две общие связи. Из-за различного числа связей в парах АТ и
СG для денатурации последовательности с преобладанием пар СG требуется больше энергии. Условия, необходимые для денатурации определенной
нуклеотидной последовательности, также зависят от внешней среды, например от концентрации солей.
Если охладить расплавленную ДНК, можно вновь соединить разъединенные цепи. Такой процесс называется ренатурацией. Однако
стабильная двухцепочечная молекула образуется только при абсолютно
правильном образовании пар оснований. Такое событие маловероятно,
если ДНК длинная и сложная (т. е. содержит много различных генов).
Измерение скорости ренатурации может дать информацию о сложности
строения ДНК (разд. 5.3).
Цепи РНК и ДНК могут ассоциировать между собой, если их нуклеотидные последовательности комплементарны, в результате чего образуются двухцепочечные гибридные молекулы. Благодаря этому фрагменты радиоактивно меченных РНК или ДНК могут служить зондами для
молекул ДНК, которым они комплементарны (разд. 5.7). Эта гибриди-
Tпл
Рис. 5.7. Кривая плавления ДНК
Гены и структура генома
197
зация комплементарных цепей нуклеиновых кислот очень успешно используется для выделения специфических фрагментов ДНК из сложной
смеси (разд. 5.10). Небольшие одноцепочечные фрагменты ДНК (длиной
до 40 пар оснований), называемые олигонуклеотидами, могут гибридизоваться с денатурированным образцом ДНК. Такой тип гибридизации
называется отжигом и зависит от последовательности олигонуклеотида
и концентрации соли в образце.
5.3
ГЕНЫ И СТРУКТУРА ГЕНОМА
5.3.1
Сложная структура гена
Участок молекулы ДНК, кодирующий единственную молекулу РНК или
белка, называется геном, а полный набор генов в клетке, органелле или
вирусе называется геномом. Клетки и органеллы могут содержать более одной копии генома. Геномная ДНК почти всех прокариотических и
эукариотических организмов существует в комплексе с белком и называется хромосомной ДНК. Каждый ген находится на хромосоме на своем
месте, которое называется локусом, определенная форма гена называется аллелем. У млекопитающих каждый ген представлен двумя аллелями, которые могут быть идентичными (гомозигота) или различаться
(гетерозигота). При выполнении проекта «Геном человека» показано,
что в геноме человека ~ 28 000 генов. Однако различные варианты процессинга могут увеличить число белков в клетке по отношению к числу
генов. Существование разных аллелей на одном и том же участке в геноме называется полиморфизмом. Чем более сложный организм, тем
сложнее его геном, хотя это правило не всегда выполняется, поскольку
многие высшие организмы имеют некодирующие последовательности,
некоторые из них повторяются много раз (повторы ДНК). В ДНК млекопитающих повторы можно разделить на низкокопийные и высококопийные. Последние могут быть распределены по всему геному, а могут
образовывать кластеры. Повторяющиеся кластерные ДНК (табл. 5.2) подразделяют на так называемые классические сателлитные ДНК, минисателлитные ДНК и микросателлитные ДНК (состоят в основном
из динуклеотидных повторов). Эти последовательности называются полиморфными; у разных людей они различаются, что служит основой для
ДНК-фингерпринтинга (разд. 6.8.7).
5.3.2
Полиморфизм одного нуклеотида
В геноме существует дополнительный источник полиморфного разнообразия, называемый полиморфизмом одного нуклеотида — SNPs* (single
nucleotide polymorphism). SNPs возникают при замене одного основания в
определенном положении внутри генома. Те из «снипсов», которые встре* Произносится «снипсы» — во множественном числе (SNPs). — Прим. перев.
198
Глава 5. Теоретические основы молекулярной биологии. Методы
Таблица 5.2. Повторяющиеся сателлитные последовательности ДНК и их
характеристики
Тип повтора ДНК
Размер
Характеристики/мотивы
повтора, п.н.
Сателлитная ДНК
5–200
Минисателлитная ДНК
Теломерная
последовательность
Большие повторы (м.п.н.), обычно
встречаются в центромерах
6
Найдена на концах хромосом. Повторяющаяся G-богатая последовательность может достигать 20 т.п.н.
Повторяющаяся последовательность
может достигать 20 т.п.н.
Часто встречается мононуклеотидный
повтор аденинового динуклеотида,
обычно обозначаемый VNTR
(variable number tandem repeat)
Гипервариабельная
последовательность
Микросателлитная ДНК
10–60
1–4
п.н. — пары нуклеотидов, т.п.н. — тысячи пар нуклеотидов, м.п.н. — миллионы пар нуклеотидов.
чаются в кодирующих областях, называются сSNPs («си-снипсы», буква «с»
(си) от англ. codon). По оценкам, SNPs встречаются один раз на каждые
300 п.н., и в человеческом геноме их существует примерно 10 млн. Интерес
к SNPs связан с тем, что у разных людей они могут оказывать влияние на
подверженность организма заболеваниям, метаболизм лекарств и ответные реакции на внешние факторы. В настоящее время предпринимается
множество попыток идентифицировать SNPs и получить геномную карту
SNPs. Некоторое количество таких карт частично завершено и создано
множество баз данных, например SNPs-консорциум.
5.3.3
Хромосомы и кариотипы
Высшие организмы могут быть идентифицированы на основании размера и формы их генетического материала в определенной точке в цикле
клеточного деления, называемой метафазой, когда ДНК конденсируется,
образуя набор четко различимых хромосомных структур. На этой стадии
могут быть идентифицированы различные морфологические структуры
хромосом, включая центромерный и теломерный участки. Хромосомы
данного организма можно покрасить красителем Гимза и проанализировать с помощью светового микроскопа. Полный набор хромосом организма называется кариотипом. При определенных генетических нарушениях могут наблюдаться аномалии размера, формы и числа хромосом, и
кариотип может быть использован для идентификации этого нарушения
(разд. 6.8.2). Возможно, наилучший пример — синдром Дауна, при котором существуют три копии 21-й хромосомы (трисомия 21) в отличие от двух
копий в норме.
Гены и структура генома
5.3.4
199
Кинетика ренатурации и сложность генома
Если образцы двухнитевой ДНК денатурировать с последующей ренатурацией, по скорости ренатурации можно оценить сложность ДНК, т. е. содержащееся в ней количество информации, выраженное в парах оснований.
Молекула может быть значительно менее сложной, чем это ожидается исходя из ее общей длины, если некоторые ее участки содержат повторы, но
сложность молекулы вполне соответствует общей длине, если все последовательности уникальны, т. е. встречаются в геноме только один раз. На практике ДНК сначала разрезают случайным образом на фрагменты размером
несколько тысяч нуклеотидов (разд. 5.8) и затем полностью денатурируют,
нагревая до плавления, Тпл (разд. 5.2.3). Ренатурацию при температуре на
10 °C ниже Тпл регистрируют либо по уменьшению поглощения при 260 нм
(гиперхромный эффект), либо путем пропускания периодически отбираемых порций образца через колонку с гидроксиапатитом (который связывает двухцепочечную ДНК), измеряя количество связавшегося на колонке
образца. Степень ренатурации зависит от концентрации ДНК (С0, число
нуклеотидов в единице объема) и времени ренатурации (t, секунды).
Из значений С0 видно, что препарат ДНК бактериофага , размер генома которого составляет 49 т.п.н., содержит намного больше копий одной и той же последовательности в единице объема, чем препарат ДНК
человека (размер гаплоидного генома 3 106 т.п.н.), и, кроме того, ДНК
фага ренатурирует гораздо быстрее, поскольку в единице объема больше
комплементарных молекул и, следовательно, имеется больше шансов для
столкновения двух комплементарных цепей. Обычно для сравнения скоростей ренатурации различных образцов ДНК измеряют С0 и время, необходимое для завершения половины цикла ренатурации (t1/2); на графике от-
Рис. 5.8. Кривая C0t для ДНК человека. Кривая отражает ренатурацию ДНК при 60 °C
после полного разделения цепей в результате нагревания. Образцы отбирали через определенные интервалы времени и пропускали через колонку с гидроксиапатитом, чтобы
определить долю двухспиральной ДНК. Строили график зависимости процентного содержания двухспиральной ДНК от логарифма C0t (произведение концентрации ДНК до
денатурации на время ренатурации)
200
Глава 5. Теоретические основы молекулярной биологии. Методы
кладывают произведение С0 t1/2. Чем больше значение С0 t1/2, тем сложнее ДНК; следовательно, значение С0 t1/2 значительно меньше для ДНК
фага , чем для ДНК человека.
Действительно, ренатурация ДНК человека не происходит однородно.
Если построить график ренатурации относительно log С0t (так называемую C0t-кривую), можно увидеть, что часть молекул ДНК ренатурирует довольно быстро, а другие молекулы ДНК — очень медленно (pис. 5.8).
Этот факт указывает на то, что часть последовательностей существует в
более высокой концентрации; другими словами, часть генома состоит из
повторяющихся последовательностей. Эти повторяющиеся последовательности могут быть отделены от уникальной ДНК при пропускании образца
ДНК через колонку с гидроксиапатитом в начале процесса ренатурации,
т. е. при низком значении С0t. На этой стадии только быстро ренатурирующие последовательности являются двухцепочечными, и поэтому только
они способны связываться с колонкой.
5.3.5
Природа генетического кода
ДНК кодирует первичную последовательность белка с помощью набора из
трех нуклеотидов, называемого кодоном или триплетом, кодирующим
Рис. 5.9. Генетический код. Выделенные кодоны соответствуют стартовому кодону (ATG)
и трем стоп-кодонам
Локализация и упаковка нуклеиновых кислот
201
определенную аминокислоту. Сочетание четырех оснований (A, C, G и T),
представленных в ДНК, дает 64 варианта триплетов; однако, поскольку в
природе существует только около 20 аминокислот, одна аминокислота может кодироваться несколькими кодонами. Этот феномен называется вырожденностью генетического кода. За исключением ограниченного
числа различий, обнаруженных в ДНК митохондрий и в одном или двух
других видах ДНК, генетический код является универсальным. Кроме кодирования аминокислот, некоторые последовательности триплетов указывают начало (старт) или конец (стоп) отдельного гена. Существует только
один стартовый кодон (ATG*), который также кодирует аминокислоту метионин, и три стоп-кодона (TAT, TAG и TGA) (pис. 5.9). Последовательность,
ограниченная стартовым кодоном и стоп-кодоном и содержащая кодоны,
которые соответствуют непрерывной белковой последовательности, называется открытой рамкой считывания (ORF, open reading frame).
5.4
ЛОКАЛИЗАЦИЯ И УПАКОВКА
НУКЛЕИНОВЫХ КИСЛОТ
5.4.1
Клеточные компартменты
Как правило, ДНК в эукариотических клетках содержится в ядре и таких органеллах, как митохондрии или хлоропласты, которые имеют свой
собственный геном. Большинство видов РНК, однако, обычно находится
в цитоплазме. Генетическая информация клеток и большинства вирусов
хранится в ДНК. Эта информация используется для синтеза молекул РНК,
которые подразделяются на три класса. Рисунок 5.10 иллюстрирует локализацию нуклеиновых кислот в эукариотических и прокариотических
клетках.
• Матричная РНК (мРНК) содержит последовательности рибонуклеотидов, которые кодируют аминокислотную последовательность белков.
Одна молекула мРНК кодирует одну полипептидную цепь у эукариот, но
может кодировать несколько полипептидов в бактериях.
• Рибосомная РНК (рРНК) образует часть структуры рибосом, являющихся
местом синтеза белков. Каждая рибосома содержит только три или четыре типа молекул рРНК, образующих комплексы с 55–75 белками.
• Транспортная РНК (тРНК) доставляет аминокислоты к рибосомам и
взаимодействует с мРНК таким образом, что аминокислоты выстраиваются в последовательности, определяемой мРНК. Существует по крайней мере один тип тРНК для каждой аминокислоты.
Только в эукариотических клетках существует группа молекул РНК, называемых малыми ядерными РНК (мяРНК), которые функционируют
* В термофильных микроорганизмах с высоким содержанием пар GC вместо стартового кодона ATG также используется приплет GTG, который кодирует остаток
валина. — Прим. ред.
202
Глава 5. Теоретические основы молекулярной биологии. Методы
Рис. 5.10. Локализация молекул ДНК и РНК в эукариотических клетках и перенос
генетической информации
внутри ядра и содействуют созреванию молекул мРНК. Все молекулы РНК
ассоциированы со своими связывающими белками, что существенно для их
функций в клетке. Нуклеиновые кислоты в бактериальных клетках менее
строго локализованы, хотя выполняют аналогичные функции*.
5.4.2
Упаковка ДНК
ДНК в бактериальных клетках, хотя и связана с ядерными белками, находится в цитоплазме, где она плотно свернута и упакована в суперспираль с помощью фермента топоизомеразы, что позволяет этой макромолекуле разместиться в клетке. Напротив, ДНК в эукариотических клетках
имеют много уровней упаковки внутри ядра с участием различных ДНКсвязывающих белков.
Первый уровень упаковки образуется в результате наматывания ДНК
вокруг комплекса из четырех маленьких белков, каждый из которых представлен двумя копиями и называется гистоном (Н2А, Н2В, Н3 и Н4). Эти
белки богаты основными аминокислотами лизином и аргинином и образуют
центральную октамерную структуру в форме бочонка. Последовательность
ДНК размером около 180 п.н. делает два оборота вокруг этой структуры, образуя нуклеосому. Еще один гистоновый белок — белок Н1 — связывается
с внешней поверхностью нуклеосомы. В результате такой упаковки длина
ДНК уменьшается в 6 раз.
* В настоящее время открыто несколько типов других молекул РНК, которые играют очень важную роль в регуляции экспрессии генов (siRNA), завершении неправильного синтеза белка на рибосоме (tmRNA), входят в состав фермента бессмертия
теломеразы и др. — Прим. ред.
Функции нуклеиновых кислот
,
203
,
Рис. 5.11. Структура и состав нуклеосомы и хроматина
Далее нуклеосомы ассоциируют, образуя вторичный уровень упаковки —
так называемое хроматиновое волокно диаметром 30 нм, уменьшая при
этом длину ДНК в 7 раз (pис. 5.11). Хроматин может быть далее свернут и сложен в петли посредством взаимодействия с другими негистоновыми белками,
образуя в конечном итоге сами хромосомы.
ДНК в ядре тесно связана с тонким слоем ядерного матрикса, который образует белковый остов внутри ядра. ДНК прикреплена к матриксу в определенных положениях, совпадающих обычно с точками начала репликации.
Существуют многие другие ДНК-связывающие белки, такие как негистоновые белки с высокой электрофоретической подвижностью (HMG, high mobility group), которые участвуют в создании определенной конформации ДНК
во время репликации или активной экспрессии гена.
5.5
ФУНКЦИИ НУКЛЕИНОВЫХ КИСЛОТ
5.5.1
Репликация ДНК
Двухспиральная структура ДНК обеспечивает ее репликацию во время
клеточного деления, поскольку разделение двух цепей ДНК позволяет
происходить синтезу комплементарных цепей на их основе. Множество
ферментов и вспомогательных белков требуется для репликации in vivo;
у бактерий этот процесс начинается в области ДНК, называемой точкой
начала репликации (Ori, origin of replication).
204
Глава 5. Теоретические основы молекулярной биологии. Методы
Рис. 5.12. Начальный этап репликации: расплетание ДНК
ДНК должна оставаться нерасплетенной до того, как белки и ферменты,
необходимые для репликации, начинают действовать, вызывая разделение
двухспиральной ДНК на две цепи. Этот процесс выполняется ферментом
ДНК-геликазой. Более того, для предотвращения соединения однонитевых
молекул ДНК с ними связываются небольшие белки, называемые белками, связывающими одноцепочечную ДНК (SSBs, single-stranded
DNA-binding proteins) (рис. 5.12).
Прежде всего на каждом однонитевом участке ДНК синтезируется короткая цепь комплементарной РНК (праймер), использующая ДНК в качестве
матрицы. Праймер синтезируется с помощью фермента РНК-полимеразы,
иначе называемого праймазой, которая использует трифосфаты рибонуклеозидов и сама не нуждается в праймере. Затем ДНК-полимераза III также
использует исходную ДНК как матрицу для синтеза, а РНК-праймер — как
стартовую точку. Наличие праймера является существенным, поскольку он
имеет свободную 3'-гидроксильную группу. Это крайне важно, поскольку
ДНК-полимераза III может добавлять новые нуклеотиды только к 3'-, но не к
5'-концу нуклеиновой кислоты. Таким образом, синтез цепи ДНК происходит
только от РНК-праймера в направлении от 5' к 3'. Эта цепь ДНК обычно называется лидирующей и ее синтез происходит непрерывно.
Поскольку две цепи двухспиральной ДНК являются антипараллельными, только одна цепь может синтезироваться непрерывным образом.
Синтез другой цепи происходит более сложным путем. Точный механизм
был открыт Реджи Оказаки в 1960 г. В данном случае цепь, обычно называемая отстающей, синтезируется в виде небольших фрагментов длиной
1–2 т.п.н., называемых фрагментами Оказаки. Этот процесс происходит в направлении от 5'- к 3'-концу также с использованием множества
РНК-праймеров для каждого отдельного участка. Таким образом, имеет
место прерывистый синтез ДНК, при котором ДНК-полимераза работает
в направлении 5' 3'. РНК-праймеры затем удаляются с помощью ДНКполимеразы I, которая имеет 5' 3'-экзонуклеазную активность, а бреши
заполняются тем же самым ферментом, действующим как полимераза. Отдельные фрагменты соединяются вместе с помощью ДНК-лигазы, образуя
новую цепь ДНК (рис. 5.13).
Функции нуклеиновых кислот
205
Лидирующая
цепь
РНК-праймеры
Рис. 5.13. Репликация ДНК. (а) Двухцепочечная ДНК разделяется в точке начала репликации. РНК-полимераза синтезирует короткие цепи ДНК-праймеров, комплементарных обеим цепям ДНК. (б) ДНК-полимераза III синтезирует в направлении от 5' к
3' новые цепи ДНК, комплементарные старым цепям ДНК от 3'-конца каждого РНКпраймера. Следовательно, синтез ДНК идет в том же направлении, что и репликация
ДНК, для одной цепи (лидирующая цепь) и в противоположном направлении для другой
(отстающая цепь). Синтез РНК-праймеров происходит многократно, позволяя синтезироваться фрагментам отстающей цепи. (в) По мере того как репликационная вилка продвигается вперед от точки начала репликации, ДНК-полимераза III продолжает синтез лидирующей цепи и синтезирует ДНК между РНК-праймерами отстающей цепи.
(г) ДНК-полимераза I удаляет РНК-праймеры отстающей цепи и заполняет образующиеся бреши ДНК. ДНК-лигаза соединяет фрагменты, создавая непрерывную цепь ДНК
Репликация эукариотической ДНК менее изучена; там множество точек начала репликации и, конечно, она происходит более сложно, чем у
бактерий; однако в обоих случаях процесс синтеза новых цепей идет в направлении 5' 3'. Конечным результатом репликации является то, что вместо исходной ДНК появляются две молекулы, каждая содержит «старую»
и «новую» цепи — так называемая полуконсервативная репликация.
Механизмы синтеза и репликации ДНК, а также участвующие в них ферменты используются во многих методах молекулярной биологии и лежат в
основе различных генно-инженерных технологий.
5.5.2
Защита ДНК и системы репарации
Рост и деление клетки требуют точной и координированной репликации
ДНК. Механизмы, которые корректируют реплицированную последовательность ДНК и сохраняют ее целостность, очень сложные и понимание
206
Глава 5. Теоретические основы молекулярной биологии. Методы
их функционирования в бактериальных системах далеко не полное. Защита ДНК у бактерий достигается с помощью системы рестрикции–модификации, основанной на специфическом метилировании хозяйской
ДНК, что позволяет отличить ее от чужеродной ДНК, например вирусной.
Чаще встречается система рестрикции–модификации II типа, состоящая
из хозяйской ДНК-метилазы и эндонуклеазы рестрикции, которая узнает
короткие (4–6 п.н.) палиндромные последовательности и разрезает чужеродную неметилированную ДНК в определенных местах. Существование
ферментов, ответственных за этот процесс, чрезвычайно полезно для манипуляций с ДНК и анализа ДНК, о чем будет сказано в разд. 5.8.
Система репарации позволяет распознавать измененные, неправильно
спаренные или пропущенные основания в двухцепочечной ДНК и инициирует вырезание соответствующего фрагмента. Бактериальные репарационные системы зависят от длины поврежденного фрагмента ДНК и
действуют либо во время репликации (dam-система), либо при основной репарации (urr-система). В некоторых случаях повреждение в ДНК активирует белок RecA, что приводит к SOS-репарации, в которой задействовано
много ферментов и белков; однако этот процесс еще не полностью изучен.
Системы рекомбинации–репарации в эукариотических клетках обладают
некоторыми общими свойствами с системами в бактериальных клетках, но
точный механизм их действия не установлен. Дефекты системы репарации
могут приводить к стабильному включению ошибок в геномные последовательности, что в свою очередь может способствовать появлению определенных генетических заболеваний.
5.5.3
Транскрипция ДНК
Экспрессия генов начинается с процесса транскрипции, посредством которого комплементарная цепь РНК синтезируется с помощью фермента
РНК-полимеразы на матрице ДНК, кодирующей ген. Большинство бактериальных генов состоят из трех областей. В центре находится последовательность, которая будет копирована в РНК и которая называется
структурным геном. К 5'-концу цепи (против хода транскрипции) лежит
область, называемая промотором, и по ходу транскрипции ниже единицы
транскрипции находится область терминатора*. Транскрипция начинается, когда ДНК-зависимая РНК-полимераза связывает промоторную область и продвигается вдоль ДНК к единице транскрипции. В стартовой
точке единицы транскрипции полимераза начинает синтезировать молекулы РНК, комплементарные (–)-цепи ДНК, двигаясь вдоль этой цепи в
направлении от 3'- к 5'-концу и синтезируя РНК в направлении от 5'- к
3'-концу, используя трифосфаты рибонуклеозидов. РНК, таким образом,
имеет такую же последовательность, как и (+)-цепь ДНК, отличаясь только заменой урацила на тимин. Достигая точки остановки в области тер* Правильнее говорить, что в бактериях последовательность гена фланкирована
регуляторными элементами, в том числе промотором и терминатором транскрипции. — Прим. ред.
Функции нуклеиновых кислот
«выше»
207
«ниже»
Рис. 5.14. Транскрипция в клетках бактерий. Структурный ген находится под контролем промотора, расположенного «выше» гена. Синтез мРНК завершается на терминаторе, расположенном за последовательностью структурного гена («ниже» гена)
минатора, транскрипция останавливается, и высвобождается молекула
РНК. Для идентификации ключевых элементов генов применяется нумерация оснований. Точка или основание +1 является остатком, находящемся в участке старта транскрипции, положительная нумерация соответствует 3'-области, тогда как отрицательная нумерация соответствует
5'-области (рис. 5.14).
В эукариотических организмах существуют три различные РНКполимеразы, обозначаемые I, II и III. Матричная РНК синтезируется
с помощью РНК-полимеразы II, тогда как РНК-полимеразы I и III катализируют синтез рРНК (I), тРНК и snРНК (III). Как правило, многие неэкспрессирующиеся гены обладают метилированными остатками, обычно
С в GС-динуклеотиде, а активные гены имеют тенденцию к гипометилированию. Это свойство наиболее ярко проявляется в 5'-фланкирующих областях и имеет важное значение для открытия и идентификации новых
генов.
5.5.4
Промоторные и терминаторные
последовательности в ДНК
Промоторы находятся обычно на 5'-концах или выше последовательности
структурного гена; они лучше всего охарактеризованы для бактерий, например Escherichia coli. Они состоят из двух консервативных элементов: последовательности ТАТА-бокс (консенсусная последовательность «ТАТАТТ»),
которая располагается приблизительно на 10 п.н. выше участка инициации транскрипции (–10 в системе нумерации), и «G+C-богатой» последовательности, которая располагается на расстоянии около –25 п.н. ТАТА-бокса.
G+C-элемент считается важным в инициации узнавания и связывания
ДНК РНК-полимеразой, тогда как последовательность –10 участвует в образовании комплекса инициации транскрипции (рис. 5.15, а).
Элементы промотора служат в качестве участков узнавания для ДНКсвязывающих белков, которые контролируют экспрессию генов; такие
белки называются транскрипционными факторами, или трансдействующими факторами. Эти белки имеют ДНК-связывающий домен
208
Глава 5. Теоретические основы молекулярной биологии. Методы
для взаимодействия с промоторами и домен активации, который позволяет
осуществлять взаимодействие с другими факторами транскрипции. Хорошо изученным фактором транскрипции (ФТ) является TFIID, который связывает последовательность –35 п.н. в эукариотических клетках. Регуляция
экспрессии гена происходит в большинстве случаев на уровне транскрипции и первоначально контролируется скоростью инициации транскрипции, хотя контроль также может быть модулирован стабильностью РНК
или на других уровнях, например при трансляции. Терминаторная последовательность хуже охарактеризована; это нуклеотидная последовательность вблизи конца мРНК, способная образовывать шпильку с петлей. За
ней располагается U-богатая область, которая может играть роль сигнала
терминации для РНК-полимеразы.
В отличие от бактериальных промоторов длиной не более 100 п.н. у эукариот в регуляции транскрипции принимает участие множество последовательностей длиной до нескольких сотен оснований. Особенно важной является последовательность ТАТА-бокса, для большинства генов лежащая
выше точки инициации транскрипции, приблизительно в области –35 п.н.
(рис. 5.15, б). Этот бокс аналогичен последовательности –10 п.н. у бактерий.
В зависимости от типа гена в образовании инициирующего комплекса с
РНК-полимеразой принимает участие большое количество транскрипционных факторов. Только после образования инициирующего комплекса
начинается транскрипция. В дополнение к ТАТА-боксу в положении –80
часто располагается САТ-бокс (консенсус GCCAATCT), который важен
для эффективности промотора. Были описаны многие элементы промотора, лежащие ближе к 5'-концу (UPEs, upstream promoter elements), которые являются либо общими, либо специфичными для определенных генов
или тканей. GC-Элементы, которые содержат последовательность GGGCG,
могут быть представлены во многих участках и в любой ориентации и часто связаны с генами «домашнего хозяйства» (housekeeping genes), кодирующими ферменты, вовлеченные в основной метаболизм. Некоторые
элементы промоторной области, такие как ТАТА-бокс, являются общими
для большинства генов, тогда как другие могут быть специфичными для
определенных генов или классов генов.
Определенный интерес представляет класс промоторов, впервые исследованный у обезьяньего вируса 40 (SV40) и называемый энхансером
(усилителем). Эти последовательности отличаются от других промоторных
последовательностей по их уникальной способности действовать на расстоянии до нескольких тысяч нуклеотидов выше или ниже по хромосоме
от определенного гена. Даже на таких огромных дистанциях от стартовой точки транскрипции они могут усиливать транскрипцию в сотни раз.
Взаимодействия между факторами транскрипции, РНК-полимеразой
или другими ДНК-связывающими белками и последовательностью
ДНК, с которой они связываются, могут быть идентифицированы и охарактеризованы с помощью метода футпринтинга ДНК (разд. 6.8.3.).
Для того чтобы в эукариотических клетках происходила транскрипция,
необходимо взаимодействие множества факторов транскрипции с промоторами и между собой. Этот каскадный механизм проиллюстрирован на
Функции нуклеиновых кислот
209
TFIID
TFIID
TFIIB
TFIIE/F
II
Рис. 5.15. а) Элементы типичного промотора, обнаруженные в бактериальной клетке
(например, E. coli). б) Типичные элементы промотора, обнаруженные в эукариотической
клетке. в) Общая схема связывания факторов транскрипции с областями промотора в
эукариотических клетках. Вслед за связыванием факторов транскрипции IID, IIF, IIB,
IIE и IIF образуется преинициаторный комплекс. РНК-полимераза II связывается с
этим комплексом и начинает транскрипцию от стартовой точки +1
рис. 5.15, в и называется комплексом преинициации. Как только около
–35-последовательности ТАТА образуется этот комплекс, РНК-полимераза
способна транскрибировать структурный ген и продуцирует комплементарную копию РНК (разд. 5.5.6.).
210
Глава 5. Теоретические основы молекулярной биологии. Методы
5.5.5
Транскрипция у бактерий
Организация бактериальных генов во многом отличается от таковой у
эукариот. Бактериальные гены в основном образованы в виде непрерывных кодирующих последовательностей. Более того, они часто группируются в опероны, которые содержат гены, относящиеся к определенной
функции, такой как метаболизм субстрата или синтез продукта. Это особенно наглядно видно на примере хорошо известного оперона, найденного в E. coli и называемого лактозным опероном, в котором три гена
lacZ, lacY и lacA находятся под контролем одного промотора и, кроме
того, включаются и выключаются в одно и то же время. В этой модели
отсутствие лактозы приводит к связыванию белка-репрессора с операторной последовательностью, лежащей выше генов Z, Y и А, и мешает
РНК-полимеразе транскрибировать гены (рис. 5.16, а). Однако в присутствии лактозы происходят транскрипция этих генов и метаболизм
лактозы. Лактоза связывается с белком-репрессором и вызывает конформационные изменения в его структуре. Это мешает его связыванию с
оператором и позволяет РНК-полимеразе связывать и транскрибировать
три гена (рис. 5.16, б). Транскрипция и трансляция у бактерий тесно связаны между собой, тогда как в эукариотических клетках эти два процесса разделены и происходят в различных отделах клетки.
5.5.6
Посттранскрипционный процессинг
Транскрипция эукариотического гена приводит к образованию гетерогенной ядерной РНК (гяРНК), представляющей собой полный структурный ген (рис. 5.17). После этого происходит процесс созревания РНК.
Первый этап процессинга включает присоединение остатка метилированного гуанозина (m7Gppp), называемого «кэпом», на 5'-конце гяРНК.
«Кэп» может служить сигнальной структурой и помогает стабилизировать молекулу (рис. 5.18). Кроме того, к 3'-концу гяРНК с помощью
фермента poly(А)-полимеразы присоединяется от 150 до 300 остатков
аденозина, называемых poly(А)-хвостом. Poly(А)-хвост позволяет проводить специфическое выделение эукариотической мРНК из общей РНК
клетки с использованием аффинной хроматографии (разд. 5.7.2); кроме
того, предполагается, что присутствие poly(А) придает транскрипту стабильность.
В отличие от бактерий эукариотические транскрипты имеют кодирующую последовательность (экспрессирующие области, или экзоны),
прерывающуюся некодирующими последовательностями (интронами).
Границы интронов и экзонов, как правило, определяются последовательностью GUAG и должны удаляться в процессе сплайсинга для образования зрелой мРНК (рис. 5.18). Процесс сплайсинга интрона опосредуется малыми ядерными РНК (мяРНК), которые существуют в ядре как
рибонуклеопротеиновые частицы. Эти частицы часто обнаруживаются в
большом ядерном комплексе, называемом сплайсосомой, в котором происходит сплайсинг. Интроны обычно удаляются последовательно от 5'- к
3'-концу, и их число неодинаково в различных генах. Некоторые эукарио-
Функции нуклеиновых кислот
211
Галактозидаза
белком-репрессором, связанным
Белок-репрессор
Галактозидаза
Не может связаться
с оператором
Белок-репрессор
Рис. 5.16. Лактозный оперон в состоянии репрессии (без лактозы) (а) и последующая
индукция лактозой (б)
тические гены, например гены гистонов, не содержат интронов, тогда как
ген дистрофина, ответственного за мышечную дистрофию, содержит более 250 интронов. В некоторых случаях, однако, один и тот же транскрипт
гяРНК может быть процессирован различными путями, образуя различ-
212
Глава 5. Теоретические основы молекулярной биологии. Методы
Рис. 5.17. Транскрипция типичного эукариотического гена, приводящая к образованию
гетерогенной ядерной РНК
Рис. 5.18. Посттранскрипционные модификации гетерогенной ядерной РНК
ные мРНК, кодирующие различные белки, и такой процесс называется
альтернативным сплайсингом. Таким образом, последовательность,
которая представляет собой экзон для одного вида РНК, может быть частью вырезаемого интрона в другом. Определенный тип или количество
мРНК, синтезируемой в клетке или типе клеток, можно проанализировать с помощью различных методов молекулярной биологии (разд. 6.8.1).
5.5.7
Трансляция мРНК
Молекулы матричной РНК считываются и транслируются в белок с помощью комплексов РНК и белков, называемых рибосомами. Рибосомы обозначаются 70S или 80S в зависимости от их коэффициента седиментации.
Функции нуклеиновых кислот
213
Бактериальные клетки имеют 70S-рибосомы, тогда как в эукариотической
цитоплазме существуют рибосомы 80S. Рибосомы состоят из двух субъединиц, которые удерживаются порознь специальными рибосомными белками
до тех пор, пока не начнется трансляция. На рибосоме существуют участки для связывания одной молекулы мРНК и двух молекул тРНК; процесс
трансляции происходит в три этапа.
• Инициация — сборка субъединиц рибосомы и связывание мРНК.
• Элонгация — процесс образования полипептидов из специфических
аминокислот в зависимости от последовательности кодонов в мРНК.
• Терминация — распад рибосомы на субчастицы с последующим высвобождением полипептида.
Молекулы транспортных РНК также необходимы для трансляции.
Каждая из них ковалентно связана со специфической аминокислотой,
образуя аминоацил-тРНК, и имеет триплет оснований, комплементарный кодону данной аминокислоты. Такой «экспонированный» триплет называется антикодоном и позволяет тРНК действовать в качестве «адаптерной» молекулы, связывающей кодон и соответствующую
аминокислоту. Процесс присоединения аминокислоты к ее специфической тРНК называется загрузкой и выполняется с помощью фермента
аминоацил-тРНК-синтетазы.
В бактериях рибосомы связываются с последовательностью на 5'-конце
мРНК, известной как участок связывания рибосомы (иногда его называют последовательностью Шайна–Дальгарно, по имени открывших его ученых). У эукариот связывание происходит подобным образом,
но с участием так называемой последовательности Козак, расположенной вокруг инициирующего кодона. После инициации трансляции рибосома движется вперед в направлении 3'-конца мРНК, позволяя молекуле
аминоацил-тРНК спариваться с каждым последующим кодоном и доставляя аминокислоты для белкового синтеза в правильном порядке. В рибосоме существует два участка для молекул тРНК: участок А и участок Р*.
Когда эти участки заняты, происходит образование пептидной связи
между аминокислотами. Этот процесс находится под контролем фермента пептидилтрансферазы. Когда рибосома встречает терминирующий
кодон (UAA, UGA или UAG), останавливающий биосинтез белка, фактор
высвобождения связывается с комплексом, трансляция останавливается,
полипептиды и соответствующие мРНК высвобождаются и рибосома разделяется на две субъединицы (pис. 5.19). В этот процесс вовлечено множество вспомогательных белковых факторов инициации и элонгации.
В эукариотических клетках полипептид затем может подвергаться посттрансляционным модификациям, таким как гликозилирование, и с
помощью специфических сигнальных аминокислотных последовательностей направляется к специфическим клеточным компартментам или
секретируется из клетки.
* В настоящее время принята модель с тремя центрами А, Р, Е. — Прим. ред.
214
Глава 5. Теоретические основы молекулярной биологии. Методы
а
в
б
Терминирующий
Рис. 5.19. Трансляция. Рибосома (а) продвигается на короткое расстояние от 5'-конца мРНК и синтезирует дипептид (с одной тРНК), готовый к переносу на третью
аминокислоту (все еще присоединенную к тРНК). Затем рибосома (б) продвигается дальше вдоль мРНК и синтезирует олигопептид, который переносится на новую
аминоацил-тРНК. Свободная тРНК оставляет рибосому и может присоединять другую аминокислоту. Рибосома движется вперед к 3'-концу мРНК на расстояние в три
нуклеотида, так что следующий кодон может принять соответствующую аминоацилтРНК на рибосоме. Рибосома (в) достигает терминирующего кодона, высвобождает
законченный полипептид и отделяется от мРНК
Поскольку последовательность оснований в мРНК читается триплетами, ошибочное положение одного или двух нуклеотидов в рибосоме
приводит к синтезу аномального полипептида. Таким образом, важно
использовать правильную рамку считывания при трансляции. У бактерий это достигается с помощью связывания между последовательностью
Шайна–Дальгарно (последовательность Козак у эукариот) и комплементарной последовательностью одной из молекул рРНК, обеспечивая правильную стартовую точку для продвижения рибосомы вдоль мРНК. Однако, если имеют место мутации, такие как делеция или вставка внутри
кодирующей последовательности, они тоже вызывают изменение рамки
считывания и приводят к образованию аномального полипептида. Генетические мутации и полиморфизмы рассматриваются более детально в
разд. 6.8.5.
5.5.8
Контроль продукции белка:
интерференция РНК
Существует множество механизмов, с помощью которых контролируется продукция белка; контроль может осуществляться либо на уровне
гена, либо на уровне белка. Это может быть контроль уровня экспрессии мРНК, увеличения или уменьшения скорости транскрипции мРНК
Манипуляции с нуклеиновыми кислотами: основные инструменты и методы
215
или контроль наличия мРНК для трансляции. Одним из недавно обнаруженных механизмов контроля, который был адаптирован как метод
молекулярной биологии для изменения содержания мРНК, является
интерференция РНК (РНКи, RNAi). Этот метод состоит в синтезе
коротких двухцепочечных молекул РНК, которые расщепляются на
фрагменты размером 21–23 п.н., образуя РНК-индуцированный
комплекс-сайленсер (RISC, RNA-induced silencing complex). Этот
комплекс использует короткие молекулы РНК, комплементарные
транскриптам мРНК, что в результате последующей гибридизации позволяет РНКазе уничтожать связанную мРНК. Метод имеет важное
применение в медицине, например для снижения повышенного уровня
специфических молекул мРНК при определенных раковых заболеваниях и вирусных инфекциях.
5.6
МАНИПУЛЯЦИИ С НУКЛЕИНОВЫМИ КИСЛОТАМИ:
ОСНОВНЫЕ ИНСТРУМЕНТЫ И МЕТОДЫ
5.6.1
Ферменты, используемые
в молекулярной биологии
Открытие множества ключевых ферментов и их изучение обеспечило развитие методов анализа ДНК. В частности, ферменты, называемые эндонуклеазами рестрикции II типа, играют ключевую роль во всех методах
молекулярной биологии. Эти ферменты узнают специфические последовательности ДНК, обычно длиной 4–6 п.н., и расщепляют их определенным образом. Узнаваемые последовательности являются палиндромными — имеют природу инвертированных повторов, т. е. они читаются
одинаково в обоих направлениях на каждой цепи. После расщепления, в
зависимости от специфичности данного фермента получается фрагмент
со ступенчатыми, или выступающими, концами, называемыми липкими
концами (они способны к сцеплению) (рис. 5.20). Важно то, что при расщеплении различных молекул ДНК одним и тем же ферментом образуются комплементарные (т. е. «липкие») концы, которые способны хорошо
отжигаться друг с другом. Отожженные цепи удерживаются вместе только гидрофобными связями между комплементарными основаниями на
противоположных цепях. Ковалентная сшивка («лигирование») каждой
из двух цепей может быть выполнена с помощью фермента ДНК-лигазы
(разд. 6.2.2). Это свойство широко применяется в молекулярной биологии
при конструировании рекомбинантных ДНК, т. е. при лигировании
фрагментов ДНК из различных источников. Было охарактеризовано около 500 ферментов рестрикции, которые узнают более 100 различных последовательностей-мишеней. Многие из этих ферментов, так называемые
изошизомеры, узнают различные последовательности-мишени, но образуют одинаковые ступенчатые, или выступающие, концы. Различные
манипуляции с ДНК с использованием других ферментов суммированы
в табл. 5.3.
216
Глава 5. Теоретические основы молекулярной биологии. Методы
II
III
I
I
I
III
II
I
Рис. 5.20. Последовательности, узнаваемые некоторыми ферментами рестрикции. а —
подробная запись; б — условное обозначение. Стрелками показаны сайты рестрикции
Заметьте, что вся информация на а может быть получена из последовательности одной
цепи ДНК; на б изображена только одна цепь в направлении от 5'-конца к 3'-концу.
Такая условная запись принята при указании сайтов рестрикции
5.7
ВЫДЕЛЕНИЕ И РАЗДЕЛЕНИЕ
НУКЛЕИНОВЫХ КИСЛОТ
5.7.1
Выделение ДНК
ДНК для анализа или манипуляций должна иметь определенную степень
чистоты. Из клеток ДНК выделяют с помощью самого мягкого способа
разрушения клетки, чтобы предотвратить ее фрагментирование в результате механического повреждения. Обычно эта процедура выполняется
в присутствии ЭДТА, образующего хелатные комплексы с ионами магния, который требуется для фермента, деградирующего ДНК (ДНКаза).
В идеальном случае клеточные стенки, если таковые присутствуют, должны быть расщеплены ферментативно (т. е. путем обработки лизоцимом),
а клеточную мембрану растворяют с помощью детергента. Если же применяется механическое разрушение, то оно должно быть сведено к минимуму и представлять собой скорее разрезание или раздавливание клеток,
без применения силы сдвига. Разрушение клетки (и последующие этапы)
Выделение и разделение нуклеиновых кислот
217
Таблица 5.3. Примеры ферментов, часто используемых в манипуляциях
с нуклеиновыми кислотами
Фермент
Пример
Использование в манипуляциях
с нуклеиновой кислотой
ДНК-полимераза I
ДНК-зависимая ДНК-полимераза
5' 3'/ 3' 5'-экзонуклеазная
активность
Фрагмент Клёнова
ДНК-полимеразы
РНК-полимеразы
ДНК-полимераза I без 5' 3'экзонуклеазной активности
ДНК-полимераза Т4 Нет 5' 3'-экзонуклеазной
активности
Taq ДНК-полимераза Термостабильная ДНК-полимераза,
используемая в ПЦР
Tth ДНК-полимераза Термостабильная ДНК-полимераза
с активностью RT
ДНК-полимераза Т7 Используется в секвенировании ДНК
РНК-полимераза Т7
РНК-полимераза Т3
Репликаза Q
ДНК-зависимая РНК-полимераза
ДНК-зависимая РНК-полимераза
РНК-зависимая РНК-полимераза,
используемая в амплификации РНК
ДНКаза I
Неспецифическая эндонуклеаза,
расщепляющая ДНК
ДНК-зависимая, последовательное
удаление нуклеотидов 3' 5'
РНКаза для картирования
Используется в синтезе второй цепи
кДНК
Специфична для одноцепочечных
последовательностей
Экзонуклеаза III
Нуклеазы
РНКаза А
РНКаза Н
Нуклеаза S1
Обратная транскриптаза AMV
Трансфераза
Лигазы
Киназы
Фосфатазы
Метилазы
RT
РНК-зависимая ДНК-полимераза,
используемая в синтезе кДНК
Терминальная
Добавляет гомополимерные хвосты
трансфераза (TdT)
к 3'-концу ДНК
ДНК-лигаза Т4
Соединяет 5'-фосфатную и 3'-гидроксильную группы фосфодиэфирной
связью
ПолинуклеотидПереносит концевые фосфатные
киназа Т4 (PNK)
группы от АТФ к 5'-ОН группам
Щелочная фосфатаза Удаляет 5'-фосфаты в ДНК и РНК
Метилаза EcoRI
Метилирует специфические остатки
и защищает от расщепления ферментами рестрикции
ПЦР — полимеразная цепная реакция; RT — обратная транскриптаза; кДНК — комплементарная ДНК; AMV — вирус миелобластомы птиц (avian myeloblastosis virus)
218
Глава 5. Теоретические основы молекулярной биологии. Методы
должны выполняться при 4 °С в стеклянной посуде, а все растворы автоклавируют, чтобы уничтожить ДНКазную активность.
После высвобождения нуклеиновой кислоты из клетки РНК может
быть удалена с помощью расщепления рибонуклеазой (РНКазой), обработанной нагреванием, чтобы инактивировать в ней любую примесь
ДНКазы; РНКаза относительно устойчива к нагреванию благодаря дисульфидным связям, которые обеспечивают быструю ренатурацию молекулы при охлаждении. Другие примеси, такие как белки, удаляются при
осторожном перемешивании с раствором фенола или со смесью фенол/
хлороформ, которые денатурируют белки, но не нуклеиновые кислоты.
Центрифугирование образовавшейся эмульсии приводит к образованию
нижней органической фазы, отделенной от верхней водной фазы промежуточной фазой, содержащей денатурированный белок. Водный раствор извлекают и депротеинизируют многократно до тех пор, пока промежуточная фаза более не содержит белка. В завершение очищенный
от белка препарат ДНК смешивают с двумя объемами абсолютного эти-
Гомогенизация клеток/тканей
:
:
Повторное растворение
ДНК: Трис-ЭДТА
Рис. 5.21. Основные этапы экстракции ДНК из клеток или тканей
Выделение и разделение нуклеиновых кислот
219
лового спирта, что позволяет высадить ДНК из раствора при сильном
охлаждении. После центрифугирования осадок ДНК перерастворяют в
буферном растворе, содержащем ЭДТА, чтобы инактивировать любую
присутствующую ДНКазу. Этот раствор может храниться при 4 °C не
менее месяца. Растворы ДНК могут храниться замороженными, хотя
повторное оттаивание и замораживание повреждает длинные молекулы
ДНК. Процедура, описанная выше, подходит для выделения общей клеточной ДНК. Если же требуется ДНК из специфической органеллы или
вируса, лучше всего экстрагировать эти органеллу или вирус до выделения ДНК, поскольку получить ДНК определенного вида из смеси достаточно сложно. Когда необходима высокая степень очистки ДНК, можно
применить ультрацентрифугирование в градиенте плотности хлорида
цезия, что особенно успешно применяется в приготовлении плазмидной
ДНК. Схема экстракции ДНК представлена на рис. 5.21. Целостность
ДНК можно проверить с помощью электрофореза в агарозном геле и
также определить ее концентрацию, учитывая тот факт, что одна единица поглощения соответствует 50 мкг см–3 ДНК, т. е.:
50 А260 = концентрация ДНК (мкг см–3).
Примеси можно идентифицировать с помощью сканирующей УФспектрофотометрии в интервале от 200 до 300 нм. Отношение поглощений раствора при 260 и 280 нм, равное ~ 1,8, указывает на то, что образец свободен от примеси белков, которые очень сильно поглощают при
280 нм.
5.7.2
Выделение РНК
Методы, используемые для выделения РНК, очень похожи на описанные
выше для ДНК, однако молекулы РНК короче и поэтому меньше повреждаются механически, так что клетки можно разрушать более энергично.
В то же время РНК более чувствительна к расщеплению РНКазой, которая присутствует в различных концентрациях в определенных типах
клеток и, кроме того, всегда есть на пальцах экспериментатора. Чтобы
предотвратить действие РНКазы, следует надевать перчатки и использовать сильные детергенты в среде для выделения. Последующая депротеинизация должна быть особенно жесткой, поскольку РНК часто прочно
связана с белками. Обработка ДНКазой может быть использована для
удаления ДНК, а РНК затем переосаждают с помощью этанола. Обычно
для экстракции РНК применяют гуанидинтиоцианат — сильный ингибитор РНКазы, который также денатурирует белки. Схема экстракции
РНК представлена на рис. 5.22. Целостность экстракта РНК можно проверить с помощью электрофореза в агарозном геле. Преобладающими
видами РНК являются 23S-рРНК и 16S-РНК в бактериях и 18S-РНК и
28S-РНК в эукариотах. Они образуют отдельные полосы в агрозном геле;
другие компоненты РНК, скорее всего, являются интактными. Обычно
электрофорез проводят в денатурирующих условиях, чтобы предотвратить образование вторичных структур РНК. Концентрацию РНК можно
220
Глава 5. Теоретические основы молекулярной биологии. Методы
определить спектрофотометрически при 260 нм. 1 ед. поглощения соответствует 40 мкг см–3 РНК, т. е.:
40 А260= концентрация РНК (мкг см–3).
Примеси могут быть идентифицированы таким же образом, как и в случае ДНК, сканирующей УФ-спектрофотометрией; для образца РНК, не содержащего белка, отношение поглощений при 260 нм и 280 нм равно ~ 2
(разд. 5.7.1).
Во многих случаях из смеси молекул РНК надо выделить мРНК,
на которую приходится всего 2–5% клеточной РНК. Это может быть
сделано с помощью аффинной хроматографии на колонках с олиго(dT)-целлюлозой. При высоких концентрациях соли мРНК, содержащая poly(А)-концы, связывается на колонке с комплементарными молекулами олиго-(dT) и благодаря этому удерживается; все остальные
молекулы РНК смываются с колонки концентрированным раствором
Рис. 5.22. Основные этапы экстракции РНК из клеток или тканей
Выделение и разделение нуклеиновых кислот
221
разного
РНК без poly(А) и ДНК смываются с колонки
высококонцентрированным раствором
poly(А)+ РНК элюируется раствором
с низкой концентрацией соли
Рис. 5.23. Аффинная хроматография poly(А)+ РНК
соли. Затем связанную РНК смывают с колонки, используя раствор с
низкой концентрацией соли (pис. 5.23). Фракции РНК можно также
разделить, используя физические методы, такие как электрофорез или
хроматография, которые основаны на разном размере фрагментов нуклеиновых кислот или разных физико-химических свойствах разделяемых компонентов.
5.7.3
Экстракция нуклеиновых кислот с использованием
автоматического оборудования или китов
Автоматическое оборудование и наборы китов (готовые наборы реагентов) широко применяются в молекулярной биологии, в том числе для
выделения нуклеиновых кислот. Выпускается множество наборов для
экстракции нуклеиновых кислот, и хотя некоторые из них основаны на
222
Глава 5. Теоретические основы молекулярной биологии. Методы
методах, описанных в разд. 5.8.1 и 5.8.2, их преимущество заключается в
том, что реагенты стандартизированы и проверены тестами качества, что
обеспечивает высокую степень надежности. Примером является использование стеклянных шариков для очистки ДНК. Небольшие компактные
колонки, например колонки QUIAGEN, также широко используются в
исследованиях и рутинном анализе ДНК. При этом для экстракции нескольких нуклеиновых кислот могут применяться одни и те же реагенты; в автоматическом режиме происходит надежное разделение. Такой
подход особенно приветствуется, когда требуется большое количество экстракций ДНК. Существует много методов экстракции РНК с использованием готовых наборов, что дало возможность решить такие проблемы,
как загрязнение РНКазой. В настоящее время там, где требуется высокая производительность, например в клинических диагностических лабораториях, для выделения нуклеиновых кислот используют полностью
автоматизированные приборы. Для этого образцы крови помещают в 96или 384-луночные микропланшеты и проводят автоматический анализ с
компьютерным контролем. Экстракция длится ~45 мин и происходит без
ручного вмешательства.
5.7.4
Электрофорез нуклеиновых кислот
Электрофорез в агарозном или акриламидном геле — удобный метод
разделения молекул ДНК по размеру. Метод может быть использован
для анализа или в препаративных целях и быть количественным или
качественным. Большие фрагменты ДНК, такие как хромосомы, также
могут быть разделены с помощью модифицированного электрофореза,
называемого электрофорезом в пульсирующем поле (PFGE, pulsed
field gel electrophoresis). Наиболее простым и широко применяемым методом является электрофорез в горизонтальном агарозном геле с последующим окрашиванием в растворе бромистого этидия. Этот краситель
связывается с ДНК, встраиваясь между стопками-основаниями (интеркаляция) и при УФ-облучении флуоресцирует в красно-оранжевой области (рис. 5.24). Очень часто электрофорез используют, чтобы оценить
чистоту препарата ДНК или полноту протекания ферментативной реакции, например, при клонировании ДНК. Для таких целей особенно
удобны минигели, поскольку для их приготовления тратится немного
времени и требуются небольшие объемы образцов, а результаты получаются быстро. Агарозные гели могут быть использованы для разделения
молекул размером более 100 п.н. Чувствительность определения ДНК и
эффективность разделения коротких фрагментов ДНК выше при электрофорезе в полиакриламидном геле.
При электрофорезе в препаративных целях кусочек геля, содержащий
фрагмент ДНК, вырезают скальпелем. Из фрагмента геля выделяют ДНК
различными способами: разрушая гель с помощью стеклянной палочки в небольшом объеме буфера; с помощью расщепления агарозы (при этом ДНК
остается в растворе); или с помощью электроэлюции. В последнем случае кусочек геля запечатывают внутри диализной трубки, содержащей буфер, а
Выделение и разделение нуклеиновых кислот
223
Рис. 5.24. Использование бромистого этидия для определения ДНК
затем помещают между двумя электродами в камере с большем количеством
буфера. Пропускание электрического тока между электродами вызывает миграцию ДНК из геля, но затем ДНК задерживается в диализной трубке, что
упрощает ее извлечение.
5.7.5
Автоматизированный анализ фрагментов
нуклеиновых кислот
Гель-электрофорез является основным методом разделения и анализа
нуклеиновых кислот. Однако все возрастающую популярность приобретают автоматизированные системы с гелями заводского изготовления.
Они особенно удобны в ситуациях, когда требуется анализировать большое число образцов. Чтобы избежать операций по приготовлению геля,
были разработаны новые технологии, такие как Lab-on-a-chip. Эти системы применяют микрожидкостные контуры, в которых используется
маленькая кассета, содержащая сообщающиеся между собой резервуары.
Образец наносят в определенное место и через микроканалы проводят
электрофорез с компьютерным контролем. Каналы ведут к резервуарам,
например, для инкубации в течение определенного времени с другими
224
Глава 5. Теоретические основы молекулярной биологии. Методы
реагентами, такими как красители*. Электрофоретическое разделение,
таким образом, происходит в микромасштабе. Небольшие размеры ячейки позволяют свести к минимуму расход образца и реагентов, что очень
выгодно при анализе образцов ДНК или РНК. Кроме того, благодаря компьютерной обработке результатов за очень короткое время можно сделать
очень много анализов. В последнее время особенно при исследовании мутаций стали популярны и другие методы анализа, основанные на высокоэффективной жидкостной хроматографии (разд. 6.8.6, в случае нуклеиновых кислот в основном используют масс-спектрометрию (разд. 9.2.4).
5.8
МОЛЕКУЛЯРНАЯ БИОЛОГИЯ
И БИОИНФОРМАТИКА
5.8.1
Основы биоинформатики**
Биоинформатика стала жизненно важным инструментом для исследований в области молекулярной биологии, в частности при определениях
мутаций ДНК. Такая важная роль биоинформатики связана с накоплением генетической информации о первичной последовательности ДНК
и необходимостью хранения этой информации и ее анализа. В настоящее время в генетических базах данных хранится большое количество
последовательностей ДНК из различных организмов, включая геном
человека. Действительно, генетическая информация, полученная из
различных организмов, является совершенно необходимой отправной
точкой в молекулярно-биологических исследованиях. Из самых крупных
первичных баз данных можно назвать GenBank при Национальном
институте здоровья США, EMBL в Европейском институте биоинформатики в Кембридже, Великобритания, и базу данных ДНК (DDBJ) в
Мишима, Япония. Эти базы данных содержат аннотированные нуклеотидные последовательности, что позволяет легко осуществлять идентификацию. Существует много вторичных баз данных, содержащих
информацию по мотивам последовательностей, таких как коровая последовательность, представляющая Р450 домены цитохрома, или ДНКсвязывающие домены. Существенно, что все эти базы данных доступны
через Интернет. Список важных баз данных и источников в Интернете
представлен в табл. 5.4.
Базы данных ДНК и последовательности других нуклеиновых кислот и
программы анализа белков доступны через Интернет, предоставляя соответствующие программное обеспечение и ссылки на авторитетные источники. В настоящее время прямое использование Интернета обеспечивает
пользователю удобный графический интерфейс для анализа и использования данных. Поэтому появились и с успехом развиваются такие области
биологических наук, которые анализируют базы данных геномных и кДНК
* Это метод капиллярного электрофореза. — Прим. ред.
** См. Леск А. Введение в биоинформатику/ Пер. с англ. — М.: БИНОМ. Лаборатория знаний, 2009. — Прим. ред.