поледовательности нуклеиновых кислот

реклама
МЕТОДЫ РАСШИФРОВКИ НУКЛЕОТИДНОЙ
ПОЛЕДОВАТЕЛЬНОСТИ НУКЛЕИНОВЫХ КИСЛОТ
(СЕКВЕНИРОВАНИЕ)
Методы расшифровки нуклеотидной последовательности нуклеиновых
кислот в отечественной литературе принято называть методами
секвенирования.
Еще в 50-е годы прошлого века были разработаны методы, позволяющие
определять последовательность аминокислот в полипептидной цепи.
Теоретически это несложно, поскольку все аминокислоты, встречающиеся в
природных белках, имеют разные свойства. Поэтому, когда был
расшифрован генетический код, появилась возможность восстанавливать
нуклеотидную
последовательность
транскрибируемой
ДНК
по
аминокислотной последовательности соответствующего белка. Однако,
генетический код является вырожденным. Следовательно, первичная
структура ДНК, полученная на основе анализа последовательности
аминокислот, не является однозначной. Кроме того, для эукариот таким
способом можно восстановить лишь нуклеотидный состав экзонов, тогда как
информация о составе интронов теряется в результате сплайсинга.
Предыстория
К концу 60-х годов Ф.Сэнгером были разработан метод секвенирования
РНК, получаемой с ДНК-матрицы при помощи РНК-полимеразы. Применив
этот способ, Ш.Вейссман и У.Фирс смогли концу 1976 г. определить
последовательность более половины молекулы ДНК SV40, длина которой
превышает 5200 нуклеотидных пар. Следующим шагом должна была стать
разработка методов прямого секвенирования ДНК.
Секвенирование ДНК по Сэнгеру: "плюс-минус" метод
Первым
методом
прямого
ферментативного секвенирования ДНК
стал
метод,
предложенный
Ф.
Сэнгером и Д. Коулсоном в 1975 г. В
качестве
матрицы
в
реакции
полимеразного
копирования
использовался
одноцепочечный
фрагмент ДНК, в качестве праймеров синтетические олигонуклеотиды или
природные субфрагменты, получаемые
при
гидролизе
рестрицирующими
эндонуклеазами, а в качестве фермента
- фрагмент Кленова ДНК полимеразы I
(PolI) из E.coli. Метод включал два
этапа. Сначала в ограниченных
условиях проводили полимеразную
реакцию в присутствии всех четырех
типов dNTP (один из них был мечен по
2
альфа-положению фосфата), получая на выходе набор продуктов неполного
копирования матричного фрагмента. Смесь очищали от несвязавшихся
дезоксинуклеозидтрифосфатов и делили на восемь частей. После чего в
"плюс" системе проводили четыре реакции в присутствии каждого из
четырех типов нуклеотидов, а в "минус" системе - в отсутствие каждого из
них. В результате, в "минус" системе терминация происходила перед dNTP
данного типа, а в "плюс" системе - после него. Полученные таким образом
восемь образцов разделяли с помощью электрофореза, "считывали" сигнал и
определяли последовательность исходной ДНК. Этим способом была
секвенирована короткая ДНК фага фХ174, состоящая из 5386 нуклеотидных
пар.
Секвенирование ДНК по Сэнгеру: метод "терминаторов"
В 1977 г. автор "плюс-минус"
метода предложил еще один способ
ферментативного
секвенирования,
получивший
название
метода
терминирующих
аналогов
трифосфатов. Более мощный и более
технологичный,
этот
способ,
несколько
модифицированный,
применяется до сих пор. В основе
метода тоже лежало ферментативное
копирование с помощью фрагмента
Кленова ДНК полимеразы I из E.coli.
В качестве праймеров использовали
синтетические
олигонуклеотиды.
Специфическую терминацию синтеза
обеспечивали
добавлением
в
реакционную смесь помимо четырех
типов dNTP (один из которых был
радиоактивно
мечен
по
альфа
положению фосфата) еще и одного из 2',3'-дидезоксинуклеозидтрифосфатов
(ddATP, ddTTP, ddCTP или ddGTP), который способен включаться в
растущую цепь ДНК, но не способен обеспечивать дальнейшее копирование
из-за отсутствия 3'-ОН группы. Отношение концентраций dNTP/ddNTP
авторы подбирали экспериментально, так, чтобы в итоге получить набор
копий ДНК различной длины. Таким образом, для определения первичной
структуры исследуемого фрагмента ДНК требовалось провести четыре
реакции копирования: по одному типу терминаторов в каждой из реакций.
После этого полученные продукты разгонялись в полиакриламидном геле на
соседних
дорожках
и
по
расположению
полос
определялась
последовательность нуклеотидов.
3
Секвенирование ДНК по Максаму и Гилберту: метод химической
деградации
В 1976 г. А. Максамом и У. Гилбертом был разработан метод
секвенирования, основанный на специфической химической деградации
фрагмента ДНК, радиоактивно меченного с одного конца. Препарат
меченной ДНК разделяли на четыре аликвоты и каждую обрабатывали
реагентом, модифицирующим одно или два из четырех оснований. А.
Максам и У. Гилберт предложили модифицировать пуриновые основания
диметилсульфатом. При этом происходит метилирование адениновых
остатков по азоту в положении 3, а гуаниновых - по азоту в положении 7.
Обработка образца ДНК соляной кислотой при 0°С приводит к выщеплению
метиладенина. Последующая инкубация при температуре 90°С в щелочной
среде вызывает разрыв сахарно-фосфатной цепи ДНК в местах выщепления
оснований. Обработка пиперидином приводит к гидролизу образца по
остаткам метилгуанина. Пиримидиновые основания модифицируют
гидразином. Если реакцию вести в бессолевой среде, то модифицируются как
цитозин, так и тимидин; если обработку вести в присутствии 2М NaCl, то
модифицируется лишь цитозин. Расщепление цепи ДНК на фрагменты и в
этом случае осуществляется пиперидином. Условия реакций авторы
подбирали таким образом, чтобы в итоге получить полный набор
субфрагментов
разной
длины.
Последующий
электрофорез
в
полиакриламидном геле позволяет восстановить полную структуру
исследуемого фрагмента.
Автоматическое секвенирование ДНК
В основе автоматического секвенирования лежит уже упоминавшийся
выше метод ферментативного секвенирования с использованием
терминирующих ddNTP (*). Как и классический вариант Сэнгера,
автоматическое секвенирование включает две стадии: проведение
терминирующих реакций и разделение продуктов этих реакций с помощью
электрофореза. Как правило, автоматизирована лишь вторая стадия, т.е.
разделение меченных фрагментов ДНК в ПААГ, получение спектра эмиссии
флуорофоров и последующий обсчет собранных данных. Таким образом,
автоматическое секвенирование идеологически отличается от современного
ему ручного секвенирования только типом используемой метки.
Флуоресцентную метку включают либо в праймер, либо в терминатор
транскрипции согласно следующим схемам: меченный праймер (четыре
разных красителя) и немеченые терминаторы; меченный праймер (один
краситель) и немеченые терминаторы; меченные терминаторы (каждый тип
терминатора своим красителем) и немеченый праймер. Использование
меченных праймеров предполагает проведение четырех независимых
реакций (отдельно с каждым из терминаторов) для каждого секвенируемого
образца. Использование меченных терминаторов позволяет совместить все
четыре реакции в одной пробирке. Если используется единственный
краситель, то разделение продуктов сиквенсовой реакции в геле проводят на
4
четырех разных дорожках. Использование четырех разных красок позволяет
разгонять продукты реакции(й) на одной дорожке.
Ниже будут подробно рассмотрены свойства флуорофоров и полимераз,
используемых в секвенировании ДНК, особенности секвенирующего гельэлектрофореза и существующие типы секвенаторов.
----------------------------(*) Строго говоря, это не совсем верное утверждение, поскольку
существует как минимум два альтернативных подхода - пиросеквенирование
и секвенирование с помощью чип-гибридизации. К сожалению, эти методы
имеют довольно серьезные ограничения, а их аппаратное воплощение еще
очень далеко от совершенства, поэтому в данном обзоре они рассмотрены не
будут.
Флуоресцентные красители
Флуоресценция - это излучение, сопровождающее переход электрона из
возбужденного состояния в основное без изменения мультиплетности (т.е.
переход синглет-синглет, либо триплет-триплет). Типичное время излучения
для флуоресценции - 10-8 с. Флуоресценции должен предшествовать
обратный процесс - переход электрона в возбужденное состояние в
результате поглощения (абсорбции) кванта света. Для флуоресценции
доказана справедливость следующих правил: спектр испускания (эмиссии) не
зависит от длины волны возбуждения; испускание сдвинуто относительно
поглощения в сторону бОльших длин волн из-за энергетических потерь
(сдвиг Стокса); спектр испускания представляет собой зеркальное отражение
спектра поглощения. Для измерения флуоресценции используют время
затухания флуоресценции и квантовый выход флуоресценции (отношение
числа испущенных фотонов к числу поглощенных).
Спектр абсорбции, равно как и спектр эмиссии, зависят от химической
структуры флуорофора, а также от условий в которые молекула флуорофора
помещена (рН, температура, среда и т.д.). В автоматическом секвенировании
используют флуорофоры, абсорбция и излучение у которых происходит в
диапазоне длин волн 450-650 нм (видимая область спектра; секвенаторы ABI
и Pharmacia) и 650-825 нм (ближняя инфракрасная область спектра;
секвенаторы фирмы LI-COR).
К настоящему времени синтезировано большое число разнообразных
флуоресцентных красителей и постоянно продолжается работа над новыми, с
улучшенными характеристиками. Помимо высокого квантового выхода
флуоресценции красители должны удовлетворять двум требованиям,
перечисленным ниже. Присоединение молекулы флуорофора способно
изменять подвижность меченного фрагмента ДНК в геле. Поэтому, если
используются одновременно несколько красителей, то необходимо, чтобы
влияние каждого из них на подвижность было либо минимальным, либо
одинаковым у всех. Выравнивание электрофоретической подвижности (когда
это нужно) проводят с помощью линкерных молекул, встраиваемых между
красителем и, например, праймером. Еще одним важным моментом является
условие минимального перекрывания спектров эмиссии. К сожалению,
5
полностью избежать перекрывания спектров до сих пор не удалось. В
качестве альтернативы синтезу все новых соединений недавно был
предложен подход, основанный на определении не спектра, а времени
флуоресценции. Правда, какого-либо практического выхода эта симпатичная
идея пока не получила.
Первыми флуорофорами, адаптированными к нуждам секвенирования,
стали соединения из семейства флуоресцеиновых (FAM, JOE) и родаминовых
(TAMRA, ROX, R110, R6G) красителей. Следующее поколение флуорофоров
этого семейства - dTAMRA, dROX, dR110, dR6G - получило довесок из двух
остатков хлора. Это позволило несколько снизить перекрывание спектров
испускания и значительно повысить интенсивность флуоресценции, а значит
и чувствительность. Еще более высоким выходом флуоресценции
характеризуются "трехкомпонентные" красители класса BigDye™ (Applied
Biosystems) и DYEnamic™ ET (Amersham-Pharmacia-Biotech), при
конструировании которых был использован принцип переноса энергии. Под
переносом энергии понимают явление безизлучательного переноса энергии
возбужденного состояния от донора к акцептору. Донором в BigDye™
является 4'-аминометил-5(или 6)-карбоксифлуоресцеин (5CF или 6CF),
который связан с акцептором (представителем семейства d-родаминов) через
остаток 4-аминометилбензойной кислоты.
Все перечисленные красители флуоресцируют в видимой области
спектра. В секвенаторах, детектирующих флуоресценцию в инфракрасной
области спектра, используются красители цианинового ряда с рабочим
диапазоном 650-715 нм и 765-825 нм. Первыми коммерческими красками
этого семейства стали IRDye41 и IRDye40. Максимумы абсорбции и
флуоресценции этих соединений расположены в районе 800 нм. Позднее был
сконструирован еще один краситель со схожими спектральными
характеристиками - IRDye800, фосфороамидитная группировка которого
позволяет присоединять краситель к праймеру в процессе синтеза
последнего. В диапазоне 650-715 нм работают IRDye700, Cy5 и Cy5.5
Полимеразы, используемые при секвенировании ДНК
В оригинальной работе Ф. Сэнгера для проведения сиквенсовых реакций
был использован Кленовский фрагмент ДНК-полимеразы I из E.Coli. В
настоящее время для секвенирования используют рекомбинантные ДНКполимеразы, отвечающие следующим требованиям: отсутствие 3'- и 5'экзонуклеазной активности, отсутствие дискриминации по включению в
растущую цепь как обычных, так и модифицированных (меченных) ddNTP.
Выбор конкретной полимеразы зависит от условий проведения сиквенсовой
реакции. Всего существует два разных подхода. В первом случае
копирование
осуществляется
при
37°С
высокопроцессивными
термолабильными полимеразами (например, T7 DNA polymerase - Sequenase
v1.0 и v2.0, Amersham Pharmacia Biotech). Во втором - реализуется
циклический процесс, который включает денатурацию, отжиг и элонгацию, и
предполагает использование термостабильных полимераз (например, Thermo
Sequenase™, Amersham Pharmacia Biotech и AmpliTaq FS™, PE Biosystems).
6
Секвенирующий гель и электрофорез
Полученные в реакции секвенирования радиоактивно/флуоресцентно
меченные одноцепочечные фрагменты ДНК разделяют с помощью
электрофореза в полиакриламидном геле. Гели, используемые в
секвенировании должны уметь разделять фрагменты, отличающиеся друг от
друга на один нуклеотид в широком диапазоне длин. Разделение должно
проходить в денатурирующих условиях, препятствующих ренатурации и
возникновению вторичных структур у разделяемых фрагментов. В общем
случае этим требованиям удовлетворяют 5-8% полиакриламидные гели,
содержащие 7М мочевину. Обычно электрофорез проводится в трисборатном буфере (89 mМ Трис-HCl, 8.9 mM борной кислоты, 2mM ЭДТА, рН
8.0-8.5). Для эффективного разделения напряжение должно составлять 3050В на см длины геля. Важным условием при проведении э/ф является
однородность температуры по всей поверхности геля. Неравномерный нагрев
геля и стекол во время электрофореза способен привести к разнице в
скоростях движения фрагментов ДНК по ширине геля и, как следствие, к
искажению результатов. Для борьбы с этим явлением используют тонкие
(обычно 0.4 - 0.1 мм) гели и принудительный подогрев стекол. В
автоматическом секвенировании помимо электрофореза в пластинах
полиакриламида чрезвычайно популярен капиллярный электрофорез в
линейном полиакриламиде. Капилляры представляют собой стеклянную
трубку длинной 30-100 см, закатанную в полимерный пластификатор.
Небольшой диаметр капилляра (50-100 мкм) позволяет проводить разделение
значительно быстрее, чем в обычных гелях. Кроме того, капиллярные
секвенаторы
позволяют
обеспечивать
гораздо
более
высокую
чувствительность за счет отсутствия горизонтальной диффузии.
Cеквенаторы
Современные секвенаторы можно разделить по типу проводимого
электрофореза на капиллярные и те, в которых разделение происходит в
гелевых пластинах. Последние могут также различаться по количеству
детектируемых красителей: один, два или четыре. Капиллярные секвенаторы
выпускаются только в варианте, использующем детекцию четырех
флуоресцентных красок.
Наиболее успешным секвенатором начала 90-х стал ABI 373 (Applied
Biosystems). В этой модели используется одновременная детекция четырех
красителей (TAMRA, FAM, ROX, JOE), возбуждаемых излучением
аргонового лазера. Лазер генерирует непрерывное излучение в сине-зеленой
области спектра в диапазоне 488-514 нм. Разделение фрагментов проводится
в геле толщиной 0.4 мм. Возбуждение флуорофора и следующая за этим
эмиссия флуоресценции происходят при прохождении меченным
фрагментом ДНК зоны сканирования. Для уменьшения эффекта
перекрывания спектров эмиссии, получаемый сигнал пропускается через
колесо с четырьмя последовательно заменяемыми фильтрами. В результате,
первичные данные представляют собой наборы из четырех чисел (в
7
соответствии с сигналом, прошедшим через каждый из фильтров) для каждой
точки сканирования (по ширине геля), собранные через равные интервалы
времени в течение всего электрофореза.
Среди секвенаторов, детектирующих флуоресценцию одного красителя,
можно выделить секвенатор MicroGene Blaster фирмы Visible Genetics.
MicroGene Blaster позволяет одновременно проводить анализ четырех
образцов, меченных Cy5.5, на 16-ти дорожках. Разделение происходит в
одноразовых MicroCel кассетах, заполняемых фотополимеризуемым
акриламидом. Высота кассет варьирует от 140 до 280 мм, что позволяет
секвенировать от 300 (MicroCel 300 Cassette) до 700 (MicroCel 700 Cassette)
нуклеотидов. В качестве источника излучения используется HeNe лазер с
длинной волны 632.8 нм. Луч лазера направляется не через, а между
стеклами, т.е. поперек геля. Это позволило отказаться от любых движущихся
частей и, следовательно, значительно повысить надежность прибора и
уменьшить его размеры.
Интересные секвенаторы, работающие на двух красителях в
инфракрасной области спектра, выпускает фирма LI-COR. Ее основная
машина - IR2 DNA Sequencer. Как известно, естественное инфракрасное
излучение не свойственно биологическим макромолекулам и компонентам
акриламидных гелей и это положительно отражается на качестве
секвенирования. IR2 несёт два твердофазных полупроводниковых лазера,
один из которых генерирует излучение с длиной волны 680 нм, а другой - 780
нм. В качестве красителей используются IRDye700 и IRDye800 или их
производные. Детекция каждого из флуорофоров осуществляется своим
фотодиодом. Причем, возбуждение/детекция красителей происходит не
одновременно, а последовательно. Подобная двухканальная система
позволяет: во-первых, избежать перекрывания спектров эмиссии (они
разнесены на 100 нм), и во-вторых проводить одновременное
двунаправленное секвенирование (сразу с двух праймеров, каждый из
которых мечен своим красителем). Разделение фрагментов в IR2 проводится
в гелях с высотой от 18 до 48 см и шириной 25 см, способных вмещать от 32
до 96 дорожек. Толщина гелей может варьировать от 0.2 мм до 0.4 мм. За
один прогон IR2 DNA Sequencer способен определять более 1000
нуклеотидов и является по этому показателю рекордсменом.
Конкурентом IR2 DNA Sequencer стал секвенатор ABI Prism 377,
который пришел на смену ABI 373. Основное новшество этой машины
заключается в замене оптической фильтрации флуоресценции, которая
использовалась в ABI 373 для разделения спектров испускания красителей,
на "виртуальную" фильтрацию. В процессе сканирования эмиссия
флуоресценции отделяется от отраженного света лазера, рассеивается
посредством дифракционной решетки (это позволяет разложить исходный
световой пучок на спектральные составляющие) и, наконец, фиксируется
CCD-камерой. Т.е. в итоге кванты света преобразуются в пиксели во всем
промежутке спектра от 514 до 680 нм. Какой именно набор пикселей
преобразовать в пик на хроматограмме задается заранее через интерфейс
программы Data Collection в зависимости от используемых флуорофоров и
8
способа введения метки. Выпускается несколько модификаций ABI 377.
Самый простой вариант обеспечивает автоматический обсчет 18-ти образцов,
самый продвинутый - 96-ти. Расстояние до точки сканирования (т.е.
дистанция разгонки) может варьировать в зависимости от размеров
используемых стекол и составлять 12, 36 или 48 см (при толщине геля 0.2
или 0.4 мм). Максимально возможный размер определяемых фрагментов 800-900 нуклеотидов.
Схожая технология записи и обработки данных используется в другом
секвенаторе фирмы Applied Biosystems - ABI Prism 310. Это
однокапиллярный секвенатор, способный в автоматическом режиме
последовательно просканировать 96 образцов. Полный цикл для каждого из
них
составляет
приблизительно
полтора
часа
и
включает:
электрокинетическую инжекцию образца в капилляр, электрофорез,
возбуждение/детекцию эмиссии флуоресценции и смену полимерного
материала в капилляре перед инжекцией следующего образца. За указанное
время ABI 310 способен прочитать приблизительно 450 нуклеотидов.
ABI Prism 310 стал пионером капиллярной технологии в
секвенировании. Нынешнее поколение капиллярных секвенаторов
представляет собой уже мультикапиллярные машины, некоторые из которых
демонстрируют гораздо более высокую производительность даже в
сравнении с ABI 377. В зависимости от поставленных задач можно
остановить свой выбор на восьмикапиллярном Beckman CEQ 2000 (Beckman
Coulter), шестнадцатикапиллярном секвенаторе ABI Prism 3100 или 96-ти
капиллярных ABI Prism 3700 и MegaBACE 1000 (Amersham-PharmaciaBiotech-Molecular Dynamics).
9
Скачать