Ген!

advertisement
1.
Инструменты генной
инженерии
- ФЕРМЕНТЫ
Момыналиев К.Т.
Современные проблемы биологии, ЕНУ,
Астана, 2012
ПОНЯТИЯ
«липкие» концы
сайт
5`.......GTGATGCGTTCGG.....3`
3`..ATGCTCACTACGCAAGCC.....5`
«тупые» концы
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
I. Эндонуклеазы рестрикции
(«рестриктазы»)
Часть системы «рестрикциимодификации» бактерий.
Специфически гидролизуют молекулы
двухцепочечных ДНК при наличии в них
определенных последовательностей
нуклеотидов, называемых «сайтами
рестрикции»
Современные проблемы биологии, ЕНУ,
Астана, 2012
I (a): Эндонуклеазы рестрикции
•
Эндонуклеазы рестрикции распознают и гидролизуют
специфические последовательности внутри молекулы
ДНК
•
Мишеневые последовательности для этих ферментов –
палиндромные (в результате образуются гомодимеры )
5’-ATAT-3’
3’-TATA-5’
•
Мишеневые последовательности обычно 4-6 п.о.

«Мелкощепящие» (каждые 256 п.о.) или
«крупнощепящие» каждые 4096 п.о.)
Mbo I (4 cutter)
5’--AACGATCGAA---TTGCTAGCTT--
Pvu I
Pvu I (6 cutter)
5’--AAC-OH
--TTGCTAG-P
Современные проблемы биологии, ЕНУ,
Астана, 2012
5’ выступающие
/ «липкие концы»
I (b): Эндонуклеазы рестрикции
• некоторые рестриктазы образуют «тупые» концы
5’-GATATC-CTATAG-5’
EcoRV
• некоторые рестриктазы распознают сайты 8, 10, 12 п.о.
-AGACGTCTC
A
Эти ферменты менее специфичны,
поскольку гидролизуют так
называемые «дегенеративные»
Современные проблемы
биологии, ЕНУ,
последовательности
Астана, 2012
Сайт расщепления находится на обоих
цепях ДНК
пример, EcoRI
5’-NNGAATTCNN-3’
3’-NNCTTAAGNN-5’
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
II. ДНК-лигазы
•
Формируют фосфодиэфирные связи
•
Обратное действие эндонуклеаз —OH (P)—
Для работы необходимы ATФ, 3’OH и 5’ фосфат на 3’
цепи ДНК
•
Работают более эффективно с «липкими» концами
ДНК
OH P
ATФ 5’-AATCGATCGTCC5’-AATCGATCGTCC-TTAGCTAGCAGG-5’
-TTAGCTAGCAGG-5’Лигаза
P OH
- Фермент не является чувствительным к
Современные проблемы биологии, ЕНУ,
последовательности
ДНК
Астана, 2012
Этапы реакции:
1. Образование промежуточного конъюгата фермента с АМФ
2. Перенос остатка АМФ на 5` - фосфатную группу концевого
нуклеотида в точке разрыва ДНК
3. Возникшая фосфодиэфирная связь гидролизуется во время
нуклеофильной атаки 3`-ОН группы соседнего нуклеотида.
Образуется новая фосфодиэфирная связь, освобождается АМФ
Современные проблемы биологии, ЕНУ,
Астана, 2012
Структура гена, транскрипция
Современные проблемы биологии, ЕНУ,
Астана, 2012
Обычная структура гена
Промотор
Кодирующий регион
+1
транскрипция
Современные проблемы биологии, ЕНУ,
Астана, 2012
Прокариоты
Координированная
экспрессия генов: гены в
кластере (оперон)
контролируются одним
промотором и
транскрибируется как
полицистронная мРНК и
кодирует множество
продуктов
Современные проблемы биологии, ЕНУ,
Астана, 2012
Эукариоты
Прерывистые гены
(экзон/интрон)
Моноцистронная мРНК
Пост-трансляционная
модификация:
5’ CAP
polyA tail
splicing
Современные проблемы биологии, ЕНУ,
Астана, 2012
Пост-транскрипционная добавление 5’ CAP к кодируемой
эукариотической мРНК
Современные проблемы биологии, ЕНУ,
Астана, 2012
Сигнал для сплайсинга
Экзоны прерываются интронами и обычно
фланкированы GT и AG
Современные проблемы биологии, ЕНУ,
Астана, 2012
Промотор
• Промотор - сегмент ДНК, находящийся
перед транскриптом
Promoter
5’
3’
• Промотор притягивает RNA Polymerase к
старту транскрипции
Современные проблемы биологии, ЕНУ,
Астана, 2012
Предсказание генов
Современные проблемы биологии, ЕНУ,
Астана, 2012
Предсказание генов
• Ген: Последовательность нуклеотидов,
кодирующая белок
• Проблема предсказания генов:
Определение начала и концевой позиции
гена в геноме
Современные проблемы биологии, ЕНУ,
Астана, 2012
Предсказание генов
aatgcatgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcat
gcggctatgcaagctgggatccgatgactatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatg
gtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatt
taccttggaatatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgc
ggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctgggatccg
atgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatcctgcggctatgctaatgaatggtcttgg
gatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttg
gaatatgctaatgcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcat
gcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcgg
ctatgctaagctcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgc
ggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggct
atgctaagctcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgc
ggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggaatgcatgcg
gctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatga
ctatgctaagctgcggctatgctaatgcatgcggctatgctaagctcatgcgg
Современные проблемы биологии, ЕНУ,
Астана, 2012
Предсказание генов
aatgcatgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcat
gcggctatgcaagctgggatccgatgactatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatg
gtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatt
taccttggaatatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgc
ggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctgggatccg
atgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatcctgcggctatgctaatgaatggtcttgg
gatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttg
gaatatgctaatgcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcat
gcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcgg
ctatgctaagctcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgc
ggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggct
atgctaagctcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgc
ggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggaatgcatgcg
gctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatga
ctatgctaagctgcggctatgctaatgcatgcggctatgctaagctcatgcgg
Современные проблемы биологии, ЕНУ,
Астана, 2012
Предсказание генов
aatgcatgcggctatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcat
gcggctatgcaagctgggatccgatgactatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatg
gtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatt
taccttggaatatgctaatgcatgcggctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgc
ggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggctatgctaagctgggatccg
atgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatcctgcggctatgctaatgaatggtcttgg
gatttaccttggaatgctaagctgggatccgatgacaatgcatgcggctatgctaatgaatggtcttgggatttaccttg
gaatatgctaatgcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcat
gcggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcgg
ctatgctaagctcatgcggctatgctaagctgggaatgcatgcggctatgctaagctgggatccgatgacaatgcatgc
ggctatgctaatgcatgcggctatgcaagctgggatccgatgactatgctaagctgcggctatgctaatgcatgcggct
atgctaagctcggctatgctaatgaatggtcttgggatttaccttggaatgctaagctgggatccgatgacaatgcatgc
ggctatgctaatgaatggtcttgggatttaccttggaatatgctaatgcatgcggctatgctaagctgggaatgcatgcg
gctatgctaagctgggatccgatgacaatgcatgcggctatgctaatgcatgcggctatgcaagctgggatccgatga
ctatgctaagctgcggctatgctaatgcatgcggctatgctaagctcatgcgg
Ген!
Современные проблемы биологии, ЕНУ,
Астана, 2012
Кодон
• В 1961 Sydney Brenner и Francis Crick открыли
frameshift мутации
• Систематический выброс (стирание) нуклеотидов
из ДНК
– Единичная и двойная делеция драматически
изменяет структуру белка
– Эффект делеции триплета минимален
– Вывод: каждый нуклеотидный триплет (кодон)
кодирует только одну аминокислоту в белке
Современные проблемы биологии, ЕНУ,
Астана, 2012
The Sly Fox
• В ряду
THE SLY FOX AND THE SHY DOG
• Уберите 1, 2, и 3 нуклеотида после ‘S’:
THE SYF OXA NDT HES HYD OG
THE SFO XAN DTH ESH YDO G
THE SOX AND THE SHY DOG
• Какая из делеций наименее ущербна?
Современные проблемы биологии, ЕНУ,
Астана, 2012
Трансляция нуклеотидов в аминоксилоты
• Кодон: 3 нуклеотида
• 4 3 = 64 возможных кодона
• Генетический код вырожден и избыточен
– включает старт и стоп кодоны
– Аминокислота может кодироваться более чем
одним кодоном
Современные проблемы биологии, ЕНУ,
Астана, 2012
Генетический код
Современные проблемы биологии, ЕНУ,
Астана, 2012
Экзоны и интроны
• У эукариот, ген является комбинацией
кодирующего сиквенса (exons), который
прерывается некодирующим сиквенсом
(introns)
• Компьютерное предсказывание генов у
эукариот более проблематичное
• Прокариоты не имеют интронов –гены
протяженные структуры
Современные проблемы биологии, ЕНУ,
Астана, 2012
Два подхода для предсказания
гена
• Статистический: кодирующий сегмент (exons)
имеет типичные последовательности на концах и
использует разные последовательности для
некодирующих сегментов (introns).
• Сходство генов: множество генов человека похожи
на гены мышей, цыплят и бактерий. Поэтому,
известные гены мышей, цыплят и бактерий могут
помочь в идентификации генов человека.
Современные проблемы биологии, ЕНУ,
Астана, 2012
Подход основанный на сходстве последовательностей
Современные проблемы биологии, ЕНУ,
Астана, 2012
Генетический код и стоп кодоны
UAA, UAG и UGA 3
Stop кодона,
которые (вместе со
старт кодоном ATG)
определяют Open
Reading Frames
Современные проблемы биологии, ЕНУ,
Астана, 2012
Шесть рамок считывания в ДНк
последовательности
CTGCAGACGAAACCTCTTGATGTAGTTGGCCTGACACCGACAATAATGAAGACTACCGTCTTACTAACAC
CTGCAGACGAAACCTCTTGATGTAGTTGGCCTGACACCGACAATAATGAAGACTACCGTCTTACTAACAC
CTGCAGACGAAACCTCTTGATGTAGTTGGCCTGACACCGACAATAATGAAGACTACCGTCTTACTAACAC
CTGCAGACGAAACCTCTTGATGTAGTTGGCCTGACACCGACAATAATGAAGACTACCGTCTTACTAACAC
GACGTCTGCTTTGGAGAACTACATCAACCGGACTGTGGCTGTTATTACTTCTGATGGCAGAATGATTGTG
GACGTCTGCTTTGGAGAACTACATCAACCGGACTGTGGCTGTTATTACTTCTGATGGCAGAATGATTGTG
GACGTCTGCTTTGGAGAACTACATCAACCGGACTGTGGCTGTTATTACTTCTGATGGCAGAATGATTGTG
GACGTCTGCTTTGGAGAACTACATCAACCGGACTGTGGCTGTTATTACTTCTGATGGCAGAATGATTGTG
• Стоп кодон – TAA, TAG, TGA
• Старт кодон - ATG
Современные проблемы биологии, ЕНУ,
Астана, 2012
n
3
Открытые рамки считывания
(ORFs)
• Определение потенциально кодирующих регионов (ORFs)
– Геном размером n состоит из (n/3) кодонов
– Стоп кодоны разбивает геном на сегменты
– Субсегменты которые начинаются со старт кодона (ATG) являются
ORFs
• ORFs в различных рамках считывания могут перекрываться
ATG
TGA
Genomic Sequence
Open reading frame
Современные проблемы биологии, ЕНУ,
Астана, 2012
Длинные vs.Короткие ORFs
• Длинные ОРС могут быть генами
• При случайном распределении, мы можем ожидать стоп
кодон каждые (64/3) ~= 21 кодон
– Однако, гены более протяженные
– Основной подход – сканирование ОРС превосходящих
по длине определенный порог
– Несколько наивно, так как некоторые гены (напмер
кодирующие иммунный ответ) относительно короткие
Современные проблемы биологии, ЕНУ,
Астана, 2012
Проверка ОРС: Использование
кодонов
• Создание 64-элементной таблицы частоты
использования кодонов в ОРС
• Аминокислоты обычно имеют более одного
кодона, но определенные кодоны
используются более часто
• Неравное использование кодонов может
характеризовать реальный ген
• Таким образом можно компенсировать
недостаток теста длины ОРС
Современные проблемы биологии, ЕНУ,
Астана, 2012
Использование кодонов в
геноме человека
Современные проблемы биологии, ЕНУ,
Астана, 2012
Использование кодонов в
геноме мыши
AA codon
Ser TCG
Ser TCA
Ser TCT
Ser TCC
Ser AGT
Ser AGC
/1000
4.31
11.44
15.70
17.92
12.25
19.54
frac
0.05
0.14
0.19
0.22
0.15
0.24
Pro
Pro
Pro
Pro
6.33
17.10
18.31
18.42
0.11
0.28
0.30
0.31
CCG
CCA
CCT
CCC
AA codon
Leu CTG
Leu CTA
Leu CTT
Leu CTC
/1000
39.95
7.89
12.97
20.04
frac
0.40
0.08
0.13
0.20
Ala
Ala
Ala
Ala
GCG
GCA
GCT
GCC
6.72
15.80
20.12
26.51
0.10
0.23
0.29
0.38
Gln
Gln
CAG
CAA
34.18
11.51
0.75
0.25
Современные проблемы биологии, ЕНУ,
Астана, 2012
Предсказывание генов и мотивы
• Регион находящийся перед геном часто
содержит мотивы, которые могут быть
использованы для предсказания гена
ATG
-35
-10
0
TTCCAA TATACT
Pribnow Box
10
GGAGG
Ribosomal binding site
Transcription start site
Современные проблемы биологии, ЕНУ,
Астана, 2012
STOP
Структура промотора прокариот (E.Coli)
Старт транскрипции
0.
• Pribnow Box (-10)
• Gilbert Box (-30)
• Ribosomal Binding
Site (+10)
Современные проблемы биологии, ЕНУ,
Астана, 2012
National Center for Biotechnology
Information
Современные проблемы биологии, ЕНУ,
Астана, 2012
Basic Local Alignment Search Tool
(BLAST)
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Современные проблемы биологии, ЕНУ,
Астана, 2012
Download