Cравнение аминокислотных и нуклеотидных

advertisement
Сравнение аминокислотных последовательностей белков и
нуклеотидных последовательностей соответствующих генов.
Цель: Исследовать элементарные эволюционные события в ближайших гомологах
RRMJ_ECOLI и зависимость процента совпадений последовательностей белков от
процента совпадений последовательностей их генов.
1) Была создана выборка гомологов.
ID гомолога
RRMJ_Salpa
RRMJ_Erwst
RRMJ_Pholl
RRMJ_Vibch
RRMJ_Xylft
RRMJ_Bucap
АС
гомолога
Q5PLC1
Q6D9B9
Q7MYY0
Q9KU87
Q9PH52
Q8K9G7
ID гена
CP000026
BX950851,1
BX571874.1
AE004149
AE003863
AAM67922
Процент
идентичности
гомолога с
RRMJ_Ecoli
99
94
90
70
52
49
Обозначение
Fastaфайлов
p1/g1
p2/g2
p3/g3
p4/g4
p5/g5
p6/g6
2) Элементарные эволюционные события в ближайших гомологах
Выравнивание RRMJ_Ecoli c RRMJ_Salpa выявило только выпадение последней
аминокислоты (пролина) в гомологе.
При выравнивании соответствующих генов было обнаружено выпадение последнего
триплета («ссс» в моем белке). Также были обнаружено 52 замены нуклеотидных
остатков. 51 из них не привела к заменам аминокислот в белке (так называемые
синонимичные замены).
Матрица замен:
A
A
T
G
C
T
3
17
4
G
6
18
C
4
Зеленым цветом выделены транзиционные замены.
Бежевым – трансверсионные. Соотношение транзиций к трансверсиям равно 35:17.
Очевидно, что вероятность замены пурина на пиримидин и наоборот во время синтеза
ДНК меньше, чем вероятность замены пурина на пурин и пиримидина на пиримидин.
43 замены произошли в третьих позициях.
Таблица синонимичных замен:
Аминокислота
триплет в
RRMJ_Ecoli
триплет в
RRMJ_Salpa
Количество
Ala
Ala
Arg
Arg
Arg
Asp
Cys
Cys
Gln
Gln
Glu
Glu
Gly
Gly
Gly
Gly
Gly
Lys
Lys
Leu
Leu
Leu
Leu
Leu
Leu
Leu
Pro
Thr
Tyr
Ser
Ser
Ser
Ser
Val
Val
Val
Val
Val
Val
gca
gct
cgt
cgg
cgt
gac
tgt
tgc
caa
cag
gag
gaa
ggt
ggt
ggt
ggc
ggc
aag
aaa
tta
ctc
ctt
ctg
ctg
cta
tta
ccg
acc
tat
tcc
agc
tcc
tct
gtg
gtt
gtt
gtc
gta
gtc
gcg
gcg
cga
cgt
cgc
gat
tgc
tgt
cag
caa
gaa
gag
ggc
gga
ggg
ggt
gga
aaa
aag
cta
ctt
ctc
ctt
tta
tta
ctg
cca
acg
tac
tca
agt
tcg
tcg
gtc
gta
gtg
gta
gtg
gtt
3
1
1
1
3
1
1
1
2
1
1
2
2
1
1
1
1
1
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
Голубым цветом выделены замены, произошедшие не по третьей позиции.
Также найдена одна несинонимичная замена: gtt(валин) – att(изолейцин).
3) Исследование зависимости процента совпадений последовательностей
белков от процента совпадений последовательностей их генов.
Ниже приведен график.
Розовая линия (ось С) показывает зависимость процента совпадений в белковых
последовательностях от совпадений в нуклеотидной последовательности. Ось С
получена следующим образом: прямой соединены точки, отвечающие за
выравнивание, с одной стороны, последовательности некоторого белка с самим собой
(100, 100), с другой стороны, последовательностей двух несвязанных белков (5, 25).
Синяя ломаная – аналогичная зависимость для выборки гомологов белка RRMJ_Ecoli.
Желтая ломаная - зависимость для выборки гомологов белка гемагглютинина.
RRMJ
120
моя
выборка
gen identity
100
прямая
сравнения
80
60
вирус
гриппа
40
20
0
0
50
100
150
protein identity
На первый взгляд они очень похожи. Но…
Гемагглютинин – белок, с помощью которого вирус гриппа присоединяется к клеткам
человека. Конфигурация аминокислот, определяющих разновидность белка
гемагглютинина, часто изменяется, ежегодно появляется новый тип вируса гриппа.
График для гемагглютинина соответствует набору мало консервативных
последовательностей.
График для RRMJ_Ecoli отражает большую консервативность этого белка по
сравнению с гемагглютинином.
Download