IV семестр «Функция и эволюция» БЛОК 1 «Эволюция» – 4 занятия

advertisement
IV семестр «Функция и эволюция»

БЛОК 1 «Эволюция» – 4 занятия
•
•
•
Молекулярная филогенетика. Задачи и подходы. Лекциясеминар, 13.02. (АБР)
Реконструкция филогенетических деревьев. 2 практических
занятия, 20.02 и 27.02 (САС, АБР)
«Алгоритмы реконструкции филогенетических деревьев».
Лекция, семинар, обсуждение полученных результатов, 6.03
(САС).
Срок сдачи основного отчета – 5.03


БЛОК 2 «Функции генов и их продуктов» – 4
занятия
БЛОК 3 «Эволюция белкового семейства» – 5
занятий
Biologists must constantly keep in
mind that what they see was not
designed, but rather evolved. It
might be thought, therefore, that
evolutionary arguments would play
a large part in guiding biological
research, but this is far from the
case.
Francis Crick
What Mad Pursuit (1988) pp.138-139
Вы это уже делали! Прокомментируйте…
MYG_HETPO/
MYG_GALGA/
MYG_ALLMI/
MYG_CYPCA/
HBA_HETPO/
HBA1_TORMA
HBA_SQUAC/
HBA_LEPPA/
HBA1_BOSMU
HBAT_HORSE
HBA1_IGUIG
HBAZ_CAPHI
HBA3_PLEWA
HBAD_PASMO
HBAD_LIOMI
HBA1_XENBO
HBA1_PLEWA
HBA_CATCL/
HBB1_XENBO
HBB_RANCA/
HBB2_XENLA
HBB0_MOUSE
HBBN_AMMLE
HBB_ALLMI/
HBB1_CYGMA
HBB_LEPPA/
HBB_SQUAC/
HBB_HETPO/
HBAM_RANCA
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
*
20
*
40
*
60
*
80
EWEHVNKVWAVVEPDIPAVGLAILLRLFKEHKETKDLFPKF-KE-IPVQQLGNNEDLRKHGVTVLRALGNILKQ------KGKHSTNVK
DWDKVNSVWSAMEANITAVGQNILLRLFEQYPESQSYFPKL-KN-KSLGELKDTADIKAQADTVLKALGNIVKK------KGNHSQPVK
EWKHVLDIWTKVESKLPEHGHEVIIRLLQEHPETQERFEKF-KHMKTADEMKSSEKMKQHGNTVFTALGNILKQ------KGNHAEVLK
DAELVLKCWGGVEADFEGTGGEVLTRLFKQHPETQKLFPKF-VG-IASNELAGNAAVKAHGATVLKKLGELLKA------RGDHAAILK
DRAELAALSKVLAQNAEAFGAEALARMFTVYAATKSYFKDY-KDFT-----AAAPSIKAHGAKVVTALAKACDHL-----D-DLKTHLH
NKKAIKNLLQKIHSQTEVLGAEALARLFECHPQTKSYFPKF-SGFS-----ANDKRVKHHGALVLKALVDTNKHL-----D-DLPHHLN
DKTAIKHLTGSLRTNAEAWGAESLARMFATTPSTKTYFSKF-TDFS-----ANGKRVKAHGGKVLNAVADATDHL-----D-NVAGHLD
DEVLIKEAWGLL-HQIPNAGGEALARMFSCYPGTKSYFPHFGHDFS-----ANNEKVKHHGKKVVDAIGQGVQHL-----H-DLSSCLH
DKGNVKAAWGKVGGHAAEYGAEALERMFLSFPTTKTYFPHF--DLS-----QGSAQVKGHGAKVAAALTKAVEHL-----D-DLPGALS
DRATVRALWKKMGSNVGVYATEALERMFLGFPSTTTYFLHL--DLS-----LGSTQVKAHGQKVADALTLAVEHL-----E-DLPRALS
DKNHIRAIWGHVDNNPEAFGVEALTRLFLAYPATKTYFAHF--DLN-----PGSAQIKAHGKKVVDALTQAVNNL-----D-DIPDALA
ERTIILSLWSKISTQADVIGTETLERLFSCYPQAKTYFPHF--DLH-----SGSAQLRAHGSKVVAAVGDAVKSI-----D-NVTSALS
EKALVVGLCGKISGHCDALGGEALDRLFASFGQTRTYFSHF--DLS-----PGSADVKRHGGKVLSAIGEAAKHI-----D-SMDQALS
DKKLIQQIWGKLGGAEEEIGADALWRMFHSYPSTKTYFPHF--DLS-----QGSDQIRGHGKKVVAALSNAIKNL-----D-NLSQALS
DRRLLQASVGKLGCRLEDIGADALNRLLITFPQSKTYFSHF--NLS-----PGSKDIIHQGEKVGKALDSALKHL-----D-DIRGTLS
DKKHIKAIMPSIAAHGDKFGGEALYRMFLVNPKTKTYFPTF--DFH-----HNSKQISAHGKKVVDALNEASNHL-----D-NIAGSLS
DKHNVKAIWDHVKGHEEAIGAEALYRMFCCMPTTRIYFPAK--DLS-----ERSSYLHSHGKKVVGALTNAVAHI-----D-DIDTAFS
DKADVKIAWAKISPRADEIGAEALGRMLTVYPQTKTYFAHW-ADLS-----PGSGPVKHGKKVIMGAIGDAVTKF-----D-DLLGGLA
DRQLINSTWGKV--CAKTIGKEALGRLLWTYPWTQRYFSSF-GNLNSADAVFHNEAVAAHGEKVVTSIGEAIKHM-----D-DIKGYYA
GGSDVSAFLAKV--DKRAVGGEALARLLIVYPWTQRYFSTF-GNLGSADAISHNSKVLAHGQRVLDSIEEGLKHP-----Z-BLKAYYA
EKAAITSVWQKV--NVEHDGHDALGRLLIVYPWTQRYFSNF-GNLSNSAAVAGNAKVQAHGKKVLSAVGNAISHI-----D-SVKSSLQ
EKAAITSIWDKV--DLEKVGGETLGRLLIVYPWTQRFFDKF-GNLSSAQAIMGNPRIKAHGKKVLTSLGLAVKNM-----D-NLKETFA
BKALITGFWSKV--KVBZVGAZALGRLLVVYPWTZRFFZHF-GBLSSABAVMBBAKVKAHGKKVLBSFSBGLKHL-----B-BLKGAFA
ERKFIVDLWAKV--DVAQCGADALSRMLIVYPWKRRYFEHF-GKMCNAHDILHNSKVQEHGKKVLASFGEAVKHL-----D-NIKGHFA
ELTIINDIFSHL--DYDDIGPKALSRCLIVYPWTQRHFSGF-GNLYNAEAIIGNANVAAHGIKVLHGLDRGLKNM-----D-NIVDAYA
EKQYIVSVFSKI--DVDHVGANTLERVLIVFPWTKRYFNSF-GDLSSPGAIKHNNKVSAHGRKVLAAIIECTRHF-----G-NIKGHLA
EKALVNAVWTKT--DHQAVVAKALERLFVVYPWTKTYFVKFNGKFH-----ASDSTVQTHAGKVVSALTVAYNHI-----D-DVKPHFV
ELHEITTTWKSI--DKHSLGAKALARMFIVYPWTTRYFGNL-KEFT-----ACSYGVKEHAKKVTGALGVAVTHL-----G-DVKSQFT
EKSAVASLWEKIAPQTNKLGAESMERLFKNHPETKSFFSRF--DIS-----PGSQDLLTHGGKIFGALGEAIKSL----------DNLQ
6
g
6 R
p
F
6 hg 6
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
81
81
82
81
77
77
77
77
76
76
76
76
76
76
76
76
76
77
80
80
80
80
80
80
80
80
76
75
72
Весна, 2008, А.Б.Рахманинова
Молекулярная эволюция
(молекулярная филогенетика)
Весна, 2008, А.Б.Рахманинова
Молекулярная филогенетика
─
изучение филогенеза и эволюции путем
анализа нуклеотидных и
аминокислотных последовательностей
Основные этапы биоинформатического анализа
молекулярной эволюции





Выбор последовательностей и их выравнивание
Построение/выбор эволюционной модели
Реконструкция эволюции
 реконструкция филогенетического дерева
 оценка силы давления и направления отбора
 сравнение скоростей эволюции
 ...
Оценка статистической значимости реконструкции
?
Весна, 2008, А.Б.Раманинова
Что будет?
Выбор последовательностей и их выравнивание
 Построение/выбор эволюционной модели
 Реконструкция эволюции
 реконструкция филогенетического дерева
 оценка силы давления и направления отбора
 сравнение скоростей эволюции
 ...
 Оценка статистической значимости реконструкции

!
Весна, 2008, А.Б.Рахманинова
Выбор последовательностей и их
выравнивание
P04443|HBB : MVHFTAEEKAAITSIWDKVDLEKVGGETLGRLLIVYPWTQRFFDKFGNLSSAQAIMGNPRIKAHGKKVLTSLGLAVKNMDNLKETFAHLSE :
P07432|HBB : -MGLTAHDRQLINSTWGKVCAKTIGKEALGRLLWTYPWTQRYFSSFGNLNSADAVFHNEAVAAHGEKVVTSIGEAIKHMDDIKGYYAQLSK :
: :**.:: *.* *.** :.:* *:***** .******:*..****.**:*:: * : ***:**:**:* *:*:**::* :*:**:
100
*
120
*
140
P04443|HBB : LHCDKLHADPENFKLLGNMLVIVLSSYFGKEFTAEAQAAWQKLVVGVATALSHKYH : 147
P07432|HBB : YHSETLHVDPCNFKRFGGCLSISLARQFHEEYTPELHAAYEHLFDAIADALGKGYH : 146
*.:.**.** *** :*. * * *: * :*:*.* :**:::*. .:* **.: **
gene1(P04443)
gene2(P07432)
TACCCATGGACTCAGAGG
TATCCCTGGACCCAAAGA
** ** ***** ** **
Весна, 2007, А.Б.Рахманинова
Выравнивание ?
# Length: 502
# Identity:
286/502 (57.0%)
# Similarity:
286/502 (57.0%)
# Gaps:
119/502 (23.7%)
# Score: 678.5
#=======================================
CAA32220|
AAA49655|
CAA32220|
AAA49655|
CAA32220|
AAA49655|
CAA32220|
AAA49655|
CAA32220|
AAA49655|
1 atggttcatttcacagctgaggagaaggcagct-atcacaagcatctggg
||||
.|||.|||||..|.|| ..|.||||| ||||..||||.|||||
1 atgg---gtttgacagcacatga-tcgtcagctgatcaacagcacctggg
49
50 ataaagt--------ggac--ttggaaaaagttggaggagaaactctggg
..|||||
.||| |.||||||
||||
|.||.||
47 gcaaagtatgtgccaagactataggaaaa-----gagg-----cccttgg
89
90 aaggctcctgattg--tttacccatggactcagaggttctttgacaaa-|.|.||.||| || .|||.||.|||||.||.||.|.||||
|
87 acgtctgctg--tggacttatccctggacccaaagatacttt-----agt
135
136 ---tttggaaacctctcttctgcccaagccatcatgggtaatcccagaat
|||||.||||||.....|||..|.|||.||
|.|||.|||
130 tcttttgggaacctcaacagtgctgacgccgtc--------ttccacaat
182
183 caa--------agcccatggcaagaaagtgctgacatccctgggcttggc
.||
.||.|||||..|.||.|||.|||||||..|.||...|||
172 gaagcagtggctgctcatggtgaaaaggtggtgacatctattggagaggc
224
46
86
129
171
221
Весна, 2008, А.Б.Рахманинова
Выравнивание ?
# Length: 502
# Identity:
286/502 (57.0%)
# Similarity:
286/502 (57.0%)
# Gaps:
119/502 (23.7%)
# Score: 678.5
#=======================================
# Length: 444
# Identity:
248/444 (55.9%)
CAA32220|
1 atggttcatttcacagctgaggagaaggcagct-atcacaagcatctggg
49
# Similarity:
(55.9%)
|||| 248/444
.|||.|||||..|.||
..|.||||| ||||..||||.|||||
# Gaps: 1 atgg---gtttgacagcacatga-tcgtcagctgatcaacagcacctggg
3/444 ( 0.7%)
AAA49655|
46
# Score: 468.0
CAA32220|
50 ataaagt--------ggac--ttggaaaaagttggaggagaaactctggg
89
#=======================================
..|||||
.||| |.||||||
||||
|.||.||
AAA49655|
47 gcaaagtatgtgccaagactataggaaaa-----gagg-----cccttgg
86
CAA32220|
1 atggttcatttcacagctgaggagaaggcagctatcacaagcatctggga
.|...|||.|||||..|.||..........||||..||||.|||||.
AAA49655|
1 ---atgggtttgacagcacatgatcgtcagctgatcaacagcacctgggg
CAA32220|
90 aaggctcctgattg--tttacccatggactcagaggttctttgacaaa-135
|.|.||.||| || .|||.||.|||||.||.||.|.||||
|
CAA32220|
51 taaagtggacttggaaaaagttggaggagaaactctgggaaggctcctga
AAA49655|
87 acgtctgctg--tggacttatccctggacccaaagatacttt-----agt
129
.|||||........|.|...|.|||..|||..|.||.|||.|.||.|||.
AAA49655|
48 caaagtatgtgccaagactataggaaaagaggcccttggacgtctgctgt
CAA32220|
136 ---tttggaaacctctcttctgcccaagccatcatgggtaatcccagaat
182
|||||.||||||.....|||..|.|||.||
|.|||.|||
CAA32220|
101 ttgtttacccatggactcagaggttctttgacaaatttggaaacctctct
AAA49655|
130 tcttttgggaacctcaacagtgctgacgccgtc--------ttccacaat
171
....|||.||.|||||.||.||.|.||||......|||||.||||||...
AAA49655|
98 ggacttatccctggacccaaagatactttagttcttttgggaacctcaac
CAA32220|
183 caa--------agcccatggcaagaaagtgctgacatccctgggcttggc
224
.||
.||.|||||..|.||.|||.|||||||..|.||...|||
CAA32220|
151 tctgcccaagccatcatgggtaatcccagaatcaaagcccatggcaagaa
AAA49655|
172 gaagcagtggctgctcatggtgaaaaggtggtgacatctattggagaggc
221
..|||..|.|||.||.|....|||.....|.|....||.|||||..|.||
AAA49655|
148 agtgctgacgccgtcttccacaatgaagcagtggctgctcatggtgaaaa
CAA32220|
AAA49655|
50
47
100
97
150
147
200
197
201 agtgctgacatccctgggcttggcagttaagaacatggacaacctcaagg
250
.|||.|||||||..|.||...|||..|.|||.|||||||..||.|.||||
198 ggtggtgacatctattggagaggccatcaagcacatggatgacattaagg
247
Весна, 2007, А.Б.Рахманинова
Выбор последовательностей и их
выравнивание
P04443|HBB : MVHFTAEEKAAITSIWDKVDLEKVGGETLGRLLIVYPWTQRFFDKFGNLSSAQAIMGNPRIKAHGKKVLTSLGLAVKNMDNLKETFAHLSE :
P07432|HBB : -MGLTAHDRQLINSTWGKVCAKTIGKEALGRLLWTYPWTQRYFSSFGNLNSADAVFHNEAVAAHGEKVVTSIGEAIKHMDDIKGYYAQLSK :
: :**.:: *.* *.** :.:* *:***** .******:*..****.**:*:: * : ***:**:**:* *:*:**::* :*:**:
100
*
120
*
140
P04443|HBB : LHCDKLHADPENFKLLGNMLVIVLSSYFGKEFTAEAQAAWQKLVVGVATALSHKYH : 147
P07432|HBB : YHSETLHVDPCNFKRFGGCLSISLARQFHEEYTPELHAAYEHLFDAIADALGKGYH : 146
*.:.**.** *** :*. * * *: * :*:*.* :**:::*. .:* **.: **
X14061.1|C :
M32456.1|A :
ATGGTTCATTTCACAGCTGAGGAGAAGGCAGCT-ATCACAAGCATCTGGG
---ATGGGTTTGACAGCACATGATC-GTCAGCTGATCAACAGCACCTGGG
Весна, 2008, А.Б.Рахманинова
Что делать?
!
tranalign
PAL2NAL
(http://coot.embl.de/pal2nal/)
Весна, 2008, А.Б.Рахманинова
Эволюционная модель - математическая модель,
описывающей изменения последовательностей во
времени.


Нужна
поправка

Число эволюционных
событий оценивают,
сравнивая 2 родственные
последовательности
Наблюдаемое число
различий между
последовательностями
меньше реального числа
из-за повторных мутаций
Резюме: чтобы оценить
реальное число событий
нужна модель.
Однопараметрическая модель
Джукса-Кантора (1969)
PA(t=0) =PA(0) =1
P A(1) =1-3

C


T
G



A
PA(2) = PA(1) (1-3) +(1- PA(1) ) 
……………..
Djc = -b ln (1 - D/b)
Djc – расстояние по Джуксу-Кантору
(среднее ожидаемое число замен за время t)
b – константа, для нуклеотидных
последовательностей b=3/4
D – неоткорректированные расстояния
(в простейшем случае, это доля
несовпадающих букв)
Однопараметрическая модель Джукса-Кантора
Вероятность А в момент t
PA(t=0) =PA(0)=1
PA(1) =1-3
PA(2) = PA(1) (1-3) +(1- PA(1) ) 
PA(t+1) = PA(t) (1-3) + (1- PA(t)) 
dPA(t) = - 4  P + 
——
A(t)
dt
PA(t) = 1/4 + (PA(0) -1/4) e -4t
PA(t) = 1/4 + 3/4 e-4t для PA(0)=1
PA(t) = 1/4 - 1/4 e-4t для PA(0)=0
Расстояние до предковой
последовательности
1. Модель предполагает, что в 1 позиции
в единицу времени происходит 3
замен.
2. Прошло время t, Djc – общее число
замен/позицию за время t.
3. Доля совпадений/позицию между
предковой и настоящей
последовательностью?
4. Доля несовпадений/позицию между
предковой и настоящей
последовательностью?
5. Расстояние между предковой и
настоящей последовательностью в
смысле ожидаемого числа замен за
время t (Djc ) - ?
Двухпараметрическая модель
М.Кимура (1980)

C


T
G



A
distance = -0.5 ln[ (1-2P-Q)*sqrt(1-2Q)]
P = transitions/npos
Q = transversions/npos
трансверсия
транзиция
Чем точнее модель, тем лучше результат?
?
по материалам
Simon Whelan, Pietro Lio and Nick Goldman
"Molecular phylogenetics: state-of-theart
methods for looking into the past"
TRENDS in Genetics Vol.17 No.5 May 2001
Сравнение скоростей эволюции разных
генов
1. Thr-Ser-Ala…
1.Thr-Ser-Ala…
2. Thr-Ser-Ala…
2.Pro-Arg-Asp…
1. ACT AGT GCC…
2. ACA AGC GCT…
?
1. ACT AGT GCC…
2. CCT AGA GAC…
Весна, 2008, А.Б.Рахманинова
KA/KS – мера давления естественного отбора
Несинонимичные замены
Синонимичные замены
Сравниваем 2 наблюдения:
ATG GGG
GCT GGG
ATA GGA
GAT GGA
KA
1
1
Ks
1
1
KA/KS =1
KA/KS =1 => одно и то же ?
Необходимо нормировать на «возможности» последовательности:
Несинонимичные сайты
Синонимичные сайты
PA
Ps
5
1
4
2
Нормируем на мутабильность последовательностей:
KA = KA/PA KS = Ks/Ps
KA/KS = 1/5
KA/KS = 1/2
KA/KS – мера давления естественного отбора

KA – число несинонимичных замен на 1 несинонимичный сайт

Ks – число синонимичных замен на 1 синонимичный сайт

Пример:
Человек
Thr Val Asp Gly ….
ACT GTT GAT GGT ….
Всего
Число несинонимичных
сайтов
110
110
11 2/3
110
8 2/3
Число синонимичных
сайтов
001
001
00 1/3
001
3 1/3
Шимпанзе
Thr Val Glu Gly ….
ACA GTC GAA GGT ….
Всего
Число несинонимичных
замен
0
0
1
0
1
Число синонимичных
замен
1
1
0
0
2
Ka= 1 / 8.67= 0.12
Ks= 2/ 3.33= 0.6
Ka/Ks=0.12 / 0.6 =0.19 (стабилизирующий отбор?)
KA/KS – мера давления естественного отбора

KA – число несинонимичных замен на 1 несинонимичный сайт

Ks – число синонимичных замен на 1 синонимичный сайт

Пример:
Человек
Thr Val Asp Gly ….
ACT GTT GAT GGT ….
Всего
Число несинонимичных
сайтов
110
110
11 2/3
110
8 2/3
Число синонимичных
сайтов
001
001
00 1/3
001
3 1/3
Шимпанзе
Thr Val Glu Gly ….
ACA GTC GAA GGT ….
Всего
Число несинонимичных
замен
0
0
1
0
1
Число синонимичных
замен
1
1
0
0
2
Ka= 1 / 8.67= 0.12
Ks= 2/ 3.33= 0.6
Ka/Ks=0.12 / 0.6 =0.19 (стабилизирующий отбор?)
KA/KS, опять все не просто....
KA/KS – мера давления естественного отбора
KA – число несинонимичных замен на 1 несинонимичный сайт
Ks – число синонимичных замен на 1 синонимичный сайт



KA / Ks << 1 отрицательный (стабилизирующий) отбор
KA / Ks  1 нейтральная эволюция
KA / Ks > 1 положительный (движущий) отбор
KA/KS; какие бывают?
Из Hurst, L.D. (2002)
Trends in Genet. 18, 486-487
КАТЕГОРИИ ГЕНОВ ЧЕЛОВЕКА,
ОБНАРУЖИВАЮЩИХ ПРИЗНАКИ
ПОЛОЖИТЕЛЬНОГО ОТБОРА
ВЗАИМОДЕЙСТВИЕ ПАТОГЕН-ХОЗЯИН
ВОСПРОИЗВОДСТВО
ПРИСПОСОБЛЕНИЕ К ПИТАНИЮ
ВНЕШНОСТЬ
СЕНСОРНЫЕ СИСТЕМЫ
ПОВЕДЕНИЕ
ОРГАНИЗАЦИЯ МОЗГА
НЕИЗВЕСТНОГО НАЗНАЧЕНИЯ
E.J. Vallender, B.T. Lahn. Hum.Mol.Gen. 2004,
V.13, Rev.Issue 2, R245-R254
Ждите лекций А.В.Алешина
по теории эволюции
и лекций М.С.Гельфанда
по сравнительной геномике!!
Download