A(1) - Kodomo

реклама
IV семестр «Функция и эволюция»

БЛОК 1 «Эволюция» – 4 занятия
•
•
•
Молекулярная филогенетика. Задачи и подходы. Лекциясеминар, 13.02. (АБР)
Реконструкция филогенетических деревьев. 2 практических
занятия, 20.02 и 27.02 (САС, АБР)
«Алгоритмы реконструкции филогенетических деревьев».
Лекция, семинар, обсуждение полученных результатов, 6.03
(САС).
Срок сдачи основного отчета – 5.03


БЛОК 2 «Функции генов и их продуктов» – 4
занятия
БЛОК 3 «Эволюция белкового семейства» – 5
занятий
Biologists must constantly keep in
mind that what they see was not
designed, but rather evolved. It
might be thought, therefore, that
evolutionary arguments would play
a large part in guiding biological
research, but this is far from the
case.
Francis Crick
What Mad Pursuit (1988) pp.138-139
Вы это уже делали! Прокомментируйте…
MYG_HETPO/
MYG_GALGA/
MYG_ALLMI/
MYG_CYPCA/
HBA_HETPO/
HBA1_TORMA
HBA_SQUAC/
HBA_LEPPA/
HBA1_BOSMU
HBAT_HORSE
HBA1_IGUIG
HBAZ_CAPHI
HBA3_PLEWA
HBAD_PASMO
HBAD_LIOMI
HBA1_XENBO
HBA1_PLEWA
HBA_CATCL/
HBB1_XENBO
HBB_RANCA/
HBB2_XENLA
HBB0_MOUSE
HBBN_AMMLE
HBB_ALLMI/
HBB1_CYGMA
HBB_LEPPA/
HBB_SQUAC/
HBB_HETPO/
HBAM_RANCA
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
*
20
*
40
*
60
*
80
EWEHVNKVWAVVEPDIPAVGLAILLRLFKEHKETKDLFPKF-KE-IPVQQLGNNEDLRKHGVTVLRALGNILKQ------KGKHSTNVK
DWDKVNSVWSAMEANITAVGQNILLRLFEQYPESQSYFPKL-KN-KSLGELKDTADIKAQADTVLKALGNIVKK------KGNHSQPVK
EWKHVLDIWTKVESKLPEHGHEVIIRLLQEHPETQERFEKF-KHMKTADEMKSSEKMKQHGNTVFTALGNILKQ------KGNHAEVLK
DAELVLKCWGGVEADFEGTGGEVLTRLFKQHPETQKLFPKF-VG-IASNELAGNAAVKAHGATVLKKLGELLKA------RGDHAAILK
DRAELAALSKVLAQNAEAFGAEALARMFTVYAATKSYFKDY-KDFT-----AAAPSIKAHGAKVVTALAKACDHL-----D-DLKTHLH
NKKAIKNLLQKIHSQTEVLGAEALARLFECHPQTKSYFPKF-SGFS-----ANDKRVKHHGALVLKALVDTNKHL-----D-DLPHHLN
DKTAIKHLTGSLRTNAEAWGAESLARMFATTPSTKTYFSKF-TDFS-----ANGKRVKAHGGKVLNAVADATDHL-----D-NVAGHLD
DEVLIKEAWGLL-HQIPNAGGEALARMFSCYPGTKSYFPHFGHDFS-----ANNEKVKHHGKKVVDAIGQGVQHL-----H-DLSSCLH
DKGNVKAAWGKVGGHAAEYGAEALERMFLSFPTTKTYFPHF--DLS-----QGSAQVKGHGAKVAAALTKAVEHL-----D-DLPGALS
DRATVRALWKKMGSNVGVYATEALERMFLGFPSTTTYFLHL--DLS-----LGSTQVKAHGQKVADALTLAVEHL-----E-DLPRALS
DKNHIRAIWGHVDNNPEAFGVEALTRLFLAYPATKTYFAHF--DLN-----PGSAQIKAHGKKVVDALTQAVNNL-----D-DIPDALA
ERTIILSLWSKISTQADVIGTETLERLFSCYPQAKTYFPHF--DLH-----SGSAQLRAHGSKVVAAVGDAVKSI-----D-NVTSALS
EKALVVGLCGKISGHCDALGGEALDRLFASFGQTRTYFSHF--DLS-----PGSADVKRHGGKVLSAIGEAAKHI-----D-SMDQALS
DKKLIQQIWGKLGGAEEEIGADALWRMFHSYPSTKTYFPHF--DLS-----QGSDQIRGHGKKVVAALSNAIKNL-----D-NLSQALS
DRRLLQASVGKLGCRLEDIGADALNRLLITFPQSKTYFSHF--NLS-----PGSKDIIHQGEKVGKALDSALKHL-----D-DIRGTLS
DKKHIKAIMPSIAAHGDKFGGEALYRMFLVNPKTKTYFPTF--DFH-----HNSKQISAHGKKVVDALNEASNHL-----D-NIAGSLS
DKHNVKAIWDHVKGHEEAIGAEALYRMFCCMPTTRIYFPAK--DLS-----ERSSYLHSHGKKVVGALTNAVAHI-----D-DIDTAFS
DKADVKIAWAKISPRADEIGAEALGRMLTVYPQTKTYFAHW-ADLS-----PGSGPVKHGKKVIMGAIGDAVTKF-----D-DLLGGLA
DRQLINSTWGKV--CAKTIGKEALGRLLWTYPWTQRYFSSF-GNLNSADAVFHNEAVAAHGEKVVTSIGEAIKHM-----D-DIKGYYA
GGSDVSAFLAKV--DKRAVGGEALARLLIVYPWTQRYFSTF-GNLGSADAISHNSKVLAHGQRVLDSIEEGLKHP-----Z-BLKAYYA
EKAAITSVWQKV--NVEHDGHDALGRLLIVYPWTQRYFSNF-GNLSNSAAVAGNAKVQAHGKKVLSAVGNAISHI-----D-SVKSSLQ
EKAAITSIWDKV--DLEKVGGETLGRLLIVYPWTQRFFDKF-GNLSSAQAIMGNPRIKAHGKKVLTSLGLAVKNM-----D-NLKETFA
BKALITGFWSKV--KVBZVGAZALGRLLVVYPWTZRFFZHF-GBLSSABAVMBBAKVKAHGKKVLBSFSBGLKHL-----B-BLKGAFA
ERKFIVDLWAKV--DVAQCGADALSRMLIVYPWKRRYFEHF-GKMCNAHDILHNSKVQEHGKKVLASFGEAVKHL-----D-NIKGHFA
ELTIINDIFSHL--DYDDIGPKALSRCLIVYPWTQRHFSGF-GNLYNAEAIIGNANVAAHGIKVLHGLDRGLKNM-----D-NIVDAYA
EKQYIVSVFSKI--DVDHVGANTLERVLIVFPWTKRYFNSF-GDLSSPGAIKHNNKVSAHGRKVLAAIIECTRHF-----G-NIKGHLA
EKALVNAVWTKT--DHQAVVAKALERLFVVYPWTKTYFVKFNGKFH-----ASDSTVQTHAGKVVSALTVAYNHI-----D-DVKPHFV
ELHEITTTWKSI--DKHSLGAKALARMFIVYPWTTRYFGNL-KEFT-----ACSYGVKEHAKKVTGALGVAVTHL-----G-DVKSQFT
EKSAVASLWEKIAPQTNKLGAESMERLFKNHPETKSFFSRF--DIS-----PGSQDLLTHGGKIFGALGEAIKSL----------DNLQ
6
g
6 R
p
F
6 hg 6
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
Весна, 2007, А.Б.Рахманинова
81
81
82
81
77
77
77
77
76
76
76
76
76
76
76
76
76
77
80
80
80
80
80
80
80
80
76
75
72
Молекулярная эволюция
(молекулярная филогенетика)
Весна, 2007, А.Б.Рахманинова
Молекулярная филогенетика
─
изучение филогенеза и эволюции путем
анализа нуклеотидных и
аминокислотных последовательностей
Основные этапы биоинформатического анализа
молекулярной эволюции





Выбор последовательностей и их выравнивание
Построение/выбор эволюционной модели
Реконструкция эволюции
 реконструкция филогенетического дерева
 оценка силы давления и направления отбора
 сравнение скоростей эволюции
 ...
Оценка статистической значимости реконструкции
?
Весна, 2007, А.Б.Рахманинова
Что будет?
Выбор последовательностей и их выравнивание
 Построение/выбор эволюционной модели
 Реконструкция эволюции
 реконструкция филогенетического дерева
 оценка силы давления и направления отбора
 сравнение скоростей эволюции
 ...
 Оценка статистической значимости реконструкции

!
Весна, 2007, А.Б.Рахманинова
Выбор последовательностей и их
выравнивание
P04443|HBB : MVHFTAEEKAAITSIWDKVDLEKVGGETLGRLLIVYPWTQRFFDKFGNLSSAQAIMGNPRIKAHGKKVLTSLGLAVKNMDNLKETFAHLSE :
P07432|HBB : -MGLTAHDRQLINSTWGKVCAKTIGKEALGRLLWTYPWTQRYFSSFGNLNSADAVFHNEAVAAHGEKVVTSIGEAIKHMDDIKGYYAQLSK :
: :**.:: *.* *.** :.:* *:***** .******:*..****.**:*:: * : ***:**:**:* *:*:**::* :*:**:
100
*
120
*
140
P04443|HBB : LHCDKLHADPENFKLLGNMLVIVLSSYFGKEFTAEAQAAWQKLVVGVATALSHKYH : 147
P07432|HBB : YHSETLHVDPCNFKRFGGCLSISLARQFHEEYTPELHAAYEHLFDAIADALGKGYH : 146
*.:.**.** *** :*. * * *: * :*:*.* :**:::*. .:* **.: **
gene1(P04443)
gene2(P07432)
TACCCATGGACTCAGAGG
TATCCCTGGACCCAAAGA
** ** ***** ** **
Весна, 2007, А.Б.Рахманинова
Выравнивание ?
# Length: 502
# Identity:
286/502 (57.0%)
# Similarity:
286/502 (57.0%)
# Gaps:
119/502 (23.7%)
# Score: 678.5 # Length: 444
#=======================================
# Identity:
248/444 (55.9%)
# Similarity:
248/444 (55.9%)
CAA32220|
1 atggttcatttcacagctgaggagaaggcagct-atcacaagcatctggg
# Gaps:
3/444 ( 0.7%)
||||
.|||.|||||..|.||
..|.||||| ||||..||||.|||||
# Score: 468.0
AAA49655|
1 atgg---gtttgacagcacatga-tcgtcagctgatcaacagcacctggg
#=======================================
CAA32220|
AAA49655|
CAA32220|
AAA49655|
CAA32220|
AAA49655|
CAA32220|
AAA49655|
49
46
50 ataaagt--------ggac--ttggaaaaagttggaggagaaactctggg
89
CAA32220|
1 atggttcatttcacagctgaggagaaggcagctatcacaagcatctggga
..|||||
.||| .|...|||.|||||..|.||..........||||..||||.|||||.
|.||||||
||||
|.||.||
47
gcaaagtatgtgccaagactataggaaaa-----gagg-----cccttgg
86
AAA49655|
1 ---atgggtttgacagcacatgatcgtcagctgatcaacagcacctgggg
50
90 aaggctcctgattg--tttacccatggactcagaggttctttgacaaa-135
CAA32220|
51 taaagtggacttggaaaaagttggaggagaaactctgggaaggctcctga
|.|.||.||| || .|||.||.|||||.||.||.|.||||
|
.|||||........|.|...|.|||..|||..|.||.|||.|.||.|||.
87 acgtctgctg--tggacttatccctggacccaaagatacttt-----agt
129
AAA49655|
48 caaagtatgtgccaagactataggaaaagaggcccttggacgtctgctgt
100
136 ---tttggaaacctctcttctgcccaagccatcatgggtaatcccagaat
182
CAA32220|
101 ttgtttacccatggactcagaggttctttgacaaatttggaaacctctct
|||||.||||||.....|||..|.|||.||
|.|||.|||
....|||.||.|||||.||.||.|.||||......|||||.||||||...
130 tcttttgggaacctcaacagtgctgacgccgtc--------ttccacaat
171
AAA49655|
98 ggacttatccctggacccaaagatactttagttcttttgggaacctcaac
150
183 caa--------agcccatggcaagaaagtgctgacatccctgggcttggc
224
CAA32220|
151 tctgcccaagccatcatgggtaatcccagaatcaaagcccatggcaagaa
.||
.||.|||||..|.||.|||.|||||||..|.||...|||
..|||..|.|||.||.|....|||.....|.|....||.|||||..|.||
AAA49655|
148 agtgctgacgccgtcttccacaatgaagcagtggctgctcatggtgaaaa
172 gaagcagtggctgctcatggtgaaaaggtggtgacatctattggagaggc
221
200
CAA32220|
250
AAA49655|
201 agtgctgacatccctgggcttggcagttaagaacatggacaacctcaagg
.|||.|||||||..|.||...|||..|.|||.|||||||..||.|.||||
198 ggtggtgacatctattggagaggccatcaagcacatggatgacattaagg
Весна, 2007, А.Б.Рахманинова
47
97
147
197
247
Выбор последовательностей и их
выравнивание
P04443|HBB : MVHFTAEEKAAITSIWDKVDLEKVGGETLGRLLIVYPWTQRFFDKFGNLSSAQAIMGNPRIKAHGKKVLTSLGLAVKNMDNLKETFAHLSE :
P07432|HBB : -MGLTAHDRQLINSTWGKVCAKTIGKEALGRLLWTYPWTQRYFSSFGNLNSADAVFHNEAVAAHGEKVVTSIGEAIKHMDDIKGYYAQLSK :
: :**.:: *.* *.** :.:* *:***** .******:*..****.**:*:: * : ***:**:**:* *:*:**::* :*:**:
100
*
120
*
140
P04443|HBB : LHCDKLHADPENFKLLGNMLVIVLSSYFGKEFTAEAQAAWQKLVVGVATALSHKYH : 147
P07432|HBB : YHSETLHVDPCNFKRFGGCLSISLARQFHEEYTPELHAAYEHLFDAIADALGKGYH : 146
*.:.**.** *** :*. * * *: * :*:*.* :**:::*. .:* **.: **
X14061.1|C :
M32456.1|A :
ATGGTTCATTTCACAGCTGAGGAGAAGGCAGCT-ATCACAAGCATCTGGG
---ATGGGTTTGACAGCACATGATC-GTCAGCTGATCAACAGCACCTGGG
Весна, 2007, А.Б.Рахманинова
Что делать?
!
tranalign
PAL2NAL
(http://coot.embl.de/pal2nal/)
Весна, 2007, А.Б.Рахманинова
Эволюционная модель - математическая модель,
описывающей изменения последовательностей во
времени.


Нужна
поправка

Число эволюционных
событий оценивают,
сравнивая 2 родственные
последовательности
Наблюдаемое число
различий между
последовательностями
меньше реального числа
из-за повторных мутаций
Резюме: чтобы оценить
реальное число событий
нужна модель.
Однопараметрическая модель
Джукса-Кантора (1969)
PA(t=0) =PA(0) =1
P A(1) =1-3

C


T
G



A
PA(2) = PA(1) (1-3) +(1- PA(1) ) 
……………..
Djc = -b ln (1 - D/b)
Djc – расстояние по Джуксу-Кантору (число
событий за время t)
b – константа, для нуклеотидных
последовательностей b=3/4
D – неоткорректированные расстояния
(в простейшем случае, это доля
несовпадающих букв)
Однопараметрическая модель Джукса-Кантора
Вероятность А в момент t
PA(t=0) =PA(0)=1
PA(1) =1-3
PA(2) = PA(1) (1-3) +(1- PA(1) ) 
PA(t+1) = PA(t) (1-3) + (1- PA(t)) 
dPA(t) = - 4  P + 
——
A(t)
dt
PA(t) = 1/4 + (PA(0) -1/4) e -4t
PA(t) = 1/4 + 3/4 e-4t для PA(0)=1
PA(t) = 1/4 - 1/4 e-4t для PA(0)=0
Расстояние до предковой
последовательности
1. Модель предполагает, что в 1 позиции
в единицу времени происходит 3
замен.
2. Прошло время t, Djc – общее число
замен/позицию за время t.
3. Доля совпадений/позицию между
предковой и настоящей
последовательностью?
4. Доля несовпадений/позицию между
предковой и настоящей
последовательностью?
5. Расстояние между предковой и
настоящей последовательностью в
смысле ожидаемого числа замен за
время t (Djc ) - ?
Двухпараметрическая модель
М.Кимура (1980)

C


T
G



A
distance = -0.5 ln[ (1-2P-Q)*sqrt(1-2Q)]
P = transitions/npos
Q = transversions/npos
трансверсия
транзиция
Чем точнее модель, тем лучше результат?
?
по материалам
Simon Whelan, Pietro Lio and Nick Goldman
"Molecular phylogenetics: state-of-theart
methods for looking into the past"
TRENDS in Genetics Vol.17 No.5 May 2001
Сравнение скоростей эволюции разных
генов
1. Thr-Ser-Ala…
1.Thr-Ser-Ala…
2. Thr-Ser-Ala…
2.Pro-Arg-Asp…
1. ACT AGT GCC…
2. ACA AGC GCT…
?
1. ACT AGT GCC…
2. CCT AGA GAC…
Весна, 2007, А.Б.Рахманинова
KA/KS – мера давления естественного отбора
Сравниваем 2 наблюдения:
ATG GGG
GCT GGG
ATA GGA
GAT GGA
Несинонимичные замены
1
1
Синонимичные замены
1
1
KA/KS =1
KA/KS =1
PA
Ps
?
Ожидаемые значения:
5/6
4/6
1/6
2/6
KA/KS =5
KA/KS = 2
Нормируем на мутабильность последовательностей:
KA/KS = 1/5
KA/KS = 1/2
KA/KS – мера давления естественного отбора

KA – число несинонимичных замен на 1 несинонимичный сайт

Ks – число синонимичных замен на 1 синонимичный сайт

Пример:
Человек
Thr Val Asp Gly ….
ACT GTT GAT GGT ….
Всего
Число несинонимичных
сайтов
110
110
11 2/3
110
8 2/3
Число синонимичных
сайтов
001
001
00 1/3
001
3 1/3
Шимпанзе
Thr Val Glu Gly ….
ACA GTC GAA GGT ….
Всего
Число несинонимичных
замен
0
0
1
0
1
Число синонимичных
замен
1
1
0
0
2
Ka= 1 / 8.67= 0.12
Ks= 2/ 3.33= 0.6
Ka/Ks=0.12 / 0.6 =0.19 (стабилизирующий отбор?)
KA/KS, опять все не просто....
KA/KS – мера давления естественного отбора
KA – число несинонимичных замен на 1 несинонимичный сайт
Ks – число синонимичных замен на 1 синонимичный сайт



KA / Ks << 1 отрицательный (стабилизирующий) отбор
KA / Ks  1 нейтральная эволюция
KA / Ks > 1 положительный (движущий) отбор
KA/KS; какие бывают?
Из Hurst, L.D. (2002)
Trends in Genet. 18, 486-487
КАТЕГОРИИ ГЕНОВ ЧЕЛОВЕКА,
ОБНАРУЖИВАЮЩИХ ПРИЗНАКИ
ПОЛОЖИТЕЛЬНОГО ОТБОРА
ВЗАИМОДЕЙСТВИЕ ПАТОГЕН-ХОЗЯИН
ВОСПРОИЗВОДСТВО
ПРИСПОСОБЛЕНИЕ К ПИТАНИЮ
ВНЕШНОСТЬ
СЕНСОРНЫЕ СИСТЕМЫ
ПОВЕДЕНИЕ
ОРГАНИЗАЦИЯ МОЗГА
НЕИЗВЕСТНОГО НАЗНАЧЕНИЯ
E.J. Vallender, B.T. Lahn. Hum.Mol.Gen. 2004,
V.13, Rev.Issue 2, R245-R254
Ждите лекций А.В.Алешина
по теории эволюции
и лекций М.С.Гельфанда
по сравнительной геномике!!
Скачать