Минисателлиты в эукариотических геномах Боева Валентина Всеволод Макеев

advertisement
Минисателлиты в
эукариотических геномах
Боева Валентина
Всеволод Макеев
Микро- и минисателлиты
В эукариотических геномах представлено большое
разнообразие различных регулярных структур.
Значимую их часть составляют
тандемные повторы.
Тандемные повторы с длиной
периода от 2 до ~ 6 называют
микросателлиты
…tttatttatttatttatttatttatt
tatttatttatttatttatttatttattt
atttattta…
…ccaccatcaccaccaccac
catcaccatcaccaccaccatc
accatcactaccaccaccacc
accaccaccatcactacca…
Тандемные повторы с длиной
периода от 6 до ~ 100
называют минисателлиты
ggcagggggcag
ggggcagggggc
agggggcagggg
gc
gggaagg-tgatggggaaggatgat
gggaaggatgatggggaaggatgat
ggtaaggatgatggagaaggatgat
Механизмы появления и размножения:


Микросателлиты:
Диссоциация репликативного комплекса от
реплицирующейся нити ДНК с последующим
смещением при реассоциации (replication
slippage)
Неравный кроссинговер


Минисателлиты:
Неравный кроссинговер
Более сложные механизмы (интра- интергенные
обмены, например, инсерции фрагментов
донорской аллели могут быть фланкированы
дупликациями реципиентной аллели или
сопровождатся делециями).
Возможные функции микросателлитов





Влияние на транскрипцию (например, из-за образования не-В
структур ДНК, или белки могут образовывать комплекс с
повтором).
Влияние на трансляцию (напр., белки узнают повторы СUG на
5’-конце РНК)
Повторы, входящие в состав структурного гена, могут
обуславливать повторы в белке и белковый полиморфизм.
Инсуляция (микросателлиты могут образовывать сайты
узнавания СTCF, значимые на инсуляции).
… тринуклеотидные повторы CTG/CAT связаны с различными
неврологическими заболеваниями (всего 14: миотоническая
дистрофия, болезнь Хантингтона, спиноцеребральной атаксия и
др.)
Возможные функции минисателлитов



GGG-повторы, сами по себе, так и содержащиеся в более
крупных минисателлитных единицах, могут формировать Gквадруплекс, способные стабилизировать различные клеточные
лиганды. Альтернативный сплайсинг теломеразы с
образованием неактивного фермента также связан с наличием
GGG-повторов.
Связь с импринтингом. Это CpG-богатые повторы в СpGостровах. Потеря повторов может коррелировать с потерей
импринтинга.
Предполагается участие повторов в контроле репликации и
клеточного цикла (мутационная нестабильность повторов может
привести к опухолеобразованию
Цель работы:
Исследовать распределения микро- и
минисателлитов с различными
характеристиками в геномах эукариот
D. melanogaster
T. nigroviridis
D. rerio
R. norvegicus
A. mellifera
G. gallus
H. sapiens
C. elegans
TandemSWAN для поиска повторов

Для поиска повторов в ДНК
мы использовали программу
TandemSWAN, которая ищет
повторы в ДНК, оценивая
статистическую значимость
найденных структур
Она отличается от большинства других доступных программ,
предназначенных для поиска тандемных повторов в ДНК, таких как
Tandem Repeat Finder, RepeatMasker или mreps, в основном тем, что
позволяет найти более вырожденные длинные повторы и тем, что
оценивает их статистическую значимость.
Распределение длин периодов
повторов
Для каждого организма большая часть генома оказывается покрыта
вырожденными или строгими повторами, найденными программой
TandemSWAN. Но более значимые из них можно отфильтровать,
основываясь на значении p-value.
Total coverage by tandem repeats with various period lengths of chromosome 22 (49554710 bp) of human
genome (17th UCSC release) . Filtration by various statistical significance values (SSVs)
SSV >3
700000
SSV >5
600000
SSV >7
SSV >9
coverage
500000
SSV >11
400000
SSV >13
SSV >15
300000
SSV >17
200000
SSV >20
100000
0
no filtration
SSV >25
SSV >30
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
Period length
SSV >40
Выбор порога фильтрации 10-15
Порог фильтрации был выбран так, чтобы вероятность
наблюсти
данную
периодическую
структуру
на
произвольной позиции была не больше 10-15.
Таким образом, у нас остаются либо повторы коротких мотивов с
большим числом копий
…tttatttatttatttatttattt
atttatttatttatttatttattta
tttatttatttattta…
либо с меньшим числом копий, но длина повторяющегося юнита
большая.
gccagccaagccagcca
gccagccagccaagcca
cccagccagccaagcca
gcca
Картинка для хромосом разных видов
0,018
0,016
0,014
0,012
0,01
0,008
0,006
C. elegans, chr I 15080556
C. elegans, chr IV 17493789
C. elegans, chr X 17718854
A. mellifera contigs 224862719
D. rerio, chr 1 54758007
D. rerio, chr 10 37730223
D. rerio, chr 20 56017462
T. nigroviridis, chr 1 14746447
T. nigroviridis, chr 10 11217712
T. nigroviridis, chr 20 2245265
G. gallus, chr 1 183734179
G. gallus, chr 10 18952625
G. gallus, chr 20 13294271
G. gallus, chr W 4135036
G. gallus, chr Z 30827154
R. norvegicus, chr 10 101026139
R. norvegicus, chr 12 41216221
H.sapiens, chr1, 245522847 bp
H.sapiens, chr8, 146274826 bp
H.sapiens, chr19, 63811651 bp
H.sapiens, chr22, 49554710 bp
H.sapiens, chrX, 154824264 bp
…Здесь трудно что-то понять 
0,004
0,002
0
2 3 4 5 6 7 8 9 1011 1213 1415 1617 1819 2021 2223 242526 2728 2930 3132 3334 3536 3738 3940 4142 4344 4546 474849 5051 5253 5455 5657 5859 6061 6263 6465 6667 6869 7071
Картинка для хромосом разных видов
…без человека
0,016
C. elegans, chr I 15080556
0,014
honey bee contigs
C. elegans, chr IV 17493789
C. elegans, chr X 17718854
A. mellifera contigs 224862719
0,012
D. rerio, chr 1 54758007
C. elegans
D. rerio, chr 10 37730223
0,01
D. rerio, chr 20 56017462
T. nigroviridis, chr 1 14746447
T. nigroviridis, chr 10 11217712
0,008
T. nigroviridis, chr 20 2245265
zebrafish
G. gallus, chr 1 183734179
0,006
G. gallus, chr 10 18952625
G. gallus, chr 20 13294271
0,004
G. gallus, chr W 4135036
X
G. gallus, chr Z 30827154
R. norvegicus, chr 10 101026139
0,002
R. norvegicus, chr 12 41216221
0
2 3 4 5 6 7 8 9 1011 121314 151617 1819 202122 232425 262728 2930 313233 343536 373839 404142 4344 454647 484950 515253 5455 565758 596061 626364 6566 676869 7071
Картинка для хромосом человека
0,018
period 67
0,016
0,014
H.sapiens, chr1, 245522847 bp
ALUs
H.sapiens, chr8, 146274826 bp
0,012
0,01
0,008
H.sapiens, chr19, 63811651 bp
H.sapiens, chr22, 49554710 bp
H.sapiens, chrX, 154824264 bp
period 42
period 48
0,006
0,004
chrX
0,002
0
2 3 4 5 6 7 8 9 10 1112 1314 1516 1718 1920 2122 2324 25 2627 2829 3031 3233 3435 3637 3839 4041 4243 4445 4647 48 4950 5152 5354 5556 5758 5960 6162 6364 6566 6768 6970 71
Картинка для хромосом млекопитающих
0,018
R. norvegicus, chr 10 101026139
0,016
R. norvegicus, chr 12 41216221
H.sapiens, chr1, 245522847 bp
0,014
H.sapiens, chr8, 146274826 bp
H.sapiens, chr19, 63811651 bp
0,012
H.sapiens, chr22, 49554710 bp
H.sapiens, chrX, 154824264 bp
0,01
C. familiaris, chr 1
C. familiaris, chr 10
0,008
C. familiaris, chr 20
C. familiaris, chr 30
0,006
Х-хромосома собаки
C. familiaris, chr X
0,004
0,002
0
крыса
2 3 4 5 6 7 8 9 1011 121314 151617 1819 202122 232425 262728 2930 313233 343536 373839 404142 4344 454647 484950 515253 5455 565758 596061 626364 6566 676869 7071
Картинка для хромосом разных видов
0,004
0,0035
T. nigroviridis, chr 1 14746447
T. nigroviridis, chr 10 11217712
0,003
T. nigroviridis, chr 20 2245265
G. gallus, chr 1 183734179
0,0025
G. gallus, chr 10 18952625
G. gallus, chr 20 13294271
0,002
G. gallus, chr W 4135036
G. gallus, chr Z 30827154
0,0015
R. norvegicus, chr 10 101026139
R. norvegicus, chr 12 41216221
крыса
0,001
0,0005
0
2 3 4 5 6 7 8 9 1011 12131415 16171819 20212223 242526 27282930 31323334 35363738 39404142 43444546 474849 50515253 54555657 58596061 62636465 66676869 7071
Картинка для хромосом разных видов
0,004
0,0035
T. nigroviridis, chr 1 14746447
T. nigroviridis, chr 10 11217712
0,003
T. nigroviridis, chr 20 2245265
G. gallus, chr 1 183734179
0,0025
G. gallus, chr 10 18952625
G. gallus, chr 20 13294271
0,002
G. gallus, chr W 4135036
курица
G. gallus, chr Z 30827154
R. norvegicus, chr 10 101026139
0,0015
R. norvegicus, chr 12 41216221
0,001
0,0005
0
половые хромосомы
2 3 4 5 6 7 8 9 10 111213 1415 161718 1920 2122 232425 2627 282930 3132 333435 3637 383940 4142 434445 4647 484950 5152 5354 555657 5859 606162 6364 656667 6869 7071
Картинка для хромосом разных видов рыб
0,01
0,009
D. rerio, chr 1 54758007
0,008
D. rerio, chr 10 37730223
0,007
D. rerio, chr 20 56017462
0,006
T. nigroviridis, chr 1 14746447
0,005
T. nigroviridis, chr 10 11217712
0,004
T. nigroviridis, chr 20 2245265
0,003
Кратные трем
0,002
0,001
0
0
10
20
30
40
50
60
70
80
Картинка для хромосом разных видов
Длина периода до 23
0,0012
C. elegans, chr IV 17493789
A. mellifera contigs 224862719
D. rerio, chr 1 54758007
0,001
D. rerio, chr 20 56017462
T. nigroviridis, chr 1 14746447
T. nigroviridis, chr 20 2245265
0,0008
G. gallus, chr 1 183734179
G. gallus, chr W 4135036
0,0006
R. norvegicus, chr 10 101026139
H.sapiens, chr1 222827847
H.sapiens, chr1 222827847
0,0004
H.sapiens, chr19 55785651
H.sapiens, chrX 150394264
0,0002
C. familiaris, chr 1 120715450
C. familiaris, chr X 121210683
D. melanogaster, chr 2L 22407739
0
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
D. melanogaster, chr X 22215881
Картинка для хромосом разных видов
Длина периода до 23
0,0012
C. elegans, chr IV 17493789
C. elegans
0,001
A. mellifera contigs 224862719
D. rerio, chr 1 54758007
D. rerio, chr 20 56017462
T. nigroviridis, chr 1 14746447
0,0008
T. nigroviridis, chr 20 2245265
G. gallus, chr 1 183734179
G. gallus, chr W 4135036
0,0006
R. norvegicus, chr 10 101026139
H.sapiens, chr1 222827847
H.sapiens, chr1 222827847
0,0004
H.sapiens, chr19 55785651
H.sapiens, chrX 150394264
0,0002
C. familiaris, chr 1 120715450
C. familiaris, chr X 121210683
D. melanogaster, chr 2L 22407739
0
D. melanogaster, chr X 22215881
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Картинка для хромосом разных видов
Длина периода до 23
0,0012
D. melanogaster
0,001
A. mellifera contigs 224862719
D. rerio, chr 1 54758007
D. rerio, chr 20 56017462
T. nigroviridis, chr 1 14746447
T. nigroviridis, chr 20 2245265
0,0008
G. gallus, chr 1 183734179
G. gallus, chr W 4135036
R. norvegicus, chr 10 101026139
0,0006
H.sapiens, chr1 222827847
H.sapiens, chr1 222827847
0,0004
H.sapiens, chr19 55785651
H.sapiens, chrX 150394264
C. familiaris, chr 1 120715450
0,0002
C. familiaris, chr X 121210683
D. melanogaster, chr 2L 22407739
D. melanogaster, chr X 22215881
0
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Картинка для хромосом разных видов
Длина периода до 23
0,0012
A. mellifera contigs 224862719
D. rerio, chr 1 54758007
0,001
D. rerio, chr 20 56017462
zebrafish
T. nigroviridis, chr 1 14746447
0,0008
человек
0,0006
собака
0,0004
T. nigroviridis, chr 20 2245265
G. gallus, chr 1 183734179
G. gallus, chr W 4135036
R. norvegicus, chr 10 101026139
H.sapiens, chr1 222827847
H.sapiens, chr1 222827847
H.sapiens, chr19 55785651
H.sapiens, chrX 150394264
C. familiaris, chr 1 120715450
0,0002
C. familiaris, chr X 121210683
D. melanogaster, chr 2L 22407739
D. melanogaster, chr X 22215881
0
2
3
4
5
6
7
8
9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
Картинка для хромосом разных видов
Длина периода до 23
0,0004
0,00035
A. mellifera contigs 224862719
0,0003
T. nigroviridis, chr 1 14746447
крыса
T. nigroviridis, chr 20 2245265
0,00025
G. gallus, chr 1 183734179
G. gallus, chr W 4135036
0,0002
R. norvegicus, chr 10 101026139
0,00015
0,0001
0,00005
0
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Картинка для хромосом разных видов
Длина периода до 23
0,00012
A. mellifera contigs 224862719
T. nigroviridis, chr 1 14746447
0,0001
T. nigroviridis, chr 20 2245265
G. gallus, chr 1 183734179
0,00008
пчела
G. gallus, chr W 4135036
0,00006
0,00004
0,00002
0
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Картинка для хромосом разных видов
Длина периода до 23
0,00012
A. mellifera contigs 224862719
T. nigroviridis, chr 1 14746447
T. nigroviridis, chr 20 2245265
G. gallus, chr 1 183734179
G. gallus, chr W 4135036
0,0001
0,00008
Tetraodon
0,00006
0,00004
0,00002
0
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
Наиболее частые слова в геномах с
частыми периодами, кратными четырем
Крыса, chr10 и chr12
слово
частота
Собака, chr1 и chrX
слово
частота
TAGA
5940
AGAT
1868
ATCT
4746
TCC
1774
ATTT
3858
GAG
1545
TCC
3701
TATC
1500
GGA
3385
ATT
1411
TAAA
3107
TAAA
1386
ACAT
2931
GAA
1279
TGTA
2873
CTTT
1276
TTC
2633
TGTA
1204
AAGA
2603
ATTT
1177
CAC
2439
AGGA
1117
ATA
2301
TCCT
1003
GTG
2253
CTT
964
TTCC
2103
ATC
892
ATT
2066
AAT
881
TCTT
2022
CATA
854
GGAA
1986
CCAT
831
AAC
1952
CAC
768
TCA
1861
TGGA
736
GAA
1820
GAAA
678
GTT
1783
GGT
666
ATCC
1774
AGC
632
GAT
1578
GCT
591
слово
TAAA
ATTT
GAAA
TTTC
TCCT
GAA
ATAG
AAT
CTT
ATT
GAAG
TATC
AATAA
TTTTA
GGA
CTC
ATTC
CTACAAATGAGA
CCAAATGACTC
TCTTT
CCAT
GAAT
AAAGA
CAAAA
Zebrafish, chr1 и chr20
частота
25237
24095
12781
10016
5497
4963
4861
4656
4568
4431
4090
3539
3231
2872
2445
1788
1219
слово
AATA
ATTT
AAAG
TCTT
ATT
GATA
ATA
TCTA
AGA
AATAA
TATTT
CTT
GGAA
CCTT
CCAT
GGAT
CTC
частота
26871
24321
6781
6716
4838
4760
4247
4025
2882
2868
2604
2317
2210
2074
1213
1177
1046
слово
частота
слово
TATC
14192
CTAT
19532
ATT
12319
ATA
12406
ATA
12221
AGAT
11585
TAGA
10472
TTA
10284
ATAAT
10174
ATAAT
8201
ATTAT
7624
TCT
6456
TAAA
5868
AGA
5345
ATTC
5478
TATAT
5190
ATGA
4961
CATC
3634
ATTT
4125
ATTT
3522
ATC
3755
TTCA
3477
GAAA
3735
ATGA
3399
AGA
3591
TAAA
3144
TCT
3551
TCTG
3140
ATCC
3503
GAT
3064
GGAT
3461
GAAA
2845
1139
1124
1077
956
849
835
ATGA
TCTTT
GAT
ATTC
TAG
GGA
951
934
817
800
768
756
TTTC
3317
ATGG
2793
ATG
2853
TCTT
2754
ATCA
2508
CAT
2100
GACA
1855
ATTG
2061
GTCT
1529
CAGA
1998
TTGT
1235
ATAC
1618
CTA
1218
TGT
1352
частота
Выводы



Для различных организмов патерны
минисателлитов различны. Даже для двух
рыб.
Человек сильно отличается от всех других
видов, в частности благодаря наличию Alu
повторов и других классов минисателлитов
Распределение минисателлитов в половых
хромосомах обычно отличается от
распределения в аутосомах
Спасибо

Миронову Андрею Александровичу,
Есиповой Наталье Георгиевне, Мирей
Ренье, Марине Фридман и Нике Опариной!

И вам за ваше внимание!!! 
Download