Минисателлиты в эукариотических геномах Боева Валентина Всеволод Макеев Микро- и минисателлиты В эукариотических геномах представлено большое разнообразие различных регулярных структур. Значимую их часть составляют тандемные повторы. Тандемные повторы с длиной периода от 2 до ~ 6 называют микросателлиты …tttatttatttatttatttatttatt tatttatttatttatttatttatttattt atttattta… …ccaccatcaccaccaccac catcaccatcaccaccaccatc accatcactaccaccaccacc accaccaccatcactacca… Тандемные повторы с длиной периода от 6 до ~ 100 называют минисателлиты ggcagggggcag ggggcagggggc agggggcagggg gc gggaagg-tgatggggaaggatgat gggaaggatgatggggaaggatgat ggtaaggatgatggagaaggatgat Механизмы появления и размножения: Микросателлиты: Диссоциация репликативного комплекса от реплицирующейся нити ДНК с последующим смещением при реассоциации (replication slippage) Неравный кроссинговер Минисателлиты: Неравный кроссинговер Более сложные механизмы (интра- интергенные обмены, например, инсерции фрагментов донорской аллели могут быть фланкированы дупликациями реципиентной аллели или сопровождатся делециями). Возможные функции микросателлитов Влияние на транскрипцию (например, из-за образования не-В структур ДНК, или белки могут образовывать комплекс с повтором). Влияние на трансляцию (напр., белки узнают повторы СUG на 5’-конце РНК) Повторы, входящие в состав структурного гена, могут обуславливать повторы в белке и белковый полиморфизм. Инсуляция (микросателлиты могут образовывать сайты узнавания СTCF, значимые на инсуляции). … тринуклеотидные повторы CTG/CAT связаны с различными неврологическими заболеваниями (всего 14: миотоническая дистрофия, болезнь Хантингтона, спиноцеребральной атаксия и др.) Возможные функции минисателлитов GGG-повторы, сами по себе, так и содержащиеся в более крупных минисателлитных единицах, могут формировать Gквадруплекс, способные стабилизировать различные клеточные лиганды. Альтернативный сплайсинг теломеразы с образованием неактивного фермента также связан с наличием GGG-повторов. Связь с импринтингом. Это CpG-богатые повторы в СpGостровах. Потеря повторов может коррелировать с потерей импринтинга. Предполагается участие повторов в контроле репликации и клеточного цикла (мутационная нестабильность повторов может привести к опухолеобразованию Цель работы: Исследовать распределения микро- и минисателлитов с различными характеристиками в геномах эукариот D. melanogaster T. nigroviridis D. rerio R. norvegicus A. mellifera G. gallus H. sapiens C. elegans TandemSWAN для поиска повторов Для поиска повторов в ДНК мы использовали программу TandemSWAN, которая ищет повторы в ДНК, оценивая статистическую значимость найденных структур Она отличается от большинства других доступных программ, предназначенных для поиска тандемных повторов в ДНК, таких как Tandem Repeat Finder, RepeatMasker или mreps, в основном тем, что позволяет найти более вырожденные длинные повторы и тем, что оценивает их статистическую значимость. Распределение длин периодов повторов Для каждого организма большая часть генома оказывается покрыта вырожденными или строгими повторами, найденными программой TandemSWAN. Но более значимые из них можно отфильтровать, основываясь на значении p-value. Total coverage by tandem repeats with various period lengths of chromosome 22 (49554710 bp) of human genome (17th UCSC release) . Filtration by various statistical significance values (SSVs) SSV >3 700000 SSV >5 600000 SSV >7 SSV >9 coverage 500000 SSV >11 400000 SSV >13 SSV >15 300000 SSV >17 200000 SSV >20 100000 0 no filtration SSV >25 SSV >30 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 Period length SSV >40 Выбор порога фильтрации 10-15 Порог фильтрации был выбран так, чтобы вероятность наблюсти данную периодическую структуру на произвольной позиции была не больше 10-15. Таким образом, у нас остаются либо повторы коротких мотивов с большим числом копий …tttatttatttatttatttattt atttatttatttatttatttattta tttatttatttattta… либо с меньшим числом копий, но длина повторяющегося юнита большая. gccagccaagccagcca gccagccagccaagcca cccagccagccaagcca gcca Картинка для хромосом разных видов 0,018 0,016 0,014 0,012 0,01 0,008 0,006 C. elegans, chr I 15080556 C. elegans, chr IV 17493789 C. elegans, chr X 17718854 A. mellifera contigs 224862719 D. rerio, chr 1 54758007 D. rerio, chr 10 37730223 D. rerio, chr 20 56017462 T. nigroviridis, chr 1 14746447 T. nigroviridis, chr 10 11217712 T. nigroviridis, chr 20 2245265 G. gallus, chr 1 183734179 G. gallus, chr 10 18952625 G. gallus, chr 20 13294271 G. gallus, chr W 4135036 G. gallus, chr Z 30827154 R. norvegicus, chr 10 101026139 R. norvegicus, chr 12 41216221 H.sapiens, chr1, 245522847 bp H.sapiens, chr8, 146274826 bp H.sapiens, chr19, 63811651 bp H.sapiens, chr22, 49554710 bp H.sapiens, chrX, 154824264 bp …Здесь трудно что-то понять 0,004 0,002 0 2 3 4 5 6 7 8 9 1011 1213 1415 1617 1819 2021 2223 242526 2728 2930 3132 3334 3536 3738 3940 4142 4344 4546 474849 5051 5253 5455 5657 5859 6061 6263 6465 6667 6869 7071 Картинка для хромосом разных видов …без человека 0,016 C. elegans, chr I 15080556 0,014 honey bee contigs C. elegans, chr IV 17493789 C. elegans, chr X 17718854 A. mellifera contigs 224862719 0,012 D. rerio, chr 1 54758007 C. elegans D. rerio, chr 10 37730223 0,01 D. rerio, chr 20 56017462 T. nigroviridis, chr 1 14746447 T. nigroviridis, chr 10 11217712 0,008 T. nigroviridis, chr 20 2245265 zebrafish G. gallus, chr 1 183734179 0,006 G. gallus, chr 10 18952625 G. gallus, chr 20 13294271 0,004 G. gallus, chr W 4135036 X G. gallus, chr Z 30827154 R. norvegicus, chr 10 101026139 0,002 R. norvegicus, chr 12 41216221 0 2 3 4 5 6 7 8 9 1011 121314 151617 1819 202122 232425 262728 2930 313233 343536 373839 404142 4344 454647 484950 515253 5455 565758 596061 626364 6566 676869 7071 Картинка для хромосом человека 0,018 period 67 0,016 0,014 H.sapiens, chr1, 245522847 bp ALUs H.sapiens, chr8, 146274826 bp 0,012 0,01 0,008 H.sapiens, chr19, 63811651 bp H.sapiens, chr22, 49554710 bp H.sapiens, chrX, 154824264 bp period 42 period 48 0,006 0,004 chrX 0,002 0 2 3 4 5 6 7 8 9 10 1112 1314 1516 1718 1920 2122 2324 25 2627 2829 3031 3233 3435 3637 3839 4041 4243 4445 4647 48 4950 5152 5354 5556 5758 5960 6162 6364 6566 6768 6970 71 Картинка для хромосом млекопитающих 0,018 R. norvegicus, chr 10 101026139 0,016 R. norvegicus, chr 12 41216221 H.sapiens, chr1, 245522847 bp 0,014 H.sapiens, chr8, 146274826 bp H.sapiens, chr19, 63811651 bp 0,012 H.sapiens, chr22, 49554710 bp H.sapiens, chrX, 154824264 bp 0,01 C. familiaris, chr 1 C. familiaris, chr 10 0,008 C. familiaris, chr 20 C. familiaris, chr 30 0,006 Х-хромосома собаки C. familiaris, chr X 0,004 0,002 0 крыса 2 3 4 5 6 7 8 9 1011 121314 151617 1819 202122 232425 262728 2930 313233 343536 373839 404142 4344 454647 484950 515253 5455 565758 596061 626364 6566 676869 7071 Картинка для хромосом разных видов 0,004 0,0035 T. nigroviridis, chr 1 14746447 T. nigroviridis, chr 10 11217712 0,003 T. nigroviridis, chr 20 2245265 G. gallus, chr 1 183734179 0,0025 G. gallus, chr 10 18952625 G. gallus, chr 20 13294271 0,002 G. gallus, chr W 4135036 G. gallus, chr Z 30827154 0,0015 R. norvegicus, chr 10 101026139 R. norvegicus, chr 12 41216221 крыса 0,001 0,0005 0 2 3 4 5 6 7 8 9 1011 12131415 16171819 20212223 242526 27282930 31323334 35363738 39404142 43444546 474849 50515253 54555657 58596061 62636465 66676869 7071 Картинка для хромосом разных видов 0,004 0,0035 T. nigroviridis, chr 1 14746447 T. nigroviridis, chr 10 11217712 0,003 T. nigroviridis, chr 20 2245265 G. gallus, chr 1 183734179 0,0025 G. gallus, chr 10 18952625 G. gallus, chr 20 13294271 0,002 G. gallus, chr W 4135036 курица G. gallus, chr Z 30827154 R. norvegicus, chr 10 101026139 0,0015 R. norvegicus, chr 12 41216221 0,001 0,0005 0 половые хромосомы 2 3 4 5 6 7 8 9 10 111213 1415 161718 1920 2122 232425 2627 282930 3132 333435 3637 383940 4142 434445 4647 484950 5152 5354 555657 5859 606162 6364 656667 6869 7071 Картинка для хромосом разных видов рыб 0,01 0,009 D. rerio, chr 1 54758007 0,008 D. rerio, chr 10 37730223 0,007 D. rerio, chr 20 56017462 0,006 T. nigroviridis, chr 1 14746447 0,005 T. nigroviridis, chr 10 11217712 0,004 T. nigroviridis, chr 20 2245265 0,003 Кратные трем 0,002 0,001 0 0 10 20 30 40 50 60 70 80 Картинка для хромосом разных видов Длина периода до 23 0,0012 C. elegans, chr IV 17493789 A. mellifera contigs 224862719 D. rerio, chr 1 54758007 0,001 D. rerio, chr 20 56017462 T. nigroviridis, chr 1 14746447 T. nigroviridis, chr 20 2245265 0,0008 G. gallus, chr 1 183734179 G. gallus, chr W 4135036 0,0006 R. norvegicus, chr 10 101026139 H.sapiens, chr1 222827847 H.sapiens, chr1 222827847 0,0004 H.sapiens, chr19 55785651 H.sapiens, chrX 150394264 0,0002 C. familiaris, chr 1 120715450 C. familiaris, chr X 121210683 D. melanogaster, chr 2L 22407739 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 D. melanogaster, chr X 22215881 Картинка для хромосом разных видов Длина периода до 23 0,0012 C. elegans, chr IV 17493789 C. elegans 0,001 A. mellifera contigs 224862719 D. rerio, chr 1 54758007 D. rerio, chr 20 56017462 T. nigroviridis, chr 1 14746447 0,0008 T. nigroviridis, chr 20 2245265 G. gallus, chr 1 183734179 G. gallus, chr W 4135036 0,0006 R. norvegicus, chr 10 101026139 H.sapiens, chr1 222827847 H.sapiens, chr1 222827847 0,0004 H.sapiens, chr19 55785651 H.sapiens, chrX 150394264 0,0002 C. familiaris, chr 1 120715450 C. familiaris, chr X 121210683 D. melanogaster, chr 2L 22407739 0 D. melanogaster, chr X 22215881 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Картинка для хромосом разных видов Длина периода до 23 0,0012 D. melanogaster 0,001 A. mellifera contigs 224862719 D. rerio, chr 1 54758007 D. rerio, chr 20 56017462 T. nigroviridis, chr 1 14746447 T. nigroviridis, chr 20 2245265 0,0008 G. gallus, chr 1 183734179 G. gallus, chr W 4135036 R. norvegicus, chr 10 101026139 0,0006 H.sapiens, chr1 222827847 H.sapiens, chr1 222827847 0,0004 H.sapiens, chr19 55785651 H.sapiens, chrX 150394264 C. familiaris, chr 1 120715450 0,0002 C. familiaris, chr X 121210683 D. melanogaster, chr 2L 22407739 D. melanogaster, chr X 22215881 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Картинка для хромосом разных видов Длина периода до 23 0,0012 A. mellifera contigs 224862719 D. rerio, chr 1 54758007 0,001 D. rerio, chr 20 56017462 zebrafish T. nigroviridis, chr 1 14746447 0,0008 человек 0,0006 собака 0,0004 T. nigroviridis, chr 20 2245265 G. gallus, chr 1 183734179 G. gallus, chr W 4135036 R. norvegicus, chr 10 101026139 H.sapiens, chr1 222827847 H.sapiens, chr1 222827847 H.sapiens, chr19 55785651 H.sapiens, chrX 150394264 C. familiaris, chr 1 120715450 0,0002 C. familiaris, chr X 121210683 D. melanogaster, chr 2L 22407739 D. melanogaster, chr X 22215881 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Картинка для хромосом разных видов Длина периода до 23 0,0004 0,00035 A. mellifera contigs 224862719 0,0003 T. nigroviridis, chr 1 14746447 крыса T. nigroviridis, chr 20 2245265 0,00025 G. gallus, chr 1 183734179 G. gallus, chr W 4135036 0,0002 R. norvegicus, chr 10 101026139 0,00015 0,0001 0,00005 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Картинка для хромосом разных видов Длина периода до 23 0,00012 A. mellifera contigs 224862719 T. nigroviridis, chr 1 14746447 0,0001 T. nigroviridis, chr 20 2245265 G. gallus, chr 1 183734179 0,00008 пчела G. gallus, chr W 4135036 0,00006 0,00004 0,00002 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Картинка для хромосом разных видов Длина периода до 23 0,00012 A. mellifera contigs 224862719 T. nigroviridis, chr 1 14746447 T. nigroviridis, chr 20 2245265 G. gallus, chr 1 183734179 G. gallus, chr W 4135036 0,0001 0,00008 Tetraodon 0,00006 0,00004 0,00002 0 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Наиболее частые слова в геномах с частыми периодами, кратными четырем Крыса, chr10 и chr12 слово частота Собака, chr1 и chrX слово частота TAGA 5940 AGAT 1868 ATCT 4746 TCC 1774 ATTT 3858 GAG 1545 TCC 3701 TATC 1500 GGA 3385 ATT 1411 TAAA 3107 TAAA 1386 ACAT 2931 GAA 1279 TGTA 2873 CTTT 1276 TTC 2633 TGTA 1204 AAGA 2603 ATTT 1177 CAC 2439 AGGA 1117 ATA 2301 TCCT 1003 GTG 2253 CTT 964 TTCC 2103 ATC 892 ATT 2066 AAT 881 TCTT 2022 CATA 854 GGAA 1986 CCAT 831 AAC 1952 CAC 768 TCA 1861 TGGA 736 GAA 1820 GAAA 678 GTT 1783 GGT 666 ATCC 1774 AGC 632 GAT 1578 GCT 591 слово TAAA ATTT GAAA TTTC TCCT GAA ATAG AAT CTT ATT GAAG TATC AATAA TTTTA GGA CTC ATTC CTACAAATGAGA CCAAATGACTC TCTTT CCAT GAAT AAAGA CAAAA Zebrafish, chr1 и chr20 частота 25237 24095 12781 10016 5497 4963 4861 4656 4568 4431 4090 3539 3231 2872 2445 1788 1219 слово AATA ATTT AAAG TCTT ATT GATA ATA TCTA AGA AATAA TATTT CTT GGAA CCTT CCAT GGAT CTC частота 26871 24321 6781 6716 4838 4760 4247 4025 2882 2868 2604 2317 2210 2074 1213 1177 1046 слово частота слово TATC 14192 CTAT 19532 ATT 12319 ATA 12406 ATA 12221 AGAT 11585 TAGA 10472 TTA 10284 ATAAT 10174 ATAAT 8201 ATTAT 7624 TCT 6456 TAAA 5868 AGA 5345 ATTC 5478 TATAT 5190 ATGA 4961 CATC 3634 ATTT 4125 ATTT 3522 ATC 3755 TTCA 3477 GAAA 3735 ATGA 3399 AGA 3591 TAAA 3144 TCT 3551 TCTG 3140 ATCC 3503 GAT 3064 GGAT 3461 GAAA 2845 1139 1124 1077 956 849 835 ATGA TCTTT GAT ATTC TAG GGA 951 934 817 800 768 756 TTTC 3317 ATGG 2793 ATG 2853 TCTT 2754 ATCA 2508 CAT 2100 GACA 1855 ATTG 2061 GTCT 1529 CAGA 1998 TTGT 1235 ATAC 1618 CTA 1218 TGT 1352 частота Выводы Для различных организмов патерны минисателлитов различны. Даже для двух рыб. Человек сильно отличается от всех других видов, в частности благодаря наличию Alu повторов и других классов минисателлитов Распределение минисателлитов в половых хромосомах обычно отличается от распределения в аутосомах Спасибо Миронову Андрею Александровичу, Есиповой Наталье Георгиевне, Мирей Ренье, Марине Фридман и Нике Опариной! И вам за ваше внимание!!!