КЛАССИФИКАЦИЯ БОЛЬШИХ ТАНДЕМНЫХ ПОВТОРОВ

advertisement
70
МЕДИЦИНСКИЙ АКАДЕМИЧЕСКИЙ ЖУРНАЛ, 2012 г., ТОМ 12, № 4
ктерицидного теста. Анализ вирулентных свойств на
мышиной модели показал, что инактивация гена mutR
привела к сильному снижению вирулентных свойств
штамма № 152, а штаммы SF370[mutR]
и № 97[mutR] оказались авирулентными. Методом
прямого бактерицидного теста показано, что штамм
SF370[mutR] неспособен выживать в цельной человеческой крови, в отличие от исходного штамма SF370.
Структура гена mutR у штамма SF370[mutR]
была восстановлена методом комплементации. В результате сравнения свойств штамма, полученного
методом комплементации, со штаммами SF370
и SF370[mutR], выявлено, что ростовые характеристики, а также вирулентные свойства восстановились. Показано, что фенотипические изменения
в результате инактивации гена mutR действительно
связаны с инактивацией гена, а не являются следствием «полярного» эффекта или вторичной мутации.
Таким образом, выявлена ключевая роль гена mutR
в метаболизме и проявлении S. pyogenes вирулентных
свойств и доказана возможность воздействия на вирулентные свойства S. pyogenes при помощи направленного влияния на механизмы транскрипции генов, отвечающих за проявление вирулентных свойств.
Литература
1. Cunningham M. W. Pathogenesis of group A streptococcal infections // Clin. Microbiol. Rev.— 2000.— Vol. 13, № 3.— P. 470–511.
2. Kreikemeyer B., McIver K. S., Podbielski A. Virulence factor regulation and regulatory network in Streptococcus pyogenes and their impact on
pathogen-host interactions // Trends Microbiol.— 2003.— Vol. 11, № 5.— P. 224–232.
3. Pulliainen A. T. et al. Deficiency of the Rgg regulator promotes H2O2 resistance, AhpCF-mediated H2O2 decomposition, and virulence in
Streptococcus pyogenes // J. Bacteriol.— 2008.— Vol. 190, № 9.— P. 3225–3235.
4. Chaussee M. S. et al. Rgg coordinates virulence factor synthesis and metabolism in Streptococcus pyogenes // J. Bacteriol.— 2003.— Vol. 185,
№ 20.— P. 6016–6024.
5. Ferretti J. J., McShan W. M., Ajdic D. et al. Complete genome sequence of an M1 strain of Streptococcus pyogenes // Proc. Natl. Acad. Sci.
USA.— 2001.— Vol. 98.— Р. 4658–4663.
Контакт: azutkis@yandex.ru
КЛАССИФИКАЦИЯ БОЛЬШИХ ТАНДЕМНЫХ ПОВТОРОВ
ЧЕЛОВЕКА
А. С. Комиссаров, О. И. Подгорная
Институт цитологии РАН, Санкт-Петербург, Россия
© А. С. Комиссаров, О. И. Подгорная, 2012 г.
Введение. Чтение генома человека в 2002 г. дало
колоссальный толчок развитию биологии, хотя
и оказалось, что генов в геноме только 5%, а известные регулирующие элементы занимают не более
10% генома. Оставшиеся 85% долгое время относили к так называемой мусорной ДНК, которая не кодирует никаких белков и является «некодирующей
ДНК». Но после того как были прочитаны геномы
мыши и крысы, оказалось, что наиболее сильно отличаются между собой геномы не генами, а огромными массивами некодирующей ДНК. После публикации в 2012 г. результатов проекта ENCODE
(The Encyclopedia of DNA Elements) оказалось, что
40–80% генома являются функциональными.
Материалы и методы исследования. Наша работа посвящена изучению наиболее загадочного
и малоизученного компонента генома: длинным полям тандемно повторенной ДНК. В настоящее время
ее функции малоизвестны, но уже ясно, что она критически важна для эпигенетического контроля состояния хроматина и формирования центромерного района хромосом. Принято разделять транскрипционно
активный, богатый генами эухроматин и транскрипционно неактивный гетерохроматин, значительной
частью которого является конститутивный гетерохроматин. У эукариот конститутивный гетерохроматин сформирован главным образом некодирующей
ДНК, организованной в виде больших тандемных
повторов (сателлитной ДНК, сатДНК), которые
занимают до 10% генома высших эукариот и располагаются преимущественно в перицентромерных, перителомерных и центромерных районах хромосом.
Долгое время считалось, что большие тандемные повторы транскрипционно неактивны, однако в последние несколько лет появляются факты, подтверждающие их активную транскрипцию в эмбриогенезе
МЕДИЦИНСКИЙ АКАДЕМИЧЕСКИЙ ЖУРНАЛ, 2012 г., ТОМ 12, № 4
и при малигнизации [1]. Несмотря на то, что большие тандемные повторы занимают значительную
часть генома, их разнообразие, устройство и функции
на геномном уровне по-прежнему плохо изучены,
а ДНК состав гетерохроматиновых районов известен
не полностью. Анализ и аннотация ДНК состава таких регионов являются необходимыми для понимания их функции. Так, например, анализ транскрипции некодирующей ДНК в транскриптомах рака
основан на последовательностях, открытых еще в догеномную эру. Этого совершенно недостаточно, например, ранее мы показали, что в геноме мыши только 2 семейства больших тандемных повторов из 62
были открыты экспериментальными методами. Оставшиеся 60 оказались не захваченными и не описанными [2]. Работа посвящена поиску и классификации больших тандемных повторов человека, что
является необходимым шагом к изучению их транскрипции при норме и патологии.
Результаты и их обсуждение. Для генома мыши
мы разработали подход к поиску и классификации
больших тандемных повторов в собранных полногеномных последовательностях [2]. Большие тандемные повторы сравнительно хорошо изучены в геноме
человека. Для анализа больших тандемных повторов
используют собранные хромосомы, в которых центромерные и перицентромерные районы практически
отсутствуют [3]. Кроме этого, часто объединяют все
неизвестные большие тандемные повторы в искусственную группу VNTR (тандемные повторы с варьирующим размером поля, Varibale Number Tandem
Repeats, [4]). Это сильно затрудняет описание
и классификацию больших тандемных повторов даже в таком хорошо изученном геноме как геном человека. Мы используем для анализа не собранные
хромосомы, а собранные полногеномные последовательности (WGS assemblies), которые содержат
фрагменты перицентромерного и центромерного
районов. Для анализа использовали результаты полногеномного секвенирования от Celera (проекты
AADB, AADC, AADD), размер полногеномной
сборки более 8,4 миллиардов п. н., сборка содержит
1 763 349 отдельных полей тандемных повторов,
что составляет 3% от размера сборки. Интересно,
что экспериментально определенное количество од-
71
ной альфа сатДНК составляет 5–10%, что указывает на сильную недопредставленность тандемных
повторов в геномных сборках. Среди найденных
тандемных повторов к большим тандемным повторам мы отнесли 3971 тандемный повтор с размером
поля более 3 т. п. н. Большие тандемные повторы
были объединены в семейства согласно схожести нуклеотидных последовательностей, после этого каждое семейство было проверено на совпадение с известными диспергированными и тандемными
повторами человека в базе данных Repbase.
Наиболее крупным семейством больших тандемных повторов, как и ожидалось, оказалось альфа
сатДНК, представленное 2289 полями (57,6% от
всех больших тандемных повторов). Интересно, что
многие поля альфа сатДНК имеют участки, схожие
с последовательностями LINE1 и HERVK11. Классический сателлит человека HS2–6 (Human
Satellite 2–6) составляет второе по численности семейство больших тандемных повторов человека (851
поле, 21,4%). Остальные семейства тандемных повторов представлены гораздо хуже. Так, бета
сатДНК (BSAT) представлено только 168 полями
(4,1%), а SATR1 — 142 полями (3,6%). Остальные большие тандемные повторы составляют менее
2% от всех больших тандемных повторов. Среди оставшихся семейств найдены гамма сатДНК человека, CER SAT, GSATX. Значительное количество
семейств сформировано тандемными повторами,
родственными диспрегированным Alu и LTR12
ERV. Оставшиеся 193 семейства отсутствуют
в Repbase. Их мы разделили на два больших суперсемейства: однолокусные большие тандемные повторы (представлены в геномной сборке только один
раз) и мультилокусные большие тандемные повторы. Среди 193 семейств однолокусных 54 семейства, остальные мультилокусные.
В настоящий момент начата работа по экспериментальной гибридизации неизвестных больших
тандемных повторов методом FISH. Предполагается найти хромосомоспецифичные гетерохроматиновые последовательности человека и разработать на
их основе хромосомоспецифичные цитогенетические
пробы, используя подход, успешно опробованный
для мыши.
Литература
1. El Atifi-Borel M., Eymery A., Fourel G., Horard B. et al. A transcriptomic analysis of human centromeric and pericentric sequences in normal
and tumor cells // Nucleic Acids Res.— 2009.— Vol. 37, № 19.— P. 6340–6354.
2. Demin S. J., Gavrilova E. V., Ishov A. M., Komissarov A. S. et al. Tandemly repeated DNA families in the mouse genome // BMC
Genomics.— 2011.— Vol. 12, № 1.— P. 531.
Download