Сравнительная геномика и метаболическая реконструкция бактериальных патогенов Михаил Гельфанд Институт проблем передачи информации РАН, Учебно-научный центр «Биоинформатика» XII Российский национальный конгресс «Человек и лекарство» Метаболическая реконструкция • Идентификация недостающих генов в полных геномах • Поиск кандидатов – Анализ генов с целью предсказания общей функции: • гомология • функциональные подписи • структурные особенности – Сравнительная геномика для предсказания специфичности: • • • • анализ регуляции позиционные кластеры слияние генов филогенетические паттерны Как это работает: ферменты • Идентификация пробелов в метаболическом пути (универсальные, таксон-специфические, в отдельных геномах) • Поиск кандидатов на включение в путь: колокализация и ко-регуляция (во многих геномах) • Предсказание общей биохимической функции по (далекому) сходству и функциональным подписям • Предварительное заполнение пробела • Верификация: анализ филогенетических паттернов: – отсутствие в геномах, не содержащих данного пути – дополнительное распределение с генами, имеющими ту же функцию Как это работает: транспортёры • Поиск кандидатов на включение в путь: колокализация и ко-регуляция (во многих геномах) • Предсказание транспортной функции: анализ трансмембранных сегментов и сходство • Предсказание специфичности: анализ филогенетических паттернов: – финальный продукт, если заменяет весь путь (встречается в геномах, не имеющих биосинтетического пути) – исходный продукт, если отсутствует в геномах, не содержащих пути (катаболические пути, предшественники в биосинтетических путях) – промежуточный продукт, если заменяет верхнюю или боковую часть пути Пробел в пути биосинтеза жирных кислот у стрептококков accA accD accB fabI (Enoyl-ACP reductase, EC Gene fabI of Enoyl-ACP 1.3.1.9), мишень триклозана. reductase (EC 1.3.1.9) is В стрептококках: missing in the genome 12B, есть ферментативная and a numberген of Streptococci активность, не известен accC fab D fab F fab G fabZ fabI acp P fabH Позиционные кластеры: идентификация гена-кандидата hyp TR? 3.5.1.? fabH fabD acpP fabG fabF fabZ accB accC accD accA fabI hyp 6.3.4.15 Genome X TR? fabH acpP ? fabD fabG fabF accB fabZ accC accD accA fabZ accC accD accA 2.1.1.79 FRNS Genome Y TR? fabH acpP ? fabD fabG fabF accB 5.99.1.2 Clostridium acetobutylicum TR? fabH Streptococcus pyogenes acpP ? fabD fabG fabF accB fabZ accC accD accA hyp Сайты связывания FabR (“Tr?”, HTH) 1 Fad (42.1.17) 2 HTH fabH acpP 3 4 fabK fabD fabG fabF accB fabZ accC E. faecalis E. faecalis E. faecalis CONSENSUS HTH-1 HTH-2 HTH-3 acTTTGAtwaTCAAAgt AgTTTGggTATCAAAGT AgTTTGAacATCAAAtg GtTTTGATAATCAAAGT E. faecium E. faecium E. faecium HTH-1 HTH-2 HTH-3 ACTTTGATAATCAAAaT AgTTTGAacATCAAAag gaTTTGATAATCAAAcT S. pyogenes S. pyogenes S. pyogenes S. pyogenes 4.2.1.17 HTH-1 fabK-1 fabK-2 GaTTTGATTATCAAAtg AaTTTGATTgTCAAAGT CtTTTGATAtTCAAAtT AgTTTGATTATCAAAtT S. pneumoniae S. pneumoniae S. pneumoniae 4.2.1.17 HTH-1 fabK-1 ACTTTGAcAgTgAAAta gtTTTGATTgTaAAAGT AgTTTGAcTgTCAAAtT S. mutans S. mutans S. mutans S. mutans S. mutans 4.2.1.17-1 4.2.1.17-2 HTH-1 fabK-1 fabK-2 ACTTTGATTtTCAAAcT AaTTTGATTATCttAaT ACTTTGATAgTCAAAGT AgTTTGAcAtTCAAAtc AgTTTGAcTgTCAAAtT 1 2 3 4 accD accA Метаболическая реконструкция пути биосинтеза тиамина (новые гены/функции показаны красным) Purine pathway Transport of HMP thiN (confirmed) Transport of HET (Gram-positive bacteria) (Gram-negative bacteria) unknown arabinose arbutin cellobiose dextran esculin fructose fucose galactose glucose inulin lactose maltose mannitol mannose melibiose N-AcGlu raffinose ribose salicin sorbitol sorbose sucrose tagatose trehalose xylose L. mesenteroides Oenococcus oeni L. brevis P. pentosaceus L. delbrueckii L. gasseri L. casei L. lactis S. suis S. thermophilus S. mutans S. agalactiae S. uberis S. equi S. pyogenes S. pneumoniae Метаболизм сахаров у стрептококков и родственных бактерий биохимические данные, ген не известен экспериментальные данные биохимия + геномные предсказания только геномные предсказания unknown arabinose arbutin cellobiose dextran esculin fructose fucose galactose glucose inulin lactose maltose mannitol mannose melibiose N-AcGlu raffinose ribose salicin sorbitol sorbose sucrose tagatose trehalose xylose L. mesenteroides Oenococcus oeni L. brevis P. pentosaceus L. delbrueckii L. gasseri L. casei L. lactis S. suis S. thermophilus S. mutans S. agalactiae S. uberis S. equi S. pyogenes S. pneumoniae Неохарактеризованный путь у инвазивных видов S. pneumoniae S. pyogenes S. equi S. agalactiae S. suis Структура локуса S. pyogenes, S. agalactiae S. equi S. pneumoniae TIGR4 IS S. pneumoniae R6 IS S. suis IS Функции генов 3-(4-deoxy-beta-D-gluc-4-enuronosyl)-Nacetyl-D-glucosamine PTS transporter hydrolase isomerase oxidoreductase dehydrogenase kinase aldolase pyruvate + D-glyceraldehyde 3-phosphate hyaluronidase (hyaluronate lyase) RegR Потенциальный регуляторный сигнал Структура локуса - 2 S. pyogenes, S. agalactiae S. equi S. pneumoniae TIGR4 IS S. pneumoniae R6 IS S. suis IS Возможная функция • Путь имеется у инвазивных видов • Иногда ко-локализован с геном гиалуронидазы • Всегда ко-регуляруется с геном гиалуронидазы Вывод: • Функция – утилизация гиалуроновой кислоты • Возможно, вовлечен в патогенез Сравнительная геномика цинковых регулонов Две основных роли цинка у бактерий: • Структурная: ДНК-полимеразы, праймазы, рибосомные белки и т.д. • Каталитическая: протеазы и другие ферменты Геномы и регуляторы ??? nZUR FUR family pZUR AdcR ? FUR family MarR family nZUR- Регуляторы и сигналы GATATGTTATAACATATC nZUR- GAAATGTTATANTATAACATTTC GTAATGTAATAACATTAC TTAACYRGTTAA pZUR TAAATCGTAATNATTACGATTTA AdcR Транспортеры • Ортологи известных систем AdcABC и YciC • Паралоги отдельных компонентов систем AdcABC и YciC • Потенциальные транспортеры с неохарактеризованной специфичностью zinT: регуляция zinT is isolated zinT is regulated by zinc repressors (nZUR-, nZUR-, pZUR) E. coli, S. typhi, K. pneumoniae Gamma-proteobacteria A. tumefaciens, R. sphaeroides Alpha-proteobacteria B. subtilis, S. aureus Bacillus group S. pneumoniae, S. mutans, S. pyogenes, L. lactis, E. faecalis Streptococcus group fusion: adcA-zinT adcA-zinT is regulated by zinc repressors (pZUR, AdcR) (ex. L.l.) ZinT: анализ белковой последовательности Y. pestis, V. cholerae, B. halodurans S. aureus, E. faecalis, S. pneumoniae, S. mutans, S. pyogenes E. coli, S. typhi, K. pneumoniae, A. tumefaciens, R. sphaeroides, B. subtilis L. lactis TM Zn AdcA ZinT ZinT: сводка • zinT иногда слит с геном компоненты цинкового транспортёра adcA • zinT экспрессируется только при недостатке цинка • ZinT находится на поверхности клетки (имеет трансмембранный сегмент) • ZinT имеет цинк-связывающий домен ZinT: вывод • ZinT – это новый тип цинк-связывающей компоненты цинкового ABC-транспортёра Цинковая регуляция генов, кодирующих PHT-белки (pneumococcal histidine triad) у стрептококков S. pneumoniae S. pyogenes S. equi S. agalactiae zinc regulation shown in experiment lmb phtD phtA phtE phtB lmb phtD phtY lmb phtD Структурные особенности PHТ-белков • PHT-белки содержат множественные мотивы HxxHxH • PHT-белки S. pneumoniae - паралоги (6595% тождество) • Sec-зависимая гидрофобная лидерная последовательнсть на N-концах • Локализация PHT-белков S. pneumoniae на поверхности бактериальной клетки была показана экспериментально PHТ-белки: сводка • PHT-белки экспрессируются при недостатке цинка • PHT-белки локализованы на поверхности клетки • PHT-белки имеют цинк-связывающие мотивы Гипотеза: • PHT-белки – это новый класс бактериальных транспортёров цинка … неверно • Цинк-связывающие домены в транспортёрах цинка: EEEHEEHDHGEHEHSH HSHEEHGHEEDDHDHSH EEHGHEEDDHHHHHDED • Гистидиновые триады у стрептококков: HGDHYHY HGDHYHF HGNHYHF HYDHYHN HMTHSHW 7 out of 21 2 out of 21 2 out of 21 2 out of 21 2 out of 21 DEHGEGHEEEHGHEH (гистидин-аспартатглютамат) (специфический паттерн гистидинов и ароматических аминокислот) Анализ PHТ-белков (продолжение) • Ген phtD водит в один оперон с геном lmb во всех геномах стрептококков – Lmb: адгезин, участвующий в связывании ламинина и вторжении стрептококков в эпителиальные клетки • PhtY из S. pyogenes: – phtY регулируется AdcR – PhtY состоит из трёх доменов: 4 HIS TRIADS PHT LRR IR HDYNHNHTYEDEEGH AHEHRDKDDHDHEHED internalin H-rich PHТ-белки: сводка-2 • PHT-белки индуцируются недостатком цинка • PHT-белки локализованы на поверхности клетки • PHT-белки имеют структурные цинк-связывающие мотивы • phtD образует оперон с геном адгезина • PhtY содержит домен интерналина, отвечающие за инвазию стрептококков Гипотеза PHT-белки – это адгезины, участвующие в прикреплении стрептококков к эпителиальным клеткам , что приводит к инвазии AdcR pZUR nZUR цинк и паралоги рибосомных белков L36 E. coli, S.typhi – K. pneumoniae – Y. pestis,V. cholerae – B subtilis – S. aureus – Listeria spp. – E. faecalis – S. pne., S. mutans – S. pyo., L. lactis – L33 – – – –+– ––– –– ––– ––– ––– L31 –+ –– –+ –+ – – – – – S14 – – – –+ –+ –+ –+– – –+ Мотив «цинковая лента» AdcR pZUR nZUR (Makarova-Ponomarev-Koonin, 2001) L36 E. coli, S.typhi (–) K. pneumoniae (–) Y. pestis,V. cholerae (–) B subtilis (–) S. aureus (–) Listeria spp. (–) E. faecalis (–) S. pne., S. mutans (–) S. pyo., L. lactis (–) L33 – – – (–) + – (–) – – (–) – (–) – – (–) – – (–) – – L31 (–) + (–) – (–) + (–) + – – – – – S14 – – – (–) + (–) + (–) + (–) + – (–) (–) + Сводка наблюдений: • Makarova-Ponomarev-Koonin, 2001: – L36, L33, L31, S14 – единственные белки, имеющие паралогов в нескольких видах – L36, L33, L31, S14 – это четыре из семи белков, имеющих мотив «цинковая лента» (четыре цистеина) – Одна из двух (или более) копий белков L36, L33, L31, S14 обычно содержит мотив «цинковая лента», а остальные – нет • Среди генов, кодирующих паралоги рибосомных белков, (почти) всегда один ргулируется цинковым репрессором, а кодируемый им белок никогда не содержит «цинковой ленты» Плохой недостаточно цинка: сценарий весь цинк использован рибосомами, не хватает достаточно цинка для ферментов цинка Регуляторный механизм Sufficient Zn ribosomes repressor R Zn-dependent enzymes Zn starvation R Хороший недостаточно цинка: сценарий некоторые рибосомы содержат паралоги без достаточно цинка, остаётся цинк для цинка ферментов Предсказание … (Proc Natl Acad Sci U S A. 2003 Aug 19;100(17):9912-7.) … и подтверждение (Mol Microbiol. 2004 Apr;52(1):273-83.) • • • • • • • • • • • • • • Андрей Миронов Анна Герасимова Ольга Калинина Алексей Казаков (гиалуронат) Екатерина Котельникова Галина Ковалёва Павел Новичков Ольга Лайкова (гиалуронат) Екатерина Панина (цинк) (сейчас в UCLA, USA) Елизавета Пермина Дмитрий Равчеев А.Б.Рахманинова Дмитрий Родионов (тиамин) Алексей Витрещак (тиамин) (сейчас LORIA, France) • Андрей Остерман (Burnham Institute, San-Diego, USA) (жирные кислоты) • Howard Hughes Medical Institute • Ludwig Institute of Cancer Research • РФФИ • РАН (программа «Молекулярная и клеточная биология»)