приглашенный доклад - Учебно-Научный центр "Биоинформатика"

реклама
Сравнительная геномика и
метаболическая реконструкция
бактериальных патогенов
Михаил Гельфанд
Институт проблем передачи информации РАН,
Учебно-научный центр «Биоинформатика»
XII Российский национальный конгресс
«Человек и лекарство»
Метаболическая реконструкция
• Идентификация недостающих генов в полных
геномах
• Поиск кандидатов
– Анализ генов с целью предсказания общей функции:
• гомология
• функциональные подписи
• структурные особенности
– Сравнительная геномика для предсказания
специфичности:
•
•
•
•
анализ регуляции
позиционные кластеры
слияние генов
филогенетические паттерны
Как это работает: ферменты
• Идентификация пробелов в метаболическом пути
(универсальные, таксон-специфические, в
отдельных геномах)
• Поиск кандидатов на включение в путь: колокализация и ко-регуляция (во многих геномах)
• Предсказание общей биохимической функции по
(далекому) сходству и функциональным подписям
• Предварительное заполнение пробела
• Верификация: анализ филогенетических
паттернов:
– отсутствие в геномах, не содержащих данного пути
– дополнительное распределение с генами, имеющими ту
же функцию
Как это работает: транспортёры
• Поиск кандидатов на включение в путь: колокализация и ко-регуляция (во многих геномах)
• Предсказание транспортной функции: анализ
трансмембранных сегментов и сходство
• Предсказание специфичности: анализ
филогенетических паттернов:
– финальный продукт, если заменяет весь путь
(встречается в геномах, не имеющих
биосинтетического пути)
– исходный продукт, если отсутствует в геномах, не
содержащих пути (катаболические пути,
предшественники в биосинтетических путях)
– промежуточный продукт, если заменяет верхнюю или
боковую часть пути
Пробел в пути биосинтеза жирных кислот у стрептококков
accA
accD
accB
fabI (Enoyl-ACP reductase, EC
Gene fabI
of Enoyl-ACP
1.3.1.9),
мишень
триклозана.
reductase
(EC 1.3.1.9) is
В стрептококках:
missing
in the genome 12B,
есть ферментативная
and a numberген
of Streptococci
активность,
не известен
accC
fab
D
fab
F
fab
G
fabZ
fabI
acp
P
fabH
Позиционные кластеры: идентификация гена-кандидата
hyp
TR?
3.5.1.?
fabH
fabD
acpP
fabG
fabF
fabZ
accB
accC
accD
accA
fabI
hyp
6.3.4.15
Genome X
TR?
fabH
acpP
?
fabD
fabG
fabF
accB
fabZ
accC
accD
accA
fabZ
accC
accD
accA
2.1.1.79
FRNS
Genome Y
TR?
fabH
acpP
?
fabD
fabG
fabF
accB
5.99.1.2
Clostridium acetobutylicum
TR?
fabH
Streptococcus pyogenes
acpP
?
fabD
fabG
fabF
accB
fabZ
accC
accD
accA
hyp
Сайты связывания FabR (“Tr?”, HTH)
1 Fad (42.1.17) 2
HTH fabH acpP
3 4 fabK
fabD
fabG
fabF
accB
fabZ accC
E. faecalis
E. faecalis
E. faecalis
CONSENSUS
HTH-1
HTH-2
HTH-3
acTTTGAtwaTCAAAgt
AgTTTGggTATCAAAGT
AgTTTGAacATCAAAtg
GtTTTGATAATCAAAGT
E. faecium
E. faecium
E. faecium
HTH-1
HTH-2
HTH-3
ACTTTGATAATCAAAaT
AgTTTGAacATCAAAag
gaTTTGATAATCAAAcT
S. pyogenes
S. pyogenes
S. pyogenes
S. pyogenes
4.2.1.17
HTH-1
fabK-1
fabK-2
GaTTTGATTATCAAAtg
AaTTTGATTgTCAAAGT
CtTTTGATAtTCAAAtT
AgTTTGATTATCAAAtT
S. pneumoniae
S. pneumoniae
S. pneumoniae
4.2.1.17
HTH-1
fabK-1
ACTTTGAcAgTgAAAta
gtTTTGATTgTaAAAGT
AgTTTGAcTgTCAAAtT
S. mutans
S. mutans
S. mutans
S. mutans
S. mutans
4.2.1.17-1
4.2.1.17-2
HTH-1
fabK-1
fabK-2
ACTTTGATTtTCAAAcT
AaTTTGATTATCttAaT
ACTTTGATAgTCAAAGT
AgTTTGAcAtTCAAAtc
AgTTTGAcTgTCAAAtT
1
2
3
4
accD
accA
Метаболическая реконструкция пути биосинтеза тиамина
(новые гены/функции показаны красным)
Purine pathway
Transport of HMP
thiN
(confirmed)
Transport of HET
(Gram-positive bacteria)
(Gram-negative bacteria)
unknown
arabinose
arbutin
cellobiose
dextran
esculin
fructose
fucose
galactose
glucose
inulin
lactose
maltose
mannitol
mannose
melibiose
N-AcGlu
raffinose
ribose
salicin
sorbitol
sorbose
sucrose
tagatose
trehalose
xylose
L.
mesenteroides
Oenococcus
oeni
L. brevis
P. pentosaceus
L. delbrueckii
L. gasseri
L. casei
L. lactis
S. suis
S. thermophilus
S. mutans
S. agalactiae
S. uberis
S. equi
S. pyogenes
S. pneumoniae
Метаболизм сахаров у стрептококков и
родственных бактерий
биохимические
данные, ген не
известен
экспериментальные
данные
биохимия +
геномные
предсказания
только
геномные
предсказания
unknown
arabinose
arbutin
cellobiose
dextran
esculin
fructose
fucose
galactose
glucose
inulin
lactose
maltose
mannitol
mannose
melibiose
N-AcGlu
raffinose
ribose
salicin
sorbitol
sorbose
sucrose
tagatose
trehalose
xylose
L.
mesenteroides
Oenococcus
oeni
L. brevis
P. pentosaceus
L. delbrueckii
L. gasseri
L. casei
L. lactis
S. suis
S. thermophilus
S. mutans
S. agalactiae
S. uberis
S. equi
S. pyogenes
S. pneumoniae
Неохарактеризованный путь у инвазивных видов
S. pneumoniae
S. pyogenes
S. equi
S. agalactiae
S. suis
Структура локуса
S. pyogenes, S. agalactiae
S. equi
S. pneumoniae TIGR4
IS
S. pneumoniae R6
IS
S. suis
IS
Функции генов
3-(4-deoxy-beta-D-gluc-4-enuronosyl)-Nacetyl-D-glucosamine
PTS transporter
hydrolase
isomerase
oxidoreductase
dehydrogenase
kinase
aldolase
pyruvate +
D-glyceraldehyde 3-phosphate
hyaluronidase
(hyaluronate
lyase)
RegR
Потенциальный регуляторный сигнал
Структура локуса - 2
S. pyogenes, S. agalactiae
S. equi
S. pneumoniae TIGR4
IS
S. pneumoniae R6
IS
S. suis
IS
Возможная функция
• Путь имеется у инвазивных видов
• Иногда ко-локализован с геном
гиалуронидазы
• Всегда ко-регуляруется с геном
гиалуронидазы
Вывод:
• Функция – утилизация гиалуроновой кислоты
• Возможно, вовлечен в патогенез
Сравнительная геномика цинковых
регулонов
Две основных роли цинка у бактерий:
•
Структурная: ДНК-полимеразы,
праймазы, рибосомные белки и т.д.
•
Каталитическая: протеазы и другие
ферменты
Геномы и регуляторы
???
nZUR
FUR family
pZUR
AdcR ?
FUR family
MarR family
nZUR-
Регуляторы и сигналы
GATATGTTATAACATATC
nZUR-
GAAATGTTATANTATAACATTTC
GTAATGTAATAACATTAC
TTAACYRGTTAA
pZUR
TAAATCGTAATNATTACGATTTA
AdcR
Транспортеры
• Ортологи известных систем AdcABC и
YciC
• Паралоги отдельных компонентов систем
AdcABC и YciC
• Потенциальные транспортеры с
неохарактеризованной специфичностью
zinT: регуляция
zinT is isolated
zinT is regulated by zinc repressors
(nZUR-, nZUR-, pZUR)
E. coli, S. typhi, K. pneumoniae
Gamma-proteobacteria
A. tumefaciens, R. sphaeroides
Alpha-proteobacteria
B. subtilis, S. aureus
Bacillus group
S. pneumoniae, S. mutans,
S. pyogenes, L. lactis, E. faecalis
Streptococcus group
fusion: adcA-zinT
adcA-zinT is regulated by zinc
repressors (pZUR, AdcR) (ex. L.l.)
ZinT: анализ белковой
последовательности
Y. pestis, V. cholerae,
B. halodurans
S. aureus, E. faecalis,
S. pneumoniae, S. mutans,
S. pyogenes
E. coli, S. typhi, K. pneumoniae,
A. tumefaciens, R. sphaeroides,
B. subtilis
L. lactis
TM Zn AdcA
ZinT
ZinT: сводка
• zinT иногда слит с геном компоненты цинкового
транспортёра adcA
• zinT экспрессируется только при недостатке
цинка
• ZinT находится на поверхности клетки (имеет
трансмембранный сегмент)
• ZinT имеет цинк-связывающий домен
ZinT: вывод
• ZinT – это новый тип цинк-связывающей
компоненты цинкового ABC-транспортёра
Цинковая регуляция генов,
кодирующих PHT-белки
(pneumococcal histidine triad) у
стрептококков
S. pneumoniae S. pyogenes S. equi
S. agalactiae
zinc regulation shown in
experiment
lmb phtD
phtA
phtE
phtB
lmb phtD
phtY
lmb phtD
Структурные особенности PHТ-белков
• PHT-белки содержат множественные
мотивы HxxHxH
• PHT-белки S. pneumoniae - паралоги (6595% тождество)
• Sec-зависимая гидрофобная лидерная
последовательнсть на N-концах
• Локализация PHT-белков S. pneumoniae
на поверхности бактериальной клетки
была показана экспериментально
PHТ-белки: сводка
• PHT-белки экспрессируются при
недостатке цинка
• PHT-белки локализованы на поверхности
клетки
• PHT-белки имеют цинк-связывающие
мотивы
Гипотеза:
• PHT-белки – это новый класс
бактериальных транспортёров цинка
… неверно 
• Цинк-связывающие
домены в транспортёрах
цинка:
EEEHEEHDHGEHEHSH
HSHEEHGHEEDDHDHSH
EEHGHEEDDHHHHHDED
• Гистидиновые триады у
стрептококков:
HGDHYHY
HGDHYHF
HGNHYHF
HYDHYHN
HMTHSHW
7 out of 21
2 out of 21
2 out of 21
2 out of 21
2 out of 21
DEHGEGHEEEHGHEH
(гистидин-аспартатглютамат)
(специфический паттерн
гистидинов и ароматических
аминокислот)
Анализ PHТ-белков (продолжение)
• Ген phtD водит в один оперон с геном lmb во
всех геномах стрептококков
– Lmb: адгезин, участвующий в связывании ламинина
и вторжении стрептококков в эпителиальные клетки
• PhtY из S. pyogenes:
– phtY регулируется AdcR
– PhtY состоит из трёх доменов:
4 HIS TRIADS
PHT
LRR IR
HDYNHNHTYEDEEGH
AHEHRDKDDHDHEHED
internalin
H-rich
PHТ-белки: сводка-2
• PHT-белки индуцируются недостатком цинка
• PHT-белки локализованы на поверхности клетки
• PHT-белки имеют структурные цинк-связывающие
мотивы
• phtD образует оперон с геном адгезина
• PhtY содержит домен интерналина, отвечающие за
инвазию стрептококков
Гипотеза
PHT-белки – это адгезины, участвующие в прикреплении
стрептококков к эпителиальным клеткам , что приводит
к инвазии
AdcR
pZUR
nZUR
цинк и паралоги рибосомных белков
L36
E. coli, S.typhi
–
K. pneumoniae
–
Y. pestis,V. cholerae – 
B subtilis
–
S. aureus
–
Listeria spp.
–
E. faecalis
–
S. pne., S. mutans
–
S. pyo., L. lactis
–
L33
–
–
–
–+–
–––
––
–––
–––
–––
L31
–+
––
–+
–+
–
–
–
–
–
S14
–
–
–
–+
–+
–+
–+–
–
–+
Мотив «цинковая лента»
AdcR
pZUR
nZUR
(Makarova-Ponomarev-Koonin, 2001)
L36
E. coli, S.typhi
(–)
K. pneumoniae
(–)
Y. pestis,V. cholerae (–) 
B subtilis
(–)
S. aureus
(–)
Listeria spp.
(–)
E. faecalis
(–)
S. pne., S. mutans
(–)
S. pyo., L. lactis
(–)
L33
–
–
–
(–) + –
(–) – –
(–) –
(–)  – –
(–) – –
(–) – –
L31
(–) +
(–) –
(–) +
(–) +
–
–
–
–
–
S14
–
–
–
(–) +
(–) +
(–) +
(–) + –
(–)
(–) +
Сводка наблюдений:
• Makarova-Ponomarev-Koonin, 2001:
– L36, L33, L31, S14 – единственные белки, имеющие
паралогов в нескольких видах
– L36, L33, L31, S14 – это четыре из семи белков, имеющих
мотив «цинковая лента» (четыре цистеина)
– Одна из двух (или более) копий белков L36, L33, L31, S14
обычно содержит мотив «цинковая лента», а остальные – нет
• Среди генов, кодирующих паралоги
рибосомных белков, (почти) всегда один
ргулируется цинковым репрессором, а
кодируемый им белок никогда не содержит
«цинковой ленты»
Плохой недостаточно цинка:
сценарий весь цинк использован
рибосомами,
не
хватает
достаточно
цинка
для
ферментов
цинка
Регуляторный механизм
Sufficient Zn
ribosomes
repressor
R
Zn-dependent
enzymes
Zn starvation
R
Хороший недостаточно цинка:
сценарий некоторые рибосомы
содержат
паралоги
без
достаточно
цинка,
остаётся
цинк
для
цинка
ферментов
Предсказание …
(Proc Natl Acad Sci U S A. 2003 Aug 19;100(17):9912-7.)
… и подтверждение
(Mol Microbiol. 2004 Apr;52(1):273-83.)
•
•
•
•
•
•
•
•
•
•
•
•
•
•
Андрей Миронов
Анна Герасимова
Ольга Калинина
Алексей Казаков (гиалуронат)
Екатерина Котельникова
Галина Ковалёва
Павел Новичков
Ольга Лайкова (гиалуронат)
Екатерина Панина (цинк)
(сейчас в UCLA, USA)
Елизавета Пермина
Дмитрий Равчеев
А.Б.Рахманинова
Дмитрий Родионов (тиамин)
Алексей Витрещак (тиамин)
(сейчас LORIA, France)
• Андрей Остерман
(Burnham Institute,
San-Diego, USA)
(жирные кислоты)
• Howard Hughes
Medical Institute
• Ludwig Institute of
Cancer Research
• РФФИ
• РАН (программа
«Молекулярная и
клеточная
биология»)
Скачать