Эволюция регуляторных систем у бактерий М.С.Гельфанд Институт проблем передачи информации им. А.А.Харкевича РАН 40 лет журналу «Молекулярная биология» 25.4.2007 От эволюции генов и белков к эволюции геномов, метаболических и регуляторных систем ~1000 бактериальных геномов Проблема: как их анализировать? Возможности: • сравнительная геномика – Функциональная аннотация – Метаболическая реконструкция – Регуляторные системы • Новый уровень изучения эволюции Сравнительная геномика регуляторных систем: задачи • Микроэволюция: динамика отдельных регуляторных сайтов • Ко-эволюция факторов транскрипции и узнаваемых ими мотивов в ДНК – Изменение специфичности регуляторов • Макроэволюция: – Расширение, сокращение, деление и слияние регулонов – Перекоммутация регуляторных каскадов – Смена регуляторных систем Методы: филогенетический футпринтинг Регуляторные сайты выглядят как консервативные островки в выравниваниях 5’-областей Пример: гены nrd у Yersinia+Erwinia, сайты связывания FNR, DnaA, NrdR Методы: проверка соответствия Истинные сайты систематически обнаруживаются перед ортологичными генами, ложные расположены случайно Пример: новый регулятор биотинового метаболизма альфапротеобактерий BioR Рождение и исчезновение сайтов – очень динамический процесс Сайты связывания NadR перед геном pncB Расширение регулона: как FruR стал CRA Mannose Glucose manXYZ ptsHI-crr edd epd eda adhE aceEF Mannitol mtlA gapA fbp Fructose pykF mtlD fruBA fruK pfkA pgk gpmA icdA ppsA pckA aceA tpiA aceB гамма-протеобактерии проекция экспериментально известных сайтов E.coli на родственные геномы: что окажется консервативно? Общий предок Enterobacteriales Mannose Glucose manXYZ ptsHI-crr edd epd eda adhE aceEF Mannitol mtlA gapA fbp Fructose pykF mtlD fruBA fruK pfkA pgk gpmA icdA ppsA pckA aceA tpiA aceB гамма-протеобактерии Enterobacteriales Общий предок Escherichia and Salmonella Mannose Glucose manXYZ ptsHI-crr edd epd eda adhE aceEF Mannitol mtlA gapA fbp Fructose pykF mtlD fruBA fruK pfkA pgk gpmA icdA ppsA pckA aceA tpiA aceB гамма-протеобактерии Enterobacteriales E. coli и Salmonella spp. Исчезновение регуляторов – тоже динамический процесс потеря RbsR у Y. pestis (ABC-транспортер тоже утерян) RbsR binding site Start codon of rbsD Потеря регулятора и слияние регулонов Yersinia и Klebsiella: два регулона, GalR и Laci-X Erwinia: один регулон, GalR По-видимому, laci-X существовал у общего предка (Klebsiella – внешний геном) Изменение регулятора стрептококки, утилизация мальтозы/мальтодекстрина Замена: вторжение регулятора из другого подсемейства (горизонтальный перенос), с другим мотивом связывания Дупликация регулятора (и изменение мотива?) – альфа-проетобактерия, утилизация мальтозы/трегалозы Регуляция гомеостаза железа Железо: • необходимый кофактор (лимитирующий во многих экологических нишах) • опасно в больших концентрациях Кишечная палочка (E. coli): FUR, регуляция транскрипции в ответ на железо: • синтез сидерофоров • транспорт (сидерофоры, гем, Fe2+, Fe3+) • хранение (ферритины и т.п.) • железо-зависимые ферменты • синтез гема • синтез железо-серных кластеров Похоже в сенной палочке (Bacillus subtilis) Регуляция гомеостаза железа у альфа- протеобактерий Эксперимент: FUR/MUR: Bradyrhizobium, Rhizobium and Sinorhizobium RirA (семейство Rrf2): Rhizobium and Sinorhizobium Irr (семейство FUR): Bradyrhizobium, Rhizobium and Brucella [- Fe] [+Fe] [ - Fe] [+Fe] RirA RirA Irr Irr FeS heme degraded Siderophore uptake 2+ 3+ Fe / Fe uptake Iron uptakesystems Fur [- Fe] Iron storage ferritins FeS synthesis Heme synthesis Iron-requiring enzymes [ironcofactor] Fur IscR Fe FeS [+Fe] Transcription factors FeS status of cell Распределение факторов по геномам Семейство FUR/MUR/Irr : P0A9A9 sp| ECOLI Escherichia coli Pseudomonas aeruginosa: sp|Q03456 PSEAE NEIMA Neisseria meningitidis: sp|P0A0S7 HELPY Helicobacter pylori: sp|O25671 P54574 BACSU Bacillus subtilis: sp| B.subtilis регуляция генов транспортеров Mn MUR SM mur Sinorhizobium meliloti Mesorhizobium sp. BNC1 (I) MBNC03003179 BQ fur2 Bartonella quintana BMEI0375 Brucella melitensis EE36 12413Sulfitobacter sp. EE-36 Mesorhizobium sp. BNC1 (II) MBNC03003593 RB2654 19538 Rhodobacterales bacterium HTCC2654 AGR C 620 Agrobacterium tumefaciens RHE_CH00378Rhizobium etli Rhizobium leguminosarum RL mur Nham 0990 Nitrobacter hamburgensis X14 Nwi 0013 Nitrobacter winogradskyi RPA0450 Rhodopseudomonas palustris Bradyrhizobium japonicum BJ fur ROS217 18337 Roseovarius sp.217 Jannaschia sp. CC51 Jann 1799 Silicibacter pomeroyi SPO2477 Silicibacter sp. TM1040 STM1w01000993 MED193 22541Roseobacter sp. MED193 HTCC2597 OB2597 02997Oceanicola SKA53 Loktanella SKA53 03101 batsensis vestfoldensis Rsph03000505 Rhodobacter sphaeroides ISM Roseovarius nubinhibens ISM 15430 HTCC1002 Pelagibacter ubique PU1002 04436 GOX0771Gluconobacter oxydans Zmomonas y mobilis ZM01411 Saro02001148 Novosphingobium aromaticivorans Sphinopyxis alaskensis RB2256 Sala 1452 ELI1325 Erythrobacter litoralis Oceanicaulis alexandrii HTCC2633 OA2633 10204 PB2503 04877Parvularcula bermudensis HTCC2503 CC0057 Caulobacter crescentus Rhodospirillum rubrum Rrub02001143 Magnetospirillum magneticum (I) Amb1009 (II) Magnetospirillum magneticum Amb4460 FUR Fur E.coli Irr Семейство RirA/NsrR (Rhizobiales) Семейство IscR Регуляция генов в функциональных подсистемах Rhizobiales Bradyrhizobiaceae Rhodobacteriales The Zoo (likely ancestral state) Реконструкция истории регуляторной системы Frequent co-regulation with Irr Strict division of function with Irr Appearance of the iron-Rhodo motif Все мотивы и одна очень привлекательная гипотеза: • Кросс-узнавание мотивов FUR и IscR в общем предке. • Когда FUR стал MUR, а IscR пропал у Rhizobiales, возникший RirA (из семейства Rrf2 с совсем другим общим консенсусным мотивом) «завладел» этими сайтами. • Iron-Rhodo мотив узнаетс IscR: поддается прямой проверке Мотивы ДНК и белок-ДНКовые взаимодействия Энтропия в выравненных сайтах и количество контактов (тяжелые атомы в паре оснований на расстоянии <порога от атома белка) CRP PurR IHF TrpR Детерминанты специфичности семейства LacI Обучение: 459 белков, средняя длина: 338 аа, 85 групп специфичности – 44 SDPs 10 остатков в контакте с эффектором 7 в области контакта с эффектором (5Ǻ<dmin<10Ǻ) 6 остатков – межсубъединичные контакты 5 в зоне межсубъединичного контакта (5Ǻ<dmin<10Ǻ) 7 остатков в контакте с оператором 6 в зоне контакта с оператором (5Ǻ<dmin<10Ǻ) LacI from E.coli Семейство факторов транскрипции CRP/FNR TGTCGGCnnGCCGACA CooA Desulfovibrio TTGTGAnnnnnnTCACAA FNR Gamma TTGATnnnnATCAA HcpR Desulfovibrio TTGTgAnnnnnnTcACAA Корреляция между нуклеотидами в мотиве и остатками в белке • • • • DD DV EC YP VC DD DV EC YP VC CooA в Desulfovibrio spp. CRP в гамма-протобактериях HcpR в Desulfovibrio spp. FNR в гамма-протобактериях COOA COOA CRP CRP CRP HCPR HCPR FNR FNR FNR ALTTEQLSLHMGATRQTVSTLLNNLVR ELTMEQLAGLVGTTRQTASTLLNDMIR KITRQEIGQIVGCSRETVGRILKMLED KXTRQEIGQIVGCSRETVGRILKMLED KITRQEIGQIVGCSRETVGRILKMLEE DVSKSLLAGVLGTARETLSRALAKLVE DVTKGLLAGLLGTARETLSRCLSRMVE TMTRGDIGNYLGLTVETISRLLGRFQK TMTRGDIGNYLGLTVETISRLLGRFQK TMTRGDIGNYLGLTVETISRLLGRFQK Контактирующие: REnnnR TG: 1й аргинин GA: глютамат и 2й аргинин TGTCGGCnnGCCGACA TTGTGAnnnnnnTCACAA TTGTgAnnnnnnTcACAA TTGATnnnnATCAA Эта корреляция сохраняется и в других членах семейства Открытые проблемы • Моделирование эволюции регуляторных систем – каталог элементарных событий – механизмы • как рождаются сайты? • дупликации и горизонтальные переносы факторов и регулируемых оперонов – оценки вероятностей – общие свойства: • распределение размера семейств факторов транскрипции в геномах • геном-специфичные массовые дупликации («взрывы») и их причины • стабильные ядра и лабильные периферии регулонов: связь с метабооической картой • Коэволюция факторов транскрипции и мотивов ДНК: – Как эволюционируют мотивы? Что является движущей силой – мутации фактора? – код ДНК-белкового узнавания – свой для кадого семейства? Предсказние мотива по белку. Все это на фоне трудоемкого сбора (литература, массовые эксперименты) и порождения (сравнительная геномика) данных, их неполноты и неточности Кто это делал: • • • • • • А.А.Миронов (алгоритмы и программы) А.Б.Рахманинова (структуры белков) Дмитрий Родионов (BioR, NrdR, железо) Ольга Лайкова (LacI, сахара) Дмитрий Равчеев (FruR) Ольга Калинина (специфичность/LacI) • Leonid Mirny, MIT (ДНК-белковые контакты, специфичность) • Andy Johnston, University of East Anglia (железо) • • • • Howard Hughes Medical Institute РФФИ РАН, программа “Молекулярная и клеточная биология” INTAS