Эволюция доменной архитектуры Домены как единицы непрерывной эволюции белков •Под непрерывной эволюцией будем понимать эволюцию последовательности, происходящую в силу незначительных изменений аминокислотной последовательности от поколения к поколению (и последующего отбора) •Домены эволюционируют в составе белков, в том числе, однодоменных. •Молекулярная филогения позволяет (до некоторой степени) восстановить непрерывную эволюцию домена. Гомеобелки (подсемейство с OAR доменом) Пример из второго семестра Непрерывность тоже не абсолютна! • Вставка 20 остатков у гомеодоменов • Циклическая перестановка у эндонуклеаз рестрикции (курсовая Нади Тухтубаевой) • Перестановка мотивов ДНК-метилтрансфераз (см. диплом Ани Попенко) Топология ДНК-метилтрансферазных доменов Рис. 9 Схематичное описание топологии ДНК-метилтрансфераз разных классов. а) m6a_alpha_II (PDB:1q0s) б) m6a_gamma_I (PDB:2ar0) в) m5c_C5_II(PDB:1dct) г) m4c_beta_II (PDB:1boo) Все 10 структурных мотивы консервативны, но только мотивы X, I, IV и VIII оказались консервативны по последовательности в больших выборках. а) III II V IV I VIII VI VII X N б) C V III II IV I VIII VI VII X N в) C V III II IV I VII IX X C N г) N V II III C VIII VI I IV VII VIII VI X 5 Общность структуры Рис. 10 Выравнивание бетатяжей ДНКметилтрансферазных доменов. И в третичной структуре бета-тяжи прекрасно накладываются. Рис. 11 Наложение бета тяжей ДНКметилтрансферазных доменов групп альфа, бета и гамма. Синий домен – гамма (2ar0), красный – бета (1boo), зеленый – альфа (1q0s). 6 В эволюции доменов происходят редкие события • дупликации гена, следовательно, белка • потеря гена, следовательно, белка • события или мутации, приводящие к изменению доменного состава белка • рекомбинация ДНК • мутации стоп-кодона • мутации сайтов сплайсинга • др. Возможные сценарии эволюции доменной архитектуры с данным доменом 1. Усложнение: однодоменный белок предка (LUCA) на какомто этапе соединился с другим белком, создав новую доменную архитектуру. Получив преимущества, новый белок либо сохранился у потомков, либо потерялся (любовь до гроба) 2. Редукция: домен предка (LUCA) уже входил в многодоменный белок. На каком-то этапе эволюции домены белка развелись, и домен стал существовать в белке с урезанной доменной архитектурой, например, в однодоменном белке (развод) 3. Непостоянство: в эволюции от предка домен претерпел множество соединений и разводов. Соединения и разводы не являются настолько существенными изобретениями эволюции, чтобы отбор их сохранял у всех потомков. В эволюции гомеодомены включались в разные архитектуры • Об этом можно судить по 216 различным доменным архитектурам гомеобелков, представленным в банке Pfam Гомеодомен Парный домен и гомеодомен Lim домены и гомеодомен Гомеодомен, продолженный лейциновой молнией POU домен и гомеодомен Два гомеодомена PBX-домен и гомеодомен Какие архитектуры сохраняются, раз возникнув, а какие – “случайны”? В основе первых двух сценариев лежит предположение о том, что домен находит оптимальную архитектуру и далее живет в ней (постоянство) • В 2011s семестре студенты примеры постоянства двухдоменной архитектуры, возникшей у LUCA • Подтверждением служит дерево домена, включающее представителей из разных царств и с двумя разными архитектурами. • Примеры: • Золотарева • Альмухаметов Как восстановить сценарий Сценарий 1. На дереве домена сложная архитектура встречается в одной кладе. Менее сложная архитектура (например, однодоменная) встречается в более широком таксоне. Сценарий 2. На дереве домена архитектура (например, однодоменная) встречается в одной кладе. В то же время более сложная архитектура встречается в более широком таксоне. Сценарий 3. На дереве домена архитектуры не образуют монофилетических групп высокого уровня. Примеры перетасовки доменов (domain shuffling) 223 белка 243 белка 507 белков • 25 белков • 9 белков • 2 белка • 12 белков Эволюционные домены часто, но не всегда совпадают со структурными доменами. Домены часто, но не всегда, имеют одинаковую функцию. Например: – HTH_5 - ДНК- связывающий домен ряда транскрипционных факторов – TrpA – цепочка А триптофансинтазы – Homeobox, он же гомеодомен, – ДНКсвязывающий домен множества эукариотических транскрипционных факторов Pfam • http://pfam.sanger.ac.uk • Большая коллекция семейств доменов Для каждого семейства есть множественное выравнивание и профиль-HMM . • Состоит из 2-х частей: PfamA – курируемая часть, покрывает 76% UniProt PfamB – большое число маленьких семейств из автоматически сгенерированной базы доменов, не вошедших в PfamA (раньше – ProDom, теперь – ADDA) . • Удобна для анализа доменной структуры белков. Язык Pfam : Семейство – коллекция гомологичных белков. Домен – структурная единица, которую можно найти во множественном выравнивании. Повтор – короткая единица, нестабильная сама по себе, но образует стабильные структуры, если есть много копий. Мотив – короткая единица структуры вне глобулярных доменов. Клан – группа родственных записей. Какая информация закодирована в картинке доменов белка • Прямоугольники с закругленными краями – найден домен целиком. • Край прямоугольника зубчатый – найден только фрагмент домена, за зубчиками домен не продолжается, хотя должен был бы быть. • Прямоугольник с острыми краями – мотив, трансмебранный участок, участок малой сложности (например, десять остатков A) и т.п. – не является эволюционным доменом! • Цветная полоска – домен из PfamB, т.е. найденные программой, автоматически выровненные, но не проанализированные экспертом, сходные по последовательности фрагменты разных белков. • Домен, имеющий ID вида DUF… с номером - Domain of Unknown Function Пример