Сценарий 1.

advertisement
Эволюция доменной
архитектуры
Домены как единицы непрерывной
эволюции белков
•Под непрерывной эволюцией будем понимать
эволюцию последовательности, происходящую в
силу незначительных изменений аминокислотной
последовательности от поколения к поколению (и
последующего отбора)
•Домены эволюционируют в составе белков, в том
числе, однодоменных.
•Молекулярная филогения позволяет (до
некоторой степени) восстановить непрерывную
эволюцию домена.
Гомеобелки (подсемейство с OAR доменом)
Пример из второго семестра
Непрерывность тоже не абсолютна!
• Вставка 20 остатков у гомеодоменов
• Циклическая перестановка у эндонуклеаз
рестрикции (курсовая Нади Тухтубаевой)
• Перестановка мотивов ДНК-метилтрансфераз (см.
диплом Ани Попенко)
Топология ДНК-метилтрансферазных доменов
Рис. 9 Схематичное
описание топологии
ДНК-метилтрансфераз
разных классов.
а) m6a_alpha_II (PDB:1q0s)
б) m6a_gamma_I
(PDB:2ar0)
в) m5c_C5_II(PDB:1dct)
г) m4c_beta_II (PDB:1boo)
Все 10 структурных
мотивы консервативны,
но только мотивы X, I,
IV и VIII оказались
консервативны по
последовательности в
больших выборках.
а)
III
II
V
IV
I
VIII
VI
VII
X
N
б)
C
V
III
II
IV
I
VIII
VI
VII
X
N
в)
C
V
III
II
IV
I
VII
IX
X
C
N
г)
N
V
II
III
C
VIII
VI
I
IV
VII
VIII
VI
X
5
Общность структуры
Рис. 10
Выравнивание бетатяжей ДНКметилтрансферазных
доменов.
И в третичной структуре бета-тяжи
прекрасно накладываются.
Рис. 11 Наложение бета тяжей ДНКметилтрансферазных доменов групп
альфа, бета и гамма.
Синий домен – гамма (2ar0), красный –
бета (1boo), зеленый – альфа (1q0s).
6
В эволюции доменов происходят редкие
события
• дупликации гена, следовательно, белка
• потеря гена, следовательно, белка
• события или мутации, приводящие к
изменению доменного состава белка
• рекомбинация ДНК
• мутации стоп-кодона
• мутации сайтов сплайсинга
• др.
Возможные сценарии эволюции доменной
архитектуры с данным доменом
1. Усложнение: однодоменный белок предка (LUCA) на какомто этапе соединился с другим белком, создав новую доменную
архитектуру. Получив преимущества, новый белок либо
сохранился у потомков, либо потерялся (любовь до гроба)
2. Редукция: домен предка (LUCA) уже входил в
многодоменный белок. На каком-то этапе эволюции домены
белка развелись, и домен стал существовать в белке с
урезанной доменной архитектурой, например, в однодоменном
белке (развод)
3. Непостоянство: в эволюции от предка домен претерпел
множество соединений и разводов. Соединения и разводы не
являются настолько существенными изобретениями эволюции,
чтобы отбор их сохранял у всех потомков.
В эволюции гомеодомены включались в
разные архитектуры
• Об этом можно судить по 216 различным
доменным архитектурам гомеобелков,
представленным в банке Pfam
Гомеодомен
Парный домен и гомеодомен
Lim домены и гомеодомен
Гомеодомен, продолженный
лейциновой молнией
POU домен и гомеодомен
Два гомеодомена
PBX-домен и гомеодомен
Какие архитектуры сохраняются, раз
возникнув, а какие – “случайны”?
В основе первых двух сценариев лежит
предположение о том, что домен находит
оптимальную архитектуру и далее живет в ней
(постоянство)
• В 2011s семестре студенты примеры постоянства
двухдоменной архитектуры, возникшей у LUCA
• Подтверждением служит дерево домена,
включающее представителей из разных царств и с
двумя разными архитектурами.
• Примеры:
• Золотарева
• Альмухаметов
Как восстановить сценарий
Сценарий 1.
На дереве домена сложная архитектура встречается в одной
кладе. Менее сложная архитектура (например, однодоменная)
встречается в более широком таксоне.
Сценарий 2.
На дереве домена архитектура (например, однодоменная)
встречается в одной кладе. В то же время более сложная
архитектура встречается в более широком таксоне.
Сценарий 3. На дереве домена архитектуры не образуют
монофилетических групп высокого уровня.
Примеры перетасовки доменов (domain shuffling)
223 белка
243 белка
507 белков
• 25 белков
• 9 белков
• 2 белка
• 12 белков
Эволюционные домены часто, но не всегда совпадают
со структурными доменами.
Домены часто, но не всегда, имеют
одинаковую функцию. Например:
– HTH_5 - ДНК- связывающий домен ряда
транскрипционных факторов
– TrpA – цепочка А триптофансинтазы
– Homeobox, он же гомеодомен, – ДНКсвязывающий домен множества
эукариотических транскрипционных факторов
Pfam
•
http://pfam.sanger.ac.uk
• Большая коллекция семейств доменов
Для каждого семейства есть множественное выравнивание и профиль-HMM .
• Состоит из 2-х частей:
 PfamA – курируемая часть, покрывает 76% UniProt
 PfamB – большое число маленьких семейств из автоматически
сгенерированной базы доменов, не вошедших в PfamA (раньше –
ProDom, теперь – ADDA) .
• Удобна для анализа доменной структуры белков.
Язык Pfam :
Семейство – коллекция гомологичных белков.
Домен – структурная единица, которую можно найти во множественном
выравнивании.
Повтор – короткая единица, нестабильная сама по себе, но образует
стабильные структуры, если есть много копий.
Мотив – короткая единица структуры вне глобулярных доменов.
Клан – группа родственных записей.
Какая информация закодирована в картинке
доменов белка
• Прямоугольники с закругленными краями – найден домен целиком.
• Край прямоугольника зубчатый – найден только фрагмент домена, за
зубчиками домен не продолжается, хотя должен был бы быть.
• Прямоугольник с острыми краями – мотив, трансмебранный участок,
участок малой сложности (например, десять остатков A) и т.п. – не
является эволюционным доменом!
• Цветная полоска – домен из PfamB, т.е. найденные программой,
автоматически выровненные, но не проанализированные экспертом,
сходные по последовательности фрагменты разных белков.
• Домен, имеющий ID вида DUF… с номером - Domain of Unknown
Function
Пример
Download