Отчёт о биоинформатическом исследовании белка

advertisement
Янков М.К., 1 курс ФББ, второе зачётное задание, 18.11.2005
Базовое биоинформатическое исследование периплазматического1
транспортёра витамина B12 btuf_ecoli (PDB-код 1n4a)
Btuf_ecoli является цитоплазматическим
транспортёром
витамина
B12
(стехиометрическая формула C63H88N14O14CoP,
структура – рис.1) в бактерии Escherichia coli2,
являющегося
необходимым
для
жизенедеятельности человека соединением и
принимающем участие в синтезе дезоксирибозы
из рибозы и связывающем кобальт, используя
единственную известную среди биологических
молекул металло-углеродную связь. Так как
эукариоты
не
могут
самостоятельно
синтезировать эту молекулу, становится ясной
практическая важность этого белка. В этой
работе
я
исследовал
белок
базовыми
биоинформатическими методами с помощью
Rasmol.
Мною
была
систематизирована
структура белка и предложена доменная
структура, были найдены предположительные
аминокислоты
белка,
связывающиеся
с
лигандом, определён характер этого связывания
и предложена модель двух генно-инженерных
экспериментов по замене связывающих витамин
аминокислот.
Рис.1 Структура витамина B12.
Молекулы в модели и доменная
дифференциация
Работа производилась с помощью результатов
рентгено-структурного анализа, с разрешением 2 Ǻ.
В модели 1n4a.pdb представлены две молекулы
белка, каждая – с лигандом, как видно на рис.2. Так
как эти молекулы полностью идентичны,
исследование
проводилось
над
цепью
A.
Рис.2 Взаимное раположение всех молекул в модели. Зелёным цветом окрашена цепь A в структурной модели, жёлтым –
цепь B, красным – молекулы витамина B12 в шарико-палочковой модели. Рисунок также подписан собственными средствами
Rasmol.
Табл.1 Состав модели PDB
Полипептидные цепи
Остатки
Название субъединицы белка
(от-до:цепь)
1-105:A Первый домен, α-цепь
106-129:A Междудоменная спираль, α-цепь
130-244:A Второй домен, α-цепь
1-105:B Первый домен, β-цепь
106-129:B Междудоменная спираль, β-цепь
130-244:B Второй домен, β-цепь
Гетеромолекулы и гетерогруппы
ID
Название
Формула
CNC
Витамин B12
C63H88N14O14CoP
HOH
Вода
H2O
Число копий
2
Комментарии
По одному в
каждом белке
549
Доменная структура белка (рис.3) определяется
довольно
легко.
Ясно
выражены
два
симметричных домена, распалагающихся по
обе стороны от связываемой молекулы и самая
длинная в белке спираль, связывающая их.
Диаметр одной молекулы белка – 64 Å, 64∙10-9
м, и 32∙10-6 бактерий E.Coli.
Вторичная структура белка
Рис.4 Доменная структура белка. Белок представлен в
структурном представлении. Зелёным показан первый
домен с остатками 1-105, синим – междоменная спираль,
содержащая остатки с 106 по 129, и жёлтым – второй
домен с остатками 130-244. Витамин показан в красной
проволочной модели.
Второй домен
H:228-241
H:218-223
Междоменная спираль
H:106-129
H:195-207
H:178-185
S:214-216
S:189-192
S:134-138
H:152-161
S:163-165
В pdb-файле с моделью белка, конечно,
содержатся определения листов и спиралей,
содержащихся в белке, но стоит отметить, что
они зачастую неверны – часто один тяж или
спираль разбит на два, или за спираль
принимаются две-три аминокислоты, лишь
примерно
соответствующие
определению
спирали. Также каждые из двух β-листов в
молекуле белка был ошибочно разбит на два.
Белок состоит из 2 листов, расположенных
Первый домен
H:89-104
S:82-85
S:59-63
S:4-6
S:25-26
H:68-78
H:48-55
H:8-18
H:32-38
S:40-42
Рис.3 Вторичная структура белка. β-тяжи изображены жёлтыми стрелками, спирали – красными прямоугольниками.
Сверху подписаны соответственные номера аминокислотных остатков. Два парралельнных листа слева и справа
показаны с помощью расположения тяжей. Также примерно изображена доменная структура.
симметрично, по одному на домен. Тяжи
чередуюся со спиралями. Предположительно
тяжи, лежащие глубже в трёхмерной структуре
белка,
задают
его
твёрдый
«скелет»
поддерживающий трёхмерную структуру, а
спирали, лежащие на периферии, определяют
его свойства.
Связывание лиганда белком
Второй задачей в исследовании, после общей
характеристики белка, стояло выяснение
аминокислотных остатков, связывающихся с
витамином B12. Так как область между
лигандом и белком наполнена молекулами
воды,
я
решил,
что
гидрофобное
взаимодействие в указанной области вряд ли
имеет место. Мною были сначала отмечены
аминокислоты и молекулы воды, находящиеся
не более чем в 3,5 Ǻ от витамина, а также
аминокислоты, находящиеся в такой же
области относительно указанных молекул
воды. Затем мной был проведён визуальный
анализ (а попросту я взял и посмотрел на
белок), и нашёл возможные водородные связи
(Рис.7).
Следующие остатки формируют с витамином
водородные связи: Arg2243, Asp220, Glu223,
Asn143, Trp174, Trp44, Ser27, Ser8, Trp63,
Asp86, Tyr28. При этом лишь Arg224, Asp220,
Tyr28 и Glu223 связываются с лигандом
водородными связями напрямую; остальные –
лишь через воду, и на самом деле
существование таких связей кажется мне
весьма сомнительным, но пренебрегать такой
возможностью нельзя. Причём существование
связи с Arg224 довольно сомнительно, так как
расстояние
между
взаимодействующими
атомами составляет для этой аминокислоты
более 4 Å.
Также Pro9 и Trp634 осуществляют Ван-ДерВаальсово взаимодействие с витамином.
Логично предположить, что именно четыре
связывающиеся водородными связями с белком
напрямую вместе с двумя, образующими ВанДер-Ваальсово взаимодействие и играют
решающую роль в связывании лиганда.
Рис. 5 Аминокислоты, связывающиеся с лигандом
водородными связями напрямую и через водные
мостики. Витамин показан в палочковой модели жёлтым
цветом, аминокислоты, наверняка участвующие в
связывании – красным, участие которых в связывании
лиганда стоит под вопросом – синим. Вода показана
голубыми шариками. Кобальт помечен розовым цветом.
Рис. 6 Связь между витамином B12 и Glu223. Glu223
показан красным цветом, витамин – жёлтым. Розовым
выделен центральный кобальт. Атомы, образующие
интересующую нас водородную связь представлены в
остовной модели. Видно, что замена Glu223 на глицин
приведёт к её полному исчезновению, а замена на
неотличимый в таком представлении глутамин, у
которого на том же месте стоит кислород точно так же,
как и у глутаминовой кислоты .
Генно-инженерный эксперимент
Задачей предложенного генно-инженерного
эксперимента стояло предложить две замены
аминокислотных остатков, одна из которых
привела бы к значительному ухудшению
свойств связывания лиганда белком, а вторая не
возымела бы такого действия. Лучшими
кандидатами на роль аминокислоты, критичной
для
связывания
являются,
естественно
указанные выше шесть; мой выбор пал на
Glu223.
Эта
аминокислота
напрямую
контактирует
с
метиламином(Рис.
6),
участвующим в координационной связи с
кобальтом, и таким образом наиболее близко из
всех подходит к центру молекулы витамина, и
мне кажется, что это делает связь прочнее. Тем
более что расстояние между реагирующими
атомами у этой кислоты наименьшее среди всех
четырёх – 2,9 Å, так что замена этой
аминокислоты на глицин привела бы, по моему
мнению, к
потере
белком способности
связываться с лигандом, а кроме того, такая
замена могла бы привести к изменению всёй
третичной структуры белка из-за особых
конформационных свойств глицина.
Также хорошим вариантом для такой мутации
является Trp63, так как он, помимо Ван-ДерВаальсова взаимодействия, хорошо подходит к
впячиванию структуры витамина и таким
образом «придерживает» его от «выпадания» из
комплекса (Рис.7), так что его замена на глицин
привела бы именно к такому «выпадению».
Что же касается замены аминокислоты, которая
не приведёт к измнению в связывании
витамина белком, то
такой
кислотой
безусловно будет связывающася с лигандом с
помощью кислорода или азота остова, т.к. при
любой замене такой аминокислоты (кроме
разве что глицина и пролина, так как замена на
них может привести к повороту всей цепи).
Подходящей кислотой для замены выглядит
Trp174 – связь осуществляется с его остовным
кислородом, и замена его на фенилаланин,
обладающий такими
же
свойствами
и
приблизительно
такой
же
трёхмерной
структурой. Но существование связи между
триптофаном и витамином через воду вообще
довольно сомнительно, поэтому корректнее для
замены опять взять Glu223, которую можно
заменить на глутамин, что, естественно, не
приведёт к изменению связей из-за практически
полной
идентичности
структур
этих
аминокислот.
Ген и белок
Кроме выполнения указанного задания мною
было замечено несоответствие длинны гена в
аминокислотных остатках и количества
остатков в белке – оказывается, в белке первые
22 аминокислотных остатка из генома
отсутствуют. Такая разница могла наверное
Рис.7 Ван-Дер-Ваальсово взаимодействие с Trp63.
Белок показан цепью, домены помечены разными
цветами. Витамин и триптофан в шариковой модели.
Становится видно, что триптофан входит в подходящую
как раз для него выемку в структуре витамина и
«придерживает» его в сайте связывания.
H2N
NH
NH
CH3
N
N
CH3
NH2
O
Рис.8 Трипептид Pro2-Arg3-Val4. Из 6 практикума.
быть вызвана редактированием мРНК в
кариоплазме E.Coli или редактированием уже
готового белка.
Мне показалось, что поскольку домены белка
явно симметричны, но первый домен меньше
второго, то удалённые аминокислоты были
симметричны аминокислотам, находящимся на
конце другого домена – а именно там находятся
аминокислоты, критичные для связывания
лиганда; то есть наверное эволюционно этот
белок произошёл от белка, обладающего двумя
парами
связыващих
аминокислот
и
предназначенного для связывания какого-то
другого, большего соединения.
Табл.2 Множества, определённые в файле 1n4a.def
Множество
Что в нём
Chain_a
Исследуемая цепь
Vitamin
Связывающаяся с исследуемой цепью молекуда витамина
BindSite
Кандидаты на образование связи с лигандом.
Occupied
Атомы рядом с витамином, уже участвующие в водородных связях
HBondProt
Атомы, подходящие по автоматически определяемым признакам5 на роль
участвующих в водородных связях со стороны белка.
HBondVit
Атомы в этих связях со стороны витамина.
HOHBondHOH
Атомы воды, образующие водные мостики.
HOHBondProt
Атомы белка, связывающиеся через водные мостики.
HOHBondVit
Атомы витамина, связывающиеся через эти мостики.
Acceptor
Акцепторы протона в водородной связи.
Donor
Доноры протона в водородной связи.
Cont_Btuf_CNC
Аминокислоты, по формальным признакам связывающиеся с лигандом.
Cont_Btuf_CNC_Direct Аминокислоты, осуществляющие прямые контакты с лигандом.
Cont_Btuf_CNC_VDW Аминокислоты, связывающиеся с лигандом с помощью взаимодействия ВанДер-Ваальса.
BindAtomsProt
Атомы белка, участвующие в водородных связях с лигандом, в т.ч. и через
водные мостики.
BindAtomsVit
Атомы витамина, участвующие в этих связяй.
VDW_Prot
Атомы белка, участвующие в взаимодействии Ван-Дер-Ваальса.
VDW_Vit
Аналогичные атомы витамина.
Domain1
Первый домен.
InterDomain
Междудоменная спираль
Domain2
Второй домен.
Практикумы второго
биоинформатического цикла
Практикум 7
В седьмом практикуме шла речь о карте
Рамачандрана и β-листах. Мною был
произведён
примерный
анализ
соответствия карты Рамачандрана моего
белка стандартной карте и изображена
структура гемоглобина.
Практикум 8
В данном практикуме рассмотрены
различные аспекты образования
вторичной и третичной структур белка –
серные мостики (Риc. 9), α-спирали (Рис.
10) и гидрофобные взаимодействия (Рис.
11).
Риc. 9 Серные мостики в глобуле инсулина.
Жёлтым и зелёным показаны различные глобулы
в ленточной модели, красным показаны серные
мостики.
Рис. 10 Сгиб α-спирали. В рисунке показано
место перегиба спирали с одной нестандартной
связью. Остов спирали приведён в шарикопалочковой модели, кислороды окрашены
красным, азоты синим, а углероды серым.
Табл.3 Список файлов, прилагающихся к
отчёту
Имя файла
Содержимое
1n4a.gif
Все молекулы в pdb-файле
(Рис.2)
1n4a.def
Определение
различных
множеств
белка
и
демонстрация процесса поиска
связывающихся с лигандом
аминокислотных остатков
Скрипт,
показывающий
1n4a.spt
общую структуру белка и его
связывание с лигандом
Yankov_cr2.doc Собственно, данный отчёт
Рис. 11 Изображение гидрофобного ядра.
Красным изображены центры гидрофобного
взаимодействия гемоглобина, синим – болееменее
полярная
периферия
молекулы.
Представлены различные срезы.
Периплазматический, как я узнал, делая этот практикум
- находящийся между внешней и внутренней мембраной
бактерии.
2
Также в процессе работы над практикумом я узнал, что
такой же ген содержится в бактерии Shigella sonnei
Ss046. Насколько я понял, последнее обозначение
отвечает за плазмиду.
3
Все аминокислотные остатки приведены в
англоязычном виде, так как это более привычно уже
после двух месяцев работы в Rasmol.
4
Получается, что по формальным признакам эта
аминокислота связывается с лигандом и по водному
мостику, и с помощью Ван-Дер-Ваальсового
взаимодействия. Мне лично такая ситуация кажется
очень маловероятной, т.е. я полагаю, что связывания по
водному мостику с этой аминокислотой нет. Но
множество Cont_Btuf_CNC в скрипте определяю именно
по формальным признакам связывания
5
Т.е. находится ближе чем в 3,5 Ǻ от атома витамина, с
которыи может связаться. Остальные подобные
множества определены аналогично.
1
Download