Компьютерный анализ и моделирование структурно

advertisement
Компьютерный анализ и моделирование структурнофункциональной организации белков (ИЦиГ СО РАН,
ИМ СО РАН, ИВМиМГ СО РАН, ИТФ СО РАН, МТЦ СО РАН)
В отчетный период были завершены работы по исследованию реакций
фотовозбужденных красителей с аминокислотами и белками в средах с ограниченной
подвижностью. Продолжались работы по исследованию пространственной структуры
биологических макромолекул методами магнитного резонанса, оптической спектроскопии и
компьютерной симуляции. Исследовались механизм и кинетика ренатурации белков.
Морозова О. Б., Центалович Ю. П., Юрковская А. В., Сагдеев Р. З.
(Международный томографический центр СО РАН)
Исследование пространственной структуры биологических
молекул с помощью «меток ХПЯ»
Для исследования кинетики и механизма формирования химической поляризации ядер
(ХПЯ) в фотореакциях ароматических красителей 2,2’-дипиридина и флавина мононуклеотида
с биологически важными молекулами, включая N-ацетилпроизводные трех аминокислот
(триптофана, тирозина, гистидина), дипептид триптофан-тирозин и куриный лизоцим в
нативном и денатурированном состояниях, были применены методы ХПЯ с временным
разрешением и лазерного импульсного фотолиза. На кинетику ХПЯ в дипептиде влияние
оказывает внутримолекулярный перенос электрона с остатка тирозина на радикал триптофана.
Особенности кинетики ХПЯ в присутствии внутримолекулярного переноса электрона изучены
для лизоцима в денатурированном состоянии. В нативном состоянии лизоцима
внутримолекулярный перенос электрона неэффективен.
Метод химической поляризации ядер
За последние десятилетия метод химической поляризации ядер (ХПЯ) [1] был успешно
использован для исследования биологически важных молекул. Явление ХПЯ состоит в том, что
скорость триплет-синглетной конверсии в радикальных парах зависит от проекции ядерных
спинов, имеющих сверхтонкое взаимодействие с электроном. Это приводит к созданию
неравновесной заселенности (усиленной абсорбции или эмиссии) ядерных спиновых состояний
в ЯМР-спектрах продуктов радикальных реакций.
Применение метода ХПЯ к изучению пространственной структуры белков основано на
облучении водных растворов белков в присутствии водорастворимых красителей с
последующей регистрацией сигналов ХПЯ, возникающих вследствие реакции возбужденной
молекулы красителя с аминокислотными остатками белка [2,3]. Только для трех из двадцати
аминокислот – триптофана, тирозина, гистидина - формируются значительные по величине
эффекты ХПЯ [2,4]. Поскольку краситель может реагировать только с остатками,
находящимися на поверхности белковой глобулы, этот метод можно применять к
исследованию пространственного строения биологических макромолекул [2,3], степени
доступности различных остатков и изменения этой доступности вследствие денатурации,
ренатурации [5] и других динамических процессов.
Однако не только доступность определяет наблюдающиеся интенсивности сигналов
ХПЯ. Среди факторов, влияющих на интенсивность ядерной поляризации – коэффициенты
усиления ХПЯ, константы скоростей реакций тушения, механизмы и константы скоростей
радикальных реакций, следующих за процессом тушения, скорости ядерной парамагнитной
релаксации. Поэтому применению метода ХПЯ к изучению биологических молекул должно
предшествовать детальное изучение механизмов формирования ХПЯ для индивидуальных
аминокислот.
61
5
CH2(CHOH)3CH2OPO3H2
6
4
3
H 3C
N
H 3C
N
N
N
O
N
NH
O
флавин мононуклеотид (FMN)
2,2'-дипиридин (DP)
CH3CONH
4
CH
COOH
CH3CONH
CH2
5
N
7
H 2N
CH
4
CH2
CO
2
N
7
2
H
NH
5
3
N
N
COOH
H
2
N-ацетилтирозин (TyrOH)
CH
CH
4
OH
N-ацетилтриптофан (TrpH)
6
CH3CONH
CH2
6
H
5
COOH
CH2
2
6
CH
N-ацетилгистидин (HisH)
COOH
CH2
6
2
5
3
OH
пептид триптофан-тирозин (TrpH-TyrOH)
Рис. 3-1. Структуры биологически важных молекул и красителей, использовавшихся в работе.
Тем не менее, даже детальное изучение фотохимии аминокислот и механизмов
формирования ХПЯ в реакциях с их участием недостаточно [6-8] для понимания поведения
протеинов. Взаимодействия между аминокислотными остатками в белке могут оказать
существенное
влияние
на
наблюдаемую
ядерную
поляризацию.
Например,
внутримолекулярный перенос электрона (ВПЭ) от тирозина к радикалу триптофана играет
важную роль в радикальных реакциях многих пептидов и протеинов [9-11] и может проявиться
в формировании эффектов ХПЯ.
Чтобы исследовать эту возможность, мы провели эксперименты по ХПЯ для
индивидуальных аминокислот, пептида триптофан-тирозин и куриного лизоцима. Лизоцим
изучался в широком диапазоне температур от комнатной (нативное состояние) до 80° С
(денатурированное состояние). В качестве фотосенсибилизатора нами было выбрано азаароматическое соединение 2,2’-дипиридин, имеющее ряд преимуществ по сравнению с
традиционно используемыми флавинами. Меньший размер молекулы дипиридина может
обеспечить лучший доступ к полуспрятанным аминокислотным остаткам; интермедиаты на
основе дипиридина имеют характерные полосы в
оптическом спектре и могут наблюдаться с
РЧ-импульс
лазер
помощью лазерного импульсного фотолиза; ХПЯ в
реакциях с дипиридином имеет большую
спад свободной
индукции
интенсивность, чем в реакциях с флавинами.
формирование
ХП
Я
Кроме того, для прямого сравнения результатов с
данными других авторов, в экспериментах с
импульсы
лизоцимом
использовался
также
флавин
преднасыщения
варьируемая задержка
J
мононуклеотид.
Результаты
исследований
показали, что существенные различия между
аминокислотами и дипептидом, а также межу
нативным и денатурированным состояниями белка
3-2.
Временная
диаграмма
определяются эффективностью реакции переноса Рис.
эксперимента по ХПЯ с временным
электрона между триптофаном и тирозином.
разрешением.
62
Экспериментальная часть
ХПЯ с временным разрешением. Образец, помещенный в стандартную ЯМР-ампулу,
облучался импульсами эксимерного лазера COMPEX Lambda Physik (длина волны 308 нм,
длительность импульса 15 нс) в датчике ЯМР-спектрометра DPX-200 Bruker. Использовалась
следующая импульсная последовательность (рис. 3-2): преднасыщение импульсами
широкополосного гомоядерного декаплера (для подавления темновых сигналов) – импульс
лазера – время эволюции t - детектирующий радиочастотный импульс. Длительность
последнего составляла 1 мкс в экспериментах с индивидуальными аминокислотами и 4 мкс в
экспериментах с лизоцимом.
Лазерный импульсный фотолиз. Раствор в прямоугольной кювете облучался
импульсами эксимерного лазера Lambda Physik EMG 101 (308 нм). Система детектирования
включает ксеноновую дуговую лампу ДКсШ-120, работающую в импульсном режиме, два
синхронно управляемых монохроматора, фотоумножитель Hamamatsu R955 и цифровой
осциллограф LeCroy 9310A с временным разрешением 10 нс.
Перед проведением экспериментов образцы барбатировались аргоном 5-15 мин.
Результаты и обсуждение
10
1x10
Trp
kq, M-1s-1
1x109
Tyr
1x108
1x107
His
1x106
0
2
4
6
8
10
12
14
pH
Рис. 3-3. Зависимость от рН константы скорости тушения триплетно-возбужденного 2,2’-дипиридина
N-ацетилпроизводными аминокислот.
Индивидуальные аминокислоты. Измерение поглощения промежуточных частиц с
целью определения механизма и констант скоростей тушения были проведены перед
экспериментами по ХПЯ. В диапазоне pH от 0 до 14 были измерены константы скорости
тушения триплетно-возбужденного дипиридина N-ацетилпроизводными триптофана, тирозина
и гистидина (рис. 3-3). Из полученных результатов можно вывести следующее эмпирическое
правило: реакция между фотовозбужденными триплетными красителями и аминокислотами
протекает через перенос электрона со скоростями, близкими к диффузионным (109 M-1с-1 и
выше), и через перенос атома водорода с гораздо меньшими скоростями (около 108 M-1с-1 и
ниже). Естественно, это правило нельзя применять автоматически, однако оно может служить в
качестве хорошего индикатора механизма реакции.
Механизмом фотохимической реакции между триплетно-возбужденным 2,2’дипиридином (TDPH+, pKa=5.7) и N-ацетилтриптофаном является перенос электрона во всем
диапазоне рН. В противоположность этому, механизм фотореакции дипиридина с Nацетилтирозином (TyrOH, pKa=10.1 для ОН-протона фенольного кольца) и Nацетилгистидином (HisH2+, pKa1=6.0 для протона, присоединенного к N3; HisH, pKa2=14.3 для
протона, присоединенного к N1) сильно зависит от рН раствора. В случае тирозина, перенос
электрона имеет место между TDPH+ и TyrOH и между TDP и TyrO-. Реакция между TDP и
TyrOH происходит через перенос атома водорода. В случае гистидина, механизмом тушения
является перенос атома водорода для реагирующих частиц TDP и HisH2+ и перенос электрона
для TDP и His-. Тушение TDPH+ дважды протонированным гистидином HisH2+ и TDP молекулой
HisH вообще не происходит. Результаты оптических измерений приводят к заключению о том,
63
что гистидин не может конкурировать за возбужденную молекулу красителя для
физиологических значений рН, и, следовательно, не проявится в спектре ХПЯ, даже находясь
на поверхности белковой молекулы.
Trp
Trp
Trp
Trp
0 ms
DP
DP
DP
DP
12 ms
смесь
TrpH + TyrOH
Tyr
8
7
пептид
TrpH-TyrOH
Tyr
8
7
@, м.д.
@, м.д.
Рис. 3-4. Ароматическая часть спектров ХПЯ, полученных при различных задержах после импульса
лазера для растворов, содержащих 2,2’-дипиридин и эквимолярную смесь N-ацетилпроизводных
триптофана и тирозина (левая часть); 2,2’-дипиридин и пептид триптофан-тирозин (правая часть),
рН=3.8.
На рис. 4 изображен ароматический участок спектров ХПЯ 1Н, полученных при
облучении раствора 2,2’-дипиридина, N-ацетилтриптофана и N-ацетилтирозина при рН=3.8 на
различных временах после лазерного импульса. Знаки ХПЯ соответствуют правилам Каптейна
[1], и в любой момент времени спектр смеси аминокислот являлся суперпозицией спектров
индивидуальных аминокислот.
Особенностью изучаемых систем является обратимость протекающих в них
фотохимических реакций, то есть продуктами гибели образовавшихся радикалов являются
исходные соединения, но с поляризованными ядерными спинами. Для таких фотореакций
характерны следующие закономерности формирования эффектов ХПЯ. Зависящая от ядерного
спина интеркомбинационная конверсия в исходной геминальной радикальной паре приводит к
образованию ХПЯ в геминальных продуктах. Радикалы, избежавшие геминальной
рекомбинации и вышедшие в объем, несут внеклеточную ядерную поляризацию. Внеклеточная
поляризация равна геминальной по величине, но противоположна по знаку в соответствии со
спин-сортирующим S-T0 механизмом формирования ХПЯ [1]. В результате гибели радикалов в
объеме внеклеточная поляризация накладывается на геминальную, что приводит к
компенсации ядерной поляризации. Тем не менее, компенсация будет неполной, если в
радикалах имеет место ядерная парамагнитная релаксация. Зависимость ХПЯ от времени
регулируется тремя основными процессами: (I) бимолекулярная гибель радикалов в объеме,
переносящая поляризацию от радикалов к диамагнитным продуктам; (II) реакции
вырожденного электронного обмена:
*
+
k
ex
RH Ÿ + RH ¾ ¾
¾
® *RH + RH+Ÿ,
(1)
где звездочкой обозначается ядерная поляризация. Кроме того, бимолекулярные
столкновения радикалов в объеме приводят к дополнительному формированию так называемой
“F-парной” поляризации [1], имеющей тот же знак, что и геминальная поляризация (III). Таким
образом, кинетика ХПЯ определяются скоростями переноса поляризации от радикалов к
продуктам и ядерной парамагнитной релаксации; стационарное значение ХПЯ зависит от
времени жизни и времени релаксации поляризованных радикалов. Важным отличием
механизма (I) от (II) заключается в том, что первый является реакцией второго порядка,
скорость которой определяется начальной концентрацией радикалов, тогда как вырожденный
обмен считается реакцией псевдо-первого порядка, поскольку концентрация радикалов обычно
много меньше концентрации исходного соединения.
64
Как правило, наиболее эффективная компенсация ХПЯ наблюдается, когда радикалы
вовлечены в вырожденный электронный обмен с исходными молекулами. Например, для рН
ниже 4.3, что соответствует величине рКа катион-радикала триптофана, вырожденный
электронный обмен в паре TrpH·+/TrpH приводит к быстрому спаду сигнала ХПЯ (рис. 5, левая
часть, l). В отсутствие электронного обмена типичная кинетика ХПЯ представляет собой
небольшой начальный рост (“F-парная” поляризация) и относительно медленный спад, как это
показано в левой части на рис. 5 для тирозина (H).
Рис. 3-5. Кинетика ХПЯ для различных протонов, полученная при облучении растворов, содержащих
2,2’-дипиридин и эквимолярную смесь N-ацетилпроизводных триптофана и тирозина (левая часть); 2,2’дипиридин и пептид триптофан-тирозин (правая часть), рН=3.8.
Кинетики ХПЯ моделировались с помощью системы дифференциальных уравнений в
соответствии с подходом, предложенным Фишером с соавторами [12]. Из анализа кинетики
ХПЯ были определены времена ядерной парамагнитной релаксации для радикалов дипиридина
и аминокислот, которые лежат в диапазоне от 16 мкс (протоны Н2, Н4 гистидина) до величины
более чем 200 мкс (b-СН2 протоны тирозина) [6-8]. Найденные значения коррелируют с
величинами анизотропии сверхтонкого взаимодействия в соответствующих радикалах.
Пептид триптофан-тирозин. Знание механизмов и констант скоростей реакций
индивидуальных аминокислот является принципиально важным для интерпретации данных по
ХПЯ, полученных для больших макромолекул. Тем не менее, данные, полученные в
экспериментах с индивидуальными аминокислотами, являются недостаточными для полного
описания формирования ХПЯ в макромолекулах. Внутримолекулярные реакции между
фотохимически окисленными аминокислотными остатками в белке и остатками, находящимися
в основном состоянии, могут оказать серьезное влияние на формирование ХПЯ. Среди
подобных реакций наиболее существенную роль может играть внутримолекулярный перенос
электрона (ВПЭ) от остатка тирозина к индольному радикалу триптофана. Поскольку реакция
ВПЭ меняет концентрации тирозильных и триптофанильных радикалов в белке, она должна
оказывать влияние на формирование ХПЯ как на протонах триптофана, так и тирозина. Ранее
ВПЭ изучался в ряде пептидов и белков методом импульсного радиолиза [9-11].
Нами был выбран пептид триптофан-тирозин для изучения особенностей формирования
ХПЯ в обратимых фотохимических реакциях, осложненных реакцией внутримолекулярного
переноса электрона:
TrpH ·+-TyrOH
ke
¾¾®
TrpH -TyrO ·
- H+
65
(2)
Спектры ХПЯ, полученные в тех же экспериментальных условиях, что и для смеси
аминокислот, показаны в правой части на рис. 3-4.
Для протонов триптофана имеет место быстрая компенсация ХПЯ, как и для
индивидуального триптофана. Однако в этом случае быстрый спад (рис. 3-5, правая часть, l)
определяется переносом поляризации противоположного знака из радикалов триптофана не в
результате вырожденного электронного обмена, а в результате внутримолекулярного переноса
электрона с остатка тирозина. Радикалы тирозина, образовавшиеся в результате ВПЭ, приводят
к 50 % росту “F-парной” поляризации на временном интервале от 0 до 6 мкс (рис. 3-5, правая
часть, H). Наиболее сложная кинетика ХПЯ наблюдается для протонов DP: поляризация
меняет знак с эмиссии на усиленную абсорбцию (рис. 3-5, правая часть, o). Для протонов
дипиридина отрицательная ХПЯ формируется в радикальной паре с триптофаном, и
положительная – в радикальной паре с тирозином, что определяется магниторезонансными
параметрами соответствующих радикалов. Начальная отрицательная поляризация отражает
преобладание радикалов триптофана над радикалами тирозина, сформированными в результате
тушения триплетно-возбужденного дипиридина. Смена знака ХПЯ на усиленную абсорбцию
отслеживает реакцию ВПЭ с остатка тирозина на радикал триптофана в пептиде. В
эксперименте со смесью индивидуальных аминокислот поляризация дипиридина остается
эмиссионной (рис. 3-5, левая часть, o). Таким образом, кинетическое поведение ХПЯ
красителя очень чувствительно к реакциям аминокислотных радикалов. Моделирование
кинетики ХПЯ с помощью системы дифференциальных уравнений позволило сделать оценку
константы скорости реакции ВПЭ, которая составила 5´105 с-1 при рН=3.8. Полученные
результаты доказывают важность реакции ВПЭ между триптофаном и тирозином для
формирования ХПЯ в пептиде, в то время как для смеси аминокислот эта реакция не играет
существенной роли.
Куриный лизоцим. Для исследования эффектов ХПЯ в лизоциме были использованы
два красителя, 2,2’-дипиридин и флавин мононуклеотид (FMN).
На рисунке 3-6 показана температурная зависимость спектров ХПЯ, полученных при
облучении водного раствора лизоцима с FMN при двух задержках между импульсом лазера и
детектирующим импульсом: геминальная ХПЯ регистрировалась при нулевой задержке (0,
левая колонка), в то время как спектр стационарной ХПЯ записывался при задержке 1000 мкс
(справа).
В полном соответствии с нашими ожиданиями, спектры, полученные при задержке
1000 мкс, очень похожи на спектры, полученные Броадхурстом с соавторами при помощи
стационарной ХПЯ [2]. Спектр ХПЯ нативного состояния лизоцима содержит абсорбционные
сигналы протонов H4 и H2,6 и эмиссионные сигналы от b-CH2 протонов Trp 62 и Trp 123.
Сигналы ХПЯ флавина соответствуют усиленной абсорбции (CH3-группа) и эмиссии
(ароматические протоны). При повышении температуры наблюдается рост сигнала тирозина и
уменьшение интенсивности ХПЯ на триптофане. В работе [2] этот эффект объяснен
понижением реакционной способности остатков триптофана по отношению к триплетновозбужденному красителю вследствие образования гидрофобных кластеров.
В то же время в спектрах, полученных сразу после лазерного импульса, изменения
сигналов триптофана гораздо менее выражены. Поляризация триптофана немного
увеличивается при изменении температуры от 30 до 40 °C, практически не меняется вплоть до
60°C, и уменьшается до приблизительно 70% от максимального значения при 80°C. Начальный
рост поляризации обусловлен ускорением реакции тушения с температурой, в то время как
небольшое уменьшение интенсивности ХПЯ при высоких температурах объясняется
конкуренцией между остатками триптофана и тирозина за молекулы фотовозбужденного
красителя. Это первое наблюдение геминальной поляризации лизоцима опровергает
предположения о низкой реакционной способности триптофана в денатурированном белке [2].
Полученная температурная зависимость для геминальной ХПЯ на триптофане однозначно
свидетельствует, что разрушение третичной структуры лизоцима не приводит к изменению
реакционной способности триптофановых остатков. Спектр ХПЯ, полученный для нативного
лизоцима с дипиридином, содержит дополнительный эмиссионный сигнал от Tyr 23 и
абсорбционный сигнал от Trp 63, расположенных в активном центре белка.
66
Сигнал Trp 63 исчезает при
t=0
t=1000 мкс
добавлении в раствор избытка Nацетилглюкозамина, который образует
комплекс
с
молекулами
лизоцима.
Наблюдаемые дополнительные сигналы
свидетельствуют о том, что дипиридин
благодаря своим меньшим размерам имеет
лучший
доступ
к
полуспрятанным
аминокислотным остаткам.
Для того, чтобы исследовать
механизмы
формирования
ХПЯ
в
лизоциме, приводящие к значительным
изменениям в стационарных спектрах и
существенному уменьшению P(1000)/P(0)
для
триптофана,
мы
предприняли
кинетические измерения при комнатной
температуре и при 80 °C, т.е. для нативного
и денатурированного состояний лизоцима с
использованием обоих красителей, DP и
FMN. В нативном состоянии зависимость
сигнала триптофана от времени не ярко
выражена. На рисунке 3-7 (левая часть)
показана кинетика сигналов ХПЯ при
реакции с DP. Видно, что компенсация
геминальной поляризации внеклеточными
реакциями несущественна для нативного
состояния
лизоцима.
Знак
ядерной
поляризации дипиридина при этом остается
отрицательным.
Совершенно
другая
картина
d, м.д.
d, м.д.
наблюдается
для
денатурированного
Рис. 3-6. Температурная зависимость спектров
состояния. Сигналы ХПЯ демонстрируют
ХПЯ, полученных при облучении раствора FMN с
существенную временную зависимость, как куриным лизоцимом (0.7 мМ). Задержка между
показано на рисунках 3-7 (правая часть) и лазерным импульсом и детектированием 0 (слева) и
3-8 для реакций с DP и FMN, 1000 мкс (справа); pH=3.8.
соответственно. Было установлено, что
скорость спада сигнала триптофана не зависит от концентрации белка и от типа используемого
красителя, и, следовательно, определяется особенностями самого денатурированного белка.
Тип используемого красителя влияет лишь на относительные интенсивности сигналов ХПЯ
триптофана и тирозина. Сравнение кинетик ХПЯ для реакций пептида триптофан-тирозин и
денатурированного лизоцима с DP свидетельствует, что основные особенности формирования
ХПЯ в присутствии ВПЭ наблюдаются как для дипептида, так и для лизоцима.
Быстрый спад ХПЯ на триптофане сопровождается ростом эмиссионной поляризации
на тирозине, а поляризация DP меняет свой знак. Единственным существенным отличием
является то, что изменения в протеине происходят медленнее, чем в пептиде. Наблюдаемые
эффекты являются веским основанием для вывода, что ВПЭ играет решающую роль в
формировании эффектов ХПЯ в денатурированном белке. Из полученных кинетик можно
сделать грубую оценку константы скорости реакции внутримолекулярного переноса электрона
в денатурированном лизоциме: ke £ 1.5´10-5 с-1.
67
Рис. 3-7. Кинетика ХПЯ для протонов дипиридина (o) и аминокислотных остатков триптофана (l) и
тирозина (H) для лизоцима в нативном (слева) и денатурированном состояниях (справа), рН=3.8.
Похожее кинетическое поведение было обнаружено для химически денатурированного
лизоцима при 50o C с добавлением 10 M дейтерированной мочевины, хотя в этом случае
эффективность ВПЭ была несколько ниже, чем при термической денатурации. Следовательно,
влияние ВПЭ на ХПЯ, приводящее к уменьшению сигнала триптофана и увеличению сигнала
тирозина, является общей особенностью денатурированного состояния лизоцима вне
зависимости от пути его формирования. Наблюдаемые спектры ХПЯ являются результатом
динамических процессов, протекающих в фотохимически окисленном белке, и не являются
прямым отражением стерической доступности различных остатков, а также не
свидетельствуют о пониженной реакционной способности триптофана по отношению к
триплетному красителю.
Заключение
Таким
образом,
наши
кинетические
измерения показали, что ХПЯ в протеинах зависит
не только от доступности аминокислотных остатков
и механизма фотохимической реакции, но и от
динамических
особенностей
промежуточных
интермедиатов
и
эффективности
внутримолекулярных реакций в белках. Было
продемонстрировано, что ВПЭ играет важную роль
в денатурированном состоянии лизоцима, и
несущественен в нативном состоянии. Этот факт
должен тщательно учитываться при интерпретации
данных по ХПЯ, полученных стационарными
методами. Из полученных результатов можно
сделать два важных вывода: 1) для анализа
доступности аминокислотных остатков в белках
нужно рассматривать только геминальную ядерную
поляризацию; 2) при исследовании методом ХПЯ
динамических процессов в белках и ренатурации
белка необходимо использовать времяразрешенный
метод.
68
Рис. 3-8. Кинетика ХПЯ для остатков
триптофана
(l)
и
тирозина
(H)
денатурированного лизоцима, полученная
при использовании FMN, рН=3.8.
Литература по разделу:
1. А. Л. Бучаченко, Р. З. Сагдеев и К. М. Салихов "Магнитные и спиновые эффекты в
химических реакциях", Наука, Москва, 1978.
2. P. J. Hore and R. W. Broadhurst, Prog. NMR Spectrosc., 25 (1993), 345-402.
3. R. Kaptein, R., 1978, In “NMR Spectroscopy in Molecular Biology”, B. Pullman, Ed. (Reidel:
Dordrecht,), 211-229.
4. S. Stob, and R. Kaptein, Photochem. Photobiol., 49 (1989), 565-577.
5. R. W. Broadhurst, C. M. Dobson, P. J. Hore, S. E. Radford, M. L. Rees, Biochemistry 30 (1991),
405-412.
6. Yu. P. Tsentalovich, O. B. Morozova, A. V. Yurkovskaya, and P. J. Hore, J. Phys. Chem. A 103
(1999), 5362-5368.
7. Yu. P. Tsentalovich, O. B. Morozova, J. Photochem. Photobiology, A: Chemistry, 131 (2000), 3340.
8. Yu. P. Tsentalovich, O. B. Morozova, A. V. Yurkovskaya, P. J. Hore, and R. Z. Sagdeev, J. Phys.
Chem. A 104 (2000), 6912-6916.
9. J. Butler, E. J. Land, W. A. Pruetz, and A. J. Swallow, J. Chem. Soc., Chem. Commun. (1986) 348349.
10. M. Faraggi, M. R. DeFelippis, and M. H. Klapper, J. Am. Chem. Soc. 111 (1989), 5141-5145.
11. K. Bobrowski, J. Poznanski, J. Holcman, and K. L. Wierzchowski, J. Phys. Chem B (1999), 103,
10316-10324.
12. J.-K. Vollenweider, H. Fischer, J. Hennig, and R. Leuschner, Chem. Phys., 97 (1985), 217-234.
Чекмарев С.Ф. (ИТФ СО РАН)
Исследование кинетики олигопептидов на атомном уровне
разрешения
Решаемая задача – моделирование кинетики укладки белков на основе
комбинированного описания с различными масштабами детализации – атомном,
аминокислотном, доменном; сравнение с данными экспериментов по распределению
реакционных химических групп на поверхности.
Биологические молекулы обладают астрономически большим числом конформеров, оно растет экспоненциально с числом атомов в системе. Поэтому для исследования кинетики
укладки белков на атомном уровне разрешения необходим эффективный метод систематизации
информации, получаемой при компьютерном моделировании методами молекулярной
динамики (МД) и/или Монте-Карло (МК). В последние годы были предприняты
многочисленные попытки разработать такой метод. Наиболее удачной из них является
графическое представление поверхности потенциальной энергии (ППЭ) системы в виде графа
связности, предложенное Беккером и Карплусом (в дальнейшем - ГСПЭ) [1]. Такой граф имеет
вид перевернутого дерева и показывает, какие конформеры соединены между собой путями,
лежащими ниже текущего уровня потенциальной энергии. ГСПЭ был использован нами в 2000
году для представления результатов моделирования аланин-тетрапептида в водном растворе
[2]. В частности, было показано, что ППЭ аланин-тетрапептида состоит из 16 супербассейнов,
которые разделены высокими барьерами (примерно в 15 Ккал/моль) и содержат конформеры,
обладающие одной и той же последовательностью транс/цис-конфигураций пептидных групп.
Существенным недостатком ГСПЭ является то что, он не отражает равновесные
заселенности конформеров и кинетику. Например, нами было обнаружено [3-4], что из двух
вторичных структур в аланин-тетрапептиде – альфа-спирали и бета-листа - термодинамически
более стабильной оказывается не альфа-спираль, представляющая собой основное состояние
данного олигопептида, а бета-лист, энергия которого на 0.78 Ккал/моль выше. Причина такого
дисбаланса в том, что бета-лист обладает большей конформационной энтропией.
Термодинамическая стабильность конформеров определяется их свободной энергией;
соответственно вместо ППЭ целесообразно рассматривать поверхности свободной энергии
(ПСЭ). Такой подход активно применяется при исследовании укладки белков [5]. При этом, для
получения глобальной картины процесса в обозримом виде используется сокращенное
69
описание конформаций, - обычно в терминах радиуса гирации и числа нативных контактов.
Свободная энергия вычисляется через вероятность обнаружить систему в определенном
конформационном состоянии, которая, в свою очередь, находится путем моделирования
методами МД или МК. Это дает возможность построить поверхность "свободная энергия –
радиус гирации – число нативных контактов", которая, предположительно, определяет
кинетику укладки белка при ходе из денатурированного состояния. При этом локальные
повышения свободной энергии на пути укладки рассматриваются как барьеры, которые
система должна преодолевать или обходить. Такие представления, однако, пригодны только
для систем с простыми путями укладки, где не возникает метастабильных областей со сложным
рельефом. В противном случае, как, например, для фрагмента B стафилококкового протеина A
или сегмента B1 стрептококового протеина [5], информация, которую дает ПСЭ, недостаточна;
здесь требуется знание детальной кинетики в метастабильной области.
Такую информацию о кинетике можно получить из графов связности в терминах
свободной энергии (ГССЭ), которые были разработаны нами в отчетном 2001 году. Основная
проблема заключалась в введении свободной энергии седла, которая необходима для
построения ГССЭ. В отличии от конформера, седловая структура не является устойчивым
образованием, поэтому стандартное определение свободной энергии к ней не применимо.
Однако, используя формализм ранней теории переходного состояния [6], можно ввести понятие
"кинетической" свободной энергии седла, в основе которого лежит дополнение статистической
суммы переходного комплекса числом изображающих точек, пересекающих седло за
определенное время J . Тем самым, восполняется недостающая степень свободы в переходном
комплексе, и он становится консистентным конформеру. Высота "кинетического" барьера по
отношению к примыкающему конформеру однозначно выражается через скорость перехода
через барьер и время J, причем по мере увеличения J высота барьера уменьшается.
Соответственно, ГССЭ с течением времени деформируется. Детальное тестирование на
модельной системе показало, что исчезновение "кинетических барьеров внутри группы
структур свидетельствует об установлении локального равновесия в ней. Поэтому серия ГССЭ
для увеличивающихся J наглядно демонстрирует, как поэтапно устанавливается равновесие в
системе – сначала внутри определенных групп конформеров, затем - между этими группами, и
наконец – во всей системе. Предложенный подход применен для описания кинетики ряда
олигопептидов (аланиновых ди-, тетра- и гексопептида). Выявлено, в частности, что
установление равновесия в этих системах при комнатной температуре требует порядка 0.1
мксек. Моделирование, в том числе – расчет скоростей переходов между конформерами,
осуществлялось в среде пакета CHARMM [7] с помощью разработанной нами техники
последовательного запирания [2 – 4, 8]. Работа готовится к публикации.
В 2002 году планируется применить разработанный подход к исследованию ряда
белков, характеризующихся наличием метастабильных областей на ПСЭ. Предполагается
использовать одну из "минималистических" моделей, описывающих белок на аминокислотном
уровне, что позволит исследовать системы, представляющие практический интерес.
Параллельно проводилась работа по моделированию олигопептидов в растворе при
задании раствора в явном виде. Основное внимание было направлено на поиск эффективного
метода идентификации конформеров применительно к данным условиям. Попытки
модифицировать стандартную процедуру, основанную на "закалке" конформеров, которая
успешно работает при задании раствора в неявном виде, не достигли желаемого результата.
Работа в этом направлении продолжается.
[1] O. M. Becker and M. Karplus, J. Chem. Phys. 106 (1997) 1495.
[2]* С. В. Кривов, С. Ф. Чекмарев, М. Карплус. Ж. структ. хим. 42 (2001) 1049.
[3] S. V. Krivov, S. F. Chekmarev and M. Karplus, Phys. Rev. Lett. (в печати).
[4] S. F. Chekmarev, In: "Atomic Clusters and Nanoparticles", Lectures at the Les Houches
Summer School, Session No. LXXIII (Springer-Verlag and EDP Sciences, Les Ulis), (в печати).
[5] J.-E. Shea and C. L. Brooks III, Annu. Rev. Phys. Chem. 52 (2001) 499.
[6] Г. Эйринг, С. Г. Лин, С. М. Лин, Основы химической кинетики (Мир, М.) 1983.
[7] B. R. Brooks, R. E. Bruccoleri, B. D. Olafson, D. J. States, S. Swaminathan, and M.
Karplus, J. Comp. Chem. 4 (1983) 187.
[8] S. F. Chekmarev, Phys. Rev. E 64 (2001) 036703.
70
Загоруйко Н.Г., Кутненко О.А. (ИМ СО РАН)
Исследование структурно-функциональной организации
белков. Распознавание наличия, длины и места локализации
сайта разрезания протеинов
Исследована задача распознавания сайта разрезания белка по его аминокислотной
последовательности.
Каждая аминокислота описывалась своим набором из 444 физико-химических свойств,
так что каждому элементу алфавита сопоставлен 444-мерный вектор свойств.
Обучающая выборка представлена двумя наборами протеинов. Первый набор
(Positiv.seq) содержит 506 протеинов, содержащих сайт разрезания. Длина этих протеинов от 37
до 69 символов, место положения сайта разрезания указано. Сайт разрезания
предположительно локализован на участке длиной L до 40 символов. Второй набор
(Negative.seq) включает 923 протеина, не содержащих сайтов разрезания. Длина этих протеинов
находится в пределах от 80 до 5200 символов. Задача состоит в том, чтобы на имеющихся
данных обучить программу распознавать наличие сайта разрезания, указывать место его
локализации и определять длину этого сайта.
Предварительный анализ убедительно показал, что решить поставленную задачу,
используя только символьное описание протеинов, невозможно. Нужно использовать описание
в терминах физико-химических свойств аминокислот.
Формирование обучающей выборки. На первом этапе была исследована
информативность 10 характеристик, полученных путем преобразования исходных свойств
аминокислот (набор свойств Kidera). Каждый из двух наборов протеинов был представлен
выборкой по 506 последовательностей. Предполагаемая длина сайта разрезания L выбиралась
равной от 6 до 36 символов.
При формировании обучающей выборки первого образа (образ "Да") окно длиной L
символов размещалось на протеиновой цепочке так, чтобы центр сайта разрезания совпадал с
центром окна. Набор из L символов, попавших в это окно, принимался в качестве описания
сайта разрезания. Каждому такому символу соответствует вектор 10 свойств Кидера, так что
набору символов в окне соответствует вектор размерностью в L*10. В итоге обучающая
выборка для первого образа "Да" представляет собой таблицу размерностью в 506 строк
(объектов) и L*10 столбцов (признаков).
Образ "Нет" был представлен цепочками из L аминокислот, попавших в окно на
случайно выбранном участке каждого из 506 протеинов, не содержащих сайта разрезания. В
результате был сформирован массив данных из представителей двух образов (по 506
реализаций каждого образа) в виде таблицы, размером в 1012 строк и *L*10 столбцов.
Выбор решающего правила. Распознавание проводилось методом скользящего
экзамена. По очереди из выборки удалялось по одному объекту, обучение проводилось на
оставшихся 1011 объектах, а изъятый объект предъявлялся для контрольного распознавания.
После повторения таких процедур 1012 раз можно было определить количество правильно
распознанных объектов первого и второго образов.
В качестве решающего правила использовалось правило "k ближайших соседей". По
этому правилу решение в пользу первого образа принимается в том случае, если k ближайших
соседей распознаваемого объекта принадлежат этому образу. И, соответственно, наоборот.
Сравнивались решения при разных значениях параметра k - от 1 до 500. Было обнаружено, что
с ростом k меняется как общее количество ошибок (Р), так и соотношение между ошибками
первого рода (Р1, пропуск сайта) и ошибками второго рода (Р2, ложная тревога). При
увеличении k от 1 до 50 растет общее количество ошибок и количество ложных тревог, но
уменьшается число пропущенных сайтов разрезания, что особенно важно. Решение о том, на
каком количестве k нужно остановиться зависит от соотношения стоимости этих ошибок. Если
потери, связанные с пропуском сайта, стоят больше, чем потери, вызываемые ложной тревогой,
то следует выбирать малые значения k.
Выбор длины окна. Предварительные эксперименты показали, что с ростом длины
окна L надежность распознавания образов "Да" и "Нет" увеличивается. Но из-за того, что сайт
71
разрезания может располагаться в начале или в конце протеина, уменьшается число
протеинов, на которых можно увидеть сайт разрезания в средней точке окна. Такие
"несимметричные" сайты на данном этапе не рассматривались, так что количество изучаемых
протеинов в выборке с ростом L сокращается. В итоге была выбрана предельная длина сайта в
18 символов, и для этой длины проводились дальнейшие исследования.
Проверка гипотезы "нечетности". Эта гипотеза опирается на геометрические
представления о пространственной форме протеинов и утверждает, что соседние аминокислоты
занимают в пространстве противоположную ориентацию. Аминокислоты, следующие друг за
другом через один символ, имеют одинаковую ориентацию и могут совместно участвовать в
определенных биохимических процессах. Следовательно, при фиксированном положении окна
и фиксированной нумерации символов в окне интересующая нас функция разрезания может
по-разному проявляться на четных и нечетных подпоследовательностях аминокислот.
Символы в окне нумеровались слева направо, начиная с номера 0 и до 17. Центр
последовательности из 18 символов совмещался с 8-м символом.
В ходе экспериментов
изучалась гипотеза "нечетности", т.е. зависимость результата от того, какие из 18 символов,
попавших в окно анализа, используются для распознавания. Исследовалось три варианта: 1) все
18 символов; 2) только 9 символов с четными номерами (0, 2,…, 16); только 9 символов с
нечетными номерами (1, 3,…17). Сравнение этих наборов на обучающей выборке показало,
что они не равноценны (см. Таблицу 3.1.)
Таблица 3.1.
Набор символов
18
9 четных
9 нечетных
Надежность
83,8
80,4
85,4
В дальнейшем при анализе длинных последовательностей окно анализа смещалось
слева направо на одну позицию, и для анализа всегда использовались элементы с нечетными
номерами (1, 3, …, 17).
Выбор признаков. При длине сайта L=18 из 10 признаков набора Kidera методом
полного перебора было выбрано наиболее информативное их подмножество. В нем оказалось 7
признаков. Исключены, как наименее существенные, признаки с номерами 3, 5 и 10. Качество
распознавания при дальнейшем уменьшении или увеличении числа признаков снижалось.
Надежность распознавания обучающей выборки двух образов ("Да", "Нет") по этим признакам
в режиме скользящего экзамена была равна 87,6 %.
Использование пространства 444 свойств аминокислот. На предыдущем этапе было
обнаружено, что результаты анализа зависят от того, как сформирована обучающая выборка
образа "Нет" (из-за ограниченности обучающего материала для образа "Да" обучающая
выборка этого образа была одной и той же). Было решено исследовать устойчивость
получаемых результатов по отношению к этому фактору. Кроме того, предпринята попытка
выбрать информативный набор признаков непосредственно из большого числа исходных
характеристик аминокислот. Таких характеристик оказалось 444. Предварительно значения
всех характеристик нормировались по их дисперсиям.
Из имеющихся в распоряжении данных было сформировано 7 обучающих выборок,
состоящих из одного и того же набора в 253 элемента образа "Да" и семи разных наборов по
253 элементов образа "Нет". Окно имело длину L=18 символов. На этих данных программа
обучалась. Для контрольного распознавания использовались данные, не участвовавшие в
обучении.
Выбор признаков. Для каждой из семи выборок решалась задача поиска наиболее
информативного подмножества признаков из исходного множества 444 признаков и 10
признаков набора Kidera (т.е. из 454 признаков). Для этого использовался алгоритм AddEl[1],
который сочетает в себе идеи
метода "последовательного добавления" (Add) и
"последовательного удаления" (El). В начале информативность всех признаков оценивается по
отдельности и выбирается самый информативный признак. Затем к нему по очереди
подбирается такой второй признак, сочетание с которым оказывается наиболее
72
информативным. Процесс добавления повторяется MAdd раз. Затем каждый из отобранных
признаков по очереди удаляется из этого набора и определяется такой признак, удаление
которого в наименьшей степени уменьшало качество выбранной подсистемы. Таким способом
за MEl шагов (MEl<MAdd) удаляется MEl признаков. После этого процессы добавления и
удаления повторяются. В данных экспериментах использовалась тактика "три шага вперед,
один шаг назад" (MAdd=3, Mel=1).
При увеличении числа признаков качество распознавания в начале растет, затем рост
прекращается, и затем начинает снижаться. Показано, что наилучшие результаты получаются
при сравнительно небольшом числе признаков - от 7 до 30.
В состав семи наборов вошло 92 признака из 454. Признаки набора Kidera не показали
своих преимуществ - всего один из них попал в один набор. Некоторые признаки вошли в два
и более наборов. В два набора вошли признаки MAKH900106, OOBM77104,
QIAN880113,DESM9001102, FAUJ880101, JANJ780103, JUNJ780101. В три набора вошел
признак CHOC760104, а признак CHAM830104 вошел в четыре набора из семи.
Распознавание контрольной последовательности. На контроль предъявлялись
последовательности, полученные из протеинов, не участвовавших в обучении. Окно длиной в
18 символов двигалось вдоль протеина слева направо со сдвигом в один символ. Таким
способом было выделено 8940 участков из 252 контрольных протеинов, содержавших сайты
разрезания. Протеинов без сайтов разрезания, не участвовавших в обучении, было гораздо
больше, вследствие чего контрольных участков длины 18 символов для образа "Нет" было
выделено 287262. На каждой позиции окна принималось решение о том, есть здесь сайт
разрезания или его нет. Распознавание этих двух образов проводилось по 7 указанным выше
наборам признаков параллельно. Решение в пользу первого или второго образов принималось
по большинству из 7 голосов. Точность распознавания можно оценивать долей голосов,
поданных за принятие общего решения. При этом были получены следующие результаты.
Из 8940 участков, взятых из протеинов с сайтами разрезания, к образу "Да" было
отнесено 3249 участков. Если выделить 252 участка (по одному из каждого протеина), для
которых центр окна совпадал с центром сайта разрезания, то на них правильный результат "Да"
был получен в 213 случаях. Решение "Да" для других участков этой группы протеинов может
говорить как об ошибках распознавания, так и о "размазанности" функции сайта разрезания
вдоль этих протеинов. На этом основании было принято решение оценивать правильность
распознавания образа "Да" только по результатам распознавания 252 участков, заведомо
содержавших сайт разрезания. Эта надежность оказалась равной 84,52 %.
Из 287262 контрольных участков для протеинов без сайтов разрезания 228903 участков
было правильно отнесено к образу "Нет", на остальных был получен ответ "Да". В итоге
надежность распознавания образа "Нет" равна 79,68 %.
Следовательно, при описанных условиях можно считать, что сайты разрезания
правильно обнаруживаются и локализуются в 84,52 % случаев. В 15,48 % происходят ошибки
первого рода ("пропуск цели") и в 20,32 % происходят ошибки второго рода - сайт
обнаруживается там, где его нет ("ложная тревога").
Функция принадлежности. Если считать, что в реальных условиях интерес
представляет задача обнаружения и локализации сайта разрезания на неисследованном
протеине, то было бы желательно иметь не только решение "Да" ("Нет"), но и оценку
вероятности наличия сайта разрезания в каждом окне наблюдения или функцию
принадлежности данного окна к образу "Да" ("Нет"). Такую оценку можно получить с
помощью видоизмененного правила "k ближайших соседей". Для каждого контрольного
объекта "y" найдем двух ближайших соседей - по одному из каждого образа. Пусть расстояние
до соседа "a" из первого образа равно r1, а до соседа "b" из второго образа - r2. Сумма этих
расстояний равна R= r1+r2. Величину
f = 1 - 2*r1/R
будем считать функцией
принадлежности объекта "у" к первому образу. Значения функции принадлежности меняются
в пределах от +1 до -1: равны +1, когда объект "у" совпадает с объектом "а", равны 0, когда "у"
находится на равном расстоянии от своих соседей, и равны -1, когда "у" совпадает с "b".
Коллективные решения. Если для данного контрольного объекта такие функции
получены при нескольких наборах признаков (коллективом решателей), то общее значение
функции принадлежности F можно получить путем простого усреднения таких частных
73
решений: F = {f1+f2+…+f7}/7. Решение о принадлежности к первому образу принимается,
если средняя оценка F >=0, и ко второму, если F<0.
Локализация сайта разрезания. На рис. 3.8. приведены графики средних значений
функции принадлежности окна к образу "Да" для всех 252 контрольных протеинов из набора
протеинов, содержащих этот сайт. Протеины совмещены друг с другом по точке локализации
сайта (вертикальная линия). На рис. 3.9. - то же для 252 случайно выбранных протеинов без
сайтов разрезания.
Рис. 3.8. Средние значения функции принадлежности для 252 протеинов, содержащих сайт
разрезания.
Рис. 3.9. Средние значения функции принадлежности для 252 протеинов, не содержащих сайта
разрезания.
Из рисунков видно, что сайт разрезания в среднем хорошо обнаруживается и
локализуется на аминокислотной последовательности. Если потребуется
уменьшить
количество пропущенных сайтов, то можно снизить пороговое значение функции F, при
которой принимается решение в пользу образа "Да" (опустить среднюю горизонтальную
линию на рисунках). Количество обнаруженных сайтов увеличится, но при этом вырастет и
количество ложных тревог.
Описанные результаты позволяют рассчитывать на то, что с помощью данной методики
можно получить высокую надежность обнаружения и локализации сайтов разрезания.
Необходимо провести анализ особенностей поведения функции принадлежности в районе
сайта разрезания и на удаленных от него участках. Требуется более тщательно исследовать на
материале большего объема зависимость результатов от длины окна наблюдения.
Литература:
[1] Н.Г. Загоруйко. Прикладные методы Анализа Данных и Знаний. Новосибирск, издво ИМ, 1999. - 270 стр.
[2] В.Н. Ёлкина, Н.Г. Загоруйко. Блок Анализа Данных в Экспертной Системе ЭКСНА.
Выч. системы, № 144, Новосибирск, 1991 г. – стр. 54 – 175, № 145, Новосибирск, 1992 г. – стр.
3 – 28.
[3] Н.Г. Загоруйко, В.Н. Ёлкина, Г.С. Лбов. Алгоритмы обнаружения эмпирических
закономерностей. Новосибирск, Наука, 1985. – стр. 103 – 105.
[4] Н.Г. Загоруйко, В.Н. Ёлкина, С.В. Емельянов, Г.С. Лбов. ППП ОТЭКС (для анализа
данных). М., Финансы и Статистика, 1986. – стр. 18 – 25.
74
Иванисенко В.А., Николаев С.В. (ИЦиГ СО РАН),
Дебелов В.А. (ИВМиМГ СО РАН)
Оптимальное совмещение пространственных структур белков
Задача сравнения пространственных структур белков является одной из
основополагающих задач анализа структуры и функции биополимеров. Структурное
выравнивание белков применяется в решении широкого круга задач - от предсказания функции
белков до предсказания их пространственной структуры.
Разработана программа оптимального совмещения пространственных структур белков
по заданным атомам. Алгоритм минимизации функционала качества основан на методе
градиентного спуска. Функционал качества задается среднеквадратичным отклонением
координат С-альфа атомов одного белка от другого. На рис. 3.10 представлен результат работы
программы - совмещенные третичные структуры двух белков.
В дальнейшем планируется использовать данный алгоритм для исследования
инвариантных форм локальной упаковки белков. В настоящее время разрабатывается
программа структурного выравнивания белков, позволяющая оптимально совмещать
третичные структуры белков, когда заранее не известно какие атомы должны быть совмещены,
в которую данный алгоритм входит в качестве одного из модулей.
Рис. 3.10. Оптимальное совмещение молекулы гемоглобина с миоглобином. Са цепь гемоглобина
отрисована синим цветом, миоглобина - красным.
75
Download