Гидрофобный эффект (наивное объяснение) • Межмолекулярный уровень Неполярные молекулы в полярном растворителе (воде) стремятся агрегировать так, чтобы минимизировать поверхность контакта с растворителем Неполярные молекулы (green) в полярном растворителе (orange) Гидрофобный эффект в белках (и других макромолекулах) • Внутримолекулярный уровень Неполярные атомные группы (CH3 и др.) белка стремяться собраться внутри молекулы чтобы минимизировать контакт с полярными группами и полярным растворителем (водой) 4Ǻ срез структуры белка Green balls = non-polar groups Red = oxygens Blue = nitrogens White = carbons bonded with oxygens or nitrogens Hydrogen atoms not shown Гидрофобный эффект в белках • Т.н. гиброфобное ядро дает существенный вклад в стабильность глобулы многих белков • Гидрофобный эффект важен для белокбелкового взаимодествия, взаимодействия белок-ДНК и других межмолекулярных взаимодействий Как измерять гидрофобный эффект in silico? Для межмолекулярного взаимодействия Расчет площади поверхности, скрытой при взаимодействии (ASA) отражает вклад гидрофобного эффекта ASA – это только число ( Å2), нет описания деталей! Симуляция молекулярной динамики, конечно, отражает гидрофобный эффект! Но не локализует его! Подходы к локализации гидрофобного эффекта в белка и межмакромолекулярных взаимодействиях • • • • • • • Kannan & Vishveshwara, 1999 Tsai & Nussinov, 1997 Swindells, 1995 Zehfus, 1995 Heringa & Argos, 1991 Plochocka et al., 1988 Наша группа: Alexeevski et al,. 2003 Swindells: группировка гидрофобно взаимодействующих неэкспонированных остатков • Отбираются остатки, которые – Слабо экспонированы (<7%) – Принадлежат спиралям или тяжам – Более 75% контактов их атомов с другими атомами классифицируются как гидрофобные Контактом считается сближение “тяжелых” атомов на сумму vdW радиусов + 1 ангстрем Гидрофобным контактом считается контакт углеродов Два остатка из отобранных считаются взаимодействующими гидрофобно если число гидрофобных межатомных контактов превосходит число негидрофобных межатомных контактов Строится граф: • Вершина – отобранный остаток • Ребро соединяет вершины, если соответствующие остатки гидрофобно взаимодействуют • Связные компоненты графа, содержащие 5 или более остатков, называются гидрофобными ядрами Граф гидрофобных контактов (пример) Zehfus: компактные группы боковых цепей остатков • Вводится мера Z компактности набора остатков (отношение ASA к минимальной возможной поверхности) • Выращиваются группы путем наращивания остаток за остатком (жадным алгоритмом) • С помощью Z-score (который здесь назван ζ) по статистике кластеров из данного числа остатков выбираются наиболее компактные группы. • Часто они состоят, в основном, из гидрофобных остатков Кластеры неполярных атомных групп • Элементарной единицей служат неполярные атомные группы (CH3 и т.п.) вместо аминокислотных остаков • Алгоритм основан на делении целого, а не на наращивании из элементов В чем задача: • Для данной структуры найти области пространства, заполненнные только или преимущественно неполярными группами Неполярные группы в белках: • • • • —CH3 —CH2— —CH< —SH, —S — не связанные ковалентно с полярными (N и O) атомами Назовем такие группы ‘HF-атомами’ “Гидрофобная область” в структуре (HF-область): • HF-область заполнена преимущественно HF-атомами • Каждый HF-атом в области имеет несколько гидрофобных контактов с другими HF-атомами из той же области • Гидрофобное взаимодействие между разными HF-областями слабое Конфигурация HF-атомов на плоскости и что хотим в ней найти Алгоритм ‘(k,l)-разрезов: input output 3D структура => список HF-областей Каждая Hf-область описавается как 1) список HF-атомов 2) параметры HF-области (число HF-атомов, центр тяжести области, полуоси эллипсода вращения и др.) Шаги алгоритма (k,l)-разрезов • • • • Создание графа HF-атомов Нахождение всех (k,l)-разрезов графа Удаление всех (k,l)-разрезов из графа Нахождение кластеров, т.е. Связных компонент полученного графа Граф контактов HF-атомов • Вершина – один HF-атом • Ребро соединяет два атома если они контактируют Два типа ребер • Ковалентные связи и, более обще, пары атомов на фиксированном расстоянии в силу форсмажора – стереофимических ограничений • Гидрофобные контакты C C C Критерии контакта m d d d0, (d0’=5.4Ǻ, d0’’=4.5Ǻ) m m0 (m0=3.0Ǻ) Что такое (k,l)-разрез графа? • Определение: (k,l)-разрез графа – это связный подграф G, содержащий k-ребер, такой , что l-реберная окрестность его после удаления ребер G распадается на две или более связных компоненты Подграф G1 (красные ребра) является (2,1)-разрезом G1 Подграф G2 (красные ребра) не является (2,1)-разрезом G2 Clusters (1,1)-cuts (2,1)-cut Graph HF-atoms after of(red (red HF-atoms (1,1)-cutting (2,1)-cutting edges) edges) Cluster 4 Cluster 11’ Cluster Cluster 3 Cluster 2 Cluster 1’’ Algorithm complexity • Time T can be considered as linear with respect to the number N of atoms in 3D structure; constant C is large • C depends exponentially on the parameter k of (k,l)-cut algorithm • Seems only small k=1,2,3,... are sufficient for HF-clusters detecting • Special ordering of edges helps to decrease an exhaustive search of connected k-edges-subgraphs of a graph Working version of the on-line program ‘ClusterDetector’ (CluD) is available now at http://monkey.belozersky.msu.ru/~mlt/HF_page.html (реализованы k=l=1) On-line CluD interface HF-clusters of RdRp RHDV Консервативное гиброфобное ядро гомеодоменов • Homeodomains are about 60 aa wellconserved DNA-recognizing domains of eukaryotic transcription factors • There are 62 chains of homeodomains in PDB representing 20 different proteins • Homeodomain consists of a ‘hand’ and 3 -helices Homeodomain structure Определение консервативноего гидрофобного ядра • Остатки во всех 62х структурах гомеодоменов пронумерованы соответственно выравниванию • Для каждого гомеодомена найден самый большой HF-кластер – гидрофобное ядро (число HFатомов в нем было от 77 до 97) • В выравнивании позиции, остатки в которых давали вклад в HF-ядро во всех структурах, были отмечены • HF-атомы из остатков в этих позициях считались входящими в консервативное HF-ядро 1AHD 1B72 1B81 1DU0 2HDD 3HDD 1JGG 1JGG 1BW5 1AKH 1YRN 1LE8 1MNM 1K61 1YRN 1APL 1LE8 (P) (A) (A) (B) (A) (A) (A) (B) (A) (A) (A) (D) (A) (B) (C) MRKRGRQTYTRYQTLELEKEFHFN---RYLTRRRRIE LRTNFTTRQLTELEKEFHFN---KYLSRARRVE RQTYTRYQTLELEKEFHTN---HYLTRRRRIE RPRTAFSSEQLARLKREFNEN---RYLTERRRQQ RTAFSSEQLARLKREFNEN---RYLTERRRQQ RTAFSSEQLARLKREFNEN---RYLTERRRQQ RYRTAFTRDQLGRLEKEFYKE---NYVSRPRRCE RYRTAFTRDQLGRLEKEFYKE---NYVSRPRRCE TTRVRTVLNEKQLHTLRTCYAAN---PRPDALMKEQ ISPQARAFLEEVFRRK---QSLNSKEKEE ISPQARAFLEQVFRRK---QSLNSKEKEE KSSISPQARAFLEQVFRRK---QSLNSKEKEE TKPYRGHRFTKENVRILESWFAKNIENPYLDTKGLEN RGHRFTKENVRILESWFAKNIENPYLDTKGLEN TKPYRGHRFTKENVRILESWFAKNIENPYLDTKGLEN YRGHRFTKENVRILESWFAKNIENPYLDTKGLEN RGHRFTKENVRILESWFAKNIENPYLDTKGLEN Conserved HF-core of homeodomains Position Number of HFatoms contributed into HFcore Amino acid residues observed in the position 8 3-7 16 4 20 26 31 34 40 44 45 6 - 7 2 - 4 2- 4 3 - 4 3 - 4 1 - 3 3 - 4 Phe Leu Phe Leu Arg Ile Leu Arg Ile Tyr Pro Ile Leu Met Gln Tyr Ile Leu Met Ile Thr Trp Val Lys Val Val Val Leu Ile Val 48 49 52 7 3, 7 1 - 3 Trp Phe Arg Val His Lys Conserved HF-core of All HF-atoms of Mat2 homeodomain Mat2 homeodomain Space region comprised by HFcore is conserved in homeodomains • In 62 superimposed homeodomains HF-cores of 59 homeodomains lie completely in the 3Å neighborhood of the HF-core of Msh homeodomain ! • In two cases 4-6 HF-atoms lie out of the neighborhood. One is MatA1 homeodomain having no N-terminal hand. Another is average NMR structure.