Предсказание пространственной структуры белков Иерархия структуры белков Первичная: белковая последовательность Вторичная: локальный фолдинг - α-спирали, β-листы, петли Третичная: пространственная организация полипептидной цепи Четвертичная: доменная организация белков Структура белков определяет их функцию Структура белка Регуляция Структура Сигнальные пути Функция Движение Катализ Транспорт Первичная структура: последовательность • Первичной структурой белка является его аминокислотная последовательность МОНОМЕР ПОЛИМЕР Аминокислота Полипептид Пептидная связь Пептидная связь Первичная структура: последовательность • Двадцать аминокислот, встречающихся в белках, имеют различные свойства. Первичная структура: последовательность Вторичная структура: α-спирали, β-листы, петли • α-спирали и β-листы формируются путем образования водородных связей между атомами кислорода и водорода главной цепи. Вторичная структура: α-спирали Вторичная структура: β-листы Антипараллельный β-лист Параллельный β-лист β-лист β-тяж Смешанный β-лист Структурные мотивы Третичная структура: домены Мозаичная структура белков Третичная структура: пространственная укладка белка (фолд) Четвертичная структура: мультимерные белки и белковые комплексы Гемоглобин - тетрамер Рибосома: РНК-белковый комплекс - синтез белка Реплисома - копирование ДНК Сворачивание белка (фолдинг) • Сворачивание белка - процесс укладки полипептидной цепи в компактную пространственную структуру. • Аминокислотная последовательность белка одназначно определяет его пространственную структуру [Anfinsen et al., 1950s]. • Пространственная структура белка определяет его функцию. Нековалентные (“слабые”) взаимодействия Водородные связи Ионные связи Гидрофобные взаимодействия Ван-дер-Ваальсовы взаимодействия Гидрофобность аминокислот • Гидрофобные эффекты играют важную роль в сворачивании белка Экспериментально измеренные уровни гидрофобности аминокислот Определение пространственной структуры белка • Экспериментальный подход - Рентгеновская кристаллография Спектроскопия ядерного магнитного резонанса • Вычислительный подход - Предсказание пространственной структуры белка на основе информации о его последовательности - нерешенная задача Предсказание пространственной структуры белка • Ab initio - моделирование укладки “из первых принципов” - без использования дополнительной информации о структурах схожих белков. • Предсказание на основе гомологии (homology modeling) моделирование на основе известных структур схожих белков. • Тридинг (Threading) - моделирование на основе слабой гомологии. Предсказание структуры ab initio • Функция потенциальной энергии - Модель водного раствора Оценка попарного взаимодействия между аминокислотами • Поиск в пространстве всевозможных конформаций - Модель на основе “решетки” Молекулярная динамика Использование библиотек известных 3D фрагментов • Предсказание вторичной структуры Предсказание структуры с использованием решетки • HP-модель (Hydrophobic-Polar) - рассматривает гидрофобные взаимодействия как наиболее важные. - Не существует эффективных алгоритмов Плохо отражает реальность Предсказание структуры с использованием решетки ROSETTA • Используются структурно консервативные фрагменты длиной 4-10 аминокислот • Поиск в пространстве конформаций осуществляется методом Монте Карло • Полученные структуры кластеризуются и в качестве результата выдаются наилучшие структуры для каждого кластера Предсказание структуры на основе гомологии • Выравнивание рассматриваемой последовательности с последовательностями белков с известной 3D структурой (обычно >30% сходства) • Наложение моделируемой последовательности на известную структуру согласно выравниванию • Локальное улучшение полученной пространственной структуры - Число уникальных укладок (фолдов), наблюдающихся в белках, ограничено (несколько тысяч) - 90% помещаемых в PDB структур имеют уже известные укладки (фолды) Примеры укладок (фолдов) Предсказание структуры на основе гомологии Raw model Loop modeling Side chain placement Refinement Тридинг (Threading) - предсказание структуры на основе слабой гомологии • Главное отличие от моделирования по гомологии поиск наилучшей структуры осуществляется с помощью выравнивания последовательности со структурой, а не с последовательностью. При этом используется специальным образом определенная весовая функция. MTYKLILN …. NGVDGEWTYTE Основные компоненты тридинга • библиотека уникальных укладок (фолдов) • функция, определяющая вес выравнивания последовательности со структурой • алгоритм нахождения наилучшего выравнивания CASP - конкурс методов предсказания структуры белков Предсказания вторичной структуры • Задача: отнести позиции заданой последовательности GHWIATRGQLIREAYEDYRHFSSECPFIP к одному из трех классов вторичной структуры - α-спиралям (H), β-листам (E) или петлям (C): CEEEEECHHHHHHHHHHHCCCHHCCCCCC Методы предсказания вторичной структуры • Статистические методы - • Chou-Fasman, GOR Ближайшего соседа • NNSSP, SSPAL Нейронные сети • PHD, Psi-Pred, J-Pred • Метод опорных векторов • Скрытые Марковские модели Точность предсказания вторичной структуры • Точность современных методов достигает 80% • Оценка различий во вторичной структуре для гомологичных белков ~ 12%. Таким образом, теоретический предел точности предсказания вторичной структуры ~ 88%. 25 PSIPRED SSpro PROF PHDpsi JPred2 PHD Percentage of all 150 proteins 20 15 10 5 0 30 40 50 60 70 80 90 Percentage correctly predicted residues per protein 100 Благодарности • При подготовке слайдов использовались материалы лекций: • Михаила Гельфанда (ИППИ) • Андрея Миронова (МГУ) • Serafim Batzoglou (Stanford) • Manolis Kellis (MIT) • Pavel Pevzner (UCSD)