Введение в кристаллографию макромолекул Владимир Юрьевич ЛУНИН Институт Математических Проблем Биологии РАН Пущино http://www.impb.ru/lmc Методы определения структуры с атомным разрешением • • • • • рентгеноструктурный анализ; двумерный ЯМР; дифракция электронов; дифракция нейтронов; трехмерная реконструкция объекта по данным электронной микроскопии. Биохимия экспрессия белка, очистка, кристаллизация Физика источники рентгеновского излучения, системы регистрации, теория рассеяния рентгеновских лучей Математика, компьютерные технологии алгоритмы решения обратной задачи теории рассеяния, управление экспериментом, обработка экспериментальной информации, визуализация результатов X-ray structure analysis Intensities Is of diffracted beams crystal registration X-ray source X-ray experiment h 0 0 0 0 0 0 k l 0 6 0 8 0 20 1 6 1 7 1 8 F 46.09 212.95 98.75 188.33 14.88 226.02 σ 2.74 5.00 3.15 5.06 8.00 7.9 Kinematic theory of diffraction X-ray structure analysis The solving of the structure h 0 0 0 0 0 0 k l 0 6 0 8 0 20 1 6 1 7 1 8 F 46.09 212.95 98.75 188.33 14.88 226.02 σ 2.74 5.00 3.15 5.06 8.00 7.9 Wk={r: rS(r) > k} The phase problem refined model preliminary model Protein Data ATOM ATOM Bank ATOM ATOM ATOM ATOM 6 7 8 9 10 11 CA C O CB OG1 CG2 MET MET MET THR THR THR A A A A A A 1 1 1 2 2 2 0 0 0 0 0 0 X Y 1.530 1.452 1.808 -0.430 -1.549 -0.265 3.431 4.960 5.574 7.045 7.435 7.733 Z T 5.646 5.500 4.503 7.578 6.701 8.906 1.00 1.00 1.00 1.00 1.00 1.00 B 9.39 7.10 10.54 23.54 27.09 21.71 ангстрем нанометр 1 Å = 10-10 м 1нм = 10-9 м = 10 Å 3.13 1.46Å 1.24Å 1.37Å 1.02Å 1.52Å размеры ядра ~ 10-4 Å радиус орбиты электрона в атоме водорода ~0.529... Å = 1 Bohr (1 Бор) 3.10 H (Из. Карапетьянц М.Х., Дракин С.И., "Строение ещества") (Из. Карапетьянц М.Х., Дракин С.И., "Строение ещества") (Из Зоммер К., "Аккумулятор знаний по химии") (Из Зоммер К., "Аккумулятор знаний по химии") Квантовая химия (компьютерная химия) Расчет структуры относительно простых соединений уравнение Шредингера волновая функция y(r) |y(r)|2 - вероятность обнаружить электрон в точке r пространства Функция распределения электронной плотности r(r) (или r(x,y,z)) - функция распределения электронной плотности dV r r(r)dV (или r(x0,y0,z0)dxdydz) - O средний (по времени) заряд в объеме dV W r r dV r W (x0,y0,z0) dz dx dy z y O x - количество электронов в области W "Сферически-симметричный" атом r r r r 200 r (e/Å ) 0 r x, y , z r0 3 x2 y2 z2 H C N O S 150 100 50 |r| (Å) 0 0 0.2 0.4 0.6 "Сферически-симметричный" атом r r r r 50 r (e/Å ) 0 r x, y , z r0 3 x2 y2 z2 H C N O S 40 30 20 10 |r| (Å) 0 0 0.2 0.4 0.6 "Сферически-симметричный" атом r r r r 50 r (e/Å ) 0 r x, y , z r0 3 x2 y2 z2 H C N O S 40 30 3 4 2t 2 4 2 r0 t C exp B B 20 10 |r| (Å) 0 0 0.2 0.4 0.6 "Сферически-симметричный" атом r r r r 50 r (e/Å ) 0 r x, y , z r0 3 x2 y2 z2 H C N O S 40 30 3 4 2t 2 4 2 r0 t C exp B B 20 10 |r| (Å) 0 0 0.2 0.4 0.6 Пяти-гауссовая модель 4 r r C j j 1 Bj 5 3 4 2 r 2 2 exp B j C1, B1, C2, B2, C3, B3, C4, B4, C5, B5 свои для каждого типа атомов International Crystallographic Tables Как "показать" распределение электронной плотности? Одно измерение - график r (e/Å3) 50 H C N O S 40 30 20 10 |r| (Å) 0 0 0.2 0.4 0.6 Двумерный случай а) график б) линии уровня (топографическая карта) Трехмерный случай, линии уровня r x, y, z0 - функция двух переменных z z0 O y x r x, y, z0 rcrit - линия уровня rcrit= 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5 Z=30/128 Трехмерный случай, линии уровня r x, y, z0 - функция двух переменных z z0 O Z=30/128 y x Z=22/128 Z=26/128 Z=34/128 Z=38/128 Трехмерный случай, поверхность уровня r x, y, z rcrit - поверхность rcrit= 0.5 rcrit= 3.0 rcrit= 1.0 Распределение электронной плотности можно проинтерпретировать в терминах координат атомов. Локальные максимумы электронной плотности отвечают центрам атомов. Объектом изучения является функция, описывающая распределение электронов в трехмерном образце исследуемого вещества. Распределение электронной плотности можно проинтерпретировать - представить его как сумму вкладов отдельных атомов. Кинематическая теория рассеяния • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны "пространственная" компонента • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны "пространственная" компонента t=0, =0 E длина волны E0 x "мгновенный снимок" • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны E t=0, =0 E0 "пространственная" компонента x "временная" компонента "мгновенный снимок" • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны E t=1, =0 E0 "пространственная" компонента x "временная" компонента "мгновенный снимок" • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны E t=2, =0 E0 "пространственная" компонента x "временная" компонента "мгновенный снимок" • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны E t=3, =0 E0 "пространственная" компонента x "временная" компонента "мгновенный снимок" • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны E t=4, =0 E0 "пространственная" компонента x "временная" компонента "мгновенный снимок" • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны "пространственная" компонента x=0, =0 E E0 1/n n частота t 1 n "временная" компонента фаза фиксирована точка наблюдения • на заряд q действует сила F=qE • E - вектор напряженности электрического поля • E(r,t) - электрическое поле Одномерная электромагнитная волна x E x, t E0 sin 2 vt амплитуда волны E фаза "пространственная" компонента x "временная" компонента фаза t=0 "мгновенный снимок" важны разности фаз различных волн Одномерная электромагнитная волна (a,b)=|a||b|cosg x E x, t E0 sin 2 vt a a, b Плоская волна в направлении s σ, r E r, t E0 sin 2 vt a g b a, b s b t=0, =0 s "мгновенный снимок" O r В любой плоскости, перпендикулярной направлению s, в данный момент времени поле постоянно. Вдоль s поле меняется синусоидально. Одномерная электромагнитная волна x E x, t E0 sin 2 vt (a,b)=|a||b|cosg a a a, b Плоская волна σ, r E x, t E0 sin 2 vt g b b a, b s В любой плоскости, перпендикулярной направлению s, в данный момент времени поле постоянно. Вдоль s поле меняется синусоидально. Одномерная электромагнитная волна x E x, t E0 sin 2 vt Сферическая волна r 1 E r, t E0 sin 2 vt r E r На любой сфере в данный момент времени поле постоянно. Вдоль радиуса поле меняется синусоидально. длина волны электроны beam-stop регистрирующее устройство рассеянные лучи diffracted waves s σ, r E r, t E0 sin 2 vt |s0|=1 σ, r |s|=1 s0 результирующий сдвиг фазы σ σ0 , r s, r O σ0 , r σ 2q s σ0 s σ σ0 - вектор рассеяния q - угол рассеяния результирующий сдвиг фазы σ σ0 , r s, r s σ σ0 - вектор рассеяния q - угол рассеяния отражение (reflection) s s 2 sin q s0 σ σ0 s q q s0 q "отражающая плоскость" •малоугловое рассеяние •рассеяние под "большими" углами Сложение волн от двух электронов E r, t E0 sin 2x E0 sin 2 x s, r2 r1 =0 =1/4 =1/8 =3/8 Амплитуда рассеянной волны зависит от взаимного расположения рассеивающих электронов. Суммирование волн от электронов в r1,r2,r3,.... ~ Es t E0 sin 2 vt s, r j j ~ Es t E0 sin 2 vt cos2 s, r j j sin(a+b)= sin(a)cos(b)+cos(a)sin(b) ~ E0 cos2 vt sin 2 s, r j j ~ sin 2 vt E0 cos2 s, r j j A cos B sin ~ cos2 vt E0 sin 2 s, r j A2 B 2 sin j arctg ~ Es t F (s) E0 sin 2 vt s 2 F (s) cos 2 s, r j sin 2 s, r j j j 2 A B "Прямая" задача теории рассеяния • электроны расположены в точках r1, r2, r3, ... ,rN • рассеянная волна при векторе рассеяния s : ~ Es t F (s) E0 sin 2 vt s 2 F (s) cos 2 s, r j sin 2 s, r j j j 2 • детектор регистрирует интенсивность рассеяния I(s), пропорциональную квадрату амплитуды рассеянной волны • эта интенсивность может быть расcчитана как 2 I (s) cos 2 s, r j sin 2 s, r j j j 2 "Обратная" задача теории рассеяния Зная интенсивности рассеяния для разных направлений рассеяния определить положения рассеивающих электронов. Метод проб и ошибок • имеем гипотезу о расположении электронов; • рассчитываем какие должны быть в таком случае интенсивности рассеянных волн; • сравниваем с результатом эксперимента. Суммирование по пространству dV r O r(r) - функция распределения электронной плотности r(r)dV - средний (по времени) заряд в объеме dV ~ Es t F (s) E0 sin 2 vt s I (s) r rcos 2 s, r dV r rsin 2 s, r dV 2 j r 2 j Обратная задача: • знаем интенсивности рассеяния для разных s; • хотим восстановить распределение r(r). r Рассеяние атомом ~ Es t F (s) E0 sin 2 vt s F (s) r rcos 2 s, r dV r rsin 2 s, r dV 2 j 2 r j r Для атома находящегося в начале координат 4 r r C j j 1 Bj 5 F s f s 3 4 2 r 2 2 exp B j s 0 s2 f s C j exp B j 4 j 1 f(s) - фактор атомного рассеяния (атомный формфактор) 50 r (e/Å3) H C N O S 40 30 20 5 10 |r| (Å) 0 0 0.2 0.4 0.6 Рассеяние суммой атомов ~ Es t F (s) E0 sin 2 vt s 2 F (s) f j s cos 2 s, r j f j s sin 2 s, r j j j cos (s) f j s cos 2 s, r j j 2 sin (s) f j s sin 2 s, r j j F(s) - модуль структурного фактора (structure factor magnitude); (s) - фаза структурного фактора (structure factor phase) Определение структуры как задача минимизации • имеем набор экспериментально определенных значений модулей структурных факторов Fobs(s1), Fobs(s2), Fobs(s3), ... • для каждой пробной структуры r1, r2, r3, r4, ... Умеем рассчитывать "теоретические" значения модулей 2 F calc (s) f j s cos 2 s, r j f j s sin 2 s, r j j j 2 • хотим подобрать координаты атомов структуры r1, r2, r3, r4, ... так, чтобы минимизировать расхождение между теоретическими и экспериментальными значениями Q r1 , r2 , r3 ,... F obs sk F calc sk ; r1 , r2 ,... min k 2 Кристаллы Проблема Интенсивность рассеяния отдельной молекулой слишком мала для регистрации. Возможное решение: • увеличение мощности источника излучения; • повышение чувствительности регистрирующего устройства; • рассеяние большим числом идентичных молекул. Много молекул: • растворы; • газы; • порошки; • кристаллы. Молекулярные кристаллы Много экземпляров молекулы расположены в пространстве регулярным образом. Идеальный монокристалл. a a a a a b a b a b a b a b a b g a элементарная ячейка (unit cell) c b g b a a, b, c, , b, g параметры элементарной ячейки (unit cell parameters) a=|a|, b=|b|, c=|c| начало координат (origin) a, b, c - в ангстремах (Å) , b, g - в градусах CRYST1 66.224 66.224 40.561 90.00 90.00 120.00 P 63 6 • Элементарная ячейка - математический объект. Она вводится для удобства работы. • Выбор элементарной ячейки и начала координат в значительной мере произвольны. • В начале координат может не находиться никакого атома. • Молекула не всегда лежит в выбранной элементарной ячейке целиком. • При сравнении координат двух структур эти структуры должны быть предварительно "выровнены". Дифракция на кристалле Рассеяние суммой атомов 2 F (s) f j s cos 2 s, r j f j s sin 2 s, r j j j 2 f s sin 2 s, r f s sin 2 s, r j j j a r0 j s, a 0 j O (s,a)=h - целое волны усиливаются (s,a)=h - нецелое усиления нет N f s sin 2 s, r0 j j 1 Nat=1 =(s,a) 0 1 2 3 4 5 6 7 8 9 10 N f s sin 2 s, r0 j j 1 Nat=1 Nat=3 =(s,a) 0 1 2 3 4 5 6 7 8 9 10 N f s sin 2 s, r0 j j 1 Nat=1 Nat=3 Nat=11 =(s,a) 0 1 2 3 4 5 6 7 8 9 10 N f s sin 2 s, r0 j j 1 Nat=21 Nat=1 =(s,a) 0 1 2 3 4 5 6 7 8 9 10 N f s sin 2 s, r0 j j 1 Nat=1 Nat=21 Nat=1 Natf(s) =(s,a) 0 1 2 3 4 5 6 7 8 9 10 линейные размеры кристалла 0.1мм=106Å линейные размеры элементарной ячейки 100Å количество копий молекулы в кристалле (104)3=1012 Кристалл усиливает сигнал в 1012 раз !!! Условия дифракции (Лауэ): (s,a)=h (s,b)=k (s,c)=l h,k,l - целые числа (индексы рефлекса) a,b,c - ребра элементарной ячейки σ σ0 s - вектор рассеяния Кристалл позволяет многократно увеличить интенсивность рассеянных лучей. В дифракционном эксперименте с кристаллом теряется информация о рассеянии в направлениях с нецелочисленными индексами. Получение кристаллов исследуемого объекта может встречаться с существенными сложностями. ? Насколько структура белка в кристалле совпадает со структурой белка в растворе?