p-Адические параметры в теории сложных систем, С.В. Козырев

advertisement
С. В. Козырев
МИАН им. В.А.Стеклова
p-Адические параметры
в теории сложных систем
2 сентября, 2010, Самара, СамГУ
научная школа ”Математическая физика и ее приложения”
Приближение сложных систем иерархическими
иерархические системы —
деревья, ультраметрический анализ, p-адические числа
Спиновые стёкла – p-адическая параметризация
матрицы Паризи
Динамика белка – уравнение p-адической диффузии
Генетический код – 2-адическая плоскость
Сложные системы
Спиновые стёкла — модель Шеррингтона–Киркпатрика
H=
N
X
Jij σi σj
i,j=1
σi = ±1 – спины
Jij (беспорядок) – симметрическая вещественная гауссовская
случайная матрица Jij = Jji ,
нулевое среднее hJij i = 0
матричные элементы независимы, то есть ненулевые
квадратичные корреляционные функции только hJij2 i = 1/N
беспорядок — флуктуации в процессе приготовления образца
статистическая физика неупорядоченных систем
Белок — цепь аминокислот, свёрнутая в компактную глобулу
(нативное состояние)
Миоглобин
проблема устойчивости, проблема фолдинга
глобула белка схожа с кривой Пеано
(заполнение кривой пространства)
ДНК упакована также аналогично кривой Пеано
кривая Пеано устроена иерархически
Биология — сложные системы (уже на молекулярном уровне)
Иерархические методы в теории сложных систем
Карл Линней, Systema Naturae, 1735
филогенетическое дерево
p-Адические числа
p-Адическая норма рационального числа: для простого p
x = pγ
m
,
n
|x|p = p −γ ,
|0|p = 0.
Поле Qp p-адических чисел —
пополнение Q по p-адической норме
p-адические числа — ряды
x=
∞
X
xi p i ,
xi = 0, . . . , p − 1.
i=γ
Мера Хаара: инвариантность относительно сдвигов,
нормировка:
∞
X
{x : |x|p ≤ 1} = {
xi p i }
i=0
шар с мерой единица.
Ультраметричность (сильное неравенство треугольника)
|x + y |p ≤ max(|x|p , |y |p )
все треугольники равнобедренны
два шара либо не пересекаются, либо один содержит другой
шары вложены друг в друга иерархично
(дерево иерархии шаров, p = 2)
Общие ультраметрические пространства
метрические пространства, метрика d(·, ·)
удовлетворяет сильному неравенству треугольника
d(x, y ) ≤ max(d(x, z), d(y , z)),
∀x, y , z.
Двойственность между ультраметрическими пространствами и
деревьями
Множество шаров в ультраметрическом пространстве —
частично упорядоченное дерево (по вложению шаров)
граница дерева с соответствующим частичным порядком
(в любом конечном пути существует единственная
максимальная вершина) — ультраметрическое пространство
Матрица Паризи и p-адическое расстояние
Блочно–иерархическая матрица Паризи (Qab )
(теория спиновых стёкол, метод реплик)


0 q1 q2 q2
 q1 0 q2 q2 
0 q1

, 
 q2 q2 0 q1  ,
q1 0
q2 q2 q1 0












0
q1
q2
q2
q3
q3
q3
q3
q1
0
q2
q2
q3
q3
q3
q3
q2
q2
0
q1
q3
q3
q3
q3
q2
q2
q1
0
q3
q3
q3
q3
q3
q3
q3
q3
0
q1
q2
q2
qi суть вещественные параметры.
q3
q3
q3
q3
q1
0
q2
q2
q3
q3
q3
q3
q2
q2
0
q1
q3
q3
q3
q3
q2
q2
q1
0












Перестановка строк и столбцов матрицы Паризи p N × p N
(в примере p = 2 и N = 1, 2, 3)
l : {1, . . . , p N } → p −N Z/Z,
l −1 :
−1
X
xj p j 7→ 1 + p −1
j=−N
−1
X
xj p −j .
j=−N
выражает матричный элемент Qab матрицы Паризи как
функцию p-адического расстояния между l(a) и l(b):
Qab = q(|l(a) − l(b)|p ),
где q(p k ) = qk , q(0) = 0, k = 1, . . . , N.
−N
Группа
рассматривается как группа дробей
P−1 p Z/Z
j
{ j=−N xj p }, xj = 0, . . . , p − 1 со сложением по модулю 1.
иерархия состояний спинового стекла
Динамика на ландшафтах энергии
Уравнение диффузии в потенциале
∂
f (x, t) = ∆f (x, t) + β∇f (x, t) · ∇U(x) + βf (x, t)∆U(x)
∂t
f (x, t) – функция распределения
U – потенциал, β = 1/kT – обратная температура.
Приближённое описание диффузии в потенциале
кинетическими уравнениями
переходы между потенциальными ямами
– локальными минимумами энергии
X
d
f (a, t) =
(Qab f (b, t) − Qba f (a, t)) .
dt
b
Скорость перехода – формула Аррениуса
– скорость пропорциональна
exp(−β∆E ),
∆E – барьер активации.
∆E = E1 − E0
Сложные энергетические ландшафты
Сложный ландшафт — много локальных минимумов.
Как построить аррениусовскую кинетику?
Наблюдение:
три локальных минимума – два переходных состояния.
отсюда следует ультраметричность.
Пример: локальные минимумы A, B, C ,
переходное состояние с энергией E1 между A и B,
переходное состояние с энергией E2 между (A, B) и C , E1 < E2
матрица переходных энергий


0 E 1 E2
 E1 0 E2  .
E2 E 2 0
Пример: локальные минимумы A, B, C , D,
переходное состояние с энергией E1 между A и B,
переходное состояние с этой же энергией между C и D,
переходное состояние с энергией E2 > E1 между парами
минимумов (A, B) и (C , D)
матрица переходных энергий


0 E1 E 2 E2
 E1 0 E 2 E2 


 E2 E 2 0 E1  .
E2 E 2 E 1 0
таблица расстояний для ультраметрики
Общий случай — дерево локальных минимумов
и переходных состояний (disconnectivity graph)
иерархия бассейнов
барьеры активации — задают ультраметрическое расстояние
между локальными минимумами
d(x, y ) = E (sup(x, y ))
Межбассейновая кинетика
Система кинетических уравнений
X
d
f (a, t) =
(Qab f (b, t) − Qba f (a, t)) .
dt
b
Сложный ландшафт — (Qab ) есть матрица Паризи.
Блоки матрицы Паризи — переходы между бассейнами
— межбассейновая кинетика
p-адическая параметризация матрицы Паризи даёт
Z
∂
f (a, t) =
q(|a−b|p )(f (b, t)−f (a, t))dµ(b),
∂t
p M Zp /p N Zp
интегрирование (суммирование)
по мере Хаара на группе p M Zp /p N Zp ,
нормировка меры: µ(Zp /p N Zp ) = 1.
Предел M → −∞, N → +∞
бесконечно много локальных минимумов
интегральное уравнение межбассейновой кинетики
Z
∂
f (x, t) =
q(|x − y |p )(f (y , t) − f (x, t))dµ(y ).
∂t
Qp
p-Адическая диффузия.
M < N,
Пример:
−1−α
q(|x|p ) = Γ−1
,
p (−α)|x|p
уравнение p-адической диффузии
∂
f (x, t) + Dxα f (x, t) = 0
∂t
порождаемой дробным оператором Владимирова
Z
f (x, t) − f (y , t)
α
−1
Dx f (x, t) = Γp (−α)
dµ(x)
|x − y |1+α
Qp
p
α пропорционально обратной температуре: α = βk.
— описывает динамику белка.
x — конформации белка
Связывание Mb–CO (миоглобин с угарным газом)
идёт на наборе конформаций
с открытым путём к иону железа внутри молекулы миоглобина
— описываемом единичным шаром в Qp .
Модель Mb–CO связывания —
уравнение p-адической диффузии со стоком
∂
α
+ Dx + Ω(|x|p ) f (x, t) = 0
∂t
Ω(|x|p ) — характеристическая функция единичного шара
f (x, t) — функция распределения по конформациям молекул
миоглобина, на связанных с CO.
Воспроизводит результаты экспериментов Фрауенфельдера по
динамике миоглобина
Генетический код
ДНК (РНК) — конечные последовательности
(линейные полимеры) нуклеотидов
белок — конечная последовательность аминокислот
Нуклеотиды: C, A, T (или U), G
Cytosine, Adenine, Thymine (или Uracil), Guanine
Триплетная структура генетического кода (Гамов)
Кодон — тройка C1 C2 C3 нуклеотидов
Генетический код — переводит кодоны в аминокислоты
20 аминокислот и 1 символ остановки
4 нуклеотида, 4 × 4 × 4 = 64 кодонов
64 > 21 — проблема вырождения генетического кода
AAA Lys
AAU Asn
AAG Lys
AAC Asn
UAA Ter
UAU Tyr
UAG Ter
UAC Tyr
GAA Glu
GAU Asp
GAG Glu
GAC Asp
CAA Gln
CAU His
CAG Gln
CAC His
AUA Met
AUU Ile
AUG Met
AUC Ile
UUA Leu
UUU Phe
UUG Leu
UUC Phe
GUA
GUU
GUG
GUC
Val
Val
Val
Val
CUA
CUU
CUG
CUC
Leu
Leu
Leu
Leu
AGA
AGU
AGG
AGC
UGA
UGU
UGG
UGC
GGA
GGU
GGG
GGC
Gly
Gly
Gly
Gly
CGA
CGU
CGG
CGC
Arg
Arg
Arg
Arg
ACA Thr UCA Ser GCA Ala CCA
ACU Thr UCU Ser GCU Ala CCU
ACG Thr UCG Ser GCG Ala CCG
ACC Thr UCC Ser GCC Ala CCC
митохондриальный генетический код
Pro
Pro
Pro
Pro
Ter
Ser
Ter
Ser
Trp
Cys
Trp
Cys
2-Адическая плоскость кодонов
1) Занумеруем нуклеотиды парами 0,1
A G
00 01
=
U C
10 11
(A)
Химический смысл:
1-ая строка — пурины
2-ая строка — пиримидины
1-ый столбец — слабая H-связь
2-ой столбец — сильная H-связь
2) Порядок нуклеотидов в кодоне
2>1>3
(B)
3) 2-Адическая плоскость — группа Z/8Z × Z/8Z
с координатами (x, y ):
x = (x0 x1 x2 ) = x0 + 2x1 + 4x2 ,
xi = 0, 1,
y = (y0 y1 y2 ) = y0 + 2y1 + 4y2 ,
yi = 0, 1.
с 2-мерной 2-адической метрикой
d((x, y ), (x 0 , y 0 )) = max(|x − x 0 |2 , q|y − y 0 |2 ),
1/2 < q < 1.
4)
Отображение кодонов
ρ переводит кодон в точку 2-адической плоскости
ρ : C1 C2 C3 7→ (x, y ) = (x0 x1 x2 , y0 y1 y2 ),
C2 определяет пару (x0 , y0 ),
C1 определяет пару (x1 , y1 ),
C3 определяет пару (x2 , y2 ).
Нуклеотиды определяют пары цифр по правилу (A),
порядок пар задаётся правилом (B).
5) Перенумеровка строк и столбцов
Занумеруем строки и столбцы 2-адической плоскости:
η : x 7→ e
x,
y 7→ ye;
η : x0 + 2x1 + 4x2 7→ 1 + 4x0 + 2x1 + x2 ;
η : y0 + 2y1 + 4y2 7→ 1 + 4y0 + 2y1 + y2 .
Эквивалентно:
η : 0, 4, 2, 6, 1, 5, 3, 7 7→ 1, 2, 3, 4, 5, 6, 7, 8.
(чтобы близкие 2-адически элементы
были расположены в соседних клетках плоскости)
2-Адическая плоскость кодонов
AAA AAG
AAU AAC
UAA UAG
UAU UAC
GAA GAG
GAU GAC
CAA CAG
CAU CAC
AGA AGG
AGU AGC
UGA UGG
UGU UGC
GGA
GGU
CGA
CGU
AUA AUG
AUU AUC
UUA UUG
UUU UUC
GUA
GUU
CUA
CUU
ACA ACG
ACU ACC
UCA UCG
UCU UCC
GCA GCG
GCU GCC
CCA CCG
CCU CCC
GUG
GUC
CUG
CUC
GGG
GGC
CGG
CGC
с метрикой
d(C1 C2 C3 , C10 C20 C30 ) = max(|x − x 0 |2 , q|y − y 0 |2 ),
(x, y ) = ρ(C1 C2 C3 ),
1/2 < q < 1,
(x 0 , y 0 ) = ρ(C10 C20 C30 ).
Применим к плоскости кодонов митохондриальный код:
Lys
Asn
Ter
Tyr
Met
Ile
Leu
Phe
Glu
Asp
Gln
His
Ter
Ser
Trp
Cys
Val
Thr
Ala
Leu
Ser
Pro
Gly
Arg
В частности
AAA AAG
Lys
→
,
AAU AAC
Asn
CCA CCG
→ Pro
CCU CCC
Вырождение генетического кода описывается метрикой d(·, ·):
кодоны, отображающиеся на одинаковые аминокислоты —
шары относительно метрики d(·, ·).
Иерархические методы для сложных систем
Спиновые стёкла – p-адическая параметризация
матрицы Паризи
Динамика белка – уравнение p-адической диффузии
Генетический код – 2-адическая плоскость
непостижимая эффективность математики
в естественных науках
непостижимая неэффективность математики в биологии
возможно, нужны новые математические методы
Download