Блок 3. Семейства белков Мотивы, паттерны и профили II.

advertisement
Блок 3. Семейства белков
II. Мотивы, паттерны и профили
Первый курс, весна 2008, А.Б.Рахманинова
Что мы можем узнать нового?
Попарное выравнивание:
*
20
XYLR_ECOLI : GYPSLQYFYSVFKKAYDTTPKEYR : 24
XYLR_HAEIN : GYPSIQYFYSVFKKEFEMTPKEFR : 24
Множественное выравнивание:
*
20
APPY_ECOLI : GYNSTSYFICAFKDYYGVTPSHYF
CELD_ECOLI : GYSSPSLFIKTFKKLTSFTPKSYR
CFAD_ECOLI : GISSASYFIRVFNKHYGVTPKQFF
ENVY_ECOLI : GYSSTSYFISVFKAFYGLTPLNYL
FAPR_ECOLI : GYTSVSYFIKTFKEYYGVTPKKFE
MELR_ECOLI : GFRSSSRFYSTFGKYVGMSPQQYR
RHAS_ECOLI : GFSDSNHFSTLFRREFNWSPRDIR
ROB_ECOLI : RFDSQQTFTRAFKKQFAQTPALYR
TETD_ECOLI : QFDSQQSFTRRFKYIFKVTPSYYR
XYLR_ECOLI : GYPSLQYFYSVFKKAYDTTPKEYR
XYLR_HAEIN : GYPSIQYFYSVFKKEFEMTPKEFR
g s
F
Fk
tP
:
:
:
:
:
:
:
:
:
:
:
24
24
24
24
24
24
24
24
24
24
24
Множественное выравнивание, весна 2008
Что хотим найти ?
НАД-связывающий
сайт/центр
Домен, связывающий сахар
Сайты возможной
посттрансляционной
модификации (РТМ)
ДНК-связывающий домен
Суперсемейства
Ортологи
Гомологичное семейство:
особенности последовательностей,
характерный тип структуры,
функции, таксономия и т.п.
Семейство 1
Семейство 2
Семейство 3
Основные понятия и термины
• Место, сайт(site) -
• Мотив (motif) –
• Домен (domain) –
• Семейство –
• Суперсемейство -
?
• Паттерн (pattern) –
• Позиционно
специфическая матрица
весов (PSSM) –
• Профиль–PSSM –
• Профиль–HМM • Подпись (signature) –
• «Oтпечатки пальцев»
(fingerprints) –
• Кластер -
Домен – единица
эволюции, структуры и функции белков.
Домен – компактная, относительно
независимо сворачивающаяся структура,
относительно консервативная в процессе
эволюции.
Белки могут состоять из одного или
многих доменов.
nitrogen fixation positive activator protein
Мотив ?
• Мотив в аминокислотной последовательности ─ набор
консервативных остатков, важных для функции белка и
расположенных на определенном (обычно коротком) расстоянии друг
от друга в последовательности.
• Мотив структуры (структурный мотив) – часто встречающийся в
белках элемент пространственной структуры (-спираль, -шпилька,
-поворот).
Структурные мотивы не обязательно соответствуют мотивам в
аминокислотным последовательностях.
Один домен может содержать один или несколько мотивов в
аминокислотной последовательности.
Мотив может не входить в домены.
Не в любом выравнивании легко найти мотив.
Основные понятия и термины
• Место, сайт(site) -
• Мотив (motif) –
• Домен (domain) –
• Семейство –
• Суперсемейство -
?
• Паттерн (pattern) –
• Позиционно
специфическая матрица
весов (PSSM) –
• Профиль–PSSM –
• Профиль–HМM • Подпись (signature) –
• «Oтпечатки пальцев»
(fingerprints) –
• Кластер -
БД белковых доменов, семейств и функциональных сайтов.
Содержит описание объектов + описание паттернов,
профилей и правил для их обнаружения.
Выравнивание
хорошо изученного семейства
Функционально
важные остатки
4-5
консервативных
остатков
Паттерн
Поиск в
UniProt
Если
находим
только«правильные»,
то ОК
Если много
лишнего, то
увеличиваем
паттерн
Паттерн – регулярное выражение UNIX’a:
[AC]-x-V-x(4)-{ED}
Ala или Cys- х-Val- х- х- х - х- (любой, но не Glu и не Asp)
PROSITE ─ биологически значимые сайты,
паттерны и профили, http://www.expasy.ch/prosite/
Релиз 20.31
08-Apr-2008
1514 документов,
1318 паттернов, 784 профилей
+ 784 ProRule
Профиль или весовая матрица (PSSM)
F
F
Y
F
F
L
F
K
K
P
P
K
E
K
L
A
I
V
V
F
L
L
F
V
V
L
I
L
S
G
G
K
A
S
G
H
Q
Q
EA
AC
ED
E
N
F
G
H
I
K
L
M
N
P
Q
R
S
T
V
W
Y
C
T
E
A
V
C
V
L
L
V
M
F
Q
L
L
G
-18
8 -3
3 -10 -2
I -10L -1K -8
-22
I -33A -18D -18 -22 -26 22 -24 -19
-35
0I -32Q-33 -7
6 -17 -34 -31
I
-27 15 -25 -26 -9 23 -9 -24 -23
L
V
C
60
-30
-13
3
-26
14
3
-22
-30
-32
-18
-22
-10
0
9
34
-30
-20
-12
-27
25
-28
-15
-6
24
5
9
-8
-10
-25
-25
-18
12
-28
-25
21
-25
19
10
-24
-26
-25
-22
-16
-6
22
-18
-1
14
-32
-25
25
-27
27
14
-27
-28
-26
-22
-21
-7
25
-19
1
-26
28
-16
-29
-6
-27
-17
1
-14
-9
-10
11
-5
-19
-25
-23
-29
-14
14
-23
4
-20
-10
8
-10
24
0
2
-8
-26
-27
-12
-15
-23
-22
-8
-15
-9
-9
-15
-22
-16
-18
-1
2
6
-34
-19
4
-33
-22
33
-27
33
25
-24
-24
-17
-23
-24
-10
19
-20
0
12
-27
-23
19
-26
26
12
-24
-26
-23
-22
-19
-7
16
-17
0
-8
-7
0
-1
-29
-5
-10
-23
0
-21
-11
-4
-18
7
-4
-4
-11
-16
-28
-18
Download