Часть 2. Протеомика.

advertisement
МАСС-СПЕКТРОМЕТРИЯ
В ПРОТЕОМНЫХ ИССЛЕДОВАНИЯХ
Часть 2: Приложения
Марина Васильевна Серебрякова
Лаборатория протеомного анализа
ФГУ НИИ ФХМ г.Москва
www.pynny.ru
ПРОТЕОМИКА – набор высокотехнологичных методов
изучения белков
1)
2)
3)
4)
определение количества того или иного белка в образце;
идентификация белка;
уточнение первичной структуры;
определение пост-трансляционных модификаций.
2D-электрофорез
Специфический гидролиз
MALDI-MS
Специфический гидролиз
Хроматография
ESI-MS-MS, микросеквенирование
Белковые чипы
Масс-спектрометрия целых белков
В базе данных
NCBI nr более 2 Для идентификации белка по его молекулярной массе
необходима точность ее измерения < 2ppm
500 000 записей
Точность недостижима при использовании времяпролетной массспектрометрии, ионных ловушек
Такая точность доступна при использовании масс-спектрометрии ИЦР
Изучаемый белок как правило отличен от имеющегося в базе данных
Пример: при анализе всех цитозольных белков бактерии Rhodobacter
с использованием масс-спектрометрии ИЦР идентифицировано около 10%
белков, пики которых наблюдались в спектре. Массы остальных белков
были отличны от рассчитанных по гену из-за наличия пост-трансляционных
модификаций.
Профилирование белков
Подложки с разными типами поверхности:
обращенная фаза, анионообменная,
катионообменная.
Биомаркер рака яичников
10000
12000
14000
20
КОНТРОЛЬНАЯ
СЫВОРОТКА
15
Для идентификации белков отличий
необходимо их выделение.
10
20
10000
12000
14000
РАК МАТКИ
15
Детектируются, как правило, хорошо
представленные белки.
10
5
17.5
10000
15
12000
14000
12000
12000
14000
14000
РАК ЯИЧНИКОВ
12.5
10
7.5
10000
10000
В данном случае –
сывороточный амилоид А1
Стратегия анализа: 2DE + MALDI-MS
2D электрофорез белков
Компьютерный анализ изображений гелей
Вырезание и трипсинолиз белков в
фрагментах геля
Экстракция пептидов и получение
MALDI масс-спектра суммарного
гидролизата
Поиск в базе данных
измеренных масс пептидов
(пептидный фингерпринт)
Post Source Decay-MS, TOF-TOF
фрагментация отдельных пептидов
Поиск в базе данных
измеренных масс фрагментов
2D-Электрофорез
Первое направление – изоэлектрическая фокусировка
Второе направление – разделение по массам в полиакриламидном геле
Белки, растворенные в неионном детергенте,
вносятся в гель с фиксированным градиентом рН
Эффективное разделение
по массам белков 10-200 кДа
Электорофорез по Лэмли:
Добавляется додецилсульфат Na:
сильный детергент
вносит отрицательный заряд
2D-Электрофорез
Достоинства
Реальные параметры разделения
Эффективное разделение
Полуколичественный метод
Ограничения
Проблемы с кислыми, щелочными
и гидрофобными белками
Невысокая воспроизводимость
Окраска:
Чувствительность:
• Кумасси голубым
50 нг/пятно
• Серебром, совместимая с MS анализом
1 нг/пятно
• Серебром, классическая
0.1 нг/пятно
Mw kDa
100
50
30
20
4
6
pI
8
4
6
pI
8
2D-Электрофорез
Окраска DIGE Cy3/Cy5
Электрофорез 2-х предварительно
окрашенных белков Mycoplasma
gallisepticum проводится на
одном геле.
•
•
Зеленым (Cy3) – белки из
контрольных клеток,
Красным (Cy5) – белки из
обработанных клеток.
Достоинства: Очень чувствителен,
прекрасное сопоставление
пятен, очень точен и удобен для
оценки экспрессии белка
Недостатки: Недолговечность
флуоресценции (сутки), требует
дорогих сканеров, непригоден
для вырезания пятен без
дополнительной окраски
серебром
878.5
x10 4
1.5
1849.7
1125.7
1490.7
1546.8
902.5
Вырезание отдельных белковых пятен
(>20 нг/мм2)
Трипсинолиз белков в фрагментах геля
Получение масс-спектра
Intens. [a.u.]
Схема проведения идентификации белка
по его пептидному фингерпринту
2869.3
2735.1
2290.0
2005.7
2097.0
2147.8
2201.1
1794.7
1273.7
1198.7
976.4
0.5
1612.7
1096.6
687.4
1929.9
1.0
0.0
750
1000
1250
1500
1750
2000
2250
2500
2750
3000
m /z
выбор базы данных
ограничение поиска по видовой принадлежности
учет возможных модификаций пептидов
точность измеренных масс
список масс пептидных фрагментов
количество кандидатов
www.matrixscience.com
Немного статистики:
В базе данных
NCBI nr более 2
500 000 записей
Среднее количество пептидов разной длины,
образующихся в результате полного гидролиза
Триптические пептиды 1000-2000Да
точность (%)
0.1
0.01
0.001
кол-во кандидатов
>1000
100-1000
5-500
Распределение моноизотопных масс пептидов
«уникальные»
Критерии достоверности поиска белков в базах данных:
peptide fingerprint
1.
2.
3.
4.
5.
6.
7.
количество «совпавших» пептидов, в предположении одного белка
количество «совпавших» пептидов, в предположении нескольких белков
распределение «совпавших» пептидов по точности
«уникальность» пептидов
перекрывание «совпавшими» пептидами последовательности белка
паттерны протеолиза
oтклонение массы белка от предполагаемой и т. д.
база данных
измеренные m/z
Приоритет критериев
2, 4, 7
программа Profound
Score
Приоритет критериев
1, 5, 6
программа Mascot
Идентификация белка заменяется нахождением его
ближайшего гомолога
Изучаемый белок обычно отличен от имеющегося в базе данных
массы
20 кандидатов
случайное
совпадение
достоверный
поиск
вероятность
20 кандидатов в порядке убывания достоверности поиска
1.
2.
3.
4.
20.
N
Масса Вероятность
Описание
gi|8486123 27875 88 reading frame [Influenza A virus]
gi|4996872 26451 74 M1 [influenza A virus (A/Taiwan/96/1769)]
gi|324260 27872 73 M1 subunit [Influenza A virus]
gi|75116
27866 73 M1 - influenza A virus (strain A/WSN/33)
------------gi|6048806 27218 58 M1 [Influenza A virus (A/Duck/Hong Kong/698/79 (H5N3))]
Sequence Coverage: 35%
IVPSGPLKAE IAQRLEDVFA
FTLTVPSERG LQRRRFVQNA
EIALSYSAGA LASCMGLIYN
QMVTTTNPLI RHENRMVLAS
QAMRTIGTHH SSSAGLKDDL
GKNTDLEVLM
LNGNGDPNNM
RMGTVTTEVA
TTAKAMEQMA
LENLQAYQKR
EWLKTRPILS
DKAVKLYRKL
FGLVCATCEQ
GSSEQAAEAM
MGVQMQRFK
PLTKGILGFV
KREITFHGAK
IADSQHRSHR
DIASQARQMV
Cпектр гидролизата смеси белков (1DE)
Accession
Mass Score
1. gi|4249653 53914 154
2. gi|10834998 57381 149
3. gi|6470141 57353 138
4. gi|6166183 60776 134
5. gi|6325467 60794 123
6. gi|13643376 60921 113
7. gi|284102
60462 111
8. gi|5705937 55015 73
9. gi|226295
55481 73
10. gi|219571
56182 72
11. gi|13699818 56515 72
……………………
18. gi|4758794 776492 64
Description
CYTOCHROME P450 2E1
----//-------//---DIMETHYLANILINE MONOOXYGENASE
----//-------//-------//---CYTOCHROME P-450 IIC
----//-------//-------//---NEBULIN
2DE + MALDI-MS - результаты
Mycoplasma gallisepticum strain R
MW
Protein coding genes - 726
200
150
100
70
Белковых пятен
> 400
Проанализировано
>150
50
30
Индивидуальных белков
Mycoplasma gallisepticum 105
20
10
pI
4.5
5
5.5
6
6.5
7
7.5
8
А
70
Примеры анализа 2DE карт
Б
2DE карты клеточных белков
двух штаммов Helicobacter pylori
Всего видно на геле ~ 500 белковых пятен
Видимых различий ~ 200
Идентифицировано ~ 150 разных белков
Из них белки отличия ~ 100
40
20
pI 4
6
8
pI 4
А
70
6
8
Б
2DE карты белков штамма клеток E.coli (А)
и штамма-продуцента треонина (Б)
Всего видно на геле ~1200 белковых пятен
Видимых различий ~ 50
Идентифицировано ~ 30 белков отличия
40
20
pI 4
6
8
pI 4
А
6
8
2DЕ карты белков клеточной линии
аденокарциномы молочной железы MCF7:
контрольной (А) и устойчивой к Hoechst33342 (Б)
Б
70
Всего видно на геле ~ 2500 белковых пятен
Видимых различий ~ 30
Идентифицировано ~ 10 белков отличия
40
20
pI 4
6
8
pI 4
6
8
Стратегия анализа: 1D - LC + ESI-MS/MS
1D электрофорез белков
Вырезание и трипсинолиз белков в полосах геля
Экстракция и хроматографическое
разделение пептидов
Intens.
x10 4
50.
+MS, 47.4-48.0mi n #2800-#2818
2+
710.6
8
Получение масс-спектров
пептидов и их
фрагментации
6
4
533.6
2
1+
445.4
2+
293.3
1+
391.6
610.3
205.3
972.9
1603.0
1034.0
0
200
400
600
800
1000
1200
1400
1600
m/z
Intens. 50.
x10 4
+MS2(710.6), 47.5-48.0min #2801-#2819
1+
791.4
1.0
0.8
0.6
Объединение данных
и анализ
1+
629.3
0.4
1+
943.5
0.2
1+
477.2
1238.7
890.5
530.3
1139.6
1003.6
0.0
400
600
800
1000
1200
m/z
Способы фрагментации пептидов
LID – фрагментация, индуцированная лазером
Пептид поглощает энергию лазера, захваченная энергия перераспределяется по
молекуле, разрушается ближайшая слабая связь.
Основной тип образовавшихся пептидных фрагментов - b-ионы и y-ионы.
Может происходить отщепление модификаций.
CID – фрагментация, индуцированная столкновениями
Пептид приобретает энергию от столкновений, захваченная энергия
перераспределяется по молекуле, разрушается ближайшая слабая связь.
Основной тип образовавшихся пептидных фрагментов - b-ионы и y-ионы.
Дополнительно образуются a-ионы и x-ионы.
Часто происходит отщепление модификаций.
ECD – фрагментация, индуцированная захватом медленных электронов
Точный механизм неизвестен. Пептид захватывает медленные электроны на азот
пептидной связи, происходит мгновенный разрыв пептидной цепи с образованием
z- ионов.
Не происходит отщепления модификаций.
Интерпретация спектров распада пептидов
Intens. 50.
x10 4
+MS2(710.6), 47.5-48.0min #2801-#2819
1+
791.4
TIGTHPSSSAGLK
1.0
b
102.0
215.1
272.2
373.2
510.3
607.3
694.4
781.4
868.4
939.5
996.5
1109.6
1237.7
0.8
0.6
1+
629.3
0.4
1+
943.5
[MH]2+
0.2
1+
477.2
1238.7
890.5
530.3
1139.6
1003.6
0.0
400
600
800
1000
1200
m/z
1
2
3
4
5
6
7
8
9
10
11
12
13
Res.
T
I
G
T
H
P
S
S
S
A
G
L
K
y
13
12
11
10
9
8
7
6
5
4
3
2
1
1154.6
1041.5
984.5
883.5
746.4
649.4
562.3
475.3
388.3
317.2
260.2
147.1
Критерии достоверности поиска белков в базах данных:
peptide fingerprint + MS/MS
база данных
измеренные m/z
Score
1.
Отбор из базы данных всех кандидатов,
содержащих триптические пептиды указанных m/z
2.
«Примерка» спектров фрагментации (MS/MS) :
количество «совпавших» фрагментов пептидов
«уникальность» спектров фрагментации пептидов
3.
Score белка = S Score пептидов
Score пептидов
1DE + LC-ESI-MS/MS - результаты
MW
Mycoplasma gallisepticum strain R
200
Проведено 3 эксперимента
150
110
Белковых полос
70
Индивидуальных белков
Mycoplasma gallisepticum
50
Эксп.1
30
Эксп.3
- 427
Белки, которые обнаружены
хотя бы в 1 эксперименте - 427
Белки, которые обнаружены
хотя бы в 2 экспериментах - 285
155 ?
20
- 50
Эксп.2
Белки, которые обнаружены
во всех 3 экспериментах - 155
10
Белки, которые обнаружены при проведении 2DE+MALDI-MS - 90
СОПОСТАВЛЕНИЕ РЕЗУЛЬТАТОВ:
2DE + MALDI-MS и 1DE + LC-ESI-MS/MS
№ NCBI
gi|31541381
gi|31541566
gi|31541571
gi|31541607
gi|31541608
mW
score
85818 119
100472 130
120325 273
130197 205
133826 168
Protein
№ NCBI
conserved hypothetical lipoprotein gi|31541381
conserved hypothetical lipoprotein gi|31541566
HepA/SNF
gi|31541753
conserved hypothetical lipoprotein gi|31541571
conserved hypothetical lipoprotein gi|31541607
lipoprotein
gi|45453612
lipoprotein
gi|45453638
lipoprotein
gi|33327196
conserved hypothetical lipoprotein gi|31541608
mW
score
85818 127
100472 817
132618 341
120325 2152
130197 1781
18284
313
18339
362
25889
436
133826 1008
conserved
conserved
conserved
conserved
conserved
Protein
hypothetical lipoprotein
hypothetical lipoprotein
hypothetical lipoprotein
hypothetical lipoprotein
hypothetical lipoprotein
Специфический гидролиз
суммарного белка + мечение ICAT
Стратегия анализа:
LC + ESI-MS/MS
Выделение цистеинсодержащих пептидов
(афинное связывание с авидином)
Хроматографическое
разделение пептидов + MS/MS
Пример: ICAT-метки
Достоинства:
Анализируются все меченные белки
Анализ содержания одного белка в
контроле и опыте
Ограничения:
Не видно взаимных количеств
разных белков в образце
Артефакты в интерпретации MS/MS
Интерпретация спектров распада пептидов (LID +CID)
Сиквенирование de-novo:
•определение пар пиков, в сумме дающих массу родительского иона
•по наличию соседних пиков +/-28, +/-15 определение типа ионов
•по разнице масс соседних однотипных ионов построение
возможных последовательностей
MALDI фрагментация
пептидов (LID +CID)
[Abs. Int. * 1000]
0
1
2
3 15
4
5
6 14
7
8
9 13
10
11 12
12
13
14 11
G
G
G
G
P
P
P
P
P
P
P
P
F
F
F
F
F
F
F
F
F
F
F
F
N
N
N
N
N
N
N
N
N
N
N
N
N
N
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
F
F
F
F
F
F
F
F
F
F
F
F
F
F
F
Q
Q
K
K
Q
Q
K
K
Q
Q
K
K
Q
Q
Q
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
L
I
L
I
L
I
L
I
L
I
L
I
L
I
L
D
D
D
D
D
D
D
D
D
D
D
D
D
D
D
Ограничения cиквенирования de-novo
при использовании MALDI-TOF-MS :
* не бывает равномерного разбиения
по всем пептидным связям
* не хватает точности измерения
для однозначной интерпретации
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
10
9
[Abs. Int. * 1000]
0
1
2
3 8.0
4
5
6 7.5
7
8 7.0
9
10
116.5
12
13
146.0
328.760
8
7
6
1180.275
5
4
231.751
174.798
475.682
A
A
A
A
A
A
A
A
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
A
A
A
A
A
A
A
A
A
A
A
A
A
A
A
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
W
W
W
W
V
V
S
S
W
W
V
V
S
S
W
W
V
V
V
S
S
S
T
T
T
T
T
T
T
T
T
T
T
T
T
T
T
W
W
W
W
W
W
W
W
W
W
W
W
W
W
W
G
G
G
G
G
G
G
G
G
G
G
G
G
G
G
N
N
N
N
N
N
N
N
N
N
N
N
N
N
N
L
I
L
I
L
I
L
I
L
I
L
I
L
I
L
K
K1843.878
Q
Q
K
K
K
K
Q
Q
Q
Q
K
K
Q
5.5
3
957.788
5.0
589.711
2
837.860
690.691
785.655
1067.237
965.951
1
1451.716
4.5
1295.219
856.697
4.0
486.654
671.642
3.5
200
400
600
800
1000
m/z
1200
1400
1600
1800
3.0
2.5
Степень фрагментации зависит
от многих параметров и плохо
предсказуема.
1143.997
557.663
2.0
1715.805
1245.047
1602.550
1056.917
1.5
1488.208
1.0
1431.323
0.5
200
Лабильность пептидной связи убывает в ряду
D/P D/ E/ N/ Q/ l/ L/ T/ S/ A/ V/…
400
600
800
1000
m/z
1200
1400
1600
1800
Определение пост-трансляционных модификаций белков
Модификации in vitro:
Модификации белков после их разделения в ПААГ
Т9
Cys + I ацетамид
Т6
Cys + акриламид
Т13
Т13-14
Met окислен
Т11
цистеины алкилированы йодоацетамидом (в геле)
Модификации in vivo:
Изучение S-S мостов
Лизоцим
Стабильность различных модификаций белков
в условиях получения масс-спектров (LID + CID)
Сахарный остаток локализован
на N-концевом серине ?
Связи менее устойчивые,
чем пептидная:
фосфоэфирная
гликозидная
дисульфидная (иногда)
Такова степень фосфорилирования ?
Pi
N-ac
О-гликозилированный пептид SAPASTTQPIGSTTSTTTK
сахарный остаток галактоза (верх) либо фукоза (низ)
Фрагмент спектра трипсинолиза природного (верх)
и генно-инженерного (низ) белка
Стабильность различных модификаций белков
в условиях получения масс-спектров (LID + CID)
Связи сопоставимые по
устойчивости с пептидной:
тиоэфирная
любая амидная N-ацетилирование
дисульфидная (иногда)
Пептид, модифицированный тремя пальмитатами
(тиоэфирная связь)
Пептид N- ацетилирован, а цистеин модифицирован
янтарным ангидридом (тиоэфирная связь)
Сравнение подходов
при определении белкового состава сложной многокомпонентной смеси
MS целых
белков
LC- ESI- 2DE -MALDI- 1DE-MALDIMS/MS
TOF- MS
TOF-MS
Определение количества одного белка в разных образцах
++
++ - +++++
+++
+
Определение количеств разных белков в одном образце
++
+
+++
+
++++
+++++
+++
+
+++
+
Идентификация сильно представленных в образце белков
Идентификация мало представленных в образце белков
Идентификация мембранных белков
Определение возможных модификаций белка
+++
+
Стратегия определения модификаций:
+++
++
Выделение белка
Гидролиз специфическими протеазами соотнесение значений масс пиков в спектре с первичной структурой.
Определение пептидов отличных по массе от рассчитанной –
гипотезы о природе модификации
Индивидуальный подход к получению структурной информации из спектров фрагментации –
выбор типа фрагментации, использование ферментов для дальнейшего расщепления
пептида, удаления модификации, химические подходы...
Литература:
* Говорун В.М., Арчаков А.И. Протеомные технологии в современной биомедицинской науке.
Biochemistry (Mosc). 2002 Oct;67(10):1109-23.
* Lottspeich F. Proteome Analysis: A Pathway to the Functional Analysis of Proteins.
Angew Chem Int Ed Engl. 1999 Sep;38(17):2476-2492
* M.Mann, R.C.Hendrickson, A.Pandey, Analysis of proteins and proteomes by mass spectrometry,
Annu. Rev. Biochem., 70, 437-473 (2001).
* O.N.Jensen, M.Wilm, A.Shevchenko, M.Mann, Sample preparation methods for mass spectrometric peptide mapping
directly from 2-DE gels, Methods Mol. Biol., 112, 513-530 (1999).
* B.Kuster, T.N.Krogh, E.Mortz, D.J.Harvey, Glycosylation analysis of gel-separated proteins, Proteomics, 1, 350-361 (2001).
* Aebersold R, Goodlett DR Mass spectrometry in proteomics Chem Rev 2001 Feb;101(2):269-95
* Nordhoff E, Egelhofer V, Giavalisco P, Eickhoff H, Horn M, Przewieslik T, Theiss D, Schneider U, Lehrach H, Gobom J.
Large-gel two-dimensional electrophoresis-matrix assisted laser desorption/ionization-time flight-mass spectrometry:
an analytical challenge for studying complex protein mixtures. Electrophoresis. 2001 Aug;22(14):2844-55
* Roepstorff P MALDI-TOF mass spectrometry in protein chemistry.. EXS 2000;88:81-97
* Gygi SP, Aebersold R. Using mass-spectrometry for quantitative proteomics Proteomics: A Trands Guide 2000, 31-36
* Andersen JS, Mann M Functional genomics by mass spectrometry. FEBS Lett. 2000 Aug 25;480(1):25-31
* Kussmann M, Roepstorff P Sample preparation techniques for peptides and proteins analyzed by MALDI-MS.
Methods Mol Biol. 2000;146:405-24
* Chaurand P, Luetzenkirchen F, Spengler B. Peptide and protein identification by matrix-assisted laser desorption
ionization (MALDI) and MALDI-post-source decay time-of-flight mass spectrometry.
J Am Soc Mass Spectrom. 1999 Feb;10(2):91-103
* Spengler, B, Post-source decay analysis in matrix-assisted laser desorption/ionization mass spectrometry of
biomolecules. J. Mass Spectrom., 32(10) 1019-36 (1997).
* Jonscher, KR and Yates, JR, 3rd, The quadrupole ion trap mass spectrometer--a small solution to a big challenge.
Anal Biochem, 244(1) 1-15 (1997).
* Qin, J and Chait, BT, Identification and characterization of posttranslational modifications of proteins by MALDI
ion trap mass spectrometry. Anal Chem, 69(19) 4002-9 (1997).
* Papayannopoulos, IA, The interpretation of collision-induced dissociation tandem mass spectra of peptides.
Mass Spectrom. Rev., 14(1) 49-73 (1995).
* Hillenkamp, F, Karas, M, Beavis, RC and Chait, BT, Matrix-assisted laser desorption/ionization mass spectrometry
of biopolymers. Anal. Chem., 63(24) 1193A-203A (1991).
* Fenn, JB, Mann, M, Meng, CK, Wong, SF and Whitehouse, CM, Electrospray ionization-principles and practice.
Mass Spectrom. Rev., 9(1) 37-70 (1990)
Download