Гибридизационные ДНК- микрочипы для анализа дифференциальной экспрессии генов

advertisement
Гибридизационные ДНКмикрочипы для анализа
дифференциальной
экспрессии генов
Микрочип (биочип) = DNA-microarray
array I [a'reI] n
1) порядок, построение
2) множество, совокупность
3) (of) набор, комплект
4) массив; матрица; сетка
Организованное размещение молекул ДНК на
специальном носителе
www.the-scientist.com
ДНК-микрочипы:
- кДНК-микрочипы
(двукрасочные с флуоресц.
детекцией)
- oлигонуклеотидные
(двукрасочные с флуоресц.
детекцией)
- олигонуклеотидные
(Affymetrix, однокрас. с
флуоресц. детекцией)
- мембранные к-ДНКмикрочипы
(с радиоакт. детекцией)
- гелевые к-ДНК-чипы
(ИМБ РАН)
Белковые микрочипы
Немного истории…
1980-е: белковые чипы
~1991: химия синтеза ДНК на подложке (высокой
плотности) – олигонуклеотидные чипы Affymetrix
(Fodor, Stryer, Lockhart)
~1995: роботы для микрораскапывания – кДНК чипы
Stanford University (Pat Brown and Dari Shalon)
1990-е: гелевые чипы ИМБ
Однако, еще в 1982 Augenlicht и Kobrin предложили
DNA array (Cancer Research), а в 1984 они сделали
чип, включающий 4000 элементов для исследования
раковых клеток.
(Статья была отклонена Science и Nature)
Cancer Res. 1982 Mar;42(3):1088-93.
Cloning and screening of sequences expressed in a mouse colon tumor.
Augenlicht LH, Kobrin D.
Memorial Sloan-Kettering Cancer Center, Walker Laboratory, Rye, New York 10580
Polyadenylic acid-containing cytoplasmic RNA was isolated from a dimethylhydrazineinduced mouse transplantable colon carcinoma. Double-stranded complementary DNA
synthesized using these molecules was inserted into the HindIII site of pBR322 using
HindIII linkers, and the recombinant molecules were cloned in Escherichia coli. Clones
were screened with labeled complementary DNA synthesized from the polyadenylic acidcontaining cytoplasmic RNA of the tumor or normal mouse colon, liver, or kidney. Of 378
clones screened with the normal colon and tumor probes, seven showed major
increases in abundance in the tumor tissue as compared to normal, and one showed a
major decrease. Twenty-five other sequences were found which showed smaller
increases and 22 showed smaller decreases. Of 373 clones screened with tumor, colon,
liver, and kidney probes, 79% exhibited little evidence of tissue specificity in expression.
The data for those sequences which do show tissue-specific regulation of expression
suggest that the tumor continues to express sequences characteristic of the colon but
also shows a loss, or decrease, in other gene products, most of which (19 of 25) are
characteristic of the colon. Finally, nine of 10 sequences which increase from low
abundance in the normal colon to high abundance in the tumor are found at a moderate
to high level in the liver and kidney. On the other hand, 23 of 36 sequences which show
more modest increases in the tumor as compared to normal are scarce or absent in the
liver and kidney.
PMID: 7059971 [PubMed - indexed for MEDLINE]
Science. 1991 Feb 15;251(4995):767-73.
Light-directed, spatially addressable parallel chemical synthesis.
Fodor SP, Read JL, Pirrung MC, Stryer L, Lu AT, Solas D.
Affymax Research Institute, Palo Alto, CA 94304.
Solid-phase chemistry, photolabile protecting groups, and
photolithography have been combined to achieve light-directed,
spatially addressable parallel chemical synthesis to yield a highly
diverse set of chemical products. Binary masking, one of many
possible combinatorial synthesis strategies, yields 2n compounds in n
chemical steps. An array of 1024 peptides was synthesized in ten
steps, and its interaction with a monoclonal antibody was assayed by
epifluorescence microscopy. High-density arrays formed by lightdirected synthesis are potentially rich sources of chemical diversity
for discovering new ligands that bind to biological receptors and for
elucidating principles governing molecular interactions. The generality
of this approach is illustrated by the light-directed synthesis of a
dinucleotide. Spatially directed synthesis of complex compounds
could also be used for microfabrication of devices.
PMID: 1990438 [PubMed - indexed for MEDLINE]
ДНК-микрочипы высокой
плотности (High Density)
C
G
A
T
G
C
T
A
ДНК
Отжиг
Гибридизация
Гибридизация
в растворе
на подложке (носителе)
Гибридизационная камера
Центральная догма молекулярной биологии
Постановка эксперимента с
использованием ДНК-микрочипов
• Вход: проба (смесь мРНК различных генов)
• Выход: относительное количество мРНК
каждого гена
Термин: профиль экспрессии (паттерн)
• Возможность получения информации не об
одном или нескольких, а о многих (тысячах)
генов одновременно.
• Возможность функциональной характеристики
ранее неохарактеризованных генов.
Что можно изучать
с использованием ДНК-микрочипов?
- экспрессию генов в различных тканях
- экспрессию генов в норме и при
патологии (в нормальных и раковых
клетках)
- изменение экспрессии генов с течением
времени как результат внешнего
воздействия (взаимодействие клетки с
патогеном, лекарством)
Профили экспрессии (паттерны) различаются у нормальных и
раковых клеток или при различных типах рака. Излечимые и
неизлечимые виды лейкозов дают разные паттерны. По виду
паттернов можно с большой вероятностью предсказать течение
болезни на самой ранней стадии.
Nature Feb, 2000
Paper by
Allzadeh. A et al
Distinct types of
diffuse large
B-cell lymphoma
identified by gene
expression
profiling
Технология изготовления
микрочипов
к-ДНК микрочипы
к-ДНК микрочипы
Affymetrix
Affymetrix использует
комбинацию фотолитографии
и химического синтеза
олигонуклеотидов для
производства GeneChip®
микрочипов.
Affymetrix
Подготовка пробы для анализа
на микрочипе
к-ДНК микрочипы
эксперимент контроль
мРНК
обратная
транскрипция
Cy5
мечение
Cy3
кДНК
Cy3
Cy5
к-ДНК микрочипы
5’
мРНК
AAAA
+ oligo(dT),
CTP-Cy3,
CTP-Cy5
AAAA
TTTT
AAAA
TTTT
Affymetrix
RTase
DNApol
кДНК
5’
AAAA
+ oligo(dT)-T7
AAAA-T7
TTTT-T7
T7 pol
+ CTP-биотин
биотин-кРНК
Гибридизация
TTTT-5’
Стрептавидин-фикоэритрин
Получение результирующего
изображения
к-ДНК микрочипы
Лазер 1
возбуждение
флуор.
эмиссия
Лазер 2
к-ДНК микрочипы
к-ДНК микрочипы
к-ДНК микрочипы
к-ДНК микрочипы
YELLOW - если ген экспрессируется и в больной (Cy5) и в
нормальной (Cy3) тканях, то в данном пятне будет
гибридизоваться ДНК, меченная и красной и зеленой
красками, и в результате получится желтый цвет
RED - если ген экспрессируется только в больной (Cy5) ткани,
то в данном пятне будет гибридизоваться только ДНК,
меченная красной краской
GREEN - если ген экспрессируется только в здоровой (Cy3)
ткани, то в данном пятне будет гибридизоваться только ДНК,
меченная зеленой краской
BLACK – если ген не экспрессируется ни в больной, ни в
здоровой ткани
Affymetrix
Affymetrix
“.DAT” file:
1 клетка содержит олигонуклеотиды
1 типа
(сырые данные)
Affymetrix
PM = perfect match
MM = mismatch
Анализ изображения
Affymetrix
“.DAT” file
сырые данные
“.CEL” file
обработанные данные
Affymetrix
Примерно 100 пикселей на каждую
клетку
Интенсивности пикселей в клетке
суммируются и соответствуют
уровню экспрессии,
измеренному с помощью данного
олигонуклеотида
пиксель - сокращение от англ. "picture element" - элемент изображения,
наименьшая из его составляющих, получаемая в результате
дискретизации изображения (разбиения на далее неделимые элементы);
характеризуется прямоугольной формой и размерами, определяющими
пространственное разрешение изображения.
к-ДНК микрочипы
к-ДНК микрочипы
к-ДНК микрочипы
Обработка изображения
• Gridding (привязка к сетке): Где находятся пятна?
• Segmentation: Какие пиксели соответствуют пятну
(сигналу), а какие – фону?
• Измерение: Чему соответствует интенсивность
каждого пятна?
__________________________
Интенсивность пятна: средняя
интенсивность пикселей внутри пятна
Интенсивность фона: средняя интенсивность
пикселей в области, прилегающей к пятну
к-ДНК микрочипы
mRNA samples
sample1 sample2 sample3 sample4 sample5 …
Genes
1
2
3
4
0.46
-0.10
0.15
-0.45
0.30
0.49
0.74
-1.03
0.80
0.24
0.04
-0.79
1.51
0.06
0.10
-0.56
0.90
0.46
0.20
-0.32
...
...
...
...
5
-0.06
1.06
1.35
1.09
-1.09
...
Уровень экспрессии гена i в образце мРНК j
=
Log (Red intensity / Green intensity)
Log(Avg. PM - Avg. MM)
P – present
к-ДНК микрочипы
Affymetrix
A – absent M – marginal
Сравнение двух типов чипов
к-ДНК микрочипы
Affymetrix
Образец
кДНК-микрочипы
к-ДНК
микрочипы
Affymetrix
Affymetrix
Эксп. и контроль,
кДНК, меч. Cy5/Cy3
Эксп.,
кРНК, меч. биотином +
стрептавидин/фикоэритрин
(после гибридизации)
1 краска
2 краски
Пятно(spot),
Ячейка (cell)
кДНК (2-нитевая, 1000 25-зв. однонитев. синтетич.
п.н.)
олигонуклеотиды,
1 пятно/1 ген
11 PM/MM пар/ген
10000-20000 пятен/чип 55000-500000 ячеек/чип
Гибридизация
Эксп. и контроль к
кДНК
Эксп. к PM и MM
олигонуклеотидам
Детекция
отношение Cy3/Cy5
разность PM - MM
2 пробы (эксп. и
контроль) конкурируют
за одно место на чипе
много мест на чипе
(PM+MM) конкурирует за
одну пробу
Стоимость анализа
Источники вариабельности и ошибок в данных,
получаемых с помошью ДНК-микрочипов
Биологическая вариабельность
• Использование микрообъемов – случайные вариации в
концентрации иммобилизованной ДНК - до 30% (неоднородность
подложки, отличия в размерах пинов робота, различие в размерах
капель)
• Проблемы выделения мРНК, мечения пробы для гибридизации,
соблюдения условий гибридизации
• Проблемы анализа изображения: оконтуривание пятен
неправильной формы и с размытой границей, отделение эффектов,
связанных со светимостью фона, при двукрасочном варианте –
соблюдение требования пространственной однородности при
перекрытии пятен с разной окраской, присутствие пыли и пузырьков
на чипе, «пересвечивание» ярких пятен – влияние на соседние
более темные
• Неспецифическая гибридизация
Нормализация
Вычитание сигнала, соответствующего
негативным контролям
Отрицательные
контроли – на чипе
присутствуют ДНК,
для которых заведомо
нет соответствующих
мРНК в
анализируемых
образцах.
Отношение сигнала к сигналу,
соответствующему положительному
контролю.
Положительные контроли – в
препарат тотальной РНК вводят
индивидуальные РНК генов из
других организмов (специально
приготовленные), для которых есть
соответствующие точки на чипе
(Affy: dap, lys, phe, thr, thp из
Bacillus).
Такая нормализация используется в
однокрасочном варианте и
позволяет сравнивать результаты
различных экспериментов.
Отношение сигнала каждого гена в эксперименте
к его сигналу в контрольном образце
Логарифмическая
трансформация
Для упрощения математической
обработки данных значения
переводят в логарифмы.
Задача эксперимента
Планирование эксперимента
Эксперимент
Анализ изображения
Измерение экспрессии
Пре-процессинг
Нормализация
Оценка
Кластеризация
Биологическая проверка
и интерпретация
Предсказание
А
Н
А
Л
И
З
Таким образом,
• ДНК-микрочипы позволяют одновременно
анализировать информацию об
экспрессии многих тысяч генов.
• Основными типами использующихся в
настоящее время ДНК-микрочипов
являются кДНК-микрочипы и
олигонуклеотидные чипы фирмы
Affymetrix.
• кДНК-микрочипы основаны на
гибридизации смешанных
экспериментального и контрольного
образцов, меченых различными
флуоресцентными красками, к чипу,
на поверхность которого нанесены
двунитевые к-ДНК, соответствующие
~10000-20000 генам.
• Микрочипы Affimetrix основаны на
гибридизации меченой биотином кРНК
экспериментального образца с набором
Perfect Match и Mismatch
олигонуклеотидов, синтезированных на
подложке чипа, с последующей прокраской
стрептавидином-фикоэритрином. GeneChip
Human Genome U133 Plus 2.0 позволяет
одновременно анализировать 47000
транскриптов, среди которых 38500
охарактеризованных генов. Микрочип
включает 1.300.000 олигонуклеотидов
различных типов.
• Анализ полученных данных требует
многоэтапной математической
обработки с использованием
специальных статистических
методов.
Repositories for Microarray Data
ArrayExpress
ChipDB
http://www.ebi.ac.uk/arrayexpress/
http://staffa.wi.mit.edu/chipdb/public/
Gene Expression
http://www.ncbi.nlm.nih.gov/geo/
Omnibus
MUSC DNA
http://proteogenomics.musc.edu/quick
Microarray Database Site/musc_madb.php?page=home&ac
t=manage
Standford Microarray http://genome-www5.stanford.edu/
Database (SMD)
Yale Microarray
http://info.med.yale.edu/microarray/
Database
GeneX
http://www6.unito.it/genex/index.shtml
Tools for Gene Expression Analysis
List Of Lists
Annotated
(LOLA)
http://www.lola.gwu.edu/
a web driven database allowing researchers to identify
and correlate significant subsets of genes derived from
microarray expression profiling.
Oncomine
http://www.oncomine.org/main/index.jsp The goal of this
project is to curate publicly available cancer microarray
studies and provide data mining tools to efficiently query
genes and datasets of interest as well as meta-analyze
groups of studies. Links to Unigene, Swissprot, Biocarta,
HPRD, and KEGG.
DAVID,
EASE
http://apps1.niaid.nih.gov/david/
http://david.niaid.nih.gov/david/ease.htm
High-Throughput http://discover.nci.nih.gov/gominer/htgm.jsp
GoMiner and
a program that organizes lists of 'interesting' genes (for
example, under- and overexpressed genes from a
MatchMiner
microarray experiment) for biological interpretation in the
context of the Gene Ontology.
Двукрасочный вариант: проверка качества
включения флуоресцентных меток
Система контролей у Affimetrix
B2 oligo
Олигонуклеотид, добавляемый в гибридизационную
смесь. Гибридизуется к сайтам по краям чипа.
Используется для построения координатной сетки.
Poly-A
контроли dap,
lys, phe, thr,
thp из Bacillus
Гены Bacillus со введенным в них поли-А концом, с
которых нарабатывают смысловую cRNA, вводят в
препарат РНК и обрабатывают по общей схеме.
Используются в качестве внутренних контролей.
Контроли
гибридизации
bioB, bioC,
bioD и cre
Гены E. coli и б/ф P1, биотинилированные сRNA
транскрипты которых вводят в смесь для гибридизации
в разных концентрациях (1,5, 5, 25, 100 pM для bioB,
bioC, bioD и cre, соотв.). BioB – на пороге
чувствительности (1:100000).
Внутренние
Смотрят на соотношение 3’- и 5’-концевых проб для
контроли
этих генов, которое не должно быть больше 3. Если
GAPDH, актин больше – деградированная РНК, неэффективная
транскрипция ds cDNA или биотинилир. cRNA.
Download