Гибридизационные ДНКмикрочипы для анализа дифференциальной экспрессии генов Микрочип (биочип) = DNA-microarray array I [a'reI] n 1) порядок, построение 2) множество, совокупность 3) (of) набор, комплект 4) массив; матрица; сетка Организованное размещение молекул ДНК на специальном носителе www.the-scientist.com ДНК-микрочипы: - кДНК-микрочипы (двукрасочные с флуоресц. детекцией) - oлигонуклеотидные (двукрасочные с флуоресц. детекцией) - олигонуклеотидные (Affymetrix, однокрас. с флуоресц. детекцией) - мембранные к-ДНКмикрочипы (с радиоакт. детекцией) - гелевые к-ДНК-чипы (ИМБ РАН) Белковые микрочипы Немного истории… 1980-е: белковые чипы ~1991: химия синтеза ДНК на подложке (высокой плотности) – олигонуклеотидные чипы Affymetrix (Fodor, Stryer, Lockhart) ~1995: роботы для микрораскапывания – кДНК чипы Stanford University (Pat Brown and Dari Shalon) 1990-е: гелевые чипы ИМБ Однако, еще в 1982 Augenlicht и Kobrin предложили DNA array (Cancer Research), а в 1984 они сделали чип, включающий 4000 элементов для исследования раковых клеток. (Статья была отклонена Science и Nature) Cancer Res. 1982 Mar;42(3):1088-93. Cloning and screening of sequences expressed in a mouse colon tumor. Augenlicht LH, Kobrin D. Memorial Sloan-Kettering Cancer Center, Walker Laboratory, Rye, New York 10580 Polyadenylic acid-containing cytoplasmic RNA was isolated from a dimethylhydrazineinduced mouse transplantable colon carcinoma. Double-stranded complementary DNA synthesized using these molecules was inserted into the HindIII site of pBR322 using HindIII linkers, and the recombinant molecules were cloned in Escherichia coli. Clones were screened with labeled complementary DNA synthesized from the polyadenylic acidcontaining cytoplasmic RNA of the tumor or normal mouse colon, liver, or kidney. Of 378 clones screened with the normal colon and tumor probes, seven showed major increases in abundance in the tumor tissue as compared to normal, and one showed a major decrease. Twenty-five other sequences were found which showed smaller increases and 22 showed smaller decreases. Of 373 clones screened with tumor, colon, liver, and kidney probes, 79% exhibited little evidence of tissue specificity in expression. The data for those sequences which do show tissue-specific regulation of expression suggest that the tumor continues to express sequences characteristic of the colon but also shows a loss, or decrease, in other gene products, most of which (19 of 25) are characteristic of the colon. Finally, nine of 10 sequences which increase from low abundance in the normal colon to high abundance in the tumor are found at a moderate to high level in the liver and kidney. On the other hand, 23 of 36 sequences which show more modest increases in the tumor as compared to normal are scarce or absent in the liver and kidney. PMID: 7059971 [PubMed - indexed for MEDLINE] Science. 1991 Feb 15;251(4995):767-73. Light-directed, spatially addressable parallel chemical synthesis. Fodor SP, Read JL, Pirrung MC, Stryer L, Lu AT, Solas D. Affymax Research Institute, Palo Alto, CA 94304. Solid-phase chemistry, photolabile protecting groups, and photolithography have been combined to achieve light-directed, spatially addressable parallel chemical synthesis to yield a highly diverse set of chemical products. Binary masking, one of many possible combinatorial synthesis strategies, yields 2n compounds in n chemical steps. An array of 1024 peptides was synthesized in ten steps, and its interaction with a monoclonal antibody was assayed by epifluorescence microscopy. High-density arrays formed by lightdirected synthesis are potentially rich sources of chemical diversity for discovering new ligands that bind to biological receptors and for elucidating principles governing molecular interactions. The generality of this approach is illustrated by the light-directed synthesis of a dinucleotide. Spatially directed synthesis of complex compounds could also be used for microfabrication of devices. PMID: 1990438 [PubMed - indexed for MEDLINE] ДНК-микрочипы высокой плотности (High Density) C G A T G C T A ДНК Отжиг Гибридизация Гибридизация в растворе на подложке (носителе) Гибридизационная камера Центральная догма молекулярной биологии Постановка эксперимента с использованием ДНК-микрочипов • Вход: проба (смесь мРНК различных генов) • Выход: относительное количество мРНК каждого гена Термин: профиль экспрессии (паттерн) • Возможность получения информации не об одном или нескольких, а о многих (тысячах) генов одновременно. • Возможность функциональной характеристики ранее неохарактеризованных генов. Что можно изучать с использованием ДНК-микрочипов? - экспрессию генов в различных тканях - экспрессию генов в норме и при патологии (в нормальных и раковых клетках) - изменение экспрессии генов с течением времени как результат внешнего воздействия (взаимодействие клетки с патогеном, лекарством) Профили экспрессии (паттерны) различаются у нормальных и раковых клеток или при различных типах рака. Излечимые и неизлечимые виды лейкозов дают разные паттерны. По виду паттернов можно с большой вероятностью предсказать течение болезни на самой ранней стадии. Nature Feb, 2000 Paper by Allzadeh. A et al Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling Технология изготовления микрочипов к-ДНК микрочипы к-ДНК микрочипы Affymetrix Affymetrix использует комбинацию фотолитографии и химического синтеза олигонуклеотидов для производства GeneChip® микрочипов. Affymetrix Подготовка пробы для анализа на микрочипе к-ДНК микрочипы эксперимент контроль мРНК обратная транскрипция Cy5 мечение Cy3 кДНК Cy3 Cy5 к-ДНК микрочипы 5’ мРНК AAAA + oligo(dT), CTP-Cy3, CTP-Cy5 AAAA TTTT AAAA TTTT Affymetrix RTase DNApol кДНК 5’ AAAA + oligo(dT)-T7 AAAA-T7 TTTT-T7 T7 pol + CTP-биотин биотин-кРНК Гибридизация TTTT-5’ Стрептавидин-фикоэритрин Получение результирующего изображения к-ДНК микрочипы Лазер 1 возбуждение флуор. эмиссия Лазер 2 к-ДНК микрочипы к-ДНК микрочипы к-ДНК микрочипы к-ДНК микрочипы YELLOW - если ген экспрессируется и в больной (Cy5) и в нормальной (Cy3) тканях, то в данном пятне будет гибридизоваться ДНК, меченная и красной и зеленой красками, и в результате получится желтый цвет RED - если ген экспрессируется только в больной (Cy5) ткани, то в данном пятне будет гибридизоваться только ДНК, меченная красной краской GREEN - если ген экспрессируется только в здоровой (Cy3) ткани, то в данном пятне будет гибридизоваться только ДНК, меченная зеленой краской BLACK – если ген не экспрессируется ни в больной, ни в здоровой ткани Affymetrix Affymetrix “.DAT” file: 1 клетка содержит олигонуклеотиды 1 типа (сырые данные) Affymetrix PM = perfect match MM = mismatch Анализ изображения Affymetrix “.DAT” file сырые данные “.CEL” file обработанные данные Affymetrix Примерно 100 пикселей на каждую клетку Интенсивности пикселей в клетке суммируются и соответствуют уровню экспрессии, измеренному с помощью данного олигонуклеотида пиксель - сокращение от англ. "picture element" - элемент изображения, наименьшая из его составляющих, получаемая в результате дискретизации изображения (разбиения на далее неделимые элементы); характеризуется прямоугольной формой и размерами, определяющими пространственное разрешение изображения. к-ДНК микрочипы к-ДНК микрочипы к-ДНК микрочипы Обработка изображения • Gridding (привязка к сетке): Где находятся пятна? • Segmentation: Какие пиксели соответствуют пятну (сигналу), а какие – фону? • Измерение: Чему соответствует интенсивность каждого пятна? __________________________ Интенсивность пятна: средняя интенсивность пикселей внутри пятна Интенсивность фона: средняя интенсивность пикселей в области, прилегающей к пятну к-ДНК микрочипы mRNA samples sample1 sample2 sample3 sample4 sample5 … Genes 1 2 3 4 0.46 -0.10 0.15 -0.45 0.30 0.49 0.74 -1.03 0.80 0.24 0.04 -0.79 1.51 0.06 0.10 -0.56 0.90 0.46 0.20 -0.32 ... ... ... ... 5 -0.06 1.06 1.35 1.09 -1.09 ... Уровень экспрессии гена i в образце мРНК j = Log (Red intensity / Green intensity) Log(Avg. PM - Avg. MM) P – present к-ДНК микрочипы Affymetrix A – absent M – marginal Сравнение двух типов чипов к-ДНК микрочипы Affymetrix Образец кДНК-микрочипы к-ДНК микрочипы Affymetrix Affymetrix Эксп. и контроль, кДНК, меч. Cy5/Cy3 Эксп., кРНК, меч. биотином + стрептавидин/фикоэритрин (после гибридизации) 1 краска 2 краски Пятно(spot), Ячейка (cell) кДНК (2-нитевая, 1000 25-зв. однонитев. синтетич. п.н.) олигонуклеотиды, 1 пятно/1 ген 11 PM/MM пар/ген 10000-20000 пятен/чип 55000-500000 ячеек/чип Гибридизация Эксп. и контроль к кДНК Эксп. к PM и MM олигонуклеотидам Детекция отношение Cy3/Cy5 разность PM - MM 2 пробы (эксп. и контроль) конкурируют за одно место на чипе много мест на чипе (PM+MM) конкурирует за одну пробу Стоимость анализа Источники вариабельности и ошибок в данных, получаемых с помошью ДНК-микрочипов Биологическая вариабельность • Использование микрообъемов – случайные вариации в концентрации иммобилизованной ДНК - до 30% (неоднородность подложки, отличия в размерах пинов робота, различие в размерах капель) • Проблемы выделения мРНК, мечения пробы для гибридизации, соблюдения условий гибридизации • Проблемы анализа изображения: оконтуривание пятен неправильной формы и с размытой границей, отделение эффектов, связанных со светимостью фона, при двукрасочном варианте – соблюдение требования пространственной однородности при перекрытии пятен с разной окраской, присутствие пыли и пузырьков на чипе, «пересвечивание» ярких пятен – влияние на соседние более темные • Неспецифическая гибридизация Нормализация Вычитание сигнала, соответствующего негативным контролям Отрицательные контроли – на чипе присутствуют ДНК, для которых заведомо нет соответствующих мРНК в анализируемых образцах. Отношение сигнала к сигналу, соответствующему положительному контролю. Положительные контроли – в препарат тотальной РНК вводят индивидуальные РНК генов из других организмов (специально приготовленные), для которых есть соответствующие точки на чипе (Affy: dap, lys, phe, thr, thp из Bacillus). Такая нормализация используется в однокрасочном варианте и позволяет сравнивать результаты различных экспериментов. Отношение сигнала каждого гена в эксперименте к его сигналу в контрольном образце Логарифмическая трансформация Для упрощения математической обработки данных значения переводят в логарифмы. Задача эксперимента Планирование эксперимента Эксперимент Анализ изображения Измерение экспрессии Пре-процессинг Нормализация Оценка Кластеризация Биологическая проверка и интерпретация Предсказание А Н А Л И З Таким образом, • ДНК-микрочипы позволяют одновременно анализировать информацию об экспрессии многих тысяч генов. • Основными типами использующихся в настоящее время ДНК-микрочипов являются кДНК-микрочипы и олигонуклеотидные чипы фирмы Affymetrix. • кДНК-микрочипы основаны на гибридизации смешанных экспериментального и контрольного образцов, меченых различными флуоресцентными красками, к чипу, на поверхность которого нанесены двунитевые к-ДНК, соответствующие ~10000-20000 генам. • Микрочипы Affimetrix основаны на гибридизации меченой биотином кРНК экспериментального образца с набором Perfect Match и Mismatch олигонуклеотидов, синтезированных на подложке чипа, с последующей прокраской стрептавидином-фикоэритрином. GeneChip Human Genome U133 Plus 2.0 позволяет одновременно анализировать 47000 транскриптов, среди которых 38500 охарактеризованных генов. Микрочип включает 1.300.000 олигонуклеотидов различных типов. • Анализ полученных данных требует многоэтапной математической обработки с использованием специальных статистических методов. Repositories for Microarray Data ArrayExpress ChipDB http://www.ebi.ac.uk/arrayexpress/ http://staffa.wi.mit.edu/chipdb/public/ Gene Expression http://www.ncbi.nlm.nih.gov/geo/ Omnibus MUSC DNA http://proteogenomics.musc.edu/quick Microarray Database Site/musc_madb.php?page=home&ac t=manage Standford Microarray http://genome-www5.stanford.edu/ Database (SMD) Yale Microarray http://info.med.yale.edu/microarray/ Database GeneX http://www6.unito.it/genex/index.shtml Tools for Gene Expression Analysis List Of Lists Annotated (LOLA) http://www.lola.gwu.edu/ a web driven database allowing researchers to identify and correlate significant subsets of genes derived from microarray expression profiling. Oncomine http://www.oncomine.org/main/index.jsp The goal of this project is to curate publicly available cancer microarray studies and provide data mining tools to efficiently query genes and datasets of interest as well as meta-analyze groups of studies. Links to Unigene, Swissprot, Biocarta, HPRD, and KEGG. DAVID, EASE http://apps1.niaid.nih.gov/david/ http://david.niaid.nih.gov/david/ease.htm High-Throughput http://discover.nci.nih.gov/gominer/htgm.jsp GoMiner and a program that organizes lists of 'interesting' genes (for example, under- and overexpressed genes from a MatchMiner microarray experiment) for biological interpretation in the context of the Gene Ontology. Двукрасочный вариант: проверка качества включения флуоресцентных меток Система контролей у Affimetrix B2 oligo Олигонуклеотид, добавляемый в гибридизационную смесь. Гибридизуется к сайтам по краям чипа. Используется для построения координатной сетки. Poly-A контроли dap, lys, phe, thr, thp из Bacillus Гены Bacillus со введенным в них поли-А концом, с которых нарабатывают смысловую cRNA, вводят в препарат РНК и обрабатывают по общей схеме. Используются в качестве внутренних контролей. Контроли гибридизации bioB, bioC, bioD и cre Гены E. coli и б/ф P1, биотинилированные сRNA транскрипты которых вводят в смесь для гибридизации в разных концентрациях (1,5, 5, 25, 100 pM для bioB, bioC, bioD и cre, соотв.). BioB – на пороге чувствительности (1:100000). Внутренние Смотрят на соотношение 3’- и 5’-концевых проб для контроли этих генов, которое не должно быть больше 3. Если GAPDH, актин больше – деградированная РНК, неэффективная транскрипция ds cDNA или биотинилир. cRNA.