Биоинформатика Факультет биоинженерии и биоинформатики МГУ имени М.В.Ломоносова 2013 год Занятие 1. Вводное. Что такое биоинформатика? Преподаватели 1 курса Дарья Владимировна ДИБРОВА Андрей Сергей Владимирович Игоревич МИТРОФАНОВ АЛЕКСЕЕВСКИЙ Сергей Александрович СПИРИН Администраторы комп.класса Лидия Куртовна СМИРЕНИНА Даниил Андреевич АЛЕКСЕЕВСКИЙ 1 2 История одного открытия… …CRISPR С чего иногда начинается открытие? 3 • Статья Yoshizumi Ishino с соавторами (1987), была посвящена секвенированию (т.е. узнаванию последовательности, от англ. sequence) и описанию одного из многих генов кишечной палочки (Escherichia (в то время последовательность coli) каждого гена получалась в ходе кропотливой работы) • В самом конце статьи в 6 (!) предложениях описывалась случайно обнаруженная рядом с этим геном необычная последовательность ДНК (Ishino et al., Journal of Bacteriology, 1987) Неожиданное наблюдение ??? 4 Последовательность >2875647-2876590|U00096|Escherichia_coli_str.K12_substr.MG1655 TGAAAATGGGAGCTGGGAGTTCTACCGCAGAGGCGGGGGAACTCCAAGTGATATCCATCA TCGCATCCAGTGCGCCCGGTTTATCCCCGCTGATGCGGGGAACACCAGCGTCAGGCGTGA AATCTCACCGTCGTTGCCGGTTTATCCCTGCTGGCGCGGGGAACTCTCGGTTCAGGCGTT GCAAACCTGGCTACCGGGCGGTTTATCCCCGCTAACGCGGGGAACTCGTAGTCCATCATT CCACCTATGTCTGAACTCCCGGTTTATCCCCGCTGGCGCGGGGAACTCCCGGGGGATAAT GTTTACGGTCATGCGCCCCCCGGTTTATCCCCGCTGGCGCGGGGAACTCTGGGCGGCTTG CCTTGCAGCCAGCTCCAGCAGCGGTTTATCCCCGCTGGCGCGGGGAACTCAAGCTGGCTG GCAATCTCTTTCGGGGTGAGTCCGGTTTATCCCCGCTGGCGCGGGGAACTCTAGTTTCCG TATCTCCGGATTTATAAAGCTGACGGTTTATCCCCGCTGGCGCGGGGAACTCGCAGGCGG CGACGCGCAGGGTATGCGCGATTCGCGGTTTATCCCCGCTGGCGCGGGGAACTCGCGACC GCTCAGAAATTCCAGACCCGATCCAAACGGTTTATCCCCGCTGGCGCGGGGAACTCTCAA CATTATCAATTACAACCGACAGGGAGCCCGGTTTATCCCCGCTGGCGCGGGGAACTCAGC GTGTTCGGCATCACCTTTGGCTTCGGCTGCGGTTTATCCCCGCTGGCGCGGGGAACTCTG CGTGAGCGTATCGCCGCGCGTCTGCGAAAGCGGTTTATCCCCGCTGGCGCGGGGAACTCT CTAAAAGTATACATTTGTTCTTAAAGCATTTTTTCCCATAAAAACAACCCACCAACCTTA ATGTAACATTTCCTTATTATTAAAGATCAGCTAATTCTTTGTTT 5 Clustered Regularly Interspaced Short 6 Palindromic Repeats TGAAAATGGGAGCTGGGAGTTCTACCGCAGAGGCGGGGGAACTC AGCGTCAGGCGTGATCGCATCCAGTGCGCCCGGTTTATCCCCGCTGATGCGGGGAACACC CGGTTCAGGCGTTAATCTCACCGTCGTTGCCGGTTTATCCCTGCTGGCGCGGGGAACTCT TAGTCCATCATTGCAAACCTGGCTACCGGGCGGTTTATCCCCGCTAACGCGGGGAACTCG CGGGGGATAATCCACCTATGTCTGAACTCCCGGTTTATCCCCGCTGGCGCGGGGAACTCC GGGCGGCTTGGTTTACGGTCATGCGCCCCCCGGTTTATCCCCGCTGGCGCGGGGAACTCT AGCTGGCTGCCTTGCAGCCAGCTCCAGCAGCGGTTTATCCCCGCTGGCGCGGGGAACTCA AGTTTCCGGCAATCTCTTTCGGGGTGAGTCCGGTTTATCCCCGCTGGCGCGGGGAACTCT CAGGCGGTATCTCCGGATTTATAAAGCTGACGGTTTATCCCCGCTGGCGCGGGGAACTCG CGACCCGACGCGCAGGGTATGCGCGATTCGCGGTTTATCCCCGCTGGCGCGGGGAACTCG CAAGCTCAGAAATTCCAGACCCGATCCAAACGGTTTATCCCCGCTGGCGCGGGGAACTCT GCCATTATCAATTACAACCGACAGGGAGCCCGGTTTATCCCCGCTGGCGCGGGGAACTCA GGTGTTCGGCATCACCTTTGGCTTCGGCTGCGGTTTATCCCCGCTGGCGCGGGGAACTCT CGTGAGCGTATCGCCGCGCGTCTGCGAAAGCGGTTTATCCCCGCTGGCGCGGGGAACTCT CTAAAAGTATACATTTGTTCTTAAAGCATTTTTTCCCATAAAAACAACCCACCAACCTTA ATGTAACATTTCCTTATTATTAAAGATCAGCTAATTCTTTGTTT Накопление знаний, гипотезы CRISPR CRISPR найдены у найдены у CRISPR туберкулёзной самых разных впервые палочки прокариот и замечены у CRISPR даже в кишечной (Mycobacterium найдены у tuberculosis) митохондриях палочки галофильных (Escherichia архей coli) 1987 1992 1993 1995 …возможно, CRISPR участвуют в расхождении ДНК при делении клетки (Hermans et al., Journal of Bacteriology, 1992) (Groenen et al., Molecular Microbiology, 1993) (Mojica et al., Molecular Microbiology, 1995) (Mojica et al., Molecular Microbiology, 2000) (Jansen et al., Molecular Microbiology, 2002) ! CRISPR встречается в геномах рядом с набором генов, кодирующих белки CAS (CRISPR-Associated Proteins) 2000 2002 …что бы ни делали CRISPR, вероятно, этот механизм широко применяется прокариотами …некоторые белки CAS похожи на белки, которые расплетают и разрезают ДНК. Возможно, они отвечают за создание повторов CRISPR 7 Система CRISPR/CAS в геноме 8 гены белков CAS ...TGAAAATGGGAGCTGGGAGTTCTACCGCAGAGGCGGGGGAACTC AGCGTCAGGCGTGATCGCATCCAGTGCGCCCGGTTTATCCCCGCTGATGCGGGGAACACC CGGTTCAGGCGTTAATCTCACCGTCGTTGCCGGTTTATCCCTGCTGGCGCGGGGAACTCT TAGTCCATCATTGCAAACCTGGCTACCGGGCGGTTTATCCCCGCTAACGCGGGGAACTCG CGGGGGATAATCCACCTATGTCTGAACTCCCGGTTTATCCCCGCTGGCGCGGGGAACTCC GGGCGGCTTGGTTTACGGTCATGCGCCCCCCGGTTTATCCCCGCTGGCGCGGGGAACTCT ... CRISPR и бактериофаги?! 9 В 2005 году путем сравнения последовательностей было обнаружено, что в неповторяющихся фрагментах CRISPR находятся последовательности из ДНК бактериофагов (Pourcel et al., Microbiology, 2005) (Mojica et al., J. Mol. Evol., 2005) (Bolotin et al., Microbiology, 2005) (Makarova et al., Biology Direct, 2006) Система CRISPR/CAS участвует в защите прокариот от их вирусов – бактериофагов www.wikipedia.org Экспериментальное подтверждение 10 Гипотеза, сделанная на основании сравнения последовательностей (in silico): система CRISPR/CAS – это система приобретенного иммунитета бактерий против бактериофагов Да, наличие в CRISPR-кассете последовательности из генома определенного фага отличает устойчивый к данному фагу штамм от восприимчивого Да, в колониях бактерий под действием бактериофага отбираются те клетки, которые смогли встроить кусочки генома этого фага в свой геном (Barangou et al., Science, 2007) 11 Обучение: встраивание фрагмента чужеродной ДНК в CRISPRкассету Приспособление вируса: мутация Иммунный ответ: уничтожение ДНК, которая комплементарна одному из фрагментов CRISPR-кассеты (Deveau et al., Annu. Rev. Microbiol., 2010) Большое спасибо бактериям за 12 защиту от фагов! 1) Система рестрикции-модификации (Нобелевская премия по медицине в 1978 г.) Рестриктаза ДНК («разрезаза», от англ. restriction) Метилаза ДНК Короткий участок ДНК (4-6 нуклеотидов) Werner Arber ! CH3 CH3 CH3 Daniel Nathans CH3 CH3 CH3 Hamilton O. Smith www.wikipedia.org Большое спасибо бактериям за 13 защиту от фагов! 1) Система рестрикции-модификации (Нобелевская премия по медицине в 1978 г.) Чрезвычайно широко применяется в генной инженерии для конструирования нужных молекул ДНК Плазмида Бактерия Проблема! • • При работе с эукариотами мало просто дать плазмиду; надо встроить ДНК в геном в определенное место Сделать это с помощью рестриктаз нельзя – в настоящем геноме очень много их сайтов Большое спасибо бактериям за 14 защиту от фагов! 2) Система CRISPR/CAS (открыта в 2007 г.) • В 2012 году на основе белка Cas9, который режет чужеродную ДНК, комплементарную фрагменту РНК бактериофага, создана система, которая в пробирке разрезает ДНК в нужном месте (Jinek et al., Science, 2012) • Система состоит из Cas9 и соответствующей РНК. В 2013 году опубликовано более 30 работ об успешном применении этой системы для изменений геномов в культурах клеток человека, растений, червяков и др. организмов (ни одной работы в 2012 году и ранее!) (Richter et al., Int. J. Mol. Sci, июль 2013, обзор) • Ожидается, что такая система в недалеком будущем может быть использована в генной терапии человека Компоненты системы CRISPR/CAS 15 для генной инженерии эукариот ЯДРО ДНК РНК РНК комплементарная последовательности, которую нужно разрезать в геноме Cas9 Плазмида, кодирующая белок Cas9, к которому исскуствено добавлен сигнал локализации в ядре (NLS) (Richter et al., Int. J. Mol. Sci, 2013) 16 Чем будем заниматься мы? …1 семестр Анализ численных результатов экспериментов Объект биоинформатики 17 Графики: (Fasano et al., PNAS, 1982) Исходные данные: линейные гетерополимерные биологические молекулы (ДНК, РНК, белки) Данные об экспрессии генов: Последовательности http://www.illumina.com Структуры 18 линейные гетерополимерные биологические молекулы (ДНК, РНК, белки) Био информатика Био информатика Цель исследования: изучение устройства ДНК, РНК и белков для (лучшего) понимания биологических функций конкретных макромолекул Цель исследования: разработка методов исследования биологических макромолекул, применимых в самых разных случаях; поддержание баз данных Больше математики Больше программирования …Меньше биологии Устройство семестра • • • • • 19 В семестре несколько блоков Блок состоит из нескольких практических занятий Практическое занятие состоит из вводной части и времени начала (!) выполнения задания по этому занятию (практикума) в компьютерном классе. Иногда на занятии проводятся миниконтрольные Форма отчета по большинству практикумов – протокол работы. Он оценивается по балльной системе, которая является сквозной для всех лет обучения За каждый блок нужно получить промежуточный зачет, который ставится при зачете всех сданных практикумов и (если они проводились) контрольных Зачет за семестр ставится при обязательном наличии зачетов за все блоки и по результатам сдачи устного зачета Устройство 1 семестра 20 Каждый студент получает индивидуальный белок и бактерию для последующего анализа Блок №1: Знакомство с геномами прокариот Блок №2: Основы программирования. Анализ некоторых свойств генома выданной бактерии с помощью простейших средств программирования Блок №3: Средства табличных редакторов (MS Excel, LO Calc) и HTML для обработки и представления данных