NB! лучше смотреть презентацию в режиме редактирования, так как многие слайды имеют комментарии. Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Компьютерная революция в биомедицине презентация была подготовлена для семинара компании Интерлабсервис революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы А.Солдатов, MPI for Molecular Genetics, Berlin проф. Ханс Лерах – руководитель лаборатории Татьяна Бородина, кбн – «мокрая» биология Алексей Давыдов, аспирант – «мокрая» биология Дмитрий Пархомчук, кбн – биоинформатика Область интересов: анализ экспрессии генов и гаплотипирование. Группа была вовлечена в NGS-сиквенирование с первых моделей машин. Принимала участие в нескольких интернациональных проектах. Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin В двух словах о всём выступлении революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • в настоящее время в биомедицине происходит компьютерная революция • эта революция сильно изменит биологию, медицину и ощутимо поменяет повседневную жизнь • в настоящее время двигателем революции является внедрение высокопроизводительных методов сиквенса ДНК в исследовательскую и медицинскую практику Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Чем хороши компьютеры? революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • сложные задачи можно решать сложным способом, постепенно совершенствуя подходы и алгоритмы коллективными усилиями • можно быстро обработать большие объёмы данных • алгоритмы легко адаптируются к подобным задачам Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Двигатель революции: сиквенс ДНК • цифровые данные: однажды полученный результат не меняется • ожидаемое будущее: все уже давно ждут, когда «понятный геном» и «понятный транскриптом» изменят нашу жизнь к лучшему. революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • разнообразные области применения: многие области биомедицины выиграли/выиграют от внедрения «быстрого и дешевого сиквенса». Этому будет посвящена существенная часть слайдов • высокая чувствительность: возможность работать с биопсиями, парафиновыми срезами, на уровне отдельных клеток • необычно и странно, что уже несколько лет общий прогресс определяется главным образом аномально высокой скоростью улучшения сиквенса. Из-за этого тот, кто хочет преуспеть в ближней перспективе, должен (кроме всего прочего) ответственно отнестись к выбору сиквенсовой платформы • в дальней перспективе важно сознавать, что мы участвуем в компьютерной революции, а не в конкурсе на лучший сиквенсовый прибор. Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Карта распределения по планете сиквенаторов следующих поколений http://pathogenomics.bham.ac.uk/hts/ Масштабные сиквенсовые проекты революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Масштабные сиквенсовые проекты • 1000 Genomes Project: поиск геномных вариаций в ~20 популяциях • PGP: personal genome project, изучение вклада наследственности и среды в проявление различных признаков; секвенирование геномов добровольцев, согласных предоставить личную информацию революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • GEUVADIS Genetic European Variation in Disease: медицинскя интерпретация сиквенсовых данных для разных моно- и полигенных заболеваний; на основе RNA-Seq и ExonSeq • ESGI: European Sequencing and Genotyping Infrastructure: организация NGS инфраструктуры для европейского научного сообщества • IHEC: International Human Epigenome Consortium: характеристика эпигенома человека, ~1000 образцов Раковые программы выявление диагностичеких маркеров, анализ и выбор лечения • ICGC: International Cancer Genome Consortium: подпрограммы по разным видам рака (напрмер, рак простаты, детские опухоли мозга) • Treat 1000: разные виды рака • OncoTrack: рак прямой кишки • CAGEKID: рак почки • Treat 20: меланома Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Геном Сиквенс и ресиквенс революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • микроорганизмы / малые геномы: самый эффективный подход • большие геномы: ресиквенс с анализом небольших перестроек был хорош всегда, сиквенс de novo и анализ больших перестроек совершенствуются на глазах • классификация организмов по молекулярным признакам • сиквенс определенных областей генома: обогащение: функциональный экзом (~5%) и произвольно выбранных областей Геномная архитектура • позиция нуклеосом • трёхмерная структура генома: 3C (hypothesis-free) и 5C (высокопроизводительный анализ) Эпигенетика • метилирование: сиквенс после бисульфидной обработки или ChIP-Seq • возможно, машины третьего поколения смогут определять модификации напрямую Взаимодействие нуклеиновых кислот с белками • ChIP-Seq • полногеномный неселективный анализ мест посадки белков • гиперчувствительность к нуклеазам, FAIRE-Seq • анализ специфичности взаимодействия (напрямую), поиск консенсусных последовательностей Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Геномные вариации революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • анализ всех видов вариаций: замены, малые делеции/инсерции, CNV (важно при психических расстройствах), большие хромосомные перестройки • гаплотип: пока довольно сложно, но, по-любому, сиквенсом • GWAS – сейчас на чипах. Снижение цены приведёт к переключению на сиквенс. При этом качество и охват повысятся. Будет окончательный результат, а не QTL. Преодоление кризиса «потерянной наследственности» Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Транскриптом (RNA-Seq) Полнота анализа • все типы РНК: кодирующие последовательности, малые некодирующие РНК, антисенс-транскрипция и т.д. революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • чувствительность: при адекватной организации эксперимента, можно быть уверенным, что замечены все действующие РНК • структура транскриптов: очень хорошо с аллельной экспрессией и РНКредактированием, есть прогресс в анализе сплайс-вариантов RNA-Seq позволяет • определять как относительный, так и абсолютный уровни экспрессии • аннотировать новые и уточнять аннотацию известных генов • смотреть отдельно ядерную, цитоплазматическую, ассоциированную с рибосомами (в цитоплазме и на мембранах) и т.п. РНК • выявлять присутствие в образце микроорганизмов и вирусов Чувствительность пропорциональна цене, можно грубо оценить как ~$150 за уровень 1 копия на эукариотическую клетку Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Протеомика революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы Измерение концентраций белков и анализ белок-белковых взаимодействий. Нуклеотидные последовательности можно использовать в качестве маркеров. Количество кодируемых вариантов экспоненциально растёт с длиной последовательности: 4N Сиквенатор можно рассматривать как прибор, различающий нуклеотидные коды. Опубликованы работы, где анализировались концентрация в растворе одновременно десятков белков. Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Сравнительный функциональный анализ Сравнение геномов разных видов позволяет революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • выявить функциональные элементы генома • связать эволюционные нововведения с появлением в геноме новых функциональных участков, типа проект «Origins of Multicellularity» • выявить механизмы и движущие факторы эволюции для разных эпох • разобраться, что отличает нас от ближайших и дальних родичей Внутривидовое сравнение геномов • причина тонких различий в реакции на факторы окружающей среды (болезни) и поведении • факторы, определяющие сложные полигенные признаки (рост, вес, предрасположенность к распространенным болезням) • механизмы рекомбинации • факторы отбора в «историческое» время • история расселения человечества Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Медицина Микробиология • выявление патогенов: холера на Гавайях, токсичная E.coli в Германии • анализ симбиотических организмов: микробиом революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы Предрасположенность к болезни → генотип • GWAS, вовлеченные гены, молекулярные причины болезни, выбор мишени • редкие болезни, семейный анализ: «быстрый» тест сиквенсом кодирующих последовательностей • иммунный репертуар B- и T-клеточных рецепторов: подверженность болезням, ответ на вакцинацию • неинвазивная и пренатальная диагностика по ДНК в крови Болезнь → профиль экспрессии • классификация опухолей, тонкий и/или ранний диагноз • спектр мутагенеза – причина опухолеобразования Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Онкология революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы Проекты по сиквенсу разных типов опухолей • спектр мутагенеза, «завершить» список онкогенов • тестирование лекарств на клеточных линиях и ксенографах • тонкая диагностика и выработка «стандартных» способов лечения • неинвазивная диагностика (посттреатмент): опухолевые ДНК и клетки в крови Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Превентивная медицина Превентивная медицина неизбежна революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • 4 миллиона американцев страдают болезнью Альцгеймера. Это обходится национальной системе здравоохранения в $500 миллионов в год. В связи с увеличением продолжительности жизни ожидается, что сумма возрастёт до $1-2 миллиардов (5-10% ВВП) в ближайшие десятилетия • ежегодно тратится ~$132 миллиона на лечение диабета второго типа. Ранний диагноз и умеренное изменение стиля жизни способны существенно снизить расходы • 60% страховых выплат приходится на последние два года жизни Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Персональная медицина Персональная медицина • лекарство для черных (сосуды) BiDil революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • Vioxx scandal, популярное лекарство было отозвано из-за побочных эффектов • практически все противораковые лекарства очень вредны – очень востребован персональный подбор Виртуальный пациент / доктор • инициатива http://www.itfom.eu/ сиквенс, масс-спек и другие объективные анализы Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin DTC (direct-to-consumer) тестирование: компании-участники Весной 2010 года более 30 DTC-компаний предлагали более 400 тестов, связанных со здоровьем. революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы Пока – либо цирк (практ. польза – выбор супруга для малых замкнутых популяций), зато дешевый, либо всерьез, но дорого, но толку всё равно мало (как результат – плохое покрытие страховыми взносами, превентивный сиквенс точно не оплатят, разве что постфактум, при выявлении проблемы). Проблема серьёзного подхода – либо отсутствие фазы, либо очень дорого. Практически все компании позиционируют свои тесты как "для образовательных и информационных целях", но не медицинские. В первую очередь это связано с лицензированием медицинской деятельности. Реальная польза ограничена и сложно получить лицензию на такую работу в области здравоохранения. Интересно, что DTC-компании уже проводят генетические исследования в собственных базах данных: (i) Genographic проект, (ii) пара публикаций от 23andMe Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin DTC тестирование: типичный пакет • происхождение человека (Европа, Азия, Африка, Южная и Северная Америка и т.п.), количественно (в процентах). Актуально для Американцев. Отдельно отслеживаются материнская линия -- по митохлндриальной ДНК отцовская -- по Y-хромосоме революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • SNP, связанные с разными забавными признаками, не влияющими на жизнеспособность, типа чувствительность к запаху мочи после спаржи, умение сворачивать язык в трубочку, цвет глаз, консистенция ушной серы, склонность к облысению, способность вкус горечи брюссельской капусты, способность потреблять молоко, чихание на ярком солнце • SNP, связанные с признаками, которые могут быть полезны сейчас, но не могли подвергаться отбору ранее: -- скорость метаболизма кофеина -- генетическая предрасположенность к героиновой зависимости -- восприимчивость к лекарствам • не рекламируется, но очевидно может использоваться для установления родственных связей (в том числе -- отцовства и материнства) • редкие наследственные заболевания -- высокий риск заболеть, но заболевания действительно редкие -- подавляющее большинство пациентов ничего подобного не обнаружат • "сильный прогноз" на распространенные заболевания -- единственный пример apolipoprotein E (APOE): 2% населения гомозиготы, 15-кратно выше риск заболеть -- забавно, что о нем Уотсон и не хотел узнавать. * "слабые прогнозы" на распространенные заболевания (результаты GWAS) - довольно много, но с очень слабой предсказательной ценностью Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin DTC тестирование: «за» и «против» в штатах New York и California запрещено DTC генетическое тестирование революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы ЗА • кто может запретить читать собственный геном? • информация о собственных рисках действеннее, чем информация об общих • SNP-типирование готовит общество к WGS • проводится работа по стандартизации интерпретации геномного анализа: NIH создал онлайн Genetic Testing Registry (GTR) ПРОТИВ • неспециалистам лучше не «копаться в геноме»: (i) если обнаружится высокий риск неизлечимых заболеваний, это может вызвать панику (от ненужных расходов на анализы до самоубийства), (ii) генетическая "чистота" может вызвать ложную успокоенность • есть более эффективные способы потратить те же деньги ради здоровья: если тратить $500 - 1,000, чтобы уменьшить риск сердечно-сосудистых заболеваний и диабета, то лучше сменить диету или записаться в тренажерный зал • сейчас разные DTC-компании используют разные алгоритмы для оценки рисков и полученные результаты различаются • раз уж грядёт WGS, то стоит ли тратиться на несовершенное SNP-типирование? Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin https://www.23andme.com/ Silicon Valley; California, ноябрь 2007 основатели Anne Wojcicki (её муж -- Sergey Brin -- один из владельцев Google) и Linda Avey Вначале -- $999 -- 600,000 SNP на ките от Illumina С сентября 2008 -- $399, На сегодня – лидер области. Собственно анализ проводит посторонняя лаборатория. Фирма проводит webпредставление результатов, прогнозы, хранение, предоставление новой информации по мере исследований. Sergey Brin обнаружил, что он носитель G2109S мутации, приводящей к 60% риску болезни Паркинсона. Написал в блоге, что это дало ему возможность готивится к возможной проблеме много лет: поддерживать и проводить исследования в этой области, выполнять профилактические упражнения. http://www.decode.com/ CEO Kari Stefansson Исландская биотехнологическая компания, предложила в ноябре 2007 web-сервис deCODEme для непосредственной работы с потребителями. Сами являются первооткрывателями многих ассоциаций, сами проводили генотипирование. Пожалуй, наиболее академически-сильная компания. 600,000 SNP на ките от Illumina Исландия -- население: ~300,000, ~95% - местные. deCODE Genetics имеет материал на ~140,000, из них 40,000 полностью генотипированы Компания обанкротились. В 2010 повысила цену на deCODEme до нереальных $2000 и, фактически, вышла из игры http://www.navigenics.com/ New York, весна 2008 основатель - онколог David Agus "Doc Hollywood" -- родословная только для уточнения вероятности прогноза -- не интересуются "развлекательными" количественными признаками; то же для неизлечимых (без профилактических упражнений) болезней «I just hope in my heart we didn't do this too early» абстрактная оценка от Navigenics: среди знакомых и родственников, прошедших тест, примерно половина предприняла какие-то позитивные действия: сходили к врачу или записались в тренажорный зал. История человечества: прошлое революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • история расселения • связь с жизнедеятельностью (сельское хозяйство) • факторы отбора в разное историческое время: экспрессия лактазы во взрослом состоянии, цвет кожи • история с обр. стороны: персональная история – откуда предки Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin История человечества: будущее несмотря на мрачные картины GATTACA , серьёзных этических проблем не ожидается. Скорее наоборот, подобные проблемы неизбежны при застое. революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • выбор эмбриона перед имплантацией (только что разрешено в Европе) – б.м. очевидно распространяется на рисковые ситуации • выбор супруга (опять же, без Шекспировских альтернатив) • внебрачных детей типа «папа не знал» – не будет вообще • спортсмены – уже проводятся генетические тесты. Но не как в Гаттаке, а выбор среди равных • страховки – если шансы заболеть разные, то справедливо, если разная оплата • не только диагнозы, но и текущее состояние проблемы Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Выбор платформы 5 коммерчески доступных «больших» платформ: • Roche GS-FLX 454 Genome Sequencer революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • Illumina Genome Analyzer • ABI SOLiD analyzer • Polonator G.007 • Helicos HeliScope 2 «малые» платформы: • Illumina MiSeq • ABI Ion Torrent И на подходе машины третьего поколения Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Третье поколение революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin http://www.my454.com/ 454 Life Sciences была организована в 2000 г. Roche приобрела «454» за $150 million • первая коммерческая NGS-платформа: 2004г. • статья в Nature, описывающая 454технологию: 25 million нуклеотидов за четыре часа: август 2005 • второй идивидуальный геном человека (James D. Watson): 2008 • геном Неандертальца: май 2010 • на сегодняшний день максимальная среди NGS-платформ длина чтения: средняя – 400bp, макс. – 600bp. http://www.illumina.com/ Solexa, Prof. Shankar Balasubramanian Illumina приобрела Solexa за $600 million • вторая NGS-платформа на рынке. Solexa отправила первые инструменты в геномные центры летом 2006 • GA II: весна 2008 • HiSeq2000 – начало 2010 • MiSeq – конец 2011 • в настоящее время – наиболее распространённая платформа http://www.appliedbiosystems.com/ SOLiD: $120 million Agencourt Personal Genomics Ion Torrent: $375 million • довольно долго конкурировала с Illumina по цене сиквенса • качество ресиквенса выше, чем у Illumina параметр Выбор платформы область применения; приготовление библиотек; типы ранов (SR, PE, barcoding), параллелизация качество революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы HiSeq2000 SOLiD 5500xl ≈ каналов в ячейке: HiSeq - 8, SOLiD - 6 • одинаковое, если проводится выравнивание относительно референсного генома • для de novo сборки качество выше у Illumina цена машины SOLiD можно купить примерно в два раза дешевле независимость каналов Illumina: 2 независимых ячейки SOLiD: 12 независимых каналов производительность ~49Gb/день ~11Gb/день цена (реактивы) ~€36/Gb ~€50/Gb цена сиквенса генома человека ~€3330, три недели ~€4765, четыре недели длина сиквенса SR: до 100nt PE: до 100 и 100nt SR: до 75nt PE: до 75 и 35nt размер вставки <600bp <300bp 5 часов 1,5 дня максимум 4 библиотеки в день (на одной EZ Bead System) время приготовления flowcell удобство и стабильность Illumina лучше SOLiDa: * гораздо реже требует ремонта * производительность соответствует или больше заявленной * удобнее и заметно безопаснее в смысле загрязнения старой библиотекой оптимизация сиквенса и использование нестандартных библиотек Illumina существенно удобнее: легкое перепрограммирование машины, простой переход на новые сиквенсовые праймеры Выбор платформы: малые машины • существенно слабее и «дороже», чем большие братья. Выход MiSeq: ~1/50 одной дорожки HiSeq2000, а цена: ~1/2 одной дорожки. революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • «быстрые» сиквенсы (часы вместо дней) – важно для разработки новых методов и клинической диагностики • IonTorrent, MiSeq – выбор в пользу MiSeq. Основные причины: -- полная совместимость с большим братом -- большая гибкость за счёт возможности читать обе цепи Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Выбор платформы: малые машины Ion Torrent MiSeq ~96k€ (сиквенатор, сервер, Ion OneTouch система и MwSt) 125k€ (вкл. MwSt) дополнительное оборудование не нужно сервер (~15k) тип сиквенса single read single read, PE максимум 100nt, в ближайшее время 200nt; ожидается до 400nt в 2012 максимум 2x150nt цена машины революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы длина рида размер вставки цена сиквенса число ридов выход с одного прогона приготовление библиотек время одного сиквенса ~600bp ~400€ (314) - 750€ (316 или 318) 330€ (1x50bp) - 630€ (2x150bp) 0.1-10 M (зависит от чипа) ~3.4 M (~6.8 M for PE) чип ячеек нуклеотидов 314 1,2 M >10 Mb 316 6,2 M >0,1 Gb 318 11,1 M >1 Gb 0.2 Gb (1x50bp) - >1 Gb (2x150bp) ~10 часов ~3 часа с OneTouch системой как для «большой» Illumina ~1,5 hours (Nextera) ~3 часа 4 часа для 1 x 35bp 27 часов для 2x150bp reads Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Быстрое развитие области революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • не стоит терять время на оптимизацию или примитивно экономить: улучшаются параметры ридов (длина, качество), цена падает • важно учитывать быстрое развитие, чтобы не целиться в то, что уже минуло • цена смещается в сторону вычислений • делать то, что можно проанализировать сейчас – иначе переплата • неправильно брать параметры с запасом • был слишком резкий скачек, не стоит строить иллюзии о простоте анализа – все утрясётся и анализы будут аккуратные и сложные Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Биоинформатика NB! один и тот же термин «сиквенирование» для классической и новой технологии революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • соотношение затрат на «мокрую» биологию и биоинформатику падает... и будет только хуже • вырабатываются стандарты • cloud computing и возможность делать на стороне Медикобиологические базы знаний • модельные организмы, модельные ткани: dbSNP и геномных перестроек, экспрессия: анотация экспрессирующихся участков, базы сплайс-вариантов, уровень и вариабельность экспрессии • каталог внутриклеточных процессов • клинические диагностические базы знаний Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin Найти своё место • случится резкое изменение «востребованности» NGS, по видимому, скачек вызовет клиника. Но двигателем будет академия. революция в биомедицине • биология • медицина • человеческая история • текущий момент • перспективы • всех коснется через медицину, которой понадобятся объективные данные Аналогия с другими технологическими революциями: повсеместное внедрение персональных компьютеров, интернет, мобильная телефония, спутниковая связь и навигация • если биолог - надо разбираться в биоинформатике • если медик – в прогностической медицине Next Generation Sequencing и биомедицина// А.Солдатов, MPI for Molecular Genetics, Berlin