Сравнительная геномика и эволюция Сравнительная геномика • Comparative genomics is the study of the relationship of genome structure and function across different biological species or strains. • Поиск сходств и различий • A human shares 50% of his genes with a banana • Humans share 23% of their genes with Yeast Для чего • Изучение эволюционных событий и объяснение механизмов эволюции геномов • Поиск генов • Поиск некодирующих функциональных элементов генома • Изучение функций генов и некодирующих участков What is compared? • Gene location • Gene structure – – – – Exon number Exon lengths Intron lengths Sequence similarity • Gene characteristics – Splice sites – Codon usage – Conserved synteny Сравнительные размеры геномов organism Homo sapiens (human) estimated size estimated gene number average gene density chromosome number 2900 million bases ~30,000 1 gene per 100,000 bases 46 42 Rattus norvegicus (rat) 2,750 million bases ~30,000 1 gene per 100,000 bases Mus musculus (mouse) 2500 million bases ~30,000 1 gene per 100,000 bases 40 13 600 1 gene per 9,000 bases 8 25 500 1 gene per 4000 bases 5 19 100 1 gene per 5000 bases 6 6300 1 gene per 2000 bases 16 3200 1 gene per 1400 bases 1 1700 1 gene per 1000 bases 1 Drosophila melanogaster (fruit fly) Arabidopsis thaliana (plant) 180 million bases 125 million bases Caenorhabditis elegans (roundworm) Saccharomyces cerevisiae (yeast) Escherichia coli (bacteria) H. influenzae (bacteria) 97 million bases 12 million bases 4.7 million bases 1.8 million bases Сравнение гомологичных последовательностей • Сходные участки – поддерживающий отбор – функционально важные • Различающиеся участки – направленный отбор – определяют различия видов …или отсутствие отбора Purifying (negative) selection → Стабилизация последовательности Гены эмбрионального развития крайне консервативны Мутация apterous Замена мутантной копии гена нормальной Замена мутантной копии гена ортологом из генома человека Positive selection → Адаптивная эволюция Выравнивание последовательностей геномов Основная задача – нахождение минимального набора фрагментов последовательностей, которые гомологичны и коллинеарны друг другу • Поиск сегментов, произошедших от общего предка • Отслеживание эволюционных событий в геноме Реаннотация геномов •Валидация предсказанных генов SC – Saccharomyces cerevisiae SP – S. paradoxus SM – S. mikatae SB – S. bayanus Реаннотация геномов • Идентификация новых генов Выявление негативной селекции на некодирующих участках позволило обнаружить ряд генов малых РНК Реаннотация геномов • Идентификация регуляторных последовательностей CNE – conserved noncoding element Могут быть как консервативные, так и вариабильные регуляторные элементы Идентификация регуляторных последовательностей 1. Dog 2. Mouse 3. Chicken 4. Frog 5. Fugu Тканеспецифичные энхансеры Эволюция генов и геномов «Ничто в биологии не имеет смысла кроме как в свете эволюции» Добржанский Ф.Г. Усложнение генов • Дупликация экзонов (неравный кроссинговер) – возможности для дивергенции последовательности и появления новых экзонов – возможности для альтернативного сплайсинга – увеличесние структурного домена белка – вариабильность генов иммуноглобулинов • Перетасовка экзонов (неаллельная рекомбинация, транспозоны) Дупликация экзонов (около 10% генов человека) Ген LPA Перетасовка экзонов Ретротранспозиция Дупликация генов • Тандемная дупликация • Транспозиция (ретрогены – нет промотора, интронов) • Сегментные дупликации • Полногеномные дупликации Следствие дупликации гена • Увеличение дозы гена • Дивергенция гена – псевдогены Гомологи – Гены, обладающие эволюционным родством и сходными последовательностями • Паралоги – гомологичные гены в одном геноме, возникшие в результате дупликации • Ортологи – гомологичные гены разных видов, произошедшие от общего предшественника и передавались вертикально при эвоюции Ортологи и паралоги А – Неофункционализация В – Субфункционализация Эволюция суперсемейства глобинов Дупликация и дивергенция генов адаптивна Дупликация генома Vertebrates WGD – whole genome duplication Диплоидизация – постепенная потеря лишних копий генов Хромосомные перестройки Muntiacus reevesi Mutiacus muntijak Хромосомные перестройки • Инверсии, транслокации характерны для эволюции млекопитающих • Формирование неоцентромеры – изменение положение центромеры в хромосоме Хромосомные перестройки Средний размер синтенных участков хромосом человека и мыши – 10 Mb Межхромосомные перестройки не затрагивают половые хромосомы • человек • шимпанзе • горилла • орангутанг Определение пола • Генное • Хромосомное – самки гомогаметны, самцы гетерогаметны (XY или XO) – самцы гетерогаметны, самки гомогаметны (ZW или ZO) • Гапло-диплоидное • Средовое Гетерогаметный пол Хромосома определяющая пол (Y, W), как правило, отличается маленьким размером, малым количеством генов, большим количеством повторов Человек: • Х-хромосома – 900 белок-кодирующих генов, 155 Mb • Y-хромосома – 80 белок-колирующих генов (30 уникальных), 59 Mb • Рекомбинация между Х и Y в мейозе происходит только в идентичных прителомерных областях (псевдоаутосомные регионы) Х и Y хромосомы человека MSY – male-specific region on the Y chromosome. Gametologs – гомологичные гены Х и Y хромосом вне псевдоаутосомных регионов. В Y хромосоме несколько таких генов стало псевдогенами. SRY и SOX3 изначально произошли от одного гена, но отличаются довольно сильно. Pseudoautosomal regions (PAR1, PAR2) PAR1 – 2,6 Mb PAR2 – 330 kb PAR1 – высокая скорость эволюции Х и Y хромосомы произошли от пары аутосом 1. 2. 3. Ген SRY произошел от гена SOX3 Появление testis-determining factor (TDF) Рекомбинация подавляется инверсией Дальнейшая дивергенция из-за отсутствия рекомбинации и накопления мутаций Межхромосомные перестройки не характерны для половых хромосом Межхромосомные перестройки не характерны для половых хромосом Сравнение хромосом собаки, человека и мыши Межхромосомные перестройки не характерны для половых хромосом Причина – инактивация Х-хромосомы Наше место на эволюционном древе • Филогенез – эволюционные отношения между организмами • Классический подход основан на анатомических и морфологических признаках • Молекулярная филогенетика использует сравнение нуклеотидных и аминокислотных последовательностей • Изначально использовалось небольшое количество локусов • Филогеномика использует знания о полных последовательностях геномов Филогенетические деревья на основе 16s РНК Построение эволюционных деревьев • Строятся исходя из гомологии анализируемых последовательностей нуклеиновых кислот или белков Branches & Nodes A – unrooted tree B – rooted tree (cladogram) Метод матрицы расстояний Distance matrix method Другие методы • Варианты distance matrix – Neighbor relation – Neighbor joining (учитывает отличия в скорости эволюции) • Maximum-parsimony – поиск дерева с минимальным количеством эволюционных шагов • Maximum-likelihood – поиск оптимального дерева из всех возможных вариантов • Эвристические методы (для большого объема данных) C-value paradox G-value paradox Возможные объяснения: • Недавние полногеномные дупликации • Необходимость адаптироваться к различным условиям • Усложнение на уровне регуляции Усложнение на уровне регуляции • Альтернативный спласинг • Некодирующая (регуляторная) ДНК Доля некодирующей ДНК в геноме Усложнение организации в ходе эволюции Гены эмбрионального развития крайне консервативны Дупликация Hox генов не происходила на протяжении сотен миллионов лет Cis-regulatory elements (CRE) • CRE отвечают за экспрессию генов в определенных тканях и/или в определенное время • Новые CRE → новые функции гена Pax6 – транскрипционный фактор, отвечающий за развитие отделов мозга, ЦНС, глаз Rhodopsin – мишень Pax6, выполняет одну функцию (фоторецептор в глазу) Эволюция CRE • Мутации в существующих CRE • Транспозиция Около 10.000 транспозонов человека эволюционировали под сильным действием отбора Гомология экзона гена PCBP2 и энхансера гена ISL1 с ретротранспозоном LF-SINE Что делает человека человеком? В эволюции приматов активно образовывались ретрогены Что делает человека человеком? • Человек и шимпанзе разошлись 5-7 млн лет назад • Отличия в последовательности ДНК: 1,2% (замены), 3% (инсерции и делеции), > 1500 инверсий • Различия в количестве копий генов, повторов • Инактивация рядя генов у человека Что делает человека человеком? • Некоторые гены подвергались позитивной селекции Фрагмент белка FOXP2 Выводы • Сравнительная геномика позволяет конструировать молекулярные филогенетические деревья, прослеживать эволюцию геномов. • Сравнительная геномика помогает идентифицировать гены, а также функциональные некодирующие элементы. • Функционально важные элементы более консервативны и мутации в них, как правило, подвергаются негативному отбору, но некоторые мутации могут подвергаться позитивному отбору. • Перетасовка и дупликация экзонов в белок-кодирующих генах увеличивает генетическое разнообразие. Транспозоны при перемещении могут становиться новыми экзонами или регуляторными последовательностями. • Эволюция может происходить также за счет дупликации генов или целых геномов. Дуплицированные гены дивергируют в ходе эволюции. Выводы • В ходе эволюции млекопитающих происходили крупные хромосомные перестройки. Часто появлялись химерные гены. Половые хромосомы исключение. • Вариации в регуляторных областях также играют важную роль в эволюции и усложнении строения организмов • Различия между геномом человека и близкими видами минимальны. Очень мало специфичных для человека генов. Многие быстро эволюционирующие регионы генома человека относятся к регулятроным элементам и нетранслируемым РНК. Спасибо за внимание