Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» . . !" #$!% Допущено Учебнометодическим объединением по классическому университетскому образованию в качестве учебного пособия для студентов, обучающихся по специальности «биоинженерия» и «биоинформатика» 2794633475-02 . 2009 Перейти на страницу с полной версией» Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» УДК 578(075.3) ББК 28.04 Л84 Лукашов В. В. Л84 Молекулярная эволюция и филогенетический анализ / В. В. Лукашов. — М. : БИНОМ. Лаборатория знаний, 2009. — 256 с. : ил. ISBN 978-5-9963-0114-0 В книге обсуждаются принципы эволюционного анализа генетической информации. Автор знакомит читателей с теоретическими основами и практическими подходами к решению задач молекулярной эволюции и филогенетического анализа. Эта книга является первым отечественным изданием, освещающим данную область знаний. Для студентов, аспирантов и научных сотрудников биологических, медицинских и математических специальностей. УДК 578(075.3) ББК 28.04 2794633475-02 Научное издание Лукашов Владимир Владимирович МОЛЕКУЛЯРНАЯ ЭВОЛЮЦИЯ И ФИЛОГЕНЕТИЧЕСКИЙ АНАЛИЗ Ведущий редактор канд. биол. наук Л. А. Аксенова Художник С. Инфантэ Технический редактор Е. В. Денюкова Корректор Л. Н. Макарова Оригинал-макет подготовлен М. Ю. Копаницкой в пакете LATEX 2ε Подписано в печать 11.09.09. Формат 60×90/16. Усл. печ. л. 16. Тираж 1000 экз. Заказ Издательство «БИНОМ. Лаборатория знаний» 125167, Москва, проезд Аэропорта, д. 3 Телефон: (499) 157-5272, e-mail: [email protected], http://www.Lbz.ru ISBN 978-5-9963-0114-0 c БИНОМ. Лаборатория знаний, 2009 Перейти на страницу с полной версией» Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» ПРЕДИСЛОВИЕ Развитие методов полимеразной цепной реакции и автоматического определения нуклеотидных последовательностей сделало возможным получение генетической информации в не представимом ранее масштабе. Число нуклеотидных последовательностей в международной базе генетических данных GenBank превышает 70 миллионов, а их общая длина — 80 миллиардов нуклеотидов (см. рисунок). Объем этой информации удваивается в среднем каждые 18 месяцев. Одновременное развитие компьютерных технологий привело к тому, что анализ генетической информации, бывший ранее темой работы относительно небольшого числа специалистов, становится повседневной задачей многих научных и практических лабораторий. В связи с этим, актуально написание книги, освещающей принципы эволюционного анализа генетической информации. 2794633475-02 Рост объема информации в генетической базе данных GenBank Перейти на страницу с полной версией» Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» 6 Предисловие Эволюционный анализ генетической информации является составной частью более общего раздела науки — биоинформатики. Спектр задач, которыми занимается биоинформатика, очень широк: к этой области науки относятся изучение происхождения наследственной информации, анализ регуляции синтеза макромолекул — нуклеиновых кислот и белков, предсказание структуры макромолекул, изучение взаимодействий между ними и многие другие вопросы [Ратнер с соавт., 1985; Гельфанд, 2005]. Одной из ключевых, основополагающих задач биоинформатики является установление законов изменения макромолекул в ходе их эволюции и, на основании этих данных, — установление родственных отношений между формами жизни, от которых эти макромолекулы получены. Этими вопросами занимается молекулярная филогенетика, возникшая на стыке традиционных наук об эволюции, передаче наследственной информации и математики [Грант, 1980; Иорданский, 2001]. Наша книга является первой отечественной книгой, освещающей современное состояние вопросов, связанных с филогенетическим анализом в молекулярной эволюции. При работе над книгой, автор ставил целью ознакомить читателя с теоретическими основами и практическими подходами к решению ключевых задач эволюционного и филогенетического анализа. Эта книга предназначена для студентов, аспирантов и научных сотрудников биологических, медицинских и математических специальностей, занимающихся вопросами эволюционного и филогенетического анализа, а также медицинских сотрудников, интересующихся этими вопросами. В гл. 1 излагаются понятия, используемые в молекулярной эволюции, включая относящиеся к строению макромолекул, генетическому коду, видам эволюционных событий и методам их изучения. При этом подразумевается, что читатель знаком с принципами организации, воспроизводства и наследования генетической информации — строением генов и организацией генома, процессами транскрипции и трансляции, механизмом наследования признаков, законами естественного отбора — из курсов биологии, биохимии и генетики. Глава 2 рассказывает о принципах выравнивания генетических последовательностей. Эволюционные модели и методы установления эволюционных дистанций между последовательностями описываются в гл.3. Глава 4 посвящена принципам филогенетического анализа и методам построения филогенетических деревьев. В гл. 5 описыва2794633475-02 Перейти на страницу с полной версией» Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» Предисловие 7 ется ряд специальных вопросов, возникающих при изучении молекулярной эволюции, включая рекомбинационный анализ, исследование нуклеотидного состава и использования кодонов, анализ митохондриальной ДНК и молекулярных часов. Специальное внимание уделено использованию генетического анализа при изучении эпидемиологии инфекционных заболеваний — молекулярной эпидемиологии. Все эти вопросы рассмотрены с использованием многочисленных примеров, на конкретных экспериментальных данных. Наконец, гл. 6 посвящена описанию компьютерных программ, используемых в эволюционном анализе. Написание этой книги было бы невозможным без участия моих коллег. Прежде всего благодарю Эдуарда Карамова и Япа Годсмита (bedankt, Jaap!) за многолетнюю поддержку моих научных интересов. Серьезную помощь при написании книги оказали ее рецензенты: Михаил Гельфанд (Институт проблем передачи информации РАН и Московский государственный университет им. М. В. Ломоносова) и Александр Гултяев (Университет Лейдена, Нидерланды). Александр Пастернак (Университет Амстердама, Нидерланды) помогал в редактировании книги. Владимир Муронец (НИИ физико-химической биологии им. А. Н. Белозерского, Московский государственный университет им. М. В. Ломоносова) и Герман Шипулин (ЦНИИ эпидемиологии Роспотребнадзора, Москва) оказали помощь при публикации книги. Автор будет признателен за отзывы, замечания, предложения касательно этой книги, которые следует направлять по адресу: [email protected]. В заключение предисловия отметим, что 2794633475-02 любой математический алгоритм, любая компьютерная программа, используемая при анализе генетической информации, проанализирует заложенные исследователем данные, используя выбранные исследователем параметры, — и выдаст результаты анализа. Вопрос о том, насколько заложенные в программу данные и выбранные при анализе параметры правильны, соответственно — насколько результаты анализа отражают истинные эволюционные события, — является вопросом, на который должен ответить сам исследователь. Среди прочих методов — и с помощью компьютерных программ. Владимир Лукашов, Амстердам, Нидерланды, 5 апреля 2009 г. Перейти на страницу с полной версией» Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» ОГЛАВЛЕНИЕ Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Глава 1. Цели, принципы и понятия молекулярной эволюции . . . . . . . . . . . . . . . . . . . . . . . . 1.1. 1.2. 1.3. 1.4. 1.5. 1.6. 1.7. Задачи молекулярной эволюции как науки . . . . . . . . . . . . Нуклеотидные последовательности . . . . . . . . . . . . . . . . . . . Аминокислотные последовательности . . . . . . . . . . . . . . . . . Генетический код . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Мутации . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Нуклеотидные замены . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.1. Транзиции и трансверсии . . . . . . . . . . . . . . . . . . . . . . 1.6.2. Синонимичные и несинонимичные замены . . . . . . . Нуклеотидный и аминокислотный состав, использование кодонов. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Эволюция нуклеотидной последовательности . . . . . . . . . . Консенсусные последовательности . . . . . . . . . . . . . . . . . . . . Гомологичные и сходные признаки, конвергенция . . . . . . Естественный отбор и неодарвинизм. . . . . . . . . . . . . . . . . . Закрепление мутации в популяции . . . . . . . . . . . . . . . . . . . Концепция молекулярных часов. . . . . . . . . . . . . . . . . . . . . . Нейтральная теория молекулярной эволюции . . . . . . . . . . Эволюционная систематика . . . . . . . . . . . . . . . . . . . . . . . . . Проведение эволюционного анализа . . . . . . . . . . . . . . . . . . 2794633475-02 1.8. 1.9. 1.10. 1.11. 1.12. 1.13. 1.14. 1.15. 1.16. Глава 2. Выравнивание генетических последовательностей . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1. Цели выравнивания последовательностей . . . . . . . . . . . . . 2.2. Принципы выравнивания последовательностей . . . . . . . . . 2.3. Алгоритмы выравнивания двух последовательностей . . . 2.3.1. Принцип матрицы точек . . . . . . . . . . . . . . . . . . . . . . . 2.3.2. Алгоритмы Нидлмена—Вунша и Смита—Уотермена, глобальное и локальное выравнивание . . . . . . . 2.3.3. Общие принципы динамического программирования при выравнивании последовательностей . . . . . 2.3.4. Методы слов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.4. Множественное выравнивание . . . . . . . . . . . . . . . . . . . . . . . Перейти на страницу с полной версией» 5 9 9 9 11 14 16 17 17 17 19 20 26 29 30 31 35 36 37 39 41 41 41 46 46 49 54 58 59 Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» Оглавление Глава 3. Генетические дистанции и эволюционные модели . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1. Наблюдаемые, истинные и расчетные дистанции . . . . . . . 3.2. Эволюционные модели и дистанции между нуклеотидными последовательностями . . . . . . . . . . . . . . . . 3.2.1. Модель Джукса—Кантора. . . . . . . . . . . . . . . . . . . . . . 3.2.2. Модель Кимуры . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3. Модель Таджимы—Неи. . . . . . . . . . . . . . . . . . . . . . . . 3.2.4. Другие эволюционные модели . . . . . . . . . . . . . . . . . . 3.2.5. Гамма-дистанции . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.6. Сравнение различных моделей . . . . . . . . . . . . . . . . . 3.3. Синонимичные и несинонимичные дистанции и их отношение . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.4. Аминокислотные дистанции, матрицы вероятностей аминокислотных замещений . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.5. Учет делеций и отсутствующей информации . . . . . . . . . . . Глава 4. Филогенетический анализ . . . . . . . . . . . . . . . . . . . . . . . 4.1. Филогенетические деревья . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Дистанционные методы построения филогенетических деревьев . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.1. Принципы дистанционных методов. . . . . . . . . . . . . . 4.2.2. Метод UPGMA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2.3. Метод трансформированной дистанции . . . . . . . . . . 4.2.4. Метод минимума эволюции . . . . . . . . . . . . . . . . . . . . 4.2.5. Методы связей между соседями . . . . . . . . . . . . . . . . 4.2.6. Метод присоединения соседей . . . . . . . . . . . . . . . . . . 4.2.7. Установление длин ветвей . . . . . . . . . . . . . . . . . . . . . 4.3. Методы анализа дискретных признаков . . . . . . . . . . . . . . . 4.3.1. Принципы методов анализа дискретных признаков . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.3.2. Метод максимальной экономии . . . . . . . . . . . . . . . . . 4.3.3. Метод максимального правдоподобия . . . . . . . . . . . . 4.4. Статистическая оценка дерева, бутстрэп-анализ . . . . . . . . 4.5. Другие филогенетические методы . . . . . . . . . . . . . . . . . . . . 4.6. Сравнение филогенетических методов . . . . . . . . . . . . . . . . 4.7. Филогенетический анализ в таксономии, фенетика и кладистика . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2794633475-02 255 61 61 65 65 71 73 74 76 79 81 85 88 90 90 98 98 99 104 107 107 109 111 114 114 115 123 126 131 133 136 Глава 5. Отдельные задачи эволюционного анализа . . . . . . . 141 5.1. Рекомбинационный анализ . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2. Анализ нуклеотидного и аминокислотного состава и использования кодонов . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2.1. Смещения нуклеотидного состава . . . . . . . . . . . . . . . 5.2.2. Различия в использовании кодонов. . . . . . . . . . . . . . Перейти на страницу с полной версией» 141 150 150 156 Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис» Перейти на страницу с полной версией» 256 Оглавление 5.2.3. Анализ нуклеотидного состава и использования кодонов в филогенетических исследованиях . . . . . . 5.3. Анализ молекулярных часов . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.1. Вопросы, связанные с концепцией молекулярных часов . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.2. Установление и калибровка молекулярных часов — тест относительных скоростей эволюции. . . . . . . . . 5.3.3. Другие подходы к установлению молекулярных часов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.4. Проблемы филогенетического анализа, связанные с несоблюдением модели молекулярных часов . . . . 5.3.5. Анализ молекулярных часов в эволюции высших организмов . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.6. Анализ молекулярных часов в эволюции вирусов . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3.7. Молекулярные часы в эволюции ВИЧ-1 и их использование для датирования начала эпидемий и эволюционных событий . . . . . . . . . . . . . . . . . . . . . . 5.4. Анализ митохондриальной ДНК. . . . . . . . . . . . . . . . . . . . . . 5.4.1. Особенности эволюционного анализа митохондриальной ДНК. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.4.2. Концепция митохондриальной Евы и использование анализа мтДНК при изучении происхождения человека . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5. Молекулярная эпидемиология . . . . . . . . . . . . . . . . . . . . . . . 5.5.1. Задачи и принципы молекулярной эпидемиологии . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5.2. Установление источника заражения . . . . . . . . . . . . . 5.5.3. Анализ эпидемиологических сетей . . . . . . . . . . . . . . 160 168 168 169 172 173 174 176 177 185 185 2794633475-02 188 193 193 195 195 Глава 6. Компьютерные программы для эволюционного анализа . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 6.1. Типы компьютерных программ . . . . . . . . . . . . . . . . . . . . . . 6.2. Программы для хранения и редактирования последовательностей. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6.3. Международные базы генетических данных . . . . . . . . . . . 6.4. Программы для выравнивания последовательностей . . . . 6.5. Программы для филогенетического анализа . . . . . . . . . . . 6.6. Другие программы . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 213 215 218 221 225 Книги для дополнительного чтения . . . . . . . . . . . . . . . . . . . . . . 226 Литература . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228 Перейти на страницу с полной версией»