Uploaded by Радующийся Тигр

Балановский Олег Павлович. Генофонд Европы

advertisement
О.П. Балановский
МОСКВА 2015
О.П. Балановский
ГЕНОФОНД ЕВРОПЫ
Товарищество научных изданий КМК
Москва 2015
Балановский О.П. Генофонд Европы. М.: Тов-во научн. изданий КМК 2015 354 с.
Монография посвящена генофонду народонаселения Европы — исследованию его пространственной изменчи
вости и его истории.
Исследования генофондов бурно развиваются благодаря использованию митохондриальной ДНК, Y-хромосо
мы и полногеномных панелей маркеров. Но обобщающие работы по мтДНК и Y-хромосоме в Европе устарели,
поскольку опубликованы более десятилетия назад до выхода основной массы частных научных публикаций. По
этому в книге проанализированы как собственные данные автора, так и литературные созданные базы данных
включили более 130 тысяч образцов по мтДНК и более 140 тысяч — по Y-хромосоме.
Параллельное изучение генофонда Европы по маркерам Y-хромосомы, мтДНК и полногеномным панелям обес
печило синтез результатов этих трех генетических систем. Такой синтез актуален не только для генетиков, но и
для смежных наук — антропологии, археологии, лингвистики, истории, все активнее включающих данные генети
Ки в комплексные исследования ЭТНОГенеза.
В книге рассмотрены и данные по древней ДНК, позволяющие — эпоха за эпохой — проследить историю гено
фонда Европы. А совместный анализ количественных лингвистических и генетических данных выявляет непрос
тую связь языков и генофондов. Особую актуальность для российской науки имеют исследования славянских и
северокавказских народов, которым посвящены отдельные главы.
Издание осуществлено при финансовой поддержке Российского фонда фундаментальных исследований
по проекту № 15-06-07016, не подлежит продаже
Р
И
ISBN 978-5-9907157-0-7
С Балановский О.П. текст. 2015.
С Т-во научных изданий КМК, 2015.
ПРЕДИСЛОВИЕ
Нет, если мне нужна Европа, то такая,
Где перед лужицей в вечерний час дитя
Сидит на корточках, кораблик свой пуская,
В пахучем сумраке Бог весть о чем грустя.
Артур Рембо (Перевод Б.К. Лившица)
Генетическое изучение популяций человека уже сотню лет привлекает многих исследователей, сре
ди которых виднейшие представители отечественной и мировой биологии: А.С. Серебровский, Н.К.
Кольцов, В.В. Бунак, Г.Ф. Дебец, Я.Я. Рогинский, Ю.П. Алтухов, Ю.Г. Рычков, Р. Виллемс, L.L. Сavalli
Sforza, W. Вофmer, а также представители смежных дисциплин — археологии, лингвистики, прикладной
математики, палеогеографии. За свою долгую историю геногеография использовала самые разные мар
керы — от групп крови до фамилий, от отдельных ДНК-маркеров до полных геномов — и обнаружила
множество частных закономерностей, причем большинство из них проявлялись вновь и вновь при ана
лизе каждого очередного типа маркеров. Кроме множества частных закономерностей, и в зарубежной, и
в российской школах геногеографии был разработан и ряд общих концепций, включая теорию демичес
кой диффузии, концепцию обобщенного гена, принцип эквидистантности и ряд других. Предлагаемая
книга продолжает традицию систематического геногеографического изучения отдельных регионов мира
и посвящена генофонду народонаселения Европы (для краткости — генофонду Европы).
При этом генофонд Европы — и так самый подробно изученный среди всех регионов мира. Для
европейской науки он стал полигоном для проверки всех главных генетических концепций и методов.
Например, вопрос о палеолитическом или более позднем времени формирования основных черт евро
пейского генофонда является, пожалуй, наиболее широко обсуждаемым вопросом в популяционной
генетике человека. Об этом свидетельствует и число статей на эту тему (в том числе в журналах Nature
и Science), и авторитет их авторов (Ammerman, Сavalli-Sforza, 1984; Сavalli-Sforza et al., 1994, Richards
et al., 1996; Richards et al., 2000: Semino et al., 2000: Вarbujani, Веrtorelle, 2001; Сhikhi et al., 2002; Наak
et al., 2005, 2009, 2015: Вrаmanti et al., 2009; Allentoft et al., 2015 и т.д.).
Да и по другим вопросам генетической структуры народов Европы написано столько работ, что их
перечисление потребовало бы отдельной монографии. Так стоит ли снова писать о генофонде Европы?
Стоит. Дело в том, что среди этого множества работ очень мало обобщающих. Например, работы,
обобщающие изменчивость мтДНК и Y-хромосомы в Европе, последний раз проводились более деся
тилетия назад|Richards et al., 2000: Rosser et al., 2000: Semino et al., 2000: Richards et al., 2002).
Подавляющее большинство последовавших крупных работ ставило задачей изучение отдельных ре
гионов Европы или по мтДНК (Неlgason et al., 2001, 2003; Меіnila et al., 2001; Маlyarchuk et al., 2002, 2003,
2004, 2006, 2008; Бермишева и др., 2002; Оrekhov et al., 1999; Pfeiffer et al., 1999; Pereira et al., 2004: Таmbets
et al., 2004: Goodacre et al., 2005; Falchi et al., 2006: Grzybowski et al., 2007; Lappalainen et al., 2008; Аlvarez
Iglesias et al., 2009: Santos et al., 2003; Garcia et al., 2011; Каrachanak et al., 2012), или по Y-хромосоме
|Веhar et al., 2003; Харьков и др., 2004, 2005б, Сinnioglu et al., 2004: Di Giacomo et al., 2003; Вrion et al.,
2005; Flores et al., 2003, 2004: Таmbets et al., 2004: Alonso et al., 2005: Goncalves et al., 2005; Кауser et al.,
2005; Реricic et al., 2005; Сapellietal.,2006, 2007; Lappalainen et al., 2006, 2008; Аdamsetal., 2008; Вalanovsky
et al., 2008, 2011; Вattaglia et al., 2009: Fechner et al., 2008; Varzari et al., 2009; Кing et al., 2011; Yunusbaev et
al., 2012; многие другие работы). Ряд работ был посвящен также отдельным гаплогруппам (Di Giacomo et
al., 2004; Rootsi et al., 2007; Оnofri et al., 2008: Тofanelli et al., 2009; Derenko et al., 2006, 2007, 2010; Сruciani
et al., 2007, 2010; Муres et al., 2011; Underhill et al., 2010; Меndez et al., 2011 и другие работы).
Но обобщающий анализ в масштабе всей Европы после работ 2000-2002 годов не проводился. А за
это время не только на порядок возрос объем данных о мтДНК и Y-хромосоме, но и появились данные
по полногеномным панелям маркеров, стремительно рванулись вперед исследования древней ДНК, не
стояли на месте и исследования смежных наук — особенно лингвистов.
Поэтому представляется своевременным данное исследование, в котором сделана попытка собрать
воедино, проанализировать, подытожить и по возможности синтезировать наши сегодняшние знания о
генофонде народонаселения Европы.
В предисловиях принято говорить о том, кому адресована книга. Но разве менее важно, кому она не
адресована? Должен же я предупредить не только о том, что есть в этой книге, но и о том, чего в ней нет!
Нет в ней погони за каждой новой веточкой Y-хромосомы, за каждым новым методом анализа полноге
номных данных, за каждой частностью, какой бы любопытной — или широко обсуждаемой в узких
интернет-кругах — она ни была. И читателям, любящим все это, книга не адресована. Им она противопо
казана, потому что в фокусе книги — популяция в целом, а не отдельные веточки разросшегося дерева
гаплогрупп одной из генетических систем. Книга, ставящая целью учесть наиновейшие новости в быс
тро развивающейся области, была бы обречена устареть еще до своего выхода из печати. А самое глав
ное, ее автора и читателей подстерегала бы опасность за веточками не увидеть леса. Ведь развитие
технологий столь стремительно, что стало модно лишь бежать замодой, не останавливаясь для того,
чтобы оглянуться — а что же действительно новое мы видим, кроме бесконечных новых веточек.
Поэтому я ставил совсем другую цель — оглядеть не веточки, а сам лес, не частности, а общую
структуру генофонда Европы, не отдельные факты, а основные закономерности. Для этого широко ис
пользовались как старые, так и самые новые достижения популяционной генетики. Например, постро
ены карты практически всех гаплогрупп Y-хромосомы, которые полиморфны в Европе и по которым на
сегодняшний день уже есть достаточно данных об их частотах в коренном населении. А в списке лите
ратуры можно найти четырнадцать статей (в том числе моих собственных), опубликованных в том же
2015 году, что и сама эта книга, причем более десяти из этих работ столь важны, что они составили
основу отдельных разделов книги. Есть в этой книге и то, что еще не было опубликовано в статьях. Но
новизна данных была не самоцелью, а лишь одним из многих средств, подчиненным настоящей цели —
выяснению структуры генофонда народов Европы и его истории. Достичь этой цели в полной мере
вряд ли возможно, но стоит пробовать. Лишь тем читателям, которым эта цель интересна, и адресована
КНИГа.
БЛАГОДАРНОСТИ
Я глубоко признателен своим учителям Е.В. Балановской и Р. Виллемсу, которые ввели меня в об
ласть геногеографии и филогеографии, признателен В.В. Запорожченко, Р.С. Сычеву, А.С. Пшенично
му, взявшим на себя труд наполнения баз данных по мтДНК и Y-хромосоме, рад случаю упомянуть
своих прекрасных помощниц А.Т. Агджоян, М.И. Чухряеву, Р.А. Схаляхо, М.А. Кузнецову, Х.Д. Диби
рову, О.А. Балаганскую, И.Э. Теучеж — результаты и их труда вошли в описанное исследование, а на
плечи двух первых легла и часть работы непосредственно по книге; благодарю коллегW. Наak, S. Rootsi,
А.В. Дыбо, О.А. Мудрака, С.М. Кошеля, О.М. Утевскую, Э.А. Почешхову, Л.А. Атраментову, М.Б. Лав
ряшину, Л.И. Тегако, М.И. Чурносова, С. Der Sarkisyan, А.С. Касьяна, Е.И. Кушнеревич, В.И. Хартано
вича, А.П. Бужилову, Л.М. Епископосяна и многих других, в сотрудничестве с которыми собирались
образцы или разрабатывались вопросы их анализа. Мне очень помогло сообщество нашего междисцип
линарного сайта генофонд.рф — его бессменный автор Н.В. Маркина и критический ум Л.С. Клейна. И
сугубая благодарность — моим родителям П.Н. Ящуку и Е.В. Балановской, оказавшим огромную и раз
нообразную помощь при подготовке этой книги.
Исследование проводилось более 10 лет, и разные его аспекты поддерживались в разное время бо
лее чем двадцатью грантами, включая международный Тhe Genographic Project, грант РНФ 14-04-00827,
грант РГНФ 06-06-00640, гранты Программ Президиума РАН «Динамика генофондов», «Фундамен
тальные науки — медицине». Благотворную роль в возникновении и развитии моей лаборатории сыгра
ли директор ИОГен РАН член-корр. Н.К. Янковский и Программа Президиума РАН «Молекулярная и
клеточная биология». Благодарю и лабораторию исторической генетики МФТИ, поддержавшую вместе
с РНФ полногеномный анализ Y-хромосомы. А наиболее постоянная финансовая поддержка все эти
годы приходила от РФФИ: за это время под моим руководством выполнены 4 инициативных (10-04
01603, 07-04-00340, 04-04-49664-а, 13-04-01711), 8 экспедиционных и 3 стажерских проекта РФФИ, и
конечно же, издательский грант на эту книгу 15-06-07016-д.
Без помощи этих фондов и энтузиазма моих коллег эта книга, конечно же, не смогла бы состояться.
ГЛАВА 1.
СОЗДАНИЕ БАЗ ДАННЫХ О ГЕНОФОНДАХ МИРА
Наше исследование генофонда Европы в контексте мирового генофонда основывается на собствен
ных и литературных данных по изменчивости в населении мира Y-хромосомы, митохондриальной ДНК
и полногеномных панелей маркеров, объединенных в специально разработанных базах данных. В дан
ной главе описываются созданные базы данных и дается характеристика собственным результатам (ко
торые включены во все базы данных, но также во многих случаях анализируются и отдельно).
Но этим содержание главы не исчерпывается – будет логичным еще до начала изложения результа
тов рассмотреть и самые необходимые аспекты методических вопросов – особенностей генотипирова
ния Y-хромосомы, мтДНК и древней ДНК, методы статистического и филогеографического анализа,
обсудить вопрос о генетических датировках и программное обеспечение для создания картографичес
ких атласов генофонда, занимающих важное место во всем исследовании.
1.1. БАЗА ДАННЫХ ПО Y-ХРОМОСОМЕ
КРАТКАЯ ХАРАКТЕРИСТИКА Y-BASE
ПРЕДНАЗНАЧЕНИЕ И ИСТОРИЯ СОЗДАНИЯ
За последние 15 лет изучение изменчивости Y
хромосомы стало одним из основных направлений
в русле популяционно-генетических, молекулярно
антропологических и филогеографических иссле
дований популяций человека. Поэтому многие на
учные коллективы остро нуждаются в быстром и
свободном доступе ко всему массиву уже накоп
ленной информации. Достижения молекулярной
генетики получили широкое признание в смежных
науках, изучающих историю человечества – в ант
ропологии, археологии, лингвистике, истории, эт
нологии, палеоэкологии. Однако отсутствие удоб
ной информационной системы, обеспечивающей
простой доступ к генетическим данным, резко ог
раничивает комплексные исследования населения
мира специалистами в разных областях естествен
ных и гуманитарных наук.
Поэтому мы поставили перед собой задачу
объединить все доступные в литературе данные и
обширные собственные архивы, несущие разнооб
разную информацию о полиморфизме Y-хромосо
мы в популяциях человека. База данных разраба
тывалась под руководством автора в течение ряда
лет (2006–2012 гг.) и продолжает совершенство
ваться.
В 2009–2012 годах создание этой базы данных
являлось одним из важных направлений темы НИР
«Анализ распространения гаплотипов митохонд
риальной ДНК и Y-хромосомы у народов мира на
основе создания геоинфосистем», выполнявшей
ся в Медико-генетическом научном центре РАМН
под руководством автора. В 2010–2012 годах со
здание базы данных было поддержано целевым
грантом РФФИ, что позволило резко интенсифи
цировать работу над базой данных. Хотя эта мно
голетняя работа по созданию базы велась главным
образом на чистом энтузиазме ее разработчиков,
однако, одно время важна была также финансовая
поддержка международного проекта «Geno
graphic», и сейчас работа интенсивно продолжает
ся все также под руководством автора в Институ
те общей генетики РАН.
Программирование выполнено Андреем Вой
сковским. В разработке алгоритмов важную роль
сыграл Андрей Пшеничнов, основную часть рабо
ты по наполнению базы выполняли Роман Сычев
и Андрей Пшеничнов, а в части подготовки соб
ственных результатов нашего коллектива к вводу
в базу данных – Хадижат Дибирова. Большую по
мощь в получении полнотекстовых версий статей
источников оказали Mark Haber и Wolfgang Haak.
Окончательное редактирование таблиц популяций
и их подготовка для картографирования (исклю
чение одних и объединение других выборок в со
ответствии сразнообразными критериями) выпол
нены автором.
В настоящее время одна израбочих версий базы
данных реализована в рамках онлайновой инфо
системы (отдельные разделы которой представле
ны на нашем сайте www.genofond.ru), и продолже
ние работы заключается в онлайн-реализации ос
тальных разделов и наполнении базы данных но
вой публикуемой информацией. Основные харак
теристики базы данных, существующей на данный
Глава 1. Создание баз данных о генофондах мира
Таблица 1.1. Характеристика двух ведущих баз данных по Y-хромосоме
ПАРАМЕТР
Объем (образцов) по SNР маркерам
Объем (образцов) по STR маркерам
Число популяций
Число источников
Размещение
Y-base
VНRD
(создана под
руководством автора)
(основной зарубежный
аналог)
144 464
17 502
32 ()54
143 044
2474
нет информации
нет информации
238
www.genofond.ru
www.yhrd.org
момент и использованной для изучения генофон
наиболее информативных и широко изучаемых
да Европы и других регионов мира, представлены
генетических систем. Поэтому массив накоплен
в таблице 1.1.
ных данных огромен и возрастает ежемесячно по
Важно отметить, что созданная нами база Y
мере появления новых публикаций. Задача сбора
base в соответствии с целями популяционно-гене
этих данных и создания электронной библиотеки
тических исследований посвящена в первую оче
теоретически проста — она хотя и трудоемка, но
редь SNP-маркерам, хотя содержит и STR-гапло
облегчается тем, что подавляющее большинство
статей публикуются на английском языке и их ан
нотации, как правило, доступны в базе данных
типы. Напротив, основной аналог — международ
ная криминалистическая база данных YНRD — на
целена в первую очередь на STR-маркеры, хотя
содержит также и SNP-маркеры. Теоретически, обе
базы основываются в основном на литературных
данных и поэтому могли бы перекрываться почти
полностью. Но на деле основная направленность
баз формирует и их объем: Y-base содержит дан
ные по 144 тысячам образцов по SNP-маркерам, а
РubМеd на сервере ncbi. Однако получение полно
текстовых версий статей, не имеющих бесплатно
го доступа, требует дополнительных усилий и вре
мени. Тем не менее, в целом эта задача решается
рутинно, и многие профильные лаборатории (в том
числе и наш коллектив) располагают достаточно
обширными электронными библиотеками.
YНRD — по 143 тысячам STR гаплотипов. Такая
Намного более сложным оказывается шаг от
близость показателей хотя и случайна, но доволь
но выразительна. При этом показательно и на по
рядок меньшее в каждой базе число образцов с
альтернативными маркерами: 32 тысячи образцов
«достаточно обширной» к почти исчерпывающей
электронной библиотеке по данной тематике, по
скольку этот необходимый этап подразумевает
с STR маркерами в нашей базе и 17 тысяч образ
цов с SNР маркерами в YНRD. Это объясняется
включение неанглоязычных статей (в первую оче
редь на китайском и русском языках), а также по
иск многих статей, не индексируемых в РubМеd и
тем, что обязательным условием для включения
других центральных хранилищах, например, ста
данных в нашу базу было наличие SNР маркеров,
а STR мы включали только в том случае, если они
опубликованы для тех же образцов. А YНRD по
тьи в многочисленных сборниках, монографиях,
трудах различных конференций. В отслеживании
этих публикаций нашему коллективу способству
ступал наоборот: обязательным условием было
ют налаженные связи с рядом ведущих междуна
только наличие STR маркеров. Поэтому можно
родных генетических центров. В отношении рос
сийских, белорусских, украинских, казахстанских
публикаций, часто несущих важные и нигде более
не опубликованные сведения по популяциям этих
стран, большую помощь оказывают наши коллеги
считать, что эти две базы взаимно дополняют друг
друга и в целом охватывают практически все опуб
ликованные данные по населению мира.
Все остальное содержание данного раздела
посвящено техническим вопросам создания базы
данных — подходам к сбору данных и к программ
ной реализации базы, описанию двух важнейших
модулей автоматической обработкиданных, а так
же трех разделов базы, уже размещенных на на
тив находится в благоприятных условиях для со
здания подробной коллекции тематических публи
каций по изменчивости Y-хромосомы в популяци
ях мира и имеет многолетний опыт создания по
шем сайте www.genofond.ru.
добных тематических библиотек.
в пределах бывшего СССР. В целом, наш коллек
ОБИЛИЕ ДАННЫХ ПОТРЕБОВАЛО СОЗДАНИЯ
ЭЛЕКТРОННОЙ БИБЛИОТЕКИ
УНИФИЦИРОВАННАЯ ХАРАКТЕРИСТИКА
В обширной и бурно развивающейся области
генетических исследований популяций мира мар
керы Y-хромосомы являются сейчас одними из
Однако самым сложным является не сбор ин
формации, а задача ее объединения в единой базе
ПОПУЛЯЦИЙ
данных. При решении этой задачи на первый план
1.1. База данных по Y-хромосоме
выходят вопросы разработки наиболее полного
простое объединение статей разных летможет при
«паспорта» данных и унификации их формата.
вести не только к трудно сопоставимым, но и про
Нашим коллективом разработан, пожалуй, наи
более детальный и выстраданный «паспорт» для
каждой изученной популяции — набор параметров,
сто к неверным результатам.
по которым характеризуется популяция при вне
сении ее в базу данных. В этот набор полей вклю
чается не только условное название популяции из
оригинальной публикации (чем зачастую ограни
чиваются составители большинства сводок), но и
обязательное указание ее этнической принадлеж
ности, страны и региона внутри страны, точных
географических координат, стратегии формирова
ния выборки и ее размер. Вся эта информация яв
ляется чрезвычайно важной для последующей ин
терпретации данных и отбора популяций для каж
При создании первой рабочей версии БД был
использован традиционный подход - единицей хра
нения в ней выступала частота той или иной гап
логруппы в каждой популяции. Если разные авто
ры использовали разные маркеры, но было извес
тно, что эти маркеры синонимичны (определяют
одну и ту же гаплогруппу), данные этих авторов
классифицировались как частоты одной и той же
гаплогруппы в соответствующих популяциях. К
сожалению, данный подход оказался трудоемким,
поскольку интеграция каждой новой статьи в базу
данных требовала принятия решений по «прирав
ниванию» гаплогрупп. И более того, он оказался
дого конкретного вида анализа.
бесперспективным — по мере уточнения филоге
Важность такого подхода поясним примером —
зачем, например, нужен такой, казалось бы третье
нетического древа гаплогрупп оказывалось, что
степенный, параметр как «стратегия формирова
туре как синонимичные, в действительности на
ния выборки». При изучении словацкой выборки
была обнаружена высокая частота генетических
ходятся на разных иерархических уровнях ветвле
вариантов, характерных для коренного населения
ветвь, а другой — доминирующую субветвь той же
Индии. Если бы эта выборка была обозначена в
нашей базе данных как «Словакия» или тем более
как «словаки», эти результаты были бы необъяс
нам известно, столкнулись и другие коллективы,
нимы. Однако внесение в БД сведений, что стра
тегия формирования данной выборки была наце
лена на создание представительной картины гено
SNР маркеры, ранее рассматривавшиеся в литера
ния филогенетического древа (один определяет
ветви). С аналогичными трудностями, насколько
составлявшие крупные сводки данных. В подав
ляющем большинстве случаев они создавались под
конкретную задачу и через два-три года, после по
явления в научном обиходе новых SNР маркеров и
фонда разных географических регионов Словакии,
изменений в обозначениях гаплогрупп, эти сводки
причем принципиально без учета этнической при
надлежности обследуемых, позволило правильно
интерпретировать этот на первый взгляд парадок
сальный результат Наличие «индийских» вариан
тов объяснялось тем, что в выборку попали не толь
становились малопригодны для пополнения и ис
пользования в других исследованиях.
Чтобы избежать этих осложнений и создать
универсальную долгосрочную автоматическую
инфосистему (АИС), при разработке ее нынешней
ко словаки, но и цыгане Словакии: в ряде районов
версии нами в основу положен принцип полного
этой страны заметную долю населения составля
сохранения всей первичной информации о про
ют цыгане, в генофонде которых, по результатам
анализированном образце. Это позволяет даль
многих исследований, сохраняется память об их
индийском происхождении.
нейшую обработку проводить автоматически спе
циальными программными средствами базы дан
ных, и при необходимости перенастраивать и ав
томатически повторять обработку образцов, но уже
УНИФИЦИРОВАННАЯ ХАРАКТЕРИСТИКА
ГАПЛОГРУПП
по новым условиям игры.
Но настоящие трудности, по нашему опыту,
начинаются при попытке внесения в единую таб
лицу не данных о популяциях, а разнородной ин
формации о генотипах, изученных авторами раз
ных публикаций. Не говоря уже о том, что разны
ми коллективами используются различные набо
ры SNР и STR маркеров, нередко используются
разные обозначения для одного итого же маркера
(названия которых стремительно эволюциониру
ют в ходе открытия новых SNР маркеров), а глав
Поэтому единицей хранения в инфосистеме Y
base является отдельный проанализированный об
разец, а полями центральной таблицы служат все
используемые в популяционных исследованиях
SNР и STR маркеры (с возможностью добавления
любых новых полей). Это означает, что инфосис
тема является, во-первых, не «популяционно-цен
тричной», а «образец-центричной», а во-вторых,
не «гаплогруппо-центричной», а «маркер-центрич
ное, большинство авторов публикует данные в виде
ной». Эти два шага навстречу правильному пост
роению инфосистемы (хранению максимально
формализованных и первичных, а не производных
частот гаплогрупп. Эта особенность принципиаль
данных) обеспечивают возможность анализа всех
на, поскольку номенклатура гаплогрупп на протя
жении последних лет неоднократно менялась, и
мировых данных о полиморфизме Y-хромосомы и
долговременное использование инфосистемы вне
Глава 1. Создание баз данных о генофондах мира
8
зависимости от возможных будущих изменений в
номенклатуре гаплогрупп или топологии их иерар
хического древа.
Такой подход потребовал создания и программ
ной реализации алгоритма для автоматического
преобразования исходных данных о генотипах об
разцов в частоты гаплогрупп в соответствии сте
кущей версией их номенклатуры.
Y-BASE В ЭПОХУ ПОЛНОГО СЕКВЕНИРОВАНИЯ
Y-ХРОМОСОМЫ
С 2013 года исследования Y-хромосомы всту
пили в совершенно новую фазу. Использование
технологий секвенирования следующего поколе
ния позволило охарактеризовать всю Y-хромосо
му (точнее, ее участки, поддающиеся надежному
секвенированию) для многих образцов. И посколь
ку каждая семья несет свои собственные уникаль
ные мутации, секвенирование десятка новых об
разцов из разных семей автоматически означает
открытие десятка новых гаплотипов, которые мо
гут претендовать название новой гаплогруппы.
Однако новая гаплогруппа получает полное при
знание лишь после того, когда она встречена хотя
бы у двух неродственных индивидов.
В результате были секвенированы сотни образ
цов и известное науке дерево Y-хромосомы за 3 пос
ледних года стало в 10 раз подробнее дерева, со
ставленного за 10 предыдущих лет исследования.
Понятно, что в этих условиях маркер-центричный
принцип обозначения гаплогрупп является спасе
нием – ведь буквенно-цифровые имена гаплогрупп
могут измениться за один день. (Отметим в скоб
ках, что в статье, обобщающей полногеномные ис
следования Y-хромосомы [Karmin et al., 2015] пред
ложен способстабилизировать и имена гаплогрупп
– именовать только ключевые, распространенные
ветви на основных иерархических уровнях, а про
межуточные ветви и их группы обозначать через
знак объединения именованных ветвей).
Хотя Y-base может вобрать в себя информацию
по частотам тысяч известных сейчас гаплогрупп и
десяткам тысяч тех, которые будут несомненно от
крыты в ближайшие несколько лет, пока нужды в
этом нет. Ведь для подавляющего большинства этих
новых гаплогрупп их популяционные частоты не
известны. Известно лишь, что гаплогруппа суще
ствует (данное сочетание SNP-маркеров встречено
у пары образцов), но никто не изучал частоту этой
гаплогруппы в популяциях. Тем самым все гаплог
руппы резко делятся на два ранга: а) существую
щие лишь в виде ветви на дереве (частоты в попу
ляциях не изучались); б) существующие и в виде
ветви, и в виде географической карты частоты их
распространения (частоты известны). И хотя раз
дел дереваY-base может отражать все многообра
зие тысяч известных ветвей (ранг 1), ключевые раз
делы инфосистемы должны содержать данные лишь
по тем гаплогруппам, для которых проведен попу
ляционный скрининги определены их частоты хотя
бы в нескольких популяциях (ранг 2). В 2011 году –
до эпохи полного секвенирования Y-хромосом – в
мировой литературе мы обнаружили 242 такие гап
логруппы ранга 2. К 2015 году, насколько известно
автору, в мировой копилке добавилось лишь около
сотни новых открытых гаплогрупп (в основном в
пределах «больших» гаплогрупп N, C, E, R1a, R1b),
для которых проведен популяционный скрининг по
новым субгаплогруппам.
ПРОГРАММНАЯ РЕАЛИЗАЦИЯ БДY-BASE
СТРУКТУРА ИНФОСИСТЕМЫ Y-BASE
В качестве системы управления инфосистемы
Y-base используется свободно распространяемая
СУБД PostgreSQL. Инфосистема содержит такие
основные разделы:
– таблица генотипов для изученных образцов
(значения SNP и STR маркеров);
– таблица популяций (со справочниками наро
дов, стран, регионов и др.), связанную стаблицей
генотипов соотношением «один ко многим»;
– иерархически упорядоченное дерево SNP
маркеров;
– справочник обозначений гаплогрупп и их со
ответствия одному или нескольким (синонимич
ным) SNP маркерам (номенклатура гаплогрупп);
– первоисточники данных (электронную биб
лиотеку).
Логически работа с инфосистемой может быть
разделена на два этапа:
1) ввод первичной информации (предусмотре
ны различные способы ввода);
2) проведение анализа хранимых данных для
получения частот гаплогрупп Y-хромосомы в раз
ных популяциях мира (предусмотрена возмож
ность выбора и комбинирования различных кри
териев, формируемых пользователем системы).
Пользователь системы имеет возможность ав
томатического расчета частот гаплогрупп в попу
ляциях мира. Для анализа данных сторонними про
граммными средствами, реализована функция эк
спорта данных, с которыми в данный моментра
ботает пользователь, в заданный формат электрон
ной таблицы.
1.1. База данных по Y-хромосоме
ЛОГИКА ОБРАБОТКИ ДАННЫХ
Основная сложность обработки данных состо
ит во взаимосвязи различных SNР маркеров, вы
текающей из иерархической структуры «родослов
ного древа» Y-хромосомы.
пы G2 в разных популяциях мира. Модуль осуще
ствит скрининг и сортировку всех записей (образ
цов) в отношении этого запроса на три типа.
В первый тип («-») попадут образцы, не отно
сящиеся к данной гаплогруппе, а именно те образ
ствуют SNР маркеры, специфичные для других
цы, которые несут SNР маркеры, маркирующие
другие гаплогруппы (ветви)иерархического древа
гаплогрупп (SNР маркеров, исключающие их от
несение к гаплогруппе G2).
Во второй тип («+») попадут образцы, несущие
SNР маркер, обозначаемый Р15, который марки
рует искомую гаплогруппу G2. В этот же тип по
крупных ветвей древа Y-хромосомы.
падут образцы, не проанализированные на маркер
Общепринято, что если для образца выявлено
наличие определенного SNР маркера, то это одно
значно доказывает принадлежность образца толь
ко к определенной ветви этого дерева. Одновре
менно это означает, что в образце заведомо отсут
Однако если выявленная ветвь Y-хромосомы
маркером. Поэтому допустим, что далее образец
Р15, но имеющие производный (derived) статус по
SNР маркерам, подчиненным данному маркеру
(маркирующие субветви в пределах ветви, марки
руемой Р15). В данном случае экспериментально
был проверен на SNР маркеры, специфичные толь
подтвержденная принадлежность образца к субвет
ко для трех из пяти известных субветвей данной
ветви. Если оказалось, что он не относится ни к
одной из трех проанализированных субветвей, то
ви автоматически означает его принадлежность и
имеет, например, пять субветвей, то каждая суб
ветвь определяется еще и своим собственным SNР
к Ветви в целОМ.
В третий тип («+») попадут образцы, относя
этот образец все еще может нести SNР маркеры на
щиеся ктой же суперветви, что и маркируемые Р15,
одну из двух оставшихся субветвей, но неизвест
но положение которых внутри суперветви неизве
но, на какую именно. Однако —увы! — авторы ис
ходных данных не генотипировали SNР-маркеры
стно. Для этих образцов нельзя вынести опреде
на оставшиеся две субветочки. Как поступать в
(Р15) или нет.
этом случае?
Наконец, следующий модуль (расчета частот
гаплогрупп) подсчитывает для каждой популяции
В этом случае при подсчете частоты встречае
мости всех ветвей (и субветвей) Y-хромосомы:
1) данный образец входит в подсчет частоты
своей «крупной» ветви («+»);
2) входит с «отрицательным» значением «-»
(как отсутствие данной ветви у данного образца) в
подсчет частоты всех прочих ветвей-гаплогрупп;
3) входит с «отрицательным» значением «-»
(как отсутствие данной субветви у данного образ
ца) для тех трех субветвей своей ветви, к которым,
как было выявлено, он не относится:
4) но этот образец никаким образом не входит
ленного суждения, относятся ли они к ветви G2
долю образцов второго типа от общего числа об
разцов в данной популяции, но для популяций,
имеющих хотя бы один образец третьего типа, бу
дет отмечено, что частота гаплогруппы G2 неопре
делима. Эта информация — частоты гаплогруппы
G2 во всех популяциях, где ее можно определить
из имеющихся данных, и указание на невозмож
ность такого определения для остальных популя
ций — и будет результатом искомого запроса.
Таким образом, применение модулей автома
тического определения гаплогруппы и расчетача
в подсчет частоты двух оставшихся субветвей, о
стот гаплогрупп позволяет полностью автоматизи
принадлежности его к которым из имеющихся дан
ровать наиболее трудоемкий и сложный этап об
работки и преобразования первичных генотипичес
ких данных для решения каждой конкретной зада
ных нельзя ничего заключить («+»).
ЦЕНТРАЛЬНЫЙ МОДУЛЬ ОПРЕДЕЛЕНИЯ
ГАПЛОГРУППЫ
чи. При этом возможность обновления дерева SNР
гаплогрупп обеспечивает эффективную работу
инфосистемы для максимально широкого круга
Описанная обработка одного образца относи
тельно легко осуществляется вручную грамотным
специалистом, но обработка даже нескольких со
тен образцов весьма трудоемка и уже ненадежна.
популяций: система не зависит от открытия новых
ветвей иерархического древа, введения в научный
оборот новых SNР маркеров и даже реорганиза
ции устоявшейся структуры иерархического дре
Поэтому в инфосистему интегрирован специали
ва, поскольку все эти изменения можно вносить в
зированный модуль, который, исходя из статуса тех
дерево гаплогрупп, не меняя сами данные и про
SNР маркеров, которые известны для данного об
цедуры их обработки.
разца, и иерархической организации древа гаплог
Данный модуль инфосистемы является цент
рупп, определяет, к какой именно ветви (гаплог
руппе) или субветви относится данный образец.
Приведем пример работы модуля. Например,
пользователь задал запрос на частоты гаплогруп
ральным в том смысле, что он преобразует первич
ную (экспериментально полученную) информацию
о статусе SNР маркеров в данном образце в иско
мую информацию о том, к какой именно гаплог
| ()
Глава 1. Создание баз данных о генофондах мира
руппе принадлежит образец. Таким образом, про
исходит автоматическая обработка эксперимен
тальных данных и помещение образца в одну из
частоты интересующей пользователя гаплогруппы
в каждой из выбранных популяций?
Задача, которую решает этот модуль програм
известных гаплогрупп. Данный модуль инфосис
мы — непосредственное получение частот гаплог
темы позволяет для каждого образца указать ал
рупп для всех внесённых в базу данных популя
лельное состояние каждого SNР маркера из пол
ций (или только избранных пользователем попу
ляций или регионов) с использованием таблицы
отнесения/исключения каждого образца к каждой
ного перечня и, соответственно, проставить при
надлежность или непринадлежность образца к
каждой из сотен известных на данный момент гап
логрупп.
из известных гаплогрупп, полученной в результа
те работы центрального модуля.
Крайне важный смысл этой операции состоит
в том, что в таблице представлено аллельное со
популяции по очереди рассматривает каждую по
стояние даже для тех SNР-маркеров, по которым
данный образец не исследовался. Например, у об
разца, для которого установлено, что маркер М9
находится в состоянии derived (+), также можно
предсказать состояние derived и по маркерам М89,
SRY 10831.1 и другим маркерам, предковым по от
ношению к мутации в маркере М9 (т.е. маркирую
щим более крупные ветви, на которых выросла эта
Алгоритм определения частоты гаплогруппы в
пуляцию и каждый маркер, отдельно от других
популяций и маркеров. Первый шаг — работа с «по
пуляцией А», маркером 12f2b, второй — стой же
популяцией, но уже смаркером 12f2a, и т.д. пока
программа не пройдёт все маркеры, выбранные для
популяции А. Затем столько же шагов для популя
ции Б, столько же для В итд.
Каждый шаг — это выполнение следующей про
более молодая ветвь), хотя в статье эти маркеры
цедуры: программа оценивает взвешенную долю
более крупных ветвей и не исследовались. Для со
поставления разных исследований, использующих
записей «D» в данном столбце для данной популя
ции и записывает её в строку «всего в популяции».
разные панели маркеров и дифференцирующих
Это число — доля образцов в популяции, которые
имеют в данном маркере производное (derived)
ветви древа на разную глубину, такое указание
маркеров для всех известных ветвей древа стано
вится крайне полезным: мы можем автоматически
отобрать для исследования любые более крупные
ветви, даже если их маркеры не изучены в публи
кации и крупные гаплогруппы не указаны.
Результатом работы этого центрального про
граммного модуля является таблица, в которой для
каждого образца проставлены аллельные состоя
аллельное состояние, то есть относятся к гаплог
руппе, которую данный маркер определяет. Напри
мер, взвешенная доля записей, имеющих в данной
популяции измененное состояние («D») в локусе
Р14 — это частота гаплогруппы F в популяции А.
Однако, иногда вычислить эту долю невозможно:
ного образца имеются экспериментальные данные,
но по всем 700 маркерам из перечня известного на
когда хотя бы одна запись в данном столбце удан
ной популяции содержит «U», то есть неизвестное
аллельное состояние. В этом случае вместо часто
ты пишется знак «Н» - частота неопределима.
После того как программа проходит по всем
момент разработки модуля SNР маркеров. Обнов
популяциям и маркерам, алгоритм оставляет толь
ление дерева происходит в полуавтоматическом
ко записи, указывающие для каждого сочетания
режиме, поэтому это число легко увеличивается до
«популяция-маркер» долю образцов в данной по
всех известных на данный момент маркеров. Ко
нечно, разработка этого алгоритма программного
модуля заняла месяцы, зато время обработки 1000
образцов тестовой программой, даже реализован
пуляции, имеющих производное состояние данно
ной макросом МS Excel, заняло всего около 20
керы для одной гаплогруппы в одну запись (зна
минут. Выполнение этой операции программой не
только сокращает время работы на несколько по
рядков, но также исключает ошибки, вызванные
чительно сокращая число столбцов в итоговой таб
ния не для 5—20SNР маркеров, по которым для дан
человеческим фактором.
го маркера. Теперь вспомним, что одна и та же
гаплогруппа может определяться многими марке
рами. Поэтому далее модуль объединяет все мар
лице). Таким образом, итоговая таблица содержит
в строках записи о популяциях, а в столбцах — о
гаплогруппах. На пересечениях строк и столбцов
— частоты гаплогрупп либо запись о невозможнос
ти их определения.
МОДУЛЬ РАСЧЕТА ЧАСТОТ ГАПЛОГРУПП
ДЕРЕВО ГАПЛОГРУПП Y-ХРОМОСОМЫ
Исходя изданных о принадлежности каждого
образца к той или иной гаплогруппе, этот модуль
базы данных рассчитывает частоты выбранных
пользователем гаплогрупп в выбранных популяци
ях. Тем самым модуль дает прямой ответ на наи
тальные разделы пока доступны только разработчи
более типичный запрос к инфосистеме — каковы
кам и дружественным пользователям по их запросу).
На нашем сайте www.genofond.ru размещены три
раздела базы данных дерево гаплогрупп, электрон
ная библиотека и БД среднеэтнических частот (ос
|1
1.1. База данных по Y-хромосоме
Дерево гаплогрупп Y-хромосомы было оцифро
вано, внесено в базу данных и реализован графи
ческий веб-интерфейс для работы с ним. Иерархи
ческая классификация гаплогрупп и определяющих
их мутаций (маркеров) закодирована в виде табли
цы, содержащей обозначение гаплогруппы, пере
чень дефенирующих ее маркеров (т.е. однозначно
ее определяющих) и ссылку на маркеры, дефениру
ющие более крупную гаплогруппу («родительскую»
по отношению к данной гаплогруппе).
Вспомогательная таблица представляет собой
полный перечень маркеров с указанием их принад
лежности к панели маркеров, определяющих одну
и ту же филогенетическую ветвь, и со ссылкой на
что маркеры, являющиеся лишь «филогенетичес
кими» синонимами (разные мутации, на данный
момент определяющие одну гаплогруппу, но фи
логенетическое положение которых может стать
различным после открытия дополнительных суб
ветвей) перечисляются в панели маркеров через
запятую и считаются разными маркерами. Марке
ры же, являющиеся синонимами в полном смысле
этого слова (одна и та же мутация, открытая неза
висимо разными авторами и получившая поэтому
разные обозначения), перечисляются через слеш
(например, Р220/S119) и рассматриваются инфо
системой как один маркер.
Большой объем современных знаний о топо
публикации с описанием данного маркера.
Раздел в настоящее время содержит 762 мар
кера, объединенных в 485 групп (соответственно,
логии дерева (порядке возникновения мутаций и
иерархической соподчиненности ветвей) делает
число гаплогрупп также составляет 485). Отметим,
даже интенсивно работающего в этой области спе
невозможным удержание всего дерева в памяти
трагик — д. б. н. Балановская Е.В.
Нарiogroup tree.
Нарpgroup
Пrве
| Search by marker group
Уl searchьyhaplogroup
ч.
Мына
-
пarker, Р97
з5,м14,м141,мl96,м206,м212, М23,м27блP247,м277уP248,м29уPзлPNз,м49,М6,м71,
, Р36.1, РА, Р5
А2
А2а
А2b
|5*: т.
М50
|
А2с
А3
АЗа
А3b
1. Р100, Р291
А3b1
рог рт
А3b1a
м127, МП3, М202, М219, М305
А3b2
М171
А3b2a
м|18
А3b2b
М139, М299, М42, М94, SRY10831.1/SRY10831a/SRY1532.1
М181, М60.Нg В шtspecifiedmarker, Р85, P90
м236,м288
мив
М182
Вт
в
в1
В1а
в2
мн50
bев
В2а
В2a1
Рис. 1.1. БД Y-base. Раздел дерева гаплогрупп в html-режиме.
Обозначения: В верхней области расположены кнопки выбора режима (html, дерево, таблица), вход в режим
редактирования (по паролю администратора) и кнопка печати выделенного фрагмента дерева в pdf файл.
Ниже находится фильтр по гаплогруппе (выбирается либо буквенное обозначение гаплогруппы из выпадаю
щего списка, либо вводится один из маркеров-дефенаторов с клавиатуры).
Основная часть формы занята древом гаплогрупп, на котором нанесены все дефенирующие маркеры, а справа
от ветвей — обозначения соответствующих гаплогрупп по текущей классификации.
Черным цветом показаны ветви нижнего уровня (не имеющие подчиненных субветвей). Целчок по ветвям,
маркеры которых подписаны синим шрифтом, раскрывает страницу с фрагментом дерева, корнем которого явля
eТСЯ выбранная ветвь.
12
Глава 1. Создание баз данных о генофондах мира
циалиста. Поэтому удобный и быстрый просмотр
интересующего фрагмента дерева является поми
нутно возникающей практической задачей. Создан
нaя нaми программа по своим возможностям (ус
коренная навигация, поиск, получение справочной
информации, печать в файл), по меньшей мере, не
уступает основному зарубежному аналогу — сайту
международного сообщества генетической генеа
логии www.isogg.org.
Реализованы три режима работы с древом для
пользователей: режим просмотра html (представ
чинять ветви, разделять группы маркеров, редак
лен на рис. 1.1), режим дерева (рис. 1.2) и режим
ЭЛЕКТРОННАЯ БИБЛИОТЕКА ПУБЛИКАЦИЙ
тировать информацию по отдельным маркерам и
т.д.
В целом, созданный раздел «дерево гаплог
рупп» является эффективным инструментом и
для организации хранимых данных о геноти
пированных образцах (привязка к известной
гаплогруппе), и для расчета частот гаплогрупп,
и удобным справочником, который может ис
ПОЛЬЗОВаТЬСЯ
НезаВИСИМО.
ИСТОЧНИКОВ
таблицы. Для администратора реализован режим
редактирования, позволяющий обновлять как таб
лицу дерева целиком (загрузка нового дерева из
Одним из важных элементов базы данных яв
ляются публикации — источники исходных данных.
Легкий доступ к статьям внутри самой базы по
файла), так и редактировать отдельные ветви. Ад
министратор может удалять, добавлять и перепод
ХудPум — д. б. н. Балановская Е.Б.
27 апрела
Мапраде
По
по имп
нартотопр
манkeгoгoпp
-
м91/Нg дunspecified marker, Р97
-
Г-вт
м139. м299, м42, м94. Spy10831.1/sFy10831aysRY1532
В
м181, мбоуна в unspecified marker, P35, poo
- сгов
мlб8, м294, pg.1
сг
Р143
= с
мнзоyRps4yRps4y/Rps4х711/pps4y-711/штул-зб78+5з7, м2:15, Р18
o c-RВF2
н
REF2
с
мlo5, мизи, м8, Р122
c2
cз
м38
С4
м347, P309
cs
м355
|
p55
|
м217, Р44, pt:2
в се
м213/P137. м235, мsoyoys188.792, P133, Р134, Р135, Р13б, Р138, Р11
F
мтуруs287ум1-удP/удр, м145/p2o5, м2оз, Р144, Р153, p155, Р157, p
н ов
|
миркеры все
магнет
Наріодгошp
* оптсе
магker group
|
|
|
Р22o/S119
кarafet et al (2008)
а
М320.1
"private=single Druze individual Sherт
м320.1
кarafet et al (2008)
мізі меонавчо веснея,
в рss
|
12b1
в
Lз4, Lза, L59, м2:23, p219/s2.
Рис. 1.2. БД Y-base. Раздел дерева гаплогрупп в режиме "tree".
Обозначения: В верхней части экрана представлено раскрывающееся дерево гаплогрупп. Раскрытые ветви
отображаются треугольником, направленным вниз, нераскрытые — треугольником, направленным вправо. Чтобы
развернуть или свернуть ветвь, следует щелкнуть по соответствующему ей треугольнику. Ветви, не имеющие
вложенных субветвей, обозначаются кружками.
В приведенном на рисунке примере раскрыты ветви первого уровня в пределах гаплогруппы С (показаны да
лее нераскрытые ветви С1 — С5, а также не имеющие вложений ветви С-RВF2 и С6).
Приводятся как обозначение гаплогруппы, так и состав определяющей ее группы маркеров.
В нижней части экрана приводится таблица маркеров. В ней можно осуществлять поиск, вводя искомые значе
ния в поля, расположенные под заголовками соответствующих столбцов. При щелчке по гаплогруппе в верхней
форме (дерево) в нижней части автоматически фильтруются все маркеры, определяющие данную ветвь.
|3
1.1. База данных по Y-хромосоме
зволяет быстро обратиться к первоисточнику затем
или иным уточнением и является эффективной
дополнительной гарантией минимизации ошибок
(например, при описании популяции).
База публикаций имеет и самостоятельную цен
ность как тематическая электронная библиотека
(тематикой является изменчивость Y-хромосомы в
популяциях человека). Хотя большинство статей
присутствуют и в глобальных электронных библио
теках (например, РubМеd), но далеко не для всех
публикаций в свободном доступе имеются полно
текстовые версии; кроме того, в связи с огромным
числом статей, Рubmed не всегда удобен для поис
капубликаций по Y-хромосоме.
Интерфейс созданного раздела «Источники»
показан на рис. 1.3 и рис. 1.4.
Пользователю предоставляется возможность
фильтрации по любому из четырех основных по
лей (авторы, год издания, название статьи, выход
мосомными гаплотипами, которые как раз и яви
ЛИСЬ ОСНОВНЫМИ ИСТОЧНИКaМИ даННЫХ ДЛЯ НаПОЛ
нения инфосистемы).
Пополнение раздела осуществляется в режи
ме администратора. Заполнение библиографичес
ких полей предусмотрено в формате наиболее по
пулярной среди генетиков библиографической про
граммы Еndnote, что значительно экономит время
администратора (один из форматов экспорта
Еndnote является форматом для автоматического
импорта в библиографический раздел Y-base).
Ссылки на раздел «Источники» из других разде
лов инфосистемы осуществляются по ID публика
ции, а пользователю отображаются в формате «пер
вый автор, год».
База «Источники» доступна на нашем сайте
www.genofond.ru, раздел «Базы данных», далее «Y
хромосома» и далее «Publications». Интерфейс раз
дела создан на английском языке, поскольку раз
ные данные). При клике мышью на названии ин
тересующей статьи открывается новая страница,
на которой представлена подробная библиографи
ческая ссылка (18 полей, включая аннотацию ста
тьи). Также на этой странице пользователю пред
рабатываемая инфосистема ориентирована не толь
ЛаГаеТСЯ ВОЗМОЖНОСТЬ ОЗНаКОМИТЬСЯ С ТеКСТОМ СТа
На сайте www.genofond.ru нами представлен,
конечно же, крайне сокращенный, но пригодный к
использованию аналог основной версии инфосис
тьи (как правило, pdf файл), а также электронны
ми приложениями (как правило, xls файлы с Y-хро
ко на российских пользователей.
БАЗА СРЕДНЕЭТНИЧЕСКИХ ЧАСТОТ
Плаги — д. б. н. Балантеская Е.Н.
27}едседа
трон
Main page
SoURCES: Papers on y chromosomal variation
-
Аuthors
Year
|Jошта!
Title
|
|aaetano
- - -
- -
- -
- -
|
-
-
V N Кharkov, V. А Stepanov, S. Р.
2005
Genetika 41 8 1132-5
Feshchenko, S. А Вorinskala, N. К.
2005/09/16 Ацg
Iarkovskii and V. Р. Рuzyrev
V N Кharkov, V. A. Stepanov, O. F.
2007
В. А. Маharchuk and М. V. Derenko
Gene pool differenc
es between northern and |Genetika 43
southem Aliaans inferred from the data on
Меdvedeva, М. G. Spiridonova, М I
Voevoda, V N Тadinova and V. Р. Рuzyrev
5 675-87
20070719 Мау
Y-chromosomalhaplogroups)
2008
Gene pool structure of Russian populations (Genetka 44 2 226-31
вот he European part of Russianferred
2003/07/18 Feb
from the data on I chromosomehaplogroups
distribution
| |V. N. Кharkov. V. A. Stepanov. S. А
Воrinskaia, М. Коrhekbaeva Zh, V. А.
2004
Structure of the gene pool of eastern
Ukrainians from Y-chromosome
Gusar, E. Grechanina, V. Р. Рuzyrev, Е. К.
Genetika 40 3 415-21
2004/05/06 Маr
haplogroups
Кhusnutdinova and lЧ К. Iankowskш
V N Кharkov, V. A. Stepanov, O.F.
Мефvedev. М. G. Spiridonova. N. R.
2008
ITheorigin of Yakuts analysis of
X-chromosomehaplotypes
Мaksimova, А N. Nogovitsyna and V. Р.
| |Рuzyrev
Рис. 1.3. БД Y-base. Интерфейс раздела «Источники».
В качестве примера показан поиск статей с соавторством Gaetano.
Мо1Вtol (Моsk) 42 2
226-37 2008/07/10
Мar-Аpr
Глава 1. Создание баз данных о генофондах мира
Лудгук — д. б. н. Балановская Е.Б.
Main page
Мап Page? SoURCES Paperson I chromosomalvanation
Нарpgroup
Differential Greek and northern African migrations to Sicily are supported by genetic evidence
from the Y chromosome
Рингапs
Download
Size
Эватт
Di Gaetano 2008 Differential Greek and northern African migrations to pdf|321471 byte
Di Gaetano 2008 supplxls
|
46592 byte
Reference Type: Journal Article
Record Nшmber 28
Аuthor. С. Di Gaetano, N. Cenutti, F. Crobu, C. Robino, S. Inturri, S. Gino, S. Guarrera, Р. А Underhill, R. J. Ring, V. Romano, F.
Сай, М. Gasparini, G. Matullo, A. Salerno, С. Тоrre andА Piazza
Year 2009
Title: Differential Greek and northern African migrations to Sicily are supported by genetic evidence from the Y chromosome
Jошпаl EurЛ Нum Genet
Volume 17
Issue: 1
Рages: 91-9
Ерub Date: 2008/08/08
Date: Jan
Рис. 1.4. БД Y-base. «Источники», просмотр отдельной записи.
Библиографические детали и файлы для скачивания для одной из найденных статей с соавторством Gaetano.
темы Y-base. Для этого мы определили среднеэт
нические частоты, то есть характеристики не от
дельных локальных популяций, а их этнических
групп — народов, поскольку именно эта информа
ция является наиболее часто востребуемой широ
кой аудиторией. Онлайновый вариант БД имеет
простейшую структуру — таблицы Еxcel, в стро
ках которой перечислены народы, столбцах — гап
логруппы, а на пересечении указывается частота
данной гаплогруппы у данного народа. Такая он
лайновая база данных не содержит STR гаплоти
пов, лишена возможностей автоматического попол
нения, поиска по комбинации полей, верифика
ции и других возможностей, реализованных в ос
новной версии инфосистемы, однако она несет
важнейшую информацию о частотах гаплогрупп
Y-хромосомы у народов мира, и эта информация
Для удобства использования среднеэтническая
база данных представлена в двух версиях — «пол
ной» и «рекомендуемой». «Полная» версия базы
данных содержит информацию о 335 гаплогруп
пах, что обычно является избыточным и затрудня
ет навигацию по базе. Поэтому в «рекомендуемой»
версии дробные гаплогруппы объединены в 29 ос
новных. Использование «полной» версии целесо
образно лишь в тех редких случаях, когда нужно
получить информацию подробному субварианту
той или иной гаплогруппы или детально разобрать
ся, на чем основана указанная в рекомендуемой
версии частота гаплогруппы. Во всех остальных
случаях целесообразно пользоваться «рекоменду
емой» версией базы данных.
В «полной» версии в данный момент содер
жится информация о частотах 335 гаплогрупп.
уже широко используется в исследованиях как на
Для удобства пользователей в связи с ограниче
шего коллектива, так и других лабораторий.
База данных среднеэтнических частот гаплог
рупп Y-хромосомы у народов мира содержит ин
ниями одной из распространенных версий МS
Еxcel (не более 256 столбцов) народы представ
формацию о частотах 335 гаплогрупп Y-хромосо
мы у 252 народов и основана на суммарной вы
борке 55 024 человек.
лены в столбцах, а гаплогруппы — в строках. В
ячейках содержатся частоты данной гаплогруп
пы у данного народа. Народы отсортированы
справа налево в алфавитном порядке. Для каждо
1.1. База данных по Y-хромосоме
го народа указано его название, страна (или стра
ны), где он был изучен, объем выборки, ссылка
на источники информации.
В «рекомендуемой» версии содержится инфор
мация о частотах 29 основных гаплогрупп. Для
удобства пользования народы представлены в стро
ках, а гаплогруппы – в столбцах. Пустые ячейки
означают, что для данного народа нет информации
15
о частоте данной гаплогруппы. Народы отсорти
рованы сверху вниз в алфавитном порядке. Для
каждого народа указано его название, страна (или
страны) где он был изучен, объем выборки подан
ному народу, ссылка на источники информации. В
«рекомендуемой» версии применено условное фор
матирование: ячейки окрашены разным цветом в
зависимости от величины значения частоты.
ПРОГРАММА HAPLOMATCH ДЛЯ ПОИСКА СХОДНЫХ ГАПЛОТИПОВ
Совместно с созданием базы данных по Y-хро
мосоме нашим коллективом были разработаны еще
две программы, помогающие обрабатывать масси
выданных по Y-хромосоме – предиктор гаплогрупп
Y-predictor и программа поиска совпадающих гап
лотипов Haplomatch. Обе программы размещены
в свободном доступе (www.genofond.ru, раздел
Базы данных / БД по Y-хромосоме).
СУТЬ ПРОГРАММЫ HAPLOMATCH
Задачи сравнения отдельных индивидуумов
или целых популяций по спектру гаплотипов мало
выполнимы вручную в силу их большой трудоем
кости. Нами предложен алгоритм определения
сходства STR гаплотипов, пригодный для анализа
массовых выборок, и разработана компьютерная
программа Haplomatch, позволяющая находить гап
лотипы, отличающиеся от заданного на любое ко
личество мутационных шагов. Программа может
функционировать в двух режимах: сравнение ин
дивидов и сравнение популяций. Гибкость про
граммы (возможность использования не встроен
ной, а любой внешней базы данных), удобство ис
пользования (работа происходит с таблицами MS
Excel) и возможность распространения на гапло
типы других хромосом и других биологических
видов может сделать ее новым полезным инстру
ментом в популяционно-генетических, криминали
стических и генеалогических исследованиях. Про
грамма Haplomatch написана на языке Pascal сту
дентом-дипломником МАИ Ильей Ивановым под
руководством автора.
НУЖДА В ПРОГРАММЕ ПОИСКА ГАПЛОТИПОВ
STR-гаплотипы Y-хромосомы являются попу
лярным инструментом в исследованиях генофон
дов – в базе данных PubMed ежегодно фиксирует
ся несколько десятков статей с их использовани
ем. Не менее важную роль STR маркеры Y-хромо
сомы (Y-STR) играют и в судебно-медицинской
практике: они являются второй по частоте исполь
зования (после аутосомных STR-маркеров) систе
мой маркеров при проведении ДНК-экспертиз.
Третьей областью применения Y-STR маркеров
является генетическая генеалогия – число коммер
ческих компаний, предлагающих своим клиентам
анализ Y-STR для прослеживания мужской генеа
логической линии, неуклонно растет и в России, и
в мире.
Основными методами обработкиданных о раз
нообразии гаплотипов Y-хромосомы являются: по
строение филогенетических сетей; подсчет гапло
типического разнообразия с последующей оцен
кой возраста гаплогруппY-хромосомы методом мо
лекулярных часов; расчетRST генетических рассто
яний и построение на их основе графиков много
мерного шкалирования; проведение анализа глав
ных компонент; сравнение спектра гаплотипов в
разных популяциях; анализ распространения кон
кретного гаплотипа в широком круге популяций.
Программа Haplomatch находится в русле дальней
шей разработки последнего из перечисленных ме
тодов – анализа совпадающих гаплотипов. В по
пуляционно-генетических исследованиях такой
подход зарекомендовал себя как один из надежных
способов выявления исторических миграций. На
пример, экспансия финикийцев по Средиземномо
рью была генетически изучена именно в результа
те анализа наличия/отсутствия отдельных гапло
типов и их ближайших мутационных «соседей»
гаплотипов [Zalloua et al., 2008a]. Проследить миг
рацию крестоносцев на Ближний Восток удалось
благодаря подробному анализу одного высокоин
формативного гаплотипа [Zalloua et al., 2008b]. Для
проведения судебно-медицинских экспертиз и для
определения вероятного этногеографического про
исхождения также требуется поиск гаплотипов, со
впадающих с заданным, в обширных базах данных.
Однако широкое применение такого подхода и в
популяционной генетике, и в криминалистике от
части сдерживается отсутствием четкого алгорит
ма и специализированного программного обеспе
чения, поскольку проведение подобных операций
вручную слишком трудоемко.
В наиболее популярной в популяционно-гене
тических исследованиях программе Arlequin мож
но проводить поиск только полностью совпадаю
щих гаплотипов, т.е. поиск гаплотипов, отличаю
щихся даже на один мутационный шаг, не предус
мотрен. Другой программой, предоставляющей
|6
Глава 1. Создание баз данных о генофондах мира
ляется разработанный европейскими криминали
тике и в генетической генеалогии, а в ряде случаев
и в популяционной генетике.
стами онлайн ресурс YНRD http://www.yhrd |12|
Однако эта система, во-первых, работает только со
РЕЖИМ СРАВНЕНИЯ ПОПУЛЯЦИЙ
возможность поиска одинаковых гаплотипов, яв
своей внутренней, закрытой для пользователей
базой данных, а во-вторых, проводит поиск только
ти (популяционной выборке). Таким образом, есть
В режиме сравнения популяций программа вы
полняет более сложную задачу сравнения с базой
данных не отдельного гаплотипа, а целой выборки
острая нужда в программном обеспечении, кото
рое позволило бы автоматизировать процесс срав
гаплотипов (представляющих интересующую нас
популяцию, называемую далее реперной). Для это
нения гаплотипов, как между отдельным индиви
го программа вычисляет генетические расстояния
по отдельному гаплотипу, но не по их совокупнос
дом и обширной базой данных, так и между целы
(определяемые как доля сходных гаплотипов) меж
ми популяциями.
дуреперной популяцией и всеми прочими популя
циями анализируемой базы данных. Поэтому этот
АЛГОРИТМ
режим оптимален для популяционно-генетических
исследований. Программа последовательно прово
Алгоритм определения степени сходства гап
дит сравнение каждого гаплотипа, представленно
лотипов основан на сумме различий по всем изу
го в реперной популяции, с гаплотипами из популя
ций в подгружаемой базе данных и потом рассчи
тывает суммарные характеристики для всей репер
ной выборки в целом, т.е. находит количество со
впадений с заданным пользователем числом мута
ционных шагов между исследуемой популяцией и
каждой популяцией из базы данных. Как и в режи
ченным микросателлитным локусам (Y-STR), т.е.
по числу известных мутаций, разделяющих эти два
гаплотипа. Сначала у отдельного исследуемого
гаплотипа и в базе данных программа находит оди
наковые локусы. Затем значения аллелей (число
STR-повторов) в этих локусах вычитаются помо
дулю. И далее эти разности суммируются по всем
локусам. Если сумма меньше или равна заданно
му максимальному шагу мутационных различий,
то программа считает это совпадение весомым, и
заносит в таблицу результатов.
Поясним вышесказанное простым примером.
Если у исследуемого нами образца и i-го образца
из базы есть отличие по локусу № 1 в один шаги
локусу № 4 в два шага, а по остальным локусам
между ними нет отличий, то сумма мутационных
ме сравнения индивидов, в режиме сравнения по
пуляций доля общих гаплотипов между сравнивае
мыми популяциями определяется с разбивкой по 0,
1, 2 и далее мутационных шагов.
Выбор числамутационных шагов, в пределах
которого гаплотипы считаются совпадающими,
определяется целями исследования. Если изучают
ся древние исторические события, то информатив
НЫМИ ОказываЮТСЯ Не ТОЛЬКО ПОЛНые СОВПадения
шагов между ними равна трем (отличие в один шаг
(0 мутационных шагов), но и отличия в 1, 2 и 3
мутационных шага. Это вызвано тем, что гапло
из первого локуса плюс отличие в два шага из чет
тип, который был общим в предковой популяции,
вертого локуса).
Программа Нарlomatch может функциониро
вать в двух режимах: сравнение индивидов и срав
нение популяций.
мог мутировать, например, по одному разу в каж
дой из разделившихся популяций, и тогда при изу
чении современных популяций потомки этого об
щего гаплотипа будут различаться на два мутаци
онных шага. В то же время имеет смысл рассмат
РЕЖИМ СРАВНЕНИЯ ИНДИВИДОВ
pивать гаплотипы только в пределах ограниченно
В этом режиме программа анализирует только
один гаплотип данного индивида, находя в базе
гочисламутационных шагов, выбирая это число в
зависимости от предполагаемой временной глуби
ныродства сравниваемых популяций. Ведь, соглас
данных гаплотипы, совпадающие с ним полностью
или частично — по числу заданных пользователем
мутационных шагов. База данных является подгру
жаемой, поэтому пользователь может сам сформи
ровать и обновлять требуемый массив данных для
поиска. Программа производит поиск как гапло
типов, полностью совпадающих с заданным (0 от
личий), так и частично совпадающих гаплотипов
(отличающихся на 1, 2 и далее мутационных ша
гов), и указывает популяции, из которых они про
исходят. Этот режим оптимален при определении
вероятного региона происхождения человека, что
может использоваться в криминалистической прак
но «эволюционной» скорости мутирования STR
маркеров Y-хромосомы, при изучении 17 STR-мар
керов разница в 1 мутационный шаг между двумя
индивидами означает, что их общий предок жил
около 1500 лет назад, при использовании «генеа
логической» скорости — около 500 лет. Поэтому для
исследования популяционных событий в пределах
последнего тысячелетия можно рекомендовать ис
ПОЛЬЗОВать ГаПЛОТИПЫ ПОЛНОСТЬЮ СОВПадающие
или отличающиеся не более, чем на один шаг
При работе, связанной со сравнением целых
популяций, необходимо учитывать неравенство
объемов выборок. Большое разнообразие гаплоти
17
1.1. База данных по Y-хромосоме
пов в нерекомбинирующих генетических системах
(мтДНК и Y-хромосоме) приводит к тому, что
сколько и в какой популяции найдено совпадений с
гаплотипами из исходных данных. Полученные ре
спектр обнаруженных гаплотипов зависит от объе
ма выборки, и насыщение недостигается даже при
многосотенных выборках. В результате в популя
ции, представленной большей выборкой, именно
по этой причине может быть обнаружено большее
зультаты можно экспортировать в привычные фор
число совпадающих гаплотипов, и генетическое
выборок гаплотипов. Программа эффективно ра
сходство с этой популяцией будет завышено. Что
бы избежать этого, число совпадений должно быть
нормировано на объемы выборок. Поэтому среди
ряда показателей, вычисляемых программой, наи
ботает и при загрузке баз данных с объемом 10 000
— 15 000 образцов, т.е. объем базы данных не явля
более информативным является показатель «Отно
шение точных совпадений кразмеру выборки». Эта
возможность также является важным преимуще
ством данной программы.
маты csv или xls.
Анализ быстродействия показал высокую ско
рость при обработке одиночных анализируемых
гаплотипов и удовлетворительную — при анализе
ется фактором, лимитирующим быстродействие.
Что же касается объема файла с анализируемыми
гаплотипами, то скорость оставалась оптимальной
при одновременной обработке до 50 образцов. При
использовании большего количества скорость ра
боты программы значительно снижается, поэтому
крупные выборки, превышающие 50 образцов, ре
РАБОТА ПРОГРАММЫ
комендуется загружать в программу частями и за
тем суммировать число найденных совпадений.
Для работы программы Нарlomatch требуется
загрузить в неё два исходных файла: базу данных,
ПРИМЕР В РЕЖИМЕ ИНДИВИДОВ
содержащую гаплотипы, с которыми будет осуще
ствляться сравнение, и файл с анализируемым гап
лотипом (или выборкой гаплотипов). Для удобства
пользователя, программа работает с файлами в фор
матах «.xls» и «csy», совместимыми с МS Excel.
Файл базы данных содержит следующую ин
Приведем в данной главе только более простой
пример использования в режиме сравнения инди
видов, поскольку использование программы «в
деле» — для реального исследования генофонда
и количество повторов по каждому из исследован
популяции донских казаков — можно найти в рабо
те (Чухряева и др., 2015). В режиме же индивидов
мы проанализировали три произвольно выбранных
индивида из той же выборки казаков; в качестве
максимального был выбран шаг равный трем му
ных STRлокусов.
тационным шагам. Один из выбранных индивидов
формацию: популяция, к которой принадлежит
образец; обозначение образца; маркер, определя
ющий гаплогруппу образца; гаплогруппа образца
Файл с анализируемым гаплотипом содержит:
обозначение образца, комментарий к нему (необя
зательное поле) и количество повторов по каждому
из исследованных STRлокусов. При наличии оши
бок в базе или исходном файле, программа обратит
на это внимание пользователя, выделив их красным
ЦВеТОМ.
После загрузки данных необходимо задать мак
симальное число мутационных шагов (от 0 долю
бого задаваемого пользователем числа), в пределах
которого гаплотипы обрабатываются как сходные.
После этого можно начинать операцию сравнения
всех гаплотипов. По окончании расчетов, на экране
отобразятся все гаплотипы из базы данных, отлича
принадлежал к гаплогруппе I2a-Р37; второй к
R1a1-М198(xМ458) и третий к R1a1a7-М458. Ре
зультаты их сравнения с рядом популяций, кото
рые могли быть связаны с происхождением попу
ляции казаков, показаны в таблице 1.3. Из неё вид
но, что для двух образцов найдены точные совпа
дения: 4 совпадения для носителя гаплогруппы I2a
Р37 с восточными украинцами и 1 совпадение с
западным украинцем, а для носителя R1a1
М198(xМ458) — 3 совпадения с центральными рус
скими и 2 совпадения с южными русскими. Лишь
для носителя гаплогруппы R1a1a7-М458 в базе
данных не найдено точных совпадений, однако есть
совпадения с отличием в один шаг с целым рядом
ющиеся от анализируемого гаплотипа на числому
популяций: наибольшее количество совпадений об
тационных шагов, меньшее или равное заданному
наружено с центральными русскими, а также они
пользователем. Результаты организованы в табли
цу, указывающую обозначения анализируемого гап
лотипа и найденного гаплотипа из базы данных, ко
имеются в популяции восточных украинцев, казан
личество совпавших локусов между этими гапло
заков, оказалось возможным очертить географичес
ских татар и западных украинцев. Итак, для всех
случайно отобранных трех образцов донских ка
типами; количество мутационных шагов, разделя
кyю зону вероятного происхождения прямого пред
ющих гаплотипы: в каких локусах содержатся эти
ка по мужской линии, что может представлять ин
терес для генетико-генеалогических исследований,
отличия, а также всю информацию о найденных гап
лотипах, содержащуюся в базе данных. При нажа
а также при определении вероятного этногеогра
тии кнопки «Вy population», полученные данные
фического происхождения образца ДНК при реше
организуются в таком виде, что становится видно,
нии криминалистических задач.
|8
Глава 1. Создание баз данных о генофондах мира
Таблица 1.2. Результаты работы программы Нарlomatch
дг
сс
ё |= |a
|S
ё в| 3
5 =| =
е
в
ё:
ё
2.
Для тех же трех образцов донских ка
заков мы попытались определить реги
в режиме сравнения индивидов.
5
| =
5
| =
он происхождения с помощью YНRD
|12|. Точные совпадения были найдены
для тех же двух образцов. Но по панели
Y-filer, состоящей из 17 локусов, в YНRD
ёё| ё = | = }| = 3
становится возможным определить про
# 3 в | 3 ё| 3 ё
исхождение образца географически
З
ё
ё 3| 8
| }
| }
5
=
| 3
|| 5
| 5
лишь крайне приблизительно — «Восточ
нaя Европа». Разумеется, для кримина
ё
ё
|5
|5
ЛИСТИКИ И даже для ГенеалОГИИ Такие
дг
—
сведения являются чересчур общими и
образец с гаплогруппой R1a1a-М458
малоинформативными. Ресурс YНRD
центральные русские
442
()
4
2
14
Восточные украинцы
397
()
2
6
19
также предлагает поиск совпадений по
минимальной панели, состоящей из 9
STR маркеров, по которой база данных
гораздо обширней, чем по Y-filer (17 STR
маркеров). Разумеется, при поиске по
Казанские Татары
| 38
()
2
2
()
Западные украинцы
586
()
|
8
28
ЛИТОВЦЫ
298
()
()
4
|1
ногайцы
57
()
()
3
2
минимальной панели совпадений было
Южные русские
| 15
()
()
3
2
найдено на порядок больше. Но посколь
шапсуги
97
()
()
()
|
грузины
абхазы
|69
51
()
()
()
()
()
()
|
()
армяне
168
()
()
()
()
Черкессы
129
| 56
()
()
()
()
()
()
()
()
азовские Греки
95
()
()
()
()
северные русские
121
()
()
()
()
ку уменьшение количества анализируе
мых локусов уменьшает и разрешающую
способность метода, то и в этом случае
области генетического сходства остают
КаЛМЫКИ
образец с гаплогруппой R1a-М198
Центральные русские
442
3
8
24
23
южные русские
| 15
2
4
7
7
ЛИТОВЦЫ
298
()
3
12
18
ногайцы
57
()
|
2
|
Казанские Татары
| 38
()
2
5
8
Западные украинцы
586
()
4
19
39
Восточные украинцы
397
()
()
9
2()
Грузины
|69
()
()
|
()
азовские Греки
95
()
()
|
4
черкесы
129
51
()
()
()
()
2
()
3
()
ся слишком широкими. А именно, для
образца R1a1a7-М458 она охватывает
часть западной, восточную, южную Ев
ропу и центральную Россию; совпадения
обнаружены также и в Юго-Западной
Азии. Для образца I2a-Р37 область со
впадений определена несколько точнее
— в основном она приходится на Украи
ну и центральную Россию, но и в цент
ральной Европе обнаружено немало
сходных гаплотипов. Но для образца,
принадлежащего к гаплогруппе R1a1
М198(xМ458) картина получается еще
абхазы
более запутанной — совпадения по ми
нимальной панели найдены не только в
армяне
168
()
()
()
()
Шапсуги
97
| 56
()
()
()
()
()
()
()
()
большее количество совпадающих об
()
разцов) и в Европе, но также и в Афга
России (где все же располагается наи
КаЛМЫКИ
северные русские
121
()
()
()
образец с гаплогруппой I2a1-Р37
Восточные украинцы
397
4
5
|1
2()
западные украинцы
586
|
8
18
34
Казанские Татары
| 38
()
2
|
()
ЛИТОВЦЫ
298
()
()
2
|
Центральные русские
442
()
()
4
2
ногайцы
57
()
()
|
()
южные русские
абхазы
| 15
51
()
()
()
()
|
()
3
()
армяне
168
()
()
()
()
Черкесы
129
()
()
()
()
Шапсуги
КаЛМЫКИ
97
| 56
()
()
()
()
()
()
()
()
нистане, Монголии, Китае и некоторых
других странах. К тому же в YНRD дан
ные по обнаруженным совпадениям не
возможно получить в виде таблицы, где
были бы указаны конкретные регионы
происхождения образцов. Таким обра
зом, единственный сходный по задачам
ресурсYНRD не может рассматривать
ся в качестве замены разработанной
нами программы Нарlomatch. Суще
ственно, что Нарlomatch позволяет
Грузины
|69
()
()
()
()
азовские греки
95
()
()
()
()
пользователю подгружать любую базу
данных, тогда как YНRD работает толь
ко с собственной встроенной, закрытой
северные русские
121
()
()
()
()
для пользователей базой данных. Также
1.1. База данных по Y-хромосоме
Haplomatch позволяет проводить сравнение не
только индивидуальных гаплотипов, но и сравни
19
вать генофонды популяций по выборкам гаплоти
пов.
ПРЕДИКТОР SNP-ГАПЛОГРУППЫ ПО STR-ГАПЛОТИПУ
СУТЬ ПРЕДИКТОРА
Программа-предиктор Y-Predictor нацелена на
прогноз SNP гаплогруппы Y-хромосомы для каж
дого образца по данным об STR маркерах данного
образца. В отличие от определения гаплогруппы
по SNP маркерам, то есть по прямым данным, пре
диктор определяет (предсказывает, дает наиболее
вероятный прогноз) гаплогруппу по косвенным
данным, а именно по информации об STR марке
рах. Основой для этого является общепризнанная
высокая корреляция STR гаплотипа с гаплогруп
пой, определяемой по SNPмаркерам. Хотя достичь
стопроцентной правильности прогноза гаплогруп
пы по STRданным невозможно, для практическо
го применения такая программа является чрезвы
чайно полезным инструментом. Создание алгорит
ма и программная реализация предиктора Y
Predictor выполнены Вадимом Урасиным, а орга
низация работы, информационной и финансовой
поддержки, а также проектирование интерфейса
программы – автором данного исследования. Сре
ди большого числа близких по задачам программ
разработанный нами предиктор является одним из
наиболее точных, и, пожалуй, наиболее удобным
в использовании.
ОБЛАСТЬ ПРИМЕНЕНИЯ
Во-первых, для образцов, изученных как по
SNP, так и по STR маркерам, модуль Y-Predictor
дает второе независимое определение гаплогруп
пы, которое теоретически должно совпасть с пер
вым – прямым определением по SNP маркерам. На
практике же нередко возникают расхождения меж
дурезультатами, полученными этими двумя мето
дами, благодаря чему мы получаем дополнитель
ную информацию.
Например, предположим, что образец по SNP
маркерам относится к гаплогруппе G, но не был
изучен на подчиненные SNP маркеры (субветви
гаплогруппы), а прогноз по STR маркерам указы
вает на гаплогруппу G2. Очевидно, что в этом слу
чае противоречия нет, а имеет место уточнение –
пусть предположительное – SNP гаплогруппы бла
годаря применению STR-предиктора (переход с
уровня над-ветви G на уровень ветви G2). Если же
модуль-предиктор сообщает прогноз на иную гап
логруппу, например R1b, то, хотя такое противо
речие может быть вызвано неверным прогнозом,
оно также указывает пользователю на возможность
ошибки в экспериментальных SNP данных по это
му образцу и на необходимость относиться к све
дениям из данной публикации с определенной ос
торожностью.
Во-вторых, для образцов, изученных по STR
маркерам, но не изученным по SNP маркерам, мо
дуль Y-Predictor является единственной возможно
стью определения гаплогруппы, пусть даже пред
положительного. Далее, уже в зависимости от кон
кретных задач, можно выбрать: а) пользоваться ли
данными по образцам, гаплогруппы которых оп
ределены только предиктором; б) ограничиться
данными по образцам, гаплогруппы которых оп
ределены прямым методом по SNP маркерам; в)
или же (для задач, требующих особой тщательно
сти) отобрать только те образцы, в которых гап
логруппы были определены обоими способами и
их результаты совпали.
Третья область применения предиктора – уп
рощение определения гаплогрупп лабораторными
методами. Это позволяет сначала провести опре
деление STR маркеров. Затем предиктор дает про
гноз гаплогруппы для данного образца. После этого
проводится его тестирование лишь потому конк
ретному SNPмаркеру, которое предсказано предик
тором. Таким образом, проводится проверка про
гнозатипированием одного SNP маркера вместо
иерархического типирования множества SNP мар
керов. Лишь в тех случаях, когда прогноз не со
впал с прямым SNP тестированием, проводится
тестирование всего ряда SNP маркеров.
ПРИНЦИП РАБОТЫ
Y-Predictor определяет Y-гаплогруппы для STR
гаплотипов (значений STR маркеров для тестиру
емого образца) с использованием филогенетичес
ких деревьев каждой отдельной ветви (гаплогруп
пы) и радиуса потомков основных узлов дерева.
Филогенетические деревья, представляющие собой
иерархическое древо эволюции STR маркеров, по
строены для каждой гаплогруппы в отдельности и
получены перечни гаплотипов узлов дерева сра
диусом потомков узла. Для минимизации расчетов
используется только группа самых близких к кор
ню дерева узлов (основных узлов), наиболее пол
но характеризующих разнообразие гаплотипов.
С этим набором заранее созданных деревьев
сопоставляется тестируемый STR-гаплотип домо
мента обнаружения на одной из частей деревата
кого гаплотипа, который наиболее сходен стести
руемым, но для которого уже точно известна при
надлежность к конкретной гаплогруппе, благода
ря параллельному анализу по SNP маркерам. В
главном модуле программы Y-Predictor для тести
2()
Глава 1. Создание баз данных о генофондах мира
руемого гаплотипа вычисляется вероятность про
исхождения от каждого основного узла дерева и
выдвигается предположение о принадлежности к
гаплогруппе.
Для обучения программы Y-Predictor исполь
зовались пятьдесят тысяч Y-STR гаплотипов из
различных открытых источников и опубликован
ных научных статей по популяциям регионов все
го мира, а также по большому массиву наших соб
ственных неопубликованных данных о коренном
населении Северной Евразии. Программой пред
лагается прогноз о принадлежности анализируе
мого гаплотипа к 76 основным гаплогруппам.
Перечень определяемых гаплогрупп: А-М91,А"
М91*(xР108,М32), А1-Р108, А3-М32, В-М60, В2a
М150, В2b-М112, С-М130, С2-М38, С3-М217, D
М174, Е-М40, Е1а-М33, E1b1a-М2, E1b1b1-М35,
Е2-м75, F-М89, F*-М89*(xМ201,М69,М523), С
М201, G1-М285, G2-Р287, G2*-Р287*(xР15,М377),
С2а-Р15, G2c-М377, Н-М69, I1-М253, I1d-L22, 12
М438, 12"-М438*(xР37.2,S23), I2a-Р37.2, I2b-S23,
I2b1-М223,
I2b2-S154,
J1-М267,
J1*
М267*(xМ365,L136), J1b-М365, J1c-L136, J1c2-Р56,
J1c3-Р58, J2-M172, J2а-М410, J2а"-М410°хL26),
J2a4-L26, J2b-М12, К-М9, К*-М9*(xМ11, М214,
М45, М70), L-М11, L1-М27,L2-М317,N-М231,N18
LLY22g"(xР43,Таt), N1b-Р43,N1c-Tat, О-М175, О1
мsy2.2, о2-р31, о3-м122, р-м45, р"
М45"(xМ242,М207), О-М242, О1а-МЕН2, О1b
М378, R1a*-М420*(xSRY10831.2), R1a1a-М198,
R1a1a*-М198*(xМ417) , R1a1a1*-М417(xМ458),
R1a1a1g-М458, R1b-М343, R1b1*-Р25*(xР297),
R1b1b1-М73, R1b1b2-М269, R2-М124, Т-М70, Т*
М70*(xL162,L131), Т2-L162, Т3-L131.
Для прогноза учитываются значения 76 Y-STR
маркеров СDY-а, СDY-b, DYS 19/394, DYS 385а,
DYS 385b, DYS 388, DYS 389-1, DYS 389-2, DYS
390, DYS 391, DYS 392, DYS 393, DYS 395S1а,
DYS 395S1b, DYS 406S1, DYS 413a, DYS 413b,
DYS 425, DYS 426, DYS 436, DYS 437. DYS 438,
DYS 439, DYS 441, DYS 442, DYS 444, DYS 445,
DYS 446, DYS 447. DYS 448. DYS 449. DYS 450,
DYS 452, DYS 454, DYS 455, DYS 456, DYS 458.
DYS 459a, DYS 459b, DYS 460, DYS 461, DYS 462,
DYS 463, DYS 464a, DYS 464b, DYS 464с. DYS
464d, DYS 472, DYS 481, DYS487. DYS 490, DYS
492, DYS 511, DYS 520, DYS 531, DYS 534 DYS
537, DYS 557. DYS 565, DYS 568. DYS 570, DYS
572, DYS 576, DYS 578. DYS 590, DYS 594, DYS
607, DYS 617, DYS 635, DYS 640, DYS 641,
YPredictor
File
Actions
Source
-ая
нер
|при | Eпоis | Result|
Сuпent order of markets;
—Source
DYS 389-1
(* Раstein editor
г File
—
383-2
390
456
19/394
385а
385b
458
437
| }
пDivision
у Tab
DY'5
DY8
DY5
DYS
DYS
DYS
DY8
DY9
;
у
г .
САТА Н4
DYS
DYS
DYS
DY8
DYS
у ове Г
-
Техt-
|
П
|
Identificato
вht|cator columns:
colUПlf]S 3
Title rows:
Отder of markers:
|
-)
391
392
393
439
635
DY5
DYS 388
426
"
-
From D''5 383|у|subtract D''5 389|
GАТА Н4 will decrease by 1
|
IV Use test haplogroups
н
Рис. 1.5. Интерфейс оффлайновой версии программы предиктора.
-
1.2. Базы данных по мтДНК и аутосомным маркерам
GAAT1B07, GATA A10, GATA H4, YCA IIa, YCA
IIb. В практике популяционных исследований, ко
нечно, набор STR маркеров, типированных для
образца, намного меньше (обычно от 7 до 17).
Основу предиктора составляют филогенетичес
кие деревья перечисленных гаплогрупп. При по
строении деревьев использовались четыре тысячи
образцов, тестированных по SNP и широкой пане
ли STR маркеров, максимально отражающие раз
нообразие гаплотипов внутри гаплогрупп и разли
чия между гаплогруппами.
Для каждого узла деревьев произведена оцен
ка возраста, что с учетом различий и совпадений в
значениях маркеров позволяет вычислить вероят
ность того, что узел является предковым для ана
лизируемого гаплотипа. Это вычисление произво
дится для всех филогенетических деревьев, ита
ким образом для всех гаплогрупп вычисляется ве
роятность отнесения к ним гаплотипа.
21
ИНТЕРФЕЙС
Предиктор реализован как в виде отдельной за
пускаемой программы (рис. 1.5), так и в онлайн ре
жиме (predictor.ydna.ru). Ввод данных осуществля
ется либо заданием STR гаплотипа в окне програм
мы, либо указанием внешнего файла (таблица Excel)
с выборкой, что удобно для обработки многих об
разцов. При анализе конкретного гаплотипа может
быть выбрано число и порядокмаркеров (например,
нарисунке выбрано 17 маркеров, входящих в набор
Y-filer). Вывод результата осуществляется как в окне
программы, так и в файле.
Интерфейс для работы с программой позволя
ет обрабатывать не единичные гаплотипы, а до 200
гаплотипов одновременно, что является важным
преимуществом данного предиктора перед зару
бежными аналогами. По каждому гаплотипу вы
дается наиболее вероятная гаплогруппа и вероят
ность принадлежности к ней (от 50% до 100%).
1.2. БАЗЫ ДАННЫХ ПО мтДНК И АУТОСОМНЫМ МАРКЕРАМ
КРАТКАЯ ХАРАКТЕРИСТИКА БД MURKA
НЕОБХОДИМОСТЬ БАЗЫ
Митохондриальная ДНК (мтДНК) также яв
ляется одной из наиболее изучаемых генетичес
ких систем. Хотя мтДНК быстро уступила паль
му первенства более информативной Y-хромосо
ме, однако и сейчас ежегодно в мире публикуют
ся десятки популяционно-генетических работ, по
священных анализу мтДНК в тех или иных попу
ляциях. Данные по мтДНК содержатся также в
статьях криминалистов, использующих мтДНК
для целей идентификации личности. Чтобы весь
этот огромный массив опубликованной информа
ции приносил реальную пользу, исследователю
необходимо иметь его под рукой в виде единой
базы данных. Ведь в течение последних 25 лет в
мировой науке сошла целая лавина статей, несу
щих сведения по огромному числу образцов
мтДНК. Наша база данных «MURKA: база дан
ных по митохондриальной ДНК и интегрирован
ное программное обеспечение», создаваемая под
руководством и при самом активном участии ав
тора, росла также лавинообразно: в 2004 году в
базе имелась информация о 33 000 образцах
мтДНК; в 2007 году – о 62 000 образцах; в 2008
году – о 95 000 образцах; в 2010 году – о 135 000
образцах, в 2011 году – о 168 000 образцах, на
текущий момент – о 206 000 образцах (табл. 1.3).
СОДЕРЖАНИЕ БАЗЫ
Важной чертой базы данных MURKA является
тщательная и подробная фиксация характеристик
изученных популяций: не только их название и
объем выборки, но и административная принадлеж
ность (страна, провинция), этническая и лингвис
тическая принадлежность, географические коорди
наты, ссылки на источник данных ит.д. База содер
жит как частоты гаплогрупп, таки сиквенсы (ГВС1,
а если имеются данные, то и ГВС2 или полный сик
венсмтДНК) с указанием начальной иконечной по
зиции секвенирования (например: 16024; 16400). Ряд
характеристик БД приведен в табл. 6. По представ
ленным в таблице данным можно сделать вывод о
превосходстве разработанной базы данных MURKA
перед двумя наиболее полными зарубежными ана
Таблица 1.3. Характеристика созданной базы данных по мтДНК
Параметр
Объем (число образцов)
Число популяций
Число источников
Размещение
БДMURKA
EMPOP (зарубежный аналог)
132 600
34 617
2 101
497
260
Нет данных
Локальная сеть
www.empop.org
Глава 1. Создание баз данных о генофондах мира
22
логами. Так, общее число образцов составляет в БД
MURKA 206 000. Из них 8 870 – полные мтДНК
геномы, 15 000 – данные по отдельным гаплогруп
пам, 50 000 – данные общественных участников
проекта «Генографик» (нет привязки к конкретным
популяциям) и 132 600 образцов – обычные попу
ляционные данные о коренном населении, которые
и использовались в исследованиях, приведенных в
последующих главах.
ИСТОРИЯ СОЗДАНИЯ
База данных создавалась при частичной под
держке ряда грантов РФФИ и РГНФ, а в 2009-2012
годах создание этой базы данных являлось одним
из важных направлений темы НИР «Анализ рас
пространения гаплотипов митохондриальной ДНК
и Y-хромосомы у народов мира на основе созда
ния геоинфосистем», выполнявшейся в Медико
генетическом научном центре РАМН под руковод
ством автора. Хотя и эта многолетняя работа по
созданию базы велась главным образом на чистом
энтузиазме ее разработчиков, однако важна была
также финансовая поддержка международного
проекта «Genographic», и сейчас работа интенсив
но продолжается все также под руководством ав
тора в Институте общей генетики РАН.
Работа по сведению воедино всех опубликован
ных данных об изменчивости митохондриальной
ДНК потребовала не одного года и продолжается
по сей день. Первые варианты базы данных состав
лялись автором и затем под его руководством А.С.
Пшеничновым в 2003–2005 годах. Программную
реализацию основных функций в то время осуще
ствил Ю.В. Пустовой. Современный вариант базы
появился благодаря усилиям В.В. Запорожченко,
взявшего на себя труд не только собрать практи
чески все опубликованные данные, но и провести
определение гаплогрупп для каждого образца с
помощью разработанного им оригинального про
граммного обеспечения. Эта задача унификации
данных разных авторов и определения гаплогрупп
– едва ли не самая трудная при создании базы дан
ных, поскольку для большинства опубликованных
данных имеется информация только о некодирую
щей части мтДНК (ГВС1), тогда как надежное оп
ределение гаплогрупп возможно лишь при нали
чии достаточного набора данных по ПДРФ сайтам
(SNP маркерам) кодирующей части мтДНК.
При создании текущей версии базы данных
была проведена большая работа по подробной и
стандартизованной характеристике охваченных
популяций, включая обоснованное присвоение им
определенных географических координат, для
чего потребовалось обращение к статьям-перво
источникам и их внимательный разбор. В выпол
нении этой работы для двух тысяч популяций
большую помощь оказали Антонина Кузнецова,
Анастасия Агджоян, Алексей Балаганский, Анд
рей Шанько и Елена Баранова, каждый из кото
рых описал более сотни популяций под руковод
ством автора, которым также проведено исклю
чение или объединение многих популяционных
выборок для целей картографирования.
ПРОГРАММИРОВАНИЕ И ИНТЕРФЕЙС
ПРОГРАММНАЯ СРЕДА
База данных по мтДНК долгое время существо
вала лишь в виде системы таблиц MS Excel, затем
была переведена в формат MS Access, средствами
которого был реализован ряд функций поиска, вво
да и выгрузки данных. Однако большой объем БД
и сложность процедур обработки потребовали пе
ревода базы в более мощную программную среду.
Поэтому в 2010 году был осуществлен перевод
базы данных в среду MS SQL Server, что позволя
ет обеспечивать целостность данных, надежность
их хранения и ограничений доступа, а также со
вместимость с целым рядом уже написанных
Windows приложений. Последний фактор оказал
ся решающим в выборе именно данной СУБД, а
не многочисленных СУБД, функционирующих в
ОС Linux. Также существенна возможность ис
пользования MS Access в качестве клиента, и по
этому пользовательский интерфейс реализован в
среде MS Access, интуитивно понятной большин
ству пользователей по опыту работу в родствен
ных программах MS Excel и MS Word, но хране
ние данных и протоколы их обработки реализова
ны в мощной среде MS SQL Server.
СТРУКТУРА ТАБЛИЦ
Реализована система из более чем 20 взаимо
связанных таблиц: генотипы, образцы, популяции,
источники данных, народы, страны, провинции,
стратегии формирования выборок, регионы
мтДНК, пользователи, гаплогруппы и т.д.. Первые
четыре таблицы являются центральными, соеди
ненными по цепочке связью «один ко многим».
В таблице «генотипы» (Sequences) содержится
нуклеотидная последовательность фрагментов
мтДНК в сравнении с Кембриджской референсной
последовательностью, приведен интервал секвени
рования, указан номер доступа к этой последова
тельности в базе данных ncbi (если имеется). Если
один и тот же образец был изучен по разным фраг
ментам мтДНК (например по ГВС1 и ГВС2), эта
информация приводится в разных записях табли
цы сиквенсов.
23
1.2. Базы данных по мтДНК и аутосомным маркерам
Для объединения этих данных предусмотрена
таблица образцов (Samples), в которой приводится
идентификатор образца (ID) и указание на попу
результатов) представлена на рис. 1.6. В верхней
части формы пользователь может задавать нужные
параметры фильтра. Можно видеть (рис. 1.6), что
ляцию.
предусмотрен поиск практически по всем полям
В таблице Рорulations приводится ссылка наис
точник данных и подробная характеристика попу
ляции (регион мира, страна, народ, географические
координаты, стратегия формирования выборок).
Многие вспомогательные таблицы (например,
таблица стран) связаны с таблицей популяций и
служат для ее формализованного заполнения и об
базы. В приведенном примере задан поиск конк
ретного гаплотипа (отличия от Кембриджской пос
ледовательности в позициях 16224, 16304, 16311
молекулы мтДНК). Флажок «exact» не активиро
ван, поэтому будет осуществляться поиск не толь
коточных совпадений, но и всех гаплотипов, со
держащих данные замены (разрешается наличие
дополнительных мутаций).
легчения поиска по базе.
В последней из основных таблиц (References)
В нижней части формы отображается информа
указываются библиографические и иные сведения
ция, найденная в результате запроса. Пользователь
об оригинальных публикациях и неопубликован
может перемещаться между вкладками, просматри
ных данных нашего коллектива, послуживших ис
вая, соответственно, информацию о найденных сик
венсах (вкладка Sequences), секвенированных образ
цах (вкладка Samples), о популяциях, из которых про
исходят эти образцы (вкладка Рорulations), и обис
точниках, в которых была опубликована информация
точниками данных при наполнении БД.
Остальные таблицы содержат дерево гаплог
рупп и различную вспомогательную информацию
(например, тип популяционных данных современ
ные популяции, древняя ДНК, популяции, изучен
ные только по одной гаплогруппе и т.д.).
о популяциях (вкладка References). На рис. 1.6 при
веден пример с просмотром популяций, а на рис. 1.7
— с просмотром сиквенсов для того же запроса.
ИНТЕРФЕЙС
Также реализована возможность просмотра и
копирования таблицисточников, популяций, образ
Реализован пользовательский интерфейс, глав
ная часть которого (форма поиска и отображения
цов, сиквенсов и гаплогрупп.
1) Задается
интересующий
7 моккАрааваке-нnasamplesandseauences
з)
2) МURКА обнаружила в
мире
еще 45 таких сиквенсов:
гаплотип
45 образцов в 23 популяциях,
File
Databage
Find
Tool.
Window
изученных в 17 статьях
F x 2} } * Кёрст. д ы |
Ref.Туре
|+
Рор Туре
Ref.Name
-
вернате
Рцы.
|-
world Reo
Ашthors
Сошntly
Tille
Jошпа!
Ethnos
теат
Strategy
|
|
Гвенеепсе
.
вазе
б. гкло|
Гл
Г-1
Г-I
|-
В
11=
АссNuп
-
Seq ID
г
б" ими
го
|
онг
|
Status
Сlear
Г Еxact
—
Fпd
}
Слпсе Пшну
|
-
(:
«ПОПУЛЯЦИИ»
:Relefence: 17 Рopulation: 23. Sample:
: 45.
4". Sequence:
ence: 4
45
-
|
Saпples | Sequences
Population Name
Рог -
г-1
Г-I
Loпп.
но
Sample ID не п.
3) Д
на ВКладка
Г-1
|
|
|
|
|
Lat.
Sample ID
|
- Рорлатоптуре
Satus
ReferenceT Wота Бедо
Egypt ofFВПLaboratory
PortugalNothem of Gonzalez
pop
pop
Vald FBILaboratory
Сургus ofIrwin
рор
Vald
Se*********
глn 2007а
N EAST
соту
Egyptians попhепа b
.
- Т
Greeks
Slovaks
Egyptians
*
популяции: название, регион,
стра на, на род ссылка на источник
|
Ethnos
Portuguese
Сургus
4) МURКА вывела характеристику
Iranians (southwest, Iran) of Metspalш
Portugal Септа|ofРегета
Agenans of Plaza
Vald conzalez 2003
NдгRicд
W EUROPE
Iranians S
Portugal
п
Сatalans of Plaza
Кшгds of Richards
pop
pop
Vald
Plaza 2003
Vald Richards 2000
Сroatian Islanders. Нwar
pop
Valid
Тоlk 2001
W EURopЕ
1. Едет
вдLСдNS
Рис. 1.6. Поисковая форма базы данных МURКА. Активна вкладка «Популяции».
Portuguese
Algerians
Spain
Кuгds
Сroat
24
Глава 1. Создание баз данных о генофондах мира
в) нle patabase Fina тook window
if x 4} }
& ppon
Ref.Туре
"|
Ref. Name
|
Publ.
i* -
Рор.Name
Г-
world Reg
|
|
Title
Еthпо:
Jошпа!
Strategy
|
1622418304163и
Г Екact
Вase
0,
Seq ID
бт ни
г ог
г
кnal
11.
|
— АссNum
+
|
Lat
Saпple ID
F conto
Г.
Г-
Сошпlгу
Authors
Year
|-
Рор.Туре
им
-
|
г
омра
Long |
Но
Сlear
Паппе Пину
Find
|
"---"- " "- г
Сompleted Reference: 17. Population: 23. Sample: 45. Sequence: 45
References Populations
sample:
Samp Population Name
. - Мен - Асс-Нар o croatians zvogosce отварапгт нуs1
тк
65534
|talians Lazloi нуS1
U8к
- - Stating БР - Ending БР 15024,
тот
129.189.224-304-311
16024,
16400
Sequence
6024,
92605
Romanians Hom constanta и н
92654
Romanianstom constania: н
98468
111301
111584
Сургus oflмni н
гаплотипов (сиквенсов): тип
6024
6024
сррра н
фрагмента мтДНК, гаплогруппа,
8024
6024
16569
16569
16569
111744
GРpр н н
отличия от СRS, интервал
5024
16569
} в секвенирования (начало и конец)" }
срpр н н
8024
16569
|| 111761
111802
срpр н
Base
- -
224-30 311
МURКА вывела характеристику
н
16383
16383
}
Рис. 1.7. Поисковая форма базы данных МURКА. Активна вкладка «Сиквенсы».
БАЗЫ ДАННЫХ ПО АУТОСОМНЫМ МАРКЕРАМ
Аутосомные маркеры традиционно являлись
мыми в популяционной генетике. Сначала они были
тыми системами фильтрации, ввода и экспорта
данных, процедурами верификации данных и т.д.
Схема данных представляет собой центральную
основными генетическими системами, используе
представлены так называемыми классическими мар
таблицу частот, связанную с крупными таблицами
керами (иммунологическими, физиологическими и
популяций и библиографических источников и
биохимическими). Затем большинство исследова
телей сосредоточились на использовании отдельных
большим числом вспомогательных таблиц. Во вре
мя создания банка (90е годы XX века) системы
создания баз данных были далеко не так разрабо
таны, как сейчас, поэтому практически все проце
дуры разработчикам приходилось проектировать
аутосомных SNР и STR маркеров, причем среди
последних особое место занимают маркеры, широ
ко используемые при ДНК-идентификации в кри
миналистической практике. На современном этапе,
хотя продолжается использование и всех перечис
ленных типов маркеров, акцент сместился на ши
рокогеномные маркеры. И поскольку наш коллек
тив — российская школа геногеографии — с восьми
десятых годов прошлого века ведет исследования
закономерностей в структуре генофондов, его все
эти годы отличала традиция сбора больших масси
вов данных и их формализация в банках данных.
и программировать самостоятельно, и создание
столь полного, продуманного и эффективно орга
низованного банка было огромным научным дос
тижением. Именно на использовании этого банка
были основаны серии основополагающих работ по
исследованию структуры генофонда народонасе
ления СССР в целом, генофондов отдельных на
родов и географических регионов, выявлению се
лективной структуры генофонда мира итд. В час
тности, на информации этого банка данных осно
БАНК ПО КЛАССИЧЕСКИМ МАРКЕРАМ
вана генетическая часть нашего исследования рус
ского генофонда, и поэтому в книге (Балановская,
Первым стал банк данных GENE РООL, раз
работанный под руководством Е.В. Балановской и
Балановский, 2007) также уделено внимание харак
теристике банка данных GENE РООL и опублико
включающий данные по частотам нескольких де
вана в виде таблицта его часть, которая относится
сятков классических маркеров в нескольких тыся
к русским популяциям.
чах популяций СССР и, в меньшей степени, мира.
Банк реализован в СУБД FoxPro и обладает разви
Когда в обиход популяционной генетики стали
массово входить отдельные диаллельные и муль
25
1.2. Базы данных по мтДНК и аутосомным маркерам
тиаллельные ДНК-маркеры, автором данной кни
ги было проведено наполнение банка данных
— источник данных (ссылка на публикацию);
В базе заполняются следующие поля:
GENЕРООL информацией о полиморфизме этих
— страна обследования;
аутосомных ДНК-маркеров в популяциях Восточ
— провинция (в пределах страны);
ной Европы и некоторых других регионов Север
ной Евразии. Информация, извлеченная из этого
— народ:
— название популяции;
банка и проанализированная автором методами
— географические координаты (широта, долго
геногеографии, легла в основу, например, моногра
фии (Лимборская и др., 2002) и ряда других работ
та и какая именно точка бралась за ориентир при
Таким образом, с точки зрения содержания был
создан, пополнялся и поддерживался банк данных
определении координат);
— объем выборки,
— обозначения локусов и аллелей.
о полиморфизме ДНК-маркеров, но с точки зре
Основное содержание базы данных - частоты
ния программной оболочки и возможностей это
каждого аллеля для каждой популяции, в которой
данный локус был изучен. Для каждого локуса в
каждой популяции рассчитаны также и внесены в
БД значения его гетерозиготности.
была база данных GENЕ РООL, расширенная за
счет новых ДНК маркеров.
БАЗА ДАННЫХ ПО МАРКЕРАМ ДНК
ИДЕНТИФИКАЦИИ
В настоящее время из панелей аутосомных
ДНК маркеров наиболее массовые исследования
проводятся по STR-маркерам, входящим в попу
лярные панели маркеров ДНК-идентификации, ко
МАССИВЫ ШИРОКОГЕНОМНЫХ ДАННЫХ
Особенностью широкогеномных массивов дан
ных является очень большое число изученных мар
торые чрезвычайно широко используются в кри
керов (сотни тысяч) при очень небольшом числе
изученных популяций (как правило, единицы, в
редких случаях — один-два десятка). А поскольку
миналистике. А поскольку для определения точ
ности ДНК-идентификации надо знать частоты ал
и число популяционно-генетических работ, в ко
торых публикуются широкогеномные данные, пока
лелей этих маркеров в популяции, откуда проис
ходит анализируемый образец, в результате уси
лий многих лабораторий эти частоты были опре
делены для множества популяций по всему миру.
не так велико, то даже суммарное число популя
Пожалуй, маркеры ДНК-идентификации являют
ся одной из наиболее подробно изученных генети
Другой особенностью широкогеномных дан
ных является то, что единицей анализа выступает
ческих систем, хотя и уступающих по числу охва
не популяция, а индивид, при этом число изучен
ченных популяций группам крови АВ0 (безуслов
ному лидеру), а также мтДНК и Y-хромосоме. Под
ных индивидов суммарно по всем статьям состав
ций мира, в которых они изучены, исчисляется пока
не тысячами, как для мтДНК и Y-хромосомы, а
ВСeГО лишь десятками.
ляет уже несколько тысяч. Поэтому ранее разра
руководством автора была составлена база данных
ботанные инфосистемы для широкогеномных мар
частот маркеров ДНК-идентификации в популяци
керов не подходят ни по техническим параметрам,
ях Евразии.
Проведенная работа по разработке этой базы
НИ ПО ИдеОЛОГИИ.
данных основывалась на сборе и унификации ли
система, объединяющая широкогеномные данные.
тературных данных. Первая сводка данных была
составлена в ходе подготовки статьи (Степанов и
др., 2011) — она включала и обширную экспери
Но биоинформатики, анализирующие их, обычно
ментальную информацию, полученную в этом ис
В настоящее время отсутствует единая инфо
не встречают технических затруднений в стыков
ке массивов данных из разных опубликованных
работ. По мере накопления данных будет востре
следовании коллективом, и литературные данные
бована инфосистема, содержащая сведения не
по популяциям России и некоторых стран Евро
столько о самих генотипах, сколько об изученных
популяциях и индивидах. Ведь, имея их исчерпы
пы. Объем этой базы составлял 8600 образцов. За
тем база данных была значительно увеличена и
унифицирована нами в ходе выполнения проектов
РФФИ 11-04-01867а и 12-06-12002-офи м. Общий
вающий список и удобную систему фильтрации
популяций и индивидов, можно будет быстро сфор
мировать список интересующих индивидуальных
объем накопленных в базе данных составляет на
образцов, а затем уже получать данные по их гено
данный момент 18 528 образцов из 84 популяций.
типам из оригинальных публикаций. Создание та
кой инфосистемы коллективом под руководством
Общее число обнаруженных аллелей достигает
почти шести сотен (593 аллеля). Общее число ло
автора пока только начато, поэтому широкогеном
кусов (изученных хотя бы в одной статье-источни
ке) составило 33 STR маркера. Географическое
ные данные, использованные в этой работе, пред
ставляют собой отдельные массивы данных, опи
положение популяционных выборок, включенных
в базу, показано на рис. 1.8.
ИЗЛОЖe НИЯ.
санные в соответствующих разделах по ходу их
26
Глава 1. Создание баз данных о генофондах мира
60°
90°
240"
210"
-о
Популяции, представленные в созданной базе данных
}
С
*
и
н
т
н.
30°
Рис. 1.8. Популяции в базе данных частот аутосомных STR маркеров ДНК-идентификации.
ПРИМЕНЕНИЕ СОЗДАННЫХ БАЗ ДАННЫХ
Разработанные базы данных изменчивости Y
хромосомы и митохондриальной ДНК не только
послужили одним из столпов, на которых выстро
ено исследования, приведенные в последующих
главах, но имеют и самостоятельное значение. То
же относится и к созданным картографическим ат
ласам, о которых речь пойдет дальше.
Во-первых, созданные базы данных и атласы
ИСПОЛЬЗОВАНИЕ БАЗЫ ДАННЫХ МURКА
Созданная база данных по изменчивости
мтДНК в популяциях мира МURКА широко при
менялась как автором и его коллегами, так и изве
стными зарубежными учеными, обращавшимися
к нам за данными по мтДНК. База данных исполь
зовалась как минимум в пяти международных пуб
охватывают коренное население всех континентов
ликациях, четыре из которых вышли в ведущих
мира, а данная монография сосредоточена на на
селении Европы в контексте генофонда Евразии.
Во-вторых, базы данных имеют значение не толь
ко для геногеографических исследований, но и для
журналах с наиболее высокими импакт-фактора
ми (от 9 до 13). Также она цитировалась и в много
решения ряда других научных и практических за
дач. В данном разделе на нескольких конкретных
примерах обрисовывается область применения со
зданных баз данных в научных исследованиях.
численных русскоязычных публикациях нашего
коллектива. Ниже представлен краткий обзор за
рубежных публикаций, применявших и цитировав
ших нашу базу данных (отечественные публика
ции, как менее важные для оценки признания базы
данных, здесь не рассматриваются).
27
1.2. Базы данных по мтДНК и аутосомным маркерам
БАЗА ДАННЫХ МИТОТИПОВ НЕКОРЕННОГО
НАСЕЛЕНИЯ МИРА
разцов) базы данных по некоренному населению
США, Европы и других стран, анализируются об
щие закономерности
В 2007 году в журнале PLoS Genetics опубли
кована статья (Веhar et al., 2007), в которой пред
ставлена база данных митотипов «общественных
участников» проекта «Генография» и программа
предиктор митохондриальных гаплогрупп. В этой
работе, на основе наиболее обширной (78 590 об
изменчивости и мутирова
ния мтДНК. Созданная нами база данных МURКА
(по коренному населению) использована в этом
исследовании для целей сравнения (с базой дан
ных по «общественным участникам») и для вери
фикации предложенного алгоритма автоматичес
кого определения гаплогрупп мтДНК.
типа
гкушагын
1.т"5 = 1.1"2"3"4"5"в втапсh
Lо втапсh
гов,
пил
тап
*
Кто реаги
инт
Lласик
полт-нпаднаги
"
1
|
гт
ап
|
|
г.г.
|
|-ланк
но
|
*ы
*]
Апропгапег of
Аfrican LS А ніte=
eal наглиноп от
А.
thгошчношt Africa
5 3 3 =3
5
55
= в
3 3*
Рис. 1.9. Филогенетическое древо митохондриальной гаплогруппы L — разнообразие мтДНК генофонда
коренного населения Африки (Веhar et al., 2008).
Зеленая часть графика соответствует «койсанской» макроветви древа мтДНК, а рыжая — макроветви остально
го человечества. Заливка внутренних прямоугольников: голубая маркирует гаплогруппы, распространенные у кой
санов, сиреневая — у не койсанских популяций Африки, розовая — у популяций вне Африки. Видно, что часть
гаплогрупп «койсанской» ветви встречается и у других популяций Африки. Также наглядно видно, какая неболь
шая доля существуюшего в Африке разнообразия была вынесена из нее частью человечества, заселившей все
ОСТaЛЬНЫe КОНТиНеНТЫ.
28
Глава 1. Создание баз данных о генофондах мира
АНАЛИЗ ПОЛНЫХ СИКВЕНСОВ ДРЕВНЕЙШЕЙ
ных субгаплогрупп в разных регионах планеты,
позволяя прослеживать все более поздние мигра
ГАПЛОГРУППЫ L мтДНК
ции.
В 2008 году в журнале Аmerican Journal of
Нuman Genetics были опубликованы результаты
РАСХОЖДЕНИЕ ГЕНОФОНДОВ САМОГО
анализа полных нуклеотидных последовательнос
НИЗКОРОСЛОГО И САМОГО ВЫСОКОРОСЛОГО
тей митохондриальной ДНК (Веharet al., 2008). Эта
НАСЕЛЕНИЯ ПЛАНЕТЫ — ПИГМЕЕВ И БАНТУ
трудоемкая работа была необходима для ответа на
вопрос — каковы были самые первые этапы микро
В 2008 году в известном журнале PNAS опуб
ликована статья (Оuintana-Мurciet al., 2008). В этом
исследовании митохондриальный генофонд пигме
ев экваториальной Африки изучен в сопоставле
нии с окружающими африканскими генофондами.
Эта информация по окружающим популяциям взя
та из нашей базы данных. Этот пример показыва
ет, что база данных МURКА действительно явля
ется глобальной и подробной, если даже извест
ные французские ученые, в течение многих лет
изучающие африканские генофонды, не имеют
более подробных источников о генофонде Афри
ки, чем наша база данных. И это при том, что база
эволюции Ноmo sapiens. Главным результатом этой
работы стало уточнение филогенетического древа
человечества (рис. 1.9). Укажем две важнейшие его
черты. Во-первых, разделение древа на два круп
ных ствола (койсаны — и все остальное человече
ство) произошло по данным о мтДНК более
140 000 лет назад. Вторая черта — уже известная
из более ранних работ, но от того не менее удиви
тельная. На древе человечества почти все разно
образие приходится на народы Африки. Лишь ма
лая часть ветвей общего древа (показанных наро
зовом фоне) дала побеги на всех остальных конти
нентах — Евразии, Америки, Австралии. Это древо
хорошо иллюстрирует общий принцип отслежи
вания миграций — расселяющиеся популяции, ото
рвавшиеся от исходного массива, забирают с со
бой в путь лишь малую часть ветвей, малую часть
имеющегося генетического разнообразия. Даль
нейшая микроэволюция приводит к росту вторич
| 1С
ря. :
(
"
В статье анализируется древнейшее и важное
событие в истории населения Африки и человече
}
м -"."?
"см"
-
;-
н
создавалась московскими специалистами, никог
да специально Африкой не интересовавшимися, но
зато проведшими подробный скрининг информа
ции, опубликованной по всем континентам (в том
числе и по Африке).
J
г-
90
- \\
" "
|
*\
Рис. 1.10. Распространение гаплогруппы L1c (Оuintana-Мurci et al., 2008).
29
1.2. Базы данных по мтДНК и аутосомным маркерам
ства в целом — расхождение генофондов самого
популяциях Европы, Индии, Индонезии, койсанс
низкорослого и самого высокорослого населения
кому населению Африки, бантуязычному населе
нию Африки по маркерам мтДНК и Y-хромосомы.
При этом вся генетическая информация по насе
планеты — пигмеев и бантуязычных народов. По
данным о мтДНК около 70 000 лет назад существо
вала их единая общность Оuintana-Мurci et al.,
2008). Их разделение, видимо, было связано с кли
матическими кризисами в истории нашей плане
ты. Ледниковые периоды в истории земли имели
лению этих регионов мира взята из разработанных
нами баз данных Y-base и МURКА.
Исторические сведения и последние данные по
анализу аутосомных ДНК маркеров показывают,
для Африки не менее катастрофичные послед
ствия, чем для Европы. Это было время иссуше
ния планеты — исчезали леса, их место в Африке
что южно-африканское цветное население являет
занимали саванны и пустыни, разделившие пред
ния различных народов Африки, Европы и Азии.
Однако оставались неизвестными пути формиро
ся уникальной, в высокой степени метисирован
ной популяцией, возникшей в результате смеше
ков пигмеев и банту. Только много тысяч лет спус
тя, когда обе популяции уже приобрели своеобраз
вания этой популяции. В данной работе с участи
ные антропологические и генетические черты, их
ем автора проведен детальный филогеографичес
ареалы вновь стали соприкасаться. Но, кaк пока
зано, поток генов между ними был строго одно
кий анализ митохондриальной ДНК и Y-хромосо
мы. Показано, что эта популяция образовалась пу
тем взаимодействия, по крайней мере, пяти раз
личных родительских популяций: койсанов, бан
сторонним: от пигмеев к банту (рис. 1.10). Народы
банту брали в жены маленьких женщин пигмеев,
приносивших свои гаплогруппы мтДНК. Но у пиг
меев не прослеживаются линии мтДНК бантуязыч
ных народов.
ту, Европы, Индии и Юго-Восточной Азии (рис.
1. 11). Однако они внесли различный вклад в ее об
разование. Более того, обнаружены значительные
различия между генетическими вкладами предко
НЕОЛИТИЗАЦИЯ ЕВРОПЫ
вых популяций в мужскую и в женскую части по
В 2009 году опубликована глава в зарубежной
пуляции. Общая картина гендерно-специфичной
монографии, посвященная рассмотрению основ
ных итогов изучения генофонда Европы (Ваla
novsky, 2009). Она включает как обзор основных
метисации показывает, что данная популяция воз
исследований за последние 20 лет, так и результа
ций скоренными койсанскими женщинами.
никла в основном в результате смешения мужчин
из европейских, африканских и азиатских популя
ты собственных исследований с использованием
АНАЛИЗ ДРЕВНЕЙ ДНК
баз данных по Y-хромосоме и мтДНК. Основной
акцент в работе сделан на возможности примене
В 2010 году в одном из наиболее престижных
ния генетических данных для изучения вопросов
научных журналов РLОS Вiology опубликована
неолитизации Европы и на сравнении полученных
статья (Нааk et al., 2010). Эта статья является од
ним из итогов многолетней совместной работы
нами результатов с археологическими и лингвис
тическими данными по этой крупной научной про
автора с Австралийским центром древней ДНК.
блеме.
Полученные этим центром данные о митохондри
альном генофонде одной из первых неолитичес
АНАЛИЗ МЕТИСИРОВАННЫХ ПОПУЛЯЦИЙ
В 2010 году в ведущем генетическом журнале
ких культур Европы были сопоставлены с нашей
обширной базой данных о мтДНК современных
Аmerican Journal of Human Genetics вышла статья
популяций Евразии. Оказалось, что генофонд нео
международного авторского коллектива (Оuintana
Мurci et al., 2010). В этом исследовании проведен
генетический анализ маркеров мтДНК и Y-хромо
литической популяции Европы, несмотря на свое
выраженное своеобразие, кластеризуется с попу
ляциями Ближнего Востока, а не с популяциями
сомы в популяции цветного населения Южной Аф
рики — крайне гетерогенной популяции, сформи
теорию между двумя конкурирующими гипотеза
ровавшейся в результате смешения пришлых ев
ропейских и индийских колонистов с аборигенным
ческих земледельцев и гипотезой чисто «культур
банту- и койсаноязычным населением Африки.
Благодаря изучению маркеров, наследующихся по
материнской и отцовской линиям, удалось рекон
струировать ход сложения этой популяции и выя
вить асимметричные генные потоки со стороны
мужчин и женщин четырех популяций — источни
ков миграций.
Весь статистический анализ в этом исследова
нии выполнен благодаря привлечению данных о
Европы. Это позволило выдвинуть компромиссную
ми — гипотезой «демической» диффузии неолити
ной» диффузии навыков земледелия (без замены
генофонда). Полемика между этими гипотезами
является, пожалуй, наиболее широко обсуждаемой
проблемой в популяционной генетике человека на
протяжении последних двадцати лет. Предложен
ный компромисс заключается в том, что, хотя (как
показывают наши данные) миграция земледельцев
с Ближнего Востока имела место (постулат гипо
тезы «демической» диффузии), но смена генофон
Глава 1. Создание баз данных о генофондах мира
3()
а
дlineation = .001
Stress = .002
1.0 -
дь
Кhoisan
SАС
0.5 -
Вantu
*
г
т
т
т
-2.0
-1.5
-1.0
-0.5
Southeast Asians
Indians
*
типы
о|0
т
т
п
0.5
1.0
1.5
-0.5 -
Europeans
-1.0 -
в
Aliпеatioп = .001
Stress = .0006
1.от
е
uropeans
1.
0.5 -
Кhoisan
Indians
г
п
-
-1.5
-1.0
-0.5
0-0
oloФ
п
т
1
0.5
1.0
1.5
SДС
-0.5 -
Вantu
Southeast Asians
-1.0 -
Рис. 1.11. Графики многомерного шкалирования: родство между южно-африканским цветным населе
нием и предполагаемыми родительскими популяциями (Оuintana-Мurci et al., 2010).
(А) график, основанный на частотах гаплогрупп мтДНК, (В) график, основанный на частотах гаплогрупп Y
хромосомы.
да Европы не произошла, и далее земледелие рас
пространялось путем культурных заимствований
(постулат гипотезы «культурной» диффузии), по
скольку эта мигрировавшая из Передней Азии
группа была немногочисленной и растворилась в
генофонде Европы, передав им навыки земледе
лия. Важно отметить, что весь статистический ана
лиз в этом крупном исследовании основывался на
информации из нашей базы данных. Подробнее эти
результаты рассматриваются в главе 8.
АССОЦИАЦИЯ СЕРДЕЧНО-СОСУДИСТОй
ПАТОЛОГИИ С ГАПЛОГРУППАМИ мтДНК
В 2011 году в журнале Annals ofНuman Genetic
опубликована статья с нашим участием (Наher et
al, 2011). Она служит примером использования
разработанных баз данных в медико-генетичес
ких исследованиях, поскольку в ней демонстри
руется ассоциация сердечно-сосудистой патоло
гии с гаплогруппами А и W мтДНК в ливанской
популяции. В литературе имелись предположения
о возможном механизме такой ассоциации. Од
нако для повышения статистической достоверно
сти ассоциаций, а также для выявления геогра
фического распространения линий мтДНК, де
монстрирующих такую ассоциацию, было необ
ходимо привлечь данные не только по Ливану, но
и по всем окружающим регионам. Использование
базы данных МURКА позволило изучить поло
жение этих линий мтДНК в общем контексте из
менчивости соответствующих гаплогрупп и оп
ределить связь линий, обнаруживающих ассоци
ацию, с историческими миграционными потока
ми в Ливан.
1.3. СОБСТВЕННЫЕ ДАННЫЕ
В соответствии с основной задачеймонографии
— охарактеризовать генофонд народонаселения Ев
ным материалом послужили созданные под руко
фондами на текущем срезе наших знаний — исход
ропы и его взаимодействие с окружающими гено
водством автора базы данных, объединившие соб
1.3. Собственные данные
31
ственные данные с опубликованнымиданными дру
гих исследователей. В то же время собственные дан
ные в ряде случаев составляли основную часть все
го анализируемого массива или даже, чтобы обес
печить методологическое единообразие массива
анализируемых популяций, анализировались от
дельно. Поэтому собственные данные–точнее, дан
ные, полученные нашим коллективом на протяже
нии последних 15 лет–требуется охарактеризовать
в сколько-нибудь подробном и систематическом
виде. Эта характеристика и представлена в данном
разделе. В нем сначала рассматривается стратегия
формирования выборок, используемая нашим кол
лективом во всех экспедициях, затем перечисляют
ся все охваченные к настоящему времени популя
ции, в том числе рассматриваются активно вовле
ченные в данное исследование популяции Европы,
Кавказа и Азии, и в конце дается характеристика
процедур генотипирования мтДНК и Y-хромосомы,
включая ее полное секвенирование.
СТРАТЕГИЯ СБОРА ВЫБОРОК
Биологический материал собран в ходе много
летних экспедиций (1998–2014 гг.), проведенных
под руководством проф. Е.В. Балановской и авто
ра данной работы. Экспедиции проводились кол
лективами лаборатории популяционной генетики
человека МГНЦ РАМН и лаборатории геномной
географии ИОГен РАН как самостоятельно, так и
в сотрудничестве с Адыгейским, Белгородским, Ке
меровским, Харьковским государственными уни
верситетами, научными учреждениями Армении,
Белоруссии, Казахстана, Киргизии, Монголии и
Таджикистана в рамках грантов РФФИ, РГНФ и
международного проекта «Genographic». Автор
лично участвовал в проведении экспедиций по об
следованию шапсугов (1998 г.), русских Архангель
ской области (1999 г., 2001 г.), Костромской обл.
(2001 г.), Смоленской обл. (2002 г.), Тверской обл.
(2003 г.), Псковской обл. (2004 г.), народов Дагес
тана (2005 г.), Осетии (2006 г.), Таджикистана (2006
г.), Афганистана (2006 г.), Татарстана (2006 г.), Кал
мыкии (2007 г.), донских казаков (2008 г.), Казах
стана (2009 г.). В проведении всех остальных экс
педиций автор участвовал на этапах их планиро
вания и организации (собирались образцы веноз
ной крови, изредка – слюна).
ПРАВИЛА СБОРА ОБРАЗЦОВ
Во всех экспедициях при обследовании гено
фондов коренного населения использовалась еди
ная стратегия формирования выборок, заключав
шаяся в строгом следовании следующим общим
правилам.
Правило 1: «Три поколения» (генетически
эффективные миграции). Анализировались толь
ко индивиды (старше 18 лет), у которых родители
и все бабушки и дедушки (т.е. на протяжении трех
поколений) родились в данной популяции и отно
сили себя к данной этнической группе. Если более
далекие предки индивида пришли в данный реги
он из других областей, но оставили в этой популя
ции потомство на протяжении более трех поколе
ний, то такая миграция считалась генетически эф
фективной и такие индивиды включались в обсле
дование.
Правило 2: «Неродственники» (нескоррели
рованность генотипов). Родственники (до третьей
степени родства) из выборки тщательно исключа
лись, поскольку наличие родственных индивидов
не только уменьшает эффективный размер выбор
ки, но и смещает частоты, создавая иллюзию миг
рации, если в выборку попала группа родственни
ков – потомков единичного мигранта. Для отсева
родственников, во-первых, использовались инфор
маторы (люди, хорошо знающие родословные сво
их односельчан). Во-вторых, обследуемому предъ
являлся список всех, уже прошедших обследова
ние, и предлагалось найти в списке своих родствен
ников. Если родственники находились, и степень
родства была ближе третьей, то новый претендент
не обследовался. В-третьих, для каждого обследу
емого создавалась родословная, также помогающая
выявлять родственные связи.
Правило 3: «Информированное согласие».
Все обследованные давали письменное информи
рованное согласие на предоставление образца кро
видля популяционно-генетического анализа. Тек
сты информированного согласия одобрены Этичес
кой комиссией МГНЦ РАМН, под контролем кото
рой проводились все экспедиционные обследова
ния. Большинство обследованных являются людь
ми среднего или старшего возраста. Если в поряд
ке исключения (обычно по настоятельной просьбе
родителей) брались образцы у детей, то в этом слу
чае требовалось письменное согласие одного из
родителей.
Правило 4: «Только мужчины» (максимум
генетической информации). В большинстве вы
борок мужчины составляют более 95%, что обес
печивает возможность анализа и Y-хромосомы, и
мтДНК, и аутосомных маркеров. Также такие вы
борки облегчают анализ Х-хромосомы, которая у
мужчин находится в гемизиготном состоянии, сни
мая этим проблему выявления гаплотипов, остро
стоящую при анализе гомологичных хромосом.
Правило 5: «Образцы крови» (максимум
генетической информации). Для обеспечения
большого количества ДНК и, следовательно, мак
симума генетической информации о каждом обсле
Глава 1. Создание баз данных о генофондах мира
32
дуемом, в качестве биологического образца прак
тически всегда брались образцы венозной крови
(от 5 мл до 12 мл с помощью системы вакуумных
пробирокVacuette). Только в редких случаях соби
рались образцы слюны, и в редчайших – образцы
буккального эпителия (например, было принято
решение не забирать венозную кровь при форми
ровании выборки в Афганистане).
Правило 6: «Субпопуляции» (охват генети
ческой структуры популяции). Большинство
популяций исследовалось не в одной, а в несколь
ких географических локальностях, охватывающих
максимальное разнообразие популяции или этно
са. Например, изучались два района в пределах
одной области для русских популяций, или два-три
горных ущелья для кавказских. В этом случае со
бранные выборки более полно характеризуютдан
ную популяцию в целом, а не ее часть, генофонд
которой может оказаться своеобразным в резуль
тате дрейфа генов или миграций.
БАНК ОБРАЗЦОВ «КОРЕННОЕ НАСЕЛЕНИЕ СЕВЕРНОЙ ЕВРАЗИИ»
В результате интенсивных экспедиций, начатых
в 1998 году и продолжающихся – по нескольку экс
педиций в год – вплоть до настоящего времени, на
шим коллективом созданнаиболее обширный и наи
более качественно сформированный биобанк образ
цов откоренного населения Северной Евразии. Био
банк находится в собственности проф. Е.В. Бала
новской и автора данной работы, определенные пра
ва на образцы имеют также международный про
ект «The Genographic project» и руководители тех
экспедиций, которые проводились хотя и по нашей
инициативе, нашей методологической программе и
зачастую при нашем финансировании, но силами
региональных российских и международных кол
лективов, с которыми ведется сотрудничество. Био
банк широко используется в научных исследовани
ях в России и хорошо известен российским и зару
бежным специалистам как “Elena Balanovska’s and
Oleg Balanovsky’s samples from North Eurasian
indigenous populations”. Объем биобанка краткомож
но охарактеризовать четырьмя параметрами: образ
цы от 24 тысяч человек, охвачено 256 популяций,
представляющих 90 народов и население 16 стран.
Качество биобанка определяется строгим следова
нием стратегии сбора образцов, описанной в пре
дыдущем пункте. Более подробная информация о
биобанке представлена на рис. 1.12 и в табл. 1.4, а
также в списке охваченных этнических групп. От
метим, что благодаря частым экспедициям коллек
ция ежегодно увеличивается на 2–3 тысячи образ
цов, поэтому, например, в 2017 году она уже может
превысить 30 тысяч образцов.
ОХВАЧЕННЫЕ ЭТНИЧЕСКИЕ И СУБЭТНИЧЕСКИЕ
ГРУППЫ
Перечислим их в алфавитном порядке: абази
ны, абхазы, аварцы, адыгейцы, азербайджанцы, ал
тайцы, андийцы, армяне, балкарцы, башкиры, бе
лорусы, бесермяне, болгары, буряты, вепсы, гагау
зы, греки крымские (азовские), грузины-менгрелы,
грузины-лазы, грузины-имеретинцы, даргинцы,
дунгане, езиды, ингуши, ишкашимцы, кабардинцы,
казахи, кайтагцы, калмыки, караимы, каракалпаки,
караногайцы, карачаевцы, карелы, киргизы, куба
чинцы, кумыки, курды, лакцы, лезгины, литовцы,
молдаване, монголы-баяд, монголы-дурвэд, монго
лы-захчин, монголы-уулд, монголы-халха, мордва
мокша, мордва-эрзя, мордва-шокша, нанайцы, не
гидальцы, ненцы, нивхи, ногайцы астраханские,
ногайцы ставропольские, орочи, осетины, русские,
русские-казаки, рушанцы, табасаранцы, таджики,
татары астраханские, татары казанские, татары
крымские, татары кряшены, татары мишари, тата
ры сибирские, тувинцы, туркмены, удмурты, удэ
гейцы, узбеки, украинцы, украинцы-казаки, ульчи,
хакасы, хамнегане, черкесы, чеченцы, чуваши, шор
цы, шугнанцы, эвенки, ягнобцы, якуты.
Таблица 1.4. Охват географических регионов биобанком коренного населения Северной Евразии
Восточная Европа
Кавказ
Волго-Уральский регион
Центральная Азия
Сибирь и Дальний Восток
ИТОГО
69 популяций
55 популяций
42 популяций
51 популяций
39 популяций
256 популяций
6 269 образцов
6 113 образцов
2 866 образцов
5 433 образцов
3 397 образцов
24 078 образцов
ИЗУЧЕННЫЕ ПОПУЛЯЦИИ ВОСТОЧНОЙ ЕВРОПЫ, КАВКАЗА,
ЦЕНТРАЛЬНОЙ АЗИИ И СИБИРИ
В данной монографии использованы многие,
но не все выборки, представленные в нашем био
банке. В соответствии с планом исследования соб
ственные данные по Y-хромосоме охватывали три
группы популяций: славянские (и близкие к ним
балтские) народы (N=1353) (рис. 1.13), популяции
1.3. Собственные данные
33
40"
60"
80°
240°
220°
Indigenous populations sampled by prof. Elena Balanovska and her team
24,078 samples representing 256 populations of North Eurasia
(former USSR, Afghanistan, and Mongolia)
к
200"
}
*
** *
о studied populations
|
:
а
*
инт
-
Рис. 1.12. Карта популяций биобанка коренного населения Северной Евразии.
Показано географическое положение популяций, обследованных в экспедициях нашего коллектива.
Кавказа (N=1695), популяции Сибири и Централь
ной Азии (N=1241); суммарная выборка превыси
ла четыре тысячи образцов (табл. 1.1). По мито
хондриальной ДНК были охарактеризованы рус
ские, украинские, белорусские и северокавказские
популяции, суммарно составляющие более трех
тысяч образцов (табл. 1.2).
Принципиальной особенностью анализируемо
го материала является не столько его объем, сколько
качество сформированных выборок и их геогра
фия. Под «качеством» подразумевается следование
описанной выше стратегии формирования выбо
рок, обеспечивающей их высокую репрезентатив
ность. Под «географией» понимается изучение
разнообразия генофонда на всей обширной терри
ПОПУЛЯЦИИ ВОСТОЧНОЙ ЕВРОПЫ
тории расселения восточных славян, для чего тре
При изучении народонаселения Европы в целом
(главы 2—5) наши собственные данные входили в
анализируемый Массив даННЫХ ЛИШЬ Как eГО СОстав
ная часть. Однако анализ генофонда балто-славян
ских народов (глава 6) проведен, уже опираясь пре
имущественно на собственные данные, и, в частно
сти, характеристика восточнославянских генофон
дов практически целиком основана на собственных
данных нашего научного коллектива. Это изучение
восточных славян проведено по большим выборкам
детальной характеристики ДНК полиморфизма в
буется анализ многочисленных популяций. Без
различных региональных группах русского, укра
инского и белорусского народов корректное изу
чение их генофонда было бы невозможно.
ВОСТОЧНЫЕ СЛАВЯНЕ В ИХ ИСТОРИЧЕСКОМ
АРЕАЛЕ
При этом наше исследование намеренно прове
дено только в пределах исторического ареала вос
из основных региональных групп русских, украин
точнославянских народов и не включило восточнос
цев, белорусов. Нами исследованы пятнадцать рус
лавянское население Урала, Сибири и Средней
Азии, сформировавшееся относительно поздно.
ских популяций по маркерам Y-хромосомы (табл.
1.5) и тринадцать русских, пять украинских и пять
белорусских популяций по мтДНК (табл. 1.6).
Такая логика объясняется необходимостью изучить
сначала генофондрусского народа и остальных двух
При этом две популяции из Западной Украины рассматриваются суммарно, т.к. увеличение объема объеди
ненной выборки обеспечивает более высокую статистическую достоверность результатов.
Глава 1. Создание баз данных о генофондах мира
34
Таблица 1.5. Популяции, изученные по маркерам Y-хромосомы.
ПОПУЛЯЦИЯ
НАРОД
ГЕОГРАФИЧЕСКАЯ ЛОКАЛИЗАЦИЯ
Пинега
русские
Архангельская обл., Пинежский р-н
114
Мезень
русские
Архангельская обл., Лешуконский р-н
54
45.74
Красноборск
русские
Архангельская обл., Красноборский и Ленский р-ны
91
45.94
N
Долгота | Широта
| 46.53
63.43
54.9
61.56
Вологда
русские
Вологодская обл, разные р-ны
121
39.9
59 23
Кашин
русские
Тверская обл., Кашинский р-н
73
37.61
57 36
Порхов
русские
Псковская обл., Порховский р-н
57
29.56
57.77
Остров
русские
Псковская обл., Островский р-н
75
Смоленск
русские
Смоленская обл., Рославльский р-н
107
Костромская обл., Мантуровский и Межевской районы
52
Кострома (Унжа) | русские
28.32
57 35
| 32.88
53.93
44,77
58.33
36.48
50.78
Русские Белгород | русские
Белгородская обл., Яковлевский, Красненский, Прохоровский р-ны | 143
Ливны
русские
Орловская обл., Ливненский р-н
110
Пристень
русские
Курская обл., Пристенский р-н
45
36.71
51 23
Репьевка
русские
Воронежская обл., Репьевский р-н
96
38.65
51 08
Кубанские казаки | русские
Адыгея, Майкопский р-н
90
Терские казаки
русские
Кабардино-Балкария, Майский, Прохладненский р-ны
125
| 44.0
43.7
| 39.1
44.2
| 37.59
4(). 17
52.4
44.51
Шапсуги
шапсуги
Краснодарский край, Туапсинский, Лазаревский р-ны
100
Абхазы
абхазы
Абхазия, разные р-ны
58
Черкесы
черкесы
Карачаево-Черкесия, Хабезский, Прикубанский р-ны
142
| 41.7
43.8
Осетины
О СеТины
359
| 44.()
42.8
Ингуши
ингуши
Северная Осетия, Дигорский, Ирафский, Алагирский,
Правобережный, Пригородный р-ны, Южная Осетия.
Ингушетия, Малгобекский р-н
143
| 45.()
43.1
Чеченцы
чеченцы
330
| 46 ()
43.2
Аварцы
аварцы
Ингушетия, Малгобекский р-н, Чечня, Ачхой-Мартановский р-н,
Дагестан, Казбековский, Хасавюртовский, Новолакский р-ны
Дагестан, Унцукульский, Гунибский р-ны
115
| 46.9
42.5
Даргинцы
даргинцы
Дагестан, Акушинский, Дахадаевский р-ны
101
47.2
42.2
Кубачинцы
кубачинцы Дагестан, Дахадаевский р-н
65
47.6
42.1
Кайтагцы
кайтагцы
Дагестан, Кайтагский р-н
33
47.63
42.2
Лезгины
Лезгины
Дагестан, Ахтынский р-н
81
47.70
41.5
Армяне
армяне
Краснодарский край и Адыгея, разные р-ны
115
Армяне-амшены
армяне
Краснодарский край (мигранты из Турции)
53
Кумандинцы,
северные
|| 87.42
алтайцы
Алтайский край, Солтонский р-н
Алтай, Турочакский и Чойский р-ны
202
Челканцы,
Алтай, Онгудайский, Улаганский, Кош-Агачский, Чойский,
Турочакский р-ны
Кемеровская обл., Таштагольский р-н
Хакасия, Таштыпский р-н
Хакасия, Аскизский, Бейский, Орджоникидзевский, Таштыпский,
Ширинский р-ны
207
88.50
50.03
139
| 88.00
52.75
185
90.00
53.00
41.10
| 40.1
-
43.1
44.1
-
52.2
тубалары
Алтай-кижи,
нОжнЫе
Те ЛенГИТЫ
алтайцы
Шорцы (горные и | шорцы
абаканские)
Качинцы,
ХаКаСЫ
сагайцы,
койбалы,
кызыльцы
Казахи Алтая
Казахи
Казахстан, Восточно-Казахстанская обл., Катон-Карагайский р-н
122
|| 85.60
49.16
Киргизы
киргизы
Киргизия, Нарынский, Таласский р-ны
140
| 76.00
41.42
Киргизы Памира | киргизы
Таджикистан, Горно-Бадахшанская обл., Мургабский р-н.
106
|| 73.95
38.15
Монголы Алтая
Монголия, аймаки Байан-Улгий, Ховд. Гоби-Алтай
140
96.00
48.00
северные
Суммарно
монголы
20 этносов
6 стран, 39 областей, 81 район
4289
-
-
восточнославянских народов на исконной территории их формирования. Это позволит при необходи-
Урал. Генофонд этих «зауральских» популяций от
ражает не столько историю формирования восточ
мости провести и корректное изучение славянских
популяций, переселившихся в XVI—XX веках за
нославянских народов, сколько историю их поздней
шей экспансии, как было показано в наших работах
1.3. Собственные данные
35
Таблица 1.6. Популяции, изученные по маркерам митохондриальной ДНК.
ПОПУЛЯЦИЯ
НАРОД
ГЕОГРАФИЧЕСКАЯ ЛОКАЛИЗАЦИЯ
N
Долгота | Широта
Пинега
русские
Архангельская обл., Пинежский р-н
144
46.53
63.43
Смоленск
русские
Смоленская обл., Рославльский и Ершичский р-ны
147
32.88
53 93
Кострома (Унжа)
русские
79
44,77
58.33
Белгород
русские
148
36.48
50.78
Боровский
русские
Костромская обл., Мантуровский и Межевской рны (р. Унжа)
Белгородская обл., Яковлевский, Красненский,
Прохоровский р-ны
Калужская, Боровский р-н
70
36.50
55 ()()
Калужская обл., Барятинский р-н
Орловская обл., Болховский р-н
75
34.53
54 ()()
76
36.00
53.43
Барятинский
русские
Болховский
русские
Черемисиновский
русские
37.25
51 87
русские
Курская обл., Черемисиновский р-н
Рязанская обл., Михайловский р-н
62
Михайловский
82
39 ()()
54.22
Спасск-Рязанский
русские
Рязанская обл., Спасск-Рязанский р-н
86
40.53
54.40
Петровский
русские
Тамбовская обл., Петровский р-н
76
40.25
52.63
Кубанские казаки
русские
Адыгея, Майкопский р-н
132
4(). 17
44.51
Терские казаки
русские
Кабардино-Балкария, Майский, Прохладненский
124
44.00
43.70
89
26.77
51 97
р-ны
Столин
белорусы
Брестская обл., Столинский р-н
Светлогорск
белорусы
белорусы
Гомельская обл., Светлогорский р-н
71
29.72
52.62
Витебская обл.
| ()()
29 ()()
55 ()()
белорусы
белорусы
Брестская обл.
104
24.00
52 ()()
Гомельская обл.
| 21
3() ()()
52 ()()
95
35.75
50.40
Витебск
Брест
Гомель
Украинцы Белгород | украинцы
Черкассы
украинцы
Белгородская обл., Красногвардейский
и Грайворонский р-ны
Черкасская обл.
179
32.07
49.43
Хмельницкая
украинцы
Хмельницкая обл., Старо-Константиновский р-н
179
27.30
49.70
24.00
49.25
ЛезГИНЫ
Львовская и Ивано-Франковская обл., разные р-ны
Дагестан, Ахтынский р-н
157
Лезгины
Украинцы западные | украинцы
69
4770
4 | 50
Кайтагцы
кайтагцы
Дагестан, Кайтагский р-н
32
47.63
42.20
Кубачинцы
кубачинцы | Дагестан, Дахадаевский р-н
55
47.60
42.10
Аварцы
аварцы
Дагестан, Унцукульский, Гунибский
81
46.90
42.50
Даргинцы
даргинцы
Дагестан, Акушинский, Дахадаевский
95
47.20
42.20
Чеченцы
чеченцы
239
46.00
43.20
Осетины
ОСеТИНЫ
Чечня, Ачхой-Мартановский р-н, Дагестан,
Казбековский, Хасавюртовский, Новолакский р
ны, Ингушетия, Малгобекский р-н
Северная Осетия, Дигорский, Ирафский,
Алагирский, Правобережный, Пригородный р-ны,
267
44.00
42.80
Суммарно
10 этносов | 23 области, 40 районов
Южная Осетия.
3234
-
-
по анализу структуры фонда фамилий (Балановс
Например, несмотря на сравнительно неболь
кая, Балановский, 2007). Та же цель — выявить не
шую территорию, население Западной Украины
сиюминутный портрет генофонда, а его историчес
киустойчивые черты — определила и подход к фор
обязательно должно было быть представлено в
общем ряду выборок. В противном случае (если
мированию выборок, то есть описанную стратегию,
все украинские выборки происходили бы из иных
направленную на выявление «коренного», наиме
регионов Украины), терялась бы существенная
часть разнообразия генофонда, поскольку антро
нее метисированного генофонда.
пологические и лингвистические данные указыва
ОХВАТ ВСЕГО РАЗНООБРАЗИЯ ВОСТОЧНЫХ
ют, что основное разнообразие украинского насе
СЛАВЯН
ления сосредоточено на западе его ареала.
Припланировании пунктов обследования учиты
Аналогично, этнографическое подразделение
вались данные геногеографии (предшествовавших
работ), лингвистики, этнографии, антропологии.
Белоруссии на северную и южную нашло отраже
ние в изучении обеих частей в нашем исследовании.
36
Глава 1. Создание баз данных о генофондах мира
Для русских представлены обширные выбор
ки казаков и северных русских, а также целый ряд
популяций Центральной России. Учитывая, что
абхазо-адыгская, нахская и дагестанская ветви cе
верокавказской лингвистической семьи, иранская
и славянская ветви индоевропейской семьи и тюр
одним из основных факторов формирования рус
ского генофонда явилась ассимиляция славянски
ми племенами автохтонного финно-угорского на
кская ветвь алтайской семьи. Все эти шесть вет
селения, изучены и сопоставлены две группы рус
ских популяций. Первая — популяции, для которых
(по антропологическим и историческим данным)
можно ожидать наибольшую долю финно-угорс
кого субстрата (население части районов Архан
гельской, Вологодской, Костромской областей),
другая — предположительно потомки исходно сла
вянского населения (Псковская, Курская, Смолен
ская области).
СЛОИ КАВКАЗСКОГО ГЕНОФОНДА
Народонаселение Кавказа представляет собой
напластование множества миграций, часть которых
мы обнаруживаем в современном языковом разно
образии народов Кавказа:
1) древние миграции, сформировавшие пласт
народов северокавказской языковой семьи;
2) миграции ираноязычных народов Евразийс
ких степей ныне представлены только ираноязыч
вей представлены в нашей работе: абхазо-адыгс
кая ветвь (шапсуги, абхазы, черкесы), иранская
ветвь (осетины, 6 субэтнических групп), нахская
ветвь (ингуши, чеченцы из Ингушетии, Чечни и
Дагестана), дагестанская ветвь (аварцы, даргинцы,
кубачинцы, кайтагцы, лезгины), армянская (сум
марная армянская и армяне-амшены), славянская
(кубанские и терские казаки) и тюркская (азербай
джанцы, балкарцы, карачаевцы, караногайцы, ку
мыки, ногайцы).
Впрочем, народы славянской и тюркской групп
стоят на особом счету и рассматриваются отдель
но. Во-первых, потому, что они представляют со
бой довольно поздние волны миграций на Кавказ.
Во-вторых, тюрки Кавказа по данным антрополо
гии представляют «Евразию в миниатюре» — от
европеоидных балкарцев и карачаевцев до монго
лоидных караногайцев — и потому требуют специ
альныX ПОДХОДОВ И ОТДельНОГО ИССледОВаНИЯ.
Каждая лингвистическая группа представлена
репрезентативной выборкой, что позволяет быть
уверенными в надежности их генетических порт
ными осетинами, но предположительно ранее
включали карачаевцев и балкарцев;
3) ранние миграции тюркоязычных народов,
приведшие к смене языка у балкарцев и карачаев
цев, а также, возможно, у кумыков и азербайджан
ретов: абхазо-адыгская N=300 образцов, иранская
N=359, нахская N=473, дагестанская N=395 образ
цов; каждая группа представлена 3—6 этнически
ми или субэтническими популяциями.
Для народов, представляющих генофонды, ок
цев;
4) поздние миграции степных тюркоязычных
народов, отраженные в популяциях ногайцев и ка
раногайцев;
5) несколько волн миграций славянского насе
ружающие основные группы народонаселения
Кавказа (Закавказье, тюркские народы и славянс
кие народы), выборки также достаточно предста
вительны (тюркская N=870, армянская N=168, сла
вянская N=222). Тюркская группа представлена
ления, отраженных последовательно в терских,
затем кубанских казаках, далее — в многочислен
ном современном русском населении Кавказа.
Именно поэтому из имеющихся в нашем распо
ряжении обширных ДНК коллекций, включающих
все перечисленные народы Кавказа, мы выбрали для
всеми шестью тюркоязычными народами Кавка
за. Исследованное нами армянское население Се
верного Кавказа формировалось в XVIII-XIX вв.
за счет выходцев из Ирана и Турции, а в конце XX
в пришла новая волна армянских переселенцев из
Абхазии, Азербайджана, Грузии, Армении, Нагор
генотипирования те народы, которые позволяют
наиболее полно выявить процессы формирования
ного Карабаха. Поэтому первая изученная выбор
народонаселения Кавказа: многочисленные народы
северокавказской языковой семьи и ираноязычные
ка включила суммарную группу армян Адыгеи и
осетины, а также народы, представляющие Закав
Краснодарского края. Вторая выборка представля
ет армян-амшенов, говорящих на особом диалек
те. Они являются потомками длительно изолиро
казье, тюркские и славянские популяции.
ванной группы, проживавшей на юго-восточном
ИЗУЧЕННЫЕ ПОПУЛЯЦИИ КАВКАЗА
побережье Черного моря (на территории Турции),
В пределах Северного Кавказа выделяют три
географических региона, занимающих территорию
от Черного моря до Каспийского Западный, Цент
рию России. Лингвистически армяне относятся к
армянской группе индоевропейской семьи. На ге
часть которых недавно переселилась на террито
ральный и Восточный Кавказ. Нами изучены на
роды, представляющие все три географических ре
ГИОНа.
ногеографических картах обе популяции армян
размещены на территории Армении.
В общей сложности для характеристики наро
дов Кавказа по маркерам Y-хромосомы изучено
Среди современного населения Северного Кав
2780 образцов. Они включают 1527 образцов ко
каза представлены шесть лингвистических ветвей:
ренного населения Кавказа, а также 780 образцов
1.3. Собственные данные
37
тюркоязычных народов, и 383 образцов армян и
казаков Северного Кавказа (рис. 1.13).
избежать последствий современной метисации со
славянскими народами, так как она может создать
иллюзию давних контактов с населением Европы.
НЕСКОЛЬКО ПОПУЛЯЦИЙ НА НАРОД
Необходимо было также избежать включения недав
ней метисации между коренными народами Кавка
В отличие от большинства предыдущих иссле
дований генофонда Кавказа, в данной работе круп
ные народы представлены не одной, а нескольки
ми популяциями. Так, чеченцы изучены в трех рес
публиках (Ингушетия, Чечня, Дагестан), соответ
ствующих трем группам в пределах исконного аре
ала чеченцев. Субэтническое подразделение осе
тин проведено в соответствии с исторически сло
за, так как это также исказит веками сложившуюся
структуру народонаселения Кавказа. Именно поэто
му в работе мы вынуждены ориентироваться лишь
на наши собственные коллекции ДНК, которые тща
тельно собирались в течение многих лет по единой
технологии и потому позволяют с одинаковой сте
пенью надежности анализировать народы по всей
протяженности Кавказа.
жившимися «обществами» (традиционными груп
пами) — дигорцы-христиане (Дигорский район),
ИЗУЧЕННЫЕ ПОПУЛЯЦИИ АЗИИ
дигорцы-мусульмане (Ирафский район), алагирцы,
Для выявления степени и характера влияния
куртатинцы, тагаурцы, туальцы, кударцы, джавцы,
азиатских миграций на формирование генофонда
ксанцы. Армяне и казаки также представлены не
одной, а двумя географически и исторически раз
личными популяциями (армяне-амшены и суммар
ная группа армян Краснодарского края и Адыгеи;
казаки кубанские и терские).
Для выявления роли дрейфа генов в населении
Кавказа были изучены не только крупные народы,
представляющие собой сложную подразделенную
Европы и решения вопросов о характере истори
ческого взаимодействия генофондов Западной и
Восточной Евразии был изучен ряд народов Цент
ральной Азии и Южной Сибири. Их ареалы охва
тили пять государств — Россию, Казахстан, Кирги
зию, Монголию и Таджикистан. Поскольку по ис
торическим данным наиболее мощное воздействие
могли оказывать миграции по степной полосе, ос
популяцию, но и три малых изолированных этноса.
новной акцент исследования был сделан на насе
Один из них представляет западные популяции Кав
каза — это причерноморские шапсуги, до Кавказской
войны бывшие ядром черкесской общности («ады
ге»). Другие два изолированных этноса — кубачинцы
и кайтагцы — представляют Восточный Кавказ.
Важнейшей особенностью сбора образцов было
тщательное формирование выборок. Требовалось
лении Алтае-Саянского региона (алтайцы, казахи,
шорцы, хакасы), а также Тянь-Шаня и Памира (кир
гизы). Собран и проанализирован 1241 образец
представителей 13 малых народов и субэтничес
ких групп крупных этносов. В Южной Сибири
многие народы региона имеют статус «коренных
97 куБАнскивкАзАки
-
*******
}
д.и.
т
пучки
и
цикли
ни
пункта-алканч
(дигорцы)
наина
*.
115АвдPцы
Сбои
осетины "осетины
или ч
(алагирцы)
*о
*
н.
|-
(куртатинцы
и тагаурцы)
-
-
101
}
,
дАРгинцы
выы"
осетиные
ударцы.",
джавцы, ксановцы)
3}" }}
у
к
у
счисел
33
" кдйfдгцы
т"
115 АРМЯНЕ
—
"- ."
":
ни
**
"—
-
.
2"
*
оо( ""
"
и
1.
5
*
куБАчинцы
т.
-
".
81 пвзгины
:*
и не ",
".
А ны
картне
мным
Рис. 1.13. Географическое положение и этнолингвистическая принадлежность изученных популяций Кав
каза. Размер кружка пропорционален объему выборки. Цветом указана принадлежность популяции клингвистичес
кой группе желтый цвет — абхазо-адыгская группа, синий цвет — иранская группа, зеленый цвет — нахская группа,
красный цвет — дагестанская группа, фиолетовый цвет — армянская группа, серый цвет — славянская группа.
Глава 1. Создание баз данных о генофондах мира
38
малочисленных народов Российской Федерации»
[Постановление Правительства РФ от 24 марта
2000 г. N255 «О едином перечне коренных мало
численных народов РФ»]. Эта малочисленность
коренного населения и интенсивная метисация раз
ных групп как с пришлым славянским населени
ем, так и друг с другом, потребовала особых уси
лий для формирования репрезентативных выборок.
Суммарный ареализученных народов велик: от
степных районов Западной Сибири, где равнина
постепенно сменяется северными предгорьями Ал
тая и цепью Саянских хребтов, до альпийских лу
гов Тянь-Шаня и высокогорного Памирского плато.
На Алтае исследованием охвачены практически все
коренные народы: шорцы (горные), северные алтай
цы (челканцы, кумандинцы, тубалары), южные ал
тайцы (алтай-кижи, теленгиты), казахи южных пред
горий Алтая (Казахстан). В Саянах изучены хакасы
(качинцы, сагайцы, койбалы, кызыльцы) и абаканс
кие шорцы. На Тянь-Шане и Памире были изучены
контрастные группы киргизов – соответственно,
нарынских имургабских. Каждая этническая груп
па представлена несколькими локальными популя
циями. Лучше всего изучены народы Алтая (пред
ставлены семь малых народов) и Саян (три круп
ных объединения хакасов и выборка абаканских
шорцев). Этнический состав, объемы выборок и
регионы их сбора представлены в таблице 1.5.
АНАЛИЗ ДРЕВНЕЙ ДНК
Анализ древней ДНК – заманчивый путь изу
чения истории формирования генофондов. И хотя
на нем подстерегают опасности получения невер
ных экспериментальных результатов (из-за конта
минации древних образцов с современной ДНК) и
неверных выводов (из-за крошечных объемов вы
борок и немногочисленности изученных популя
ций), некоторым научным коллективам удается
пройти мимо этих сцилл и харибд и получить но
вые и при этом надежные результаты.
В таблице 1.7 представлен перечень тех попу
ляций древней ДНК, которые были изучены при
участии автора. Они охватывают все основные эпо
хи – палеолита, мезолита, неолита, раннего метал
ла, античности и Нового времении образцы из раз
ных регионов Европы. Большинство этих иссле
дований было инициировано автором и им же про
ведена значительная часть популяционно-генети
ческого анализа полученных экспериментальных
данных. Генотипирование этих образцов по мар
керам мтДНК проведено в Австралийском центре
древней ДНК, в том числе при участии автора. В
остальных случаях автор настоящей книги лишь
был одним из соавторов результирующих публи
каций (это относится к полногеномным данным).
Данный перечень (табл. 1.7) представляет значи
тельную часть от всех изученных в мировой науке
древних популяций Европы и ее окрестностей, и
систематическое описание этих результатов соста
вило основу главы 8.
Таблица 1.7. Изученные популяции древней ДНК.
Популяция
Мальта, Афонтова гора
Южный Олений остров,
Попово
Лошбор
Мотала
Деренбург, культура
керамики
линейно-ленточной
Штуттгарт, культура
керамики
линейно-ленточной
Большой Олений остров
Скифы Дона
Чальмны-Варрэ
Эпоха
палеолит
мезолит
мезолит
мезолит
неолит
неолит
Датировка
лет
17-24
назад
тыс.
Локализация
Россия, Иркутская обл.,
Красноярский край
N
Генотипирование
2
Полные геномы
Россия, Карелия
11
мтДНК
Люксембург
1
Полные геномы
Мотала, Швеция
7
Полные геномы
7,0-7,5 тыс. лет
назад
Германия, Деренбург
21
мтДНК
7,0 тыс. лет
назад
Германия, Штуттгарт
1
Полные геномы
Россия, Мурманская
обл.
23
мтДНК
Россия, Ростовская обл.
16
мтДНК
Россия, Мурманская
обл.
42
мтДНК
7,5 тыс. лет
назад
8,0 тыс. лет
назад
8,0 тыс. лет
назад
эпоха
металла
раннего
3,5 тыс. лет
назад
время
античное
2,5 тыс. лет назад
(VI-III вв. до н.э.)
0,2 тыс.век
летн.э.)
назад
(XVIII
время
новое
1.3. Собственные данные
39
ОСОБЕННОСТИ ГЕНОТИПИРОВАНИЯ Y-ХРОМОСОМЫ И МТДНК
В данном подразделе кратко описывается тех
нология генотипирования, с помощью которой по
лучен тот большой массив собственных данных,
который был описан в предыдущих подразделах.
Эти методические вопросы имеют значение по
стольку, поскольку унификация процедур геноти
пирования обеспечивает возможность сравнитель
ного анализа данных по самым разным популяци
ям. Без такой унификации возникали бы пробле
мы и разных наборов гаплогрупп Y-хромосомы,
изученных для разных популяций, и вопросы на
дежности полученных экспериментальных дан
ных, и многие другие. Поэтому стоит подчеркнуть,
что собственные данные нашего коллектива уни
фицированы как на этапе сбора образцов по еди
ной стратегии и единым правилам, так и на этапе
генотипирования этих образцов.
ФОРМИРОВАНИЕ ДНК-КОЛЛЕКЦИЙ
Выделение ДНК из практически всех коллек
ций образцов венозной крови проводилось ме
тодом фенол-хлороформной экстракции, гаран
тирующим высокий выход и качество ДНК, а
также стабильность при многолетнем хранении.
Для очень немногих популяций в качестве ис
ключения применялся метод выделения ДНК вы
саливанием или ряд хорошо себя зарекомендо
вавших коммерческих наборов. Для каждого об
разца сформированы коллекционная, рабочая и
архивная (резервная) аликвоты. Проведено из
мерение концентрации ДНК, причем не только
спектрофотометрически, но определялась и эф
фективная концентрация методом ПЦР в реаль
ном времени с использованием набора Human
DNA Quantifiler kit (Applied Biosystems). Изме
рение концентрации каждого образца проводи
лось в двух независимых реакциях, а при высо
кой дисперсии результатов анализ повторялся
еще в двух повторностях. Сформированы коллек
ции нормализованной (до 2 нг/мкл) ДНК в 96
луночных планшетах, из которых по мере необ
ходимости приготовлялись планшеты с сухими
образцами ДНК. Именно ДНК, нормализованная
до единой концентрации, и использовалась в
большинстве видов анализа.
ПАНЕЛЬ SNP МАРКЕРОВ Y-ХРОМОСОМЫ
Для анализа полиморфизма Y-хромосомы ис
пользованы обе системы маркеров: однонуклеотид
ные полиморфные локусы SNP и высоковариабель
ные микросателлитные STR маркеры.
Исследование SNP позволяет отнести исследу
емый образец к той или иной ветви родословного
древа Y-хромосомы – гаплогруппе. В начале попу
ляционных исследований Y-хромосомы на ней
было известно лишь около десятка гаплогрупп,
далее это число, благодаря специальным исследо
ваниям, постепенно увеличивалось, и к началу эпо
хи массового полного секвенирования Y-хромосо
мы (т.е. к 2013 году) на филогенетическом дереве
Y-хромосомы было известно около 500 гаплогрупп,
из которых примерно для половины проводился
анализ ее распространения хоть бы в некоторых
популяциях хотя бы одной лабораторией в мире.
При этом и число, и набор маркеров, генотипиро
ванных в разных исследованиях, различались дра
матически. Поэтому перед нами стояла задача
сформировать набор гаплогрупп, по которым про
водить генотипирование наших коллекций.
Гаплогруппы Y-хромосомы географически вы
соко специфичны, поэтому нам для изучения по
пуляций Северной Евразии не было большой нуж
ды включать африканские, американские или ав
стралийские гаплогруппы, но евразийские гаплог
руппы надо было включить почти все (за исклю
чением разве что приуроченных только к Южной
и Юго-Восточной Азии). Ведь в генофонде изуча
емых народов из удаленных частей Северной Ев
разии можно встретить максимальное разнообра
зие спектра гаплогрупп – как западно-евразийских,
так и восточно-евразийских. При этом вставал воп
рос и о глубине филогенетического разрешения,
поскольку анализировать все до одной субгаплог
руппы, известные в пределах какой-либо гаплог
руппы, было нереально с точки зрения финансо
вого обеспечения. Поэтому приходилось включать
в панель лишь субгаплогруппы, наиболее частые
в Северной Евразии, причем сама частота нередко
выяснялась в ходе как раз наших исследований.
В итоге была разработана панель из 44 основ
ных и 32 дополнительных гаплогрупп. Основные
гаплогруппы генотипировались практически без
исключений для всех изученных нами популяций.
Дополнительные представляли собой региональ
ные субтипы, информация по которым имела зна
чение лишь при изучении данного региона, а ге
нотипирование их в остальных популяциях не было
столь уж необходимым. Например, субтипы гап
логруппы О3 было важно изучить в популяциях
Сибири, но их генотипирование в популяциях Кав
каза было избыточным – гаплогруппа О3 настоль
коредка на Кавказе, что для интерпретации ее при
сутствия у считанных образцов вполне достаточ
но знать, что это О3, и не так важно, в какому имен
но субтипу О3 они относятся (появление того или
иного субтипа становится уже игрой случая при
таких низких частотах).
В этом перечне гаплогруппы «основной панели»
указаны жирным шрифтом, а «дополнительные» мар
керы в пределах основных гаплогрупп даны обыч
ным шрифтом и в скобках. Вот этот перечень:
40
Глава 1. Создание баз данных о генофондах мира
С-М130, С-М217, С-М48 (С-М407), D-М174,
Е-М96, Е-М35, Е-М78 (E-V13, Е-М123). F*-М89,
С*-М201, С-М285, С-Р15, С-Р16, С-Р18, С-М406,
С-Р303 (G-М377), Н-М69, I-М170, I-М253, (1
Р215), I-Р37, I-М223, J-М304, J-М267, J-Р58, J
М172, J-М12 (J-М47), J-М67, J-М92, К-М9, L
М20 (L-М27, L-М317, L-М357), N-М231 (N
LLY22g), N-М128, N-Р43, N-М178, О-Р186 (О
М119, О-Р31), О-М122 (О-Р201, О-М159. О-М134.
О-М7), О-М242, R-М207, R-М198, R-М458, R
М343, R-М73, R-М269 (R-L23, R-L11, R-U106. R
U198. R-L48, R-Р312. R-М65. R-М153, R-М167. R
U152. R-М126. R-М160. R-L2, R-L20. R-М37. R
М222), R-М124, Т-М70.
пировалась для каждого образца. Затем спектрис
пользуемых SNР маркеров увеличивался, но они
уже генотипировались только для тех образцов,
которые, по результатам первого раунда генотипи
рования, могли относиться к соответствующим
гаплогруппам.
Для наиболее эффективного и быстрого опре
деления SNР-гаплогруппы применялись две стра
тегии (по отдельности или совместно). Во-первых,
«иерархическое типирование» - анализ на все суб
гаплогруппы, дочерние по отношении к гаплогруп
пе, определенной при предыдущем этапе анализа
образца. Во-вторых, «предикция»: на основании
данных по STR гаплотипу определялась ожидае
В 2014-2015 годах к нашим «основной» и «до
мая гаплогруппа для образца, которая далее под
полнительным» панелям Y-SNР маркеров добави
тверждалась типированием соответствующего
лись еще две панели маркеров, открытых на гап
SNР-маркера (предикция проводилась с помощью
логруппах N1c-М178 и С3-М217 и включающих
разработанной нашим коллективом программы
суммарно 31 маркер. Подробнее эти панели опи
предиктора, описанной в разделе 1.1).
саны в тех разделах книги, где рассматриваются
полученные с их помощью результаты.
МЕТОД ГЕНОТИПИРОВАНИЯ SNР МАРКЕРОВ
ГЕНОТИПИРОВАНИЕ STR МАРКЕРОВ
Анализ высокополиморфных STR маркеров Y
хромосомы позволяет выявить в пределах каждой
Генотипирование проводилось методом ПЦР в
реальном времени с использованием ТафМan зон
гаплогруппы множество родственных гаплотипов.
Различия между индивидами по числу коротких
1. 14. Можно видеть, что этот метод дает надежные
и объективные результаты. Важно, что этим мето
тандемных повторов (STR — short tandem repeats)
возникают гораздо чаще, чем по SNР из-за более
высокой скорости мутирования STR — быстрого
изменения числа тандемных повторов. Однако по
каждому отдельному STRмаркеру легко могут воз
дом возможно объединение на одном графике ре
никать одинаковые аллели в разных гаплогруппах.
зультатов всех постановок одного итого же марке
Поэтому, не зная, к какой гаплогруппе принадле
жит данный образец, мы не можем сувереннос
тью сказать, действительно ли он родственендру
дов на SNР маркеры (эти зонды были разработаны
по нашему заказу компанией Арplied Biosystems).
Пример результирующего графика приведен нарис.
ра, даже сделанных в разные годы, что обеспечива
ет унифицированный подход при отнесении образ
цов к одному или другому кластеру. Также суще
ственно, что график всегда можно пересмотреть
гому образцу с похожим набором STR маркеров.
Именно поэтому наиболее эффективно парал
повторно, если возникают сомнения в правильнос
лельное исследование обеих генетических систем
ти определенного генотипа. Наконец, формат авто
— SNР и STR. Их образно сравнивают с часовой и
минутной стрелкой: первая (SNP) позволяет понять
матического экспорта результатов в электронные
таблицы, предусмотренный в программах обработ
ки результатов ТаqМаn, насущно необходим при
массового анализа тысяч образцов. Генотипирова
ние Y-хромосомы проведено в основном в лабора
тории популяционной генетики человека МГНЦ
РАМН и в лаборатории геномной географии ИОГен
РАН под руководством и при участии автора, за ис
ключением русских популяций, проанализирован
ных лично автором на базе Эстонского биоцентра
|Ваlanovsky et al. 2008). SNР маркеры в этих рус
ских популяциях анализировались не с помощью
ТаqМanзондов, а более старым методом ПДРФ, как
описано в|Вalanovsky et al., 2008).
При типировании популяций каждого региона
(славяне, Кавказ, Южная Сибирь и Средняя Азия)
вначале подбиралась панель гаплогрупп, наиболее
частых в данном регионе по информации нашей
базы данных Y-base. Эта панель маркеров геноти
положение образца народословном древе в «гло
бальном» масштабе, а вторая (STR) — определить
его более точное положение. Исследование STR
маркеров на фоне данных обSNР маркерах позво
ляет датировать возникновение отдельных класте
ров гаплотипов (т.е. субветвей родословного дре
ваY-хромосомы).
Для получения данных о STR гаплотипах амп
лифицировались 17 STR локусов Y-хромосомы
(dys3891, dys389п, dys390, dys456, dys19.
DYS385a, DYS385b, DYS458. DYS437. DYS438,
dys448. сата н4, dys391, dys392, dys393,
DYS439, DYS635) с использованием коммерческо
го набора Y-filer РСR Amplification Кit (Applied
Вiosystems). Фрагментный анализ амплификонов
проводили на капиллярном секвенаторе Арplied
Вiosystems 3130х1 Genetic Analyzer. Ряд образцов
анализировался также с использованием второго
1.3. Собственные данные
41
мультиплексного набора (Genographic custom
multiplex, AppliedВiosystems), включавшем два STR
локуса, DYS388 и DYS426, вместе с шестью SNР
локусами (М17, М60, М91, М139, М175, М186).
ПОЛНОЕ СЕКВЕНИРОВАНИЕ Y-ХРОМОСОМЫ
За последнее десятилетие полногеномный ана
лиз стал мощным методом обнаружения новых
SNР-маркеров. Это особенно актуально для Y-хро
мосомы, с ее максимальной межпопуляционной из
менчивостью и географической специфичностью
аллелей (гаплогрупп). Полное секвенирование каж
дой очередной Y-хромосомы фактически открыва
ет новую гаплогруппу (новую веточку на филоге
нетическом дереве) и несколько специфичных для
нее SNP-маркеров.
В конце 2013 года компании FamilyTreeDNA и
ВGI независимо создали долгожданные техноло
setup) nstuer Resus locsummary)
Мarker.
п
н
|
са П
ПКП a | } | a | a |
дllelic Discrimination plot
—п
—
—
н
и
р
0.8
н.
-
0,7
|
0,6
0,5
0.4
0.3
0.2
н
.*.*
-
*4.
и 3.
к
-
.
|
00
.
-
},
: "",
* * *
-0,1
0.1
п.3
0.5
от
0.9
и.т
1.3
1.5
17
Аненех (у Р15-д)
Рис. 1.14. Генотипирование SNP-маркеров методом ТаqМаn.
Приведен результирующий график накопления двух флуоресцентных меток после ПЦР-реакции. Представле
ны результаты генотипирования образцов шапсугов по маркеру Р15, определяющему гаплогруппу G2a Y-хромо
сомы. Каждый образец показан отдельной точкой. Распределение образцов по Y-и Хоси в соответствии с наличи
ем или отсутствием соответствующей метки (а значит, соответствующего нуклеотида) позволяет разделить их на
три группы: преобладание сигнала от аллеля Р15-А (образцы отмечены красными точками), преобладание сигнала
от аллеля Р15-G (синий цвет), отсутствие обоих сигналов (реакция не прошла, черный цвет). Данный пример
иллюстрирует эффективность и удобство метода ТаqМan для генотипирования SNP-маркеров.
42
Глава 1. Создание баз данных о генофондах мира
гии Y-capture (отдельный анализ Y-хромосомы),
оптимальные по соотношению «цена-информатив
изучения генофонда, чем полные геномы челове
от числа секвенированных образцов и от степени
представленности различных ветвей древа в этих
образцах. Конечно же, принадлежность образца к
ветви заранее неизвестна (выяснить ее — ЭТО И еСТЬ
ка. Лидирующие коллективы мира тотчас присту
цель секвенирования), однако охват географичес
пили канализу генофондов на основе Y-capture.
ки контрастных
Поскольку наш коллектив обладает самым обшир
ным во всем мире биобанком по народонаселению
стных образцов (по уже известным для них марке
рам Y-хромосомы) значительно повышает вероят
ность представленности филогенетически контра
ность» и потому даже более перспективные для
Северной Евразии и обширным опытом исследо
популяций и
генетически контра
ваний Y-хромосомы, это дало нам возможность
успешной конкуренции в этом новейшем и перс
пективном направлении исследований в мировой
стных ветвей в выборке.
После получения сиквенсов необходимо про
науке.
основании обработанных сиквенсов построить
По самой логике подобных популяционных
исследований, работа естественным образом рас
падается на две части: обнаружение новых марке
ров на Y-хромосоме и скрининг их распространен
филогенетическое древо. Первоначальная обработ
(выравнивание на геном, отсеивание ложных
сигналов и т.п.), завершающаяся списком марке
ности в популяциях.
вести биоинформационную обработку, и уже на
Ка
ров, обнаруженных у каждого образца, предлага
ется секвенирующей компанией, хотя и этот этап
исследователю полезно параллельно проводить
«ПОЛНЫЕ ИГРЕКИ»: ДЕРЕВО
проводить секвенирование Y-хромосомы. Эти сик
самостоятельно. Последующие этапы — приведе
ние сиквенсов всех образцов к единому списку ге
нотипированных маркеров, разработка алгоритма
их сведения в единую таблицу — должны прово
венсы можно получить либо в качестве побочного
ДИТЬСЯ СaМИМ ИССледОвателем.
Для обнаружения новых маркеров необходимо
продукта полного секвенирования генома (сто
имость не менее 3 тысяч долларов США), либо
физическим выделением Y-хромосомы (необходи
«ПОЛНЫЕ ИГРЕКИ»: ПОПУЛЯЦИОННЫЙ
СКРИНИНГ
мы клеточные линии, и в целом это едва ли оправ
данный путь), либо секвенированием только Y-хро
Наконец, выбор маркеров для скрининга (из
мосомы после избирательного обогащения полно
геномных библиотек данной хромосомой. Имен
но этот путь является наиболее целесообразным
большого числамаркеров, которые, как ожидает
ся, будут открыты в результате секвенирования) в
связи с высокой ценой этого этапа целесообразно
по соотношению цена/результат Технология изби
проводить с максимальной эффективностью, вклю
рательного секвенирования Y-хромосомы разрабо
тана двумя компаниями — китайской лидирующей
чая лишь те маркеры, которые гарантированно
компанией полногеномного секвенирования ВGI
(цена выше 1000 долларов) и американской ком
панией FamilyTreeDNA (цена 700 долларов). Хотя
технология американской компании позволяет про
читать чуть более короткую часть Y хромосомы,
но число проанализированных образцов важнее
длины секвенирования, поэтому нами был выбран
именно этот вариант. Хотя полное секвенирование
Y-хромосомы на порядок дешевле полного секве
нирования генома, но и такие исследования требу
ют заметных финансовых затрат. Поэтому «пол
ногеномная» часть наших исследований Y-хромо
сомы была бы невозможна без полученного авто
маркируют не частные «семейные» линии Y-хро
мосомы, а достаточно распространены хотя бы в
некоторых популяциях.
Для скрининга распространенности ветвей,
определяемых выбранными маркерами, необходи
мо охватить максимально широкий географичес
кий ареал, в идеале полностью покрывающей тер
риторию изучаемой гаплогруппы, и при этом не
обходима высокая плотность покрытия ареала изу
ченными популяциями. Для этого наша коллекция
образцов Северной Евразии является оптимальным
решением.
К настоящему времени с использованием та
кого подхода мы провели исследование уже трех
ром гранта РНФ (№ 14-14-00827) и в особенности
гаплогрупп (С3-М217 N1c-М178 и G1-М285) и
без сотрудничества слабораторией исторической
генетики МФТИ, взявшей на себя расходы по сек
венированию образцов из тех гаплогрупп, для ана
завершается исследование восточноевропейских
ветвей R1b. Для этих гаплогрупп проведено пол
ное секвенирование Y-хромосомы более 100 образ
лиза которых финансирования РНФ оказалось не
цов, построены филогенетические деревья, обна
достаточно.
ружено большое количество новых субветвей, по
давляющее большинство которых характеризуют
Целью является выявление новых ветвей фи
логенетического дерева и обнаружение специфич
ных для них генетических маркеров, а эффектив
ность такого выявления зависит от двух факторов:
ся высокой географической специфичностью. Для
каждой из этих ветвей выбрано по одному SNР
маркеру и созданы их панели, позволяющие про
1.3. Собственные данные
водить массовый скрининг распространенности
этих новых открытых ветвей Y-хромосомы в по
пуляциях. В эти панели включены маркеры, опре
деляющие все основные субветви, известные на
данный момент в пределах этих гаплогрупп (как
полученные другими коллективами, так и наши
собственные).
Ко времени написания этой книги нами широко
используются панели для гаплогрупп N1c-М178 и
С3-М217, включающих 8 и 23 маркера. По этим
43
ЭВОЛЮЦИЯ РЕФЕРЕНСНОЙ
ПОСЛЕДОВАТЕЛЬНОСТИ мтДНК
Для характеристики каждой секвенированной
мтДНК указывают ее отличия от последовательнос
ти, избранной к качестве референсной. Первым ре
ференсом была первая полностью секвенированная
мтДНК, так называемая «кембриджская» последова
тельность (СRS — Сambridge referencesequence), впер
вые опубликованная в (Аnderson et al., 1981). При
повторном исследованиитого же образца почти двад
панелям генотипированы почти все образцы из на
ших коллекций, относящиеся к соответствующим
гаплогруппам (суммарно более двух тысяч образ
цов). Также готовится панель по восточноевропей
ским и азиатским субгаплогруппам R1b, и можно
ожидать, что в ближайшие пару лет нами будут раз
работаны и войдут в обиход и панели для осталь
ных важнейших североевразийских гаплогрупп.
По мнению автора, именно эта работа по рез
кому увеличению филогеографического разреше
цать лет спустя [Andrews et al., 1999), обнаружился
ряд небольших неточностей в первоначальном опре
делении последовательности. Исправленный вариант
СRS обозначают как rСRS (revised СRS).
В отношении гипервариабельных сегментов,
которые исследуются наиболее часто, СRS не отли
чается от rСRS. Однако этот референс был неудо
бен тем, что находится на самом конце одной из вет
вей филогенетического дерева, характерной имен
но для Европы. Однако в мировом генетическом
ния Y-хромосомы путем не только открытия но
вых гаплогрупп в результате полного секвениро
разнообразии и глобальной истории популяций че
ловека Европа, конечно, является окраинным, пе
вания, но и популяционного скрининга на эти но
вые маркеры является сейчас наиболее перспек
тивной в мировой популяционной генетике. Под
робнее ход работы, используемые подходы, био
информационные методы и первые полученные
риферийным регионом. Поэтому для описания гап
логрупп других регионов мира (и даже других ев
ропейских ветвей) при использовании rСRS в каче
стве референса приходилось сначала отсчитывать
мутации от rСRS до корня мирового дерева, а по
результаты систематически описаны в разделе 7.4.
ГЕНОТИПИРОВАНИЕ МИТОХОНДРИАЛЬНОЙ ДНК
том откорня до изучаемой гаплогруппы. Такой двой
ной отсчет хотя и стал для исследователей привыч
ным за двадцать лет использования, но был неудо
бен и приводил иногда к ошибкам.
Митохондриальные маркеры используются в
Поэтому в работе (Веharet al., 2012) было пред
ложено использовать в качестве референсной пос
исследованиях генофонда популяций человека
ледовательности реконструированный «корень»
благодаря их высокой скорости мутирования и от
превращает мтДНК в такой мультиаллельный ло
филогенетического митохондриального дерева
человечества, которых получил обозначение RSRS
- Reconstructed Sapiens Reference Sequence. В дан
кус, в котором можно восстановить порядок про
ный момент основной часто обновляемый ресурс
а также привлекаются по ходу изложения в неко
торых других частях книги.
сутствию рекомбинации (что методологически
исхождения аллелей друг от друга). Поэтому
по митохондриальному дереву — www.phylotree.org
мтДНК, как и другая нерекомбинирующая систе
ма в геноме человека — Y-хромосома — идеальны
— предлагает версии дерева, ориентированные как
на rСRS, так и на RSRS.
для филогенетических исследований, основанных
на реконструкции дерева происхождения аллелей
ДВА РЕГИОНА мтДНК
(гаплотипов) друг от друга. Митохондрии пере
Функционально мтДНК разделяют на так на
даются детям от их матери и происходят от тех
зываемые кодирующий регион (включающий нук
митохондрий, которые оказываются в яйцеклетке
в момент оплодотворения. Ключевым вопросом
леотиды в мтДНК от номера 00578 до номера
для филогенетических исследований с помощью
16023) и контрольный регион (включающий ос
тальные нуклеотиды, 16024-00574). В кодирующем
мтДНК является возможность рекомбинации
мтДНК отца и матери. Считается, что митохонд
рии сперматозоидов (вместе с отцовской мтДНК)
деградируют после оплодотворения. Указания на
наличие рекомбинации между отцовской и мате
ринской мтДНК, произошедшие в результате пе
редачи мтДНК от отца, подробно разбирались и
были опровергнуты в критическом обзоре
|Ваndelt et al., 2005).
регионе расположены 37 генов. В середине конт
рольного региона расположен сайт инициации реп
ликации Н-цепи (от которого и ведется отсчетно
меров нуклеотидов в мтДНК) и сайты инициации
транскрипции обеих цепей. Контрольный регион
реплицируется в последнюю очередь и долго су
ществует в виде нереплицированного (общего для
двух новых цепей) участка — так называемой D
44
Глава 1. Создание баз данных о генофондах мира
петли (D-loop). Внутри D-петли существует 3 ги
первариабельных сегмента (ГВС). Накопление
мутаций в них происходит особенно быстро - ос
новная часть полиморфизма мтДНК сосредоточе
на в первом гипервариабельном сегменте (ГВС1)
контрольного региона. На D-петлю приходится
около 23% всего полиморфизма мтДНК у челове
ка при ее общей длине 6,8% от всей мтДНК (Ноrai
et al., 1995).
Многие мутации, возникающие в D-петле ве
дут себя как условно нейтральные. Мутации, воз
никающие в кодирующем регионе, наоборот, по
тенциально подвержены жесткому естественному
отбору в связи с большой значимостью функцио
нирования митохондрий для жизнедеятельности
организма.
КАКОЙ РЕГИОН мтДНК ИЗУЧАТЬ?
Для исследования мтДНК можно использовать
полное секвенирование всех 16,5 тысяч нуклеоти
дов, и такой подход в последние 2—3 года стал наи
более распространенным. Но подавляющее боль
шинство образцов мтДНК, изученных к настояще
первый способ (анализ только ГВС) типичен для
статей криминалистов, для которых главным яв
ляется совпадение/несовпадение образцов, а вто
рой способ (дополнение ГВС филогенетически
информативными маркерами кодирующего регио
на) — для популяционно-генетических работ, для
которых принципиально определение принадлеж
ности к конкретной гаплогруппе.
ГЕНОТИПИРОВАНИЕ мтДНК
Этот второй подход — параллельный анализ и
контрольного, и кодирующего регионов - был ис
пользован и в нашем исследовании. Генотипиро
вание мтДНК включило секвенирование ГВС1
между позициями 16024 и 16400. Секвенирование
проводилось на капиллярных секвенаторах АВI
377, АВI 3130х1, Меgabace 2000 с использованием
секвенирующих наборов DYЕnamicТМ ЕТ
terminator или ВigDye Terminator v3.1. Определе
ние однонуклеотидных замен в кодирующем ре
основной массив был накоплен в предшествующие
гионе молекулы мтДНК проводилось методом
ПДРФ-анализа или методом ТафМаn; анализиро
вались маркеры на гаплогруппы Н, V, НV, U, U4,
К, R, Т, J, J1, N, N1b, W, X, I, М, А, С, Z, D, D5.
Для контроля правильности определения гаплог
годы, когда трудоемкие технологии секвенирова
руппы использовались также характерные сочета
ния позволяли проводить полный анализ мтДНК
лишь для немногих образцов. Большинство образ
также применялись для уточнения субгаплогрупп
му времени, изучены не столь полно, поскольку
цов поэтому изучались либо лишь по ГВС — ги
первариабельным сегментам (одному или несколь
ким), либо по гипервариабельным сегментам плюс
по нескольким (филогенетически наиболее инфор
мативным) SNР маркерам кодирующей части. Не
обходимость исследования маркеров кодирующе
горегиона обусловлена тем, что в гипервариабель
ных сегментах мтДНК нередко параллельно воз
никают одинаковые мутации в разных гаплогруп
пах, и поэтому анализ только ГВСчасто оказыва
ния мутаций (мотивы) в ГВС1 мтДНК, которые
(например, U5a, U5b, U2е и другие варианты в пре
делах гаплогруппы U определялись по мотивам
ГВС1). Перечень характерных мотивов для ряда
гаплогрупп опубликован с участием автора в ра
боте (Веhar et al., 2007).
Генотипирование мтДНК большинства популя
ций проведено автором на базе Эстонского биоцен
тра, оставшаяся часть (главным образом южнорус
ские и северокавказские популяции, табл. 1.6) была
ется недостаточным для правильного определения
генотипирована под руководством автора в лабо
ратории популяционной генетики человека МГНЦ
гаплогруппы (Кivisild et al., 1999). Как правило,
рамн.
1.4. КАРТОГРАФИЧЕСКИЙ И СТАТИСТИЧЕСКИЙ АНАЛИЗ
Он любил три вещи на свете:
За вечерней пенье, белых павлинов
Истертые карты Америки.
Не любил, когда плачут дети,
Не любил чая с малиной
И женской истерики.
... А я была его женой.
Анна Ахматова
В анализе генофондов различного масштаба (от
всей Евразии до популяций Русского Севера) и
различной географической локализации (от Евро
пы до Сибири), вошедших в эту книгу, применя
Быстрокрылых ведут капитаны,
Открыватели новых земель,
Для кого не страшны ураганы,
Кто изведал мальстремы и мель,
Чья не пылью затерянных хартий, —
Солью моря пропитана грудь,
Кто иглой на разорванной карте
Отмечает свой дерзостный путь
Николай Гумилев
лись единые подходы и единый набор методов.
Поэтому разумно изложить их однажды в начале
книги, чтобы не повторять потом многократно ме
тодические подробности. Использованные методы
1.4. Картографический и статистический анализ
можно разделить на статистические, филогенети
ческие и картографические. Статистические боль
шей частью основаны на частотах аллелей (для Y
хромосомы и мтДНК-гаплогрупп), филогенетичес
кие – на анализе гаплотипов (включая расчет воз
раста гаплогрупп по накопленному разнообразию
гаплотипов), а картографические – показывают
распространение статистических или филогенети
ческих показателей в пространстве и позволяют
проводить дальнейший статистический анализ уже
самих полученных карт.
ЛОГИКА КАРТОГРАФИЧЕСКОГО АНАЛИЗА
Целью картографического анализа является
«проявление» структуры генофонда. Поэтому кар
та – это не иллюстрация, а инструмент исследова
ния. Не картинка, а научная модель. Не фотогра
фия, а образ генофонда. Как всякий хороший ин
струмент, карта непроста в использовании и тре
бует правильного обращения. Как всякая модель,
она может существовать во множестве вариантов
– в зависимости от задаваемых параметров. Как
всякий образ, картаможет быть прокомментиро
вана, но не передана словами. Карта иногда краси
ва, и всегда логична, проверяема, математически
точна.
На первом этапе, согласно логике картографи
ческого анализа генофонда, строятся карты распро
странения отдельных генов (или других призна
ков). Эти карты содержат рассчитанные значения
признака в каждом из тысяч узлов карты, равно
мерной сетью покрывающих территорию. И нуж
но подобрать такие параметры картографирования,
чтобы полученный набор значений оптимально
моделировал распространение признака и соответ
ствовал целям конкретного исследования.
На втором этапе эти рассчитанные значения
подвергаются статистическому анализу. Простей
ший пример – среднее значение по всем узлам кар
ты. Сложнейший – корреляция картографирован
ного признака с неким другим признаком, рассчи
танная для каждого узла карты (причем в одной
части территории корреляция может оказаться по
ложительной, а в другой – сменить плюс на ми
нус).
На третьем этапе карты разных признаков ком
бинируются друг с другом – создаются обобщен
45
ные карты. Поскольку карты – это математичес
кие матрицы значений, с ними можно проводить
любые математические операции – складывать,
делить друг на друга, извлекать корни и брать про
изводные… Поэтому любой популяционно-гене
тический параметр, который обычно рассчитыва
ется для данных в исходных изученных популяци
ях, можно рассчитать и для картографированных
значений, тем самым построив карту этого пара
метра. Обратное неверно: бывают ситуации, когда
по карте рассчитать какой-то параметр можно, а
вот без карты – нельзя. Например, если разные ана
лизируемые признаки изучены по разному набору
популяций, то многие виды многомерного статис
тического анализа становятся невозможны, тогда
как картографический анализ, позволяющий рас
считать значения всех признаков в каждом из уз
лов сетки карты, становится универсальным инст
рументом изучения генофонда, позволяя проводить
и те виды статистического анализа, которые без
карты провести никак нельзя.
На всех этих этапах карта представляет собой
файл с данными, не воспринимаемый толком че
ловеческим глазом. Но этот файл всегда можно ви
зуализировать, показав разные группы значений в
разных узлах разными цветами и выведя их в тех
частях карты, где находится соответствующий узел.
Тем самым статистическая модель предстает в об
личье привычной географической карты, на кото
рую можно наносить любую дополнительную ин
формацию – от береговой линии до местархеоло
гических раскопок.
В итоге можно получить карту распростране
ния любого аллеля, или карту любого параметра
генофонда, провести ее последующий анализ для
уточнения закономерностей в географической из
менчивости, связать с другими картами и создать
в итогеточный и выразительный геногеографичес
кий образ генофонда.
Картографический способ представления дан
ных о генофонде оптимален еще и тем, тем, что
допускает использование генетических результа
тов не только генетиками, но и специалистами в
смежных областях: карта является универсальным
средством, понятным представителям многих на
учных дисциплин, чего нельзя сказать о генетичес
кой терминологии.
ПРОГРАММА GENEGEO
ПРОГРАММА GENEGEO – ОБЩАЯ
ХАРАКТЕРИСТИКА
Теория, правила и алгоритмы такого картогра
фического анализа разрабатывались еще в 90е годы
прошлого века рядом коллективов. Наиболее пос
ледовательно и полно они были разработаны рос
сийской школой геногеографии, по преимуществу
в работах Е.В. Балановской. Для их практического
применения под ее руководством был последова
тельно разработан ряд картографических пакетов,
из которых наилучшим и наиболее широко исполь
зовавшимся был GGMAG. Но в начале текущего
столетия этот пакет, разработанный под DOS, с
одной стороны, начал терять совместимость с со
46
Глава 1. Создание баз данных о генофондах мира
временными операционными системами, и в него
все труднее стало вносить усовершенствования, а
с другой стороны, стремительное развитие средств
программирования делало возможным решение
тех задач (особенно в плане визуализации), кото
рые ранее были нереальными. Поэтому назрела
насущная необходимость в разработке нового, со
временного программного обеспечения для картог
рафо-статистического анализа генофонда. Им ста
ла программа GeneGeo.
Как видно из его названия, программа разра
батывалась специально для целей геногеографии.
GeneGeo разрабатывается под руководством ав
тора данного исследования совместно с сотруд
ником кафедры картографии МГУ к.г.н. С.М. Ко
шелем (вместе с которым разрабатывался и
GGMAG). Программа GeneGeo соответствует со
временным мировым стандартам картографичес
ких программ, в том числе в разделе графическо
го отображения карт и совместимости с другими
картографическими пакетами (Surfer, ArcGIS).
Для возможности международного использования
интерфейс программы представлен на английском
языке. С точки зрения программирования, автор
ских прав, использования в публикациях и т.д.,
программа GeneGeo, является новым программ
ным продуктом, написанным практически «с
нуля». При этом с точки зрения реализуемых ме
тодов, GeneGeo является продолжением описан
ной выше геногеографической традиции, пред
ставленной зарубежом работами L.L. Cavalli
Sforza и его школы, а в России – работами Ю.Г.
Рычкова, Е.В. Балановской и их учеников, вклю
чая и автора данного исследования.
Программа GeneGeo разрабатывается нашим
коллективом в течение ряда лет (с 2007 года по
настоящее время). В связи с обширностью и тру
доемкостью задачи, разные этапы этой работы
выполнялись в разное время и при частичной
поддержке ряда грантов, а в 2009–2012 годах со
здание этой программы являлось одним из на
правлений темы НИР «Анализ распространения
гаплотипов митохондриальной ДНК и Y-хромо
сомы у народов мира на основе создания геоин
фосистем», выполняемой в Медико-генетичес
ком научном центре РАМН под руководством
автора.
ИСПОЛЬЗОВАНИЕ ПРОГРАММЫ GeneGeo
Картографическая программа GeneGeo широко
используется не только в отечественных, но и в ряде
зарубежных исследований. Программа использова
лась (и, соответственно, цитировалась) в следую
щих международных и отечественных статьях:
1) в статье [Haak et al., 2010], опубликованной
в журнале PLoS Biology (импакт-фактор 13);
2) в статье [Balanovsky et al., 2011], опублико
ванной в журнале Molecular Biology and Evolution
(импакт-фактор 10);
3) в статье [Knappskog et al., 2014], опублико
ванной в журнале Oncotarget (импакт-фактор 6,6);
4) в статье [Der Sarkissian et al., 2014], опубли
кованной в журнале PLOS One (импакт-фактор 3,5);
5) в статье [Kushniarevich et al., 2015], опублико
вано в журнале PLOS One (импакт-фактор 3,5);
6) в статье [Balanovsky et al., 2015], опублико
ванной в журнале PLOS One (импакт-фактор 3,5);
7) в статье [Haber et al., 2011], опубликованной в
журналеAnnalsofHumanGenetics(импакт-фактор 2,6);
8) в статье [Pshenichnov et al., 2013], опублико
ванной в журнале American Journal of Physical
Anthropology (импакт-фактор 2,5);
9) в статье [Балановский и др., 2010], опубли
кованной в журнале «Медицинская генетика);
10) в статье [Дибирова и др., 2010], опублико
ванной в журнале «Медицинская генетика);
11) в статье [Балаганская и др., 2011], опубли
кованной в журнале «Вестник Московского уни
верситета. Серия XXIII. Антропология»;
12) в статье [Балановская и др., 2011], опубли
кованной в журнале «Вестник Московского уни
верситета. Серия XXIII. Антропология»;
13) в статье [Балановский и др., 2011], опублико
ванной в журнале «Генетика» (импакт-фактор 0.25).
14) в статье [Степанов и др., 2011] «Характе
ристика популяций Российской Федерации по па
нели пятнадцати локусов, используемых для ДНК
идентификации и в судебно-медицинской экспер
тизе», опубликованной в журнале «Acta Naturae».
Весь картографический анализ, представлен
ный в настоящей книге, выполнен именно с исполь
зованием GeneGeo. И в связи с ключевой ролью
картографического анализавданном исследовании
полезно описать, как основные этапы анализа реа
лизованы в этой программе.
ЭТАП 1: ПОСТРОЕНИЕ КАРТ ОТДЕЛЬНЫХ ПРИЗНАКОВ
Для построения карты отдельного признака
достаточно исходной информации о значениях это
го признака в популяциях и о географических ко
ординатах этих популяций. Кроме этой минималь
ной информации в формате файла исходных дан
ных для каждой популяции предусмотрены: ука
зание ее названия (на английском и русском язы
ках), объема выборок из них, ссылки на источни
киданных, исследователя, указавшего эту инфор
мацию, и даты указания, два столбца комментари
ев. Для всего массива данных в начале файла при
водится его «паспорт», включая анализируемый ре
гион, цель картографического анализа, исследова
телей, создавших и модифицировавших файл, даты
47
1.4. Картографический и статистический анализ
его создания и последней модификации. Для удоб
янию до них; если задать степень 2, он будет об
ства пользователей все эти исходные данные пред
ратно пропорционален квадратурасстояния; если
ставляются в виде csv файла, прекрасно совмести
степень 3 — кубу, и так далее. Понятно, что чем
больше степень, тем меньше роль более далеких
опорных точек. Поэтому из двух параметров важ
мого с Excel.
При запуске GeneGeo, прежде всего, нужно
указать картографическую основу, то есть картог
рафируемый регион в заданной картографической
нейшим является именно степень — ведь значения
в далеких точках, пусть даже и попавшие в ради
проекции, для которого на основу нанесены моря
ус, будут иметь очень небольшой вес при высоких
и суша, береговая линия, границы государств и их
провинций, главные и второстепенные реки, глав
степенях весовой функции.
ные и второстепенные озера, столицы, надписи на
исследователя о том, на каком расстоянии возмо
званий географических объектов, гидрография и
жен поток генов в изучаемом регионе и для того
прочие объекты. Пользователь может выбирать, ка
кие именно из этого широкого спектра объектов
отобразить при построении конкретной карты. Кар
масштаба времени, за который предположительно
же нужно учитывать плотность распределения
тографические основы разрабатываются отдельно,
но к настоящему времени их для GeneGeo разра
кoм мaленьким, для каких-то узлов на слабо изу
ботано уже достаточно много, чтобы проводить
ченных частях территории в радиус может не по
анализ любого региона мира, а для Северной Ев
пасть ни одной опорной точки (тогда GeneGeo ото
Радиус обычно подбирается из предположений
сформировались изучаемые закономерности. Так
опорных точек по карте — если радиус задать слиш
разии созданы отдельные основы и для многих ее
бразит в узле лишь «белое пятно», это, впрочем,
субрегионов. В данном исследовании использова
может быть полезным, если часть картографируе
ны картографические основы: «Евразия», «Евро
па», «Восточная Европа», «Кавказ», «Степная по
лена в исходных данных). Если радиус необосно
лоса Евразии» и некоторые другие.
После того, как основа выбрана, нужно загру
мого региона действительно совсем не представ
ванно мал, в него может попасть очень мало опор
зить файл с исходными данными, указать парамет
ры сетки узлов будущей карты (рекомендуется ис
ных точек, и тогда расчет по ним будет ненадеж
ным. Например, для карт мира в данном исследо
вании использован радиус в 3 тысячи километров.
пользовать заданные по умолчанию для данной
А для карт Европы — 1 тысяча. Радиус можно зада
картографической основы, иначе карту нельзя бу
вать как в километрах, так и в числе опорных то
дет анализировать совместно с другими, уже по
чек — в этом случае радиус для каждого узла будет
своим — программа будет расширять его до тех пор,
строенными на этой картографической основе) и,
самое главное, задать параметры картографирова
ния. При разных параметрах на основе одних и тех
ПОКа в НеГО Не ПОПадет ЗаданнОе ПОЛЬЗОВателем
число опорных точек.
же исходных данных получатся разные карты, по
Выбор весовой функции, как говорилось, важ
этому выбор параметров является важной и ответ
ственной задачей. К настоящему времени в
нее. При ее малых степенях значения в удаленных
точках будут «затирать» локальные флуктуации зна
GeneGeo реализован только алгоритм средневзве
чений признака: если в одной опорной точке значе
шенной интерполяции, хотя начата реализация
ния значительно ниже, чем в окрестных, и этих ок
кригинга и ряда других алгоритмов. Средневзве
рестных опорных точек много, а степень мала, тог
шенная интерполяция — использованная и в
да даже в узле, ближайшем к этой опорной точке с
GGМАС, и во многих зарубежных геногеографи
ческих работах — состоит в следующем. Значение
низким значением, может перевесить влияние ок
признака в каждом узле карты рассчитывается как
ружающихточек, итогдазначение вузле будет лишь
немного ниже, чем в окружении. При больших сте
среднее значений во всех опорных точках (т.е. изу
пенях, наоборот, карта будет повторять все флукту
ченных популяций, значения признака для кото
ации в исходных данных. Поэтому если важен ос
рых взяты из файла исходных данных), в пределах
новной тренд карты, и локальные флуктуации мало
интересуют, то малые степени полезны. Отметим,
что эти локальные флуктуации в каких-то опорных
точках могут не соответствовать реальности (напри
мер, быть следствием ошибки выборки), и в этом
заданного радиуса отрассчитываемого узла; при
этом значение в каждой опорной точке берется с
весом, обратно пропорциональном расстоянию от
нее до рассчитываемого узла, и это расстояние воз
ведено в заданную степень.
случае «затирание» такой ложной особенности со
Таким образом, для построения карты требу
седними точками полезно. Но если исследователь
ется задать, во-первых, радиус, за пределами кото
доверяет значениям в подавляющем большинстве
рого опорные точки уже не участвуют в расчетах
опорных точек и хочет получить карту, отражаю
значения признака для данного конкретного узла
сетки. Во-вторых, требуется задать степень весо
щие все особенности пространственного распреде
ления признака, следует задавать более высокие сте
вой функции: если задать степень 1, то вес опор
пени весовой функции. Основной способ выбрать
ных точек будет обратно пропорционален рассто
оптимальную степень — это построить серию карт
48
Глава 1. Создание баз данных о генофондах мира
Окно слоев
Окно создания сеточного слоя
(интерполированных значений)
Окно параметров интерполяции
".
— а
GeneGeo Еврация
не мен
ин вными менем нев
Grid from points data one feature
Layers
тринренналы
визы
.
затеерогенн
Рел тексант
*R-
— я
-
}
-
вниннга
---8
}
синаготины
-
не иментерии метод
}
-
*
-
-
охое
т.
Пирены:
тескт
*ытнемв 2011-x-24 Ru
*
",
crміртмпетент
млл
каком
*не
мль
бокт: наклонн
ях гs:
х гг.:
ххх Гёхххх
таким гих гих
ветствентеннен: навыкает заняерены
севлассичанесен
т.
темнлевот
длиновору
outputcжныне пине винчахи
"шнеименамножекменонне
стоинск нт книги готтесня втест тегебеемту
в!
Ренн
*
вам
5тоститурматикет
п.
дгде
г,
г
*мат
сірого геронинган
* орошчолом
ре"инагогатном
* сынрктицхет
- вммыимекны
охот
гыльевна-регоне Г
также теннин не
Гнаммными
Гвинциммле
мозившемии
"шелетнегрut feeыапиташке тепт пакташенат неватрерспы
ofьное
сотяталt
-
5"нт
катке
ннннннннннннни
полме
светсепт
|
ркингпа ама"ffии)
гт
1
та
Рис. 1.15. Процесс построения карты отдельного признака в GeneGeo.
Видна картографическая основа «Евразия» с нанесенными на нее изученными популяциями, показанными
красными опорными точками. В окне слоев выведен слой опорных точек и (неактивированный) регион отсече
ния, других слоев пока нет. В окне создания сеточного слоя указано имя слоя с исходными данными, выбранный
метод интерполяции, число узлов сетки карты и ряд других параметров. Также указано имя файла шкалы ин
тервалов. В окне параметров интерполяции указана степень весовой функции 4 и радиус 900 тысяч километров
(900 000 метров).
на одних и тех же данных, но сразными параметра
они непрозрачны, и поэтому в выводимое на эк
ми, проанализировать различия, повторив это по
возможности для карт других таких же исходных
ран изображение входит один сеточный слой (са
мый верхний в списке) и один или несколько сло
признаков, и оценить, при каких параметрах пост
ев с опорными точками.
роения карты лучше соответствуют целям конкрет
На рис. 1.15 приведен реальный пример, как
ного картографического исследования. Есть и ко
задаются параметры построения карты.
личественные методы оценки оптимальной степе
После этого, чтобы получить карту на рис. 1.16.
автор только щелкнул мышью по кнопке Start в
ни весовой функции, но они не учитывают всех де
талей карт. По опыту работы автора в GeneGeo,
малые степени - это 1 и 2, а более высокие — 3 и 4.
Большинство карт, представленных в данной кни
ге, построены со степенью 3.
GeneGeo отображает карту по принципу сло
ев. На картографическую основу (слой по умолча
нию) последовательно накладываются слои с опор
ными точками и сеточные слои (со значениями
признаков). Слоям можно задать степень прозрач
ности и результирующее картографическое изоб
ражение будет наложением всех слоев. На практи
ке в окне слоев обычно загружено несколько се
точных слоев, с которыми ведется работа. Но все
ОКне СОЗдания СеТОЧНОГО СЛОЯ.
Карта на рис. 1. 17 отличается только заданием
другой весовой функции (на рис. 1. 16 степень 4, а
здесь степень 1) и другим радиусом (на рис. 1.16
радиус 900 км, а здесь радиус 2 000 км). Сравни
вая карты на рис. 1. 18 и 1.19, можно наглядно убе
диться в справедливости сказанного выше о важ
ности параметров интерполяции и особенностях
карт, построенных при малых и больших степенях
весовой функции.
На рис. 1.16 показана карта отдельного призна
ка, построенная в результате выполнения проце
дур, заданных нарис. 1.15.
49
1.4. Картографический и статистический анализ
Окно слоев
«Белые пятна» - узлы за
пределами радиуса от
ближайщей опорной точки
и
-
ни чин
ин аннули
мгнон
нер
и 3, а в р т
** a
П" сегнивергатежи
*отт-чарт 2011-м ты впл
н
*
Рис. 1.16. Результат построения карты отдельного признака в GeneGeo.
Карта построена в результате выполнения процедур, заданных в примере на рис. 1.17. Видны «белые пятна» в
Африке, на крайнем северо-востоке Сибири и на юге Камчатки — узлы сетки на этих территориях находятся далее,
чем 900 км от любой из опорных изученных популяций (показанных красными точками). В окне слоев добавился
сеточный слой (слой синтерполированными значениями). Видимая карта представляет собой наложение слоя с
опорными точкам поверх сеточного слоя.
Важно отметить, что при картографическом
построения карт: пользователь один раз задает па
анализе генофондов, как правило, анализируется
раметры картографирования и указывает файл c
не один, а много генетических маркеров, и для каж
исходными данными, содержащий значения раз
ных признаков в разных столбцах csv файла, и про
грамма строит сразу все карты. Опция серийного
дого нужно построить карту. Поскольку парамет
ры картографирования для всех однотипных мар
керов в одном исследовании должны быть одина
ковыми, в GeneGeo реализован пакетный режим
построения карт в пакетном режиме многократно
ускоряет проведение картографического анализа.
ЭТАП 2: АНАЛИЗ ОТДЕЛЬНОЙ КАРТы
ЭТАП 2 — АНАЛИЗ ОТДЕЛЬНОЙ КАРТЫ
Статистические параметры, рассчитываемые
по умолчанию, выводятся в статистическом окне
Разнообразные виды анализа, которые можно
провести с картой отдельного признака, можно
сгруппировать в четыре типа:
— расчет статистических параметров карты,
легенды карты (рис. 1.16).
АНАЛИЗ В ПЛЫВУЩЕМ ОКНЕ состоит в том, что
каждый узел сетки карты поочередно становится
— анализ ее закономерностей в плывущем окне
центром окна заданного размера. Окно, таким об
— анализ корреляции с другими картами
разом, постепенно проплывает по всей карте. И
пока оно плывет, рассчитывается какой-либо ста
— статистические трансформации карт
Глава 1. Создание баз данных о генофондах мира
5()
".
не мен ин аннин минн неи
и *, *, c) : ,
GeneGeo Евразия
*=
Пригеннагогатеем
Окно
названия
синымникинит-сминианинаивыркиншило
н
н
Окно значк
опорных точек
}- окно шкалы
Окно
гистограммы
Окно
-
значении в
|}= статистических
опорных точках
-
показателеи
сеточного слоя
Окно
гистограммы
значений
сеточного слоя
| |=) —
Рис. 1.17. Значение параметров интерполяции: карта, построенная по тем же исходным данным, что и
на предыдущем рисунке, но с другими параметрами.
Карта построена при следующих параметрах картографирования степень весовой функции 1, радиус влияния
2 000 км. В результате увеличения радиуса белые пятна исчезли, распределение признака стало намного более сгла
женным, а сравнение гистограмм исходных и картографированных значений показывает, что наиболее высокие зна
чения признака исчезли с карты за счет влияния более далеких, но многочисленных узлов с низкими значениями. На
карту выведены 6 окон легенды: 1) Окно названия; 2) Окно значка, которым показаны опорные точки; 3) Окно гис
тограммы исходных значений — показано распределение значений в исходных точках по интервалам шкалы; 4) Окно
гистограммы интерполированных значений — показано распределение значений в узлах сеточного слоя по интерва
лам шкалы; 5) Окно шкалы — указаны граничные значения интервалов и цвет интервалов; 6) Статистическое окно. В
нем указаны число опорных точек, число узлов сетки карты, а также статистические параметры, рассчитанные по
значениям во всех узлах сеточного слоя — минимальное, максимальное и среднее значения, дисперсия, — коэффици
енты корреляции с широтой, долготой и коэффициент множественной корреляции с географическими координата
ми, — показатели общей гетерозиготности, средней ожидаемой внутрипопуляционной гетерозиготности и межпопу
ляционного разнообразия, при их расчете картографируемый признак рассматривается как аллель диаллельного
локуса. Поскольку в данном случае картографируется одна из гаплогрупп Y-хромосомы, интерпретация показателей
гетерозиготности затруднена, но показатель межпопуляционного разнообразия весьма информативен, особенно при
сравнении с другими гаплогруппами или другими генетическими системами.
тистический показатель по всем узлам, находящим
ся в текущий момент времени в пределах окна, и
бым, а на практике в GeneGeo предусмотрен ши
рокий спектралгебраических, статистических, три
это значение присваивается текущему центрально
гонометрических и других математических опера
му узлу плывущего окна. В результате для каждо
торов.
гоузла рассчитан показатель позначением всех его
Простейшим способом применения плывуще
го окна является усреднение всех значений, попав
окрестных узлов, попавших в окно заданного раз
мера. То есть создан новый сеточный слой, новая
ших в окно. Но и этот способ имеет большое зна
карта, содержащая уже не те значения, которые
чение — он позволяет нивелировать мелкие коле
были рассчитаны первоначально, а значения како
го-либо показателя, рассчитанные по узлам, близ
бания значений признака между соседними попу
ляциями, вычленяя и делая явным глобальный
ким к данному. Этот метод в корне отличается от
статистического метода анализа генофонда, по
скольку в его основе лежит географическое распо
тренд в их изменчивости.
ложение популяций сразными значениями.
Размер плывущего окна задается пользовате
лем, форма его может быть квадратной или круг
лой, а рассчитываемый показатель в теории лю
В плывущем окне можно вычислять и величи
нумежпопуляционного разнообразия, что являет
ся примером использования более сложного мате
матического оператора. При этом мы получаем
карту, показывающую, на каких территориях меж
популяционное разнообразие велико, а на каких
1.4. Картографический и статистический анализ
территориях все популяции генетически более или
менее похожи друг на друга. Этот подход лежит в
основе выявления и картографирования генети
ческих границ.
АНАЛИЗ КОРРЕЛЯЦИИ С ДРУГИМИ КАРТАМИ
можно провести двумя способами.
Первый способ состоит в расчете корреляций
между последовательностями значений во всех
узлах первой карты и второй карты. (Понятно, что
карты должны быть созданы на одной итой же кар
тографической основе и с одинаковым числом уз
лом сетки). При этом способе географический ас
пект сведен к минимуму, поскольку анализируют
ся по сути два статистических ряда, а географи
ческое положение членов ряда игнорируется. Ре
зультатом этого вида анализа является не новая
карта, а просто показатель корреляции между срав
ниваемыми картами.
Второй способ состоит в использовании плы
вущего окна – корреляция для каждого узла рас
считывается между значениями в окрестных узлах
51
на первой карте и в тех же узлах второй карты. Ре
зультатом является создание карты корреляций – в
каждом узле записаны значения корреляции двух
исходных карт в данной географической области.
Поразительно, что такие карты часто выявляют гео
графическую неоднородность корреляционной
связи. То, что при первом способе расчета пред
ставало, например, как слабая положительная кор
реляция, на корреляционной карте иногда выгля
дит как сильная положительная корреляция в од
ной части ареала, и нулевая или даже отрицатель
ная – в другой.
Для анализа в плывущем окне также предусмот
рен пакетный режим – пользователем один раз за
даются параметры и указывается список исходных
карт, а программа проводит анализ для всех них.
Последний тип анализа отдельной карт – ее
статистическая трансформация - состоит в приме
нении одного итого же математического операто
ра к каждому узлу. Например, можно вычесть зна
чения в узле из единицы и тем самым получить
карту альтернативного аллеля (для диаллельных
систем).
ЭТАП 3: РАСЧЕТ ОБОБЩЕННЫХ КАРТ
Как корреляционные карты построены по дан
ным двух карт исходных признаков, так обобщен
ные карты построены по данным множества исход
ных карт. Простейшим примером обобщенных карт
являются суммарные карты. Например, можно сум
мировать карты гаплогрупп C, D и OY-хромосомы
(эти гаплогруппы считаются восточноевразийски
ми) и получить карту суммарной частоты восточ
ноевразийских гаплогрупп. При построении сум
марных карт значение в данном узле первой карты
суммируется со значением в том же узле на второй
карте, со значением того же узла на третьей карте и
так далее для всех суммируемых карт. Эта процеду
ра проводится для каждого узла. Но суммарные кар
ты слишком просты и не слишком интересны. Бо
лее широко в геногеографии применяются обобщен
ные карты других типов: карты генетических рас
стояний; карты генетических границ (межпопуля
ционного разнообразия); карты главных компонент;
карты внутрипопуляционного разнообразия (гете
розиготности, гаплотипического разнообразия). Со
здание всех этих типов карт предусмотрено в
GeneGeo.
Например, специальный модуль, вызываемый
из меню Analysis, посвящен построению карт ге
нетических расстояний. При этом необходимо за
дать файл счастотами аллелей в реперной популя
ции (от которой будут рассчитываться генетичес
кие расстояния) и набор картраспространения этих
аллелей по изучаемой территории. Программарас
считает расстояния от реперной популяции для
каждого узла сетки карты и поместит эти значе
ния в соответствующие узлы. Тем самым каждый
узел, то есть каждая точка географического про
странства будет заявлять о себе, насколько попу
ляция в этой точке генетически сходна с реперной
популяцией, причем в среднем по всему набору
анализируемых аллелей.
СОЗДАНИЕ КАРТОГРАФИЧЕСКОГО ОБРАЗА
Важным направлением работы по разработке
GeneGeo является постоянное усовершенствование
графического представления создаваемых карт. На
рисунке 1.18 приведено сравнение одной и той же
карты, построенной в старом пакете GGMAG (раз
работан под руководством Е.В. Балановской и Ю.Г.
Рычкова в 1990-х годах), и той же карты, постро
енной в пакете GeneGeo. Легко заметить графичес
кие преимущества нового пакета: современный
дизайн, возможность переключения слоев карты,
гибкая цветовая шкала, отображение рельефа от
мывкой, интуитивный интерфейс и т.д.
Как из одних и те же исходных данных при раз
ных параметрах интерполяции получаются разные
сеточные слои (карты в виде матриц), таки из одно
го итого же сеточного слоя при разных параметрах
визуализации получаются разные картографические
изображения (карты в обычном понимании).
52
Глава 1. Создание баз данных о генофондах мира
ШКАЛА. Важнейшим параметром визуализации
является шкала интервалов. Ведь узлы сеточного
слоя отображаются на карте точками разного цве
та в зависимости от величины значения в узле.
Шкала как раз и задает, какой интервал значений
отображается каким цветом. В книге (Балановская,
Балановский, 2007) мы уже описывали, какими
должны, и главное, какими не должны быть шка
лы, чтобы полученный картографический образ пе
редавал объективную информацию, а не попытки
географически специфичны. Большинство из них
распространены только в каком-то одном регионе
мира, а на большей части планеты отсутствуют или
встречаются лишь спорадически (частота ниже
1%). Поэтому на картах в этой шкале почти весь
мир предстает в серых тонах отсутствия гаплог
руппы. И на этом фоне ярко проявляется не серым,
а цветным ареалом, тот регион, где гаплогруппа
распространена, пусть и с невысокими частотами.
составителя карты навязать читателю свои апри
СОСТАВЛЯЮЩИЕ КАРТОГРАФИЧЕСКОГО ОБ
орные представления о географии признака. Что
РАЗА. Кроме выбора шкалы, при создании картог
бы не повторяться, укажем лишь, что составителю
мерными шкалами, а читателю карты — доверять
рафического изображения также можно:
— выбрать выводимые на карту географические
объекты из числа предусмотренных картографи
лишь тем чертам карт, которые основаны на раз
ческой основой;
личиях хотя бы в два интервала шкалы, и не счи
тать действительно различающимися территории,
ных популяций:
карты можно рекомендовать пользоваться равно
— задать цвет, размер и форму значков изучен
лы. Пример важности шкалы можно видеть в на
— пользуясь файлами такого же формата, как
файл опорных точек, вывести любые другие знач
шей недавней работе (Ваlanovsky et al., 2015) где
ки-обозначения:
мы сначала привели карту в неравномерной шка
ле, подчеркивающей то, что для нас было всего
— выбрать язык надписей карты (английский
или русский);
важнее (повышенные частоты приурочены к
древнему ареалу ираноязычных популяций), но
сетки:
потом для объективности привели ту же карту и
в нашей стандартной шкале, которая первона
— выбрать отображения интервалов изолиния
ми, заливкой, или и тем, и другим;
чально создает несколько иное впечатление, и
— задать шрифты и ввести сами тексты надпи
значения в которых попадают в соседние интерва
— задать частоту следования линий градусной
лишь при внимательном рассмотрении в ней про
сей в заголовке карты и в шкале интервалов;
является указанная выше закономерность, хотя
— настроить отображение географического ре
льефа (рельеф отображается современным спосо
и видно, что она не является единственно воз
можной интерпретацией карты.
бом аналитической отмывки — как бы тени, пада
ющие от гор — при этом можно задавать угол паде
УНИВЕРСАЛЬНАЯ ШКАЛА. Большинство карт,
представленных в этой книге, построены в «уни
версальной» шкале, разработанной автором для
картографирования гаплогрупп мтДНК и Y-хромо
сомы. Эта шкала (см., например, рис. 16 и 17) со
стоит из трех равномерных отрезков: от 1% до 5%
интервалы идут с шагом 2%, от 5% до 60% интер
валы идут с шагом 5%, а от 60% до 100% интерва
лы идут с шагом 10%. Это позволяет сохранить
традиционный шаг в 5% на основной части воз
ния света и интенсивность отображения рельефа):
— выбрать выводимые окна легенды и задать
места их размещения;
— и еще многое другое.
В целом, GeneGeo является прекрасным инст
рументом не только для построения геногеографи
ческих карт и не только для их разностороннего
анализа, но и для их отображения в виде вырази
тельных, наглядных, радостных образов. А еще
можного диапазона варьирования, при этом выде
программа очень удобна в работе, множеством спо
собов экономит время и безотказна — настоящий
лить более подробно закономерности в части низ
друг геногеографа.
ких частот (большинство миграций приносят не
слишком большой процент новой гаплогруппы), но
КАРТОГРАФИЧЕСКАЯ БАЗА ДАННЫХ. В связи с
менее подробно показать различия между сверх
тем, что созданные карты исчисляются многими
высокими частотами (потому что редко когда име
сотнями, и с тем интересом, который они (судя по
запросам от специалистов) представляют как для
ет значение, составляет частота в какой-то попу
ляции 82% или 88% — и то и другое значение слиш
ком велики и оба являются редкостью). Частота
ниже 1% в универсальной шкале отображается
нейтральным серым цветом, выбивающимся из
разноцветной (от темно-зеленых через зеленые и
желтые к красноватым и бордовым тонам) цвето
вой гаммы остальной части шкалы. Это сделано
потому, что гаплогруппы мтДНК и Y-хромосомы
коллег-генетиков, так и для специалистов смежных
гуманитарных дисциплин, под руководством авто
ра создана общедоступная онлайн-версия картог
рафической базы данных, а точнее, базы карт
Эта базарешает как задачу публикацию создан
ных карт на сайте, так и задачу легкого поиска, про
смотра и скачивания необходимой карты. Базадан
ных доступна на разрабатываемом нашим коллек
53
1.4. Картографический и статистический анализ
} } } }} }} } }| }}|11 || ? |||||}||}||}| } | | | } } } } } } } } } }} | | | [1] [$
22-
29"
з.а. D" в.д.
}д"
22°
39"
4]"
57"
at:"
*
-«б
9:
i"
*
н
*}.
* , :
*
*
г. м.
*
.--
*
3
*
:
*
" " ",
}
*
-
*
*
"
*
.
|
|
рт
*
.
*
*
й
— в х.
Сепеево
File view
и
Grid дnalysis
Window Help
8 8 G } *
.2
Е U R О РЕ
На p l o type diversity
".
-
\e
& *
S"
*
Сл о еu middт
-
}
ё:
.
-
Нарkalype diversity
ещ mariv dml
с фец_lakedты
Сл о еu boundame: dm
*
ё:
"
hishading
СаННароypediversity
-
Сл о Europe-cppro egion
Ба’oeu-sea dт
Gridfie
Нарсуре diversity
ры
СТЕМFiacea3052\hapoype diversypog
Level
Lие
Lab,
е)
Repretentalion mode
Г contous с Image
}
м F|
wley,
Effect:
w Intepolate pxel:
Гнlshadro
-
ГSmooth corмол:
—
v Cipping
|Europe. Срpngregion
-
гshowlepend opion
сё
-
Рис. 1.18. Сравнение графических возможностей отечественного пакета GGМАG (вверху) и пакета
GeneGeo, разработанного под руководством автора (внизу).
На обеих картах отображена одна и та же исходная информация.
Глава 1. Создание баз данных о генофондах мира
54
тип:
ДНК маркеры
Пошск
Класс:
выберите регион Евразия
гаплогруппы мтДнк
м.
Признак:
лновой
искать
Поиск по названию
*
2 следующая
гг
тип
класс
Признак
регион
днкмаркеры
гаплогруппы мтДнк
западно-евразийские
гаплогруппы (суммарно)
Евразия
Днкмаркеры
гаплогруппы и днк
2
Евразия
Днк маркеры
гаплогруппым днк
x
Евразия
Днкмаркеры
гаплогруппы мтДнк
w
Евразия
днкмаркеры
гаплогруппым днк
м
Евразия
Карта распространения гаплогруппы U5b
итднк в коренном населении Евразии
ДНК маркеры
гаплогруппы мтДнк
ш5t
Евразия
карта распространения гаплогруппы U5a
ДНК маркеры
гаплогруппы мтлнк
оба
Евразия
Название
но-евразийских гаплогрупп
т
нина
мн
п
пп
нии
карта распространения гаплогруппы у
итднк в коренном населении Евразии
Рис. 1.19. Интерфейс системы фильтрации картографической базы данных (www.genofond.ru).
тивом сайте www.genofond.ru в разделе «Атласы».
Интерфейс базы данных позволяет осуществлять
жен одновременный поиск по группе признаков.
поиск нужных карт одновременно в двух направ
пользователю выбрать, карту какого регионатре
Поиск (фильтрация) по региону позволяет
лениях — по типу картографируемого признака и
буется найти (весь мир, Евразия, Европа, степная
по региону, для которого создана карта.
полоса Евразии и т.д.).
По завершении поиска пользователю выводит
ся список найденных карт с их уменьшенными
изображениями. При щелчке мышью по любой из
карт отображается ее увеличенное изображение
с сопровождающей информацией по карте. При
мер работы системы фильтрации приведен на
рисунке 1.19.
Поиск (фильтрация) по признаку позволяет пос
ледовательно выбрать тип признака (например,
ДНК-маркеры), класс признака (например, митохон
дриальная ДНК) и собственно признак (например,
конкретные гаплогруппы мтДНК). Пользователь
может остановиться на любом уровне общности
признаков, не указывая подробно признак, возмо
МЕТОДЫ СТАТИСТИЧЕСКОГО АНАЛИЗА
РАСЧЕТ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
По таблицам частот гаплогрупп рассчитыва
лись генетические расстояния по Нею (Nei, 1975)
с использованием разработанной нашим коллекти
вом программы DJgenetic (Ваlanovsky et al., 2008).
Полученные матрицы расстояний использовались
четырьмя способами:
гомерному шкалированию, использовался и клас
терный анализ. Дендрограммы строили в програм
ме Statistica 6.0 (StatSoft. Inc, 2001) с применением
метода Уорда (Ward's method):
3) по матрицам генетических расстояний рас
считывались средние попарные расстояния в груп
1) визуализировались методами многомерного
шкалирования с помощью программы Statistica 6.0
пе популяций для характеристики межпопуляци
онного разнообразия внутри этой группы:
4) В тех случаях, когда расстояния между кон
кретными популяциями представляли особый ин
(StatSoft. Inc, 2001):
терес, рассматривались и эти значения в отдель
2) в ряде случаев для целей визуализации мат
риц генетических расстояний, вдополнение к мно
ных ячейках большой матрицы «все популяции от
ВСeX)).
55
1.4. Картографический и статистический анализ
АНАЛИЗ ГЛАВНЫХ КОМПОНЕНТ ДЛЯ ЧАСТОТ
ГАПЛОГРУПП
безно предоставлены член-корр. РАН А.В. Дыбо и
проф. О.А. Мудраком.
Частоты гаплогрупп использовались не только
для расчета генетических расстояний, но и для рас
РАСЧЕТ ГЕОГРАФИЧЕСКИХ РАССТОЯНИЙ
чета главных компонент АМОVА и ряда других
методов. Анализ главных компонент проводился в
той же программе Statistica 6.0, а для совмещения
на одном графике расположения и популяций, и
гаплогрупп (по факторным нагрузкам на главные
компоненты) использовали программу SPSS.
Необходимые для последних двух видована
лиза географические расстояния рассчитывались
по географическим координатам популяций (табл.
1, 2) в разработанной нашим коллективом програм
мe DistGeo (www.genofond.ru).
АНАЛИЗ ГЕНЕТИЧЕСКИХ ГРАНИЦ (WОМВLING)
МЕТОДАМОУА ДЛЯ ОЦЕНКИ ГЕТЕРОГЕННОСТИ
служили частоты гаплогрупп, и для анализа исполь
Выявление генетических границ на географи
ческой карте (зоны резких изменений частот гап
логрупп) проводили как статистическими, так и
картографическими методами. Статистический
способ реализован в программе Вarrier 2.2 (Маnni
and Guerard, 2004), а картографический описан в
зовали программу Аrlequin 3.11 (Schneider и др.,
соответствующем разделе.
Параллельно с этими методами, нацеленными
на визуализацию данных, проводилсся анализ
иерархической изменчивости (АМОVА) с целью
выявить наиболее гетерогенные и наиболее гомо
генные группы популяций. Исходным материалом
2000). Расчет межпопуляционного разнообразия
АНАЛИЗ ШИРОКОГЕНОМНЫХ ДАННЫХ
проводили на разных иерархических уровнях изу
ченных популяций. Определялась генетическая ге
терогенность как отдельных этносов (различия по
Исследования обширных панелей, включаю
частотам гаплогрупп локальных популяций в пре
щих сотни тысяч SNP-маркеров — полногеномные,
аточнее, широкогеномные (genome-wide) марке
делах этносов), так и лингвистических групп (раз
ры, проводятся как методами анализа частоталле
личия по частотам гаплогрупп популяций, относя
щихся к различным ветвям лингвистических групп).
лей, так и методами анализа гаплотипов. Эти мар
керы в подавляющем большинстве аутосомные (а
немногие присутствующие X-хромосомные и Y
Gsт И ГЕНЕТИЧЕСКИЕ РАССТОЯНИЯ ДЛЯ ОЦЕНКИ
гетерогенности
хромосомные маркеры исключаются из анализа)
и, хотя они являются рекомбинирующими, но на
Гетерогенность этносов и их групп на разных
иерархических уровнях также оценивалась и дву
близких расстояниях нахромосоме гаплотипы (со
четания SNP-маркеров) не успевают разбиваться
мянуты выше как третий способ использования
рекомбинацией за исторические промежутки вре
мени, а число разбиений может даже использовать
ся для оценки времени. В связи с очень большим
матрицрасстояний) и через расчет Gет в оригиналь
числом маркеров тот же анализ главных компонент
ной программе МЕGERА (мера генетического раз
нообразия).
проводится в специально разработанных програм
мя другими методами — как средние попарные ге
нетические расстояния между популяциями (упо
мах, в нашем случае РLINК (Рurcell et al., 2007).
Из методов анализа гаплотипов в нашем исследо
МЕТОДАМОУА ДЛЯ ОЦЕНКИ ЭФФЕКТИВНОСТИ
вании использован ПВD анализ — выявление в раз
КЛАССИФИКАЦИЙ
ных популяциях гаплотипов, идентичных по про
исхождению, и подсчет их доли как показателя
Метод АМОVА также использовался для срав
нительного анализа эффективности генетической,
географической и лингвистической классификаций
популяций в определении сходства генофондов.
родства популяций. Эти методы подробнее описа
ны в тех разделах, где они применяются.
РАСЧЕТ ГАПЛОТИПИЧЕСКОГО РАЗНООБРАЗИЯ
мтДНК
ТЕСТ МАНТЕЛЯ ДЛЯ ОЦЕНКИ ЭФФЕКТИВНОСТИ
КЛАССИФИКАЦИЙ
В программе Аrlequin 3. 11 выполнялся тест
Мантеля для оценки общих и частных коэффици
ентов корреляций между матрицами генетических,
географических и лингвистических расстояний.
Простейшим показателем, рассчитываемым по
данным об отдельных гаплотипах мтДНК и Y-хро
мосомы, является их разнообразие. Гаплотипичес
кое разнообразие рассчитывали как дополнение до
единицы суммы квадратов частот всех гаплотипов,
Матрицы лингвистических расстояний, получен
встреченных в популяции, такой расчет легко про
ные по стословному списку М. Сводеша (Swadesh,
вести даже в Еxcel. Например, если в популяции
обнаружен только один гаплотип (все обследован
ные члены популяции одинаковы по мтДНК) — по
1955) с исключением заимствованных слов по ме
тоду С.А. Старостина|Старостин, 1989), были лю
Глава 1. Создание баз данных о генофондах мира
56
казатель выявленного гаплотипического разнооб
разия равен нулю; если все обследованные разли
чаются по мтДНК (ни один из гаплотипов не встре
чен дважды) – показатель гаплотипического раз
нообразия составляет единицу. Можно видеть, что
этот показатель, рассчитываемый для гаплоидных
систем, идентичен гетерозиготности, рассчитыва
емой для обычных диплоидных маркеров. Ведь
квадрат частоты гаплотипа (аллеля) – это частота
гомозигот, сумма таких квадратов для всех алле
лей – гомозиготность (доля гомозигот), а величи
на, дополняющая ее до единицы – и есть доля ге
терозигот, то есть гетерозиготность популяции. Ту
же мысль можно выразить и иначе: гаплотипичес
кое разнообразие оценивает вероятность того, что
два случайно выбранных из популяции гаплотипа
окажутся разными. Но ведь и гетерозиготность
оценивает то же самое: какова вероятность, что два
аллеля из популяции, объединившиеся в одной
зиготе, будут разными. Подчеркнем, что при рас
чете гаплотипического разнообразия не учитыва
ется степень родства гаплотипов друг с другом, зато
все прочие методы их анализа основаны как раз на
этом родстве.
1.5. ДИСКУССИИ О ДАТИРОВКАХ
Всеобщая грамотность, открывшая людям
доступ к научным текстам, создает иллюзии,
что чтение равнозначно пониманию.
В.А. Шнирельман
В возможности датировок миграций и других
событий истории популяций заключается важное
преимущество нерекомбинирующих («однороди
тельских») генетических систем передаутосомны
ми (рекомбинирующими) генетическими система
ми. В тоже время получение надежных датировок
является большой проблемой, ставшей предметом
многих числа научных, околонаучных и даже лже
научных дискуссий. Поэтому на этом вопросе сто
итостановиться подробнее.
Предположим, мы обнаружили монофилетич
ный кластер гаплотипов. Раз он «монофилетич
ный», то по определению представляет одну ли
нию происхождения, значит все гаплотипы клас
тера произошли от одного исходного гаплотипа.
И предположим, что мы знаем, от какого именно
гаплотипа. С ходом времени в результате мута
ций в пределах кластера будут возникать все но
вые дочерние гаплотипы (отличающиеся на один
мутационный шаг), а от них, в свою очередь, бу
дут возникать внучатые гаплотипы (отличающие
cя на два шага) и так далее. И чем больше прой
дет времени, чем больше новых гаплотипов воз
никнет, тем на большее число мутационных ша
гов они будут отличаться от исходного, то есть
тем более разнообразные гаплотипы мы выявим
в этом кластере. Следовательно, верно и обрат
ное: чем большее разнообразие гаплотипов мы
видим в пределах кластера, тем дольше он суще
ствует. То есть по разнообразию гаплотипов в пре
делах кластера мы можем судить о возрасте этого
кластера. Эталогика проиллюстрирована на рис.
1.20. По сути, это и есть принцип молекулярных
часов, где время отсчитывается происходящими
мутациями. Если скорость мутаций постоянна, то
часы будут работать. Обо всем этом спора нет
(оговорки, которые мы делали по ходу, говоря
«предположим» и «если», разобраны в конце это
го подраздела). Но споры начинаются, когда при
ходится решать, как именно подсчитывать разно
образие гаплотипов и как именно переводить его
в годы.
МЕТОДЫ ФИЛОГЕНЕТИЧЕСКОГО АНАЛИЗА
ПОСТРОЕНИЕ ФИЛОГЕНЕТИЧЕСКИХ СЕТЕЙ
Родство рассматриваемых гаплотипов принято
отображать в виде филогенетического дерева. А ког
да однозначное дерево реконструировать не удает
ся, и остаются равновероятные возможности, что
превращение одного гаплотипа в другой шло тем
или иным путем, то это отображается как слияние
нескольких ветвей, то есть дерево превращается в
сеть. Методология построения и анализа филоге
нетических сетей была хорошо разработана в по
пуляционной генетике в 90е годы прошлого века.
Филогенетические сети были построены в програм
ме Network 4.1.1.2 (Fluxus TechnologY-Ltd.)
(www.fluxus-engineering.com) на основе алгоритма
reduced median с порогом редукции, равным 1. По
лученные графики затем редактировались и снаб
жались легендами в программе Network Publisher
(Fluxus Engineering, Clare, U.K.). Построение фило
генетических сетей мы проводили и по гаплотипам
мтДНК, и по STR гаплотипам Y-хромосомы.
ВЫЯВЛЕНИЕ КЛАСТЕРОВ ГАПЛОТИПОВ
На большинстве филогенетических сетей об
наруживается ряд более или менее компактных кла
57
1.5. Дискуссии о датировках
Б
А
о
*
} :
Рис. 1.20. Молекулярные часы: нарастание дерева гаплотипов.
Показан постепенный рост дерева гаплотипов: возникновение новых гаплотипов в результате мутаций:
А. Один исходный гаплотип (встречен у многих образцов, поэтому большой кружок) и один производный
(только у одного образца, маленький кружок). Б. Возник уже целый ряд производных гаплотипов. В. Из «дочер
них» гаплотипов начали возникать уже «внучатые», а частота исходного гаплотипа уже почти не отличается от
любого из производных. Г. Дерево приобрело сложную структуру, и уже нельзя однозначно понять, какой именно
гаплотип был исходным.
стеров гаплотипов, выявление и датировка време
словами, кластерами считались только строго мо
ни их происхождения стало важным аспектом мно
нофилетические ветви на реконструированной
гих современных исследований Y-хромосомы
сети).
(Zhivotovsky et al., 2004; Rootsi et al., 2007; Derenko
et al., 2007; Нaber et al., 2010 и многие другие рабо
2) Этот узловой гаплотип рассматривался в ка
честве предкового гаплотипа-основателя (founder)
ты). При этом нет алгоритма, автоматически выяв
для своего кластера. Выбор гаплотипа-основателя
ляющего кластеры гаплотипов на сети, и опреде
важен при расчете возрастас использованием по
ление числа и границ кластеров оставляется на ус
Ка3aТеЛЯ С.
мотрение исследователя. Таким образом, проведе
ние этой процедуры неизбежно оказывается до не
которой степени произвольным. Поэтому, чтобы
3) Рассматривались только кластеры, содержа
щие 10 или более образцов, чтобы избежать оши
бок в расчете возраста из-за малых объемов выбо
минимизировать эту произвольность, при выявле
рок.
нии кластеров мы применяли следующие форма
лизованные правила.
1) Поскольку большинство филогенетических
сетей имеют четко выделяющуюся центральную
4) В качестве популяционно-специфичных
кластеров рассматривались только те группы
гаплотипов, специфичность которых для данной
популяции или группы популяций была ВЫШе
зону (вероятный корень, от которого происходит
гаплогруппа), мы считали кластерами только те
фичном кластере суммарная доля образцов из
группы гаплотипов, которые связаны с этим кор
всех других популяций не может составлять
нем через один и тот же узловой гаплотип (иными
более 20%.
80%. Это означает, что в популяционно-специ
ДАТИРОВКИ ПО ГАПЛОТИПАМ
РАСЧЕТ ИЛИ МОДЕЛИРОВАНИЕ?
Все предложенные методы можно поделить на
методы расчета и методы моделирования.
Из методов моделирования в нашем исследо
вании использованы только ВАТWING (как один
из способов датировки кластеров на Кавказе, раз
дел 7.3) и ВЕАSТ (как один из методов датирова
ния ветвей филогенетического дерева, полученно
го по полным сиквенсам Y-хромосомы, раздел 74).
ВАТWING кратко описан ниже в этом разделе, па
раметры применения ВЕАSТ — в разделе 7.4. По
скольку методы моделирования используются реже
и бурных дискуссий не вызывают, в этом разделе
58
Глава 1. Создание баз данных о генофондах мира
МЫ
будем
говорить не о них, а только о методах
расчета.
со скоростью мутирования: для STR гаплотипов
Y-хромосомы (на которых в основном и рассчиты
вался возраст гаплогрупп до начала массового пол
ТРИ СОСТАВНЫХ ЧАСТИ РАСЧЕТА ВОЗРАСТА
Расчет возраста кластера очень прост: надо
накопленное разнообразие поделить на скорость
возникновения мутаций и умножить на длину по
коления. Например, если разнообразие у нас оце
нивается в 40 условных единиц, а скорость му
таций 2 единицы за поколение, то понятно, что
это разнообразие накопилось за 20 поколений.
А если новые поколения людей нарождаются, до
пустим, каждые 25 лет, то возраст кластера бу
дет 500 лет (40/2)*25=500. Но такая теоретичес
ного секвенирования Y-хромосомы в 2013 году)
были предложены две скорости: «эволюционная»
и «генеалогическая», и они различались в три раза!
Рассмотрим эти три составные части последова
тельно, начав с методов.
МЕТОД ДАТИРОВКИ С ПОМОЩЬЮ ПОКАЗАТЕЛЯ с.
кая простота наталкивается на практические
Этот классический метод (Forster et al., 1996)
основан на подсчете среднего числамутаций, на
копившихся в пределах кластера (это число и обо
значается с). Для этого метода необходимо иметь
филогенетическое дерево, показывающее проис
сложности: как количественно выразить разно
хождение всех гаплотипов кластера друг от друга.
образие, какова скорость мутирования, какова
длина поколения?
Сдлиной поколения все относительно понят
Также необходимо знать, какой из гаплотипов яв
ляется исходным (гаплотип-основатель — founder
haplotype), т.е. первый гаплотип, из которого про
изошли все остальные. Расчет прост: поочередно
рассматривается каждый гаплотип, для гаплотипа
но — ее оценки определяются в демографических
исследованиях популяций, а оценки, применяемые
для анализа Y-хромосомы, варьируют не слишком
сильно, от 25 до 33 лет. Сметодами чуть сложнее:
в научной литературе наиболее широко использу
ются два метода — показатели с и АSD, а в генети
ческой генеалогии иногда используется и метод
расчета по доле исходного гаплотипа. Хуже всего
p — это среднее число
мутаций
определяется число мутационных шагов, отделя
ющих его от исходного гаплотипа-основателя, и
если такой гаплотип встречен более чем у одного
образца, то это число умножается на число образ
цов. Когда такой расчет проведен для каждого гап
лотипа, полученные величины суммируются и де
от
исходного гаПлотипа до всех
встреченных гаплотипов
N — число
образцов
С ДанныLМ
Гаплотипом
L — длина
ветви, т.е. число
мутационных шагов отданного
гаплотипа до исходного
p= (2 nL) / N
г.
p = (6*1 + 1*2+3*2 + 9°о) / 20 = 0.7
Рис. 1.21. Расчет возраста кластера гаплотипов с помощью показателя с.
Показано деревородства гаплотипов: один исходный (большой кружок, встречен у 9 образцов) и 10 производ
ных гаплотипов, из них девять гаплотипов встречены только у одного образца каждый, а десятый гаплотип встре
чен у двух образцов. Для гаплотипа, выделенного зеленым, подписаны показатели n (встречен у одного образца) и
L (отстоит от исходного гаплотипа на два мутационных шага).
Проведен расчет показателя c — cуммировано число образцов в гаплотипах, умноженное на число шагов от
данного гаплотипа до исходного: шесть гаплотипов отстоят на один шаги представлены одним образцом каждый
(6°1), один гаплотип отстоит на один шаг и представлен двумя образцами (1*2), три гаплотипа представлены
одним образцом и отстоят на два шага (3°2), исходный гаплотип представлен 9 образцами и отстоит сам от себя на
ноль шагов. Величина с в данном примере составляет
07.
59
1.5. Дискуссии о датировках
лятся на общее число образцов. Можно видеть, что
Его достоинством является то, что дерево фи
по сути подсчитывается число мутационных ша
логенетических отношений гаплотипов — которое
гов, на которое изученные образцы в среднем от
стоят от исходного гаплотипа. Пример примене
ния этого метода показан на рис. 1.21. Для про
знать не требуется. Но тем же достоинством об
стых филогенетических деревьев расчет легко про
щественным — МетОда ДОЛИ ИСХОДНОГО ГаПЛОТИПа
водится вручную, но он также автоматизирован в
является то, что он применим только для самых
на практике нелегко реконструировать надежно —
ладает и метод АSD. Недостатком — и весьма су
программе Network. В работе (Saillard et al., 2000)
простых филогенетических схем, лишь для самых
описана возможность расчета статистической
ошибки показателя с, а возможные погрешности
начальных этапов истории новой гаплогруппы. На
пример, в примерах на рис. 1.20 этот метод был бы
обсуждаются в [Сох, 2008).
ДАТИРОВКИ С ПОМОЩЬЮ ПОКАЗАТЕЛЯ АSD
Для использования этого второго метода нетре
буется знать ни гаплотип-основатель, ни схему воз
применим только в случаях А и Б, а уже в случае В
погрешность при его применении становилась бы
огромной: ведь стоит в выборке случайно оказать
ся не двум, а трем или одному образцам с исход
ным гаплотипом, и его доля изменится в полтора
два раза, а значит, кардинально изменится и оцен
никновения из него остальных гаплотипов. Метод
состоит в определении средних квадратичных раз
личий (average squared difference—ASD) между STR
гаплотипами (Sengupta et al., 2006). То есть вновь
как бы рассчитывается среднее расстояние от ис
ходного гаплотипа до каждого гаплотипа в выбор
ке, но за исходный гаплотип по каждому STR-мар
керу берется не предполагаемый гаплотип-основа
ка возраста. От этого недостатка свободны и ме
тод расчета АSD, и метод расчета с.
О двух достоинствах метода АSD уже сказано
выше. Недостатком его является чрезмерная упро
щенность модели: ведь «среднестатистический»
гаплотип вовсе не обязательно является предковым,
и, главное, усреднение значений по всем локусам
как бы игнорирует, что в действительности они не
тель, а принимается средневзвешенное значение
являются независимыми и существуют лишь в пол
этого STR-маркера во всех изученных образцах. На
ном сцеплении друг с другом в виде конкретных
копленное разнообразие оценивается также иначе
— по дисперсии значений в разных образцах вокруг
этого среднего. Проводится расчет отдельно для
каждого STR-маркера, а затем результаты по всем
маркерам усредняются. Этот расчет несложно про
вести вручную, а удобнее всего — просто в Еxcel.
ГаПЛОТИПОВ.
Поэтому наиболее обоснованным является по
казатель с. Но и он не свободен от недостатков.
Ведь для его использования требуется — не всегда
известное — древородства гаплотипов.
Резюмируем: когда деревородства гаплотипов
реконструировано надежно, оптимален метод с, в
ДАТИРОВКИ ПО ДОЛЕ ИСХОДНОГО ГАПЛОТИПА
противном случае целесообразно применить АSD,
Этот методтребуеттолько знаниятого, кaкой гап
лотип является исходным. Определяется его часто
а расчет по доле исходного гаплотипа не оптима
лен ни в каком случае.
та, и из нее рассчитывается прошедшее время: чем
СКОРОСТЬ МУТИРОВАНИЯ
больше прошло времени, тем меньше становится эта
частота, поскольку исходный гаплотип постепенно
мутирует в производные. Убывание доли исходного
гаплотипа описывается логарифмической формулой,
используемой во многих областях науки: например,
дляхарактеристикирадиоактивногораспада (доляне
распавшихся ядер убывает со временем) или для ха
рактеристики словарного состава (доля не заместив
шихся слов из списка Сводеша убывает со временем
потому же закону). Этот метод используется только
в генетической генеалогии и в ДНК-генеалогии и не
был опубликован в признанных научных журналах.
Поэтому я затрудняюсь привести точную ссылку —
но среди пользователей метода общепринято считать,
Для определения скорости мутирования любых
участков генома возможны два подхода: прямой
подсчет и калибровка.
Первый подход — прямой подсчет — состоит в
сравнении генотипов родителей и их потомства.
Хотя мутации случаются редко, но при больших
выборках можно обнаружить достаточное их ко
личество. Частота встречаемости мутантных алле
лей в поколении потомков по сравнению споколе
нием родителей и будет скоростью возникновения
мутаций. Такие исследования для STR-маркеров
Y-хромосомы были проведены неоднократно — в
основном благодаря тому, что STR-маркеры Y-хро
что он был разработан Дмитрием Адамовым и Ана
мосомы часто генотипируются при определении
толием Клесовым.
отцовства. В результате таких определений накап
ливаются многие сотни случаев, когда отцовство
СРАВНЕНИЕ МЕТОДОВ РАСЧЕТА
Ранжируя методы от простого к сложному, нач
НеМ С ДОЛИ ИСХОДНОГО ГаПЛОТИПа.
несомненно подтверждается (в том числе по дру
гим маркерам), а значит, имеются генотипы отцов
и сыновей, и можно определить, как часто в них
Глава 1. Создание баз данных о генофондах мира
60
происходили мутации. Таких исследований было
проведено немало [Gusmao et al., 2005; Sánchez
Diz et al., 2008; Ge et al., 2009], каждый раз на все
больших объемах выборок. Результаты всех этих
работ совпали, что является важнейшим подтвер
ждением корректности этой оценки частоты мута
ций. Средняя скорость мутирования изученных
STR-маркеров (обычно использовался 17-ти мар
керный набор Y-filer) составляет 2.1*10-3 на локус
за поколение. То есть для среднестатистического
STR-маркера вероятность смутировать при пере
даче от отца к сыну составляет 0,0021 – примерно
двадцать один шанс из десяти тысяч. Поскольку
эта скорость мутирования определена при прямом
подсчете числамутаций в известных родословных,
она получила название «генеалогической».
Второй подход – калибровка – состоит в оп
ределении разнообразия гаплотипов, накопленно
го популяцией за время ее существования. Для
этого нужно изучить популяцию, для которой из
вестно время ее «основания», и найти в ней клас
теры гаплотипов, возникшие за все время суще
ствования популяции и роста ее численности от
небольшого числа основателей до современной
численности. Понятно, что этот подход намного
сложнее, и у него больше потенциальных источ
ников погрешности. В то же время подход калиб
ровок является общепринятым в науке – доста
точно привести пример калибровок в радиоугле
родном методе датирования. При этом определя
ется доля распавшихся атомов для образца с из
вестным возрастом и отсюда вычисляется, с ка
кой скоростью распадаются атомы. И эта скорость
потом применяется для расчета возраста других
образцов, для которых тоже определена доля рас
павшихся атомов, но возраст неизвестен. Ско
рость мутирования STR-маркеров Y-хромосомы
была определена в работе [Zhivotovsky et al., 2004]
на двух примерах. Ими послужили кластеры гап
лотипов, накопленные в популяции маори, сфор
мировавшейся в результате миграции полинезий
цев надотоле необитаемую Новую Зеландию не
позднее 800 лет назад, и в популяции цыган Бол
гарии, сформировавшихся в результате историчес
кидатированной миграции предков цыган из Ин
дии и их разделения на эндогамные группы внут
ри Европы около 900–1000 лет назад. К сожале
нию, других работ по калибровке скорости мути
рования Y-STR маркеров не было проведено, по
этому отсутствуют независимые подтверждения
(как, впрочем, и опровержения) этой скорости.
При оценке этим методом для среднестатистичес
кого STR-маркера вероятность смутировать при
передаче от отца к сыну составляет 0,0007 – при
мерно семь шансов из десятитысяч. Эта скорость
получила название «эволюционной», поскольку
определена для эволюционирующей популяции.
Как видим, «эволюционная» и «генеалогичес
кая» скорости различаются в три раза (!) – семь
шансов или двадцать один шанс из десяти тысяч.
Поэтому и возраст гаплогрупп, рассчитанный при
использовании той или иной скорости, будет раз
личаться в три раза. Научные дискуссии по этой
проблеме описаны чуть ниже.
ДЛИНА ПОКОЛЕНИЯ
Для перехода от датировок в числе поколений к
датировкам в годах требуется задать длину поколе
ния. В данном исследовании во всех методах нам
пришлось пользоваться двумя разными величинами
длины поколения для двух мутационных скоростей.
При использовании эволюционной скорости
мутирования, длина поколения принималась рав
ной 25 лет, поскольку эволюционная скорость была
первоначально определена в годах и пересчитана
в поколения при использовании именно такой дли
ны поколения [Zhivotovsky et al., 2004].
При использовании генеалогической скорости
мутирования, длина поколения принималась рав
ной 30 годам, поскольку данная величина пример
но соответствует длине поколения для мужчин,
определенной в демографических исследованиях
[Fenner, 2005], и та же величина была определена
для кавказских популяций при их генетико-демог
рафическом исследовании [Почешхова, 2008].
ДАТИРОВКИ ПО ПОЛНЫМ СИКВЕНСАМ Y-ХРОМОСОМЫ
В самые последние годы в изучении Y-хромо
сомы произошла «полногеномная революция» –
стали стремительно накапливаться данные не по
нескольким десяткам STR-маркеров, а по несколь
ким миллионам позиций на Y-хромосоме, каждая
из которых представляет собой потенциальный
SNP-маркер. И хотя скорость мутирования SNP
маркеров намного меньше, чем STR, но за счет их
огромного числа теперь каждый секвенированный
образец характеризуется своим собственным на
бором из встреченных только у него SNP-марке
ров, и каждая ветвь на дереве тоже несет несколь
ко специфичных для нее маркеров. Тем самым ре
шается проблема неоднозначной реконструкции
дерева – дерево теперь обычно реконструируется
однозначно. Предковый гаплотип тоже четко оп
ределяется по дереву. То есть снимаются основные
проблемы, свойственные применению ρ-показате
ля. Метод расчета возраста гаплогрупп по полно
геномным данным столь прозрачен, что обычно
даже не обсуждается, но по сути это именноρ –
среднее число мутаций от предкового узла-гапло
61
1.5. Дискуссии о датировках
типа до гаплотипов-потомков служит мерой воз
нуклеотида на Y-хромосоме вероятность смутиро
раста кластера, происходящего от этого предково
вать за один год составляет примерно восемь шан
го узла. Мерой возраста, выраженного в числе му
таций, — но ведь нужно знать также скорость му
тирования и длину поколения?
Скорость мутирования для полного секвениро
вания Y-хромосомы уже определена во многих ис
следованиях. Причем, в отличие от скорости STR, и
прямой подсчет, и калибровки получены в несколь
ких работах, причем для калибровок использованы
самые разные подходы (рис. 1.22). На этом рисунке
сов из 10 миллиардов. Разумеется, для одного от
дельно взятого нуклеотида это весьма редкое собы
тие, но если секвенируются, скажем, 10 миллионов
нуклеотидов, то вероятность мутации хотя бы од
показаны величины скорости, полученные во всех
этих исследованиях. Видно, что первоначально (ста
тьи 2009—2012 годов) разброс был почти двукрат
ный, но почти все последующие исследования (мож
но надеяться, более основательные) дали близкие
оценки, и центр тяжести определений скорости явно
находится около величины 0,8°10°мутаций на нук
леотид в год. То есть для среднестатистического
Оценки
скорости
НОГО За ОДИН ГОД СОставляет восемь шаНСОВ ИЗ Ста.
А за столет — уже восемьдесят шансов из ста. То
есть одна мутация произойдет в среднем за 120 лет.
Значит, затысячу лет (это небольшой срок для объек
тов популяционных исследований) произойдет уже
целых восемь мутаций, то есть по числу мутаций
можно оценить возраст гаплогруппы с приемлемой
статистической погрешностью.
Важно, что полногеномная «эволюционная»
скорость (полученная по калибровкам заселения
Сардинии (Francalacci et al., 2013) и Америки
(Рoznik et al., 2013)) совпала с полногеномной «ге
неалогической» скоростью, полученной по много
мутирования
Y-хромосомы,
опубликованные к 2015 году.
протяженных
участков
Для каждой оценки указаны способ ее
получения,
статью,
и
ссылка
показано,
на
оригинальную
в
какую
Часть
диапазона скоростей она попадает.
ті3
ті
iтё* |} ті#
|+}
e
()
0,2
0,4
0,6
0,8
1
Скорость мутирования при полном секвенировании Y-хромосомы
(число мутаций на миллиарднуклеотидов в год)
Рис. 1.22. Оценки "полногеномной" скорости мутирования на Y-хромосоме.
|Хue et al., 2009) — скорость 1*10°мутаций на нуклеотид в год. Проведен прямой подсчет мутаций по 1 родос
ловной между 2 образцами, разделенными 13 поколениями. (Меndez et al., 2012) — скорость 0,62*10°мутаций на
нуклеотид в год. На Y-хромосому просто перенесена скорость, принятая для аутосом. (Рoznik et al., 2013) — ско
рость 0,82*10°мутаций на нуклеотид в год. Калибровка по заселению Америки, принимая дату равной 15 тыся
чам лет (Francalacci et al., 2013) — скорость 0,65°10°мутаций на нуклеотид в год. Калибровка по археологическим
датам заселения Сардинии. Вalanovsky et al., 2015) — скорость 0,78*10°мутаций на нуклеотид в год. Калибровка
по времени жизни генеалогического предка изученных представителей рода казахов-аргынов (справедливость в
данном случае генеалогических преданий подтверждается совпадением с реконструированным генетическим де
ревом). Кarmin et al., 2015) — скорость 0,74°10°мутаций на нуклеотид в год. Калибровка по древней ДНК, датиро
ванной радиоуглеродным методом, и современным образцам — ее потомкам. (Неlgason et al., 2015) — скорость
0,87°10°мутаций на нуклеотид в год. Проведен прямой подсчет мутаций по 274 родословным между 753 образца
ми, разделенными 2449 поколениями. Желтыми стрелками показаны две первые опубликованные оценки, а крас
ными — результаты последних исследований.
Глава 1. Создание баз данных о генофондах мира
62
численным исландским родословным [Helgason
et al., 2015]. Расхождение между этой и более ран
ней генеалогическими оценками [Xue et al., 2009;
Helgason et al., 2015] составляет лишь 13% и не
сомненно, что предпочтение следует отдать более
поздней и основанной на несравненно большем
объеме данных «исландской» скорости. Конечно,
любая из этих оценок не бесспорна: например, ис
пользованная дата заселения Америки (15 тысяч
лет) весьма условна, поскольку, например, прика
либровке скорости мутирования митохондриаль
ной ДНК [Forster et al., 1996] та же дата принима
лась равной 25 тысячам лет.
Способ оценки скорости мутирования, исполь
зованный в нашей собственной работе [Balanovsky
et al., 2015], мы назвали «клановым», потому что он
является промежуточным между калибровкой и
подсчетом породословной: скорость определена по
разнообразию, накопленному в популяции (что род
нит с калибровкой), но изученная казахская попу
ляция аргынов, как выяснилось, происходит преиму
щественно от одного основателя-родоначальника
(что роднит с подсчетом породословной).
Наконец, в работе [Karmin et al., 2015] исполь
зован еще один подход: подсчетчисламутаций, по
которым современные гаплотипы отличаются от
секвенированного древнего образца ДНК, который
филогенетически может считаться их предком (точ
нее, расположен на филогенетическом дереве очень
близко к своему общему предку с современными
гаплотипами).
Что же касается вопроса о длине поколения, то
при оценках «полнохромосомных» скоростей в
качестве вводной информации использовались
даты в годах (время заселения Сардинии и Амери
ки, время жизни основателя клана, датировка древ
него образца), поэтому и скорости указаны сразу в
мутациях на год, и нет необходимости промежу
точного пересчета через длину поколения.
Итак, в отличие от скоростей мутирования Y
STR-маркеров, в которых конкурируют две оцен
ки, различающиеся в три раза, скорости мути
рования при датировках по полным сиквенсам
Y-хромосомы определены с приемлемой точно
стью, и существенных разногласий в этом воп
росе нет.
НАУЧНЫЕ ДИСКУССИИ
Трехкратные различия между «эволюционной»
и «генеалогической» скоростями мутирования
представляют собой научную проблему, ставшую
предметом оживленных дискуссий [Zhivotovsky et
al., 2004; Di Giacomo et al., 2005; Zhivotovsky et al.,
2005; Zhivotovsky et al., 2006]. Естественно, что
наибольшее число статей по этому вопросу опуб
ликовано автором «эволюционной» скорости про
фессором Л.А. Животовским, искавшим причины
таких различий. Последняя из перечисленных ра
бот подводит итоги дискуссии и предлагает объяс
нение различий между скоростями.
Объяснение [Zhivotovsky et al., 2006] заклю
чается в том, что гаплотипы возникают в популя
ции в таком количестве, как следует из «генеало
гической» скорости, но часть из этих гаплотипов
затем элиминируется дрейфом генов, и потому
при рассмотрении сохранившихся гаплотипов (а
только их, естественно, и может изучить иссле
дователь в реальной популяции) обнаруживается
меньшее разнообразие, чем разнообразие, возни
кавшее по ходу истории популяции, а потому и
рассчитываемая по этим данным скорость мути
рования оказывается меньше. Это предположение
было подтверждено компьютерным моделирова
нием, и был сделан важный вывод, что соотно
шение «генеалогической» и «эволюционной» ско
ростей может быть не только трехкратным, а прак
тически любым, в зависимости от конкретных де
мографических параметров популяции, а также в
зависимости от – во многом стохастической – де
мографической истории конкретной гаплогруппы.
Иного объяснения трехкратным различиям ско
ростей в научной литературе предложено не было,
и объяснение элиминацией части гаплотипов вош
ло в обиход.
В то же время оставалось непонятным, какой
все же скоростью пользоваться на практике. Мно
гие исследователи полагали, что поскольку эволю
ционная скорость была получена не для семей, а
для популяций, то именно ее логично использовать
для датировок истории гаплогрупп в популяциях.
Некоторые другие авторы предпочитали генеало
гическую скорость, а во многих работах приводи
лись расчеты по обеим скоростям. Последний ва
риант особенно наглядно показывал реально су
ществующую неопределенность в оценках возра
ста большинства гаплогрупп. Поэтому большин
ство специалистов предпочитали не основывать
свои выводы на столь шатком фундаменте, как ге
нетические датировки, и предпочитали другие ос
нования, такие как географические закономернос
ти в распространении гаплогрупп, градиенты их
разнообразия, сравнение с лингвистическими и
археологическими данными и другие подходы.
К вопросу сравнения двух скоростей мы вер
немся в главе 7, в которой покажем, что генетичес
кие датировки, полученные для генофондов Кав
каза с использованием “генеалогической” скорос
ти, оказались куда в более хорошем согласии с лин
гвистическими и историческими датировками, чем
полученные с помощью «эволюционной» скорос
1.5. Дискуссии о датировках
ти. Другим указанием в пользу «генеалогической»
скорости являются данные полного секвенирова
ния Y-хромосомы: в них «эволюционная» скорость
не отличается существенно от «генеалогической»,
а значит, и для STR-гаплотипов «эволюционная»
должна бы быть близка к твердо установленной
(независимо показанной во многих исследовани
ях) «генеалогической» скорости.
В работе [Karmin et al., 2015] для нескольких
десятков гаплогрупп были сопоставлены датиров
ки, полученные по STR-маркерам и по данным
полного секвенирования. Оказалось, что для мо
лодых гаплогрупп (в пределах 5-10 тысяч лет) «эво
люционная» скорость сильно занижает возраст, и
для соответствия полногеномным результатам ско
рость мутирования STR-маркеров должна быть
близка к “генеалогической” или даже превосходить
ее. Зато для более древних гаплогрупп “эволюци
онная” скорость подходит лучше, а начиная при
63
мерно возрастов порядка 30 тысяч лет, скорость
мутирования STR-маркеров, требующаяся для со
впадения результатов с полногеномными, факти
чески совпадает с “эволюционной” скоростью.
Итак, по мнению автора, окончательной ясно
сти в этом вопросе нет, но большинство аргумен
тов указывают на обоснованность применения в
большинстве случаев «генеалогической» скорос
ти мутирования при обработке данных по Y-STR
маркерам. Впрочем, этот вопрос потерял свою ос
троту, поскольку возраст гаплогрупп теперь дос
таточно надежно определяется по результатам пол
ного секвенирования Y-хромосомы. А для датиро
вок тех совсем молодых кластеров в пределах этих
гаплогрупп, где требуется использование быстро
мутирующих STR маркеров, сама их молодость
(приближающая их временной диапазон к диапа
зону известных генеалогий) обосновывает приме
нение к ним «генеалогической» скорости.
ОКОЛОНАУЧНЫЕ И ЛЖЕНАУЧНЫЕ ДИСКУССИИ
ОКОЛОНАУЧНЫЕ ДИСКУССИИ
Словом околонаука – надеюсь, не обидным –
назовем исследования в области генетической ге
неалогии, поскольку их в основном проводят люди,
которые сами себя называют «любителями», про
тивопоставляя «профессионалам» – обычным по
пуляционным генетикам. Это та сфера, что на За
паде называется citizen science – наукой, которой
занимаются не профессиональные ученые, а обыч
ные люди. Эти исследования действительно нахо
дятся около науки – являясь научными по предме
ту исследований, они не всегда следуют строгой
научной методологии. Они находятся около науки
и формально, поскольку не интегрированы в сло
жившуюся структуру науки, хотя иногда взаимо
действуют с ней. Настойчивость, энтузиазм и не
сомненная талантливость помогают многим пред
ставителям генетической генеалогии получить зна
чимые результаты, часть из которых со временем
входит и в академическую науку. Однако отсут
ствие навыков критического подхода, поверхност
ность познаний и склонность кангажированным
интерпретациям приводят некоторых других пред
ставителей генетической генеалогии к выводам,
имеющим с наукой мало общего.
Вообще же главное, но легко преодолимое, рас
хождение между генетической генеалогией и по
пуляционной генетикой кроется в причинах пси
хологических. Представителям науки нелегко при
нять форму, в которой генетическая генеалогия по
дает свои результаты (например, в виде серии не
всегда связанных между собой кратких «постов»
на интернет-форумах). Представители же генети
ческой генеалогии, похоже, склонны компенсиро
вать естественно возникающее в их положении
«любителей» ощущение неполноценности острой
критикой в адрес популяционных генетиков-«про
фессионалов».
Излюбленным предметом этой критики явля
ется как раз скорость мутирования.
Неудивительно, что генетическая генеалогия
выбрала для своих расчетов «генеалогическую»
скорость мутирования, которая, действительно,
подтверждается не только на парах «отец-сын», но
и на более глубоких генеалогиях. Но удивительно,
с каким энтузиазмом критикуется скорость «эво
люционная». Такая острота характерна для вопро
сов принципиальных, а скорость мутирования вов
се не является ключевым вопросом для популяци
онной генетики, ведь датировки по изменчивости
STR гаплотипов Y-хромосомы являются очень не
значительным ее разделом.
Генетики, как правило, сознают трудность на
дежного определения возраста гаплогруппы – ведь
даже если решить проблему скорости, останется
вопрос неполноты выборки гаплотипов (многие
реально существующие подветви в анализируемой
выборке могут отсутствовать), неточности рекон
струированного дерева (даже при использовании
большого числа маркеров на дереве остаются –
путь не всегда отображаемые – ретикуляции, пре
вращающие ее в запутанную сеть), и даже точно
определенный возраст гаплогруппы не всегда по
могает достичь цели – датировать события в исто
рии популяций. Ктому же в ряде случаев трудность
в определении абсолютного возраста гаплогрупп
не скажется существенно на выводах, поскольку
для решения многих задач достаточно относитель
ного возраста, то есть важно определение после
64
Глава 1. Создание баз данных о генофондах мира
довательности появления разных гаплогрупп в изу
чаемом регионе — какая гаплогруппа распростра
нилась первоначально, кaкиe потом, а какие гап
логруппы маркируют наиболее поздние миграции.
Поэтому популяционные генетики относятся к
дуальных, что относится к конфиденциальной ин
формации, а именно групп) — для серий изучен
ных нами гаплотипов; полезные совместные об
суждения и многое, многое другое. Можно наде
яться, что эти реальные совместные достижения
расхождениям в датировках философски, а к са
перевесят мифические противоречия, и русско
мим датировкам — с изрядной долей скепсиса. Но
язычные генетики и генеалоги догонят и перего
генетические генеалоги отчего-то кладут вопрос
НЯТ СВОИХ аНГЛОЯЗЫЧНЫХ КОЛЛeГ ПО ЧaСТИ ВЗаИМО
датировок в сердцевину своего мировоззрения и
понимания, взаимопомощи и сотрудничества друг
убеждены если не в точности каждой конкретной
даты, то в принципиальной достижимости и прин
ципиальной важности точных дат. Поэтому в от
с другом.
ЛЖЕНАУЧНЫЕ ДИСКУССИИ
НОШеНИИ ГеНеТИЧеСКИХ ГеНеаЛОГОВ К ГеНеТИКе СО
здается некая аберрация зрения: хотя расчеты воз
«Лженаука» — сильное слово, но ДНК-генеало
раста по STR-гаплотипам являются очень неболь
гия в варианте, пропагандируемом А.А. Клесовым,
заслуживает его в полной мере. Это было давно
шой частью исследований Y-хромосомы, проводи
мых популяционным генетиками, и генетические
генеалоги прекрасно знают эти исследования, ге
неалоги искренно убеждены, что «неправильная
эволюционная скорость» является для работ попу
понятно специалистам, а после публикации кол
лективной статьи 24 ведущих российских ученых
— генетиков, лингвистов, археологов, историков,
ляционных генетиков краеугольным камнем и сво
генетических генеалогов и других (Троицкий ва
риант-наука, № 1(170), 13 января 2015), «ДНК-ге
дит на нет всю их ценность.
неалогия Клесова» получила статус лженауки, так
Нужно отметить, что в интернет-дискуссиях на
сказать, официально. Обсуждению лженауки было
эту тему нередко смешиваются совершенно раз
бы, наверное, не место в этой научной моногра
личные вещи. Например, скорости мутирования и
фии, если бы А.А. Клесов не распространял ДНК
метод расчета возраста — хотя очевидно, что лю
генеалогию настолько широко и агрессивно в рус
бой метод можно скомбинировать и стой, и с дру
гой скоростью. Любопытно, что смешивая скорость
ляющиеся профессиональными генетиками, поне
и метод, многие генеалоги начисто отрицают эво
люционную «скорость Животовского», но при этом
пользуются методом АSD (Sengupta et al., 2006).
хотя в этой статье Л.А. Животовский был вторым
соавтором и, учитывая его квалификацию матема
тика, скорее всего, занимался как раз разработкой
МетОда.
Накал страстей поражает воображение. Не бу
дем приводить здесь цитаты — желающие легко
скоязычном интернете, что многие ученые, не яв
воле знакомятся с ней. Не будучи знакомы с реаль
ной картиной генетических исследований истории
народов — представленной в интернете весьма скуд
но — они иногда подпадают под очарование запре
дельного упрощения А.А. Клесовым генетических
данных, методов и результатов. Но здесь мы рас
смотрим лишь учение ДНК-генеалогии о расчете
возрастов гаплогрупп по разнообразию гаплоти
пов.
От генетической генеалогии, в русле которой
найдут их даже на наиболее основательном из рус
скоязычных интернет-сайтов по генетической ге
А.А. Клесов начинал свою деятельность на гене
неалогии www.molgen.org, не говоря уже о сайтах,
тическом поприще, он унаследовал: (1) веру в не
для которых не так характерны взвешенные выс
погрешимость «генеалогической» скорости мути
казывания. Не будем и развивать далее тему о про
блемах взаимодействия популяционной генетики
и генетической генеалогии. Лучше бегло упомя
рования и (2) в непогрешимость метода расчета
возраста подоле исходного гаплотипа (разработан
нем те совместные достижения, которые получе
тической генеалогии и одного лишь нашего кол
Дмитрием Адамовым). За годы самостоятельной
деятельности он: (3) объявил «генеалогическую»
скорость своим личным изобретением, (4) соста
лектива. Это база данных Y-base, в наполнении
вил инструкцию расчета возраста и справочную
которой большую помощь оказал Роман Сычев,
база данных МURКА, текущая версия которой раз
работана Валерием Запорожченко; программа-пре
таблицу, (5) ввел поправку на обратные мутации,
(6) назвал все это единственно верным способом
датировок, и более того — (7) новой наукой, не име
диктор, разработанная по нашему заказу Вадимом
Урасиным; наши совместные статьи-диалоги с
Вадимом Вереничем и Евгением Матюшонком на
ющей отношения к популяционной генетике.
Прокомментируем по пунктам.
сайте Генофонд.рф: моя статья в «Российском вес
действительно, неплохо обоснована. Забавно, что
автор этих строк, который едва ли не больше чем,
кто-либо другой из популяционных генетиков, до
казывал преимущество именно «генеалогической»
ны в рамках сотрудничества представителей гене
тнике генетической генеалогии»; помощь ряду ге
неалогов, исследующих гаплотипы Кавказа и За
кавказья, передача им групп фамилий (не индиви
НОГО ИМ СОВМеСТНО С Ге НеТИЧеСКИМ Ге НеаЛОГОМ
(1) «Генеалогическая» скорость мутирования,
65
1.5. Дискуссии о датировках
скорости мутирования перед «эволюционной», в
(4) Пошаговая инструкция расчета возраста —
интернет-публикациях А.А. Клесова фигурирует
вещь, несомненно, полезная для начинающих лю
бителей генетической генеалогии или ДНК-генеа
как убежденный приверженец «эволюционной»
скорости. Должен сказать, что я не так уж убежден
и в абсолютной правильности скорости «генеало
гической», но именно она подтвердилась в двух
которой скорости мутирования приведены не толь
ко для обычного для популяционной генетики 17
исследованиях, которые мы проводили в разное
ти маркерного набора STR-маркеров, но и для дру
время и на разных генофондах: это было одним из
гих наборов маркеров, предлагаемых компанией
основных выводов и обобщающей статьи по Кав
коммерческого ДНК-тестирования ftDNА, тоже
казу (Ваlanovsky et al., 2011), и статьи по калиб
полезна, хотя такие расчеты проводились и мно
ровке полногеномной — и заодно основанной на
гими представителями генетической генеалогии.
Итак, и на этом этапе противоречий с подходами
популяционной генетики нет
STR — скорости мутирования (Ваlanovsky et al.,
2015). Итак, вера в непогрешимость генеалогичес
кой скорости, хотя и имеет ненаучные истоки, вряд
ли приведет к научным ошибкам, тем более на тех
интервалах времени, с которыми имеет дело ДНК
генеалогия. Поэтому на этом первом пункте кле
совское учение ДНК-генеалогии не вызывает на
реканий.
логии, но не более того. Справочная таблица, в
(5) Поправка на обратные мутации правильна,
но только для наименее оптимального метода рас
чета по доле исходного гаплотипа и при внешне за
Клесов это знает, поскольку часто пользуется об
данной скорости мутирования. Ведь действитель
но, могут происходить и обратные мутации произ
водных гаплотипов в исходный, и они занизят на
блюдаемую долю производных гаплотипов по срав
нению с долей реально возникавших производных
гаплотипов. Но для других методов расчета и при
использовании калиброванных скоростей мутиро
вания введение такой поправки было бы неверным,
ведь обратные мутации могли происходить и в при
мере, послужившем основой калибровки, а значит
уже в неявном виде учтены. Итак, и тут в методе
щепринятым расчетом по числу накопленных мy
расчета ДНК-генеалогии нет ошибок? Возможно.
таций, а достоинством своего метода (доли исход
Хотя область применения сужается с каждым но
ного гаплотипа) называет не точность, а лишь про
вым шагом до предельно простых случаев.
стоту расчетов. Итак, и здесь особых проблем нет
(6) Но ошибки точно начинаются с этапа, ког
да этот «клесовский» способ расчета объявляется
единственно верным. Во-первых, он не «клесовс
кий», а разработан популяционными генетиками
и использовался задолго и независимо от А.А. Кле
сова. Во-вторых, этот способ не единственно вер
ный и расчет по числу мутаций, и особенно рас
(2) Метод расчета по доле исходного гаплоти
па, как указывалось выше, правомочен, но имеет
ряд ограничений и в целом наименее оптимален.
Для датировок молодых кластеров с простой фи
логенетической структурой он приемлем, но для
старых и сложных филогений, скорее всего, опре
делит возрастхуже других методов. Вероятно, А.А.
(хотя нет и преимуществ), и клесовская ДНК-ге
неалогия остается в рамках правомочных с точки
зрения популяционной генетики методов.
(3) Объявление А.А. Клесовым «генеалогичес
кой» скорости своим изобретением требует сразу
трех комментариев. Во-первых, им, насколько мож
но судить, действительно проводились исследова
ния шотландских родословных и была получена,
естественно, та же «генеалогическая» скорость
мутирования, которая получалась всеми была из
вестна во многих исследованиях пар отец-сын, не
давно получена нами на казахской родословной
|Ваlanovsky et al., 2015), а также получалась и в
ряде исследований в русле генетической генеало
гии. Во-вторых, этот результат — возможно, впол
чет по доле исходного гаплотипа имеют свои не
достатки, да и «генеалогическая» скорость мути
рования не бесспорна.
(7) Область деятельности (ДНК-генеалогия
Клесова), основанная на позаимствованном из по
пуляционной генетики методе датировок класте
ров гаплотипов, объявляется новой наукой и попу
ляционной генетике противопоставляется. Тут уже
комментарии излишни - поскольку ДНК-генеало
не научный — не был никогда А.А. Клесовым опуб
гия самим ее гуру выводится за пределы академи
ликован в признанных научных журналах, и даже
ческой науки на просторы лженауки.
в его интернет-публикациях методы описаны не
достаточно полно для их воспроизведения. Имен
Стоит добавить, что этот вывод за пределы на
ку «насколько можно судить». В-третьих, если А.А.
уки строится на странной нелепице, с завидным
постоянством внедряемой в умы почитателей кле
совской ДНК-генеалогии. Им внушается нелепое
Клесовым и была независимо подтверждена изве
представление, что сфера исследований генети
но поэтому мне и пришлось выше ставить оговор
стная задолго до него и многократно подтвержден
ки не изменилась со времен монаха Грегора Мен
ная "генеалогическая скорость, это не делает ее
некой третьей "клесовской скоростью — она оста
ется все той же, следуя устоявшемуся термину, "ге
деля, и что генетика занимается только генами —
неалогической".
теми фрагментами наследственного материала,
которые отвечают за фенотипические и иные при
знаки. А весь основной массив ДНК, о котором
Глава 1. Создание баз данных о генофондах мира
66
мы не знаем его связи с внешним проявлением,
остается якобы бесхозным, и именно его присва
ивает себе ДНК-генеалогия. Нелепый девиз:
«Гены – генетике, а ДНК – ДНК-генеалогии», как
ни удивительно, находит отклик в умах почитате
лей, имеющих среднее образование. Казалось бы,
даже школьное образование обеспечивает поня
тие о генетике. Генетика – это отнюдь не «наука о
генах». Это наука о наследственности и изменчи
вости. А наследственность, даже если рассматри
вать только связанную с ДНК, включает в себя
множество самых различных типов нуклеотидных
последовательностей, среди которых гены состав
ляют меньшинство. Как термин «атом» (т.е. «не
делимый») используется и ныне, но означает со
всем иное, чем для философов античности, так и
термин «ген» используется и ныне, но означает
совсем иное, чем для Иоганнсена, который ввел
его более ста лет назад. Поэтому генетикам даже
неловко разъяснять понятия, известные школьни
кам, что генетика работает со всем наследствен
ным материалом, со всей ДНК, как и развеивать
прочие невежественные постулаты ДНК-генеало
гии. (Например, столь же невежествен постулат
А.А. Клесова о том, что популяционная генетика
якобы занимается путем от гена к признаку, хотя
этим занимаются совсем иные разделы генетики
и других биологических наук). Но именно с по
мощью наслаивания одних невежественных по
стулатов на другие и формируется лженаука ДНК
генеалогия, которые зарубежные коллеги назва
ли «генетической астрологией».
ДАТИРОВКИ В ЭТОЙ КНИГЕ
Датировки по данным полного секвенирования
Y-хромосомы используются в разделе 7.4, а подан
ным о STR-гаплотипах наиболее последовательно
и систематически применялись при исследовании
генофонда Кавказа (раздел 7.3). Для датировки
STR-кластеров в пределах гаплогрупп использо
вались три метода:
1) Показательρ использовался для датировки
кластеров, как описано в [Forster et al., 1996; Saillard
et al., 2000].
2) Метод BATWING [Wilson et al., 2003], осно
ванный на моделировании возникновения гапло
типов, был использован для получения независи
мых оценок возраста тех же кластеров.
3) Показатель ASD [Sengupta et al., 2006] ис
пользовался для определения времени, необходи
мого для накопления наблюдаемой изменчивости
внутри популяции для всей гаплогруппы (а не для
отдельных кластеров внутри гаплогрупп, в отли
чие от первого и второго методов анализа).
Хотя подавляющее большинство статистичес
ких расчетов в данном исследовании выполнены
лично автором, но анализ методом BATWING про
веден совместно с сотрудником Нью-Йоркского
исследовательского центра IBM Дэном Платтом
(Dan Platt), а расчет АSD – вместе с научным коор
динатором проекта «Генография» Давидом Сория
(David Soria) в рамках совместного исследования
[Balanovsky et al., 2011].
ДАТИРОВКИ С ПОМОЩЬЮ МЕТОДА BATWING
BATWING позволяет определить временные
границы, между которыми могла возникнуть му
тация, впоследствии не повторявшаяся (unique
event polymorphism –UEP). Обычно в качестве UEP
используются SNP маркеры, но этот подход может
быть расширен за счет использования «виртуаль
ных мутаций», маркирующих кластеры STR гап
лотипов, как описано в работах Cruciani с соавто
рами [Cruciani et al., 2004, 2006]. Выделялись по
пуляции, в которых присутствуют эти кластеры, и
расчеты методом BATWING включали все образ
цы из этих популяций с целью датировать UEP. Мы
использовали те же параметры распределения, что
и в работе [Xue et al., 2008].
BATWING также применялся для моделирова
ния последовательности популяционных ветвле
ний и датировки точек ветвления. Кластеры гап
лотипов, определенные на филогенетических се
тях, никоим образом не учитывались в этих расче
тах. Таким образом, эти результаты предоставля
ют методически независимую оценку времени раз
деления популяций.
ОГОВОРКА 1: МОНОФИЛЕТИЧНОСТЬ
Все методы датировок кластеров исходят из
предположения, что рассматриваемые гаплотипы
реально происходят от одного предка. Но для это
го нужно точно знать дерево происхождения гап
лотипов друг от друга. При использовании полно
го секвенирования Y-хромосомы это достигается,
но при использовании данных по STR-гаплотипам
получаемое дерево является лишь приближенной
реконструкцией реально происходившей эволюции
гаплотипов. Конечно, чем больше STR-маркеров
анализируется, тем точнее выделяются гаплотипы
и лучше реконструируется их родство друг с дру
гом, но даже при использовании и нескольких де
сятков, и более сотни STR-маркеров остаются нео
днозначности в дереве.
Публикуемые схемы родства гаплотипов, даже
если они отображаются в виде сетей (ретикуляции
на сетях как раз предназначены для отображения
разных возможных путей эволюции), часто созда
ют иллюзию почти полной однозначности дерева.
В действительности же эти схемы определяются
67
1.5. Дискуссии о датировках
порогами, задаваемыми программе при построе
ков (рис. 1.20 Б, В). Такая структура действитель
нии дерева, или внутренними алгоритмами самой
программы. При использовании наиболее популяр
чаще приходится работать с филогенетической се
ной программы Network сеть при отображении
тью сложной топологии, на которой просматрива
большинства возможных путей эволюции выгля
дит как спутанный клубок. Но при задании жест
ких условий исключения всех ветвей, кроме наи
более вероятных, клубок можно превратить в кра
сивое звездообразное дерево, ретикуляции на ко
ются группы гаплотипов, лишь отдаленно напоми
тором остаются лишь там, где решительно невоз
но иногда выявляется в реальных данных. но куда
нающие звездообразную структуру. В этом случае
который,
во-первых, представлен у большого числа образ
цов, а во-вторых, имеет большое число потомков.
При противоречии между этими правилами пред
предковым стоит считать тот гаплотип,
можно отдать предпочтение одному из двух воз
почтение стоит отдавать «правилу потомков», по
можных путей. Более того, даже в названии ста
тьи, описывающей метод построения медианных
тому что частота предкового гаплотипа могла
сетей (Ваndelt et al., 2000), присутствует оборот
«жадная редукция» (greedy reduction), указываю
щий на то, что исключение менее вероятных вет
вей является неотъемлемой — и вполне разумной —
особенностью метода. Но ведь эти не отображае
мые на дереве пути эволюции тоже вполне возмож
уменьшиться, а частота одного из потомков слу
чайно вырасти. Но если у гаплотипа на сети со
всем мало потомков, то и у нас совсем мало осно
ваний считать его исходным гаплотипом кластера.
Еще одно правило, тоже выработанное при
предковый ГаП
лотип обязательно должен быть в своем кластере
изучении кавказских гаплотипов:
ны (особенно при жестких порогах). А значитта
ближе всех к центру сети (общему предку всех
группа гаплотипов, которая на полученном дереве
показана как происходящая из одного гаплотипа
вообще гаплотипов на сети). Иными словами, мы
запретили себе допускать «мутации назад» при
основателя, на самом деле может включать гапло
интерпретации филогенетической сети, и включать
типы, имевшие в действительности других пред
ков, пусть скорее всего в какой-то мере и родствен
в кластер гаплотип,
который
согласно сети, явля
ных приписанному им предку-гаплотипу.
ется «предком предка» (или, если уж его включать,
то его и принимать за предка). Это правило введе
Эта погрешность, неизбежная при использова
нии Y-STR данных, является наиболее серьезным
но из тех соображений, что достаточно уже той
неизбежной погрешности, которая внесена при
препятствием для надежного определения возрас
построении сети объективным методом, и не сто
тов кластеров — в ряде случаев не менее серьез
итувеличивать погрешность за счет субъективных
ным, чем трехкратные различия при использова
предположений, что родство гаплотипов могло
быть не таким, а чуть иным. Правильнее прини
нии разных скоростей мутирования. Для миними
зации этой погрешности можно только вниматель
мать построенную сеть как данность и выделять
но относиться к построению филогенетических
кластеры, строго следуя ее топологии. Многочис
схем, сравнивать схемы, полученные при разных
ленные примеры выделения гаплотипов-основате
параметрах и порогах, тщательно рассматривать
лей приведены в Вalanovsky et al., 2011) и в разде
детали топологии и брать в работу лишь те класте
ры, которые представляются действительно моно
ле 7.3.
филитическими группами.
По этому пути мы шли в анализе филогенети
ческих сетей гаплогрупп на Кавказе, и очень по
лезным оказалось следование некоторым формаль
ОГОВОРКА 3: ПОСТОЯНСТВО СКОРОСТИ
Метод молекулярных часов основывается на
том, что скорость возникновения мутаций посто
ным правилам. Например, при выделении какой
либо группы на сети в качестве кластера, все гап
янна и не меняется ни во времени, ни в простран
лотипы сети, дистальные по отношению к гапло
тации в данном гаплотипе одинакова, независимо
стве. То есть что вероятность возникновения му
типу-основателю, обязательно должны быть вклю
оттого, принадлежит ли этот гаплотип палеолити
чены в кластер.
ческому сибиряку или современному негру. В от
личие от других сделанных оговорок, эта не со
структура с одним гаплотипом в центре, представ
здает реальных затруднений. Ведь действительно
нет оснований полагать, что скорость унаследован
ных мутаций меняется во времени или простран
стве. Даже такие события, как ядерные взрывы в
Хиросиме или Челябинске-40, судя по большин
ству исследований, не увеличили частоту мутаций,
ленном у большого числа образцов и расходящи
унаследованных следующими поколениями
ОГОВОРКА 2: НАЙТИ ОСНОВАТЕЛЯ
Выделение этого гаплотипа-основателя пред
ставляет собой отдельную проблему. В идеальном
случае на сети выявляется четкая звездообразная
мися от него получам гаплотипами-потомками
(всплеск соматических мутаций у самих облучен
(каждый из которых представлен у меньшего чис
ла образцов, чем основатель) и потомками потом
ных людей, естественно, к этому вопросу не отно
сится). А для остальной истории человечества нет
68
Глава 1. Создание баз данных о генофондах мира
оснований предполагать условия, стимулирующие
или замедляющие мутации в мере, хотя бы при
ближающейся к этим двум печальным примерам.
Другое дело, что скорость мутаций теоретичес
ки может несколько различаться в зависимости от
в пределах некой гаплогруппы, то часть этого раз
нообразия, действительно, накоплена популяцией
за время ее истории, но другая часть разнообразия
была у популяции «еще на старте» весьма отда
ленном. И даже если какая-то гаплогруппа встре
генетического окружения на хромосоме, и в неко
ЧаеТСЯ ТОЛЬКО В
торых исследованиях были найдены указания на
ние гаплогруппы хорошо датировано, и популяция
несколько различающиеся скорости мутирования
имеет логически обоснованное «начало» (допус
тим, миграция на остров), то возраст популяции
для разных гаплогрупп мтДНК и Y-хромосомы.
Достоверно показано и то, что частота мутаций на
Y-хромосоме увеличивается с возрастом отца. По
одной популяции, и возникнове
вовсе не обязательно совпадает с возрастом гап
логруппы. Ведь гаплогруппа могла возникнуть за
этому в принципе возможно, что в популяциях с
долго до формирования популяции, но не сохра
различной длиной мужских поколений скорость
накопления мутаций будет несколько различаться.
ниться в других местах, а сохраниться лишь в по
Однако на обычно исследуемых промежутках вре
пуляции, мигрировавшей на остров, и тогда гап
логруппа будет старше популяции. Но могла она
мени длина поколений относительно постоянна для
возникнуть и после формирования популяции на
всего человечества. Итак, на практике всеми эти
каком-то этапе ее истории, и тогда гаплогруппа
ми сомнениями в универсальности скорости му
будет моложе популяции. Второй вариант иллюс
таций можно пренебрегать — особенно по сравне
нию с проблемой привязывания данных по дати
трируется, например, тем же исследованием гено
ровке кластеров (гаплогрупп) к событиям истории
водилось в качестве примера. В нем для многих
популяций.
популяций были обнаружены специфичные для
ОГОВОРКА 4: ВОЗРАСТ КЛАСТЕРА И ВОЗРАСТ
ПОПУЛЯЦИИ
Автор этих строк никогда не сможет забыть
слышанный им на заре использования мтДНК на
учный доклад, в котором возраст гаплотипов,
встреченных у славян, был определен в 20 тысяч
фонда Кавказа (раздел 7.3), которое не раз уже при
них кластеры гаплотипов. Раз эти кластеры встре
чаются в одной популяции, но отсутствуют в дру
гих, то датировки кластеров указывают на время
отделения этот популяции от родственных ей
групп. Но это время является нижней (наимень
шей, более близкой к современности, более по
здней) оценкой времени выделения популяции из
родительской прапопуляции, поскольку кластер
лет, и тут же был сделан вывод, что славянская
мог возникнуть как сразу после разделения попу
популяция 20 тысяч лет назад и сформировалась.
ляций, так и в любой момент времени после этого
Даже сделанное докладчику указание на наличие
километровой ТОЛщи льда Двадцать тысяч лет на
зад (эта дата попадает на период последнего оле
денения) в месте, где была собрана выборка и где
события.
ОГОВОРКА 5 РАЗНЫЕ СКОРОСТИ ДЛЯ РАЗНЫХ
МАРКЕРОВ
поэтому предполагалось возникновение славян, не
поколебало его уверенности. Ведь вывод был сде
При рассмотрении скоростей мутирования упо
лан на основе данных генетики, которая имеет ре
путацию почти что точной науки.
миналось, что они относятся к «среднестатисти
Возможность допустить ту же ошибку, пусть
Не в ТаКИХ масштабах, ДаМОКЛОВЫМ МечОМ ПОСТО
янно нависает над очень многими и любителями,
и даже профессионалами, не исключая, возможно,
ческому» маркеру. Но частотамутирований, напри
мер, разных STR-маркеров отличается на один-два
порядка. К счастью, частота мутирования конкрет
ного локуса обычно не важна, поскольку всегда
анализируются их наборы. Поэтому нужно знать
и самого автора. Уж очень велик соблазн связать
историю гаплогруппы, встреченной в популяции,
с историей самой этой популяции. И несомненно,
скорость мутирования именно набора локусов (то
что демографическая история популяции действи
ра). Конечно, скорости мутирования разных набо
тельно влияет на историю содержащихся в ней гап
логрупп. Вот только эти две истории редко когда
могут быть приравнены друг к другу.
В случае с подледным возникновением славян
ров могут различаться, если в один набор включе
ны быстромутирующие, а в другой — медленно
мутирующие маркеры. Но поскольку используемые
в анализе гаплогрупп наборы состоят из несколь
ошибка очевидна: генетическое разнообразие,
ких десятков локусов (от 17 до 111), и они, заред
пусть даже действительно Двадцатитысячелетне
ким исключением, не подбирались специально по
скорости мутирования, то случайное включение
быстрых и медленных маркеров взаимно компен
сируется, и скорости мутирования разных наборов
мало отличаются друг от друга. В целом, хотя эту
го возраста, хотя и было обнаружено у славян, на
чало накапливаться еще у их далекой предковой
популяции. И если в какой-то популяции обнару
жена некая величина генетического разнообразия
есть вероятность того, что смутирует какой-то
любой — не важно, кaкой именно — локус из набо
1.5. Дискуссии о датировках
69
особенность и стоит иметь в виду, она имеет мень
и поэтому нельзя установить, какой из аллелей от
шее значение, чем другие источники погрешнос
тей.
носится к какому из двух локусов, эти локусы при
ОГОВОРКА 6: ИСКЛЮЧЕНИЕ ИЗ РАСЧЕТОВ
нято исключать из анализа при построении фило
генетических сетей. Соответственно, эти маркеры
были исключены и из расчетов с использованием
ОТДЕЛЬНЫХ STR ЛОКУСОВ
показателя с, а также при анализе методом
Поскольку дуплицированные маркеры DYS385а
и DYS385b типируются на одной паре праймеров,
то они проводились в двух вариантах: с включени
ем и с исключением DYS385a и DYS385b.
ВАТWING. Что касается расчетов показателя АSD,
ГЛАВА 2.
СТРУКТУРА ГЕНОФОНДА ЕВРОПЫ
В ЗЕРКАЛЕ Y-ХРОМОСОМЫ
Бурное развитие популяционной генетики че
ловека, ознаменовавшееся появлением таких но
вых направлений, как филогеография, молекуляр
ная антропология, этногеномика, археогенетика, во
многом связано с широким использованием двух
информативных, но своеобразных генетических
систем – Y-хромосомы и митохондриальной ДНК.
Это сформировало своеобразный «двусистемный»
способ мышления – следуя ему, исследователь ожи
дает, что большинство миграций должны оставить
след в географическом распространении обеих си
стем: и мтДНК (отражающей материнскую линию
наследования), и Y-хромосомы (отражающей от
цовскую линию наследования). По изменчивости
этих двух систем опубликовано множество работ,
охвативших население практически всех стран Ев
ропы, а в последние годы к ним добавились и ис
следования полногеномных панелеймаркеров. По
скольку европейский генофонд одновременно яв
ляется и наиболее гомогенным, и наиболее изучен
ным в мире по всем трем упомянутым генетичес
ким системам (Y-хромосомы, мтДНК, полногеном
ных панелей), именно на его примере можно усо
вершенствовать методологию анализа генофонда.
Если удастся выявить пространственную и этно
лингвистическую структурированность даже гомо
генного европейского генофонда–это означает, что
применяемые подходы и во всех иных, более гете
рогенных, частях света позволят обнаружить как
важные особенности их пространственной струк
туры, так и проследить траектории этногенеза.
Отметим, что предыдущее обобщающее исследо
вание, преследовавшее ту же цель [Rosser et al.,
2000] проводилось более десяти лет назад по вы
борке (N=3 616), в десять раз меньшей нашей
(N=38 000). Пожалуй, пришло время провестино
вый обобщающий анализ генофонда Европы на
новом витке его изученности.
2.1. ПРЕДШЕСТВОВАВШИЕ ИССЛЕДОВАНИЯ
ОБОБЩАЮШИЕ И РЕГИОНАЛЬНЫЕ РАБОТЫ
РАННИЕ ОБОБЩАЮЩИЕ РАБОТЫ
Исследования изменчивости Y-хромосомы в
Европе начались в 1990е годы. И почти одновремен
но с плодотворной обобщающей статьей по измен
чивости мтДНК в Европе [Richards et al., 2000], по
явились две крупные работы, суммирующие данные
об изменчивости в Европе Y-хромосомы [Semino et
al., 2000; Rosser et al., 2000]. Обе статьи основыва
лись на внушительных объемах данных, и, хотя
были написаны в различной манере, выявили сход
ные черты европейского генофонда.
Россер с коллегами [Rosser et al., 2000] следо
вали феноменологическому подходу, давая описа
ния обнаруженным ими паттернам географической
изменчивости Y-хромосомы. Они показали удиви
тельно четкую клинальную изменчивость в распро
странении всех гаплогрупп Y-хромосомы и стати
стически обосновали, что генетическое сходство
популяций определяется их географическим сосед
ством, а не лингвистическим сходством их языков.
Что же касается статьи Семино с коллегами
[Semino et al., 2000], то они следовали ассоциатив
ному подходу, заключив, что наблюдаемые геогра
фические закономерности современного генофон
да могли быть сформированы такими факторами
со сходным географическим распространением,
которые известны для периода верхнего палеоли
та. (Тем самым авторы этой статьи присоединились
к сторонникам «палеолитического» времени фор
мирования генофонда Европы и, следовательно,
«культурной» теории неолитизации – без мигра
ции самих носителей неолитической культуры в
Европу). Легко заметить, что, делая такой вывод,
авторы интерпретируют географические законо
мерности по ассоциации с событиями, имевшими
сходную географию. Строго говоря, это логически
не обоснованно, поскольку наличие корреляции
между двумя явлениями еще не доказывает при
чинно-следственную связь между ними.
И, действительно, один из наиболее убежден
ных последователей альтернативной гипотезы «де
2.1. Предшествовавшие исследования
мической диффузии», т.е. миграции в Европу не
только культуры, но и самих носителей неолити
ческой культуры [Chikhi et al., 2002], проведя не
зависимый анализ того же самого массива данных,
что и Семино с коллегами [Semino et al., 2000], при
шел к противоположным выводам, интерпретиро
вав те же закономерности как сформировавшиеся
в неолитический период.
Одна из проблем «ассоциативного» подхода
состоит в том, что он не учитывает, что миграции
населения во многом определяются географичес
кими барьерами и географическим ландшафтом, и
потому маршруты миграции повторяются вновь и
вновь в разные эпохи. Это не позволяет на основе
«ассоциаций» различать время экспансии. Имен
но поэтому и в обзоре [Barbujani, Bertorellе, 2001]
отмечено, что палеолитическая и неолитическая
миграции в Европу шли, вероятно, близкими мар
шрутами.
В целом, эти два первых обобщающих иссле
дования изменчивости Y-хромосомы в Европе
[Semino et al., 2000; Rosser et al., 2000] выявили,
прежде всего, ярко выраженную географическую
дифференциацию европейского населения по мар
керам Y-хромосомы. Это сразу ярко отличило Y
хромосомные данные и привлекло к ним большое
внимание, поскольку по данным об аутосомных
маркерах и мтДНК Европа выглядела довольно
однообразным массивом популяций. В этих и пос
ледующих работах было показано:
а) что в западноевропейских популяциях пре
обладает гаплогруппа R1b-М343;
б) тогда как в Восточной Европе высока часто
та гаплогруппы R1a1-SRY1532;
в) популяции Балканского полуострова харак
теризуются высокой частотой гаплогруппы I2а-Р37;
71
г) тогда как в Скандинавии резко увеличена
доля гаплогруппы I1-М253;
д) агаплогруппы J2-М172 и E1b1b1-M35 при
урочены к Южной Европе.
ПОСЛЕДУЮЩИЕ РЕГИОНАЛЬНЫЕ РАБОТЫ
После выхода этих ранних обобщающих иссле
дований подавляющее большинство последовав
ших работ концентрировалось на более дробных
регионах [Malyarchuk et al., 2002, 2003, 2004, 2006;
Beharet al., 2003; Харьков и др., 2004, 2007, 2008,
2011; Zakharov et al., 2004; Brion et al., 2005;
Cinnioglu et al., 2004; Di Giacomo et al., 2003; Flores
et al., 2003, 2004; Tambets et al., 2004; Alonso et al.,
2005; Gonсalves et al., 2005; Kayser et al., 2005;
Pericic et al., 2005; Capelli et al., 2006, 2007;
Lappalainen et al., 2006, 2008; Adams et al., 2008;
Balanovsky et al., 2008, 2011; Battaglia et al., 2008;
Bertoncini et al., 2012; Fechner et al., 2008; Marchani
et al., 2008; Mirabal et al., 2009; Varzari et al., 2009;
King et al., 2011; Yunusbaev et al., 2012; Хуснутди
нова и др., 2012; многие другие работы] или на
отдельных гаплогруппах [Di Giacomo et al., 2004;
Cruciani et al., 2007, 2010; Myres et al., 2010;
Underhill et al., 2010, 2015; Mendez et al., 2011;
Onofri et al., 2008, Derenko et al., 2006, 2007, 2010;
Rootsi et al., 2004, 2007, 2012; Tofanelli et al., 2009 и
другие работы]. Обобщающий анализ в масштабе
всей Европы более не проводился. Поэтому не по
терял своей актуальности сделанный еще в 2000
году и описанный выше вывод, что обнаруженная
клинальная изменчивость гаплогрупп Y-хромосо
мы объясняется скорее географическими законо
мерностями, чем характером расселения лингвис
тических групп [Rosser et al., 2000].
ГОМОГЕННОСТЬ И ГЕТЕРОГЕННОСТЬ ЕВРОПЫ
Если главной чертой, обнаруженной в митохон
дриальном генофонде Европы, является его гомо
генность [Simoni et al., 2000], то изменчивость Y
хромосомы, напротив, характеризуется исключи
тельной гетерогенностью. Также, как и для мтДНК,
для Y-хромосомы выделены несколько основных
гаплогрупп, преобладающих в населении Европы.
Но если частоты основных митохондриальных гап
логрупп практически одинаковы во всех уголках
Европы, то распределение гаплогрупп Y-хромосо
мы демонстрирует четкие географические гради
енты. Ни аутосомные классические маркеры и
ДНК-маркеры (до полногеномных исследований),
ни гаплогруппы мтДНК никогда не обнаруживали
столь элегантные тренды. Следовательно, Y-хро
мосома оказалась новым и весьма эффективным
инструментом для популяционной генетики насе
ления Европы.
Конечно, необходимо отдавать себе отчет, что
генофонд Европы не может быть одновременно и
гомогенным, и гетерогенным. Величина разнооб
разия генофонда Европы, конечно же, только одна.
Вопрос лишь в том, в какой степени разные марке
ры способны выявить эту реально существующую
степень изменчивости генофонда. Например, имея
в своем распоряжении данные по нескольким де
сяткам аутосомных маркеров, «классические» по
пуляционные генетики достигли хорошего уровня
разрешения в изучении генетических различий
международами Европы [Cavalli-Sforza et al., 1994;
Рычков, Ящук, 1983]. А вот при использовании
данных по митохондриальной ДНК различия меж
ду отдельными народами Европы почти не выяв
ляются, и генетикам удается успешно оперировать
только на более высоком иерархическом уровне,
выявляя географические регионы [Richards et al.,
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
72
2002] или лингвистические группы [Balanovsky,
2009]. Y-хромосома значительно лучше фиксиру
ет межпопуляционную дифференциацию и выяв
ляет генетические различия даже между локальны
ми популяциями, относящимися к одному и тому
же народу, как будет показано ниже. А исследова
ния, основанные на широкогеномных маркерах
позволяют различать генетическое положение ин
дивидуумов среди популяций [Novembre et al.,
2008]. Таким образом, разные типы маркеров в раз
ной степени выявляют гетерогенность генофонда.
Напомним, что под «гетерогенностью» гено
фонда в этой книге всегда подразумевается вели
чина межпопуляционной изменчивости в пределах
генофонда. Например, гетерогенность генофонда
Европы – это величина различий между популя
циями Европы; гетерогенность генофонда немцев
– это величина различий между популяциями нем
цев и т.д. Но то, что разные маркеры в разной сте
пени выявляют гетерогенность, не мешает сравни
вать генофонды по уровню их гетерогенности,
лишь бы это сравнение проводилось отдельно для
каждого типа маркеров. Например, гетерогенность
Европы по любому типу маркеров всегда будет
ниже гетерогенности Сибири, и это одно из карди
нальных различий между этими генофондами.
Нельзя лишь сравнивать величины гетерогеннос
ти двух генофондов, если эти величины получены
по разным типам маркеров. А если – в идеальном
случае – все сравниваемые генофонды изучены по
всем типам маркеров, тогда важным инструментом
становится степень согласованности показаний
разных типов маркеров. Если при переходе от ге
нофонда к генофонду величины их гетерогеннос
ти по разным маркерам изменяются согласованно,
то такая согласованность служит наилучшим под
тверждением реальности выявленных различий в
гетерогенности генофондов.
ПРЕДЫДУЩИЕ ИССЛЕДОВАНИЯ ОСНОВНЫХ ГАПЛОГРУПП
ГАПЛОГРУППЫ R1b И R1a
ГАПЛОГРУППЫ I1 И I2a
Возвращаясь к обзору работ по изменчивости
Y-хромосомы в Европе, отметим вывод о том, что
две основные гаплогруппы, суммарно вбирающие
почти половину Y-генофонда Европы, распределе
ны в направлении запад-восток. Из них гаплогруп
па R1b-M343 достигает частоты более 50% в За
падной Европе и убывает к востоку, а гаплогруппа
R1a-M198 почти столь же частав Восточной Ев
ропе и убывает к западу. Анализ другого типа мар
керов Y-хромосомы – микросателлитных STRмар
керов – также обрисовал западный и восточный
домены как основные структуры в генофонде Ев
ропы [Roewer et al., 2005].
Как отмечалось выше, интерпретации «по ас
социации» должны делаться с большой осторож
ностью. Поэтому ассоциацию этих двух доменов с
двумя основными мезолитическими рефугиумами
(юго-западным «припиренейским» и юго-восточ
ным «причерноморским») лучше считать одной из
возможных гипотез, имеющей право на существо
вание, но не доказанной. Например, можно было
бы предложить альтернативную гипотезу, интер
претирующую эти два домена как наследников
культур не палеолита, а позднего неолита - культу
ры колоковидных кубков и культуры шнуровой
керамики. Подробный анализ разнообразия гапло
типов в пределах гаплогруппы R1b-М269, форми
рующей западный домен, позволил предложить и
третью гипотезу, возводящую формирование это
горазнообразия ко времени неолита [Balaresque et
al., 2010]. Можно выдвинуть и другие гипотезы,
основанные на географических ассоциациях.
Две основные европейские гаплогруппы - R1b
и R1a – распространены также в населении Сред
ней Азии, Ближнего Востока, Индии, Северной
Африки. Но две другие гаплогруппы – I1-M253 и
I2a-P37 (ранее они обозначались I1a и I1b) – встре
чаются практически только в Европе, где они, веро
ятно, и возникли. Если R1b-M343 и R1a-M198 за
нимают запад и восток Европы, то I1-M253 и I2a
P37 преобладают, соответственно, на севере и юге
Европы. Гаплогруппа I1-M253, распространенная
в Скандинавии и на всех побережьях Балтийского
моря, привлекает несколько меньшее внимание ис
следователей по причине сравнительно позднего
заселения этого региона - только после окончатель
ного отступления ледника. «Балканская» гаплогруп
па I2a-P37 является основной гаплогруппой на юго
востоке Европы, но редка на Ближнем Востоке, и
поэтому ее нельзя считать принесенной оттуда на
Балканы первыми неолитическими земледельцами
(этот вопрос подробно рассмотрен ниже).
Три оставшиеся частые гаплогруппы E-M96,
J-M304 и N1c-M178 встречаются не по всей Евро
пе, а приурочены к ее субрегионам. Поэтому счи
тается, что они маркируют более поздние и не столь
масштабные волны миграций в Европу, которые не
затрагивали население всего европейского субкон
тинента.
ГАПЛОГРУППА N1c
Гаплогруппа N1c (она же ранее обозначалась
N3 или TAT) ограничена северо-востоком Европы,
2.1. Предшествовавшие исследования
и главным образом встречается в популяциях, го
ворящих на языках финно-угорской группы. Но она
также очень часта и в коренном населении Сиби
ри. В течение почти десяти лет оставалось неяс
ным, свидетельствует ли такая география о мигра
ции из Европы на восток в Сибирь или же о мигра
ции из Сибири на запад, в Европу.
В 2007 Роотси с соавторами (Rootsi et al., 2007)
показали, что корни этой гаплогруппы находятся в
кластере восточноазиатских линий Y-хромосомы, и
поэтому наличие этой гаплогруппы в Европе сле
дует интерпретировать как влияние азиатских гено
фондов. Авторы этой работы (Rootsi et al., 2007)
73
Вывод обазиатских, а не европейских корнях
гаплогруппы N1c, подтверждается и ее подробным
филогенетическим деревом, полученным уже по
результатам полного секвенирования Y-хромосо
мы Кarmin et al., 2015).
Это создает проблему для «двусистемного под
хода» (совместное рассмотрение результатов по Y
хромосоме и мтДНК), являющегося как бы сокра
щенным вариантом развиваемого нами «полисис
темного подхода». Дело в том, что по данным о
мтДНК сибирские (восточноевразийские) гаплог
руппы встречаются в Европе с крайне низкой час
тотой и только на самых восточных ее рубежах.
предполагают несколько последовательных шагов
Эти восточноевразийские гаплогруппы не образу
этой растянувшейся на многие тысячелетия мигра
ют сколько-нибудь значимого генетического плас
та ни в одном из регионов к западу от Урала. На
пример, когда типичная восточноевразийская гап
логруппа мтДНК F была обнаружена на хорватс
ции из Северного Китая в Восточную Европу, кото
рая началась в раннем голоцене и прошла через вто
ричную «экспансию» (резкое увеличение численно
сти носителей гаплогруппы) на этом долгом пути.
В том же году Деренко с соавторами (Derenko
et al., 2007) изучили изменчивость микросателлит
ных локусов в пределах этой гаплогруппы более
подробно и дали оценки ее возраста. Они выдели
ли два субварианта. Один из них был принесен в
ких островах (и с низкой частотой также на основ
ной территории Хорватии), это рассматривалось
как парадокс, и специальная статья (Тоlk et al.,
2001) была посвящена объяснению этого факта
возможными миграциями, связанными с восточны
Европу, по их оценкам, около 6—10 тысяч лет на
ми торговыми путями Венецианской республики,
в которую тогда входили эти острова. Данные ши
зад, тогда как второй (менее частый) вариант был
рокогеномных маркеров также показывают лишь
принесен в ходе меньшей по масштабу и более
поздней миграции, имевшей место около 2—4 ты
сяч лет назад. Конечно же, к этим, как и к любым
абсолютным оценкам времени, полученным по
очень ограниченную представленность сибирско
молекулярно-генетическим данным, следует отно
нента в генофонде значительной части Европы,
ситься состорожностью.
столь явно выраженное в высокой частоте Y-гап
логруппы N1c-М178, является одним из немногих
крупных противоречий между данными по Y-хро
мосоме и данными по мтДНК.
Представляется, что эту проблему можно снять,
К мнению о миграции носителей гаплогруппы
N1c-М178 из Азии в Европу (а не наоборот), при
соединяется и В.Н. Харьков (Харьков, 2012). В
проведенном им подробном анализе гаплотипов
выделены кластеры, специфичные для отдельных
народов и регионов Сибири, в частности показано
своеобразие кластера, характерного для якутов (у
которых частота этой гаплогруппы максимальна).
Отметим, что существование этноспецифичных
кластеров в пределах гаплогруппы N1c-М178 было
выявлено независимо ранее и в нашем исследова
нии (Балаганская и др., 2011). В.Н. Харьков, в со
гласии с предыдущими исследованиями, рассмат
pивает Восточную Европу как зону вторичной эк
спансии этой гаплогруппы, а высокое разнообра
зие гаплотипов объясняет меньшим действием, по
сравнению с Сибирью, дрейфа генов, при большей
интенсивности метисации.
Таким образом, все три исследования (Rootsi
et al., 2007; Derenko et al., 2007: Харьков, 2012) со
гласуются друг с другом в том, что население cе
веро-востока Европы имеет значительный (или
даже преобладающий) генетический компонент,
го (североазиатского) и тем более восточноазиатс
кого компонентов в генофонде Европы (глава 4).
Вот почему наличие восточноевразийского компо
приняв во внимание, что генетическая граница
между Европой и Азией находится намного вос
точнее географической границы (Уральских гор).
Западная часть Средней и Центральной Азии,
Южной Сибири (в особенности Алтай) и значи
тельная часть Западной Сибири могут рассматри
ваться как генетически промежуточный регион в
наше время (Балановская, Балановский, 2007) и как
регион с преобладанием западноевразийского
(можно сказать европеоидного) компонента в про
шлом (Грехова и др., 1996, Балановская и др., 1997).
С этих позиций выглядит естественным, что Y-хро
мосомная гаплогруппа N1-LLY22 (включая дочер
нюю гаплогруппу N1c-М178), несмотря на ее воз
никновение в Восточной Азии 20—30 тысяч лет на
зад, к неолитическому времени являлась типичной
гаплогруппой и для европеоидного населения ев
разийских степей к западу от Алтая, и для монго
золитической Южной Сибири и Центральной
лоидного населения евразийских степей к востоку
от Алтая. Именно из западной половины своего
тогдашнего ареала гаплогруппа N1c-М178 могла
Азии.
распространиться к северо-западу в ходе многочис
происходящий из верхнепалеолитической или ме
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
74
ленных миграций, известных для этой территории.
Тогда становится понятным, почему эти миграции
не принесли в Европу восточноевразийские мито
кан (быстрый рост численности как раз и приво
хондриальные гаплогруппы: на территории к за
дит к накоплению микросателлитного разнообра
паду от Алтая, откуда шли эти миграции, даже в
зия, из которого вычисляется возраст гаплогруп
наши дни преобладают западноевразийские вари
анты мтДНК. Преобладание западных генетичес
ких вариантов на данной территории было тем бо
пы).
лее справедливо для того времени, поскольку тюр
чардсом с соавторами (Richards et al., 2000) при
коязычные монголоидные народы начали рассе
вает по направлению к соседним регионам и поче
му их возраст близок к времени неолитизации Бал
Однако внутренняя логика этой модели прямо
противоположна той, которая была применена Ри
Последние две частые в Европе гаплогруппы
анализе данных по митохондриальной ДНК. Ведь
Ричардс с соавторами показали, что митохондри
альные гаплогруппы, изменчивость которых была
накоплена в Европe in silи, имеют палеолитичес
кий возраст. На основе этого они сделали вывод,
что современные европейцы являются потомками
Y-хромосомы обозначаются Е-М96 и J-М304. Обе
они преобладают в населении Северной Африки и
палеолитического населения Европы (Richards et
al., 2000). А спустя восемь лет Баттаглия с соавто
Ближнего Востока, а в Европе приурочены глав
ляться на эти земли только около 2000 лет назад.
ГАПЛОГРУППЫ R И J
ко не все варианты этих гаплогрупп достигли Ев
рами показали, что Y-хромосомные гаплогруппы,
изменчивость которых была накоплена в Европе
in silи, имеют неолитический возраст. Но из этого
ропы, а преимущественно только одна ветвь гап
противоположного факта они сделали прежний
логруппы Е (а именно Е-V13 — основной субвари
ант гаплогруппы Е-М35) и две ветви гаплогруппы
ТОМКаМИ ОПЯТЬ-ТаКИ И СИЛ eОЛ11/111/ЧеСКОaО НаСе ЛеНИЯ
ным образом к Средиземноморью. Впрочем, дале
J2-M172 (J2-М410 и J2-М241).
Если распространение гаплогруппы J2-М410
следует особому тренду, две остальные гаплогруп
вывод — что современные европейцы являются по
Европы (Ваttaglia et al., 2008).
Оба исследования опираются назначительный
чительно на Балканах и не встречены со сколько
нибудь существенными частотами в соседних ре
объем данных, и результаты обоих выглядят обо
снованными. Но этот пример наглядно показывает
необходимость применения более надежных и уни
версальных способов логической интерпретации
молекулярно-генетических данных, по крайней
пы (Е-М35, J2-М241, а также рассмотренная выше
гаплогруппа I2a-Р37), сосредоточены почти исклю
гионах. В работе (Ваttaglia et al., 2008|даны следу
мере, когда речь идет о столь сложных процессах,
ющие оценки возраста этих гаплогрупп: для Е-V13
— от 4 до 7,5 тысяч лет; для J-М241 — от 3,5 до 6
тысяч лет; для I2a-Р37 — от 5,5 до 10 тысяч лет
Конечно, эти оценки были основаны на данных о
как НеОЛИТИЗаЦИЯ.
Что же касается данного конкретного случая,
то возможный логический компромисс, на мой
взгляд, состоит в следующем. Модель, предложен
STR-маркерах, и сейчас уже есть куда более на
ная в работе (Ваttaglia et al., 2008) в действитель
дежные оценки по результатам полного секвени
ности подразумевает действие обоих процессов -
рования Y-хромосомы. Но во время выхода рабо
и культурной, и демической диффузии (и распрос
ты (Ваttaglia et al., 2008) других оценок не было, а
транение одной лишь традиции земледелия, и рас
эти оценки, пусть приблизительно, но соответство
вали времени неолитизации юго-восточной части
Европы, где в наши дни распространены эти гап
логруппы. Поэтому авторы этой работы предпола
пространение самих земледельцев). Хотя авторы и
не формулируют этого в явном виде, но их модель
гали, что автохтонное мезолитическое население
только между регионами (сначала между Малой
Азией и Балканами, затем между Балканами и дру
гими регионами Европы). При этом внутри регио
Балканского полуострова (генетически восходящее
к палеолиту) восприняло неолитический культур
ный комплекс (главным образом, земледелие) от
подразумевает, что культурные заимствования зем
леделия без миграции земледельцев имели место
нов разумно предполагать наличие демической
своих ближневосточных соседей, сохранив гено
диффузии (распространение земледелия путем рас
фонд палеолитического населения. Переход к за
селения увеличивающейся в численности популя
ции земледельцев).
имствованным неолитическим технологиям при
вел к быстрому росту численности этих теперь уже
земледельческих популяций, которые распростра
нились по всему Балканскому полуострову и да
лее передали культурный неолитический комплекс
(но не свой генофонд) мезолитическим популяци
ям соседних частей Европы. Такая модель хорошо
объясняет, почему эти три гаплогруппы приуроче
ны к территории Балкан, почему их частота убы
Завершая на этом обзор основных предшество
вавших работ по изменчивости Y-хромосомы в Ев
ропе, нужно отметить, что среди перечисленных и
еще большего числа лишь упомянутых работ по
чти отсутствуют исследования, посвященные Ев
ропе в целом. По сути, лишь в работе [Rosser et al.,
2000) анализируются закономерности структуры
европейского генофонда, а все остальные работы
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
сосредоточены на отдельных регионах или отдель
ных гаплогруппах. Но за 15 лет, прошедших после
статьи [Rosser et al., 2000], массив данных по из
менчивости Y-хромосомы вырос во много раз – и
по числу охваченных популяций и по числу выде
75
ляемых гаплогрупп. Поэтому на последующих
страницах предпринята попытка обобщающего
анализа накопленных в мировой науке данных о
структуре генофонда Европы, как она видится в
зеркале Y-хромосомы.
2.2. ГЕНОГЕОГРАФИЯ ГАПЛОГРУПП Y-ХРОМОСОМЫ В ЕВРОПЕ
Анализ генофонда Европы начнем с рас
смотрения геногеографии отдельных гаплог
рупп. Отчасти это является продолжением пре
дыдущего раздела, в котором кратко суммиро
валось то, что было известно о распростране
нии гаплогрупп Y-хромосомы до нашего иссле
дования. Но теперь мы рассмотрим современ
ные, подробные карты распространения всех
основных европейских гаплогрупп и тех их суб
вариантов, для которых уже известны частоты
в ряде популяций Европы.
В нашей базе данныхY-base содержится почти
вся опубликованная информация о частотах гап
логрупп Y-хромосомы в мире (и в Европе в част
ности), но далеко не вся эта информация пригодна
для изучения географического распространения
гаплогрупп. Как и при создании других геногеог
рафических атласов, для создания карт распрост
ранения Y-хромосомы в Европе данные были тща
тельно отобраны и создан массив данных для карт
Y-хромосомы в Европе. Рассмотрим, по каким кри
териям этот массив данных формировался.
ОРГАНИЗАЦИЯ ДАННЫХ
МАССИВ ДАННЫХ ДЛЯ КАРТ: ПОПУЛЯЦИИ
Для надежного определения частоты одноро
дительских генетических маркеров (Y-хромосомы
имтДНК)требуется объем выборки в два раза боль
ший, чем для аутосомных маркеров – поэтому ниж
няя граница выборки должна быть не менее 70-100
образцов. Маленькие выборки или объединялись
с географически соседними выборками того же
народа, или (если объединение было невозможно)
не включались в анализ. В результате средний
объем выборки в массиве данных для карт состав
ляет N=136 образцов. Но делались и исключения
из правила. По некоторым народам или же регио
нальным группам в пределах народа, которые для
полноты картины хотелось обязательно предста
вить на карте, были доступны лишь небольшие
выборки. Тогда, скрепя сердце, приходилось вклю
чать в массив для карт и выборки меньшего разме
ра. Но такие исключения делались редко – из 251
картографированных популяций лишь десятая
часть (29 популяций) имеют объем выборки ниже
N=50, а подавляющее большинство (192 выборки)
имеют объем N=70 и выше.
Если для какого-либо народа были данные по
его региональным популяциям, то для картографи
рования не использовались выборки этого народа,
для которых географическая привязка неизвестна
(если авторы при публикации указали лишь при
надлежность к народу).
В итоге массив для карт включил данные по 251
популяциям (выборкам), и суммарное число образ
цов во всех выборках составило 34 294 образцов.
Стоит отметить, что значительная часть этих дан
ных получена благодаря исследованиям нашего кол
лектива под руководством автора этих строк: 45
популяций и 4 880 образцов. Это наши данные по
русским популяциям [Balanovsky et al., 2008], укра
инским, белорусским и некоторым дополнительным
русским популяциям [Kushniarevich et al., 2015],
популяциям Северного Кавказа [Balanovsky et al.,
2011], а также наши еще неопубликованные данные
по популяциям крымских и казанских татар, мок
шии эрзи. (Данные по частотам гаплогрупп из трех
опубликованных статей приведены в таблицах 2.1,
2.2, 2.3.) Получается, что из всего массива данных
по изменчивости Y-хромосомы в Европе каждая
пятая популяция (нарис. 2.1 обозначены синими
кружками) и каждый седьмой образец изучены на
шим коллективом, хотя исследованиями в этой об
ласти занималось и занимается несколько десятков
лабораторий по всей Европе. Если добавить, что
Европа – самый изученный регион мира, то это от
части объясняет, почему именно нашим коллекти
вом предпринятобобщающий анализ генофонда Ев
ропы. Для построения картиспользованы также дан
ные Y-base не только по европейским популяциям,
но и по популяциям близлежащих регионов, входя
щих в картографируемый ареал.
Кроме 251 популяций Европы, изученных по
панелям гаплогрупп, охватывающих весь их
спектр, еще около 200 популяций были изучены
по субвариантам только одной какой-то гаплогруп
пы. В основном это статьи [Myres et al., 2010;
Underhill et al., 2010, 2014], посвященные гаплог
руппам R1b и R1a, и ряд статей по гаплогруппам
76
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
N, Е, и J. Как правило, выборки, использованные в
этих статьях для углубленного генотипирования
Но обнаружение их — только первый шаг, который
требует множество следующих шагов и усилий по
анализу большого массива самых разных популя
ций на наличие новых гаплогрупп. И пока не про
отдельных гаплогрупп, раньше уже изучались по
всему спектру гаплогрупп. Рис.2.1. дает представ
ление о плотности покрытия Европы и смежных
регионов популяциями, изученными не по одной
гаплогруппе, а по всему их спектру с обычным
уровнем филогенетического разрешения.
ведено определение их частот в широком спектре
популяций, значение этих новооткрытых гаплог
рупп для исследований генофонда невелико.
Объединяя в одной таблице данные из десят
ков статей разных лет, неизбежно оказывается, что
некоторые гаплогруппы изучены в очень большом
числе популяций, а некоторые — лишь для немно
МАССИВ ДАННЫХ ДЛЯ КАРТ: ГАПЛОГРУППЫ
Это понятие «обычного филогенетического
гих популяций. К счастью, для картографирования
это не представляет большой проблемы (уж в двух
уровня» изученности гаплогрупп очень условно, и
уровень этот растет с каждым годом. Если в 2000
году число гаплогрупп в обычной статье не дотя
гивало до десятка, то в 2010е годы большинство
статей используют панели из 40—70 гаплогрупп.
Конечно, начиная примерно с 2013 года, число из
вестных гаплогрупп, обнаруженных благодаря пол
трех десятках популяций изучены почти все ото
ному секвенированию, исчисляется уже тысячами.
неодинакова. Стоит иметь в виду и то, что любая
30°
20"
10"
бранные для картографирования гаплогруппы, а
такогочисла опорных точек обычно достаточно для
выявления основных трендов). Но все же при рас
смотрении карт стоит иметь в виду, что подроб
ность исходных данных для разных гаплогрупп
0"
10°
20'
30°
40’
50°
60°
70"
80"
90
Популяции Европы и смежных регионов,
изученные по полиморфизму
Y-хромосомы
y
* с
тя
*:
*
и цит в 1 лк с кот.
мнит т.
}
ни}}
Рут
внину?
30"
40°
50"
Рис. 2.1. Географическое положение популяций Европы и смежных регионов, изученных по полимор
физму Y-хромосомы (изученные нами популяции обозначены синими кружками).
S
кзгт
G2a
G1**
F**
N1c
N1b
N**
|+
R2
R1b1a2
R1b1a1
I2a2a
I2a1
J2
о
Е11
RJ1
1a
Р15
М285
М89
М123
1М78
М
М267
М223
Р37
М253
М124
М269
М73
SRY1532
М242
ТАТ
Р43
М231
М70
М9
70
72
().9
1.9
2.8
7.5
10.3
13.1
45.8
11.2
(2.7
3
|
64
19.3
28
45.3
.7
.3
) ()
1.8
3.5
10.5 ()
15.8
52.6
5.3
3(932.7
8
3
11.5
9
|
()
5.8
3.8
13.5
.8
.6
) ()
(6.8
|
4
8.2
2.7
1.4
4.1
11
56.2
) ()
(6.6
1
|
3.3
2.2
9.9
12.
5.5
36.3
19.8
) ()
(().8
7
|
17
8.3
11.6
35.5
3.3
33.1
).8
().9
()
4.4 ()
23.7
15.8
39.5
14
0.9
13.6
(8.2
7
2
().9
()
4.5
62.7
3.6
) ()
2.2
17.8 |
4.4
13.3
55.6
1
2.
(2.1
()
3.1
16.7
6.3
59.4
5.2
) ()
(7
4
1
07
4.2
(),7
12.6
3.5
11.9
0.7
59.4
2.8
)
48.8
2.2
(16.5
1
|
()
3.3
4.4
6.6
1.1
7.3
.4
)
19.2
(
4
5.6
3.2
().8
()
2.4
7.6
5.4
6.4
38.4
)
граопеилдзоквгорвдуынпмыиме
К
*
образцы
относятся
пF*
с
но
М89,
маркера
аллелем
12f2.
М170,
М201,
М9,
маркерам
по
аллелями
(44.4
9
|
()
46.3
7.4
)
чо-aаастотах
о
данные
Наши
2.1.
В(прYгТаблица
в
2008)).
al.,
et
усских
пхlурaлбоnмиoягкоvцрсвsиуоаkяпмнyхы
граопеилдзоквгорвдуынпмыиме по
К
*
образцы
относятся
пК°
с
но
М9,
маркеру
аллелем
М231.
92R7,
М70,
маркерам
по
граопеилдзоквгорвдуынпмыиме
К
*
образцы
относятся
пN*
с
и
М231,
маркеру
аллелем
М128.
Р43,
ТАТ,
маркерам
граредковым
К
*
образцы
относятся
пG1°
с
но
М285,
маркера
аллелем
Р20.
маркеру
по
опилзовгордунпыме
()
().8
24.6
б
01.
6
0
1
3
().
16.3
0.5
(0.4
56.5
41()
7.
.4
.3
)
33.8
9
0.б
14.2
4.8
1.3
3.9
16б
1.4
().8
5
()
16
().
75
581.
3.8
.2
.
(5.4
().8
8
5.
(б.2
4
2
7
().
()
1).8
35.5
37.5
4.2
).
.6
)
Примечания
М123
М78
3
|
Г
міте
Р4з
1дл92
p
М217
ГМ78
раза:
мlдов
М223
Р37.2
м458
Р58
дл:E9
8|
н
и
|и
1
и н
н
сR
ё
с
ё
e
е
|
a
Е.
м
J
т
b
b
a
3
н:
a
8
:
3
b
b
a
a
-
мет
м198
р15
Р297
глава
гл12
Б95
Белорусы
обл.
Брестская
22,9
35,5
7,3
17,7
1,0
до
2,1
10
0,0
||
елорус ия,
2,1
1
2
||
48
Жемяйтия
Южная
Литва,
Литовцы
12,5
29,2
37,5
2,1
53
4,2
до
0,0
н
2
н
1
1
-
3,0
1,0
б,0
обл.
Львовская
Украина,
Украинцы
бо
5,9
18,8
5,0
14,9
27,7
00
1,0
5,6
3,0
0,0
99
101
(Порхов)
обл.
Псковская
Россия,
па
0,0
пd
Русские
57
10,5
О,0
15,8
1,8
0,0
5,3
б,0
3,5
49,1
0,0
4,5
29,2
б,0
Жемяйтия
Северная
Литвa,
Литовцы
1,5
3,1
00
б,0
4,5
49,2
p,0
},0
0,0
7,7
О,0
ее
Бе49,7
Россия,
обл.
па
0,0
пd
0Русские
|
143
О,7
00
07
},0
12,5
3,5
д0
9,0
11,9
0,7
1,4
0,0
2,8
О,0
9,8
лго,0
родская
чаКо-ластотах
о
данные
Наши
2.2.
(бпYгТаблица
[народов
в
2015]).
al.,
et
uпхтsуорhлб-nосiлмиaаягковrцрясeнвиуvосаiяпкмнcихыh
Геокгарлфизчаесцкиая
лЭтное
f
N
|
Г
},
|
м173
мнот
мада
мат:
март
Ар40,7
Россия,
(Мезень)
обл.
ла
пd
Русские
|D,0
54
9,0
00
45,3
7,4
6,0
},0
од
б,0
О,0
0,0
3,7
хангельская пd
ла
й,9
14,0
0,0
31,5
79
АрРусские
Россия,
},0
||
114
(Пинега)
обл.
00
о,0
23,7
15,8
9,0
О,0
д,0
0,9
0,0
4,4
хангельская 3,3
Абр12,1
оРоссия,
6,0
00
0,0
36,3
пd
Русские
81
1,1
9,0
9,9
3,3
00
5,5
0,0
7,7
лх.а(Кнргаеснлоьбсорксакя) 0,0
rd
пd
rid
ВРусские
Россия,
6,8
00
||
121
обл.
8,3
11,5
2,0
1,7
35,5
3,3
0,8
0,0
24,0
9,1
ологодская
"
3
|н
|
2
1
||
|
2
н
1
-
Rмаза
*
12f}.1
мтп
м1то
т.1
Харь,0
Украина,
0Украинцы
|
55
обл.
12,7
00
109
25,5
3,5
до
1,8
0,0
5,5
дб
ковская 5,4
Б55
Россия,
Украинцы
обл.
9,0
21,4
5,4
00
10,7
51,8
1
41,
др
6,0
3,5
0,0
елг,4
ородская
||
100
2,0
15,0
14,0
49,0
0,0
Белорус ия,
Белорусы
обл.
Витебская
б,0
од
00
д,0
6,0
9,0
1,0
7,0
2,0
0,0
10,0
34,0
4,0
9,0
},0
00
б,0
О,0
50
Аукшайтия
Западная
Литва,
9Литовцы
0
o
6,0
32,0
2,0
0,0
8,0
,0
м13а
дават
Гла
м59
н мда
|
Че18,8
Украина,
Украинцы
обл.
22,9
3,1
0,0
6,0
},0
00
б,0
95
О,0
3,1
2,1
1,0
7,3
0,0
25,0
рниговская
мва
|
и
2,5
0,0
38
Жемяйтия
Западная
Литва,
Литовцы
p,0
2,5
5,3
00
0,0
9,0
39,5
Ив8,8
Украина,
Украинцы
обл.
17,5
25,3
0,0
3,8
1,4
21,1
2,1
6,8
0,2
0,5
д,0
5,3
1,8
0,0
57
ано-Франковская
и
8,9
25,7
},0
22,8
9,9
2,0
00
д,0
5,9
1,0
0,0
||
101
обл.
Сумская
Украина,
Украинцы
н
143
в
до
13,2
47,4
0,0
од
28,9
00
2,5
38
Аукшайтия
Южная
Литва,
Литовцы
м:5
м35
м38
и
м158
9
н
a
0,0
8,7
42,1
9,0
Хмельницкая
Украина,
Украинцы
0,9
1,2
00
од
||
179
обл.
19,0
5,1
9,5
5,6
0,6
1,1
6,7
н
|
3
1
*
|
3
1
-
0,0
|
52
Аукшайтия
Восточная
Литва,
Литовцы
9,7
27,4
48,4
8,1
1,5
0,0
6Украинцы
0
||
114
3,5
22,8
7,0
24,5
5,3
1,8
0,0
0,9
окол,
Черкасская
Украина,
,1
Кост,0
|Россия,
0Русские
|
52
обл.
9,6
115
21,2
13,5
1,9
19
3,8
11,5
ла
пd
5,8
0,0
ромская пd
ла
иd
шd
0,0
15,1
41,1
0Русские
|
73
обл.
Тверская
Россия,
00
од
4,1
82
2,7
1,4
11,0
6,8
,0
ла
шd
пd
(остров)
обл.
Псковская
Россия,
4,0
6,0
00
б,0
9,3
5,7
1,3
д,0
2,7
0,0
17,3
28,0
Русские Русские
5
7
11,2 0,0
43,0
2,8
13,1
10,3
1,9
ла
пd
0,9
7,5
до
0,0
||
107
обл.
Смоленская
|Россия,
00
ла
0,9
13,8
пd
||
110
обл.
Орловская
Россия,
00
8,2
2,7
4,5
0,9
3,5
0,0
14,5
48,2
Русские
0,2
|
45
обл.
Курская
|Россия,
2Русские
0
2
22,2
33,3
13,3
2,2
17,8
4,4
тd
пd
0,0
,0 10
ла
0,0
15,7
шd
пd
Во9ё
Россия,
обл.
од
3,1
1,0
5,3
5,2
2,1
57,3
Русские
ронежская
79
Åâðîïå
â
Y-õðîìîñîìû
ãàïëîãðóïï
Ãåíîãåîãðàôèÿ
2.2.
Q T O3
L3 L2 L1 L*
J2* J1* J1e
G1
I2a I*
R1b
N1ñ1 N1*
J2a4a J2b
G2a*
G2a1
J2a4b*
G2a1a
J2a4b1
R1a1a* R1a1a7
E1b1b1
G2a3b1 G2a3a
R1b1b2
0
3 0 4 0 03 0 1 0 0 1 00 0 0 0 0 3 44 0 0 0 0 0 12 0 1 0 1 1
8
8()
Глава 2.
Структура генофонда Европы в зеркале Y-хромосомы
L142.1, E1b1b1a1c-V22, E1b1b1b1-М81, E1b1b1c
М123, G2a1-Р16, G2a3a-М406, G2a3b1-Р303, I1
L118, I2a-Р37.2, I2b-L35, J1-L255, J1c3-Р58, J2
L228, J2a-L152, J2a3b-М67, J2a3h-L207.1, J2b
L282, L-М11, N1b-Р43, N1c-М46, О3-М122, О
М242, R1a1-L120, R1a1a1g-М458, R1a-М558, R1a
Z284, R1a-Z93, R1b1a1-М478, R1b1a2-L265, R1b
L10, R1b1a2a1a1a-М405, R1b1a2a1a1a1-М467,
R1b1a2a1a1b-Р312, R1b1a2a1a1b2a-М153,
R1b1a2a1a1b2b1-М167, R1b1a2a1a1b4b-М222,
R1b1c-V88, R2a-L266, Т-L206.
гаплогруппа состоит из многих — в том числе еще
неизвестных — субветвей. Поэтому показанная на
карте частота, как обычно в геногеографии, сфор
мирована не каким-то одним, а суммой множества
частных популяционных событий.
Для картографирования отбирались гаплогруп
пы, составляющие заметную часть генофонда хотя
бы в некоторых популяциях Европы и при этом изу
ченные, как только что было сказано, в нескольких
десятках популяций. Этим критериям удовлетвори
ли 40 гаплогрупп: Е1b1a1-DYS271, E1b1b1a1b
ГАПЛОГРУППА R1a И ЕЕ ВАРИАНТЫ
ГАПЛОГРУППА R1a
других маркеров, определяющих эту гаплогруппу,
(без подразделения на субветви)
поэтому для ее обозначения может использовать
cя любой из этих них. В массиве данных для карт
Как указывалось в обзоре предшествовавших
работ, гаплогруппа R1a является одной из двух наи
более частых гаплогрупп Европы. Более того, она
является и наиболее широко распространенной
гаплогруппой в Евразии в целом. Для ее генотипи
рования используются разные маркеры — М198,
М17, SRY1542, филогенетическая разница между
она фигурирует как R1a-L120.
На рис. 2.2 можно видеть четкий тренд геогра
фического распространения R1a-L120 хотя она
распространена по всей Европе, но обширная зона
максимальных частот находится в Восточной Ев
ропе, причем в этих популяциях она составляет
почти половину генофонда. На востоке зону мак
симума ограничивает Волга, причем на всем ее
которыми почти отсутствует, и известно множество
10"
П.01 0.03 0.05
0.1
0.15
02
0.25
0.3
0.35
0.4
0.45
0.5
о
0.55
10°
0.6
0,7
20'
30
п.8
40
50
50
70"
0.8
11 а1" i * и * * * 1.
мии I т.
и т. I, 1, т 11 п.1.
чин т ь.
0"
Рис. 2.2. География гаплогруппы R1a-L120 (R1a) Y-хромосомы в Европе.
8|
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
протяжении — от Верхней Волги до низовий. На
юге зона максимума доходит почти до Черного
моря, на северо-западе — до Балтийского моря, а
циях Европы, построение геногеографических карт
невозможно. Сейчас об ареалах распространения
довольно четко ограничена, и падение частоты на
этой субветвей можно рассуждать лишь гадатель
но, основываясь на порой зыбких сведениях о ме
стах происхождения тех единичных образцов, по
которым каждая из этих сотен ветвей была откры
та. Интерес к этой гаплогруппе столь велик, что,
конечно, такой популяционный скрининг будет
каких-то двухстах-трехстах километрах достигает
проведен разными лабораториями мира (в том чис
почти 30% (от примерно 35—45% у поляков и сор
бов до 10—15% у немцев). Анализу этой «польско
ле и нашим коллективом) в самые ближайшие годы,
немецкой генетической границы» были посвяще
порядок подробнее. Но на данный момент мы ог
ны несколько статей (Ploski et al., 2002; Кауser et
раничены теми маркерами, по которым проведен
al., 2005: Rebala et al., 2013| .
Я не упомянул еще границу зоны максималь
ных частот R1a на севере — хотя перепад частот
массовый популяционный скрининг в статьях
на юго-западе ограничивается Карпатами и Аль
пами. Но наиболее любопытны границы этой об
ласти на западе; хотя никаких географических ба
рьеров там нет, зона высоких частот R1a все равно
там не так выражен, как на западе (не от красных к
и тогда геногеография субвариантов R1a станет на
|Underhil et al., 2010; 2014) и в работах нашего кол
лектива: это три основных маркера европейской
ветви R1a и маркер азиатской ветви R1a.
зеленым, а только от красных к желтым тонам, то
есть процентов на пятнадцать), но северная гра
ница тоже выявляется на карте вполне рельефно.
"АЗИАТСКАЯ ВЕТВЬ" R1a-Z93
В данном случае она проходит внутри ареала од
Деление на европейскую и азиатскую ветви
ного народа — русского — маркируя отличия гено
проявляется на филогенетическом древе R1a очень
четко (Каmin et al., 2015). Маркером азиатской вет
фонда Русского Севера от остальных русских по
пуляций. Эти желтые тона умеренных частот за
нимают не только Русский Север, но и все про
странство Восточной Европы между Волгой и Ура
лом, и лишь за Уральским хребтом частоты R1a
падают до столь же низких значений (зеленые тона
виявляется Z93. В Европе эта ветвь приурочена
только к ее юго-восточным окраинам (Предкавка
зье, Поволжье) и почти отсутствует на основной
территории Европы (рис. 2.3; благодарю А. Штру
нова и В. Таганкина, заметивших на карте ошиб
на карте), что и в Западной Европе, Скандинавии,
Балканах и Передней Азии.
ку, которая теперь исправлена). Перейдем теперь
СУБ ВАРИАНТЫ ГАПЛОГРУППЫ R1a
"ЕВРОПЕЙСКАЯ ВЕТВЬ" R1a-М458
В пределахтакого огромного ареала гаплогруп
пы R1a-L120, несомненно, существует почти столь
же огромное число субвариантов этой гаплогруп
Первый из них, R-М458, выделяет центрально
европейский субвариант в общем массиве гаплог
руппы R1a, занимающей половину Европы. Поэто
пы, причем многие из них могут иметь четкие и
му после открытия этого маркера мы специально
к рассмотрению европейских ветвей.
сравнительно небольшие географические ареалы.
генотипировали его во многих славянских и севе
Но в течение долгого времени субтипы в пределах
R1a были неизвестны. Пока, благодаря работам
рокавказских популяциях, что позволило впервые
построить подробную карту его распространения с
лаборатории Реter Underhill в Стэнфордском уни
учетом Восточной Европы и Кавказа (рис. 2.4).
верситете, не были открыты сначала первые два, а
потом и еще несколько субвариантов. Конечно, в
настоящее время число известных субвариантов
R1a исчисляется сотнями: каждый образец, для
тоты этого маркерау западных славян (поляков и
чехов), где он составляет четверть генофонда, и
которого проведено полное секвенирование всего
пуляциях. Распространение этого маркера наза
генома или Y-хромосомы, образует свою ветвь на
пад ограничено прилежащими популяциями нем
филогенетическом древе. Но пока хотя бы для не
их распространенности в популяциях и не опреде
цев (вероятно, ассимилировавших западнославян
ские группы, ранее населявшие эти территории).
Зато на восток зона высоких частот гаплогруппы
лены частоты их встречаемости в разных популя
R-М458 распространяется далеко, захватывая
которых из этих вариантов не проведен скрининг
Карта демонстрирует наиболее высокие час
несколько сниженные частоты в окружающих по
* Отметим в скобках, что объективная приуроченность данной гаплогруппы к славянским популяциям на дан
ной весьма
ТеЛЬСКИХ
ограниченной территории,
форумах в
к сожалению, стала одним из поводов к столь распространенному на люби
интернете навешиванию «славянского» ярлыка на всю гаплогруппу R1a. Но такая привязка
гаплогруппы — на всем протяжении ее
евразийского
ареала в пространстве и несоизмеримого со славянством
протяженного существования во времени — к одной лишь славянской лингвистической группе, увы, уже не только
граничит солженаукой, но и переходит эту грань.
82
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
50
40"
30
20"
1g-
0
10°
20'
30"
мо"
во
во"
ту
80
99"
100"
R-293
D.Dт 9.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
п.4
0.45
д.5
0.55
0.8
0.7
0.8
0.9
*
", мм и " т. мн.
*
ал
ч. ч.
чт. м
-
с.
g"
19-
29"
30"
-
40"
50"
Рис. 2.3. География гаплогруппы R1a-Z93 Y-хромосомы в Европе.
50-
40"
30"
20"
10"
0"
по
20°
30'
до
50
50-
ту
o 01 0 03 0.05 0.1 0.15 02 о 25 оз оз5 04 0.45 0.5 055 об от оз о е
С
-
11илт в т. д. и к шин.
смутмос"
милт".
члит тт.
в изученные популяции
0"
Рис. 2.4. География гаплогруппы R1a-М458 Y-хромосомы в Европе.
80"
90"
100"
83
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
весь ареал восточных славян. Характерно, что эта
восточная экспансия более выражена в лесостеп
ной зоне (у украинцев), чем в лесной (белорусы и
русские). Еще более любопытным представляет
ся ограниченность экспансии на юг: у южных
славян и неславянских народов Балкан (венгры,
румыны) частота этой гаплогруппы мала, причем
прослеживается соответствие генетической «гра
ницы» высоких частот R-М458 и географической
границы Карпат. К северу от этого горного хреб
та расположена зона максимальных частот гап
"ЕВРОПЕЙСКАЯ ВЕТВЬ" R1a-М558
Второй европейский субвариант R1a обозна
чается по названию маркера R-М558 (рис. 2.5.).
Филогенетически он братский (для мтДНК в та
ких случаях принято говорить «сестринский», но
тут речь идет о Y-хромосоме) для R-М458. Оба этих
маркера распространены сходным образом: R
М558 тоже распространен преимущественно в Во
сточной Европе, тоже реже встречается на Балка
нах, заходит с низкими частотами в соседние об
логруппы, а к югу от Карпат частота резко сни
жается. По-видимому, Карпаты выступили в роли
ласти Западной Европы, и так же, как и R-М458,
географического барьера для потока генов, пре
Ареалы этих субтипов перекрываются и по зоне
пятствуя распространению этой гаплогруппы на
Балканы. Отметим, что в отличие от R1a в целом,
встречающейся хотя бы с низкими частотами в
любом регионе Европы, R-М458 распространена
только по всей Восточной Европе, соседних тер
риториях Западной Европы и на Балканах, но
практически полностью отсутствует на большей
части Западной Европы — Пиренейском полуост
рове, Франции, Британских островах, значитель
ной части Аппенинского и Скандинавского полу
островов, а также отсутствует за пределами Ев
ропы — и в Передней Азии, и в Сибири.
0,01
0.03 0,95
0,1
0,15
0,2
0,25
9,3
9,35
п.4
с,45
a,5
9,55
практически отсутствует за пределами Европы.
их максимальных частоту западных и восточных
славян. Основное различие между паттернами рас
пространения R-М458 и R-М558 состоит только в
большей приуроченности к западной или восточ
ной части их общего ареала.
R-М458, в отличие от R-М558. имеет склон
ность к западу ареала. У западных славян встреча
ется в среднем счастотой 25% (т.е. четверть гено
фонда), а у восточных славян в среднем встреча
ется с частотой 15%, хотя и повышается до 23% у
западных белорусов и у некоторых украинских
популяций (но не западных, а центральных).
а.е
от
0,8
0,9
*
вхтмце"
ммрт.
и на т и т. д. и книг.
мим ти.
в наученные популяции
|
-
I
0-
1"
Рис. 2.5. География гаплогруппы R1a-М558 Y-хромосомы в Европе.
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
84
R-M558 имеет склонность к востоку их общего
ареала. Он встречается с частотой выше 30% в обе
их изученных по этому маркеру популяциях южных
русских; составляет 20–25% у белорусов, поляков,
словаков, западных украинцев; снижается ниже (или
значительно ниже)20%у центральных русских, че
хов, центральных и восточных украинцев и чехов.
Впрочем, R-M558 изучен в значительно меньшем
числе популяций, чем R-M458, и поэтому карта его
распространения можетеще значительно уточнить
ся в будущем. Мы видим, что даже это основное
различие между паттернами распространения R
M458 и R-M458 выражается в небольших различи
ях частот и имеет довольно сложную географию.
Этот пример ясно показывает, что повышение
филогенетического разрешения далеко не всегда
приводит к повышению географического разреше
ния: хотя в пределах европейской ветви R1a иуда
лось выделить два субтипа, но их географическое
распространение очень сходно. По всей видимос
ти, они возникли в родственных популяциях и рас
пространялись совместно, в ходе одних и тех же
миграций. Или же, возникнув даже в разных час
тях ареала популяций, интенсивно обменивавших
ся миграциями друг с другом, они распространи
лись в пределах всего этого ареала. Конечно, по
вышать филогенетическое разрешение необходи
мо, и, как правило, выделяемые субтипы имеют
более четкую географическую привязку, чем ветвь
в целом; субтипы следующего уровня имеют еще
более узкую зону распространения в пределах зон
субтипов предыдущего уровня и так далее. Но эта
географическая четкость зависит не только и даже
не столько от уровня филогенетического разреше
ния, сколько от структуры генофонда, от истори
чески заданного соотношения изоляции и метиса
ции, то есть, в терминах популяционной генетики,
от баланса дрейфа генов и миграций.
Если этот баланс сдвинут в сторону изоляции
(как на Кавказе или в Сибири), то частоты гаплог
рупп будут резко различаться между популяция
ми, гаплогруппы будут иметь географически узкие
ареалы, мало перекрывающиеся друг с другом, и
гаплогруппы будут достигать очень высоких час
тот в «своих» популяциях. Если же баланс сдви
нут в сторону миграций, то частоты будут разли
чаться не столь драматически, ареалы будут до
вольно широкими и перекрывающимися друг с
другом, а субгаплогруппы достигать не слишком
высоких частот, потому что остальная часть гено
фонда будет представлена другими гаплогруппа
ми, ареалы которых заходят на эту же территорию.
Все эти черты хорошо видны на примере R-M458
и R-M558, потому что сдвиг баланса в сторону не
изоляции, а миграций особенно характерен имен
но для Европы.
ЕВРОПЕЙСКАЯ ВЕТВЬ R1а-Z284
Зато еще один субвариант R1a – гаплогруппа
R-Z284 (рис. 2.6.) – имеет совершенно другой пат
терн, который можно назвать «скандинавским» или
«североевропейским». По имеющимся на настоя
щий момент данным [Underhill et al., 2014] его ча
стота составляет 20% в Норвегии, 7% в Дании, и
по 3% в Англии и Швеции, а за пределами Север
ной Европы R-Z284 встречена лишь у единичных
образцов. Эти частоты наверняка скорректируют
ся в ходе изучения новых популяций и увеличения
объемов выборок уже изученных народов, но об
щая приуроченность к популяциям Северной Ев
ропы несомненна уже сейчас.
ГАПЛОГРУППА R1b И ЕЕ ВАРИАНТЫ
ГАПЛОГРУППА R1b (В ЦЕЛОМ)
Гаплогруппа R1b, «братская» по отношению к
гаплогруппе R1a и вторая среди наиболее частых
в Европе, имеет тоже широкий ареал (рис. 2.8), од
нако основная зона её максимальных частот при
ходится на Западную Европу. Важным вкладом в
изучение генофонда Европы стало открытие но
вых информативных SNP маркеров в пределах од
ной из ветвей гаплогруппы R1b – гаплогруппы R
М269 (на картах обозначена с помощью филоге
нетически близкого маркера как R-L265). Это мас
штабное исследование выполнено большим меж
дународным коллективом с участием автора и
опубликовано в[Myres et al., 2010].
Карта распространения гаплогруппы R1b в
целом (R-L10, рис. 2.8) ярко показывает, что это
основной компонент, составляющий более поло
вины Y-хромосомного генофонда Западной Евро
пы. Лишь население южной части Аппенинского
полуострова несет сниженные частоты этой гап
логруппы, поскольку у них преобладают средизем
номорские гаплогруппы, да еще Скандинавия по
географии гаплогрупп относится не к Западной
Европе, а формирует самостоятельный северный
домен, в котором преобладает иная гаплогруппа–I1.
Гаплогруппа R1b даже в большей степени
свойственна Западной Европе, чем R1a свойствен
на Восточной, поскольку R1b во многих популя
циях (Британские острова, баски и ряд других по
пуляций Пиренейского полуострова) составляет
даже не половину, а более двух третей генофонда.
В целом, тренд гаплогруппы R1b – максимальные
частоты у басков и постепенное снижение часто
ты к востоку от Пиренейского полуострова – очень
напоминает географию классического маркера Rh
85
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
СУБВАРИАНТЫ ГАПЛОГРУППЫ R1b
d (резус-фактор). Всплеск частоты на востоке Ев
ропы отражает повышенную частоту R1b у неко
торых популяций башкир, известную из работы
|Лобов, 2009). Впрочем, нашим коллективом сей
час завершается подробное исследование разно
образия Y-хромосомы в популяциях башкир (бо
лее 1000 образцов). В этом исследовании выявле
но, что частота R1b великатолько в немногих
родовых группах, тогда как для большинства ро
довых групп башкир характерны другие гаплог
руппы, а частоты R1b у них невелики. Поэтому
всплеск R1b на востоке Европы отражает не об
щеевропейскую закономерность, а лишь локаль
Карты на рис. 2.9, 2. 10 и 2.11 показывают три
основные ветви R1b (Рис. 2.7), которые — со мно
жеством оговорок — можно назвать африканской,
степной евразийской и западноевропейской гаплог
руппами. Действительно, когда мы смотрим на кар
ту R1b в целом (рис. 28), то видим ее наличие в
том числе и в Северной Африке.
R1b-110
\/88
ные закономерности происхождения отдельных
М478
L265
родовых групп степных популяций Евразии.
Хотя R1b достигает высоких частот в основ
М405
Р312
ном в Западной Европе, карта (рис. 2.8) показы
вает, что она (как и R1a) распространена повсе
М467
М167
М222
местно, занимая весь картографированный ареал
М153
и уходя далеко за его пределы по Евразии. Счита
ется, что R1b имеет переднеазиатское происхож
Рис. 2.7. Филогенетическое дерево гаплогруппы
R1b-L10. Нарисунке показаны только ветви, которые под
дение, и разные ее ветви распространились по раз
личным уголкам Старого Света, но особенно «по
везло» лишь той ветви, которая распространилась
в Европе и достигла в ней столь значительных
робно рассматриваются с помощью геногеографических
карт, структура схемы соответствует полному дереву гап
логруппы R1b-L 10 по версии ISОGG на октябрь 2015 г
ЧаСТОТ.
8"
0,01
0.03 0,95
0,1
0,15
0,2
0,25
:ь
в.3
a,35
п.4
0,45
a,5
9,55
9,8
0,7
9.8
0,9
и на т и т.д. и книг.
мим ти.
и
скит "мом
? :
*}, г
x
:
}
}
-
в наученные популяции
м
|
в"
Рис. 2.6. География гаплогруппы R1a-Z284 Y-хромосомы в Европе.
99"
100"
86
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
п.6
0,7
д.8.
д.?
11 нит в 1, д. ч. 1, чит.
мнит т.
б"
Рис. 2.8. География гаплогруппы R1b-L10 Y-хромосомы в Европе.
50-
40"
30"
29"
10"
п"
по
2о
30°
40’
50°
50'
ту
0.1
0.15
0.2
0.25
0.3
0,35
п.4
0,45
0.5
9у
ипп"
R-V88
-
0,01 0.03 0.05
80"
0.55
0.5
0.7
0.8
0,9
-
-
*
},
и им "ц", кн. кил1.
вхтwwwв"
.ч. и т.
т.
мнъти.
*** "1.
Рис. 2.9. География гаплогруппы R1b-V88 Y-хромосомы в Европе.
.
87
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
"АФРИКАНСКАЯ ВЕТВЬ" R1b-V88
"ЗАПАДНОЕВРОПЕЙСКАЯ ВЕТВЬ" R1b-L265
Карта R-V88 (рис. 2.9) как раз и показывает час
тоты пустьи невысокие (1—6%, с повышением до 26%
только в одной популяции), но зато по всей Север
ной Африке (от Марокко до Египта), и почти полное
отсутствие этой гаплогруппы в Европе и в Азии. То
есть «африканская» часть R1b — это почти исключи
тельно ветвь R-V88. Своего максимума она достига
Третья из основных ветвей гаплогруппы R1b —
гаплогруппа R-М269, или, как её здесь обознача
ем на картах, R-L265 — составляет основную (по
частоте и ареалу) часть R1b. Поэтому карта ее рас
пространения (рис. 2.11) в целом вторит карте L10,
ет далеко за пределами картографируемого ареала —
в Центральной Африке (Сruciani et al., 2010).
рупп, многие из которых специфичны для той или
иной территории в пределах ареала ветви. Оста
"СТЕПНАЯ ВЕТВЬ" R1b-М478
Карта следующей ветви — R-М478 — показыва
ет ее приуроченность к степным популяциям Ев
разии (рис. 2.10). Зона ее максимальных частот
также находится по большей части за пределами
картографируемого ареала — на пространствах от
Урала до Алтая. Впрочем, как можно видеть на
карте, отдельными «языками» эта гаплогруппадо
ходит и до Кавказа, оставаясь приуроченной к степ
ным областям Южного Урала и Предкавказья, и
составляя только 1—10%, редко в каких популяци
ях до 20% генофонда.
лишь без африканской части ее ареала. Эта гап
логруппа подразделена на множество субгаплог
новимся на двух основных ветвях внутри R-L265:
центральноевропейской гаплогруппе R-М405 и её
пиренейско-британском «брате» R-Р312 со всеми
их «сыновними» ветвями (рис. 2.12—2.17).
"ЦЕНТРАЛЬНОЕВРОПЕЙСКАЯ ВЕТВЬ" R1b-М405
в целом
Гаплогруппа R-М405 (рис. 2.12) встречается
практически по всей Западной, Центральной и Се
верной Европе (за исключением южных областей
Пиренейского и Аппенинского полуостровов, а так
же Балканского полуострова — на юге, Финляндии
и Кольского полуострова — на севере), а также и в
19"
п.01 0,03 0.05
0,1
0,15
п.2
п.25
п.3
п.35
п.4
п.45
0,5
п.55
0.5
0.7
20
39
0.8
40°
50′
50-
то-
0.9
Рейкьявик,
и ни и т. к.
ни т.
чини и т.
о"
Рис. 2.10. География гаплогруппы R1b-М478 Y-хромосомы в Европе.
55-
g0"
н00
88
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
19"
20
39
40°
50'
во
R-L265
д.ии
и,p3 0.05
0.1
о.15
п.2
и 25
п.3
п.35
п.4
п.45
0,5
a.55
и5
0.7
о.8
0.8
иниц в 1. М. и к чит.
мии и т.
в наученные популяции
г.
Рис. 2.11. География гаплогруппы R1b-L265 Y-хромосомы в Европе.
40"
0,01 0,03 0.05
0.1
0.15
30
0.2
0.25
0.3
2o"
0,35
0,4
0,45
10"
0.5
п"
0.55
по
0.5
2о
0.7
30°
40’
50°
50'
70-
0.8
11 и 11,1 м; и кии 1.
мнь и т.
Рис. 2.12. География гаплогруппы R1b-М405 Y-хромосомы в Европе.
80"
ст
89
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
западной части Восточной Европы. Однако с мак
симальными частотами (18—36%) гаплогруппа R
М405 встречается преимущественно в населении
Центральной Европы (на территории Германии,
Швейцарии, Бельгии, Голландии, Дании и юге Бри
тании). Датировки как возникновения, так и выде
ления внутренних субвариантов гаплогруппы R
М405 по данным wwwyfull.com составляют около
5 тыс. лет назад (в интервале 4,4—5,3 тыс. лет на
зад), т.е. приходятся на бронзовый век. Похоже, что
графии (не самые обширные, по европейским мас
штабам, территории вокруг Северного моря) — тем
не менее представляет интерес. География гаплог
руппы R-М467 наводит на предположение о миг
рации её носителей стерритории современной Гер
мании вдоль Северного моря к берегам Британс
ких островов. Датировки для гаплогруппы R
М467, представленные на сайте www.yfull.com,
указывают на её возникновение около 4,7 тыс. лет
уже в это время происходили и миграционные про
экспансии (разделения на субветви) спустя тыся
цессы, приводящие к распространению гаплогруп
чу лет — около 3,4 тыс. лет назад (в интервале от
2,8—4,0 тыс. лет назад). Сопоставляя ареал гаплог
пы R-М405 в разные части Европы. Не исключено,
что данные по гаплогруппе R-М405 указывают на
один из эпизодов распространения носителей индо
европейских языков на территории Европы. На одно
из направлений распространения носителей гаплог
назад (в интервале 4,1—5,4 тыс. лет назад), а время
руппы R-М467 на карте с указанными датировка
ми возникновения и распространения, можно пред
положить две модели появления такой ситуации.
Первая — когда миграционные процессы с терри
тории центральных областей современной Герма
нии времен бронзового века прошли вдоль берега
Северного моря к Британским островам и остави
ли свой след в современном генофонде. Вторая —
когда эта гаплогруппа могла быть распространена
руппы R-М405, возможно, указывает география
одной из её субветвей — гаплогруппы R-М467.
«ГЕРМАНО-БРИТАНСКАЯ» ВЕТВЬ R1b-М467
Скромное распространение гаплогруппы R
М467 (рис. 2. 13) — как по её частотам (от максиму
ма4% в восточной Германии через значения около
3% в северной и южной Германии, Голландии и на
юге Британии до 0,5% во Франции), так и по гео
несколько шире на юг, запад и восток, но в резуль
тате прихода туда другого населения и без того
невысокая частота гаплогруппы R-М467 снизилась
на юге до величин, почти не улавливаемых при те
кущих объемах выборок.
пг
и,и
т.03 a.j5
а. 1
9.15
0:
0.25
0.3
0,35
п.4
с,45
9,5
9,55
а.ё
от
0.8
0,9
},
ал
и на "ц и д: не кии 1.
тактудuтво
моть
мии и т.
*
с
":
*.
иl
=
*
=
н
*
г
Рис. 2.13. География гаплогруппы R1b-М467 Y-хромосомы в Европе.
90
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
"ПИРЕНЕЙСКО-БРИТАНСКАЯ ВЕТВЬ" R1b-Р312
R1b на карте гаплогруппы R-Р312 сокращается
до небольшого «глазка» в точке для северных баш
кир, которую со всех сторон обтекают области
низких частот (не более 3%).
Гаплогруппа R-Р312, таким образом, охваты
вает значительную часть как разнообразия всей
гаплогруппы R-L265, так и её ареала. Можно
в целом
Распространение гаплогруппы R-Р312 (рис.
2. 14) интересно тем, что во многом отражает об
щие особенности распределения в населении Ев
ропы как своей предковой гаплогруппы R-L265,
так и всей гаплогруппы R1b в целом. Самые вы
предполагать, что в таком случае внутри гаплог
сокие частоты гаплогруппы R-Р312 на самом за
руппы R-Р312 тоже существует ряд локальных
субветвей с более узкими ареалами. И это пред
паде Европы (Пиренейский полуостров, террито
рия западной Франции, Британские острова) с по
положение оправдывается: на сегодня известно
степенным снижением частоты к востоку и ло
пять больших ветвей, которые в свою очередь под
разделяются на несколько десятков более глубо
кальный всплеск в южном Приуралье — это почти
те же особенности, которые были описаны выше
при характеристике ареала гаплогруппы R1b в
целом. Однако следование общему тренду совсем
не значит полное сходство. Так, обширная область
красно-фиолетовых оттенков (частоты 50—75%) на
территории большей части Западной Европы, ко
торую наблюдали ранее на картах гаплогрупп
R1b-L10 и R-L265 (рис. 2.8 и рис. 2.11), на карте
гаплогруппы R-Р312 (рис. 2. 14) превращается в
локальный всплеск частоты (до 75%) на севере
Британских островов и область желто-красных
оттенков (частота 30—50%) на территории Пире
нейского полуострова и Франции. Южноуральс
ких. Однако остановимся только на трех ветвях
R-Р312, распространение которых в Европе хо
рошо изучено: гаплогруппа R-М167 и ее субва
риант R-М153, а также гаплогруппа R-М222 (рис.
2.15-2.17).
«БАСКО-РОМАНСКАЯ» ГАПЛОГРУППА R1b-М167
Такое название для гаплогруппы R-М167услов
но: её география (рис. 2.15) охватывает население
Пиренейского полуострова и Западной Франции,
небольшую область на юге Германии и единичный
«глазок» в Голландии, а еще область в Западном
Причерноморье (румыны и болгары). Большинство
кий красно-фиолетовый всплеск общей частоты
50-
4]"
30"
20"
нр"
й"
19"
20
39
40°
50′
50-
то-
89"
g0"
R-Р312
г.и
m,p3 0.05
0,1
0,15
п.2
и 25
п.3
п.35
п.4
п.45
0,5
п.55
п.5
0,7
0,8
п.3
сс
Рейкьявик
и ни и т. к.
ни т.
ектечu"но
мньи т.
мии и т.
о"
Рис. 2.14. География гаплогруппы R1b-Р312 Y-хромосомы в Европе.
>.
*
н00
91
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
ареала гаплогруппы, таким образом, населяют на
роды, говорящие на языках романской (испанцы,
португальцы, французы и румыны) группы индо
европейской языковой семьи и баскской языковой
семьи. Впрочем, южные немцы и болгары, у кото
рых тоже встречена гаплогруппа R-М167, говорят
на языках иных групп индоевропейской семьи.
Область максимальных частот гаплогруппы R
М167 (желтовато-зеленоватые тона на рис. 2.15,
ях этого народа. Возраст возникновения этой гап
логруппы по данным www.yfull.com составляет
около 2,5 тысяч лет (в пределах от 3500 до 1500
лет назад). Иными словами, эта гаплогруппа, ве
роятнее всего, появилась в популяциях Пиренейс
ких гор на заре нашей эры и успела распростра
ниться по обе стороны горного хребта (причем эф
фективнее — к югу от Пиренеев) в результате ло
кальных миграций.
частота гаплогруппы от 6% до 25%) охватывает
"БРИТАНСКАЯ ВЕТВЬ" R1b-М222
территорию Пиренейского полуострова и юго-за
падной Франции. Эта же область является един
ственной территорией распространения дочерней
Удивительной, только не по широте ареала, а
гаплогруппы R-М167 — субварианта R-М153 (рис.
как раз по его компактности, можно считать гап
2.16).
логруппу R-М222 (рис. 2. 17). Распространение
этой гаплогруппы практически исключительно на
Британских островах наводит на предположение
о ее местном происхождении. Согласно оценкам
"БАСКСКАЯ" ВЕТВЬ R1b-М153
www.yfull.com, экспансия гаплогруппы R-М222
Как можно проследить по карте (рис. 2.16), гап
логруппа R-М153 своей максимальной частоты
(почти 16%) достигает у басков, в два раза реже
встречается в населении испанских Пиренеев, и с
очень низкими частотами (1—3%) охватывает ос
тавшуюся часть своего ареала. Из-за такой геогра
фии гаплогруппу R-М153 можно условно назвать
«баскской» и предположить, что она появилась и
датируется всего лишь 1,8 тыс. лет назад (в интер
вале 1,3—2,4 тыс. лет назад). Иными словами, гап
логруппа появилась в популяциях Британских ос
тровов во 2 тыс. до н.э., а миграции, которые рас
пространили её, происходили в начале нашей эры,
то есть примерно в римское время.
Пример филогеографии гаплогруппы R-L265
показывает, сколь подробная генетическая инфор
распространялась преимущественно в популяци
д
по
за
30-
40°
50′
55-
ту
0,03 а.j5
0.1
0.15
0:
0.25
0.3
0,35
п.4
0,45
0,5
a.55
0.5
0.7
0.8
0,9
11 на "1,1 д: + кнk 1.
-
99"
R-М167
гг
г),и
80"
--.
в наученные популяции
о"
Рис. 2.15. География гаплогруппы R1b-М167 Y-хромосомы в Европе.
ира"
92
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
10"
20'
30"
to
50
50
70
R-М153
п.0и 0,03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.55
0.5
0.7
0.8
0.9
:
:
илт и т.д. и китт.
*
мии тт.
*/
2:
с
в изученные популяции
п"
-
Рис. 2.16. География гаплогруппы R1b-М153 Y-хромосомы в Европе.
50"
30"
*п"
20"
10"
с
10°
20'
30"
to
50°
50'
тр"
-
0.01 0.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
п.45
0,5
0,55
0.5
0.7
0.8
0.9
рвакья
11илт и т. д. и килт
*
ал
*:
e
и т.1, т.1 инт 1.
мии и т.
—
в изученные популяции
Рис. 2.17. География гаплогруппы R1b-М222 Y-хромосомы в Европе.
8"
*
исс"
93
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
мация скрывается в пределах каждой гаплогруп
пы Y-хромосомы. Остается надеяться, что по мере
накопления данных по полным геномам будут об
наружены информативные маркеры и в пределах
низкими частотами (менее 3%) лишь на севере
Аппенинского полуострова и в Сардинии, у по
других гаплогрупп.
лее высокой частотой 5% гаплогруппа R2 (R
L266) замечена в юго-восточной Турции, с час
тотой 6% — у калмыков. Такая скудная геогра
фия гаплогруппы в пределах картографируемо
го ареала, пожалуй, неудивительна: ведь основ
ной ареал R2 (R-L266) охватывает далекие тер
ритории Индийского полуострова и Центральной
Азии, а с низкими частотами гаплогруппа дохо
дит до Китая на востоке и до Юго-Западной Азии
пуляции турок вблизи пролива Дарданеллы, в
центральной Анатолии и Закавказье. С чуть бо
"ИНДИЙСКАЯ" ГАПЛОГРУППА R2 (R-L266)
Гаплогруппа R2 (R-L266) происходит из того
же корня, что и гаплогруппа R1, давшая начало
гаплогруппам R1a и R1b. Карта распростране
ния гаплогруппы R2 (R-L266) (рис. 2. 18) пока
зывает, что для народонаселения Европы в це
лом R2 не характерна: она встречается с крайне
— на западе своего ареала.
ГАПЛОГРУППА I И ЕЕ СУБВАРИАНТЫ
Продолжая тему о высокой информативности
выделения субтипов и анализа их географического
распределения, напомню ставшую классическойра
боту (Rootsi et al., 2004), в которой гаплогруппа I
М170 была филогенетически подразделена на три
субтипа. Оказалось, что эти субтипы имеют совер
кализована преимущественно в Северо-Западной
Европе. Именно после этой работы и ряда ей по
добных стало ясно, что обнаружение новых SNР
маркеров, подразделяющих гаплогруппу на субвет
ви, является магистральным путем повышения ин
шенно различную географическую приурочен
ность: гаплогруппа I1-М253 (на картах — I-L118)
формативности анализа Y-хромосомы. Но долгое
время движение по этому пути было медленным, и
лишь после внедрения полного секвенирования Y
приурочена к северной Европе, I2a-Р37 — к Балкан
хромосомы новые маркеры стали накапливаться ла
скому региону, а I2b-М223 (на картах — I-L35) ло
винообразно. Так, в течение долгого времени неуда
5"
4"
30"
2a"
1g-
с"
10"
*
30"
40°
50'
во"
70"
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0,45
0.5
=
0.55
0.5
0.7
0.8
0.9
|
-
*/
100"
R-L266
|
П.01 0.03 0,05
gи"
89"
инь 1'1, 1 д: не к на 1.
(
*
схемцумо мо"
\} ,
}
:
т.
мими 1.
-r:
с
0
Рис. 2.18. География гаплогруппы R2-L266 Y-хромосомы в Европе.
|
н
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
94
валось обнаружить новые SNР маркеры в пределах
гаплогруппы I, или же новые открываемые SNР
маркеры не выделяли новых ветвей с четкой гео
графией. Например, в работе (Underhill et al., 2008)
были обнаружены новые маркеры и реорганизова
на топология ветвей гаплогруппы I-М170, но сохра
нились, пусть под новыми названиями, те же три
основные ветви, а новые обнаруженные варианты
были редкими и не характеризовались четкими гео
графическими трендами.
"СКАНДИНАВСКАЯ" ГАПЛОГРУППА I-L118
Карта распространения «скандинавской» гап
логруппы I-L118 (1-М523. рис. 2. 19) показывает ее
гов» могло оказаться более значимым ДЛЯ Меньших
по размеру популяций Заволжья.
"БАЛКАНСКАЯ" ГАПЛОГРУППА I-Р37
Карта распространения «балканской» гаплог
руппы I-Р37 (рис. 2.20) показывает ее высокие ча
стоты также и в Италии. В целом, эта гаплогруппа
распространена практически по всей Европе, кро
ме Скандинавии. В Восточной Европе плавный
градиент убывания ее частоты с юго-запада (с Ук
раины) к северу и востоку очень напоминает карту
первой главной компоненты по классическим ге
нетическим маркерам (Рычков и др., 2002). Также
стоит отметить достаточно выраженное совпаде
максимальные частоты не только в географичес
кoй Скандинавии, но и на территориях, тесно свя
ние ареала этой гаплогруппы с географическими
занных с ней исторически: Дании, Шотландии, за
падных районах Финляндии. Поэтому любопытна
область умеренных частоту русских популяций к
северу от Волги, выделяющаяся на фоне низких
частоту большинства славянских популяций.
Нельзя исключать, что это отражает исторические
черноморье гаплогруппа очень редка на Северном
КОНТаКТЫ С
норманнскими популяциями. Хотя
границами Европы — при высокой частоте в При
Кавказе и почти отсутствует в Закавказье, а при
максимальных частотах на Балканах очень редка в
соседней Малой Азии.
"ВАРЯГО-ГРЕЧЕСКАЯ" ГАПЛОГРУППА I-L35
эти
контакты были более интенсивны для северо-за
падных русских популяций (на пути «из варяг в
греки»), но территории северо-запада были срав
Вдоль берегов Северного и Балтийского морей,
и немного вглубь от них - так можно было бы опи
нительно густо населены, поэтому влияние «варя
бы еще не два дополнения на северо-востоке и юго
0,01 0.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
0.55
сать географию гаплогруппы I-L35 (I2b-М223), если
0.8
0.7
0.8
0.9
5.
Рейкьявик,
1111т и т. д. и к цит
чли? Т. 1.
и т.п, т, и инт 1. 3,
.
мии и т.
}
в нзученные популяции
|
0"
Рис. 2.19. География гаплогруппы I-L118 (I1-М253) Y-хромосомы в Европе.
95
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
10
0,01 0.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
п.4
0.45
0.5
0.55
9.8
20'
0.7
30"
0.8
40
50
50"
то"
80"
g0'
100"
0.9
д.
плитт и т. д.
к ци и.
„кумихио мо"
мнат м.
g"
Рис. 2.20. География гаплогруппы I-Р37 (I2a) Y-хромосомы в Европе.
востоке. Хотя максимум частоты гаплогруппы I-L35
(17%) отмечен в Швеции (рис. 2.21), зона более ред
кой встречаемости гаплогруппы (3—7%) охватыва
ет северную часть Центральной Европы, на юго
востоке отдельной областью очень низких частот (1—
3%) охватывает Балканский полуостров и западную
часть Малой Азии, а на северо-востоке проявляет
ся у русских популяций Тверской и Костромской
областей. Можно заметить, что ареал гаплогруппы
I-L35 — довольно умеренный и однородный по зна
чениям частот гаплогруппы (на большинстве ареа
ла частота варьирует от 2—3% до 7%, только пик в
Швеции до 17%) — связывает несколько крайних
областей Европы: Скандинавию, северные районы
Восточной Европы и восток Южной Европы. Впол
не возможно, что география гаплогруппы I-L35дей
ствительно отражает один из генетических следов
торговых путей между севером и югом Европы. Не
менее вероятно, что каждая из этих зон связана со
своим субвариантом этой гаплогруппы.
ГАПЛОГРУППА N И ЕЕ СУБВАРИАНТЫ
Гаплогруппа N в пределах Европейского реги
она представлена двумя большими ветвями — гап
логруппами N1c и N1b (далее и на картах N-М46
и N-Р43 соответственно). Хотя общие ареалы этих
двух гаплогрупп в Европе пересекаются, зоны их
максимальных частот разграничиваются на севе
"СЕВЕРОЕВРОПЕЙСКАЯ" ЗАПАДНАЯ
ГАПЛОГРУППА N-М46 (N1c)
Карта распространения гаплогруппы N-М46
(рис. 2.22) показывает ее максимальные частоты у
финнов. Ее частоты высоки и у других популяций
ре рекой Печорой, а южнее — Уральским хребтом:
северо-востока Европы. Хотя в целом эта гаплог
к западу от этой условной "границы остаются
руппа оказывается приуроченной к финно-угорс
зоны повышенной встречаемости гаплогруппы N
М46, а к востоку — зона максимальных частот N
ким популяциям, но она столь же часта и у север
Р43. Рассмотрим географию этих двух "братских"
миляцией дославянского населения, как будет опи
сано в следующих главах). Наиболее любопытным
ветвей гаплогруппы N чуть подробнее.
ных русских (что, по-видимому, объясняется асси
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
96
50
30
20
10
10°
0
20'
30"
to
50
50
70"
80"
90"
|-L35
0,01 д.03 0.05
0.1
от от о 25 оз оз5 ол для об ов, ов
0.7
0.8
0.9
РейкьяЕй
ти чит" и т. д.
и т.
мнати.
0
Рис. 2.21. География гаплогруппы I-L35 (I2b-М223) Y-хромосомы в Европе.
50
30"
40"
20"
1"
п-
10°
20'
30"
до
50
50
ту
80"
n-м46
0,01 п.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
п.4
п.45
п.5
1141 т а т. д. и к ци и.
0.55
0.8
0.7
0,8
0,9
т.x" тwwwво
моте
чли? Т. 1.
и т.п, т, и инт 1.
мии "1.
Рис. 2.22. География гаплогруппы N-М46 (N1c) Y-хромосомы в Европе.
100"
97
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
представляется область высокой частоты этой гап
логруппы у балтов (латышей и литовцев). В дан
дают с лингвистическими граница ареалов бал
лее узкий ареал. Максимальные частоты этой гап
логруппы наблюдаются на крайнем северо-вос
токе Европы и плавно переходят в мировой мак
симум этой гаплогруппы в Западной Сибири. С
тов и западных славян совпадает с резко выражен
умеренными частотами эта гаплогруппа распро
ным «обрывом» частоты гаплогруппы. Похожая
картина наблюдается и на границе с белорусами.
«СЕВЕРОУРАЛЬСКАЯ» ГАПЛОГРУППА N-Р43
странена по всему Уралу и Приуралью. Заметен
убывания частоты к западу и
югу, так что у популяций Центральной России и
нижней Волги эта гаплогруппа еще встречается
Карта распространения гаплогруппы N-Р43
пуляций Европы практически полностью отсут
ном случае генетические границы хорошо совпа
плавный градиент
(хотя и с минимальным частотами), а у других по
(рис. 2.23) выявляет также северный, но куда бо
ствует.
ГАПЛОГРУППА E И ЕЕ СУБВАРИАНТЫ
"Восточно-СРЕДИЗЕМНОМОРСКАЯ"
Большинство вышеописанных гаплогрупп в
гаплогруппа e-l142
основном характеризовали условно северную по
ловину Европейского континента. Рассматривая
географию следующей гаплогруппы — Е — мы пе
реместим внимание на юг к берегам Средиземно
го моря. В Европе встречаются четыре основные
ветви гаплогруппы Е: Е-L142 и Е-V22 (восходя
щие к общему корню — гаплогруппе Е-М78), Е
Карта гаплогруппы Е-L142 (рис. 2.24) отчасти
напоминает карту гаплогруппы I-Р37 (рис. 2.20) —
максимальные частоты обеих этих гаплогрупп при
урочены к Балканскому полуострову. Также очень
похожи их паттерны: убывание частоты к северу,
м81 и e-м123.
западу и востоку. Основные различия между трен
о"
П,01 0.03 0,05
0.1
0.15
0.2
0.25
0.3
0.35
п.4
0.45
0.5
11илт и т. д. с кит.
0.55
10°
0.8
20'
0.7
30"
0.8
to
50
50
0.9
wхут"кин,
мать
чли? т. к.
скит, и мол,
мо и т.
0
Рис. 2.23. География гаплогруппы N-Р43 (N1b) Y-хромосомы в Европе.
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
98
50
20
|
п
10
20'
30"
40
50
50"
ту
80"
99"
E-L142.1
оси роз ось от оль от оз5 оз оз5 он оле оз ов; он от
и чит" и т. д.
0.8
0.9
к. и т.
мнат м.
* скит "мок
-
ми, и т.
0.
Рис. 2.24. География гаплогруппы Е-L142 Y-хромосомы в Европе.
20"
30
1"
0-
10°
20'
30"
to
50
50
то"
Е-\/22
11илт в т. д. с кит.
члдат *.
*, с 1.1.1. "иии,
0"
Рис. 2.25. География гаплогруппы Е-V22 Y-хромосомы в Европе.
100"
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
80"
ичит" и т. д.
99"
100
к. и т.
мий ти.
иррурд
и3
}
да
*
с
в нзученные популяции
0"
3]
-
уд
10"
50
Рис. 2.26. География гаплогруппы Е-М81 Y-хромосомы в Европе.
50-
40"
30"
20"
1"
0-
10°
20'
30"
to
50
50-
0.1
0.15
0.2
0.25
80"
90
Е-М123
|
0,01 0.03 0.05
ту
0.3
0.35
0.4
0.45
0.5
0.55
0.8
0.7
0.8
0.9
11илт и т. д. с кит.
чли? Т. 1.
в нзученные популяции
0
Рис. 2.27. География гаплогруппы Е-М123 Y-хромосомы в Европе.
100"
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
| ()()
меньшей частоте Е-L142 (на большинстве терри
V22, вероятно, именно последний (с более высо
кими частотами и широким распространением) по
торий она «уступает» I-Р37 на один интервал шка
служил основным источником распространения
лы карты) и, во-вторых, в распространении Е-L142
не только в Европе, но и по всему Средиземномо
гаплогруппы Е-V22 в Европу.
дами двух этих гаплогрупп состоят, во-первых, в
рью, включая Ближний Восток и северные окраи
САХАРСКАЯ ГАПЛОГРУППА E-M81
ны Африки. В пределах Балкан I-Р37 (I2a) особен
но часта у боснийцев и хорватов, а Е-L142 преоб
ладает южнее — у сербов, албанцев и греков.
Если две предыдущих ветви гаплогруппы Е —
Е-L142 и Е-V22 — демонстрировали в основном
распространение вдоль северных и восточных бе
«ЕГИПЕТСКАЯ» ГАПЛОГРУППА E-V22
регов Средиземного моря, иногда с углублением
на север и восток континента, то география тре
Два небольших «глазка» на севере и юге Пире
тьей ветви — гаплогруппы Е-М81 — больше следу
нейского полуострова и Аппенинский полуостров
—территории счастотой гаплогруппы Е-V22 до 5%,
небольшая область на северо-западе Малой Азии
(в окрестностях Стамбула) с частотой до 6%; на
ет южному Средиземноморью. Карта распростра
этом можно было бы закончить описание геогра
ная зона высоких частот находится в северо-запад
фии гаплогруппы Е-V22 в географических грани
цах Европы (рис. 2.25). Однако география гаплог
руппы Е-V22 в Европе в основном следует Среди
ное снижение частоты в северном направлении
через Гибралтарский пролив сумеренным распро
земноморскому побережью, поэтому стоит просле
дить её распространение и южнее. Карта на рис.
ритории Пиренейского полуострова и юго-запад
2.25 показывает плавное повышение частоты гап
логруппы Е-V22 в двух противолежащих регионах:
на юго-западе и юго-востоке Средиземноморья. В
юго-западном Средиземноморье у берегов Гибрал
тарского пролива и вглубь Марокко частота гап
логруппы Е-V22 выpacтaeт до 7%. В юго-восточ
ном Средиземноморье повышение частоты гаплог
руппы Е-V22 отмечается от Малой Азии на юг -
нения гаплогруппы Е-М81 на рис. 2.26 хотя и по
казывает заметное присутствие гаплогруппы на
Ближнем Востоке (частота до 20%), однако основ
ной Африке. Из этого максимума отмечено плав
странением (2—10%) гаплогруппы Е-М81 на тер
ной Франции, узкие области низких частот (не бо
лее 3%) на Аппенинском и Балканском полуост
ровах, а также северо-востоке Малой Азии.
"ПЕРЕДНЕАЗИАТСКАЯ" ГАПЛОГРУППА E-М123
Гаплогруппа Е-М123 достигает максимума в
через Левант вплоть до дельты Нила, где она дос
Передней Азии (20—25%), ближе к Европе (в Ма
лой Азии) снижается до 15%. В самой же Европе
тигает 14%, и ещё южнее вдоль Нила, где у еги
она с низкими частотами распространена вдоль
петских арабов оазиса Бахария она достигает ми
северных берегов Средиземного моря, и отдельны
рового максимума 22%. Из этих двух неевропейс
ми вкраплениями проявляется в Центральной Ев
ких регионов распространения гаплогруппы Е
ропе (рис. 2.27).
ГАПЛОГРУППА G И ЕЕ СУБВАРИАНТЫ
Карты распространения гаплогруппы двух вет
восточных областях. Зоны высокой частоты гап
вей гаплогруппы G2a-Р15 — гаплогрупп G-Р303 и
G-Р16 — в целом похожи, и даже в общеевропейс
режья Черного моря и приурочены к популяциям
ком масштабе карт видно, что обе ветви приуроче
ны в первую очередь к Кавказу. Однако своих мак
симальных частот они достигают в разных частях
Кавказкого региона: один вариант G2a преоблада
ет на крайнем северо-западе у причерноморских
шапсугов, а другой вариант G2a (гаплогруппа G
Р16) — на Центральном Кавказе у осетин-иронцев
(рис. 2.28 и рис. 2.29). Это полностью подтвержда
ется при отдельном изучении генофонда Кавказа
|Ваlanovsky et al., 2011; глава 7 этой книги).
логруппы G-Р303 тянутся вдоль восточного побе
народов Западного Кавказа, в основном, абхазо
адыгской лингвистической группы. С меньшими
частотами (до 10%) гаплогруппа G-Р303 распрос
транена в Северном Причерноморье (на террито
рии Крымского полуострова и в Приазовье), об
ласть низких частот (3—5%) тянется далее на север
в зону украинской лесостепи. Локальное повыше
ние частоты гаплогруппы G-Р303 до 13% также
наблюдается в Поволжьеу популяции мордвы мок
ша и окружается областью низких частот
"ЗАПАДНОКАВКАЗСКАЯ" ГАПЛОГРУППА G-Р303
"ЦЕНТРАЛЬНОКАВКАЗСКАЯ" ГАПЛОГРУППА G-Р16
Карта показывает, что гаплогруппа G-Р303
(рис. 2.28) также распространена на Ближнем Во
География гаплогруппы G-Р16 (рис. 2.29) бо
лее узкая по сравнению с её «братской» ветвью G
стоке, а в Европе встречается в основном в ее юго
Р303. Она охватывает исключительно Кавказский
|()|
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
-
0,01 д.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
п.4
0.45
0.5
0.55
9.8
0.7
0.8
0.9
РейкьяЕй
г
1141 т в т. д. и к 0 1.
и/
мий ти.
-
:
с
*
y
дя
-в нзученные популяции
|
g'
Рис. 2.28. География гаплогруппы G-Р303 Y-хромосомы в Европе.
50-
40"
0,01 0.03 0.05
0.1
0.15
30"
0.2
0.25
0.3
20"
0.35
0.4
0.45
1"
0.5
0-
0.55
10°
0.8
20'
0.7
30"
0.8
to
50
50
0.9
11илт в т. д. с кит.
чли? Т. 1.
1.1.1. "иии,
ми, и т.
0
Рис. 2.29. География гаплогруппы G-Р16 Y-хромосомы в Европе.
70"
80"
99"
100"
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
1()2
регион и Малую Азию. В пределах этого ареала
частота гаплогруппы G-Р16 резко падает от мак
симальных значений у осетин (73%у осетин-ирон
цев и 56% у осетин-дигорцев) к значениям в диа
пазоне 10—20% у народов Северо-Западного Кав
каза (абхазов, черкесов, балкарцев и карачаевцев)
и Затем СНижается ДО минимальной отметки уту
рок, армян и азербайджанцев.
ГАПЛОГРУППА J И ЕЕ СУБВАРИАНТЫ
Гаплогруппа J представлена двумя крупными
ветвями J-L255 (J1) и J-L228 (J2), из которых в
Европе большее распространение получила вторая.
Хотя обе эти ветви по своему происхождению
ближневосточные и отражают древние взаимосвя
зи населения Европы и жителей намного более юж
ных регионов Евразии, имеет смысл рассмотреть
отдельно географию и каждой из этих линий в це
лом, и каждой из внутренних ветвей более распро
страненной в Европе гаплогруппы J-L228 (J2).
луострова. В пределах региона максимальных час
тот — Кавказа — гаплогруппа J-L255 выделяет наро
ды Восточного Кавказа, где на ее долю приходится
львиная доля всего генофонда. Максимума гаплог
руппа J-L255 достигает в Дагестане (у кубачинцев,
даргинцев, табасаранцев и аварцев ее частоты колеб
лются от 63% до 98%), и снижается до 44% у лезгин
и 21% у чеченцев. На территории Малой Азии доля
гаплогруппы J-L255 составляет от 5% до 15%.
ГАПЛОГРУППА J-L228 (J2) В ЦЕЛОМ
ГАПЛОГРУППА J-L255 (J1): ОТ ПЕРЕДНЕЙ АЗИИ
К ПИКАМ ВОСТОЧНОГО КАВКАЗА
Карта распространения гаплогруппы J-L228
(J2) рисует иную картину (рис. 2.31). В отличие от
Распространение гаплогруппы J-L255 (рис. 2.30)
большинства рассмотренных выше гаплогрупп, J
в картографируемом ареале охватывает преимуще
L228 (J2) распространена с высокими частотами
не в Европе, а на Ближнем Востоке и в Северной
Африке. Конечно, ее ареал заходит и в соседние с
ственно его юго-восточные области Кавказ, Малую
Азию, Северное Причерноморье, Балканский полу
остров; небольшими зонами — юг Аппенинского по
луострова и Франции, юго-запад Пиренейского по
этими регионами южные области Европы: Испа
нию (особенно в ее южные районы), Италию (так
10°
20'
30"
to
so
50
70-
89"
99"
J-L255
0,01 п.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
п.4
п.45
0.5
1141 т и т. 4: t к на т.
0.55
9.8
0.7
0.8
0.9
ихть"ции,
мчить
мил ти.
0"
Рис. 2.30. География гаплогруппы J-L255 (J1) Y-хромосомы в Европе.
190
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
30-
20"
|()3
10"
0"
10°
20'
30"
40
50
50"
70"
|
о.01 0.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
плитт и т. д.
0.5
П. 55
д.в
0.7
0.8
0.9
к. и т.
мнат м.
и изученные популяции
—
й"
Рис. 2.31. География гаплогруппы J-L228 (J2) Y-хромосомы в Европе.
4]"
0,01 п.03 0.05
0.1
0.15
30"
0.2
0.25
0.3
20"
0.35
п.4
0.45
1"
0.5
й"
0.55
10°
0.8
20'
0.7
30"
0,8
до
50
50
0,9
1141 т ат. 4: t к цит
чли? Т. 1.
0"
Рис. 2.32. География гаплогруппы J-М67 Y-хромосомы в Европе.
70"
80"
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
104
0,01 д.03 0.05
0.1
0.15
0.2
0.25
0.3
0.35
п.4
0.45
0.5
0.55
9.8
0.7
0.8
0.9
--
ти чит" и т. д.
и т.
мий ти.
|
--
-
в нзученные популяции
0
Рис. 2.33. География гаплогруппы J-L282 Y-хромосомы в Европе.
же особенно южную), юг Балканского полуостро
ва. Но максимальных частот (красный цвет на кар
те) эта гаплогруппа достигает в некоторых попу
ляциях Северного Кавказа. Как было показано в
нашем исследовании (Ваlanovsky et al., 2011; гла
ва 7 данной книги), а также в работе (Yunusbaev et
al., 2012) кавказский максимум приурочен к попу
ляциям нахской группы (чеченцам и ингушам).
узком географическом охвате и в целом с более низ
кими частотами, распространение ее «сыновней»
ветви — гаплогруппы J-М67 (рис. 2.32). Однако при
этом гаплогруппа J-М67 по своей частоте больше
приурочена к Кавказу, составляя на территории Ма
лой Азии не более 13% генофонда.
ГАПЛОГРУППА J-L152 И ЕЕ СУБВАРИАНТ J-М67
Распространение гаплогруппы J-L282 в Евро
пе (рис. 2.33) заметно отличается от предыдущей
ГАПЛОГРУППА J-L282
География гаплогруппы J-L152 на территории
ветви. На фоне обширной зоны низких частот вы
Европы довольно обширна: зона низких частоття
нется с северо-запада Балканского полуострова че
рез Центральную Европу и до Пиренейского по
луострова. Зона повышенных частот (от 15%) ox
ватывает Малую Азию и Кавказ. Практически по
вторяет эту закономерность, но несколько в более
деляются три области, где доля гаплогруппы J
L282 в генофонде повышена до 10—15%; север
Фенноскандии (правда, этот максимум опирается
лишь на данные по одной популяции), Поволжье
(популяция мордвы мокша) и север Балканского
полуострова (несколько популяций албанцев).
РЕДКИЕ ГАПЛОГРУППЫ L, О, Т
ГАПЛОГРУППА L-М11
Кавказ. При этом частота гаплогруппы L-М11
плавно увеличивается в юго-восточном направле
Гаплогруппа L-М11 (рис. 2.34) в Европе при
урочена к юго-восточным регионам (за исключе
нием единичного случая в Бельгии): Крымский по
луостров, европейская часть Турции и Северный
нии, достигая 14% на территории Восточного Кав
каза у чеченцев и 13% на северо-востоке Малой
Азии у турок. Далее ее частота повышается на
Ближнем и Среднем Востоке, достигая индийско
105
2.2. Геногеография гаплогрупп Y-хромосомы в Европе
100
-
п.4
0.45
ти чит" и т. д.
0.5
0.55
9.8
0.7
0.8
0.9
и т.
мий ти.
и 1,1,1,111 чи,
ми, и т.
в нзученные популяции
g'
Рис. 2.34. География гаплогруппы L-М11 Y-хромосомы в Европе.
40-
30'
20"
1"
0-
10°
20'
30"
to
50
50
11илт в т. д. с кит.
члий т. к.
0
Рис. 2.35. География гаплогруппы О-М242 Y-хромосомы в Европе.
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
106
50"
40"
или 0,03 д.05
0.1
0.15
30"
0.2
0.25
0.3
20"
п.35
0.4
ни
п.45
и т. д.
10"
0,5
10-
с.55
0.6
20,
0,7
30
а.8
40
50
50
то"
80"
9"
1co"
0.9
и т.
члил ти.
* изученные папупячин
-
о"
Рис. 2.36. География гаплогруппы Т-L206 Y-хромосомы в Европе.
го максимума уже далеко за пределами картогра
ГАПЛОГРУППА Т
фируемого ареала.
ГАПЛОГРУППА О-М242
Гаплогруппа О-М242 в Европе практически не
встречается, за исключением нескольких точек с
низкими частотами (до 3%) в Центральной и Вос
точной Европе, на Крымском полуострове и в вос
Частота гаплогруппы Т-L206 в народонаселе
нии Европы не превышает 5% (рис. 2.36). Ее ареал
в Европе лоскутный и сводится на западе к трем
узким областям на Пиренейском полуострове и в
Сардинии, а на востоке — к зоне в Северном При
черноморье с переходом на северо-восток в укра
точной половине Малой Азии (рис. 2.35). Плавным
инскую лесостепь, единичными случаями в Повол
жье указанских татар и на Северном Кавказе уку
коридором отсеверо-западного побережья Каспий
банских ногайцев. За пределами Европы частота
ского моря далее на восток с постепенным ростом
гаплогруппы Тстоль же невелика, но зато ее ареал
частоты ареал гаплогруппы О-М242 переходит в
Центральную Азию и Сибирь, где она достигает
становится уже не лоскутным, а почти непрерыв
своего евразийского максимума.
ным, охватывая всю Малую Азию, Ближний Вос
ток и северо-восток Африки.
Y-ГЕНОФОНД ЕВРОПЫ — ПРИНЦИП ПАЗЗЛОВ
Таким образом, проведенное исследование из
менчивости Y-хромосомы в популяциях Европы,
основанное на объединении обширных собствен
ных данных слитературными, подтвердило и уточ
нило вывод о том, что основной чертой структу
рированности генофонда является четкое выделе
ние географических зон, в каждой из которых пре
обладает своя гаплогруппа. Это убедительно де
монстрируют карты распределения гаплогрупп
(рис. 2.2—2.36).
Однако при размещении данных по каждой гап
логруппе на отдельной карте трудно отследить пе
рекрывание — или же, напротив, не перекрывание -
ареалов гаплогрупп. Поэтому мы совместили зоны
распространения всех гаплогрупп на одной карте
(рис. 2.37). На этом рисунке контур каждой из девя
2.3. Генетические взаимоотношения популяций: три уровня
*
*
*
го
но
кв}}
3г
на
107
о
во
во
}
л }
9.
}
*
*
итвинутё.
ччи и м и ним ч.
чт. м.
Рис. 2.37. Структура генофонда Европы по Y-хромосоме: «принцип паззлов».
В каждой географической части Европы доминирует одна гаплогруппа, редко встречающаяся в остальных
частях. Карта показывает, к каким частям Европы приурочена каждая из основных гаплогрупп. Карта основана на
точных значениях частот. Цветом показаны зоны счастотой гаплогруппы выше порогового значения 0,35 (то есть
на выделенных цветом территориях более трети генофонда относится к данной гаплогруппе).
ти основных европейских гаплогрупп строго соот-
Полученная карта ярко демонстрирует «прин
ветствует территории, на которой частота этой гаплогруппы выше 35%, т.е. более трети генофонда
цип паззлов» — высокую географическую специ
фичность гаплогруппY-хромосомы. Благодаря это
Можно видеть, что каждая гаплогруппа действи-
му на каждой территории, хотя и присутствует
тельно занимает свой собственный ареал. Области,
остающиеся белыми, невелики — этоте территории,
много гаплогрупп, но доминируют лишь одна-две.
Таким образом генофонд Европы оказывается со
на которых разнообразие гаплогрупп высоко и ни
ставлен, как из паззлов, из ареалов преимуществен
одна гаплогруппа не достигает уровня 35%.
ного распространения разных гаплогрупп.
2.3. ГЕНЕТИЧЕСКИЕ ВЗАИМООТНОШЕНИЯ ПОПУЛЯЦИЙ: ТРИ УРОВНЯ
Проведя картографический анализ отдельных
них, перейдем к обобщенному (по всем гаплогруп
гаплогрупп Y-хромосомы и убедившись в четкой
географической приуроченности большинства из
пам совместно) статистическому анализу генофон
да Европы.
МАССИВЫ ДАННЫХ ДЛЯ СТАТИСТИЧЕСКОГО АНАЛИЗА
Массив данных для статистического анализа,
как и массив данных для карт в предыдущем раз-
возможности более 70 образцов), а меньшие вы
борки или исключались, или — в пределах одного
деле, сформирован на основе нашей базы данных
Y-base (раздел 1.1). Как и для картографирования,
народа — объединялись друг с другом. Отличие ста
тистического анализа от картографического состо
В маССИВ ДаННЫХ ДЛЯ СТаТИСТИЧеСКОГО анализа ОТ-
ит в том, что каждая популяция должна быть изу
бирались только выборки достаточного объема (по
чена по каждой гаплогруппе. Однако в большин
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
| ()8
стве статей, особенно не самых последних лет, ис
пользовались ограниченные наборы гаплогрупп.
Поэтому, если требовать, чтобы каждая выборка
была изучена по каждой гаплогруппе, то резко со
кратится или набор гаплогрупп (менее чем до 10)
или набор популяций.
Чтобы избежать и того, и другого, данные по
всем выборкам в пределах одного народа былиус
ла гаплогрупп достигнуто за счет подразделения
трех основных гаплогрупп Европа (R1b, R1a и N1c)
На ИХ ВеТВИ.
При описанном анализе на этническом уров
не мы избегаем и искажений частот гаплогрупп,
и потери числа гаплогрупп или числа народов. Но
кое-что все-таки теряется: при таком подходе из
поля зрения выпадает изменчивость на внутри
реднены и в анализе использовались эти среднеэт
этническом уровне, то есть никак не могут про
нические частоты. В таком случае, если по данно
явиться различия между популяциями, относящи
мународу изучено 10 популяций (выборок), то до
мися к одному народу. Чтобы изучить изменчи
вость и на этом — внутриэтническом — уровне, был
создан третий массив данных. В него вошли дан
статочно, чтобы хотя бы одна из этих популяций
была изучена по данной гаплогруппе, и тогда час
тота этой гаплогруппы в этой популяции будет при
своена всему народу. Если же гаплогруппа была
ные только по тем народам, для которых имелись
данные хотя бы о двух разных популяциях этого
изучена в нескольких региональных популяциях
народа. Число гаплогрупп составило 15 (две гап
народа, то еще лучше — эти значения усредняются
логруппы из набора 17 гаплогрупп были исклю
и тогда присвоенное народу значение частоты гап
чены из рассмотрения), число народов составило
логруппы получается более надежным. При таком
20, а число популяций этих народов было боль
шим — 120 популяций.
Наконец, поскольку ориентироваться в боль
подходе, ориентированном не на локальные попу
ляции, а на народы (этнический уровень популя
ционной системы) число пустых ячеек в таблице
частот гаплогрупп резко сокращается иудается оха
рактеризовать большинство народов Европы по
большинству гаплогрупп.
Правда, какое-то число пустых ячеек все рав
шом числе точек на графике бывает нелегко, был
создан еще один упрощенный массив данных — ре
гиональный. Были выделены 15 регионов Европы,
частоты гаплогрупп в которых были рассчитаны
усреднением частоту народов, относящихся к этим
но остается (для какого-либо народа вообще нет
информации о частоте у него какой-либо гаплог
руппы). В таких случаях сохраняется проблема вы
регионам.
бора — исключать из анализа такой народили ис
хических уровнях: региональном, этническом и су
ключать такую гаплогруппу. Анализ был проведен
бэтническом. Причем этнический уровень охарак
теризован двумя массивами данных по 17 и по 40
гаплогруппам. Таблица 24 суммирует важнейшую
в обоих вариантах и были созданы два массивадан
ных: массив частот 17 гаплогруппу 62 народов
(меньше гаплогрупп, но больше народов) и мас
сив частот 40 гаплогруппу 40 народов (больше гап
логрупп, но меньше народов). Это увеличение чис
В итоге были получены массивы данных, ха
рактеризующие генофонд Европы на трех иерар
информацию о всех этих массивах данных. А таб
лица 2.5 показывает для каждого народа, в каких
массивах он представлен.
Таблица 2.4. Массивы данных, сформированные для статистического анализа генофонда Европы по
маркерам Y-хромосомы
Название
Число
Число
Массива
анализируемых
ГаПЛО
ДаННЫХ
популяций
групп
Региональный
15 регионов
Европы
17
Перечень гаплогрупп
с-м130, е-м35, g-м201, i-м253, i-р372, i-м223,
Этнический 17 | 62 народа Европы
17
1-м 170(хм253 Р372 м223), J-м304. N-LLY22g, R-м198(xМ458),
r-м458, r-м343, l-м11, о-м242, r-м124, т-м70,
other (А, D, E, F, Н, I, К, О)
Те же гаплогруппы
е-м35, g-м201, i-м253, i-р372, i-м223, j-м304 с-м130,
Этнический 40
40 народов
Европы
40
I-М170(xМ253.Р372 М223), L-М11, О-М242, R-М124, Т-М70,
R-М198(xМ458.М5587284 Z93), R-М458, R-М558, R-Z284, R-Z93,
R-М343(xМ73xМ269), R-V88, R-M73, R-М269(хL23), R-L23(xМ412),
R-М412(xL11), R-L11(xU106xS116), R-U106(xU198), R-U198,
R-S116(xМ529xU152), R-М529(xМ222), R-М222, R-U152.
N-М178(xР298), N-L392(xСТS10760.7.1936.F4205,В202), N-Z1936,
n-стs10760, n-f4205, n-в202, n-р298, n-м2118, n-в211,
other (А, D, E, F, Н, I, К, О)
С-М130, Е-М35, G-М201, I-М253, I-Р372, I-М223. J-М304, L-М11,
-
120 популяций
Субэтнический
15
двадцати народов
N-LLY22g. О-М242, R-М198, R-М343, R-М124, Т-М70,
other (А, D, E, F, Н, I, К, О)
109
2.3. Генетические взаимоотношения популяций: три уровня
Таблица 2.5. Представленность народов Европы в анализируемых массивах данных
Представлен в
Представлен в
Представлен в
МаССИВе
МаССИВе
МаССИВе
«Этнический 17»
«Этнический 40»
«Субэтнический»
(в скобках — число
Абазины
+
+
-
Западный Кавказ
Абхазы
+
+
-
Закавказье
Аварцы
+
+
-
Восточный Кавказ
Адыги
+
+
-
Западный Кавказ
Народ
К какому региону относится в
массиве «Региональный».
популяций)
Албанцы
+
-
+ (3)
Англичане
+
+
-
Британские о-ва
Армяне
+
+
-
Анатолия
Балкарцы
+
+
-
Западный Кавказ
Баски
+
-
-
Пиренейский п-в
Башкиры
+
-
+ (5)
Степи Европы
Белорусы
+
+
+ (8)
Восточно-Европейская равнина
Балканский п-в
-
-
+ (5)
Западная Балтика
Болгары
+
-
+ (9)
Балканский п-в
Боснийцы
+
+
+ (2)
Балканский п-в
Венгры
+
-
Степи Европы
Галисийцы
+
-
-
Пиренейский п-в
Герцеговинцы
+
+
-
Балканский п-в
Греки
+
+
+ (5)
Балканский п-в
Грузины
+
-
-
Закавказье
Даргинцы
+
+
-
Бельгийцы
Восточный Кавказ
Датчане
+
+
-
Западная Балтика
Ингуши
+
+
-
Восточный Кавказ
Ирландцы
+
+
-
Испанцы
+
+
-
Пиренейский п-в
Итальянцы
+
+
-
Аппенинский п-в
Караногайцы
+
+
-
Степи Европы
Карачаевцы
+
+
-
Западный Кавказ
Карелы
+
+
-
Северо-Восточная Европа
Каталонцы
+
-
-
Коми
+
+
+ (2)
Кубачинцы
+
+
-
Восточный Кавказ
Кумыки
+
+
-
Восточный Кавказ
Латыши
+
-
-
Восточная Балтика
Литовцы
+
-
+ (6)
Восточная Балтика
Македонцы
+
+
+ (2)
Балканский п-в
}
+
-
+ (2)
Правобережье Волги
Немцы
+
+
-
Ногайцы
+
-
-
Степи Европы
Осетины
+
+
-
Западный Кавказ
Поляки
+
+
+ (6)
Восточно-Европейская равнина
Португальцы
Румыны
+
+
-
Пиренейский п-в
+
+
-
Балканский п-в
эрзя
Британские о-ва
Пиренейский п-в
Северо-Восточная Европа
Западная Балтика
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
110
Таблица 2.5. Представленность народов Европы в анализируемых массивах данных (окончание)
Народ
Представлен
массиве 17»
«Этнический
в
Представлен
массиве 40»
«Этнический
в
Представлен в
массиве
(в
«Субэтнический»
скобках – число
К какому региону относится в
массиве «Региональный».
Русские
+
+
популяций)
+ (20)
Саамы
+
-
-
Северо-Восточная Европа
Сардинцы
Сербы
+
-
Аппенинский п-в
+
-
+ (4)
Словаки
+
-
-
Восточно-Европейская равнина
Словенцы
Сорбы
Татары
казанские
+
+
-
Балканский п-в
Восточно-Европейская равнина
Балканский п-в
+
-
-
Западная Балтика
+
+
-
Восточно-Европейская равнина
+
-
-
Степи Европы
+
+
Анатолия
Украинцы
+
+
+ (6)
+ (13)
Восточно-Европейская равнина
Финны
Французы
+
-
+ (7)
Северо-Восточная Европа
+
-
-
Франция
+
+ (3)
Балканский п-в
Татары
крымские
Турки
Хорваты
+
Черкесы
+
-
-
Западный Кавказ
Чехи
+
+
+ (5)
Восточно-Европейская равнина
Чеченцы
+
-
-
Чуваши
+
+
Шведы
+
+
+ (7)
Восточный Кавказ
Правобережье Волги
Эстонцы
+
+
-
Западная Балтика
Восточная Балтика
РЕГИОНАЛЬНЫЙ УРОВЕНЬ
Рассмотрение на региональном уровне являет
ся предварительным – мы сначала посмотрим на
Европу как бы из космоса, чтобы уловить скелет,
основной паттерн в структуре ее генофонда, а по
том уже перейдем к главному анализу – на этни
ческом уровне. Генетические взаимоотношение
регионов Европы представлены на рис. 2.38.
Прежде всего, хорошо видны отличия генофон
да Кавказа: Западный Кавказ и Восточный Кавказ
при взгляде «из космоса» генетически близки и
друг к другу, и к народам Закавказья и Анатолии.
(Последние два, строго говоря, не относятся к Ев
ропе, но включены в анализ для полноты карти
ны). Зато все эти четыре региональных генофонда
расположены далеко от генофондов собственно
Европы.
Европейские же генофондыделятся на два кла
стера – Западной Европы и Восточной. В преде
лах Западной Европы генофонды Средиземномо
рья (Аппенинский и Пиренейский полуострова) на
ходятся хотя и не близко канатолийско-кавказско
му кругу, но все же ближе к ним, чем генофонды
Франции и Британских островов. А эти генофон
ды, географически более северные, и в генетичес
ком пространстве находятся выше («севернее»)
средиземноморских.
Мостом между западно-европейскими и вос
точно-европейскими генофондами служит населе
ние Балтики, причем Западная Балтика генетичес
ки ближе к Западной Европе, а Восточная Балтика
– к Восточной Европе. Географически так и долж
но быть, поскольку «Западная Балтика» в нашем
понимании (табл. 2.5) включает и Швецию, и Да
нию, и Германию, то есть значительную часть по
граничья Западной и Восточной Европы. Правда,
регион «Восточно-Европейская равнина» также
граничит с Западной Европой. Но ее генофонд на
графике и расположился очень близко к генофон
ду Восточной Балтики.
Положение восточноевропейских генофондов
относительно друг друга также вторит географии:
популяции Северо-Восточной Европы и в генети
ческом пространстве (рис. 2.38 А) располагаются
справа и выше («северо-восточнее») от популяций
|||
2.3. Генетические взаимоотношения популяций: три уровня
Восточно-европейской равнины. А популяции Пра
рованных) происходило в Европе за все время ис
вобережья Волги (табл. 2.5), которые географичес
ки южнее большинства популяций Восточно-Ев
ропейской равнины, и на генетическом графике
располагаются ниже («южнее») ее (рис. 2.38 А).
Популяции восточноевропейских степей, геогра
фически расположенные на самом юге Восточной
Европы и примыкающие к Кавказу, и на генети
ческом графике оказываются «южнее» остальных
восточно-европейских регионов, и оказываются
единственным регионом Европы, генетически при
ближенным к Кавказу.
Итак, генетические взаимоотношения регионов
тории ее населения и во всех мыслимых направле
ниях (что и сделало показатель генетических раз
личий популяций Европы наименьшим среди таких
показателей для всех регионов мира (Балановская,
1998)), неудивительно, что по географической бли
зости или удаленности регионов друг от друга мож
но хорошо предсказывать, соответственно, обилие
или немногочисленность миграций между ними и,
соответственно, близость или удаленность их гено
фондов. На самом деле картина интереснее просто
го отражения географии в генофонде; хотя взаим
ное положение регионов следует географии, но вот
Европы отражают соотношения их географическо
генетические расстояния между регионами отнюдь
го положения друг относительно друга. Учитывая,
не прямо пропорциональны географическим. Осо
как много только исторически документированных
бенно хорошо это видно в удаленности кластеров
миграций (и, вероятно, еще больше не документи
Восточной и Западной Европы (географически боль
Восточная
Северо
Балтика
Восточная
Западная
о
Европа
Балтика
Восточно
Европейская
Британские
п-ант
р-на
o
Балканский п
Правобере
жье Волги
Франция
o
отренейский
Степи
п-ов
Европы
o
o Аппенинский
п-ов
Западный
Кавказ
о
Восточный
o Кавказ
Закавказье
o Анатолия
Главная компонента 2
Рис. 2.38. Структура генофонда Европы на региональном уровне.
График главных компонент, отражающий взаимоотношения генофондов 15 регионов Европы. Использованы
данные о частотах 17 гаплогрупп Y-хромосомы. Первая главная компонента описывает 29%, а вторая — 17% об
щей дисперсии.
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
112
шинство входящих в них регионов не настолько уда
лены друг от друга), а также в генетической удален
ности Кавказа, хотя географически он близок вос
точноевропейским регионам.
Кроме общего правила согласованности генети
ческого и географического положения, из рисунка
2.38 следуют и другие исключения. Наиболее яркое
из них – совпадение генофонда Британских остро
вов и Балкан: их генофонды не должны бы быть
похожи. Они действительно не похожи, что хорошо
видно по частотам гаплогрупп и их картам. И ана
лиз главных компоненттоже хорошоуловилэтираз
личия, но отразил их потретьей главной компонен
те. По ней генофонды Британских островов и Бал
канского полуострова характеризуются противопо
ложными, полярными значениями, но при проек
ции многомерного графика на плоскость первой и
второй главных компонент эти два региона нало
жились друг на друга. Несмотря на это, рассмотре
ние первых двух главных компонент весьма инфор
мативно, поскольку вместе они описывают почти
половину суммарной изменчивости, что редко ког
да достигается при анализе более 10 независимых
признаков (в нашем случае 17 гаплогрупп).
ЭТНИЧЕСКИЙ УРОВЕНЬ: 17 ГАПЛОГРУПП, МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ
ЭТНИЧЕСКИЙ УРОВЕНЬ
Этнический уровень является основным – и
наиболее устойчивым, и наиболее хорошо изучен
ным – среди всех уровней иерархической структу
ры популяций. Это показано и экспериментально
[Балановская, 1990] и интуитивно признается боль
шинством исследователей, потому что любую изу
ченную ими выборку называют прежде всего по
названию народа, к которому она относится. (Прав
да, в Европе могут называть как народ, так и стра
ну, но большинство стран Европы, за исключени
ем разве что России и Великобритании, если и не
мононациональны, то близки к этому – в отноше
нии их коренного населения). Этнический уровень
является основным и для нашего анализа структу
ры генофонда Европы, поэтому его мы проанали
зируем трижды: методом многомерного шкалиро
вания на основе массива данных «Этнический 17»
(табл. 2.4), методом главным компонент на основе
того же массива данных и методов многомерного
шкалирования на основе массива данных «Этни
ческий 40» (табл. 2.4).
4 ЗОНЫ НА ГРАФИКЕ
Генетические взаимоотношения народов Евро
пы при анализе методом многомерного шкалиро
вания показаны на рис. 2.39. При взгляде на этот
график бросается в глаза его сложность – почти
все поле заполнено многочисленными популяция
ми и поэтому их группировка в кластеры неодноз
начна. Но генетические взаимоотношения между
почти всеми народами, существующими в Евро
пе, и не должны быть простыми при их проециро
вании на двумерный график. Попробуем разобрать
ся в полученной картине. Прежде всего поделим
график на четыре зоны – в соответствии с геогра
фией Европы и прилегающих регионов. В левой
нижней зоне окажутся генофонды Средиземномо
рья (в соответствии с их географическим положе
нием на юго-западе Европы). В правой нижней зоне
окажутся генофонды Передней Азии (включая и
Кавказ), что соответствует их географическому по
ложению на юго-восток от Европы. В правой вер
хней зоне окажутся генофонды Восточной Евро
пы, а в левой верхней – генофонды Западной Ев
ропы, опять-таки в соответствии с географией. То
есть первый вывод, который мы можем сделать и
который облегчит дальнейшее рассмотрение гра
фика – это то, что согласованность положения ре
гионов Европы в географическом и генетическом
пространстве сохраняется (как и должно быть) и
после того, как каждый регион представлен уже
не одной точкой (рис. 2.38), а множеством точек
входящих в этот регион народов (рис. 2.39). Рас
смотрим поочередно каждую из этих четырех зон.
ЗОНА 1: СРЕДИЗЕМНОМОРЬЕ
Средиземноморье (южная часть Европы) гео
графически представляет собой цепь из трех боль
ших полуостровов и ряда больших и малых остро
вов. Полуострова, перечисляя с запада на восток–
Пиренейский, Аппенинский, Балканский. Далее к
востоку находится полуостров Малая Азия (Ана
толия), но он формально уже не относится к Евро
пе. И на генетическом графике мы видим ту же цепь
генофондов народов, населяющих эти полуостро
ва: слева расположились популяции Пиренейско
го полуострова; правее (впрочем, без резкого пе
рехода) расположился генофонд Аппенинского
полуострова и соседнего с ним острова Сардиния;
еще правее – генофонды многочисленных народов
Балканского полуострова. Часть балканских гено
фондов уходит далеко за пределы зоны Средизем
номорья, вклиниваясь в скопления этнических то
чек не только Восточной Европы (что соответствует
отсутствию четкой географической границы меж
ду Балканами и Восточной Европой), но и в зону
графика, занятую популяциями Западной Европы,
что выглядит странно. Но в целом, хотя идеально
го соответствия географического и генетического
положения внутри регионов и не прослеживается
(чтобы его достичь, каталонцы должны были бы
поменяться местами с галисийцами, испанцы – с
2.3. Генетические взаимоотношения популяций: три уровня
португальцами, а сардинцы — с итальянцами), то,
| || 3
геноцида армян в начале 20 века были населены
преимущественно армянами). На графике оба этих
народа Анатолии кластеризуются совместно, отра
жая, по всей видимости, общий древний анатолий
ский субстрат в их генофондах или даже прямую
ассимиляцию части армян турками. Кавказ в ана
лизируемых данных представлен подробно, и чет
ко делится на кластеры Западного Кавказа, Вос
точного Кавказа и Закавказья. Как и на графике ре
что популяции одного региона кластеризуются со
вместно, а расположение этих регионов формиру
еттакую же цепь, как и в географическом простран
стве, показывает явный параллелизм между струк
турированностью генофонда Европы и ее геогра
фической структурированностью.
ЗОНА 2 — ПЕРЕДНЯЯ АЗИЯ
гионов (рис. 2.38), из всех европейских популяций
Этот обширный регион в нашем анализе пред
Кавказ приближен только к популяциям степей
Восточной Европы. Причем этот мостик перебро
ставлен только двумя своими частями, погранич
ными с Европой — Анатолией и Кавказом. Гено
фонд Анатолии прекрасно вписывается в цепь по
луостровов Средиземноморья, примыкая к гено
фондам народов Балкан, с которыми Анатолия со
шен через тюркоязычные народы Западного Кав
каза (карачаевцев и балкарцев). Конечно, одного
лишь положения этих народов на паневропейском
седствует и географически. Анатолия в анализе
графике недостаточно, чтобы делать выводы об их
этногенезе (генофонду Кавказа посвящена отдель
представлена не только турками, но и армянами
ная глава 7), но все же можно выдвинуть гипотезу
(поскольку восточные области Анатолии вплоть до
о наличии в их генофондах не только ассимилиро
ВОСТОЧНАЯ ЕВРОПА
в финны
Северо-Восточная Европа
и саамы
ЗАПАДНАЯ ЕВРОПА
и карелы, вепсы, ижорцы
Ж сорбы
северные русские
коми
- герцевоншцы
+
Восточная Балтика
и +литовцы
латыши
ж
Восточно-Европейская
равнина
поляны
босншийцы
и
в украинцы
в хораппы
Западная Балтика
южные русские
в
башкиры белорусы
шведы
слевенчы -
А
татары
и мордва-эрзя
р
р
Правобережье]и
чуваши
словаки
Ж. датчане
нехи
сербы
*
Британские о-ва
Ж немцы
ирландцы
пнглич
г—
не
французы
—
каталонцыX
испанцы
галисийцы
иренеискии
x
ане
*
*
и мордва мокша
Степи Европы
а
.
А карачаевцы
ноаппцы
донц
нрымские
-
А балкарцы в абазины
*}ены албанцы
аренш
x
сардинцы
Балканский А }ол ия
паптаплымы
р
x
п
венгры
нортноепшцы
ви",
ж
бпски
эстонцы
* черкесы
-
Аппенинский п-ов
П-ОВ
* кумыни
адыгейцы
закавказье,
* * ***"
п-ов
грузины
армяне
СРЕДИЗЕМноморьЕ
*
Западный Кавказ
Восточн ыйКа}}
оргшнцы
+
* чеченцы
аварцы
ингуши
повтины
.
кубачинцы
ПЕРЕдняя Азия
языковы в ГРУППы:
И финно-угорская
Ж германская Ф славянская
А тюркская
+ балтская
хроманская
— другие
Ф северокавказская
Рис. 2.39. Структура генофонда Европы на этническом уровне: многомерное шкалирование по данным
о 17 гаплогруппах. Использованы данные о частотах 17 гаплогрупп Y-хромосомы у 63 народов Европы (массив
данных «Этнический 17», табл. 24 и 2.5.). Для каждого народа цвет значков обозначает регион, а форма значка лингвистическую группу, цвет надписей народов и регионов соответствует цвету значка, цвета и формы стандар
тизованы для всех рисунков серии (рис. 2.39. — 2.41.). Приведен график многомерного шкалирования, основанный
на матрице генетических расстояний Нея. Уровень стресса составляет 0.19, алиенации — 0.20.
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
| 14
ванного тюрками автохтонного компонента Кавка
прежде всего, западные и восточные славяне, а так
за, но и компонента, пришедшем на Кавказ из сте
же татары. Об этой генетической общности мы еще
пей вместе с носителями тюркских языков.
будем подробно говорить в главе 6, посвященной
балто-славянским народам. Пока же отметим един
ЗОНА 3 — ЗАПАДНАЯ ЕВРОПА
ственное исключение — чехов, которые, в противо
Поскольку Средиземноморье мы рассматрива
ем отдельно, на долю Западной Европы осталось
не так много народов. На графике присутствуют
народы Британских островов, французы, немцы,
датчане и шведы. (Еще несколько народов, напри
рической близости к словакам и полякам, на гра
мер, голландцы и норвежцы, к сожалению, надеж
зость к популяциям Восточной Балтики и Северо
но не изучены по выбранной панели гаплогрупп).
Популяции Британских островов, в четком соот
Восточной Европы, но о своеобразии северных
русских уже написано достаточно (Балановская,
ветствии с их географическим положением фор
мируют островной кластер в самой левой («запад
ной») части графика. Французы, географически
принадлежащие частью к Средиземноморью, а ча
новская и др., 2011).
вес их географической, лингвистической и исто
фике отлетели далеко на «запад» и расположились
вблизи генофондов немцев. Второе исключение —
северные русские, которые демонстрируют боль
шие генетические отличия от прочих славян и бли
Балановский, 2007; Вalanovsky et al., 2008; Бала
Следующий регион, географически располо
этими популяциями, но решительно приближают
женный к северу от Восточно-Европейской равни
ны — Восточная Балтика (в данном анализе соот
ветствует обычному понятию Прибалтики и вклю
чает латышей, литовцев и эстонцев) — и на генети
стью граничащие с англичанами и немцами, на ге
нетическом графике тоже находятся между двумя
ся к пиренейскому кластеру Средиземноморской
ческом графике расположен к «северу» от популя
зоны, отдаляясь от немцев. Немцы, напротив, не
ций Восточно-Европейской равнины. Близкое по
преподносят никаких сюрпризов, располагаясь на
ложение этих популяций на генетическом графике
соответствует небольшим географическим рассто
яниям между ними. Эти популяции Прибалтики
графике в точном соответствии с их географичес
ким положением. К «северу» от них, опять-таки в
соответствии с географией, располагаются датча
не, а еще «северо-восточнее» (выше и правее на
графике), как можно было бы ожидать — шведы. В
служат мостом от популяций Восточно-Европейс
воспроизводят их географическое положение, и эту
кой равнины к популяциям Северо-Восточной Ев
ропы — опять-таки в соответствии с их географи
чески промежуточным положением. Эти популя
ции северо-востока Европы (карелы, финны, саа
ми и коми) не преподносят никаких сюрпризов,
монотонную картину нарушает лишь пара неуго
кроме разве что какой-то слишком уж выраженной
монных балканских народов — боснийцы и герце
говинцы — далеко отлетевшие на графике от осталь
близости своих генофондов, не соответствующей
ни большим географическим расстояниям между
ных популяций Балкан в западно-европейскую
зону и занявшие место, которое должно бы — по
ними, ни хорошо известному для них действию
целом, генетические взаимоотношения западноев
ропейских народов с немецкой пунктуальностью
географии — принадлежать отсутствующим в на
шем анализе норвежцам. (Это исключение уже упо
миналось при описании зоны Средиземноморья, и
к нему мы еще раз вернемся ниже).
дрейфа генов, который должен был бы подальше
разнести их генофонды друг относительно друга.
Впрочем, при анализе Y-хромосомы слишком мно
го зависит от уровня филогенетического разреше
ния отдельных гаплогрупп: поскольку во всех этих
генофондах преобладает гаплогруппа N1c-М178.
ЗОНА 4 — ВОСТОЧНАЯ ЕВРОПА
а в этом анализе она еще не подразделена на не
давно обнаруженные субтипы (Каrmin et al., 2015),
Среди восточноевропейских народов наиболее
то большим межпопуляционным различиям про
многочисленной группой являются народы Восточ
явиться труднее. Следующий регион — Правобере
но-Европейской равнины. Они занимают и самую
жье Волги — объединяет мордву-мокшу, мордву
большую территорию, значительно превышающую
эрзю и чувашей. Конечно, географически их ареа
ПЛОщадь Остальных ВыделенныX В нашем анализе
лы расположены на Восточно-Европейской равни
географических регионов. Но на генетическом гра
фике все они сбились в компактный кластер, отра
не, но их особое положение на графике вкупе с
тесным географическим соседством друг с другом
жая генетическую общность населения огромной
территории— от Польши до Урала. Правда, внутри
побудило меня рассматривать их как отдельный ре
гион. Они и географически, и генетически распо
кластера, как мы видели и для кластеров Среди
земноморья, географические закономерности не
лагаются между другими популяциями Восточно
Европейской равнины и популяциями степей Ев
прослеживаются, например, татары расположи
ропы. А среди их соотношений друг с другом сто
лись немного «западнее» русских. В эту группу по
пуляций Восточно-Европейской равнины вошли,
ит отметить разве что большие генетические раз
личия между мокшей и эрзей.
2.3. Генетические взаимоотношения популяций: три уровня
Последний из восточно-европейских регионов
– степи Европы – выделен не столько по географи
ческому, сколько по «историческому» признаку.
Хотя степная зона Европы и представляет собой
единую полосу от Урала до Среднедунайской низ
менности, но тогда в нее надо было бы включать и
украинцев (которые обозначены мной как предста
вители народов Восточно-Европейской равнины
отчасти из-за их большого генетического сходства
с другими славянскими популяциями этой равни
ны). Все же стоит обратить внимание, что боль
шинство включенных в анализ степных народов
Европы (караногайцы, ногайцы, крымские татары,
венгры) формируют единую, хотя и вытянутую,
зону на графике (только башкиры занимают совсем
другое место на графике). Это может служить ос
нованием для гипотезы о наличии общего «степ
ного» пласта в их генофондах, которую, как и лю
бую гипотезу, надо далее проверять.
Итак, планомерно пройдя по всему графику, мы
каждый раз выявляли хорошее согласие между, с
одной стороны, географическим положением ре
гионов и народов друг относительно друга и, с дру
гой стороны, их генетическими соотношениями.
Из этого правила – «генетика следует за географи
ей» – есть, конечно, и несколько исключений. Наи
более яркое из них – уже дважды упоминавшееся
положение боснийцев и герцеговинцев вблизи за
падноевропейских популяций на графике. Но судя
по самой матрице генетических расстояний, рас
считанных по частотам гаплогрупп, пять народов,
наиболее генетически сходных с боснийцами, это
герцеговинцы, румыны, сербы, хорваты, македон
цы; а пять народов, наиболее сходных с герцего
115
винцами, это боснийцы, румыны, хорваты, сербы,
македонцы. То есть и боснийцам, и герцеговинцам
прежде всего генетически близки другие народы
Балкан, а вовсе не Западной Европы. Потому и на
графике боснийцы и герцеговинцы должны бы за
нять место в балканском кластере, но при визуа
лизации матрицы в виде двумерного графика были
помещены далеко в стороне. В том-то и состоит
основной недостаток метода многомерного шка
лирования, что, не теряя информации (использу
ются генетические расстояния, в расчете которых
принимали участие все гаплогруппы), график шка
лирования теряет в точности. Ведь многомерное
пространство (сколько точек на графике, столько
измерений) никогда не проецируется на двумерную
плоскость идеально, и геометрические расстояния
между точками воспроизводят генетические рас
стояния между популяциями лишь с наибольшей
возможной степенью. Показатели стресса и алли
енации как раз и измеряют степень искажения, вне
сенную при визуализации на двумерном графике.
В нашем случае они высоки (0.19 и 0.20), поэтому
скорее удивительно, что популяций с искажением
их положения так немного (явные случаи такого
искажения только боснийцы и герцеговинцы), чем
то, что популяции с искажениями вообще есть.
Поэтому попробуем проанализировать тот же
самый массив данных другим методом – глав
ных компонент, который, в отличие от многомер
ного шкалирования, не теряет в точности, хотя и
теряет значительную часть информации: первые
две компоненты описывают лишь часть общей
изменчивости использованных для анализа гап
логрупп.
ЭТНИЧЕСКИЙ УРОВЕНЬ: 17 ГАПЛОГРУПП, ГЛАВНЫЕ КОМПОНЕНТЫ
Генетические взаимоотношения народов Евро
пы, выявленные методом главных компонент, по
казаны на рис. 2.40. По идее, этот график должен
бы совпасть с предыдущим (рис. 2.39), потому что
исходные данные для обоих видов анализа иден
тичные (массив «Этнический 17», способ визуа
лизации тоже идентичен (расположение точек-по
пуляций на двумерном графике) и отличается толь
ко сам статистический метод визуализации – мно
гомерное шкалирование на рис. 2.39 и главные ком
поненты на 2.40.
В первом приближении графики действитель
но похожи, поскольку на рис. 2.40. выделяются те
же самые четыре зоны, соответствующие четырем
географическим частям Европы и ближайших к ней
частей Передней Азии: переднеазиатская зона в
правой нижней части графика (юго-восток изуча
емого региона), средиземноморская зона в левой
нижней части графика («юго-запад»), западноев
ропейская зона в левой верхней части графика («се
веро-запад») и восточноевропейская зона в правой
верхней части графика («северо-восток»). Но по
ложение регионов и тем более народов в пределах
этих зон более хаотично, чем нарис. 2.39. Рассмот
рим зоны поочередно.
ЗОНА 1 – СРЕДИЗЕМНОМОРЬЕ
Как и на предыдущем графике, можно выде
лить цепь региональных кластеров, соответству
ющую полуостровам Средиземноморья. Но наро
ды Пиренейского и Аппенинского полуостровов
перемешаны друг с другом, хотя их совместное об
лако почти не перекрывается с облаком народов
Балканского полуострова. Также совершенно не
наблюдается близости генофондов Балканского
полуострова и Анатолии (рис. 2.40), которая столь
явно проявляется и на географической карте, и при
анализе тех же данных методом многомерного шка
лирования (рис. 2.39).
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
116
ЗОНА 2 — ПЕРЕДНЯЯ АЗИЯ
ЗОНА 3 — ЗАПАДНАЯ ЕВРОПА
Народы Анатолии (турки и армяне), как и на
предыдущем графике, в целом близки к генофон
дам Северного Кавказа и Закавказья, хотя пара
доксально, что армяне занимают на графике обо
собленное положение, а турки попадают в само
облако кавказских популяций. В пределах Кавка
В этой зоне, в отличие от Кавказа, закономер
ности могут быть прослежены, хотя они и выра
жены очень слабо: французы снова приближены к
генофондам Средиземноморья, а оба изученных
народа Британских островов (англичане и ирланд
цы) расположены на графике вблизи друг друга и
за географическая структурированность почти не
проявляется: народы Восточного Кавказа, Запад
ного Кавказа и Закавказья не только не формиру
дет непосредственно примыкать, но все же не пе
ют отделенных друг от друга кластеров, но даже
дами, датчанами и немцами. Правда, британский
не прослеживаются закономерности в их распре
кластер тесно граничит и с народами Балкан (что
не имеет ни географического, ни исторического
если их выделить в отдельный кластер, то он бу
рекрываться с народами Западной Балтики — шве
делении внутри кавказского облака. Зато карди
нальные отличия генофонда Северного Кавказа
от остальных популяций, входящих в географи
ческое понятие Европы, и на этом графике видны
очень четко (рис. 2.40).
смысла), но, как и при анализе на уровне регио
нов, Балканы и Британские острова, почти совпа
дая по значениям первых двух главных компонент,
принимают противоположные значения потретьей
ВОСТОЧНАЯ ЕВРОПА
ЗАПАДНАЯ ЕВРОПА
}
датчане
Ж шведы
Северо-Восточная Европа
П финны
Западная Балтика
саамы
сорбы ж
П эстонцы
Восточно-
карелы
востg}ная Балтика
Европейская""},
р
о белорусы
главенцы
Ж немцы
англичанеж
равнина
о
"иты
в".
Балканский п-ов
литовцы
коми
эрзя
центр и южные русские
шрландцы
боснийцы
верцеговшнцы
- плбанцы
болгары
мпкедонцы
и башниры
и
т венеры
баски
тетры
o
планшп
хка
напаногайцы
х
ногайцы
штальянцы
испанцы
А карачаевцы
= гренш
« даргинцы Западный Кавказ
Аппенинский п-ов
X галисийцы
с
тепи Европы
ниы
"Х?ранцузы
X португальцы
й пПиренейский
п-ов
+ +
северны}}
украинцы чуваши Правобережье Волги
Британские о-ва
сербы
главпни
р
Х сардинцы
«» адыги А балкарцы
ф
кубачинцы ******* Ф
а кумыки
о абазины
нрымгнив пппппы
ф абхазы
СРЕДИЗЕМНОМОРЬЕ
ПЕРЕДняя
Азия
ингуши Ф— осетины
= грузины
А турки
Закавказье
Анатолия
Ф аварцы
Восточный Кавказ
- армяне
Ф чеченцы
языковыЕ ГРУППЫ:
В финно-угорская
Ж германская Ф славянская
А тюркская
+ балтская
хроманская
— другие
«е» северокавказская
Рис. 2.40. Структура генофонда Европы на этническом уровне: анализ главных компонент по данным о
17 гаплогруппах. Массив данных и обозначения идентичны рис. 2.39: использованы массив данных «Этничес
кий 17» (табл. 24 и 2.5), цвет значков и надписей обозначает регион, а форма значка — лингвистическую группу,
как и для всех рисунков серии (рис. 2.39 — 2.41). Приведен график главных компонент Первая главная компонента
описывает 20 %, а вторая — 13 % общей дисперсии.
2.3. Генетические взаимоотношения популяций: три уровня
главной компоненте. То есть различия их генофон
117
СРАВНЕНИЕ РЕЗУЛЬТАТОВ МНОГОМЕРНОГО
|КАЛИРОВАНИЯ И ГЛАВНЫХ КОМПОНЕНТ
дов несомненны, и выявляются они в том числе и
методом главных компонент, пусть и не на основ
ном графике.
Итак, два методаанализа одних и тех же дан
ных (рис. 2.39 и 2.40) дали похожие, но отнюдь не
ЗОНА 4 — ВОСТОЧНАЯ ЕВРОПА
идентичные результаты. Поэтому те черты, кото
рые проявились на обоих графиках, можно счесть
Как и на предыдущем графике, генофонды Во
наиболее устойчивыми и объективными. Перечис
сточно-Европейской равнины, в соответствии с гео
лим их:
графией, граничат и с облаком западно-европейс
ких точек, и с балканскими генофондами. Как и на
предыдущем графике, народы этого региона, не
— положение народов на генетическом графике
соответствует их географическому положению на
географической карте (сточностью до положения
смотря на обширность Восточно-Европейской рав
региона Европы эта закономерность прослежива
нины, демонстрируют выраженное сходство друг
ется очень хорошо, с точностью до положения от
с другом. Характерно, что только чехи опять сме
дельных народов прослеживается не всегда — это
щены на «запад», демонстрируя такое генетичес
часто видно на графике шкалирования и реже на
графике главных компонент);
— генофонд Северного Кавказа отличается от
генофонда Европы и примыкает к генофондам Пе
редней Азии,
— генофонд чехов, в отличие от других славян
кое сходство с западноевропейскими народами,
которое не проявляют другие славянские и несла
вянские народы Восточно-Европейской равнины.
Опять-таки, повторяя предыдущий график и гео
графическую карту, на «северо-восток» от Восточ
но-Европейской равнины располагаются генофон
ды Восточной Балтики (Прибалтики), а еще далее
— генофонды народов Северо-Восточной Европы
(финны, саамы, карелы, коми). И северные русские
опять приближены к этим генофондам и к балтам,
тогда как южные и центральные русские распола
гаются в середине популяций Восточно-Европей
ской равнины, большинство которых составляют
славянские народы. Завершая аналогию с преды
дущим графиком, отметим, что народы Правобе
режья Волги снова расположены между остальны
ми популяциями Восточно-Европейской равнины
и популяциями степей Евразии, и в пределах этого
региона мокша и эрзя снова генетически далеки
друг от друга. Но вся эта согласованность с гео
графией выражена куда слабее, чем на графике
многомерного шкалирования (рис. 2.39) — четких
кластеров нет и говорить можно лишь о тенденци
ях на графике, и в пределах каждого региона поло
жение большинства народов хаотично. Пожалуй,
единственное, в чем график главных компонент
лучше отражает географическое положение (и,
можно полагать, региональную структуру генофон
да), чем график многомерного шкалирования, это
положение башкир, которые нарис. 2.40 присое
динились к другим популяциям степей Европы.
ских народов, приближен к западноевропейским
генофондам;
— генофонд северных русских является вторым
исключением из общей тенденции большого сход
Ства Всех Западно-СлаВЯНСКИХ И ВОСТОЧНО-СлаВЯНС
ких генофондов, потому что приближен к финно
угорским народам северо-востока Европы (и отча
сти к балтским народам);
— изо всех популяций Европы только народы
степной зоны приближены к генофонду Кавказа и,
несмотря на большую протяженность степей (от
Урала до Венгрии) демонстрируют некоторое ге
нетическое сходство друг с другом;
— остальные народы Восточно-Европейской
равнины, несмотря на обширность этого региона,
генетически близки друг другу.
Основное отличие между двумя графиками то, что на графике многомерного шкалирования
(рис. 2.39) географические закономерности вид
ны очень четко, а на графике главных компонент
(рис. 2.40) они смазаны. Конечно, когда два раз
ных метода показывают разные паттерны, в об
щем случае неизвестно, который из них более пра
вильный. Но в данном случае предпочтение мож
но обоснованно отдать паттерну многомерного
шкалирования. Ведь, во-первых, если бы график
Эти степные популяции вновь являются единствен
многомерного шкалирования отличался бы лишь
ным мостиком, приближающим европейские гено
в силу технических причин, то популяции никак
фонды к кавказским, и их приближенность друг к
другу на графике снова позволяет задуматься о на
не могли бы сами «догадаться» о своем геогра
нофонде. Хотя выражена эта тенденция куда сла
бее, чем на графике многомерного шкалирования
фическом положении — ведь в анализ закладыва
лись лишь частоты гаплогрупп, а география в ис
ходных данных не присутствовала. Значит, высо
кая степень структурированности в генофонде
— крымские татары отчего-то попали в середину
присутствует объективно, но лучше выявляется
кавказского облака, а венгры (что, напротив, впол
не разумно) присоединились к балканским попу
методом многомерного шкалирования, чем глав
ляциям, удалившись от прочих степняков.
водит и рассмотрение отдельных регионов, в ча
личии у них общего «степного» компонента в ге
ных компонент. Во-вторых, к тому же выводу при
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
| 18
стности, Кавказа. Четкое деление его генофонда
практике, по моему опыту, многомерное шкали
в соответствии с географическим делением на За
падный и Восточный Кавказ несомненно (глава
7, а также Вalanovsky et al., 2011; Yunusbaev et
al., 2011)) и хорошо выявляется при многомерном
шкалировании (рис. 2.39), но не проявляется на
графике главных компонент (рис. 2.40). Вообще,
рование лучше выявляет реально существующую
хотя теоретически эти два метода равноценны, на
КОМПОНеНТ.
структуру генофонда (не обязательно эта струк
тура географическая, но все равно шкалирование
ее обычно выявляет лучше). Потому-то в работах
нашего коллектива куда чаще используются гра
фики многомерного шкалирования, чем главных
ЭТНИЧЕСКИЙ УРОВЕНЬ: 40 ГАПЛОГРУПП, МНОГОМЕРНОЕ ШКАЛИРОВАНИЕ
В этом виде анализа использовано большое
руппы R1b, R1a и N1c подразделены на субтипы.
число гаплогрупп, хотя при этом и пришлось ис
(Снова и снова повторим, что, хотя этих субтипов
ключить из анализа народы, по которым не было
столь подробных данных. Основное отличие мас
сивов данных «Этнический 17» и «Этнический 40»
— то, что основные западно-европейские гаплог
сейчас известно очень много, для изучения струк
туры генофонда и истории популяций полезны
лишь те их них, для которых уже проведен скри
нинг их распространенности в популяциях и оп
ВОСТОЧНАЯ ЕВРОПА
ЗАПАДНАЯ ЕВРОПА
Северо-Восточная Европа
карелы
коми
Пэстонцы
Восточная Балтика
Западная Балтика
Восточно-Европейская
Ж шведы
поляки о
Ждатчане
равнина
- шрландцы
Жангличане
татары А
русские белорусы
словенцы
Британские о-ва
o
o
o
герцеговинцы
корвппы
— венгры о чехи
украинцы
боснийцы
х французы
Пиренейский п-ов
Балканский п-ов
Х румыны
каталонцы
А караногайцы
X испанцы
Степи Европы
X португальцы
— греки
тены
абазины
Аппенинский п-ов
А карачаевцы
А турки
А
Западный Кавказ
А кумыки балкарцы
армяне
даргинцы
ф*
-
Ф абхазы
Закавказье
аварцы
Ф адыги
кубачинцы ФФ ингуши
Восточный Кавказ - осетины
СРЕДИЗЕМНОМОРЬЕ
ПЕРЕдняя Азия
ЯЗЫКОВЫЕ ГРУППЫ:
и финно-угорская
Ж германская Фславянская
А тюркская
+ балтская
хроманская
— другие
Ф северокавказская
Рис. 2.41. Структура генофонда Европы на этническом уровне: многомерное шкалирование по данным
o 40 гаплогруппах. Использованы данные о частотах 40 гаплогрупп Y-хромосомы у 40 народов Европы (массив
данных «Этнический 40», табл. 2.4 и 2.5). Как и на других рисунках серии (рис. 2.39 — 241) для каждого народа
цвет значка и надписей обозначает регион, а форма значка - лингвистическую группу. Приведен график много
мерного шкалирования, основанный на матрице генетических расстояний Нея. Уровень стресса составляет 0.16,
алиенации — 0.17.
2.3. Генетические взаимоотношения популяций: три уровня
| 19
ределены частоты их встречаемости хотя бы в двух
цев) и опять примкнувших к этому кругу францу
трех десятках популяций Европы.) Поэтому гра
фик шкалирования по 40 гаплогруппам потенци
зов. Точно так же, несмотря на подразделение гап
логруппы R1a, народы Восточно-Европейской рав
ально может точнее выявить особенности генети
нины остаются довольно компактным кластером,
ческих взаимоотношений народов Европы.
а подразделение гаплогруппы N1c заметно не уве
личивает различия между карелами и коми. Мож
но думать, что такая стабильность положения на
Рассматривая этот график (рис 2.41) мы снова
видим те же 4 зоны (Средиземноморье, Передняя
Азия, Западная Европа, Восточная Европа), а в пре
делах зон обнаруживаем те же, географические в
своей основе, соотношения между генофондами
родов в генетическом пространстве отчасти зада
ется прочими гаплогруппами (кроме мажорной),
данные по которым не меняются, а отчасти опре
регионов Европы. Чтобы не повторять в третий раз
описание тех же закономерностей, обратим вни
деляется тем, что даже при подразделении гаплог
мание лишь на две главные черты.
перекрываются если не по зонам максимумов, то
Первая особенность этого графика — то, что ге
нофонд Балканского кластера переехал из среди
земноморской зоны в восточноевропейскую. Это
по зонам их умеренных частот
ознaчaет, что после разделения основных гаплог
рупп на субтипы (что приближает к реальной
структуре линий Y-хромосомы) генофонд Балкан
проявляет большее сходство с генофондом Восточ
ной Европы, чем Средиземноморья или Западной
Европы. Исключением стали лишь греки, генети
чески приблизившиеся к своим соседям по Сре
диземноморью — народам Аппенинского полуост
рова и Анатолии.
руппы на субтипы, ареалы субтипов значительно
В целом, увеличение числа гаплогрупп с 17 до
40, при неизбежном уменьшении числа рассмат
pиваемых народов, неувеличило информативность
графика. Поэтому, если из серии рассмотренных
графиков (рис. 2.39—241) выбирать какой-то один,
я бы однозначно остановился намногомерном шка
лировании по 17 гаплогруппам (рис. 2.39). Впро
чем, вдумчивым читателям, которые будут исполь
зовать материалы этой главы для собственных ис
следований или собственных выводов, не стоитог
раничиваться каким-то одним графиком — иссле
Вторая черта — то, что подразделение в каком
либо регионе его мажорной гаплогруппы на суб
дования будут куда надежнее, а выводы обосно
типы не приводит автоматически к резкому возра
кого анализа, и карт распространения гаплогрупп,
станию генетических отличий народов этого реги
она друг от друга. Так, несмотря на подразделение
гаплогруппы R1b, англичане, датчане, ирландцы
ро пойдет речь. Не стоит забывать и о том, что каж
и шведы остаются на графике вблизи друг от дру
га, хотя и более четко отделяются от народов Сре
диземноморья (испанцев, португальцев, итальян
ваннее при учете и различных видов статистичес
и роли лингвистического фактора, о котором ско
дый народ, представленный на графике одной точ
кой, в действительности состоит из многих локаль
ных популяций, которые могут значительно отли
чаться друг от друга.
СУБЭТНИЧЕСКИЙ УРОВЕНЬ: ЭТНИЧЕСКИЕ ОБЛАКА
ИДЕЯ АНАЛИЗА
Поэтому рассмотрим теперь изменчивость ге
ношения народов друг с другом — об этом выше
сказано уже достаточно, да 20 народов и маловато
для детальных выводов. Вместо этого мы сосре
нофонда Европы на внутриэтническом уровне. В
доточимся на вопросе о том, насколько сходны по
этот вид анализа включены те европейские наро
ды, для которых имелись данные хотя бы по двум
популяциям. Таких народов набралось двадцать,
число изученных популяций для разных народов
пуляции одного народа друг с другом и насколько
они перекрываются с популяциями других наро
дов. То есть речь пойдет о том, насколько важен
этнический уровень в структурировании генофон
варьирует от 2 до 20 (особенно подробно изучены
восточнославянские народы), а суммарное число
популяций — 120 (табл. 2.4 и 2.5). Этот анализ, хотя
да Европы, то есть насколько принадлежность по
пуляций к одному народу задает сходство их гено
и ограничен по числу народов, показывает струк
использованный выше прием усреднения данных
фондов и, как следствие, насколько обоснован был
туру генофонда Европы настолько детально, на
по локальным популяциям в среднеэтнические ха
сколько позволяет внушительный современный
объем данных, накопленный за 15 лет интенсив
рактеристики.
ных исследований. Ведь в этом анализе мы имеем
дело уже не сусредненными этническими часто
тами, а со всем многообразием конкретных попу
ляций, населяющих различные уголки Европы.
При рассмотрении этих графиков мы не будем
уже специально обращать внимание на взаимоот
Ранее этот вопрос обуровне внутриэтнической
изменчивости в Европе по Y-хромосоме специаль
но не рассматривался (за исключением моей соб
ственной работы (Ваlanovsky et al., 2008)). Даже
исследования, в которых какой-либо народ Евро
пы изучен не в одной, а в нескольких региональ
ных популяциях, немногочисленны. Среди ТаКИХ
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
| 20
исследований следует особо выделить работу
ное значение, поскольку он указывает на четкие
|Кауser et al., 2005), в которой изучены популяции
различия между генофондами народов Европы по
двух народов — немцев и поляков. Правда, авторы
не анализируют и тем более не сравнивают сте
пень внутренней гетерогенности этих народов,
сконцентрировавшись на выявлении генетической
маркерам Y-хромосомы.
Два своеобразных исключения касаются сла
вянских групп. Во-первых, северные русские по
границы между ними. Ряд популяций поляков (и
их субэтнической группы кашубов) изучен и в ста
тье (Rebala et al., 2012). В работе (Сinnioplu et al.,
2004) изучены паттерны географической изменчи
вости гаплогруппY-хромосомы в популяциях Тур
ции. В работе Б.А. Малярчука (Мalyarchuk et al.,
2004) исследована изменчивость в пределах рус
ских популяций (главным образом центральных и
южных). В исследованиях (Каsperaviciute et al.,
2004; Каrlsson et al., 2006: Luca et al., 2007;
Lappalainen et al., 2008; Мirabal et al., 2009; Лобов,
2009; Larmuseau et al., 2010: Каrachanak et al., 2013:
пуляции не присоединяются к южным и централь
ным, а образуют отдельный кластер, находящийся
между популяциями шведов, финнов и немцев. Во
вторых, остальные популяции западных и восточ
ных славян — поляков, южных русских и украин
цев — формируют не три отдельных, а единое об
лако, демонстрируя общность своих генофондов.
Здесь опять проявляется ведущая роль лингвисти
ческого, а не географического фактора: славянс
кие популяции, занимающие половину территории
Европы, оказываются не различными (как должно
бы быть в случае доминирования географическо
го фактора), а генетически сходными, в согласии с
Кushnarevich et al., 2013) изучены популяции, со
ответственно, литовцев, шведов, чехов, финнов,
лингвистическими данными о близком родстве
коми, башкир, бельгийцев, болгар, белорусов. В
Хотя эти данные сами по себе еще не отвергают
наших собственных исследованиях были очень
вывод Россера с соавторами (Rosser et al., 2000) о
географической (а не лингвистической) структу
рированности генофонда Европы, эти результаты
подробно изучены русские, украинские и белорус
ВОСТОЧНОСлаВЯНСКИХ И ЗападнОСлаВЯНСКИХ ЯЗЫКОВ.
ские популяции (Ваlanovsky et al., 2008;
Кushnarevich et al., 2015), а также популяции мор
указывают, что в отдельных регионах Европы гео
двы (наши неопубликованные данные). В данном
графически различные, но лингвистически сход
анализе, кроме перечисленных источников, исполь
ные популяции оказываются сходными и генети
зовались и данные разных авторов по финнам, гре
чески, указывая на важность и лингвистического
кам, албанцам, сербам, хорватам, боснийцам, ма
фактора в формировании структуры генофонда.
кедонцам (для этих народов, хотя и не проводи
лось специальных исследований ряда популяций,
Из полученных результатов можно сделать два
вывода. Первый вывод методологический Y-хро
но данные по разным популяциям одного и того
мосомаявляется надежной генетической системой
же народа появлялись в разных статьях, и попали
с высокой разрешающей способностью. В против
в нашу базу данных Y-base).
Анализ генофонда Европы на субэтническом
уровне я проводил дважды — в 2007 году (опубли
ковано в Вalanovsky et al., 2008)), и в 2015 году
(впервые публикуется в этой книге). Два этих ана
ном случае генетические различия между этноса
лиза методически однотипны, но различаются
объемом данных — за 8 лет значительно увеличи
лось и число народов, по которым есть данные о
нескольких субпопуляциях (9 народов в 2007 году
и 20 народов в 2015 году) и число гаплогрупп, по
которым есть данные обо всех субпопуляциях всех
этих народов (7 гаплогрупп в 2007 году и 15 гап
логрупп в 2015 году). Тем интереснее сравнить по
ми не были бы обнаружены или же разные попу
ляции одного народа вели бы себя по-разному, за
нимая случайные места на графике. Второй вывод
— феноменологический: в структуре генофонда
проявляется не только географическая, но и линг
вистическая структурированность. (В данном слу
чае этнический фактор совпадает с лингвистичес
ким, поскольку этническая принадлежность попу
ляции определяется в основном по языку). Кана
лизу роли географии и лингвистики в структури
ровании славянских генофондов мы еще вернемся
в главе 6.
лученные закономерности.
АНАЛИЗ 2015 ГОДА (20 НАРОДОВ, 15 ГАПЛОГРУПП)
АНАЛИЗ 2007 ГОДА (9 НАРОДОВ, 7 ГАПЛОГРУПП)
Результаты анализа 2007 года представлены на
В анализ 2015 года удалось включить в два раза
больше и гаплогрупп, и народов, и их субпопуля
рис. 2.42. Этот график демонстрирует удивитель
ций. Генетические взаимоотношения этих стадвад
но четкую картину: почти во всех случаях популя
цати европейских популяций показаны нарис. 2.43.
Популяций так много, что даже современная вер
ции, относящиеся к одному народу, кластеризуют
ся совместно. Причем образующиеся «этнические
облака» (скопления точек, соответствующих попу
ляциям одного народа) почти не перекрываются
друг с другом. Этот результат имеет принципиаль
сия программы Statistica не выводит их на график
одновременно, поэтому на рис. 2.43 А выведены
популяции всех народов, но восточнославянские
народы представлены лишь некоторыми из изучен
2.3. Генетические взаимоотношения популяций: три уровня
121
Аlienation = .09
Stress = .09
Neigenetic distances are plotted
ин"""
*
}"---",сe9, 2
swepes
*
S2
}
e}
Ge1">«Хge5
их
..………."
jк
*
".
Ge2
…"..."
е.-jaws
*е. o
*
Ок4
e
*}ёe11
}
RussiАмs
Ф
--
R5,
".,
-
9A}
шквам,Амs}
cr2
При Р7
воцвS
}
"Р4.
Рис. 2.42. Структура генофонда Европы на субэтническом уровне (анализ 2007 года, воспроизводится по
(Ваlanovsky et al., 2008). Приведен график многомерного шкалирования. Популяции, относящиеся к одному на
роду, показаны однотипными значками одного цвета.
ных популяций, а на рис. 243 Б выведены лишь
пуляции каждого из этих народов сбиваются друг
народы центрального кластера, проявившегося на
с другом в кучки. Состальными народами — морд
рис. 2.43. А, но восточнославянские популяции
вой, русскими, белорусами, македонцами и болга
рами картина чуть сложнее. Впрочем, с болгарами
и македонцами особенность только в том, что об
лако болгар оказывается довольно рыхлым, пока
зывая большие межпопуляционные различия, но с
другими облаками оно почти не перекрывается —
лишь немного с облаком македонцев. Особенность
выведены уже все.
Несмотря на новые данные, закономерность
осталась старой — наличие четко выраженных эт
нических облаков. Действительно, разные регио
нальные популяции одного народа группируются
совместно, и эти этнические облака или отделены
от этнических облаков других народов или грани
мордвы в том, что популяции мокши и эрзи не кла
чат с ними, но за редким исключением не пере
стеризуются друг с другом, хотя размах генетичес
крываются. Рассматривая сначала график2.43 А.
видим отграниченные друг от друга этнические об
лака финнов, шведов, бельгийцев и граничащие
друг с другом облака греков, туроки албанцев. При
этом облака албанцев и турок четкие и довольно
ких различий между ними на этом графике оказы
вается не так уж и велик. Особенность русских,
проявлявшаяся и на предыдущем графике (рис.
2.42) — это генетическая обособленность северных
популяций, которые на этом графике (рис. 2.43).
частично перекрываются с этническим облаком
компактные, а греческие популяции генетически
очень разнообразны — греки Малой Азии и Крита
близки к туркам (что неудивительно, поскольку
турки Малой Азии должны были в значительной
литовцев. С белорусами еще интереснее — они чет
ко делятся на южных (Полесье) и северных (вся
остальная часть Белоруссии, то есть центр и се
степени ассимилировать греческое население, осо
вер); южные белорусы не формируют своего обла
бенно на побережье).
Переходя к популяциям остальных народов
ка, а попадают в облако украинцев, аналогично
северные белорусы попадают в самую середину
облака русских популяций. Таким образом, увели
(рис 2.43 Б) снова видим ту же закономерность:
для коми, литовцев, поляков (и кашубов), чехов,
украинцев, боснийцев, хорватов и сербов характер
ны четкие этнические облака: многочисленные по
чив число гаплогрупп и число изученных локаль
ных популяций, удалось увидеть внутреннюю
структуру поляко-русско-украинской генетической
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
122
А.
О
О
С
О
О
9 "о"О
О
С
О сооО о
О
О
С
Со 2
О
o3
e e=
е.
8.
o5
забанные
сс
з
e 2 финны
греки о в
о7
o 1
ов
—2
1 о оз
Св
С а
1о
в шведы
с7
o4
турки
ОСОт
Св
С2
С4
в
её бельгийцы
О
о
2
4
ллонилп к 2
на и Чехи
кашубы в из
ж в
x 8
в
- 3 - -2
*
тполяки
*
******14 *a*as
* центральные и
3
те
северные
русские
+з
7
+в
+ 5
++ 1
п1
ж 1
болгары
т.
в
беларусы } * }
в
ж 2
з
южные русские
хз
12
к 4
45 ";
м3, а
**A* "АА то11 мукраинцы**
6
ж 5
от
х 7
н
литовцы
Ж*ж о х 1 в ли
македонцы
— 2
— 1
А 8
2
сербы к
хорваты
р
П2
нолли
-
и т.
боснийцы
а
и т.
— в
Этничвонив группы
на рисунке А:
Обельгийцы о греки
О шведы
о финны
Отурки
Салбанцы
С популяции,
-
}*ые
на рисунке Б:
п коми
+ литовцы
о центральные
и мордва (эрзя и мокша) х сербы
}
северные русские — }
х болгары
белорусы
А.
- кашубы
чехи
— хорваты
в боснийцы
смакедонцы
Рис. 2.43. Структура генофонда Европы на субэтническом уровне.
Использованы данные о частотах 15 гаплогрупп Y-хромосомы (массив данных «Субэтнический», табл. 24 и
2.5.). В связи с большим генетическим своеобразием башкир их популяции не выведены на график, соответствен
но, проанализированы 115 популяций 19 народов.
2.3. Генетические взаимоотношения популяций: три уровня
123
Цвет (а на рис. Б — и форма) значка специфичны для каждого народа. Эти цвета не соответствуют цветам на
предыдущих графиках (рис. 2.39 — 241) поскольку на них цвет означал регион Европы, а здесь цвет обозначает
народ.
А. График многомерного шкалирования, основанный на матрице генетических расстояний Нея и включающий
все популяции, кроме некоторых восточнославянских. Уровень стресса составляет 0.12, алиенации — тоже 0.12.
Б. График многомерного шкалирования, основанный на матрице генетических расстояний Нея и включающий
все популяции всех народов, показанных выколотыми кружками на рис. А. На этот график выведены все изучен
ные восточнославянские популяции. Уровень стресса составляет 0.10, алиенации — тоже 0.10.
Конкретные популяции в пределах каждого народа обозначены цифрами.
На рисунке А:
Финны : 1 — Хяме, 2 — Северной Остроботнии, 3 — Северной Савонии, 4 — Сатакунты, 5 — Южной Карелии, 6 —
Южной Остроботнии, 7 — Юго-Западной Финляндии.
Шведы: 1 — Блекинге и Кристианстада, 2 — Готланда, 3 — Эстергётланда и Йёнчёпинга, 4 — Скараборга, 5 —
Уппсалы, 6 — Вэрмланда, 7 — Вестерботтена.
Бельгийцы: 1 — Антверпена, 2 — Кампина, 3 — Мехелена, 4 — Северного Брабанта, 5 — Фландрии.
Албанцы: 1 — Албании, 2 — Македонии, 3 — Косово.
Греки: 1 — Малой Азии, 2 — Фессалии, 3 — Крита, 4 — Македонии, 5 — Пелопоннеса.
Турки: 1 — центральные, 2 — восточные, 3 — Стамбула, 4 — северо-восточные, 5 — северо-западные, 6 — юго
ВОСТОЧНЫe.
На рисунке Б:
Коми: 1 — ижемские, 2 — прилужские.
Мордва; 1 — эрзя, 2 — мокша.
Литовцы: 1 — аукшайты восточные, 2 — аукшайты южные, 3 — аукшайты западные, 4 — жемяйты северные, 5—
жемяйты южные, 6 — жемяйты западные.
Белорусы: 1 — юго-западные (Брестская обл.), 2 — северные (Витебская обл.), 3 — центральные, 4 — восточные,
5 — юго-восточные, 6 — юго-западные, 7 — западные, 8 — северные.
Северные русские: 1 — Архангельская обл., Лешуковский р-н, 2 — Архангельская обл., Пинежский р-н, 3 —
Архангельская обл., Красноборский и Ленский р-ны, 4 — Вологодская обл.
Центральные и южные русские: 1 — Костромская обл., Мантуровский и Межевской р-ны, 2 — Тверская обл.,
Кашинский р-н, 3 — Псковская обл., Порховский и Дедовичский р-ны, 4 — Псковская обл., Островский р-н, 5 —
Смоленская обл., Рославльский и Ершичский р-ны, 6 — Орловская обл., Ливненский р-н, 7 — Курская обл., При
стенский р-н, 8 — Воронежская обл., Репьевский р-н, 9 — Белгородская обл., 10 — донские казаки (нижний Дон), 11
— донские казаки (верхний Дон), 12 — кубанские казаки, 13 — терские казаки, 14 — Рязанская обл., Сапожковский р
н, 15 — Рязанская обл., Сараевский р-н, 16 — Рязанская обл. (из разных пунктов).
Украинцы: 1 — западные (Закарпатская обл.), 2 — западные (Ивано-Франковская обл.), 3 — западные (Львовская обл.),
4 — центральные (Черкасская обл.), 5 — западные (Хмельницкая обл.), 6 — западные (Черновецкая обл.), 7 — западные
(Ровненская обл.), 8 — северные (Житомирская обл.), 9 — северные (Черниговская обл.), 10 — северные (Сумская обл.), 11
— восточные (Белгородская обл.), 12 — Белгородской обл., 13 — запорожские казаки (Запорожская обл.).
Поляки: 1 — Косiewie, 2 — курпы, 3 — из Вроцлава.
Кашубы: 1 — центральные, 2 — северные, 3 — южные.
Чехи: 1 — Брно, 2 — Йиндржихув-Градец, 3 — Клатови, 4 — Писек, 5—Тршебич.
Болгары: 1 — Бургас, 2 — Ловеч, 3 — Монтана (Болгария), 4 — Пловдив, 5 — Софийская обл., 6 — Хасково, 7 —
Варна, 8 — Разград, 9 — София.
Македонцы: 1 — из Скопье, 2 — из разных регионов Македонии.
Сербы: 1 — из Приштины (Косово), 2 — из разных регионов Сербии, 3 — из Боснии.
Хорваты: 1 — из Сплита, 2 — из разных регионов материковой Хорватии, 3 — из Боснии.
Боснийцы: 1 — центр и юг Боснии и Герцеговины (Зеница, Мостар, Широки-Бриег), 2 — из разных регионов
Боснии и Герцеговины.
общности, которая была гомогенной при анализе
2007 года, основанном наменьшем объеме данных:
саются, генетические взаимоотношения популяций
теперь популяции каждого народа занимают свою
лирования можно описать как генетическую общ
ность, состоящую из русской и украинской поло
вин, причем белорусские популяции распределе
ны почти поровну между обеими половинами.
собственную зону в пределах этой общности. Учи
тывая, что украинское и русское облака, хотя не
перекрываются друг с другом, но тесно соприка
ВОСТОЧНЫХ СЛаВЯН На
графике
многомерного шка
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
124
2.4. ГЕОГРАФИЧЕСКАЯ И ЛИНГВИСТИЧЕСКАЯ СТРУКТУРИРОВАННОСТЬ —
ЗАКОНОМЕРНОСТИ
Из всего предыдущего рассмотрения структу
ки Fsт) и средние попарные генетические расстоя
ры европейского генофонда по Y-хромосоме оче
ния. Таблица 2.6 показывает, что в пределах Евро
виден высокий уровень межпопуляционных раз
личий и четкая кластеризация популяций. Возни
кает естественный вопрос, каков основной прин
нов, хорватов, русских и итальянцев, шведы и нем
цип этой структуры, какими факторами она сфор
мирована? Рассматривая те или иные конкретные
закономерности, мы уже не раз видели кластери
зацию по географическому принципу. Но видели и
кластеризацию по принципу лингвистического
пы наибольшая гетерогенность характерна для фин
цы демонстрируютумеренную гетерогенность; дру
гие народы (греки, турки, поляки, украинцы) харак
теризуются сниженной гетерогенностью. Высокая
этническая гетерогенность турок объясняется вы
соким филогенетическим разрешением, с которым
изучены эти популяции (26 гаплогрупп). Если эти
гаплогруппы объединить до уровня, с которым изу
сходства, а также — близкую по смыслу клингвис
тической — кластеризацию в этнические облака.
Поэтому в этом разделе описывается межпопуля
чены другие народы (8 гаплогрупп), то средние рас
ционную изменчивость основных лингвистичес
до 3,5, а Gsт оказывается менее чувствительным к
ких групп Европы и анализируется роль географи
ческого и лингвистического факторов. Это вечный
вопрос для генофонда любого региона мира — по
набору гаплогрупп, снижаясь с 1,3 до 0.8.
число народов, и он выровнен по числу гаплогрупп,
пробуем решить его на текущем уровне знаний
что увеличивает сопоставимость результатов по
применительно к генофонду Европы и к данным
разным народам (табл. 2.7). Закономерности похо
жи — финны, хорваты и русские вновь в числе ли
деров (средние расстояния 0,12—0,15), хотя для рус
ских это определяется дифференциацией на север
по Y-хромосоме.
ВНУТРИЭТНИЧЕСКАЯ ДИФФЕРЕНЦИАЦИЯ
стояния между популяциями турок падают с 16,5
Массив данных 2015 года включает большее
ных и южных, а различия внутри каждой из этих
Этот вид анализа является дополнением графи
камногомерного шкалирования на субэтническом
уровне, которым оканчивался предыдущий раздел
групп не так уж велики. Этим лидерам лишь не
много уступают шведы (итальянцы и немцы в таб
лице 2015 года отсутствуют, поскольку по их ре
этой главы. Но график основной упор делает на
соотношениях разных популяций друг с другом (в
гиональным популяциям нет надежных данных по
том числе становится видно, существуют или не
инцев новыми данными подтверждается снижен
существуют этнические облака для каждого наро
нaя этническая гетерогенность (0,02—0,06). Из чис
да). А о степени сходства разных популяций одно
го народа друг с другом по графику можно судить
ла народов, проанализированных и в 2007, и в 2015
лишь по размеру этнического облака. Расчет же
межпопуляционной изменчивости для популяций
им по новым данным оказывается свойственна не
каждого народа, напротив, ничего не говорит о том,
другом. Но зато он дает количественный и точный
гетерогенность, хотя это отчасти объясняется иным
набором проанализированных популяций, а отча
сти большим числом гаплогрупп, все же такие раз
ответ на вопрос, насколько сильно разные популя
личия между старым и новым анализами застав
как генофонды разных народов соотносятся друг с
панели 15 гаплогрупп). Для турок, поляков и укра
годах, различаются только результаты по грекам:
сниженная, а напротив, повышенная этническая
ции одного народа отличаются друг от друга гене
ляют быть осторожными в оценке этнической ге
тически, то есть оценивает параметр, который мы
терогенности греков и подождать появления допол
называем «этническая гетерогенность».
нительных данных по этому народу. Что касается
народов, появившихся только в анализе 2015 года,
Такое исследование я тоже проводил неоднок
ратно. В таблице 2.6 приведены результаты 2007
года для Европы (для Сибири — 2010 года), а в таб
лице 2.7 — результаты 2015 года по расширенному
массиву данных. В таблице 2.6, кроме изменчиво
сти популяций внутри отдельных народов (внут
риэтническая дифференциация), рассчитана также
изменчивость среднеэтнических частот разных
народов (межэтническая дифференциация).
то заслуживает упоминания неожиданно высокая
этническая гетерогенность болгар (это мы видели
и на графике шкалирования). А максимальная эт
ническая гетерогенность, далеко оставляющая за
собой гетерогенность иных народов Европы, ока
зывается свойственной башкирам. В разных мес
тах этой книги по самым разным данным мы на
талкиваемся на этот результат, который не являет
Для максимальной объективности, анализ
2007—2010 годов был проведен тремя методами, с
использованием трех различных показателей меж
ся неожиданностью ни для антропологов (посколь
популяционной изменчивости. Gsт, АМОVА (оцен
состоят из многих родов, контрастных по своему
ку башкиры весьма гетерогенны в расовом отно
шении), ни для этнографов (поскольку башкиры
|25
2.4. Географическая и лингвистическая структурированность — закономерности
происхождению). Остальные народы, добавивши
еся в анализ 2015 года (белорусы, бельгийцы, по
ляки-кашубы, литовцы, сербы, чехи) характеризу
ются сниженной гетерогенностью (средние рассто
яния 0,02-0,05) и лишь албанцы более гетероген
ны (0,08).
В среднем, по результатам 2007 года, гетеро
генность типичного европейского народа (его внут
риэтническая дифференциация) составляет (табл.
2.6) около 0.03: Gsт=0.029. Fsт=0.027. Различия уже
не внутри одного народа, а международами (ме
жэтническая дифференциация) оказываются на
много выше: Gsт=0.149. Fsт=0.166 (табл. 2.6). Пя
тикратное превышение внутриэтнической измен
чивости над межэтнической является количествен
ным выражением того, что подразделение европей
ских популяций по Y-хромосоме в соответствии с
(0,15), а на различия между ними остается только
0,06. Такой результат объясняется тем, что этнотер
риториальные объединения, выделяемые традици
онно (хакасы, алтайцы), включают ряд малых на
родностей, генофонды которых значительно разли
чаются между собой (Балаганская и др., 2011).
ДИФФЕРЕНЦИАЦИЯ ВНУТРИ
ЛИНГВИСТИЧЕСКИХ ГРУПП
Рассмотрим теперь закономерности межпопуля
ционной изменчивости на более высоком иерархи
ческом уровне — не отдельных народов, а их групп.
Народы можно классифицировать по-разному, но
основной является лингвистическая классификация
их языков. Конечно, для оценки роли не только лин
их этнической принадлежностью высоко информа
гвистического, но и географического фактора было
бы хорошо классифицировать народы и по регио
тивно и объясняет львиную долю всей межпопу
нам их проживания, и затем сравнить генетическую
ляционной изменчивости в генофонде Европы.
Аналогичный анализ этнической гетерогеннос
ти проведен нами для народов Южной Сибири
(табл. 2.6). Суммарные межпопуляционные разли
чия в этом регионе (0,20) оказались практическита
кими же, как и для популяций Европы (0,19). Но
дифференциацию прилингвистической и географи
ческой классификациях. Такой анализмы провели
для Кавказа (глава 7), где географическая класси
фикация достаточно очевидна. Не то для Европы —
в ее пределах регионы можно выделять по-разному,
и результаты слишком зависели бы отмоего субъек
основная часть изменчивости приходится на измен
тивного взгляда. Лингвистическая же классифика
чивость внутри этнотерриториальных объединений
ция достаточно устойчива, почти общепризнана и
Таблица 2.6. Закономерности изменчивости Y-хромосомы на внутриэтническом и межэтническом
уровнях популяционной иерархии (данные 2007 и 2010 года)
Средние
Nров
N
Nнс
ГеНеТИЧеСКИе
Gsт
(Gsт"1 0")
амоvа
(Fsт"1 0°)
расстояния
европа
Финны
5
107
6
(). 13
8.2
8.1
Хорваты
Русские
Итальянцы
Шведы
Немцы
Греки
Турки
5
100
8
(). 18
8 ()
7.4
| ()
123
8
(). 14
5.2
4.5
5
105
8
(). 13
3.9
5 ()
4
76
12
(). 13
27
1.4
|1
| 1 ()
9
().07
2.1
1.5
4
91
8
(). 1 ()
1.4
1.1
5
87
26(8)
0.17 (004)
1.3(0.8)
| ()
Поляки
8
114
7
() ()2
1.1
().З
Украинцы
Межэтнический уровень
Внутриэтнический уровень
Внутрипопуляционный уровень
4
102
| ()
() ()2
().9
0.4
16.6
10
6
14.9
6
6
2.9
2.7
61
6
82.2
80.7
СИБИРЬ
Хакасы
Северные алтайцы
Шорцы
Южные алтайцы
Киргизы
Межэтнический уровень
Внутриэтнический уровень
Внутрипопуляционный уровень
4
62
30
().85
18.2
30.3
3
67
30
().8()
15.1
20 ()
2
70
30
().09
4.9
4.7
2
104
30
().07
3.9
3.2
2
123
30
(). 15
2.9
5.1
-
5.5
5
30
3
30
-
14.7
13
30
-
79.8
Примечания: Nров — число региональных популяций, изученных для данного народа, N — средний размер вы
борки региональных популяций, Nно—число основных гаплогрупп, включенных в анализ, этносы расположены в
пределах региона по убыванию значений G,т.
126
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
Таблица 2.7. Закономерности изменчивости Y-хромосомы на внутриэтническом уровне (данные
2015 года)
Средние генетические
Этнос
Nров
N
Nно
расстояния
Башкиры
Греки
0,425
0.197
0,155
Финны
5
86
15
5
195
15
7
82
15
3
89
15
9
82
15
20
104
15
4
95
15
Хорваты
Болгары
Русские
Русские северные
Русские центральные и южные
0,146
0,136
0,129
16
10б
15
Шведы
0,110
0,082
7
53
15
3
| |()
15
0,064
0,046
6
69
15
6
5()
15
0,040
0,037
8
96
15
5
51
15
0,032
0,030
0,020
0,017
0,016
13
92
15
3
68
15
4
|()()
15
0,065
0,047
Албанцы
Турки
Литовцы
Белорусы
Чехи
Украинцы
Кашубы
Сербы
Бельгийцы
Поляки
Примечания: Для
получение более
устойчивых
5
95
15
3
234
15
оценок в анализ включены народы из массива
«Субэтничес
кий», представленные как минимум тремя популяциями, соответственно, не включены народы, представленные
только двумя —
боснийцы,
(мокша и эрзя). Nров — число региональных популяций, изу
выборки региональных популяции, Nно — число гаплогрупп,
коми, македонцы, мордва
ченных для данного народа, N — среднии размер
включенных в анализ,
уж в любом случае отменя не зависит. Поэтому в
таблицах 2.8 и 2.9 приведена генетическая гетеро
генность основных лингвистических групп Европы,
зированном под остальную Европу) представлены
только гаплогруппами G и J безо всякого их под
рассчитанная как межпопуляционная изменчивость
пе. (Отметим, что этот анализ, таким образом, ос
на субтипы гомогенность обеих кавказских линг
вистических групп значительно бы выросла.
В наборе 40 гаплогрупп кавказские варианты
новывался на среднеэтнических, а не популяцион
опять не подразделены (это повлекло бы за собой
ных частотах частоты гаплогрупп во всех популя
сокращение числа анализируемых популяций по
остальной Европе, не изученных по этим субвари
между всеми народами, относящимися к этой груп
циях одного народа были усреднены, такая проце
разделения, тогда как с учетом их подразделения
дура проведена для всех народов, и сравнивались
антам), поэтому дифференциация абхазо-адыгской
полученные среднеэтнические частоты).
При анализе по панели 17 гаплогрупп (табл.
2.8) наиболее гетерогенными оказываются славян
ская, тюркская и финно-угорская группы (средние
и нахско-дагестанской групп остается минималь
ной. По балтской группе по этой панели данных
генетические расстояния международами в пре
(0,2), славянской группы даже немного снижается
(0,4), зато гетерогенность тюркской группы увели
чивается в полтора раза (до 0,7), финно-угорской —
в два (до 1,0), ароманской — в три (до 0,9). Хотя
делах каждой из этих групп составляют около 0,5)
Этот результат по финно-уграм и тюркам хорошо
перекликается с аналогичным анализом по мтДНК,
о котором речь пойдет в следующей главе 3, а при
чины гетерогенности славян разбираются в главе
6. Романская группа уже заметно менее гетероген
на (0,3), германская еще менее (0,1), а балтская,
абхазо-адыгская и нахско-дагестанская почти го
могенны (0,01—0,05). Надо, впрочем, оговориться,
что эти выводы зависят от набора гаплогрупп —
например, доминирующие на Северном Кавказе
гаплогруппы в этом наборе гаплогрупп (оптими
на момент написания книги недостаточно, гетеро
генность германской группы несколько возрастает
очевидна большая зависимость результатов как от
числа гаплогрупп, так и от степени их подразде
ленности, все же отметим, что при наилучшем воз
можном на данный момент наборе данных наибо
лее гетерогенной является не германская группа
(хотя лучше всего подразделена доминирующая у
нее гаплогруппа R1b), а финно-угорская группа —
по всей видимости, за счет преобладающих у нее
процессов дрейфа генов вследствие изоляции.
2.4. Географическая и лингвистическая структурированность – закономерности
127
Таблица 2.8. Гетерогенность лингвистических групп Европы по панели 17 гаплогрупп
Лингвистическая группа
популяций
Число
Средние
генетические
расстояния
коррекции*
Расстояния
после
Исключенные обособленные
популяции
Абхазо-адыгская
4
0,048
-
-
Балтская
2
0,009
-
-
Германская
3
0,095
-
-
Нахско-дагестанская
5
0,009
-
-
Славянская
15
0,505
0,381
Романская
8
0,312
0,214
Северные русские и сорбы: ген.
расстояния в 1,7 и 1,9 раза
больше средней
Румыны: ген. расстояния в 2,5
раза больше средней
Тюркская
10
0,471
-
-
Финно-угорская
8
0,470
-
-
*В некоторых случаях одна-две генетически обособленные популяции за счет больших генетических расстоя
ний до остальных популяций завышали уровень гетерогенности всей группы. Поэтому была проведена коррек
ция: повторный расчет при исключении из расчета тех популяций, среднее расстояние до которых значительно
превышало аналогичный показатель для остальных популяций данной группы.
Таблица 2.9. Гетерогенность лингвистических групп Европы по панели 40 гаплогрупп
популяций
Число
расстояния
генетические
Средние
после
коррекции
Расстояния
Исключенные
обособленные популяции
Абхазо-адыгская
3
0,058
-
-
Германская
3
0,230
-
-
Нахско-дагестанская
4
0,012
-
-
Славянская
10
0,444
0,374
Романская
4
0,902
0,586
Тюркская
7
0,751
0,594
Чехи: ген. расстояния в
1,6 раза больше средней
Румыны:
расстояния
ген.
в 1,4 раза больше средней
Казанские татары: ген.
расстояния в 1,4 раза
больше средней
Финно-угорская
4
0,968
-
Лингвистическая группа
РОЛЬ ЛИНГВИСТИЧЕСКОГО И
ГЕОГРАФИЧЕСКОГО ФАКТОРОВ
Напомню, что первое обобщающее исследова
ние Y-хромосомного генофонда Европы [Rosser et
al., 2000] называлось «Изменчивость Y-хромосо
мы в Европе является клинальной и задается, преж
де всего, географическим, а не лингвистическим
фактором». Этот вывод был основан на получен
ной Россером с соавторами достоверной корреля
ции матрицы генетических расстояний между по
пуляциями Европы с матрицей географических
расстояний между теми же популяциями (коэффи
циент корреляции 0.4), при недостоверной корре
-
ляции между генетическими и лингвистическими
расстояниями [Rosser et al., 2000].
Поэтому наш коллектив тоже провел анализ
корреляции между матрицами генетических,
географических и лингвистических расстояний,
включив в него и многочисленные новые дан
ные, опубликованные после выхода в свет упо
мянутой статьи [Rosser et al., 2000]. Анализ про
водился по точным лексико-статистическим
данным и только в пределах индоевропейских
народов (составляющих большинство в Европе),
поскольку расстояния между разными лингви
стическими семьями не поддаются точному из
мерению.
| 28
Глава 2. Структура генофонда Европы в зеркале Y-хромосомы
Таблица 2.10. Роль лингвистического и географического факторов в структурировании Y-хромосом
ного генофонда Европы (первый вариант — 17 гаплогрупп, 26 народов)
Вид корреляции
Параметры корреляции
Коэффициент корреляции
Парная корреляция
Генетика и лингвистика
0,45
Парная корреляция
Генетика и география
0,56
Частная корреляция
Генетика и лингвистика (география
( огр ф
0,30
остается постоянной)
Частная корреляция
Генетика и география
графия (лингвистика
(
0.46
2
остается постоянной)
Таблица 2.11. Роль лингвистического и географического факторов в структурировании Y-хромосом
ного генофонда Европы (второй вариант — 40 гаплогрупп, 18 народов)
Вид корреляции
Параметры корреляции
Коэффициент корреляции
Парная корреляция
Генетика и лингвистика
0,54
Парная корреляция
Генетика и география
0.74
Генетика и лингвистика
Частная корреляция
-
0,42
(география остается постоянной)
Генетика и география
Частная корреляция
(лингвистика остается
постоянной)
При использовании массива данных по 17 гап
логруппам (табл. 2.10) корреляция генетических
расстояний с географическими (0,56) лишь немного
больше корреляции с лингвистикой (0,45). При ис
пользовании частных корреляций величины умень
шаются, но разрыв становится рельефнее: 0,46 с
географией и только 0,30 с лингвистикой.
При использовании массива данных по 40
гаплогруппам (подразделяются R1a, R1b, N1c —
табл.2.4) приходится исключить из анализа не
которые народы, не изученные по этой панели.
Но это полностью оправдывается тем, что резко
возрастают коэффициенты корреляции и с гео
графией, и с лингвистикой. То есть подразделе
ние гаплогрупп не только лучше выявляет их гео
графическую приуроченность на картах, но и ис
пользование этих новых субгаплогрупп позволя
ет лучше увидеть характер структурированнос
ти европейского генофонда, его связь и с геогра
2
(),69
фическим, и с лингвистическим факторами. Пар
ная корреляция генетических расстояний (табл.
2. 11) с географическими составляет 0,74, а с лин
гвистическими 0,54. При анализе частных кор
реляций связь с лингвистикой хотя и остается су
щественной (0,42), но значительно уступает свя
зи с географией: 0.69. Отметим, что полученный
нами коэффициент частной корреляции между
матрицами генетических и географических рас
стояний превышает 0,7, что в полтора слишним
раза больше величины 0,4, полученной ранее
Россером с соавторами. Это убедительно дока
зывает, что по мере накопления данных по из
менчивости Y-хромосомы географическая струк
турированность генофонда Европы становится
все более и более явной. В целом же, оба факто
ра — и география, и лингвистика — играют каж
дый свою роль, совместно формируя генетичес
кий ландшафт Европы.
ГЛАВА 3.
СТРУКТУРА ГЕНОФОНДА ЕВРОПЫ
В ЗЕРКАЛЕ МИТОХОНДРИАЛЬНОЙ ДНК
Уже около двадцати лет митохондриальная
ДНК является одной из наиболее востребованных
генетических систем в популяционно-генетичес
ких исследованиях. Вместе с Y-хромосомой мтДНК
образовала своеобразный дуэт, и эти две нереком
бинирующие генетические системы с однороди
тельским типом наследования стали наиболее по
пулярными маркерами в исследовании популяций
человека. Даже сейчас, после внедрения широко
геномных маркеров и полногеномного секвениро
вания, число выходящих статей по изменчивости
мтДНК и Y-хромосомы в несколько раз превыша
ет число полногеномных исследований, хотя и ус
Однотипность плана анализа мтДНК и Y-хро
мосомы придется нарушить лишь в двух частных
пунктах: для Y-хромосомы мы не стали анализи
ровать гаплотипическое разнообразие, а для
мтДНК не будем рассматривать карты отдельных
гаплогрупп. Это вызвано тем, что внутрипопуля
ционное гаплотипическое разнообразие Y-хромо
сомы, оцениваемое по наиболее популярной пане
ли из 17 STR маркеров, практически во всех попу
ляциях Европы близко к максимуму, и потому раз
личия между популяциями невелики. Что же каса
ется картотдельных гаплогрупп мтДНК, то для них
географические закономерности (например, более
тупает им по импакт-фактору журналов. В целом
высокая частота гаплогруппы Н на севере Евро
можно уверенно констатировать, что появление
пы) известны, но маловыразительны. Причина -
широкогеномных маркеров добавило третью сис
уже упоминавшаяся гомогенность Европы по час
тему, но не заменило первые две.
тотам гаплогрупп мтДНК. Поэтому геногеография
Поскольку митохондриальная ДНК и Y-хро
гаплогрупп мтДНК в Европе специально не рас
мосома настолько параллельны друг другу — и по
сматривается (в отличие от анализа Y-хромосомы,
четким геногеографическим паттернам отдельных
гаплогрупп которой посвящен раздел 2.2).
Отметим, что в этой главе анализируется па
методам анализа, и по объему накопленных дан
ных — в книге анализ этих двух систем проведен
по возможности аналогично, чтобы было легче
сопоставить результаты: и общие закономерности,
нель данных по гипервариабельному сегменту
выявляемые обеими системами, и частные факты,
мтДНК и SNР маркерам кодирующей части, а дан
обнаруженные только по одной из них. Поэтому
план изложения исследований митохондриально
pиваются. Дело в том, что геногеография опери
го генофонда Европы такой же, как и для Y-хромо
сомного генофонда. Сначала мы кратко рассмот
рим итоги предшествующих исследований. Затем
рует выборками, а не индивидуальными образца
ми. И если полное секвенирование нескольких де
сятков образцов какой-либо гаплогруппы выявля
проанализируем генетические взаимоотношения
ет новые субгаплогруппы, эта информация каса
популяций, причем, как и для Y-хромосомы, рас
смотрим закономерности в трех приближениях.
ется лишь молекулярной, а не популяционной со
ставляющей анализа мтДНК: мы знаем, что эти
субгаплогруппы существуют, но мы не знаем, с
какой частотой они встречаются в каких популя
(Правда, поскольку межпопуляционная вариабель
ность мтДНК в Европе куда меньше, то ее измен
чивость на внутриэтническом уровне, где она со
всем мала, не рассматривается). Потом изучим роль
географического и лингвистического факторов в
структурировании генофонда, и рассчитаем гене
тическую гетерогенность основных лингвистичес
ких групп населения Европы.
ные полного секвенирования мтДНК не рассмат
циях. Поэтому и по Y-хромосоме (глава 2), и по
мтДНК (данная глава) анализируются лишь те гап
логруппы, по которым уже накопились данные об
их частотах в разных популяциях, а новейшие дан
ные о гаплогруппах, выявленных при полногеном
ном секвенировании, рассматриваются отдельно,
в одном из разделов главы 8.
| 3()
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
3.1. ПРЕДШЕСТВОВАВШИЕ ИССЛЕДОВАНИЯ ИЗМЕНЧИВОСТИ мтДНК
в европе
Авторитет митохондриальной ДНК (мтДНК)
Ключевой аргумент в работе (Richards et al.,
в популяционной генетике человека утвердился
2000) состоял в выявлении характерных для Евро
пы гаплогрупп и кластеров гаплотипов мтДНК и
расчете их возраста: древность большинства из них
после яркой иллюстрации африканских корней
митохондриальных генофондов населения всех
континентов. Это явилось чрезвычайно убеди
далеко превышала датировки неолита и даже ме
тельным аргументом в пользу моноцентристской
золита, уводя в верхний палеолит Итак, благодаря
концепции происхождения человека современ
ного вида и африканской прародины. Меньший
географический масштаб, но ничуть не меньший
исследованию (Richards et al., 2000) не только (вре
менно) возобладала теория палеолитического вре
мени формирования генофонда Европы с лишь
резонанс, имело и крупнейшее исследование ми
незначительным вливанием ближневосточного ге
тохондриального генофонда Европы (Richards et
al., 2000). В популяционной генетике человека
митохондриальной ДНК приобрело исключитель
Европа всегда являлась наиболее изученным кон
тинентом, поскольку многочисленные европей
ские лаборатории концентрируются в первую
очередь на изучении населения своих собствен
ных стран, и лишь во вторую — населения дру
гих частей света.
НЕОЛИТ ИЛИ ПАЛЕОЛИТ?
нетического компонента в неолите, но и изучение
ный авторитет в решении проблем истории фор
мирования генофондов.
ГОМОГЕННОСТЬ МИТОХОНДРИАЛЬНОГО
ГЕНОФОНДА ЕВРОПЫ
Однако основной успех исследования Richards
с соавторами (Richards et al., 2000) заключался в
сравнении европейского митохондриального гено
Митохондриальная ДНК не стала исключени
ем, и, начиная с 908 годов XX века, стали стреми
тельно накапливаться данные о полиморфизме
мтДНК европейских популяций. Эти исследования
фонда с генофондом внешнего по отношении к Ев
ропе региона Ближнего Востока, а вопрос о внут
ренней структуре европейского генофонда не ста
привели к результатам, которые можно рассматри
вился. Во многом это было связано с устоявшимся
к тому времени взглядом на европейский митохон
вать как смену «неолитической» парадигмы в трак
дриальный генофонд как на исключительно гомо
товке формирования генофонда Европы на «палео
генный, однородный по всему европейскому ареа
литическую». В 1970°-908 годах преобладала ги
лу: исследования показали, что в самых разных
потеза формирования европейского генофонда в
частях Европы распространен один и тот же набор
гаплогрупп, причем с очень близкими частотами
|Simoni et al., 2000).
Последующее накопление данных лишь отча
сти внесло коррективы в такую трактовку: было
показано, что при увеличении суммарной выбор
результате миграции популяций неолитических
земледельцев из Передней Азии в Европу (Аnmer
man, Сavalli-Sforza, 1984). Но на рубеже XXI века
большинство специалистов склонилось на сторо
ну гипотезы неолитизации путем заимствования
неолитической культуры без миграции самих зем
ледельцев, что предполагает значительно более
древнее (палеолитическое) время формирования
европейского генофонда (Richards et al., 1996,
2000). Тем самым была почти отвергнута знаме
нитая теория «демической диффузии» (Ammerman,
Сavalli-Sforza, 1984: Сavalli-Sforza et al., 1994), воз
водящая (по данным об аутосомных классических
маркерах) формирование основных черт генофон
ки (по всем изученным европейским популяциям)
до 3113 человек и при объединении данных по
крупным регионам Европы удается выявить неко
торую степень структурированности по географи
ческому принципу: популяции Средиземноморья,
Центральной и Северной Европы входят в разные
кластеры на графике генетических взаимоотноше
ний населения этих регионов (Richards et al., 2002).
И все же вывод о гомогенности митохондриально
да Европы ко времени расселения неолитических
земледельцев, пришедших с Ближнего Востока и
ассимилировавших аборигенные палеолитические
популяции охотников-собирателей. Взамен была
региональных популяций остался в силе и до сих
реабилитирована теория «культурной диффузии»,
РЕГИОНАЛЬНЫЕ ИССЛЕДОВАНИЯ
го генофонда Европы и очень слабых различиях
пор часто цитируется.
рассматривающая неолитизацию Европы как рас
пространение земледелия путем культурных заим
ствований без миграции самого населения. Прав
да, в последующие годы однозначность такого
вывода несколько поколебалась, о чем мы будем
говорить в главе 8.
Возможно, именно сложившейся уверенностью
в бесперспективности поиска внутренней струк
туры в европейском митохондриальном генофон
де (а также интенсивной обобщающей работой в
предшествовавший период, 1995—2002 гг.) объяс
3.1. Предшествовавшие исследования изменчивости мтДНК в Европе
няется отсутствие новых попыток такого обобща
|3 |
число работ по изменчивости мтДНК в Европе
ющего анализа за десять с лишним лет, прошед
|Маlyarchuk et al., 2002, 2003, 2004, 2006, 2008.
ших после работы (Richards et al., 2002).
2010, 2012), во многих из которых проводится изу
Вместо этого большинство исследователей со
чение различных аспектов митохондриального ге
средоточились на получении данных по отдельным
нофонда как популяций Сибири, так и восточных,
западных и южных славян. Огромную роль в про
странам и популяциям Европы, и было опублико
вано более ста подобных работ. Перечислим лишь
важнейшие из них, опубликованные в период 1995—
2011 годов и опирающиеся на выборки более, чем
ведении исследований российских коллективов
сыграл Эстонский биоцентр и его директор Р. Вил
лемс. В годы, когда секвенирование в России было
150 образцов мтДНК (Sajantila et al., 1995; Dupuy
et al., 1996; Richards et al., 1996, 2000; Орdal et al.,
технически и/или финансово недоступно, моло
дые специалисты (включая и автора этой книги)
1998; Pfeiffer et al., 1999: Dimo-Simonin et al., 2000;
из практически всех перечисленных институтов
Нelgason et al., 2001; Larruga et al., 2001; Меіnila et
России, также, как и специалисты из многих дру
al., 2001; Nasidze et al., 2001; Вermisheva et al., 2002;
гих стран Европы, толпами съезжались в Эстонс
Мalyarchuk et al., 2002, 2004, 2006, 2010: Gonzalez
et al., 2003; Маса-Меуеr et al., 2003; Роetsch et al.,
2003: Dubut et al., 2004: МсEvoy et al., 2004; Реreira
кий биоцентр со своими образцами, проводя там
и технический этап секвенирования, и обучаясь
etal., 2004; Вabalini et al., 2005: Goodacre et al., 2005;
Аlvarez et al., 2006: Воsch et al., 2006; Falchi et al.,
2006; Picornell et al., 2006; Тоnks et al., 2006; Аchilli
et al., 2007: Grzybowski et al., 2007: Вrandstaetter et
al., 2007, 2008: Нефman et al., 2007; Irwin et al., 2007.
2008: Richard et al., 2007; Тetzlaff et al., 2007;
Zimmermann et al., 2007; Lappalainen et al., 2008;
Lehocky et al., 2008: Мartinez et al., 2008: Turchi et
al., 2008; Аlvarez-Iglesias et al., 2009: Santos et al.,
2003; Аlvarez et al., 2010: Garcia et al., 2010;
Мikkelsen et al., 2010: Pereira et al., 2010; Тіllmar et
al., 2010; Моrozova et al., 2011; Каrachanak et al.,
2011).
методам анализа митохондриальных данных.
ЦЕЛЬ — АНАЛИЗ В МАСШТАБЕ ВСЕЙ ЕВРОПЫ
Но, несмотря на такое обилие сильных регио
нальных работ, обобщающие исследования в мас
штабе всей Европы за последнее десятилетие мне
неизвестны. Свою роль в этом сыграли и объектив
ные трудности составления сколько-нибудь полной
сводки о полиморфизме мтДНК в Европе в услови
ях растущей лавины информации по этой тематике,
публикуемой во множестве генетических, судебно
медицинских и даже археологических изданий. В
связи с этим создававшиеся общедоступные базы
данных по мтДНК, аккумулирующие эту информа
ИССЛЕДОВАНИЯ В РОССИИ
цию, либо переключились более на молекулярную,
чем на популяционную сторону изменчивости
Реальность бумамитохондриальных работил
люстрирует тот факт, что только в России эти ис
следования были развернуты целым рядом кол
лективов: Института биологических проблем Се
вера в Магадане (Derenko et al., 2003, 2007;
Мalyarchuk et al., 2001, 2002, 2003, 2004, 2006,
2008, 2010, 2012). Института цитологии и гене
тики в Новосибирске (Гольцова и др., 2005;
Derbeneva et al., 2002a,b; Сукерник и др., 2010;
Starikovskaya et al., 1998, 2005; Rubinstein et al.,
2008; Volodko et al., 2008), Уфимского научного
центра в Уфе (Бермишева и др., 2002, 2004), Якут
ского научного центра в Якутске |Fedorova et al.,
2003, 2013), Южного федерального университе
та в Ростове-на-Дону|Коrnienko et al., 2004), Ин
ститута общей генетики РАН (Оrekhov et al., 1999;
Орехов, 2002; Наумова и др., 2008; Вulayeva et al.,
2003; Моrozova et al., 2011), Института молеку
лярной генетики РАН (Вelyaeva et al., 2003), Ме
дико-генетического научного центра РАМН в
Москве (Балановский и др., 2011; Рshenichnov et
al., 2013) и другими научными коллективами стра
ны. Среди них особого упоминания заслуживают
работы Б.А. Малярчука, который из всех россий
ских исследователей опубликовал наибольшее
мтДНК (например, популярные интернет-ресурсы
www.mitomap.org и www.phylotree org), либо рост
базы данных прекратился или замедлился после
нескольких обновлений (база данных НVRbase, до
стигшая объема 13 873 образцов мтДНК, но затем
угасшая, ЕМРОР с текущим объемом 34 717 образ
цов). Из целого ряда предпринятых попыток созда
ния баз данных о популяционном полиморфизме
мтДНК, насколько нам известно, лишь база данных,
развиваемая нашим коллективом («МURКА»), вы
держала целый ряд последовательных обновлений
и к настоящему времени
содержит сведения о
132 600 образцов мтДНК в 2 101 популяциях мира
(табл. 1.3). Применительно к генофонду Европы и
соседних территорий в базе данных содержатся 31
935 образцов мтДНК, что более чем в 10 раз превы
шает объем данных, использованный в последнем
обобщающем исследовании полиморфизма мтДНК
в Европе (Richards et al., 2002).
Именно последовательная работа по созданию
максимально полной базы данных по изменчивос
ти мтДНК («МURКА», раздел 1.2.) является пер
вой предпосылкой для новой попытки обобщаю
щего анализа европейского митохондриального
генофонда, предпринятой в данной монографии.
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
| 32
Второй предпосылкой стало наше исследование
полиморфизма Y-хромосомы в Европе, тоже осно
боты стало проведение аналогичного анализадан
ных по митохондриальной ДНК: было решено
ванное на обширной базе данных и включившее
предпринять попытку выявить основную структу
картографический и статистический анализ этих
данных (это исследование было начато в работе
|Ваlanovsky et al., 2008) и завершено в главе 2 дан
ной книги). Естественным продолжением этой ра
ру европейского генофонда по мтДНК и сравнить
основные черты генофонда Европы, реконструи
руемые благодаря дуэту обеих информативных
«однородительских» систем.
3.2. ГЕНЕТИЧЕСКИЕ ВЗАИМООТНОШЕНИЯ ПОПУЛЯЦИЙ: ТРИ МАСШТАБА
ФОРМИРОВАНИЕ МАССИВА ДАННЫХ
Для выявления генетических взаимоотноше
ний популяций Европы и смежных регионов ис
пользован ставший традиционным метод много
ящему времени европейских популяций были от
сеяны или объединены, суммарный объем анали
зируемых образцов оказался все-таки на порядок
больше, чем в предыдущих обобщающих иссле
дованиях европейского митохондриального гено
мерного шкалирования. Однако особенностью про
фонда (Richards et al., 2000, 2002). Но еще более
веденного анализа является большое число тща
важно для получения надежных результатов то, что
тельно отобранных популяций.
Первым критерием отбора был размер выбор
мы опираемся на большой объем выборки из по
объема по возможности объединялись соседние
пуляции (N=200). Карта на рис. 3.1 показывает гео
графическое положение популяций Европы,
изученных по полиморфизму мтДНК.
Следующей задачей было формирование набо
ра гаплогрупп. Из двух критериев полиморфизма,
принятых в популяционной генетике (однопроцен
тный и пятипроцентный) мы применили «мягкий».
популяции одного народа так, чтобы в сумме со
ставить выборку более 70 образцов. Если такой
возможности не было, малые выборки исключа
Поэтому рассматривалитолько гаплогруппы, сред
няя частота которых в европейских популяциях со
ставляет хотя бы один процент. Для этого из боль
ЛИСЬ ИЗ а НаЛИЗа.
шого числа гаплогрупп часть была объединена (с
учетом их филогенетического родства). Например,
ки. В базе данных МURКА по Европе имелись дан
ные по 336 популяциям, но многие из них были
изучены по небольшой выборке. Для обеспечения
репрезентативности мы установили минимальный
объем выборки N=70. При выборках меньшего
Вторым критерием отбора была надежность
определения гаплогрупп. Мы стремились исполь
зовать только те выборки из нашей базы данных, в
которых принадлежность образцов к данной гаплог
руппе была подтверждена анализом SNР маркеров
кодирующей части мтДНК (как правило, методом
ПДРФ-анализа). Если для данного этноса или реги
были объединены V и preV, также объединялись
разные варианты U2 и т.д. Часть редких гаплог
рупп, отдаленных от других гаплогрупп филоге
нетически или с отдаленным от Европы ареалом
их преимущественного распространения, была
объединена в сборную группу «другие» (other),
она такие выборки отсутствовали, в анализ вклю
чались выборки, где ПДРФ данных не было, но гап
причем средняя частота этой сборной парагруппы
логруппы можно было надежно (с высокой вероят
ностью) определить по ГВС1. Пороговым уровнем
было наличие не более 5% образцов, для которых
чены следующие 35 гаплогрупп: А, В, С, D, F, G,
надежное определение гаплогруппы оказывалось
невозможно. Выборки, в которых доля таких образ
цов превышала 5%, не включались в анализ.
составила только 2%. В итоге в анализ были вклю
Z, L, М1, preНV, Н, НV, J,Т", Т1, Т2, I, N1a, N1b,
R, К, V, W, X, U1a, U1b, U2, U3, U4, U5a, U5b, U6,
U7, U8, other.
В результате была сформирована таблица из
Третьим критерием было наличие четкой гео
118 строк-популяций и 35 столбцов-гаплогрупп, ко
торая и послужила основой для всех видов анали
графической привязки в описании выборки. По
за, проведенных на уровне частот гаплогрупп
этому, если для выборки было известно ее проис
хождение лишь с точностью до страны, но по этой
стране имелись и выборки с региональной привяз
кoй внутри страны, первую выборку приходилось
мтДНК. Данные на уровне отдельных гаплотипов
ИСКЛЮЧaТЬ.
европейского генофонда анализ был проведеннаэт
В итоге были сформированы 118 выборок, ха
используются только для анализа внутрипуляци
онного гаплотипического разнообразия.
Для рассмотрения основных закономерностей
рактеризующих все части Европы и смежных ре
ническом уровне. Для этого данные по популяциям
одного народа были усреднены и анализировались
гионов, причем каждая представлена не менее чем
частоты для получившихся среднеэтнических по
70 образцами. Средний объем выборок составляет
пуляций. Число анализируемых популяций при этом
N=200, суммарно 23 500 образцов. Таким образом,
сократилось до 62 народов. Они включили следую
даже после того как две трети изученных к насто
щие этнические популяции Европы и прилегающих
3.2. Генетические взаимоотношения популяций: три масштаба
*
y
мтДНК
* на
133
№
,
}
}
ач
*
НАШИ ДАННЫЕ
литЕРАТУРныЕ ДАнныE
Рис. 3.1. Популяции Европы и смежных регионов, изученные по мтДНК.
регионов Северной Африки, Ближнего Востока и
Западной Сибири (приводятся в соответствии сан
положение в генетическом пространстве), а нари
глоязычными обозначениями базы данных
МURКА): Lithuanians, Estonians, Finns, Каrelians,
Кomi, Мari, Мordvinians, Saami, Udmurts, Сzech,
(их положение в географическом пространстве).
сунке 3.2Б — локализация тех же популяций на карте
В генетическом пространстве четко выделяют
ся четыре кластера. Первый кластер включил толь
Роles, Вyelorussians, Russians, Slovaks, Ukrainians,
ко саамов, что не удивительно, учитывая их гене
Вashkirs, Сhuvash, Тatars, Albanians, Greeks.Аromuns,
Romanians, Slovenians, Вosnians, Вulgarians,
Сroatians, Нungarians, Вasques, Irish, Scottish,
Аustrians, English, Germans, Icelanders, Norway,
Swedes, Swiss, French, Italians, Portugals, Sardinians,
Sicilians, Spaniards, Turkey, Armenians, Georgians,
Кabardinians, Оssets, Аzeris, Nogays, Кurds, Iranians,
Syrians, Iraq, Jordanians, Palestinians, Saudi Arabia,
Моrocco, Каzakhs, Мansi, Nenets, Nganasans.
тическое своеобразие (Сavalli-Sforza et al., 1994).
в том числе показанное и по мтДНК (Таmbets et
al., 2004). Второй кластер включил те популяции
восточных рубежей Европы, у которых повышена
частота восточноевразийских гаплогрупп. Третий
кластер включил популяции Передней Азии и Кав
каза. Наконец, все остальные популяции с основ
ной территории Европы (от Волги до Пиренейско
го полуострова) помещаются в четвертый «пан
европейский» кластер. Его небольшие размеры на
АНАЛИЗ ПОПУЛЯЦИЙ ЕВРОПЫ И БЛИЖНЕГО
ВОСТОКА
генетическом графике (при огромных размерах на
географической карте) свидетельствуют о низкой
межпопуляционной изменчивости внутри этого
Результаты анализа митохондриальных гено
фондов этих 62 этнических популяций представ
лены на рис. 3.2. На рисунке 3.2А показаны гене
тические взаимоотношения этих популяций (их
кластера. Эти результаты подтверждают генетичес
кую гомогенность Европы (кроме Приуралья) по
мтДНК и указывают на своеобразие генофондов
Приуралья и Ближнего Востока.
| 34
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
Европейский
восточнblи
удмурты
оненцы
в ногайцы овдшкиры
o
нFдндсдны
.
судовойловийкий"
Рис. 3.2. Генетические взаимоотношения европейских и ближневосточных популяций по данным об из
менчивости мтДНК.
А. График многомерного шкалирования (стресс=0,085). Популяции разных кластеров показаны разным цветом.
Б. Географическое положение изученных популяций. Цвет каждой популяции такой же, как на графике А.
Результаты, представленные на рис. 3.2А, та
ким образом, подтверждают на новом витке иссле
дований и резко возросшем объеме информации
два явления: гомогенности митохондриального ге
нофонда Европы и эффективности выделения двух
основных вариантов митохондриального генофон
та) занимают большую область только в генети
ческом пространстве (3.3А). На географической же
карте (3.3Б) желтые кружки близки друг к другу,
занимая не столь уж большую область на северо
востоке Европы. Таким образом, высокое генети
ческое разнообразие (большие генетические раз
да Евразии — западноевразийских и восточноевра
зийских гаплогрупп, поскольку именно наличие
восточноевразийских гаплогрупп обуславливает
своеобразие Приуралья.
Но попробуем узнать о Европе новое, — и для
этого рассмотрим этот европейский кластер как бы
под микроскопом, удалив из анализа внеевропейс
кие популяции и «генетических чужаков» Европы:
назвать его «финно-угорским». Действительно, в
него входят финноязычные народы (коми, мордва,
мари, финны, карелы). К этому кластеру прибли
пограничную полосу красных кружков восточных
жаются также тюркоязычные чуваши итатары, для
рубежей Европы и зеленые популяции Ближнего
Востока. То есть рассмотрим только одну Европу
— только популяции, обозначенные фиолетовым
цветом на рис. 3.2А и 3.2Б.
которых по антропологическим данным предпола
личия между популяциями, проявляющиеся в боль
шом размере генетического кластера) умещается
на географически небольшой территории северо
востока Европы. Рассмотрение того, кaкиe попу
ляции входят в этот кластер, позволяет условно
гается значительный финно-угорский субстрат. От
метим, что другие тюркские народы Европы (на
пример, башкиры и ногайцы) в этот кластер не
входят.
АНАЛИЗ ТОЛЬКО ЕВРОПЕЙСКИХ ПОПУЛЯЦИЙ
Интерпретация высокого межпопуляционного
разнообразия в «финно-угорском» кластере будет
При анализе только популяций, вошедших в
дана ниже, при рассмотрении гаплотипического
«европейский» (фиолетовый) кластер на рис. 3.2,
получаем новый график и новую карту (рис. 3.3).
График снова показывает положение популяций в
разнообразия мтДНК. Пока же отметим, что, хотя
этот кластер популяций географически располага
генетическом пространстве и вновь популяции,
его генетическое своеобразие нельзя объяснять
ется на востоке Европы вблизи границы с Азией,
попавшие в один кластер, обозначены одним цве
азиатскими влияниями. Ведь миграции из Азии,
том (3.3 А), а карта (3.3 Б) отображает географи
отразившиеся в высокой частоте восточноевразий
ческое положение тех же популяций с теми же цве
товыми обозначениями. Мы обнаруживаем новый
генетический кластер со значительным разнооб
разием популяций внутри его (желтый цвет). Об
ратим внимание, что эти популяции (желтого цве
ских гаплогрупп, уже сформировали кластер, про
явившийся при предыдущем генетическом масш
табе (рис. 3.2 А), в котором финноязычные попу
ляции были генетически неотличимы от осталь
ной Европы. Мы видели, что лишь при повыше
3.2. Генетические взаимоотношения популяций: три масштаба
А
135
финны
мордвд
КАРЕлы
Коми
финно-угорский
мАР
тдтдРы
ЧувдШит
Рис. 3.3. Генетические взаимоотношения популяций, вошедших в «пан-европейский» кластер на рис. 3.2.
А. График многомерного шкалирования (стресс=0,138). Популяции разные кластеров показаны разным цветом.
Б. Географическое положение изученных популяций. Цвет каждой популяции такой же, как на графике А.
нии разрешающей способности анализа и перехо
де от генетического масштаба рис. 3.2 к генети
ческому масштабу рис. 3.3. (при рассмотрении из
менчивости генофонда только самой Европы, без
восточноевразийского влияния) проявилось свое
образие финноязычных народов. Таким образом,
финноязычные народы (с примкнувшими к ним
чувашами и татарами) следует признать по мито
хондриальному генофонду европейцами, но чет
кое разделение генофонда Европы на финноязыч
Европы. Хотя изученные популяции занимают по
чти все пространство графика и четкие кластеры
поэтому не образуются, все же по сходству попу
ляций в генетическом пространстве можно выде
лить несколько групп популяций. Более строго их
было бы назвать «зонами», поскольку термин «кла
стер» предполагает отграниченность от соседних
групп, а в нашем случае одна зона тесно соседству
ную и остальную Европу оказывается новым и важ
ет с другой. Но для сохранения единства термино
логии мы будем называть выделенные группы ге
нетически сходных популяций по-прежнему «кла
ным результатом нашего анализа.
стерами».
Отметим, что все остальные популяции Евро
пы снова оказались генетически почти неразличи
мы, опять формируя гомогенный кластер, который
теперь можно назвать «узко-европейским». Это сно
ва демонстрирует генетическую гомогенность Ев
ропы — но на этот раз уже не всего европейского
генофонда, а только «не-финноязычной» его части.
АНАЛИЗ ЕВРОПЕЙСКОГО ГЕНОФОНДА БЕЗ
ФИННОЯЗЫЧНЫХ ПОПУЛЯЦИЙ
В попытке выявить, присутствует ли все же
генетическая структурированность в этом «узко
европейском» кластере, мы вновь повторили тот
же прием смены генетического масштаба. Для это
го исключили из рассмотрения генетически отли
чающиеся популяции («финно-угорского» класте
ра) и проанализировали остальные популяции Ев
ропы (только «узко-европейского» кластера).
Результаты этого анализа показаны на рис. 3.4.
В один кластер (рис. 3.4 А) вошли испанцы,
португальцы, французы, сардинцы, итальянцы. Все
это народы романской языковой группы индоев
ропейской лингвистической семьи. В другой клас
тер вошли латыши и литовцы, то есть народы бал
тской языковой группы. В третий — соседний — кла
стер попали русские, словенцы, поляки, чехи, сло
ваки, боснийцы, хорваты, украинцы, болгары. Все
это — народы славянской языковой группы. Наро
ды германской языковой группы — немцы, шведы,
норвежцы, швейцарцы, австрийцы, англичане, ис
ландцы — тоже образуют свой собственный клас
тер. Учитывая, что население Шотландии лишь
исторически недавно сменило кельтский язык на
язык германской группы, их генетическое сходство
с ирландцами обрисовывает общность митохонд
риального генофонда и кельтской группы тоже.
Албанцы — единственные представители албанс
нашего популяционного микроскопа, мы, наконец,
кой языковой группы — располагаются примерно в
центре графика. Баски — единственный представ
ленный на этом графике народ, который не отно
сится к индоевропейской семье, соответственно за
обнаруживаем различия между этносами внутри
нимает обособленное положение.
Только при этом, третьем
по
счету, «увеличении»
| 36
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
кEльтский
грEки
потугальцы
итальянціомайскидодин
о.
-
Еден и
o
** Алванцы
чьи русскй. *словинцы
в поляки
еволгдры
хорватые
укеницы
словакие
венгры украинцы и литовцы
и сицилийцы
слдвянскии
б эстонц
БЕлорус
дромуны
-
| | валтский
лд Тыши
Рис. 3.4. Генетические взаимоотношения популяций, вошедших в «узко-европейский» кластер на рис. 3.3.
А. График многомерного шкалирования (стресс=0,19). Популяции разных кластеров показаны разным цветом.
Б. Географическое положение изученных популяций. Цвет каждой популяции такой же, как на графике А.
Такой впервые полученный результат позволя
ет НаМ Сделать Два важных ВЫВОДа.
1) Европа не гомогенна по мтДНК: в ее пре
делах есть генетические кластеры.
2) Эти кластеры образованы народами, сход
ными по языку, то есть митохондриальный ге
нофонд Европы упорядочен по лингвистичес
дов, и генетически располагаются особняком.
Эстонцы, единственные из финно-угров, распо
ложились между славянским и балтским класте
ром — то есть между своими географическими
соседями. Итак, на графике можно увидеть как
роль сходства языков, таки важность фактора гео
графического соседства. Поэтому необходимо
кому принципу.
обратиться к решению вопроса: так что же все
Эти выводы подтверждаются и тем, что при
предыдущем генетическом масштабе формирова
таки определяет генетические дистанции между
популяциями Европы — лингвистика или геогра
ние кластеров также следовало лингвистическому
фия? Этот вопрос рассматривается в следующем
принципу, поскольку отделились финно-язычные
народы (уральская лингвистическая семья), а ос
разделе.
тались в кластере только народы, говорящие на
сути, впервые выявившего структурированность
языках индоевропейской лингвистической семьи,
и баски — осколок мира, предшествовавшего рас
пространению индоевропейских языков.
Из общей закономерности, выявленной в ходе
анализа митохондриального генофонда Европы
(популяции одной языковой группы характеризу
ются сходными митохондриальными генофонда
европейского генофонда по мтДНК, обусловлен,
на наш взгляд, прежде всего обширностью создан
Отметим, что успех проведенного анализа, по
ной базы данных и использованием в анализе лишь
больших выборок. Если бы в анализ были включе
ны выборки малого объема, то статистический
«шум» не позволил бы разглядеть закономернос
ти в структуре генофонда. Вторым факторомус
ми, рис. 3.3 и 3.4), обнаруживаются всего лишь
три исключения. Они заданы наложением геогра
фического фактора на лингвистический. Так, ро
маноязычные румыны и аромуны, географичес
ный метод последовательного «увеличения» раз
решающей способности через последовательное
ки оторванные от большинства романских наро
удаленных популяций.
пешности проведенного анализаявился применен
ВЫЯВЛеНИе И ИСКЛЮЧеНИе ИЗ аНаЛИЗа ГеНеТИЧеСКИ
3.3. ГЕОГРАФИЧЕСКАЯ И ЛИНГВИСТИЧЕСКАЯ СТРУКТУРИРОВАННОСТЬ
— ТЕНДЕНЦИИ
Вопрос о том, что больше определяет сходство
вопрос, и чтобы ответить на него на новом витке
генофондов — географическое соседство или лин
развития генетики уже недостаточно анализиро
гвистическое родство популяций — имеет давнюю
историю в популяционной генетике. Это старый
требуются другие методы анализа, позволяющие
вать графики генетических взаимоотношений. Тут
137
3.3. Географическая и лингвистическая структурированность — тенденции
по формальным статистическим критериям срав
нить значимость этих двух факторов.
Классическим и математически строгим мето
дом ответа на этот вопрос является тест Мантеля,
оценивающий тесноту статистической связи меж
думатрицами сходства популяций по разным сис
темам признаков. Для применения этого теста были
нием географических координат генетически изу
ченных популяций, относящихся к данному наро
ду (языку).
Эти три матрицы послужили входной инфор
сначала получены матрицы, оценивающие сходство
мацией для теста Мантеля, результаты которого
представлены в табл. 3.1. В верхних двух строках
таблицы показаны «прямые» оценки тесноты свя
зи генетической матрицы с двумя остальными мат
каждой пары популяций по трем признакам: гене
рицами. Оказалось, что генетическая матрица при
тическим, лингвистическим и географическим.
мерно в равной степени и достоверно связана и с
Генетическая матрица представляла собой
обычную матрицу генетических расстояний меж
лингвистической (коэффициент корреляции
r=0.31), и с географической (r=0.37). Однако дос
ду всеми изученными народами.
таточно взглянуть на лингвистическую карту Ев
ропы, чтобы убедиться, что лингвистика и сама
Лингвистическая матрица расстояний пред
ставляла собой инвертированную матрицу лингви
стического сходства между языками, на которых
говорят эти народы. Матрица лингвистического
сходства между индоевропейскими народами Ев
ропы была получена в ходе многолетних исследо
ваний московской школы глоттохронологии (про
ект «Вавилонская башня», www.staring.rinet.ru) и
любезно предоставлена член-корр. РАН А.В. Дыбо.
связана с географией (теснота этой связи в нашем
анализе составила r=0.39). Поэтому в двух ниж
них строках таблицы 3.1 теснота той же связи двух
факторов оценена при исключении влияния тре
тьего фактора (технически для такого исключения
применяется коэффициент частной корреляции.)
При этом все связи стали слабее, недостигая уров
ня достоверности, но опять можно отметить, что
Поскольку расстояния между языками, относящи
уровень связи генетики с лингвистикой лишь не
мися к разным лингвистическим семьям, трудно
многим уступает уровню ее связи с географией.
Таким образом, все три параметра (генофонд,
язык, география) оказываются столь тесно пере
оценить количественно, в анализ были включены
только популяции индоевропейской языковой се
мьи. Впрочем, к этой семье относится подавляю
щее большинство народов Европы. Для сопоста
плетены друг с другом, что не удается выявить
лидирующую связку между членами этой триады.
вимости генетических и лингвистических данных,
Однако можно констатировать, что при формаль
при расчете генетических расстояний популяции
были объединены в соответствии с их языком, вы
деляемым лингвистами. Хотя в большинстве слу
чаев это выделение совпадает с обычными пред
ставлениями генетиков о народах Европы, имеет
ся и несколько различий. Так, популяции южной
Франции были проанализированы отдельно от
ном статистическом анализе роль лингвистическо
го фактора в структурировании генофонда Евро
пы оказывается почти столь же значимой, что и
роль географического фактора.
РАЗНООБРАЗИЕ ГЕНОФОНДОВ
ЛИНГВИСТИЧЕСКИХ ГРУПП ЕВРОПЫ
большинства французских популяций и сопостав
лены провансальскому языку, популяции Уэльса и
Корнуолла сопоставлены, соответственно, с вал
лийским и корнуэльским языками, и ряд других по
добных примеров.
Географическая матрица представляла собой
географические расстояния (в километрах) между
Как и в разделе 2.1. по изменчивости Y-хромо
сомы, кроме анализа скоррелированности генети
ческих и лингвистических расстояний, был про
веден и анализ генетического разнообразия линг
вистических групп Европы (табл. 3.2). При этом
оценивались не различия между генофондамилин
центрами этнических ареалов. Для большей сопо
гвистических групп, а различия между популяци
ставимости сгенетической матрицей географичес
ями в пределах одной группы, то есть генетичес
кие координаты этих центров получены усредне
кая гетерогенность каждой группы. Оказалось, что
Таблица 3.1. Роль географического соседства и лингвистического родства в структурировании
митохондриального генофонда Европы (тест Мантеля)
Матрицы расстояний
Коэффициент корреляции
Генетика и лингвистика"
0.31
Генетика и география"
Генетика и лингвистика (без влияния географии)*
Генетика и география (без влияния лингвистики)*
(). 19
0.37
().29
Обозначения: "коэффициент парной корреляции, “коэффициент частной корреляции. Указаны корреляции
между матрицами генетических, лингвистических и географических расстояний.
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
| 38
Таблица 3.2. Гетерогенность генофондов лингвистических групп Европы по мтДНК
Лингвистическая
Числ0
Средние
Расстояния
Исключенные
группа
популяций
ГеНеТИЧеСКИе
ПОСЛe
обособленные
расстояния
коррекции"
популяции
-
Германская
Кельтская
14
7
().013
().039
() () 13
().039
Славянская
27
().042
() 034
хорватыо-ва Крк.
белорусы Бобруйска
Кантабрия
Романская
-
27
().048
().044
5
0.240
().240
-
9
0.420
().070
Саамы, удмурты
Тюркская
Финно-угорская
жВ некоторых случаях одна-две генетически обособленные популяции (например, островные популяции хор
ватов) за счет больших генетических расстояний ДО ОСТaЛЬНЫХ популяций завышали уровень гетерогенности всей
группы. Поэтому была проведена коррекция исключение из расчета тех популяций, среднее расстояние до кото
рых более чем в два раза превосходит аналогичный показатель для остальных популяций группы.
митохондриальные генофонды всех групп индоев
ропейской семьи характеризуются умеренной ге
терогенностью (от 0.1 до 0.4), тогда как гетероген
ность финно-угорской группы уральской языковой
семьи в два раза выше. Это согласуется с обособ
ленностью их генофонда и дисперсным располо
жением финно-угорских популяций при многомер
ном шкалировании (рис. 3.3 А).
Второе место по уровню гетерогенности (меж
популяционного разнообразия) занимает тюркс
кая группа (табл. 3.2, рис. 3.5). Это легко понять,
ФИННО-УГОРСКИЕ ГЕНОФОНДЫ: ВЫСОКОЕ
РАЗНООБРАЗИЕ МЕЖДУ ПОПУЛЯЦИЯМИ И
НИЗКОЕ — ВНУТРИ ПОПУЛЯЦИИ
При анализе генетических взаимоотношений
популяций Европы мы выявили обособленность
финно-угорских и родственных им популяций Во
сточной Европы. Анализ генетической гетероген
ности разных лингвистических групп Европы толь
ко что тоже указал нам на особость финно-угорс
ких групп. В следующем разделе мы увидим, что
и по показателю внутрипопуляционного (гаплоти
пического) разнообразия финно-угорские народы
учитывая предполагаемую для многих из них
(турки, чуваши и др.) смену автохтонного языка
на тюркский без значительных изменений гено
фонда.
своеобразны: среди двух обнаруженных в Европе
зон сниженного гаплотипического разнообразия
(рис. 1.20) «пиренейская зона» является второсте
0,45 —
0,4 0,35 0,3 0,25 0,2 —
0,15 0,1 0,05 -
Рис. 3.5. Сравнение лингвистических групп Европы по гетерогенности их митохондриального генофон
да. Показаны значения из таблицы 3.2.
3.4. Гаплотипическое разнообразие и мониторинг генофонда
пенной, а основной и по территории, и по масшта
бу снижения является зона сниженного разнооб
разия на северо-востоке Европы (рис. 1.20, рис.
3.6), в которую входят главным образом финно
угорские народы.
Таким образом, сниженное внутрипопуляцион
ное разнообразие (рис. 3.6) сочетается у финно
угорских популяций с повышенным межпопуля
ционным разнообразием (рис. 3.5). Обе эти черты
(сниженное внутрипопуляционное разнообразие и
повышенное межпопуляционное) являются двумя
сторонами одной медали: дрейфа генов. Действи
тельно, хорошо известный в популяционной гене
тике «эффект Валунда» как раз объясняет сниже
ние внутрипопуляционного разнообразия в подраз
деленной популяции. При этом, чем выше степень
подразделенности, тем больше и межпопуляцион
139
ные различия. Можно полагать, что у финно-угор
ских народов северо-востока Европы сниженный
(в силу эколого-демографических причин) эффек
тивный размер популяций и повышенная (по срав
нению с другими европейскими народами) изоля
ция популяций друг от друга и сформировала обе
особенности, выделяющие финно-угорский гено
фонд среди всех европейских генофондов: боль
шие различия между популяциями и сниженное
гаплотипическое разнообразие внутри них. Эта за
кономерность, таким образом, скорее географичес
кая, чем лингвистическая: она была бы характер
на для населения северо-восточных областей Ев
ропы, на каком бы языке они ни говорили, но так
сложилось, что в этом ареале исторически были
распространены преимущественно финно-угорс
кие языки.
3.4. ГАПЛОТИПИЧЕСКОЕ РАЗНООБРАЗИЕ И МОНИТОРИНГ ГЕНОФОНДА
ГАПЛОТИПИЧЕСКОЕ РАЗНООБРАЗИЕ мтДНК
ГАПЛОГРУППЫ И ГАПЛОТИПЫ мтДНК
РАСЧЕТ ГАПЛОТИПИЧЕСКОГО РАЗНООБРАЗИЯ
В предыдущем разделе была выявлена струк
турированность европейского митохондриального
генофонда в соответствии с лингвистическим фак
тором. Не менее важной (и более легко выявляе
мой) является упорядоченность географическая
(что следует и из табл. 3.1). Поскольку география
гаплогрупп мтДНК в Европе (по крайней мере, на
обычном уровне филогенетического разрешения)
оказывается малоинформативной, то географичес
кая изменчивость митохондриального генофонда
изучена не на уровне гаплогрупп, а на уровне от
дельных гаплотипов мтДНК. Конечно, рассмотре
ние географии каждого из нескольких тысяч гап
лотипов не было бы разумным. В главе 6 рассмат
риваются географически скоррелированные груп
пы гаплотипов, а здесь рассмотрим географию
обобщающего показателя, суммирующего измен
чивость всех гаплотипов мтДНК – гаплотипичес
кого разнообразия мтДНК [Балановский и др.,
2011].
Для расчета величины гаплотипического раз
нообразия использована информация нашей базы
данных «MURKA» о встречаемости каждого об
наруженного гаплотипа мтДНК в популяциях Во
сточной Европы и смежных территорий. Значи
тельная часть этой информации представляет со
бой наши неопубликованные данные, но рассчи
танные уровни гаплотипического разнообразия
опубликованы в работе [Балановский и др., 2011].
Информация по другим популяциям, показанным
на карте, введена в базу данных из опубликован
ных работ других авторов.
Простейшей характеристикой митохондриаль
ного генофонда является частота в популяции той
или иной гаплогруппы (или гаплотипа) мтДНК.
Вторым показателем является гаплотипическое
разнообразие, рассчитываемое как дополнение до
единицы суммы квадратов частот всех гаплотипов,
встреченных в популяции. Если в популяции об
наружен только один гаплотип (т.е. все обследо
ванные члены популяции одинаковы по гаплоти
пу мтДНК) – показатель гаплотипического разно
образия равен нулю; если все обследованные раз
личаются по мтДНК (ни один из гаплотипов не
встречен дважды) – показатель гаплотипического
разнообразия составляет единицу. Можно видеть,
что расчет гаплотипического разнообразия иден
тичен расчету ожидаемой гетерозиготности для
аутосомных маркеров: сумма квадратов частот со
ответствует суммарной частоте гомозигот, а допол
нение частоты гомозигот до единицы является ча
стотой гетерозигот, то есть гетерозиготностью по
пуляции. Конечно, термин «гетерозиготность» при
меним лишь к диплоидным генетическим систе
мам, тогда как митохондриальная ДНК гаплоидна.
Поэтому можно считать, что гаплотипическое раз
нообразие для гаплоидных систем является анало
гом гетерозиготности.
КАРТА ГАПЛОТИПИЧЕСКОГО РАЗНООБРАЗИЯ
Рассчитанные показатели гаплотипического
разнообразия были картографированы. Созданная
карта представлена на рис. 3.6.
140
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
тором действия дрейфа генов, особенно сильно
Карта показываетзакономерное убывание уров
ня разнообразия к северу от 0.99у южных популя
ций Причерноморья до 0.95 в северных областях
Восточной Европы и ниже 0,9 у саамов на берегах
Северного Ледовитого океана. Такая отрицательная
корреляция с географической широтой местности
нередко обнаруживается для отдельных генов, но
впервые показана для разнообразия гаплотипов.
Для популяционной генетики сниженное внут
рипопуляционное разнообразие является индика
3
18"
л"
го в небольших по размеру и значительно изоли
рованных популяциях севера Восточной Европы.
Такое объяснение является классическим и, по
всей видимости, верным. Но можно сделать сле
дующий шаг и задаться вопросом: а почему насе
ление северных областей существует в форме
популяций небольшой численности? И почему ин
тенсивность миграций между ними слабее, чем
на юге?
:
на"
н"
*
т;"
н"
— пришнлки
*
Нд:ЕЛЕ
Вссто
И ЕВРОПы
}ы|ипи
|-
и"
н.д.
ган
т им и т.
на
те ита:
инг
на
тя
*
вв"
3
|
.
}
",
.
н
А
*
*
:
.
}
L
11
интии
* "ахельги
} }
"в
*
й s" ?"
}
*
-
.
иг тенгин
во"
---
"
ил
*н*
".
3.
"он
. и ногами.
*
мим
-
*.
}
}
}
і пікій *
ч.
-
.
** .
* :
*
К.
га.
=*
-
ы
3.
*
вагода * -акклима
*
тирм
и
-
москвм в чле":
:
-
-
-
"...л.
тул,
кин.нне.
симили
*
Пны
же,
сын
и
--
кишингт
|
, }
л
xдPEст
".
:ия
*
*с
м н т и л к
— —
5з-
-
т -я
=
---
:
=
инн", "и
Ереван
т.
й и
игр-нн-ын попутными
|
т.
Рис. 3.6. Карта гаплотипического разнообразия мтДНК в Восточной Европе.
3.4. Гаплотипическое разнообразие и мониторинг генофонда
ЭКОЛОГИЧЕСКАЯ ТРАКТОВКА
Возможный ответ на этот вопрослежит в эко
лого-географических условиях обитания популя
ции. Если южные области представляют высоко
продуктивную среду обитания для популяций че
ловека (черноземная полоса), то более северные
области относятся к лесной зоне, уже не столь бла
гоприятной для сельского хозяйства, а значит, спо
собной снабжать продуктами питания меньшую по
численности популяцию. Еще далее к северу, в
полосе лесотундры и тундры, может существовать
только малочисленное население. А с учетом боль
ших пространств эти популяции оказываются изо
лированными друг от друга самим географичес
ким расстоянием, а также зачастую и меньшей
«проходимостью» территории. Все эти факторы
имели большое значение в прошлые столетия и
тысячелетия, когда и происходило формирование
генофондов севера Восточной Европы. Но даже и
сейчас сравнение, например, густоты и качества
дорожной сети северных и южных областей Евро
пейской России делает понятным сохранение боль
шей изолированности друг от друга именно север
ных популяций.
Эти общие рассуждения находят четкое под
тверждение в прямых генетико-демографических
данных. Так, проведенное исследование индексов
эндогамии одной из южных областей (Белгородс
кой) показало небольшие изменения параметров
миграций, вызванные административным перепод
чинением районов [Чурносов и др., 2008], и в це
лом выявило небольшой уровень различий между
генофондами разных районов Белгородской обла
сти. В то же время имеющиеся генетические дан
ные по северным русским популяциям (Архангель
ской области) показывают их существенные гене
тические различия [Balanovsky et al., 2008; Бала
новская и др., 2011]. Большая генетическая диф
ференциация северных, чем южных, русских по
141
пуляций показана и прямым расчетом (табл. 2.7),
и эту закономерность можно распространить и на
популяции других народов.
Другим аргументом, подтверждающим право
мочность эколого-географической трактовки фак
та убывания гаплотипического разнообразия к се
веру, является его сходство с картой плотности на
селения (карту плотности населения можно най
ти, например, здесь http://map-geo.ru/667943.html).
Оба показателя (и плотность населения, и гапло
типическое разнообразие) принимают максималь
ные значения в южных, промежуточные – в цент
ральных, и минимальные – в северных областях
Восточной Европы.
Таким образом, вырисовывается единая и зако
номерная картина взаимосвязанных изменений от
юга к северу сразу нескольких параметров: геогра
фической широты (возрастает), продуктивности сре
ды (убывает), плотности населения (убывает), изо
ляции субпопуляций (возрастает), эффективного
размера популяции (убывает), дрейфа генов (возра
стает), гаплотипического разнообразия мтДНК
(убывает). Эти параметры перечислены в порядке
предполагаемой причинно-следственной цепи.
В МАСШТАБЕ ЕВРОПЫ
Карта гаплотипического разнообразия была по
строена также и в масштабе всей Европы, а не толь
ко Восточной (эта карта приводилась на рис. 1.20 в
качестве примера для сравнения возможностей кар
тографических пакетов GGMAG и GeneGeo). В мас
штабе Европы выявляется и вторая область снижен
ного разнообразия–Пиренейский полуостров, глав
ным образому басков. Это также согласуется с пред
ложенной экологической трактовкой. Хотя корреля
ция с широтной зональностью в этой области кар
ты не прослеживается, но очевидна связь с высот
нойзональностью: снижение гаплотипического раз
нообразия в Пиренеях.
ЭКОЛОГО-ГЕНЕТИЧЕСКИЙ МОНИТОРИНГ
ТЕОРИИ
Предложенное «экологическое» объяснение
изменчивости гаплотипического разнообразия в
Европе позволяет несколько отклониться от цент
ральной темы книги и рассуждать о роли экологи
ческих факторов в структуре генофонда человека
– и вообще о возможностях отслеживания измене
ний в генофонде (мониторинге генофонда). Это
позволит нам оглянуться на важный этап развития
отечественной популяционной генетики в 70е и 80е
годы. Сравнивая с нынешними работами, нельзя
не заметить, что современный этап отличается
стремительным ростом объема экспериментальных
данных – важных, но частных результатов. Рабо
там же Ю.П.Алтухова, Ю.Г. Рычкова и других вид
ных популяционных генетиков того периода была
свойственна любовь к обобщениям, поиску зако
номерностей. Создаваемые в результате концепции
были мостом между теоретическими конструкци
ями и практическими исследованиями разнообра
зия генофондов.
Одним из таких обобщений, активно развива
емых Ю.П. Алтуховым, было представление об
уровне гетерозиготности как об интегральном по
казателе, связанном и с продолжительностью жиз
ни индивида[Алтухов, 1996, 1999], и с состояни
ем генофонда популяции: «Как убыль гетерозигот
ности, так и ее чрезмерное нарастание одинаково
неблагоприятны для нормального функционирова
142
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
ния популяции» (Динамика популяционных гено
щем ту или иную роль в адаптации его носителя к
фондов, 2004). При этом исторически сформиро
вавшееся соотношение гетерозиготности (внутри
популяционной изменчивости) и межпопуляцион
условиям естественной или искусственной среды.
ной изменчивости рассматривалось им как важней
Особенностью же отечественной популяционно-ге
нетической традиции является акцент на генофон
де, то есть на изменениях общих параметров рас
шая видоспецифичная «константа». Отклонение от
пределения в популяции всей совокупности генов.
нее в любую сторону свидетельствует о «неблаго
Примером являются работы Ю.П. Алтухова как о
связи средней (по многим генам) гетерозиготнос
получном» состоянии генофонда (Динамика попу
ляционных генофондов, 2004). В этом его работы
теснейшим образом (Алтухов, Рычков, 1970) пе
рекрываются сработами другого классика отече
ственной популяционной генетики — профессора
ти и продолжительности жизни, так и о существо
вании оптимального уровня межпопуляционных
различий (Алтухов, 1996, 1999: Динамика популя
ционных генофондов, 2004).
Ю.Г. Рычкова и его школы, в особенности с их ис
следованиями распределения межпопуляционной
изменчивости (Рычков. Ящук, 1980; Балановская,
Рычков, 1990а, б) и сработами в области эколого
генетического мониторинга (Рычков, Балановская,
1996).
И в то же время, несмотря на такое множество
близких по тематике исследований, нам неизвест
ны работы, в которых бы рассматривались пробле
Отдавая дань памяти этим ведущим ученым, а
ний во времени. В данном разделе я кратко сумми
рую итоги своих размышлений и исследований в
также желая хотя бы отчасти вернуть отечествен
ной популяционной генетике ее теоретическую
мы адаптации народонаселения не по отдельным
генам, а по генофонду в целом, причем в аспекте
мониторинга, то есть отслеживания этих измене
этом направлении.
составляющую, рассмотрим представленные выше
новые данные об изменчивости митохондриальной
СХЕМА ЭКОЛОГО-ГЕНЕТИЧЕСКОГО
ДНК, пользуясь концепциями Ю.П.Алтухова, Ю.Г.
МОНИТОРИНГА
Рычкова и их коллег о важнейшей роли гетерози
готности и о подходах к эколого-генетическому
мониторингу. Для этого проанализируем связь гео
графической изменчивости гаплотипического раз
нообразия (аналог гетерозиготности для митохон
дриальной ДНК) как с экологическими парамет
рами, так и с отягощенностью населения наслед
ственной патологией (генетическим грузом).
ГЕН ИЛИ ГЕНОФОНД?
Понятие эколого-генетического мониторинга
|Алтухов, 1995; Рычков, Балановская, 1996) осно
вывается на представлении о генофонде как о «жиз
ненном ресурсе» популяции, то есть о совокупно
сти наследственности (определяющей ее облик) и
изменчивости (задающей пределы ее пластичнос
Чтобы легче ориентироваться в комплексе
сложных и взаимосвязанных понятий, предлагает
ся следующая схема эколого-генетического мони
торинга.
1. Генетические изменения, вызванные средой:
1А — изменения по отдельным генам (адаптация);
ПБ — изменения генофонда (в силу экологичес
ких причин).
2. Отслеживание генетических изменений:
2А — вызванных средой (эколого-географичес
кий фактор);
2Б — вызванных миграциями (исторический
фактор).
Проанализируем под этим углом зрения дан
ные по изменчивости митохондриальной ДНК в на
родонаселении Восточной Европы. При этом наи
ти, необходимой для адаптации к меняющимся
большее внимание уделим разделу 2А (отслежи
условиям). Такое представление о генофонде вос
ходит к родоначальнику геногеографии А.С. Се
ванию экологически обусловленных изменений
генофонда).
ребровскому и получило дальнейшее развитие в ра
ботах отечественной геногеографической школы,
возглавлявшейся Ю.Г. Рычковым. Похожие рабо
ИЗМЕНЕНИЯ ПО ОТДЕЛЬНЫМ ГЕНАМ
(АДАПТАЦИЯ)
ты ведутся и в мировой науке: достаточно напом
Адаптивно значимые изменения частот отдель
нить о бурно развивающейся сейчас фармакогене
ных генов интенсивно изучаются многими иссле
тике, обнаруживающей различия популяций в их
реакции на лекарства. В более общем плане такие
исследования являются областью экологической
генетики (Спицын, 2008), изучающей те механиз
дователями на многочисленных примерах конкрет
ных генов (Спицын, 2008; Воrinskaya et al., 2009:
Козлов и др., 1998 и многие другие). Подавляю
щее большинство этих генов относится к аутосом
мы адаптации популяций к конкретной среде оби
ным, поскольку именно они проявляются в фено
тания, которые отражаются в повышении частот
генов, наиболее благоприятных в данных услови
ях. Важно отметить, что в большинстве исследо
ваний акцент делается на конкретном гене, играю
типе организма, подвергающегося действию отбо
ра. Изучение митохондриальной ДНК практичес
кине имеет отношения к этому разделу, поскольку
3.4. Гаплотипическое разнообразие и мониторинг генофонда
|43
в ней находится слишком мало генов. Хотя отдель
Третьим примером, взятым из работ Ю.П. Ал
ные примеры предположительного действия есте
ственного отбора на гаплотипы и гаплогруппы
мтДНК известны, все же они являются слишком
частными, чтобы придавать мтДНК значимую роль
во всем процессе адаптации популяций к окружа
ющей среде. Кроме того, все эти гены находятся в
тухова, являются генетические последствия интен
сивного промыслового лова рыбы. Использование
сетей со стандартным размером ячеи приводит к
преимущественному выживанию более мелких
особей, которые (в силу связи гетерозиготности с
размерами тела) оказываются в среднем более ге
кодирующей части мтДНК, а наиболее информа
терозиготными (Динамика популяционных гено
тивным для популяционных исследований являет
ся контрольный регион, считающийся селективно
фондов, 2004). Тем самым экологический фактор
(появление в ареале популяции многочисленных
нейтральным (безразличным для естественного
отбора).
хищников с определенным способом ловли жерт
ИЗМЕНЕНИЯ ГЕНОФОНДА (В СИЛУ
ЭКОЛОГИЧЕСКИХ ПРИЧИН)
средней гетерозиготности.
Все эти примеры иллюстрируют то общее по
вы - рыболовецких судов) приводит к изменению
одного из важнейших параметров генофонда —
ложение, что экологические условия, в которых
Зато митохондриальная ДНК оказывается ин
формативной для изучения изменений не отдель
ных генов, а генофондов в целом. Важно отметить,
находится популяция, оказывают закономерное
воздействие не только на частоты отдельных ге
нов, но и на общие параметры генофонда этой по
что такие изменения вовсе не обязательно долж
пуляции.
ны быть «адаптацией», то есть улучшать существо
вание популяции. Например, популяция, оказавша
яся в экологических условиях Севера, из-за мень
шей продуктивности среды распадается наряд изо
лированных субпопуляций, между которыми, с
одной стороны, нарастают различия, а с другой
стороны, члены одной субпопуляции становятся в
череде поколений все более генетически сходны
ми (вследствие случайного инбридинга). Это из
менение не является адаптацией, поскольку оно не
улучшает приспособленность ни отдельных чле
нов, ни популяции в целом, но оно является неиз
В нашей работе исследуется вопрос о связи
митохондриального генофонда Восточной Европы
и особенностей географической среды. Высокая
скорость мутаций мтДНК приводит к тому, что в
подавляющем большинстве популяций мира гап
лотипическое разнообразие очень высоко (более
97%). Но тем интереснее оказывается обнаруже
ние популяций даже с небольшим снижением это
го показателя. Как описывалось выше, обнаружен
ное снижение гаплотипического разнообразия на
севере мы объясняем изменчивостью цепочки эко
явления были обнаружены Ю.П. Алтуховым с кол
лого-демографо-генетических явлений: географи
ческой широты (возрастает), продуктивности сре
ды (убывает), плотности населения (убывает), эф
фективного размера популяции (убывает), изоля
ции субпопуляций (возрастает), дрейфа генов (воз
растает), гаплотипического разнообразия мтДНК
(убывает). Данное исследование может считаться
легами для ряда популяций лососевых рыб|Дина
примером комплексного изучения изменений в ге
бежным в тех экологических условиях, в которые
попала такая популяция. Примером такой популя
ции является генофонд саамов (Таmbets et al., 2004:
Балановский, 2008) и северных русских популяций
|Балановская, Балановский, 2007), и подобные же
мика популяционных генофондов, 2004).
Другим примером действия экологических ус
ловий не на отдельные гены, а на генофонд в це
нофонде, проведенного с позиций эколого-генети
ческого мониторинга.
к земледелию вызвал резкий рост населения и рез
Таким образом, мтДНК оказалась весьма эф
фективным инструментом для отслеживания изме
нений в географической структуре генофонда. При
кое повышение его локальной плотности (сосре
этом данные по мтДНК в целом согласуются и с
лом, является неолитическая революция: переход
доточенность в поселениях). Это повлекло за со
данными по другим системам генетических мар
бой изменения в структуре генофонда этих попу
ляций — ослабело действие дрейфа генов, то есть
керов (сходное убывание гетерозиготности к севе
руи востоку было показано по совокупности клас
стабилизировались частоты генетических вариан
сических маркеров (Рычков и др., 1999). Однако
тов в поколениях, сократились межпопуляционные
данные по мтДНК (одна генетическая система) в
силу большого разнообразия вариантов и в 4 раза
генетические различия. Предполагается, что это же
повлекло за собой и изменения в генофонде чело
вечества в целом, поскольку те генетические ва
сниженного для этой системы эффективного раз
мера популяции (для аутосомных маркеров эффек
рианты, которые случайно оказались свойственны
тивный размер той же самой популяции в 4 раза
ми популяциям, перешедшим на производящее
больше) выявляют этот тренд в целом даже луч
хозяйство, по мере экспоненциального ростачис
ленности этих популяций могли стать преоблада
ше, чем совокупность тридцати трех аутосомных
ющими и в генофонде всего человечества.
генетических маркеров. К тому же популярность
мтДНК в популяционно-генетических исследова
144
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
ниях, а также в работе криминалистической экс
пертизы обуславливает накопление огромного ко
личества данных по множеству популяций. Это
является дополнительным аргументом в пользу
эффективности и целесообразности использования
мтДНК для изучения общих параметров генофон
да, в том числе и в эколого-генетическом аспекте.
ОТСЛЕЖИВАНИЕ ГЕНЕТИЧЕСКИХ ИЗМЕНЕНИЙ,
ВЫЗВАННЫХ СРЕДОЙ. ГЕНЕТИЧЕСКИЙ ГРУЗ
Важным аспектом является добавление в ту же
цепь еще одного важнейшего показателя: заболе
селения определены величины генетического гру
за для 11 популяций России (Зинченко, Гинтер,
2008). Из них для семи популяций имеются и дан
ные об изменчивости мтДНК. Также мы включи
ли в анализ и восьмую популяцию (Брянской об
ласти), взяв в качестве генетической пары наши
данные по самому югу Смоленской области (рай
оны, пограничные с Брянской областью и истори
чески с ней связанные).
Рассчитанные коэффициенты корреляции гап
лотипического разнообразия сразными показате
лями генетического груза варьировали от 0.1 до 0.4.
руководством академика РАМН Е.К. Гинтера убе
При этом наибольшая корреляция (коэффициент
корреляции Пирсона, равный 0.4) получен с ауто
сомно-рецессивной патологией. Это указывает на
дительно показана взаимосвязь между грузом на
правильность избранного подхода, поскольку наи
следственной патологии (следствие) и генетичес
кой структурой популяции, в частности уровнем
более прямая связь с инбридингом (и с генетичес
ким дрейфом) ожидается как раз для рецессивных
генов (выход которых в гомозиготу в результате
ваемости населения. Работами научной школы под
случайного инбридинга (причина)|Гинтер, 1993;
Зинченко и др., 2000: Наследственные болезни в
популяциях человека, 2002). Поскольку случайный
инбредного брака обуславливает проявление на
следственного заболевания).
инбридинг прямо связан с действием дрейфа ге
Сама величина корреляции (r=0.4) является
нов, который, как мы видели, резко уменьшает гап
лотипическое разнообразие, то возможна и тесная
связь между уровнем гаплотипического разнооб
разия мтДНК и величиной сегрегационной состав
ляющей груза наследственных болезней.
Для проверки этого предположения нами были
сопоставлены величины этих двух показателей в
значимой, хотя и не слишком высокой. Нужно
иметь в виду, что эта корреляция является нижней
оценкой тесноты реально существующей связи,
поскольку реальный уровень наследственной па
тологии трудно поддается количественному опре
делению: интенсивность скрининга, неизбежно
различная в разных областях, приводит к разному
одних и тех же популяциях (табл. 3.3). К настоя
проценту выявляемости реально существующих в
щему времени методом тотального скринингана
популяции больных с наследственной патологией.
Таблица 3.3. Уровни генетического груза и гаплотипического разнообразия мтДНК
Популяция
Аутосомно- | Аутосомно-
х-
ПаТОЛОГИ (я
ПаТОЛОГИ (я
груз
суммарно
разнообразие
ПаТОЛОГИ (я
2.73
1.53
() 68
4.94
().984
3 47
1.56
().96
5.99
0.953
| 82
1.25
().47
3.54
0.967
2.23
1.43
() 33
3.99
0.922
| ()|
().81
(). 39
2.21
0.981
| 25
0.9
(). 3
2.45
0.958
доминантная | рецессивная | сцепленная
Башкиры
Удмурты
Чуваши
Марийцы
Русские
Генетический | Гаплотипическое
мтДНК
(Брянская обл.)
Русские
(Костромская обл.)
Русские
(Ростовская обл.)
Русские
(Краснодарский кр.)
Русские
2
1.34
().44
3.78
0.976
| ()|
0.64
(). 35
2
0.980
(Кировская обл.)
| 56
1.28
(). 36
3.2
(Тверская обл.)
().96
0.72
(). 62
2.3
Адыгейцы
107
1.41
(). 5
2.98
-
Русские
Примечание: данные по генетической отягощенности взяты изработы Зинченко, Гинтер, 2008). В исследова
ниях, обобщенных в этой работе, генетический груз определялся методом тотального скрининга населения в выб
ранных регионах, при этом число обнаруженных семей с наследственной патологией приводится в формате «чис
ло случаев на 100 тысяч человек».
3.4. Гаплотипическое разнообразие и мониторинг генофонда
При статистических сравнениях это приводит к
повышенному уровню шума, снижающему вели
чину коэффициента корреляции.
Более того, корреляции такого уровня тради
ционно рассматриваются как информативные при
сравнениях связи между признаками различной
природы. Например, вывод о зависимости распре
деления гаплогрупп Y-хромосомы в Европе от гео
графических факторов (Rosser et al., 2000) осно
вывался на величине корреляции между генетичес
кими и географическими расстояниями r=0.3; а
общепризнанное в настоящее время положение об
информативности фамилий в качестве квазигене
тического маркера было первоначально обоснова
но А.А. Ревазовым с соавторами при такой же ве
личине коэффициента корреляции r=0.3 |Ревазов
|45
ций, реконструировавших основные этапы и пути
расселения человека по планете. Что касается воз
можности отслеживания по мтДНК итогов мигра
ций, происходящих в настоящее время и ожидае
мых в ближайшем будущем, то мы предлагаем под
разделять их на два типа. Первый тип — миграции
русских, украинцев и белорусов внутри их исто
рического ареала. Митохондриальные генофонды
всех этих популяций очень похожи (Балановский
и др., 2010), и вряд ли мы сможем обнаружить по
токи миграций между этими генетически сходны
ми этносами восточных славян. Однакомы можем
оценивать общую интенсивность миграций по
средним генетическим расстояниям между восточ
нославянскими популяциями. Эта величина со
вается весьма информативным для изучения связи
ставляет 0.049 между всей совокупностью восточ
нославянских популяций, 0.043 между популяци
ями белорусов; 0,053 между популяциями русских;
0.029 между популяциями украинцев. При резком
возрастании интенсивности миграций между по
генетической структуры популяций и груза наслед
ственной патологии. Поэтому данные по мтДНК
стояний будут убывать. Таким образом, при повтор
и др., 1986).
Резюмируя, можно сказать, что гаплотипичес
кое разнообразие митохондриальной ДНК оказы
(совместно с другими генетическими и квазигене
тическими маркерами) могут использоваться для
прогноза груза наследственной патологии для тех
популяций, по которым нет прямых генетико-эпи
ДеМИОЛОГИЧеСКИХ Данных.
ОТСЛЕЖИВАНИЕ ГЕНЕТИЧЕСКИХ ИЗМЕНЕНИЙ,
пуляциями, величины средних генетических рас
ных исследованиях генофондов мы имеем возмож
ность сравнивать получаемые величины средних
генетических расстояний с наблюдаемыми нами
для коренного (в трех поколениях) населения, про
водя тем самым генетический мониторинг общей
интенсивности миграций, снижающих подразде
ленность восточнославянского генофонда. Для это
ВЫЗВАННЫХ ИСТОРИЧЕСКИМ ФАКТОРОМ
го, правда, будет необходимо провести повторное
исследование строго по стандартам первого, вклю
Последний аспект эколого-генетического мо
ниторинга — это отслеживание изменений в гено
фонде, вызванных миграциями населения. Не имея
тесной связи с экологической составляющей (по
скольку миграции человека объясняются все же
чаще историческими, а не экологическими причи
нами), фактор миграций имеет ключевое значение
для мониторингагенофонда. Действительно, мас
совые миграции населения, усиливающиеся с каж
дым столетием, становятся решающим фактором,
изменяющим структуру генофондов.
Отметим попутно, что рассмотрение фактора
миграций имеет значение и для эколого-генетичес
ких исследований, поскольку каждое наблюдаемое
изменение генофонда может быть вызвано как адап
тацией (естественным отбором), так и миграциями.
Поэтому прежде чем делать вывод об экологичес
кой обусловленности наблюдаемых различий, не
обходимо исключить действие других факторов
микроэволюции, и в первую очередь миграций.
Рассмотрим информативность мтДНК для от
слеживания действия миграций на генофонд—сна
чая формирование выборок, использованные мар
керы мтДНК (ГВС1 + отдельные маркеры кодиру
ющей части) и набор выделяемых гаплогрупп.
Необходимо при этом учитывать, что сравнитель
но небольшие величины этих различий делаютта
кой подход пригодным лишь для отслеживания
принципиально нового уровня межпопуляционных
миграций, тогда как небольшие изменения, по-ви
димому, не будут достигать порога статистической
ЗНaЧИМОСТИ.
Второй тип миграций — это включение в вос
точнославянский генофонд населения из географи
чески удаленных и генетически контрастных ре
гионов. Характер распределения гаплогрупп
мтДНК у народов мира позволяет четко отслежи
вать миграции из восточных частей Евразии, в ча
стности Сибири, Китая, Юго-Восточной Азии.
Прослеживание же миграций из Юго-Западной
Азии возможно только по частотам характерных
«ближневосточных» гаплогрупп, таких как J и U7.
Что же касается миграций с Кавказа и Урала, то
значительное сходство митохондриальных гено
чала для прошедших, а затем и для будущих эта
фондов этих регионов с восточнославянским сде
пов микроэволюции генофонда.
Высокая информативность для отслеживания
лает такую оценку в настоящее время проблема
тичной. Анализ мтДНК на основе ее полного сек
миграций, имевших место в прошлом, доказыва
ется всей совокупностью сотен научных публика
цировать потоки миграций. Тем не менее, можно
венирования позволяет более детально дифферен
|46
Глава 3. Структура генофонда Европы в зеркале митохондриальной ДНК
полагать, что для этих целей наиболее информа
тивным будет анализ Y-хромосомы, варианты ко
торой обладают значительно большей географичес
кой специфичностью, чем варианты мтДНК.
Заключая, можно констатировать, что из че
ческих условий и структуры генофонда в целом;
2) для мониторинга таких изменений. При этом
митохондриальная ДНК мало информативна для
изучения адаптации по отдельным генам и обла
дает средней информативностью в четвертом ас
тырех аспектов эколого-генетического монито
пекте — при отслеживании изменений, происхо
ринга митохондриальная ДНК весьма информа
тивна для двух: 1) для изучения связи экологи
дящих в генофонде по причине миграций насе
ЛеНИЯ.
ГЛАВА 4. СТРУКТУРА ГЕНОФОНДА ЕВРОПЫ В ЗЕРКАЛЕ
ПОЛНОГЕНОМНЫХ МАРКЕРОВ
4.1. ОСОБЕННОСТИ ШИРОКОГЕНОМНОГО АНАЛИЗА
Специалист подобен флюсу — полнота его односторонняя.
Козьма Прутков
«ПОЛНОГЕНОМНЫЕ» И «ШИРОКОГЕНОМНЫЕ»
ПОЛНОГЕНОМНЫЕ = АУТОСОМНЫЕ?
анализа обеспечил возможность подробной гене
В связи с особой важностью Y-хромосомы для
популяционных работ надо пояснить, что и широ
тической характеристики каждого образца - по всей
когеномные панели, и полногеномные данные, ко
длине его генома. Термин «полногеномные» ис
пользуется в двух смыслах, различающихся степе
нечно, включают данные и по этой хромосоме. Но
поскольку методы анализа рекомбинирующих и
НЬЮ ОХВаТаГеНОМa.
нерекомбинирующих систем различны, то в попу
Быстрый прогресс технологий генетического
В первом случае под «полногеномными» дан
ляционных исследованиях широкогеномных дан
ными понимаются чипы высокой плотности по
ных информация по Y-хромосоме, а также по
мтДНК и Х-хромосоме, исключается из анализа.
Анализируются, таким образом, лишь аутосомные
крытия генома, состоящие из множества (от не
скольких сот тысяч до нескольких миллионов)
SNP-маркеров. Эти панели маркеров точнее было
маркеры, поэтому анализ широкогеномных данных
бы называть широкогеномными (калька с англо
является фактически синонимом анализа подроб
язычного термина genome-wide), и именно так я
буду их называть в этой книге, хотя в русскоязыч
ных аутосомных данных.
ной литературе их обычно называют «полногеном
шинство широкогеномных данных разрабатыва
лись для целей медицинской генетики и поэтому
НЫe».
Это нередко вызывает путаницу, потому что во
втором случае подтем же термином «полногеном
ный анализ» имеется в виду именно расшифровка
полной последовательности всего генома. Правда,
и эта полнота не абсолютна — в геноме есть регио
ны, состоящие из часто повторяющихся последо
вательностей, секвенирование которых из-за это
го крайне затруднено. Этих последовательностей
Нужно лишь сделать важную оговорку. Боль
включили мало маркеров по Y-хромосоме, да и те
попались в основном филогенетически мало ин
формативные. Но две широкогеномные панели панель Нuman Оrigin (разработанная под руковод
ством David Reich из Гарвардского университета)
и панель GenoChip (разработанная в проекте
Genographic 2.0) — специально предназначались для
популяционных исследований и включили множе
особенно много на Y-хромосоме — они составляют
более половины ее длины. Поэтому «полное» сек
венирование Y-хромосомы чаще всего включает
10—15 млн.п.н., то есть примерно четверть ее дли
ство филогенетически информативных маркеров
Y-хромосомы. Поэтому при использовании этих
ны, но и этого оказывается вполне достаточно для
сматриваются отдельно, а в основной анализ вклю
точных филогенетических реконструкций.
чаются лишь аутосомные маркеры.
широкогеномных панелей данные по Y-хромосо
мене игнорируются. Но и в этом случае они рас
В связи с очень высокой стоимостью полного
Эта «аутосомность» широкогеномного анали
секвенирования геномов большинство «полноге
номных» популяционных исследований (в том чис
ле представленных в нашем исследовании) выпол
нены по «широкогеномным» данным. Но идей
ствительно полногеномный анализ, пусть и в мень
за касается и полногеномного. Хотя при полном
секвенировании добываются также данные по Y
хромосоме и мтДНК, они также рассматриваются
ОтдельНО, а в Основные виды анализа включаются
только маркеры аутосомных хромосом.
шей степени, представлен в мировой литературе и
в этой книге — например, секвенирование полных
Много МАРКЕРОВ, но МАЛО ОБРАЗЦОВ
древних геномов (глава 8) и результаты секвени
рования Y-хромосомы (глава 7).
Высокая стоимость широкогеномного и, особен
но, полногеномного генотипирования резко ограни
Глава 4. Структура генофонда Европы в зеркале полногеномных маркеров
|48
чивает число изучаемых образцов. Если классичес
кими для популяционной генетики являются выбор
ки в 70-100 образцов, а при анализе Y-хромосомы и
мтДНК их иногда старались даже увеличивать (что
для гаплоидных систем действительно необходимо),
то выборки при широкогеномном анализе состав
ляют обычно 10-20 образцов, а полные геномы и
вовсе чаще всего одиночны. Считается, что малый
объем выборки отчасти компенсируется большой
подробностью генотипирования каждого образца.
Но, во-первых, только отчасти, а во-вторых, это толь
ко так считается. Что действительно помогает по
лучать надежные результаты при столь малых вы
борках, это то, что единицей анализа при широко
геномных исследованиях выступает не популяция,
а отдельный образец. Соответственно, если попу
ляция представлена десятком-другим образцов, и
почти все они ведут себя одинаково (например, вхо
дят в один кластер на графике главных компонент и
наборов — для панелей маркеров, включающих от
300 тысяч до 2 миллионов SNР-маркеров, равно
мерно покрывающих весь геном. Кроме того, ком
пания предлагает разработку наборов на заказ,
включающих любые маркеры, нужные пользова
телю, но объем заказа должен быть достаточно
большим (1000 и более образцов). Основные па
нели были разработаны для нужд медицинской
генетики, ведь для картирования генов болезней
как раз нужно иметь равномерное покрытие гено
ма. Но эти же панели оказались высокоинформа
тивны и для популяционной генетики. Из панелей,
разработанных к настоящему времени на заказ, для
целей популяционной генетики предназначена
лишь одна — панель GenoChip, разработанная био
информатиком Еran Elhaik для проекта Genographic
2.0. Автор этой книги и сам участвует в проекте
Genographic 2.0. И потому, зная принцип тщатель
ного отбора маркеров — чтобы в их число были
характеризуются почти одинаковым соотношением
включены характеристические маркеры для каж
предковых компонентов на графике АDMIXTURE)
дой популяции мира, изученной ко времени созда
ния набора, — может рекомендовать читателю не
судить о качестве набора лишь по числу маркеров
— это является сильным аргументом воспроизводи
мости и надежности полученного результата даже
при малом объеме выборки.
Но малый объем выборок представляет еще
одну опасность. Ведь если в выборке в 15 образ
цов из популяции Амногие образцы случайно ока
(которое кажется не слишком большим по совре
менным меркам: около 130 тысяч аутосомных и
около 13 тысяч Y-хромосомных маркеров).
Аffimetrix также предлагает ряд панелей, но в
жутся от людей, в своих родословных имеющих
целом они использовались в популяционной гене
предков из популяции Б, то для всей популяции А
тике меньше, чем Пlumina. Однако самое первое,
будет сделан вывод о ее большом генетическом
сходстве с популяцией Б — и этот вывод будет не
верным. Иными словами, поскольку по данным о
малой выборке — 10—15 человек — зачастую судят о
ключевое широкогеномное исследование популя
генофонде многомиллионного народа, решающее
ций Европы (Novembre et al., 2008) выполнено на
одной из первых панелей Аffimetrix. И набор
Нuman Оrigin, широко используемый в статьях ко
манды David Reich, занявшей в последние пару лет
значение имеет, в какой степени эти 10 человек
лидирующие позиции, тоже генотипируется на
репрезентативны для всего генофонда. Это накла
платформе Аffimetrix.
дывает огромную ответственность на тех, кто со
бирает популяционные выборки и отбирает из них
образцы для широкогеномного анализа. Конечно,
в популяционной генетике всегда анализируются
выборки, а выводы делаются о популяциях. Но при
широкогеномных исследованиях контраст между
выборкой и всей популяцией может быть разитель
ным. Итак, при широкогеномных исследованиях
принципиальное значение имеет качество форми
рования выборок.
АНАЛИЗ РОССИЙСКИХ ПОПУЛЯЦИЙ
Еще с конца 90х годов ряд российских коллек
тивов в тесном сотрудничестве друг с другом вы
полнял работы по изучению восточно-европейских
популяций по панелям из 3—10 аутосомных марке
ров. Были охвачены почти все народы Восточной
Европы и Урала, а число маркеров было для того
времени достаточно большим: использовались в
основном микросателлиты и миниcаттелиты
РАЗНЫЕ ПАНЕЛИ
Широкогеномное генотипирование техничес
ки проводится на двух платформах, предлагаемых
компаниями Illumina и Аffimetrix. Для генотипи
рования нужно иметь и оборудование от одной из
этих компаний, и наборы для генотипирования,
соответствующие оборудованию, и поэтому разра
батываемые теми же производителями.
(Popova et al., 2001; Султанаева и др., 2001; Хус
нутдинова и др., 2003; Verbenko et al., 2003ab;
Stepanov et al., 2011: Ахметова и др., 2006), хотя
применялись и маркеры других типов (Shabrova et
al., 2004; Yunusbayev et al., 2006; Соловьева и др.,
2010). Основная часть этих исследований была
обобщена в монографии (Лимборская и др., 2002)
и моей диссертации (Балановский, 2002).
Накопленный опыт исследований отдельных
Пlumina за несколько лет своей работы после
аутосомных маркеров позволил российским кол
довательно предлагала около десятка основных
лективам (в сотрудничестве с рядом зарубежных,
4.2. Генетические взаимоотношения популяций: три вариации на европейскую тему
|49
ных стран, в основном благодаря работам Эстон
ских коллег, а также ряда других российских и
зарубежных лабораторий, изучено на уровне, не
уступающем большинству других регионов
мира. По крайней мере, большинство народов
России представлены хотя бы одной выборкой,
генотипированной по широкогеномным марке
ского биоцентра и его многочисленных россий
рам.
предоставлявших технические возможности ге
нотипирования)
ВКЛЮЧИТЬСЯ И В ИССЛeДОВаНИЯ
полногеномных маркеров, когда они вошли вар
сенал популяционной генетики. К настоящему
времени народонаселение России и сопредель
4.2. ГЕНЕТИЧЕСКИЕ ВЗАИМООТНОШЕНИЯ ПОПУЛЯЦИЙ: ТРИ ВАРИАЦИИ НА
ЕВРОПЕЙСКУЮ ТЕМУ
Все то же солнце ходит надо мной,
Но и оно не блещет новизной!
Шекспир. Сонет 76.
ВАРИАЦИЯ ПЕРВАЯ: «ГЕОГРАФИЧЕСКАЯ»
КЛАСТЕРИЗАЦИЯ
нию от англичан к испанцам, то французы окажут
ся справа от нее и на географической, и на генети
ческой карте, а само это пространство на генети
Первой статьей, подробно охарактеризовавшей
генофонд Европы по широкогеномным маркерам,
ческой карте пустует — как и на географической
оно занято Бискайским заливом.
стала работа международного коллектива, опубли
Генетическая карта отлично воспроизводит гео
кованная в 2008 году в Nature (Novembre et al.,
графическую и в Средиземноморье — видны гене
тические облака, соответствующие Аппенинскому
2008). В этой статье популяции, представляющие
большинство европейских стран, были охаракте
и Балканскому полуостровам, и промежутки меж
ризованы по панели Аffimetrix из 500 тысяч SNР
маркеров. Основной результат показан на графике
главных компонент (рис. 4.1).
Как говорилось, большое число SNP-маркеров
дy ними, соответствующие Балеарскому и Адриа
позволяет надежно определять генетическое по
друг относительно друга хотя обычно и соответ
ложение не только популяционной выборки, но и
каждого индивидуального образца. Тем удиви
ствует географическому положению народов, но
тельнее, что даже индивиды, несмотря на заведо
ются от географической.
мо большой размах межиндивидуальных разли
чий внутри популяции, четко кластеризуются по
стране происхождения. Более того, получившая
ся «генетическая карта» в значительной степени
Напомним, что очень близкий результат полу
чен в нашем исследовании и по данным обY-хро
воспроизводит географическую. Этот результат
был вынесен в название статьи — «Гены отража
тическому морям. Правда, в Восточной Европе
такого полного отражения географии уже не на
блюдается. Там положение этнических облаков
пропорции генетической карты уже явно отлича
мосоме (рис. 2.40): точно также вместе группиро
вались популяции Британских островов, близко
друг к другу были популяции Пиренейского полу
ют географию». Но, положа руку на сердце, этот
результат не нов. Он ранее неоднократно наме
острова (аналогично Аппенинского и Балканско
го), соответствие географической и генетической
карт прослеживалось и в Восточной Европе. Об
чался в популяционных исследованиях и школы
наружив один и тот же результат в двух обобщаю
Кавалли-Сфорца, и отечественной школы геноге
ографии.
Другое дело, что географическая кластериза
ция никогда еще не проявлялась стакой рельефно
стью и убедительностью. Действительно, почти все
ирландские образцы образуют «этническое обла
ко», примыкающее к облаку уроженцев Великоб
щих исследованиях, разных и по использованным
системам, и по методам, и по изученным популя
циям, нужно признать, что генофонд Европы дей
ствительно структурирован прежде всего по гео
графическому принципу!
ВАРИАЦИЯ ВТОРАЯ: ОБОСОБЛЕННОСТЬ СЕВЕРО
ритании — точно также как примыкают друг к дру
ВОСТОКА
гу два этих острова. Сразу за английским облаком
— опять следуя географии — располагается облако
французских образцов. А от французского облака
отделено небольшим промежутком (хочется ска
зать — отделено Пиренеями) облако испанцев, по
генофонда Европы основывались, главным обра
Последующие широкогеномные исследования
зом, на различных панелях сразным, все увеличи
вающимся, числом SNР-маркеров компании
чти слившихся — на одном полуострове — спорту
Illumina (Nelis et al., 2009; Yunusbaev et al., 2012).
гальцами. Полноту сходства с географической кар
хотя использовались и панели Аffimetrix (Xing et
al., 2009). Эти работы подтвердили вывод о при
той дополняет то, что если провести прямую ли
15()
Глава 4. Структура генофонда Европы в зеркале полногеномных маркеров
Рис. 4.1. Генетические взаимоотношения популяций Европы по данным о широкогеномных маркерах
панели Аffimetrix. График главных компонент, приводится по (Novembre et al., 2008).
мате географического фактора в структурировании
аутосомного генофонда Европы по широкогеном
мо, поэтому в ней не выявилась «трехлучевая»
ным данным. Так, вышедшая уже в следующем
структура. А когда в работе (Nelis et al., 2009) до
бавились генетические контрастные финны (куда
году статья (Nelis et al., 2009) тоже констатировала
кластеризацию по географическому принципу.
ровать из их географического положения), все ос
Более того, роль географии была показана не толь
ко на уровне крупных популяций (уровня стран),
но и внутри столь небольшой по площади страны,
как Эстония (группы индивидов, выделенные на
графике по критерию их генетического сходства,
более контрастные, чем можно было бы прогнози
тальное генетическое разнообразие Европы сплю
щилось в одну линию. Правда, и в статье (Nelis et
al., 2009) очень многие народы Европы отсутство
вали, поэтому и трехлучевая картина не является
окончательной.
мии северными финнами, а также эстонцами) ока
Отметим, что вывод (Nelis et al., 2009) о резко
выраженном своеобразии генофонда финнов по
большому счету тоже не нов — не новее вывода о
географической кластеризации (Novembre et al.,
2008). Это своеобразие финнов хорошо известно в
популяционной генетике и объясняется сильным
зываются одним из трех генетических «полюсов»
действием дрейфа генов на редко заселенных тер
Европы. Степень выраженности этих полюсов та
кова, что все европейские популяции вместе фор
риториях северо-востока Европы. У медицинских
мируют как бы трехлучевую звезду, случами, вы
тянутыми от общеевропейского центрактpем «по
те редкие наследственные варианты, которые за
соответствуют их происхождению из различных
районов Эстонии).
Другой важный вывод этой работы состоит в
том, что популяции северо-востока Европы (пред
ставленные в этой статье главным образом южны
генетиков есть даже термин «финские болезни» -
люсам» (рис. 4.2). В работе (Novembre et al., 2008)
счет дрейфа генов достигли заметной частоты у
финнов, а в других популяциях Европы практичес
северо-восток был почти не представлен, — види
ки отсутствуют Финны во всех этих случаях явля
Генетические взаимоотношения
:
:
:
:
:
:
*
популяций:
три вариации на
европейскую
тему
c-echве public
- Аш:tria
* Bulgaria
.
О Е:tonia
* Finland (Helsinki)
- Finland
o France
Нungary
Northern Germany
Northern Italy
- Latvia
-Lithuania
Ф Rш5:1a
+Spain
151
(kчusamo,
-southern Germany
+southernкы,
--.
Poland
-Sweden
Рис. 4.2 Генетические взаимоотношения популяций Европы
панели Пlumina. График главных компонент (Nelis et al., 2009).
ются наиболее подробно изученными представи
и с определенной осторожностью, относить ко все
му этому региону.
В статье (Nelis et al., 2009) проведен также ана
лиз генетических границ. Для этого использован не
геногеографический подход через локальное меж
популяционное разнообразие (описанный в главе 8),
а традиционный подход совмещения данных о ге
нетических расстояниях между популяциями и их
географических координатах, реализованный в про
грамме Вarrier (использованной и нами в главе 7).
Любопытно, что генетические границы (барьеры
для потока генов) выявлены как между этнически
ми облаками, так и внутри некоторых народов (на
пример, между южными и северными финнами,
между южными и северными итальянцами).
"..
"...
- Switzerland
телями всего населения северо-востока Европы (от
Балтики до Урала), и выводы о финнах можно, хотя
"...
по данным о широкогеномных маркерах
Последующие работы не изменили сколь-либо
существенно выводов этих двух основных работ,
и были посвящены отдельным регионам Европы
(Filippova et al., 2012; Кarafet et al., 2015; Кhrunin
et al., 2013 и другие). В частности, в статье [Кhrunin
et al., 2013) представлены данные по 4 русским по
пуляциям, а также финно-угорским популяциям
севера Европейской части России и показано, что
население крайнего северо-востока Европы (пред
ставленного в статье популяцией коми) может быть
еще одним полюсом генетического разнообразия
европейского генофонда.
ВАРИАЦИЯ ТРЕТЬЯ: МОСТ К БЛИЖНЕМУ
ВОСТОКУ
Следующий витокисследований связан с исполь
зованием двух методических приемов: специальных
Вообще эта работаничем не уступает по свое
«исторических» панелей маркеров и совмещением
му уровню исследованию (Novembre et al., 2008),
данных по современным и древним популяциям.
Если первые полногеномные популяционно-ге
но, появившись чуть позже, она была опубликова
на и в менее престижном журнале (PLoS Оne), и
нетические исследования опирались на чипы высо
реже цитируется.
кой плотности, разработанные для целей медицин
152
Глава 4. Структура генофонда Европы в зеркале полногеномных маркеров
ской генетики, то в последние годы все шире ис
В этом исследовании были подробно изучены не
только европейские, но и ближневосточные по
пуляции. На графике прекрасно выделяются эти
пользуются «прицельные» панели - широкогеном
ные панели маркеров, специально подобранные для
целей выявления истории популяций. Наиболее под
робные данные о современных популяциях опуб
ликованы к настоящему времени по набору Нuman
Оrigins в серии статей подруководством David Reich,
и к рассмотрению их результатов мы сейчас и пере
ходим. Что касается совмещения на одном графике
данных по современным и древним образцам, то
два региона, популяции которых протянулись дву
мя параллельными линиями. Генетическими по
ЛЮСаМИ Европы являются: сардинцы, а также на
роды Иберийского полуострова (первый полюс),
и (второй полюс) народы Восточно-Европейской
равнины. То есть опять паттерн в точности сле
дует географической оси, вдоль которой с запада
на восток вытянута Европа. Генетические полю
са Ближнего Востока, рассматриваемого в самом
этот прием широко используется в тех же статьях,
но мы его рассмотрим в главе 9, специально посвя
щенной исследованиям древней ДНК.
широком смысле, включая и смежные регионы, —
это Северная Африка и Кавказ. Обращает на себя
внимание, что изменчивость генофонда Ближне
График главных компонент, полученный по
набору Нuman Оrigin, представлен на рисунке 4.3.
Ancients (projected)
".
v Stuttgart
О Мotala12
w Skoglund farmer о Моiala merge
ку Iceman
o Skoglund нG
Ф Loschbour
о МД1
С Laвгапа
о дер
*
0.05 -
Ф
*
"
-
."--
" }
.."
А.
} .*} л"
} ** -
Ancient north Eurasians
м
С»
А
* " " ...:
** ,
А
ее
А
+.
А
3++
e- "ахи
0.00 -
в
****
*
*н
*
3.
"
" ..."
*.
}+
и
с
0
* :
С»
}
****
*."
" - в
x
*
и
*. EaryуEuropeanfarmers
- y
8
с
в
д",н "м
* **
+x
Scandinayan hunter-gatherers
"л
*е
":
к не
*
*.*в натят
да, -
5
e
*
ж.
г. :
|-
**
.***
".
*
м.
*:* А*
}
c\
.
н
"я
}
—0.05 «»
**
- ".
Western European hunter-gatherers "
:
Ф
и"
Моdern West Eurasians
—0.10 -
* English
о дгпепіап
и Iranian
и French
А Тurkish
* Icelandic
Albanian
и Веrgamo
* Вulgarian
* Сypriot
Abkhasiaп
* Adygei
Вalkar
* Norwegian
x Orcadian
x Greek
в Scottish
- весiouіпд
и весioulпв
Italian South
+ Маitese
А Jordanian
* Раlestinian
* Sicilian
x Saudi
в Tuscan
e Syrian
—0.10
—0.05
* Сhechen
к Georgian
Кumyk
+ Lezgin
* North Ossetian
* Ashkenazi Jew
и Georgian Jew
А Iranian Jew
* Iraqi Jew
x
в
+
*
в
-
Libyan Jew
Моroccan Jew
Tunisian Jew
Turkish Jew
Yemenite Jew
Вasque
French South
* Spanish
* Spanish North
a Druze
и Lebanese
и Сroatian
А Сzech
кин
и и
* Estonian
х Нungarian
".
* Lithuanian
+ Ukrainian
- Сanary Islanders
и Sardinian
Finnish
Могdowіап
* Russian
- Веlarusian
0.00
0.05
0.10
Dimension 1
Рис. 4.3. Генетические взаимоотношения популяций Европы и Ближнего Востока по данным о широко
геномных маркерах (панель Нuman Оrigin — Аffimetrix). График главных компонент (Lazaridis et al., 2014).
| 53
4.3. Анализ предковых компонентов (ADMIXTURE)
го Востока (и Северной Африки) выше, чем Ев
динии, как считается, сохранило генофонд неоли
ропы, хотя по площади территории эти регионы
тической миграционной волны в Европу, которая
СОПОСТаВИМЫ.
во всех других местах значительно смешалась с
Два больших облака на графике — европейских
и ближневосточных популяций — четко отделены
друг от друга, как и географически они разделены
Средиземным и Черным морями. Мостом между
ними служат популяции двух народов, населяющих
острова Средиземноморья — греков и сицилийцев.
Острова Эгейского моря и Сицилия действитель
но являлись путями многих исторически докумен
тированных миграций между южным и северным
побережьями Средиземного моря. В этом плане
скорее неожиданно, почему население вдоль тре
тьего пути (Гибралтарского) по этим данным раз
нится между собой (например, популяции испан
цев и запада Северной Африки генетически уда
лены друг от друга).
Еще одним мостом являются популяции евре
ев (из Европы, Ближнего Востока и Северной Аф
рики), многие из которых выведены на этот гра
фик. Возможно, в ходе своей сложной истории
миграций они включили в себя как европейские,
так и ближневосточные компоненты. Лишь евреи
донеолитическим населением или приняла в себя
позднейшие миграционные волны. Подтверждение
этому мы увидим в главе 9, где с современным ге
нофондом Сардинии почти совпадают геномы пер
вых неолитических популяций Европы, реконст
руированные по древней ДНК.
Итак, результаты этого третьего крупного ис
следования, хотя и добавляют ряд важных штри
хов — в основном про взаимодействие Европы и
Ближнего Востока — тоже являются вариацией на
тему географической кластеризации европейских
генофондов.
Дальнейшее уточнение структуры европейс
кого генофонда с помощью широкогеномных дан
ных может идти двумя путями. Первый путь — это
увеличение числа изученных популяций, ведь в
каждом из трех описанных исследований карта
изученных популяций зияет многочисленными и
обширными дырами. Второй путь — это расшире
ние спектра использованных методов анализадан
ных, ведь до сих пор мы рассматривали лишь гра
Грузии, Ирана и Йемена генетически почти нео
фики главных компонент. Оба этих пути реализо
тличимы от основного населения этих стран — ве
ваны в данной книге в региональном масштабе —
роятно, за счет преобладания в их генофонде ком
для балто-славянских народов Европы (глава 6).
понента принявших иудаизм местных уроженцев
Но прежде чем перейти канализу славянских ге
над компонентом, принесенным в ходе миграции
нофондов, рассмотрим еще одни результаты по
евреев из их исторического ареала.
широкогеномным маркерам в глобальном масш
табе. Речь идет о применении метода
Любопытно положение сардинцев, находящих
ся в генетическом пространстве близко к основ
ной массе европейских популяций, но не присое
диняющихся к ней. Действительно, население Сар
АDMIXTURE, который, наряду с главными ком
понентами, уже стал традиционным при обработ
ке широкогеномных данных.
4.3. АНАЛИЗ ПРЕДКОВЫХ КОМПОНЕНТОВ (ADMIXTURE)
Я не сам по себе — я лишь тень отдаленного предка.
Постоянно мне кажется — с ним я один человек.
Я на дереве общем всего лишь случайная ветка,
От которой появится новый зеленый побег
Миллионы за мною и передо мной миллионы.
Жар свирепой пустыни, зола от костров на снегу.
Как измученный зек, из невидимой этой колонны
Я и радубежать бы, да только, увы, не могу.
А. Городницкий
ПРИНЦИП МЕТОДА
Чтобы сравнивать генофонды по широкогеном
ным данным, часто используется анализ «предко
вых компонентов» (не путать с «главными компо
нентами»!). Этот метод реализован в программе
STRUCTURE и в ее усовершенствованном вари
анте — программе ADMIXTURE. Метод требует
только двух вещей: широкогеномных данных по
большому числу популяций и задания числа гипо
тетических предковых популяций, из которых
сформировались все эти современные популяции.
Тогда программа вычисляет, каковы должны быть
частоты каждого аллеля в каждой из предковых
популяций, и рассчитывает для каждой современ
ной популяции доли этих предковых популяций в
ее генофонде. Эти разные предковые компоненты
принято отображать разными цветами, и каждая
популяция характеризуется своим спектром этих
цветов. Понятно, что такая модель условна - в ре
альности вряд ли современные генофонды сфор
мировались в результате смешения фиксированно
Глава 4. Структура генофонда Европы в зеркале полногеномных маркеров
| 54
го числа предковых популяций. Но выявляемые
предковые компоненты, как мы сейчас увидим,
имеют реальный смысл.
ВЫБОР ЧИСЛА КОМПОНЕНТОВ (k)
вычное со школы деление на три большие расы -
негроидов, европеоидов и монголоидов. А если
физическим антропологам сказать, что требуется
разделить все антропологическое многообразие на
4 группы, тогда большинство из них выделитаме
риканоидную расу из состава монголоидной. Не
Основной проблемой является выбор числа
большое отличие от антропологических классифи
предковых компонентов, который должен задать
пользователь. Это число принято обозначать k.
каций состоит в том, что австралоидная раса при
обретает свой собственный компонент лишь начи
Хотя и существуют приемы определения оптималь
ного k, они не всегда срабатывают, и выбор обыч
ная с k=6, тогда как в традиционных расовых клас
сификациях австралоидная раса имеет чуть более
но остается на усмотрение исследователя. Ситуа
высокий иерархический статус. Поразительно и
цию облегчает то, что выделяемые компоненты
весьма устойчивы — при анализе самых разных
традиционных расовых классификаций новейши
печально, что при таком полном подтверждении
МаССИВОВ Данных чаСТО ВЫЯВЛЯЮТСЯ ОДНИ И те же
ми генетическими данными, до сих пор широко
предковые компоненты. Так, на низких к выделя
ются континент-специфичные генофонды, а при их
распространено мнение, что генетика «доказала»
увеличении выделяются давно известные из ант
ропологических и геногеографических работаре
лось (Раса: миф или реальность, 1998).
Все эти расы, выделившиеся при k=6 (негро
алы сходных популяций внутри континентов.
идная, европеоидная, америндская, северомонго
АНАЛИЗ В МИРОВОМ МАСШТАБЕ:
отсутствие рас. Впрочем, об этом уже давно писа
лоидная, южномонголоидная, австралоидная), про
должают существовать и при более высоких k,
ГЕНЕТИЧЕСКАЯ РЕАЛЬНОСТЬ РАС
лишь при каждом его повышении какая-то из них
дробится на два компонента.
Наиболее репрезентативно исследование
Так, при k=7 из европеоидного (западноевра
|Раgani et al., submitted), основанное на секвени
зийского) компонента выделяется южноазиатстко
ровании полных геномов, и поэтому набор исполь
ближневосточный, который при k=8 разделяется
зованных SNP-маркеров не смещен в сторону ев
на ближневосточный и южноазиатский (индийс
ропейских популяций, как это свойственно боль
шинству широкогеномных панелей. В этой работе
к тому же проанализировано большое число попу
ляций изо всех основных регионов мира.
В результате при k=2 один компонент включил
все популяции Африки и Западной Евразии, а дру
гой — все популяции Восточной Евразии и Амери
ки.
При увеличении до k=3 западно-евразийские
и африканские популяции разделяются на отдель
кий), при k=9 выделяется компонент северо-вос
точной Сибири, при k=10 начинает дробиться не
гроидная раса и так далее.
АНАЛИЗ В ЕВРОПЕЙСКОМ МАСШТАБЕ
Но вернемся к генофонду Европы. В ходе ана
лиза генофонда балто-славянских народов (глава
6) был проведен анализ АDMIXTURE, включив
ший не только балтов и славян, но и остальные
НЫe КОМПОНеНТЫ.
изученные по широкогеномным маркерам популя
При k=4 выделяется отдельный компонент до
минирующий в популяциях американских индейцев,
ции Европы, и, в несколько меньшей мере, попу
но также составляющий около половины генофонда
и в Сибири (остальная часть сибирского генофонда
воспользоваться этими результатами для анализа
ляции других регионов мира. Это позволяет нам
приходится на восточно-eвразийский и в меньшей
в европейском масштабе.
Приведем карты распространения предковых
мере на западно-евразийский компоненты).
Но уже при k=5 население Сибири приобрета
чинах k, равных 6 и 18. Первый вариант близок к
ет свой собственный компонент, вбирающий ос
новную часть сибирского генофонда.
При k=6 население Сахула (Австралия + Па
пуа Новая Гвинея, правда, представленное в этом
исследовании лишь папуасскими популяциями),
приобретает свой собственный компонент. До этого
оно было частью восточноевразийского компонен
та, а после отделения сибирского — частью остав
компонентов, полученных при контрастных вели
разумному минимуму, поскольку делит все генофон
ды Старого Света на шесть основных доменов: аф
риканский домен, два домена в северной половине
Евразии (европейский и сибирский), и три домена
в южной половине Евразии (средиземноморский,
южноазиатский и восточноазиатский). Это те реги
оны мира, которые выделяются и географически, и
известны из предшествовавших геногеографичес
ШеГОСЯ ВОСТОЧНОaЗИaТСКОГО КОМПОНеНТа.
ких работ, что подтверждает осмысленность резуль
Эта картина удивительно схожа (чтобы не ска
зать совпадает) страдиционной расовой класси
фикацией. Ведь при k=3 мы, по сути, видим при
татов, получаемых методом АDMIXTURE. Второй
вариант (k=18) близок к максимуму, поскольку при
таких высоких к многие популяции приобретают
155
4.3. Анализ предковых компонентов (ADMIXTURE)
«собственные» компоненты, и картина становится
чрезвычайно дробной.
Чтобы различать предковые компоненты, выде
ленные при k=6 и k=18, будем далее обозначать их
Кавказе, где составляет около трети генофонда.
Примерно также он выражен и по всей Юго-Запад
ной Азии. Заметную долю генофонда (10-15%) он
составляет на Балканском и Аппенинском полуост
в первом случае (k=6) как 6.1, 6.2. ... 6.5. 6.6; а во
втором случае (k=18) как 18.1, 18.2, ... 18.17, 18.18.
ровах и в южных частях Центральной Европы, но
далее к северу не распространяется, и вокруг Бал
тийского моря почти полностью отсутствует
РАСПРОСТРАНЕНИЕ ПРЕДКОВЫХ КОМПОНЕНТОВ
Сибирский компонент (6.4, рис. 4.4.Г). При
ПРИ К=6
мерно стой же степенью влияния, как и южноази
атский компонент, в Европе представлен и сибир
На рисунке 44 картографировано распростра
нение по Европе и смежным регионам всех шести
предковых компонентов, выделяемых при k=6.
Поскольку они выделены в масштабе мира, мак
симумы только двух из них приходятся на изучае
мый регион — это североевропейский и средизем
ский. На отдельных территориях (на южном Ура
ле) он составляет более четверти генофонда, но
чуть западнее у народов Поволжья частота его уже
снижается, далее к западу на основной части Вос
точно-Европейской равнины он составляет совсем
номорский компоненты. Геногеографические кар
небольшую часть генофонда, а еще западнее — в
Центральной и Западной Европе — практически
ты всех шести основных компонентов, в разной
отсутствует
мере созидающих генофонд Европы, позволяют
Что касается двух оставшихся компонентов
объективно оценить и степень влияния, и регионы
мирового генофонда, то их доля в европейском ге
нофонде ничтожна.
Восточноазиатский компонент (6.5, рис.
4.4.Е) составляет от 1 до 5% процентов у отдель
их влияния (рис. 4.4. А-Е).
Североевропейский компонент (6.1, рис.
4.4.А) охватывает всю Европу, но максимума дос
тигает на территориях вокруг Балтийского моря,
где составляет более 90% генофонда. Паттерн его
распространения поразительно сходен — почти со
ных народов Урала, Поволжья и Восточного Кав
каза, но отсутствует на всей остальной террито
рии Европы.
впадает — с распространением светлой пигмента
Африканский компонент (6,6, рис. 4.4.Д)
ции волос и глаз. Это ведущий антропологичес
сходным образом составляет пару процентов ге
кий признак выделения североевропеоидной ма
лой расы, и этот генетический компонент, по всей
нофонда Пиренейского полуострова, и отсутству
ет на остальной территории Европы.
видимости, совпадает с антропологическим ком
понентом, давно уже выделенным в физической
антропологии.
Средиземноморский компонент (6.2, рис.
4.4.Б) составляет более трети генофонда на евро
пейском побережье и более половины генофонда
— на азиатском и африканском побережьях Среди
земного моря.
РАСПРОСТРАНЕНИЕ ПРЕДКОВЫХ КОМПОНЕНТОВ
ПРИ К=18
Хотя в нашем анализе генофондов мира мето
дом АDMIXTURE Европа и представлена куда
большим числом популяций, чем другие части све
та, однако из 18 предковых компонентов 10 явля
В Европе доля североевропейского компонен
ются африканскими или азиатскими. На террито
та снижается к югу, а доля средиземноморского
рии Европы они либо вообще не встречаются, либо
навстречу ему — к северу. Но в целом североевро
пейский компонент преобладает по всей Европе:
даже на южных полуостровах Европы он состав
ми южными популяциями, но даже в них частоты
ляет большую долю генофонда, чем средиземно
морский предковый компонент Центр тяжести сре
диземноморского компонента приходится на Юго
Западную Азию. Его можно сопоставить с южно
европеоидной (средиземноморской) малой расой.
Основное отличие от нее кроется за пределами
картографированного ареала — ареал средиземно
морской малой расы включает и Индостан, тогда
как генетический предковый компонент в Индос
тане свой, равноправный средиземноморскому.
Впрочем, и средиземноморский компонент за
ходит в Индостан, и индийский (южноазиатский)
компонент заходит в Средиземноморье.
Южноазиатский компонент (6.3. рис. 4.4 В) в
пределах Европы наиболее выражен на Северном
ограничиваются ее самыми восточными или самы
этих компонентов лишь немного превышают 1%.
Из остальных 8 компонентов основными в Европе
являются западноевропейский и восточноевропей
ский компоненты; чуть меньшее значение имеют
средиземноморский и кавказский; поволжский и
южноуральский выражены локально, хотя и очень
ярко; а южноиндийский и сибирский компоненты,
напротив, покрывают почти всю Восточную Евро
пу, но составляют лишь немногим более одного
процента ее генофонда. Рассмотрим эти восемь
карт подробнее.
Четыре основных предковых компонента Ев
ропы (18.1—18.4), выделяемые призначениях k=18,
представлены на рис. 4.5. А-Г
Западноевропейский компонент (18.1, рис.
4.5.А) составляет более половины генофонда на
Глава 4. Структура генофонда Европы в зеркале полногеномных маркеров
| 56
.
-
ч
-
и
к
и
—ПГ-
к-
-
-
-
||k3, североевропейский||||п
-
ит а"и
с.
н
т али
а ан на
на
ава
т
ан-
они раз :
-
к2, средиземноморский
п
ил или на сан из ан
га і 44 кв и из ив
вт
он
от
линиями чить
н:
:-
вт
:
гт
в
|-
k5, южноазиатский
.
ит
и
оси
с
тии
с.-
ав
&ь
-
-
и
кани
н-и-
и
-
-
k1, африканский
-
-си
т
||k6, восточноазиатский
от
аса о
*
.
k4, сибирский
-
ли
и
с
о-н
&
от
и
с.
аам
""}"
и
т
-
ли
}ь """"
&
}
и
Рис. 4.4. Распространение предковых компонентов АDMIXTURE при k=6.
А. Североевропейский компонент (6.1), Б. Средиземноморский компонент (62), В. Южноазиатский компо
нент (6.3), Г. Сибирский компонент (64), Д. Африканский компонент (66), Е. Восточноазиатский компонент (6.5).
4.3. Анализ предковых компонентов (ADMIXTURE)
и
.
и
157
.
-
-
-
| k7, западноевропейский
вді ці ці ti ami ti api a1 и 14 дн дни и й н н ап
йн
ан
вки вики ися и ими на ан ал ни он ан и ан ни
аи
ав
и
:
-
н
-
им
-
-
с
али
на
азы ая и ни
от ись
-
.
|-
bi для на ан фл ти дн и на на
с
амм
-
ан,
на
и
авр и
ал
и
фи
а им г.
-
-
-
-
п|| k10, приуральский
-
**т аат ан
tai tj iti
авь он
т
ат
д.
мнен, чин
т не н
*.*
н и * н.
-
к8, восточно
европейский
в винн
-
-
Глава 4. Структура генофонда Европы в зеркале полногеномных маркеров
158
н
1.
н
.
-
.
к16, южноиндийский
k12, сибирский
ант аса
и от гии, а
т или вы а на
аи
ни
ат -
а
рот вам иск, ат атр в
н
от
н ая слы а
ава
т
а
от
Рис. 4.5. Распространение предковых компонентов АDMIXTURE при k=18.
А. Западноевропейский компонент (18.1), Б. Восточноевропейский компонент (18.2), В. Средиземноморский
компонент (18.3), Г. Кавказский компонент (18.4), Д. Приуральский компонент (18.5), Е. Южноуральский компо
нент (18.6); Ж. Сибирский компонент (18.7), З. Южноиндийский компонент (18.8).
Иберийском полуострове, во Франции, на Британ
ских островах и юге Скандинавии. Перепрыгивая
моря, он объединяет популяции всех побережий
западной трети Европы.
Восточноевропейский компонент (18.2, рис.
полуостровов (особенно Греции и Италии) и чуть
менее трети — генофонда остальной части южной
Европы, включая и Карпаты, и Альпы, и южную
половину Франции.
4.5.Б) доминирует у популяций восточной трети
вертый и последний из основных предковых ком
понентов Европы, напротив, распространен толь
Европы. На всем пространстве огромной Восточ
ноевропейской равнины — от Черного моря на юге
до Балтийского и Белого на севере, от Карпат на
западе до Волги на востоке — он составляет даже
не половину, а две трети генофонда, и чуть менее
выражен и далее на восток — до Урала.
Средняя треть Европы — Центральная Европа
и Балканы — примерно в равной мере характеризу
ется западноевропейским и восточноевропейским
компонентами, причем на Балканах они оба усту
пают лидерство средиземноморскому компоненту.
Средиземноморский компонент (18.3, рис.
4.5 В). Максимум этого предкового компонента на
ходится за пределами формальных границ Евро
пы — в Леванте и Египте. Но это и показывает всю
условность границ между выделяемыми для удоб
ства частями света. Ведь население всех побере
жий Средиземноморья, и особенно восточной его
части, издавна обменивалось миграциями. Скорее
мир Средиземноморья можно было противопоста
вить миру более северных областей Европы, чем
противопоставлять друг другу европейскую и аф
риканско-азиатскую части Средиземноморья. Об
этом и напоминает нам география средиземномор
Кавказский компонент (184, рис. 4.5.Г). Чет
ко в одной части Европы — на Северном Кавказе.
Но зато он составляет более трех четвертей гено
фонда северокавказских популяций. Впрочем, ге
нетически Кавказ является частью Передней Азии,
а не Европы (как мы увидим в главе 7). Поэтому и
предковый кавказский компонент на Переднюю
Азию еще распространяется, а в Европе выражен
очень слабо: его доля варьирует от 1% до 5% гено
фонда, причем популяции Восточной Европы бли
же к верхней границе этого интервала, а Западной
Европы — к нижней.
Этими четырьмя компонентами описывается
ПОЧТИ ВеСЬ генофонд Европы — За ИСКЛЮЧеНИеМ
Волго-Уральского региона. В этой восточной ок
раине Европы обнаруживается большое генетичес
кое разнообразие, проявившееся сразу в двух пред
КОВЫХ КОМПОНеНТаХ.
Приуральский компонент (18.5, рис. 4.5.Д).
Один из них, названный нами приуральским, пре
вышает 90% у удмуртов и составляет около трети
генофонда коми.
Южноуральский компонент (18.6, рис. 4.5.Е).
ского компонента, составляющего более трети ге
Другой — южноуральский предковый компонент —
доминирует у башкир и составляет около трети
нофонда населения Балканского и Аппенинского
генофондов татар и чувашей.
159
4.3. Анализ предковых компонентов (ADMIXTURE)
Но оба этих компонента распространены, хотя
и с очень разными частотами, у всех. народов Вол
го-Уральского региона. На остальной территории
Восточной Европы встречаются с крайне низкими
частотами, а в Западной Европе отсутствуют. На
личие этих двух специфических уральских компо
нентов указывает на большое генетическое разно
образие и своеобразие, скрытое в самых восточ
ных областях Европы — вывод, совпадающий сре
зультатами анализа митохондриальной ДНК (рис.
3.5) и с результатами анализа карт генетических
расстояний (глава 5).
Для полноты картины упомянем еще два ком
понента, которые, хотя и с низкими частотами, все
же обнаружены в генофонде Европы.
Сибирский компонент (18.7. рис. 4.5.Ж)
встречается, как и можно ожидать, у народов на
самом востоке Европы (с частотой около 2%).
Южноиндийский компонент (18,8, рис. 4.5.3),
распространенный также по всей Передней Азии,
заходит, пусть и с самыми низкими частотами, на
Восточно-Европейскую равнину, но отсутствует в
Западной Европе.
ГЛАВА 5.
ПАНОРАМА НАРОДОВ НА ФОНЕ ЕВРОПЫ
Лицом к лицу
Лица не увидать.
Большое видится на расстояньи.
Сергей Есенин
Мы рассмотрели отражение лика генофонда
Европы в трех зеркалах — Y-хромосомы (глава 2),
митохондриальной ДНК (глава 3) и аутосомного
генома (глава 4). Однако даже такое трехмерное
— скажем, поляки — от которой и будут рассчиты
ваться генетические расстояний до каждого узла
отображение будет все же незаконченным, если мы
от Европы в целом не обратимся еще и кликам
дой точки Европы известны частоты в ней каждой
отдельных народов — к генетическим связям того
или иного народа Европы со всем остальным ев
ропейским миром. Такое рассмотрение позволяет
не только увидеть место того или иного этничес
сетки (включая и ареал самих поляков). Берутся
средние частоты гаплогруппу поляков. А для каж
гаплогруппы (ведь мы уже построили карту для
каждой гаплогруппы). Этих данных достаточно,
чтобы вычислить среднее генетическое расстояние
отчастот гаплогруппу поляков до частот гаплог
рупп в каждой точке Европы. Эти генетические
кого генофонда среди его ближних и дальних со
седей. Оно дает больше — увидеть, как именно из
расстояния и наносятся на карту.
отдельных паззлов складывается общая картина ев
например, сербов — и повторяем все те же действия
с картами. И получаем карту генетического ланд
ропейского генофонда. Может быть, это позволит
разглядеть и пути истории в сложении этой общей
картины. Для этой цели наиболее полезно зеркало
Y-хромосомы: его информативность сопоставима
с информативностью широкогеномных аутосом
ных панелей (как показано, например, в следую
щей главе 6), а палитра изученных популяций —
несравнимо богаче.
Генетический портрет отдельных народов на
Затем берем в качестве реперной популяции,
шафта, показывающего степень сходства Y-хромо
сомного генофонда сербов с Y-хромосомным ге
нофондом каждой популяции Европы. И так для
любой выбранной нами популяции — этноса или
же субэтноса.
Однако, что делать с тем, что разные популя
ции изучены по разным наборам гаплогрупп? Ко
нечно, при построении геногеографических карт
интерполированные значения рассчитываются для
фоне всего европейского генофонда лучше всего
обрисуют карты генетических расстояний. Они по
казывают как генофонд данного народа вписыва
ется в общую панораму народов Европы. Основы
каждой точки карты даже если опорных точек (не
посредственно изученных популяций) немного. Но
если мы хотим — при построении карт генетичес
ваясь на всей совокупности гаплогрупп, карты ге
ких расстояний — наиболее точно охарактеризовать
нетических расстояния показывают для данного на
генофонд всех популяций, то панель гаплогрупп
рода насколько он своеобразен, с кем он схож, от
начинает сокращаться как шагреневая кожа. На
шим коллективом используется обширная панель
кого отличается, насколько далеко простираются
его генетические связи с другими народами Евро
пы и близлежащих регионов.
Карты генетических расстояний создаются так.
Сначала строится серия карт — для каждой гаплог
руппы своя карта. Как подробно описано в главе 1
(раздел 1.4), каждая карта представляет собой чис
ловую матрицу — очень густую сетку, равномерно
SNР-маркеров (44 основных, 32 дополнительных
гаплогруппы, а также еще 32 «новейших» гаплог
руппы, как описано в разделе 1.3), и большинство
популяций Восточной Европы нами изучены по
этой широкой панели. Но чтобы равномерно пред
ставить на картах генетических расстояний все
уголки Европы, эту панель, к большому сожале
покрывающую все картографируемое простран
ство. В каждом из множества узлов сетки (напри
нию, на данном этапе изученности генофонда при
водимых картах — почти 200 тысяч узлов сетки
ких гаплогрупп — Е1b-М35. G-М201, 11-М253, I2a
покрывают картографируемую территорию) запи
Р37. J-М304. N1c-М178. R1a-М198. R1b-М269.
Дальнейшие исследования и массовый скри
нинг популяций Европы по субветвям этих гаплог
рупп, открываемым благодаря полному секвени
сана частота данной гаплогруппы в данной геогра
фической точке. Затем выбирается интересующая
нас группа популяций (она называется реперной)
шлось сократить до восьми основных европейс
|61
5.1. Народы Северо-Восточной Европы (серия I)
рованию Y-хромосомы, позволит постепенно уточ
нять эти карты. Читая любую карту, надо помнить,
что эта модель создана для объема информации,
имеющейся на данном временном срезе: ограни
чен и массив популяций, и панель гаплогрупп.
Поэтому важно обращать внимание не на детали,
а на наиболее общие и устойчивые структуры ге
нетического ландшафта.
Карты генетических расстояний могут быть
построены для всех народов Европы. В данной
монографии мы приведем не все, но многие — 36
карт генетических расстояний от 36 этносов и су
бэтносов Европы, наиболее важных для остальных
глав книги. Эти 36 генетических ландшафтов объе
динены в шесть серий:
Серия 1: народы Северо-Восточной Европы
(карелы и вепсы, эстонцы, коми ижорские, коми при
лузские, литовцы, латыши, северные русские, финны),
Серия 2: восточные и западные славяне (рус
ские центральные и южные, украинцы, белорусы,
белорусы Полесья, поляки, кашубы, словаки, чехи,
сорбы);
Серия 3: неславянские народы Восточной
Европы (башкиры, казанские татары, мишари,
чуваши, мокша и эрзя);
Серия 4: на севере Балкан (молдаване, румы
ны, гагаузы, венгры, словенцы);
Серия 5: южные славяне (македонцы, сербы,
хорваты, боснийцы, Герцеговина);
Серия 6: обрамление Европы (албанцы, шве
ды, ногайцы).
5.1. НАРОДЫ СЕВЕРО-ВОСТОЧНОЙ ЕВРОПЫ (СЕРИЯ I)
Эта серия объединяет восемь карт генетичес
ких расстояний — не только от генофондов этносов
(карел и вепсов, эстонцев, латышей, литовцев и
финнов), но и от отдельных субэтнических групп
(коми ижемских, коми прилузских, Русского Се
вера). Почти все эти карты объединяет не только
географический регион, но и сходство генетичес
кого ландшафта. При этом лингвистическая при
генетически близкие популяции (то есть генети
ческие расстояния до них от карел и вепсов наи
меньшие), окрашены интенсивно зелеными тона
ми. Это генетические расстояния в интервале
0<d<0.05. Такие небольшие генетические рассто
яния обнаруживаются для популяций стран При
балтики, Русского Севера и частично Приуралья.
Несколько генетически более отдаленные популя
надлежность этих народов поражает своей пест
ции, окрашенные в светло-зеленые и желтые тона
ротой. Здесь есть и западные финноязычные наро
ды (прибалтийско-финская ветвь финно-угорских
языков) — карелы, эстонцы, финны, и восточные
финноязычные коми (пермская ветвь финно-угор
ских языков); и славяне — северные русские; и бал
(генетические расстояния до них от карел и веп
сов лежат в интервалах 0,05<d<0.10), ненамного
фонды во многом схожи. Чтобы убедиться в этом,
расширяют этот ареал. На севере он охватывает
Белое море. На юге его граница удивительно чет
ко проходит по левобережью Волги. На юго-запа
де эта граница проходит между Литвой и Белару
сью. На юго-востоке она охватывает Татарстан и
рассмотрим всю серию карт — восемь карт генети
вдоль правобережья Волги опускается до Самары,
ческих расстояний от каждого из восьми реперных
на востоке ее ограничивает Кама, и далее граница
генофондов (рис. 5.2-5.9). А для того, чтобы ви
следует почти строго на север по «камскому мери
деть отличия каждой из восьми карт от обобщен
диану».
ты — латыши и литовцы. И, тем не менее, их гено
ного генетического ландшафта Северо-Восточной
Важное отличие карты генетического ландшаф
Европы, приведем среднюю карту генетических
такарел и вепсов от других карт данной серии мы
обнаруживаем не на востоке, а на северо-западе.
расстояний (рис. 5.1). Такой обобщенный ланд
шафт получен в результате простых арифметичес
Здесь область генетического сходства с карелами
ких действий с матрицами карт: суммированием
и вепсами не знает административных границ и
всех восьми карт (для каждой точки карты были
суммированы значения восьми карт в этой точке)
пронизывает «желтым» коридором популяций, ге
нетически все же схожих с карелами и вепсами
и делением полученной суммарной карты на во
(0,05<d<0.10), все страны Фенноскандии — Фин
СеМЬ.
ляндию, Швецию и Норвегию.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕноФондом КАРЕЛ И ВЕПсов (рис. 52)
Стоит отметить и то, что группа «оранжевых»
интервалов (генетические расстояния от карел и
вепсов ds02), показывающая популяции генети
чески уже далекие, но все же еще не совсем чуж
Основной ареал генофондов, сходных с каре
лами и вепсами (при расчете «реперных» частот
дые генофонду карел и вепсов, охватывает значи
Y-гаплогрупп наряду с данными о карелах и веп
ральной Европы. При этом Западная и Южная Ев
сах учтена также небольшая выборка ижорцев),
очерчен географически четко (рис. 5.2). Наиболее
ропа, Предкавказье, Прикаспийский регион и даже
тельную часть Фенноскандии, Восточной и Цент
Зауралье генетически максимально далеки от ге
Глава 5. Панорама народов на фоне Европы
162
50"
40"
му
вп"
1c-
с"
по
20
мл
40
50
во
in
в.
20
cЕРия I.
сввв Ро-восточндя
т" стантипатии им и отклхетии ании и три от ит из плив и от от
и
т. п. и. л.
Т
свPoПА
цит
—
Рис. 5.1. Карта обобщенного генетического ландшафта Северо-Восточной Европы по гаплогруппам Y
(Усредненная карта генетических расстояний от вепсов и карел, коми ижемских, коми прилузских,
латышей, литовцев, русских северных популяций, финнов, эстонцев).
хромосомы.
50"
ли"
тттттся
пш"
кт
остатьи по итот от иттрипт ответствит от три
ёы
за
от
за
до
5
вп:
7
ихwww"
и им
тй
*
вn
тру
КАРЕЛЫ, ВЕПСы,
ИЖОРцы
моги,
-
}
им п.
мнит т.
и т.п. кт и так
"инт
о"
с
аллос слвиг-с-х
и
сми
агитт с
сикс
оп
с
Рис. 5.2. Карта генетических расстояний от карел и вепсов (генетический ландшафт по гаплогруппам Y
хромосомы).
163
5.1. Народы Северо-Восточной Европы (серия I)
плохо:гомосомол, пило, от оттот, отстготвоистон для от от си т.
—
ёы
пи птик дь
и
и пттии, к к: к п. 1.
*
чин" и т.
*
с
с:
:
*
*
g
=
си,и .т и щит.
—
*л цить
:
10"
стан: пгт:cтитут
пианатлача ли
инге
ац ч
или гиганта англи сти к лит. сп галл
илл
Рис. 5.3. Карта генетических расстояний от эстонцев (генетический ландшафт по гаплогруппам Y-хромосомы).
нофондов карел и вепсов (интенсивно красные
пермяки, хотя у них общий этноним, да и граница
тона).
между их диалектами не совпадает с администра
Переходя к карте генетических расстояний от
эстонцев (рис. 5.3), мы видим те же общие законо
мерности, что и на карте расстояний от карел и
тивной. Более южную общность составляют коми
пермяки, проживающие ныне в Пермском крае.
Более северную общность — коми-зыряне, прожи
вающие в Республике Коми (именно их часто на
зывают просто коми). Истоки формирования коми
относят ко II тыс. до н.э. в районе впадения в Вол
гу Оки и Камы. В ходе следующих веков общий
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ ЭСТОНЦЕВ (рис. 5.3)
вепсов (рис. 5.2). Однако область генетически наи
более близких популяций, окрашенных интенсив
но зелеными тонами (наименьшие генетические
расстояния от эстонцев в интервале 0<d<0.05), рас
ширяется и смещается восточнее. Генетически бо
ареал коми неуклонно расширялся на север, а под
давлением новгородской колонизации смещался на
восток. Коми расселялись по долинам крупных рек,
ассимилируя различные группы более древнего
населения — как прибалтийских финнов, так и дру
лее далекие популяции, окрашенные в светло-зе
гие уралоязычные группы, на что указывают дан
леные и желтые тона (генетические расстояния от
эстонцев в интервалах 0,05<d<0.10) охватывают
еще больший ареал, местами заходя южнее и на
правобережье Волги. В то же время северо-запад
Европы — популяции Фенноскандии — генетичес
кидальше от эстонцев, чем от карел и вепсов. Од
нако генетические ландшафты обеих карт (рис. 5.2
и 5.3) очень схожи, указывая на сходство генофон
дов всех трех народов.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕноФондом Коми-зырян (рис. 5.4 и 5.5)
Популяции комитрадиционно подразделяют на
две этнических общности — коми-зыряне и коми
НЫe ТОПОНИМИКИ.
Среди коми-зырян выделяют девять этногра
фических групп. Одна из них — коми-ижемцы (рис.
5.4), проживающие компактно в Ижемском райо
не на севере Республики Коми (в бассейне средне
го течения Печоры и ее притоков) и занимающие
ся — в отличие от других групп коми — кочевым
оленеводством, которое они переняли от ненцев.
Сложение этнографической группы коми-ижемцев
относят к концу XVI века — в ее формировании при
няли участие не только разные группы коми (вым
ские, удорские) и северные русские, но и ненцы.
Основная масса коми-ижемцев относится к бело
морскому антропологическому типу.
Глава 5. Панорама народов на фоне Европы
164
50-
3y
40"
20"
10"
о"
по
22,
30
40
50
80"
п0
8.
90
10}
коми ижемскив
птоархосудиоптрипо, ат оттот, отстготвоиптотипа ра
ёы
ап пл им пы птик дь
и
и пттии, к к: к п. 1.
чин" и ".
си и и.т. и цит.
мньть
10"
—
Рис. 5.4. Карта генетических расстояний от коми ижемских (генетический ландшафт по гаплогруппам Y
хромосомы).
ца"
прийдтирайtча: встаёт сна; в 1 дня в типин 11:йта в 1?йили 19 а? да за из ив ыт пи ай
ёы
1шил
и
пытки к ши.
чинить.
н"
-
г-на-и-и-и сти --
-- см - оп. --
Рис. 5.5. Карта генетических расстояний от коми прилузских (генетический ландшафт по гаплогруппам Y
хромосомы).
|65
5.1. Народы Северо-Восточной Европы (серия I)
Другая этнографическая группа — прилузских
коми (рис. 5.5) — проживает на другом — южном —
конце ареала коми-зырян: на самом юге Республики
Коми в бассейне Лузы и в верховье Летки, где грани
чит уже с Пермским краем и Кировской областью.
Однако вопреки и географии, и хозяйственно
культурному типу, и адаптивному типу (ижемских
коми относят к арктическому адаптивному типу),
карты генетических расстояний от обеих этнографи
ческих групп коми-зырянудивительно схожи. Выде
ляется темно-зеленая область минимальных рассто
яний (наибольшего сходства) между обеими группа
невелик. Возможность «гендерной асимметрии
браков» всегда необходимо учитывать, когда мы
анализируем лишь одну из однородительских ге
нетических систем — или Y-хромосому, или мтДНК.
За этим исключением — смещения наименьших
генетических расстояний (ярко-зеленых) на восток
и север — область генофондов, генетически близких
к коми, окрашенная в светло-зеленые и желтые тона,
очень схожа с ландшафтом, обнаруженным выше у
карел, вепсов и эстонцев. Это невольно заставляет
вспомнить работы палеоантропологов (Хартанович,
1991), указывавших, что по краниологическим дан
ми коми. Их разделяет популяция русских Красно
ным коми-зыряне тяготеют к карелам, а не к коми
борского района Архангельской области, резко отли
чающаяся (оранжевые тона) от них, как впрочем, и
пермякам. Однако лишь будущее детальное изуче
ние генофондов всего разнообразия популяций
коми-зыряникоми-пермяков (а также своеобразных
по языку коми-язьвинцев) позволит точно опреде
от основного массива северных русских популяций
(рис. 5.8). Со всеми другими северными русскими
популяциями коми обнаруживают наибольшее сход
лить степень их генетического сходства как друг с
ство (наиболее яркие зеленыетона на карте). Это осо
другом, так и с другими народами Северо-Восточ
бенно ярко видно на карте генетических расстояний
от прилузских коми (рис. 5.5), отличающихся от ге
нофонда своих южных географических соседей и
ной Европы и Приуралья.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДАМИ ЛАТЫШЕЙ И ЛИТОВЦЕВ
генетически явно тяготеющих к северным, пусть и
географически более далеким, генофондам.
Однако не будем забывать, что такая генети
ческая близость самой южной и северной групп
(рис. 5.6 и 5.7)
На выше рассмотренных четырех картах (рис.
52—5.5) «реперными» генофондами, от которых
коми может указывать на сохранение единства
лишь Y-хромосомного генофонда коми: возможно,
из иноэтничных групп брались, главным образом,
жены, а приток мужских Y-хромосом из них был
рассчитывались генетические расстояния, высту
пали популяции финно-угорских народов. Теперь
переднами карты генетических расстояний от двух
ортостал: ася по: до, артрс? : от атт от ат; ртарль ат; для ста от от за сл и
{ь
пь и так :
1
и кит и п. 4. . . .и т.
митт,
Рис. 5.6. Карта генетических расстояний от латышей (генетический ландшафт по гаплогруппам Y-хромосомы).
Глава 5. Панорама народов на фоне Европы
166
50-
40"
3y
20"
10"
о"
то"
?
:0
49
50
80"
10"
8.
90
10}
литовцы
ппппардурсы ад,до пишу припра от п.11 a1*a13 атч ать дип.11 п.1ипл9 от ап см пу пи птик дь
и
д.
ёы
и птт и к к: к п. 1.
н
скучим во ме"
чин" и т.
зученные популяции
10"
-
снин:пахликупителиакатлач личнянганн ош учинили гигичнукли см качать опталлинили
Рис. 5.7. Карта генетических расстояний от литовцев (генетический ландшафт по гаплогруппам Y-хромосо
мы).
то?
ппппу асурснады приппу припра от птт от ат;сти ать дипт пил пл9 от ап ол пы па птик дь
—
ёы
:
и щиттии к к: к цит.
-"
мил p и,
*
*:
с
|
}
*
50"
т.
*-
с т.п.",т и цит
—
м щит и
-
—
--
о"
снан 2апсилстик,
10
как знатлача Аннананг на а л ьчананв
в
наняли си качать апг-аллернала
Рис. 5.8. Карта генетических расстояний от северных русских (генетический ландшафт по гаплогруппам Y
хромосомы).
|67
5.1. Народы Северо-Восточной Европы (серия I)
балтоязычных народов — латышей (рис. 5.6) и ли
товцев (рис. 5.7). Лингвистически они относятся
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕноФондом Финнов (рис. 5.9)
уже не к уральской семье, а к индоевропейской.
Однако вопреки столь огромным лингвистическим
С этим призывом к осторожности интерпрета
различиям мы вновь видим все тот же генетичес
ций согласуется и самая своеобразная карта дан
ной серии — генетических расстояний от «самого
кий ландшафт, не требующий даже дополнитель
ного описания. Ближе всего он к генетическому
финноязычного» народа — то есть от самих фин
нов (рис. 5.9). Их генетический ландшафт не по
ландшафту соседних эстонцев (рис. 5.3). Отличие
этих двух ландшафтов лишь в том, что область
хож ни на один из рассмотренных: мы вообще не
популяций, генетически близких к балтским наро
видим никакого сходства с рассмотренными гено
дам, на северо-западе и северо-востоке максималь
фондами Северо-Восточной Европы. Область сход
но сужается, оставаясь широкой на юге и тем са
ных значений умещается в Фенноскандии, да и то
мым приближаясь к форме треугольника.
занимая лишь ее половинку: как самая восточная
Предполагается, что носители балтских языков
ранее были распространены в намного более ши
роком ареале — от северо-востока современной
окраина Фенноскандии, таки огромная юго-запад
ная часть Норвегии и Швеции оказались генети
чески далеки от генофонда финнов. И лишь очер
Польши до верховьев Волги, бассейна Оки, сред
тания оранжевой области генетически далеких по
него Днепра и Припяти. Поэтому совпадение ге
нетических ландшафтов карел, вепсов, коми, эс
пуляций (но все же не максимально удаленных ге
нофондов) повторяют очертания зоны сходства на
тонцев и латышей позволяет ставить вопрос о при
остальных картах этой серии.
чинах такого совпадения. Налицо смена языковой
Столь выраженное своеобразие генетического
ландшафта финнов находится в противоречии с их
принадлежности (или балтов, или финно-угров,
или и тех, и других) при сохранении некоего об
щего древнего генофонда. Может быть, существо
вал некий более древний генофонд, о лингвисти
близким лингвистическим родством с другими
народами прибалтийско-финской группы (сформи
ровавшейся исторически недавно — в I тысячеле
ческой принадлежности которого у нас нет даже
гипотез, и именно он стал тем генетическим суб
тии до н.э.) и географическим положением — фин
стратом, который до сих пор задает ландшафт са
мых разных генофондов Северо-Восточной Евро
Северо-Восточной Европы.
пы?
ны естественным образом входят именно в регион
Традиционно считается, что своеобразие гено
Эти сомнения и раздумья еще больше усили
фонда финнов (выражающееся, в том числе и в на
личии особого «финского» спектра наследствен
ных болезней) связано с тем, что популяция про
шла через демографическое «бутылочное горлыш
ко», приведшее к мощным эффектам дрейфа ге
нов. Финны как бы оказались на периферии и фин
вает карта генетических расстояний от северных
но-угорского, и скандинавского миров. Напомню,
русских (рис. 5.8): генофонд наследников Новго
что у Андерсена при поисках чертогов Снежной
родской Руси полностью повторяет все вышеопи
санные закономерности. Генетическое своеобразие
северных русских популяций твердо установлено
королевы лапландка отсылает Герду на самый край
|Ваlanovsky et al., 2008: Балановская и др., 2011;
Кushniarevich et al., 2015). Но стало привычным
клише связывать это своеобразие лишь с финно
ЧТО ДАЛЬШЕ?
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕноФондом СЕВЕРНЫХ РУССКИХ (рис. 5.8)
угорским субстратом. Поэтому обратим внимание,
что карта генетических расстояний от северных
русских все же более схожа с генетическими лан
дшафтами балтов — латышей и литовцев, а не фин
ноязычных народов. Это указывает, что будущие
исследования палеоДНК мезолитического и нео
литического населения могут внести коррективы
света — к финке. Дальше уже некуда.
Итак, выявлен стойкий генетический ланд
шафт, характерный для большинства народов Се
веро-Восточной Европы. Но эти народы не объе
диняет ни принадлежность к общей языковой груп
пе, ни принадлежность к общему региону (фин
ны, несомненно, принадлежат к тому же региону,
но их карта иная). Тогда что же их объединяет?
Сохранение («консервация») генофонда древней
в ставшую привычной интерпретацию генетичес
шего населения перигляциальной зоны Восточной
кого своеобразия Русского Севера просто лишь как
наследия генофонда финноязычного населения.
Европы? Искушение выдвинуть такую гипотезу
Возможно, у нас будет возможность увидеть связь
ной карты генетического ландшафта генетически
резко отличающихся (отдрейфовавших?) финнов,
генофонда Русского Севера с балтами, которые в
свою очередь унаследовали генофонд древнейше
го населения перигляциальной зоны Восточной
Европы.
велико. Ведь даже если мы исключим из обобщен
и построим карту заново по серии из семи карт
(рис. 5.10) — мы получим все тот же устойчивый
генетический ландшафт Северо-Восточной Евро
Глава 5. Панорама народов на фоне Европы
168
50-
30-
ции
30'
10"
0
10°
20'
30"
40
50
80"
ту
30"
99"
тру
финны
приппа ара
оком расстрада он атт ст. ст.
сноватонов и 2
ёы
-
илит и т.
п. п.4 p5 pt p1 p2 pt
}
к.кит.
В»
вы
1
кxxxwwто "с.
o
мна "т.
x
с
*:
:
*:
*
50"
-
=
с и в и,т и сюк
=
м Китт.
—
н
-
о"
10
-
Рис. 5.9. Карта генетических расстояний от финнов (генетический ландшафт по гаплогруппам Y-хромосо
мы).
59"
ц:
от
:
ст: с тел:
ё:
3}
to"
й
" : "тенан с
п0°
30'
30"
т а
49°
50'
}
т"
3й
99"
СЕРИя I,
СЕВЕРО-ВостоЧНАЯ
ЕвРопд
уwwмо моть
и цити , д. и к им 1.
-* пгт.
:
:
:
:
с.
al
=
в и,в и,т и к Е.
—
м китт.
=
-
*
н
-
*
.
g"
————
Рис. 5.10. Карта обобщенного генетического ландшафта Северо-Восточной Европы по гаплогруппам
Y-хромосомы (без финнов) (Построена как средняя по семи картам генетических расстояний: от вепсов и карел,
коми ижемских, коми прилузских,
латышей, литовцев,
северных русских,
эстонцев).
| 69
5.2. Восточные и западные славяне (серия II)
пы (что и на рис. 5.1), только окрашенный в еще
Европы. Поэтому выявленные зоны сходства и их
особенности определяется не одной лишь гаплог
более яркие тона малых генетических различий.
Именно его можно считать типичным, стандарт
руппой N1c, а всем Y-хромосомным генофондом.
ным, «эталонным» генетическим ландшафтом ко
ренного населения Северо-Восточной Европы.
Но все же роль этой североевразийской гаплог
руппы особенно велика. Поэтому ее углубленное
Любой, даже поверхностно знакомый с гено
изучение позволит продолжить историю, расска
географией, сразу скажет: эти карты объединяет
занную в этом разделе. Продолжения ждать уже
недолго: полногеномные исследование Y-хромосо
мы уже позволили выделить в евразийском ареале
гаплогруппы N1c, по крайней мере, восемь геогра
гаплогруппа N1c-М178. Да, именно ее высокие ча
стоты характерны для всех рассмотренных гено
фондов, и ареал этих высоких частот формирует
выгнутую к северу дугу от Пpибaлтики до При
фически приуроченных ветвей, по которым уже
уралья. Но ее частота особенно велика у финнов
(более половины генофонда), и своеобразие гене
тического ландшафта финнов объясняется во мно
проведен скрининг целого ряда популяций Евра
зии. Как только число и спектр популяций Евро
гом именно повышением частоты этой гаплогруп
пы. У других народов севера Восточной Европы
частоты N1c-М178 более умеренные. Но не будем
забывать, что карты построены не по одной N1c
М178, а по данным обо всей совокупности основ
ных европейских гаплогрупп, частоты которых зна
вей гаплогруппы N1c, достигнет достоверного
чительно разнятся в пределах Северо-Восточной
пы, для которых определены частоты новых вет
уровня для создания полноценных карт генетичес
ких расстояний, мы обновим эту серию карт, вклю
чив в спектр анализируемых гаплогрупп карты
новых ветвей N1c и тогда, надеюсь, сумеем выде
лить различные миграционные потоки в генетичес
ком ландшафте Северо-Восточной Европы.
5.2. ВОСТОЧНЫЕ И ЗАПАДНЫЕ СЛАВЯНЕ (СЕРИЯ II)
Следующая серия карт хотя и объединяет наро
Во избежание недоразумений и поверхностных
ды по принципу лингвистической общности — вос
трактовок напомним международное правило по
точные (белорусы, русские, украинцы) и западные
славяне (кашубы, поляки, словаки, сорбы, чехи), но
также следует и географии, охватывая обширный
географический ареал, но теперь уже не в Северо
пуляционной генетики — принцип «трех поколе
ний». В каждом этническом ареале исследуются
только те индивиды, все бабушки и деды которых
относили себя к этому этносу и родились в данной
популяции. Казалось бы, для изучения Y-хромо
сомных линий достаточно знаний происхождения
только деда по отцовской линии. Но показано, что
учет всей родословной на три поколения позволя
ет охватить наиболее устойчивую часть каждого
Восточной, а в Восточной и Центральной Европе.
Как и в предыдущей серии, мы не следуем строго
этническому уровню при отборе «реперных точек»,
от которых строятся карты генетических расстоя
ний, но, верные геногеографической логике, вклю
чаем и «субэтнические» карты — южных/централь
ных русских и белорусов Полесья.
Наглядный результат применения метода карт
расстояний — то, что эта серия девяти карт, как и
предыдущая, выявила общий паттерн геногеогра
генофонда.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ ЮЖНЫХ И ЦЕНТРАЛЬНЫХ
РУССКИХ Популяций (рис. 5.12)
фического ландшафта. Этот паттерн можно назвать
«западно-восточнославянским» — карта обобщен
ного генетического ландшафта западных и восточ
ных славян приведена на рис. 5.11. Как и обобщен
ная карта первой серии, она получена в результате
простых арифметических действий с матрицами
карт: усреднением для каждой точки карты значе
ний всех девяти карт в этой точке.
Единственное исключение из общего паттерна
Для краткости анализируемый «не-северный»
массив русских популяций будем условно имено
вать «южнорусским» генофондом, помня, что это
название соответствует не привычному админист
ративному делению на округа и зоны, а дихотоми
ческому делению русского генофонда на «север»
и «не-север». При этом «не север» включает и
центр, и восток, и запад исторического ареаларус
ского народа. Принципы выделения этого ареала
— чехи — лишь оттеняет правило, как и в предыду
щей серии, было одно исключение — финны. Ко
даны в книге «Русский генофонд на Русской рав
нине» (Балановская, Балановский, 2007).
нечно же, каждая карта имеет и свои особенности.
Однако генетическое, лингвистическое и геогра
фическое единство западных и восточных славян
Карта (рис. 5.12) сразу обнаруживает две са
мые яркие особенности генетического ландшафта
«южнорусских» популяций.
демонстрируется этой серией карт ярко и убеди
ТеЛЬНО.
Глава 5. Панорама народов на фоне Европы
170
50"
40"
3y
20"
10"
о"
1c
]
30
40
50
80
10"
8.
90
10}
СЕРИЯ|.
восточныв издпддныE
отрасстрлномом потомом от от отстаидисилтон для со стол и он от он
ёы
олдвянв
11 пттии к к: к п т.
чин" и ".
-
o
10"
-
стен хапсалстинус епианатлач личнингана сам учиннин гигина англи сти к мать спилял
галл
Рис. 5.11. Карта обобщенного генетического ландшафта восточных и западных славян по гаплогруппам
Y-хромосомы. (Построена как средняя по девяти картам генетических расстояний: от белорусов, белорусов Поле
СЬЯ, кашубов, поляков, русских «южных», словаков, сорбов, украинцев, чехов).
в"
то"
:
30°
40
59
80:
Tй"
3.
}
тр:
Русскив южныE
пpl pngйjйсной, одифиl n
ат и 11 ат; ; 13 ф
и п.1: п1ай 19 ф: да бы им
пи птик дь :
И ЦЕНТРАЛЬНЫЕ
*--
ёы
плит п. и. на с
„кухмично мо"
п. п.
чции и т.
с т.п .т и щит.
м цити.
с
2апсилстику с
пиана-лама А
и
сил училии
в
ли си качать сп
алл
мл
Рис. 5.12. Карта генетических расстояний от южных и центральных русских популяций (генетический
ландшафт по гаплогруппам Y-хромосомы).
171
5.2. Восточные и западные славяне (серия II)
Во-первых, он является почти полной альтер
нативой генетическому ландшафту Русского Севе
ра (рис. 5.8): ареал популяций, сходных с «южно
русским» генофондом, иной. «Северный» и «юж
ный» русские ландшафты почти не перекрывают
ся. Лишь небольшой «рукав» вдоль верхней Вол
ги является как бы переходной зоной между ними
и отчасти принадлежит обеим половинкам русско
го генофонда.
Во-вторых, (рис. 5.12) ареал популяций, гене
тически сходных с «южнорусским» генофондом,
между разными западно- и восточнославянскими
генофондами несущественны.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ БЕЛОРУСОВ (рис. 5.13 и 5.14)
Отличить генетический ландшафт белорусско
го генофонда (рис. 5.13) от «южнорусского» (рис.
5.12) практически невозможно: они почти идентич
ны. Можно лишь заметить, что зеленые области ге
нетического сходства с белорусами еще более рав
практически равномерно охватывает значительную
номерно покрывают практически весь ареал «запад
часть не только Восточной, но и Центральной Ев
ропы. Приводит в изумление, что популяции, наи
и основную часть исторического русского ареала, и
более генетически близкие к «южнорусским» (ми
нимальные расстояния в интервалах 0<d<0.05, ок
рашенные зелеными тонами), охватывают и Бела
русь, и Украину, и Польшу, и восточную Германию,
и Словакию. Если попытаться все же ранжировать
степень сходства, то практически не отличимыми
от русского генофонда (интенсивно темно-зеленые
тона) оказываются популяции Беларуси и восточ
ной Польши, а генофонды Западной Польши, Ук
раины и Словакии окажутся чуть дальше. Но, ко
нечно же, при интерпретации крайне важно учи
тывать масштаб генетических различий: по срав
нению со всеми другими окружающими генофон
дами Европы, окрашенными в оранжевые тона
больших генетических расстояний, эти различия
но-восточнославянского» ландшафта — и Украину,
Польшу, и восточную Германию, и Словакию.
Это заставляет выдвинуть неожиданную гипо
тезу, что именно эти два генофонда — белорусский
и русский — наиболее полно воспроизводят общие
черты единства Y-хромосомных генофондов запад
ных и восточных славян. На других картах «запад
но-восточнославянской» серии мы увидим те же
основные очертания ареала генетического сход
ства, но области наибольшего сходства, окрашен
ные насыщенно-зелеными тонами, наиболее об
ширны и наиболее равномерно покрывают этот
ареал только на этих двух картах генетических лан
дшафтов — русском и белорусском.
При этом если мы рассмотрим часть белорус
ского генофонда — популяции Полесья (рис. 5.14),
пппп адрсиады псидит припра от птт от ат; сти ать дипт: птл пл9 от ап ол пы па птик дь
ёы
и
и щиттии к к: к цит.
мил p и,
с т.п.",т и цит
м цити
иерусали,
* ,
о"
снан 2апсилстик, с как анатлача Ашинананг на аш ученнан
в
наняли си качать апг-ананала
Рис. 5.13. Карта генетических расстояний от белорусов (генетический ландшафт по гаплогруппам Y-хромо
сомы).
Глава 5. Панорама народов на фоне Европы
172
50"
3"
}
10"
с"
10-
2}
30
49
59
30
ту
80
90
20
БЕЛoРусы ПолEcья
др1 ac: j: сс4 0 0; по идт рад, пт
от от от отгольствалтон от ф:
и китт.п. 4.
#} дл ш5 по ит р: :
..и т.
1
к кхумом" "
и
-
}
o
мна и т.
цп и имит
ч, на и т.
ст
20"
снанізапихаий писателягилкин Антистиннн ашунгин Ея Баганняли си книга ап ралл=нный
Рис. 5.14. Карта генетических расстояний от белорусов Полесья (генетический ландшафт по гаплогруппам
Y-хромосомы).
ппl pрайфурсайд, до адмицу при ат и 11 ат?й 13:gтч gтьаи и 11 п.1ий 19 ф: ап да им пи птик дь
ёы
т
и птт и к c к п т.
чь на в ч.
си и .т и цит.
м китт.
снинапсихии купитидиакатлач личнингини о шучищлиги типа уныли см качить опталлипким
Рис. 5.15. Карта генетических расстояний от украинцев (генетический ландшафт по гаплогруппам Y-хро
мосомы).
173
5.2. Восточные и западные славяне (серия II)
то увидим, что их генофонд сохраняет историчес
татарами, обнаруживает отличия от генофондов
кое сходство с популяциями Украины, поскольку
украинцев, а обширные территории, представлен
ные украинцами, словаками, поляками, белоруса
ми, южными и центральными русскими обнару
паттерн этой карты сходен с паттерном карты ге
нетических расстояний от украинцев (рис. 5.15).
Однако вновь напомню о генетическом масштабе
— все остальные популяции Беларуси и юго-запад
живают высокое генетическое сходство с украин
ЦaМИ.
ной части южнорусского ареала, также окрашен
ные в зеленые тона, лишь чуть-чуть больше отли
чаются от населения Полесья, чем генофондукра
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДАМИ ПОЛЯКОВ (рис. 5.16)
И КАШУБОВ (рис. 5.17)
Инцев.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕноФондом УКРАИНЦЕВ (рис. 5.15)
Ландшафт генетических расстояний от поля
ков вновь полностью вторит общему «западно-во
сточнославянскому» ландшафту, хотя и имеет три
Не удивительно, что на карте генетических
характерные черты.
расстояний от украинцев (рис. 5. 15), мы обнару
Во-первых, области, наиболее воспроизводящие
живаем тот же самый общий «западно-восточнос
«среднестатистический» генофонд поляков (окра
лавянский» ландшафт. Отличие от других восточ
нославянских ландшафтов лишь в том, что тем
шенные в насыщенные темно-зеленые тона) слегка
сдвигаются на запад: они более характерны для по
пуляций западной половины Польши, соседних по
но-зеленые области минимальных расстояний
концентрируются теперь главным образом на Ук
пуляций Словакии и наиболее восточных областей
раине, в Словакии и в белорусском Полесье. Это
различие между генетическими ландшафтами
Германии, чем для восточных окраин Польши.
Во-вторых, карта опровергает шаблонное пред
украинцев, белорусов и русских позволяет пред
ставление об особенном сходстве генофондов
положить, что Y-хромосомный генофондукраин
Польши и Украины.
цев представляет собой более локальный вариант
В-третьих, генофонд поляков обнаруживает
генетической общности западных и восточных
яркое сходство с огромным массивом белорусских
и русских популяций — это сходство больше, чем с
С.ЛаВЯН.
Из характерных деталей генетического ланд
шафта украинцев важно отметить, что, несмотря
генофондами географических соседей — чехов иук
раинцев.
на то, что для Украины имеются выборки для всех
Генофонд кашубов (рис. 5. 17) еще ярче прояв
историко-этнографических областей, в масштабе
ляет все эти три черты, несмотря на относительно
Европы мы не видим генетических различий меж
небольшую численность: кашубов в Польше око
ло 300 тыс. человек, в то время как поляков — в сто
дy ними даже генофонд западной Украины нео
тличим от других ее частей.
Другая характерная деталь генетического лан
раз больше (36 млн.). Кашубы — это субэтническая
дшафта украинцев — юго-западный зеленый рукав
ре Польши. Как предполагают, она восходит к древ
неславянскому племени поморян. Ее современный
сходных популяций, мало заметный на карте рас
стояний от русских, здесь более явственно тянет
группа поляков, компактно проживающая на севе
генофонд обнаруживает максимальное генетичес
ся через Румынию и Хорватию к Адриатике.
кое сходство с популяциями вдоль южного побе
Во избежание каких-либо односторонних трак
товок, напомним еще раз и о том, что на каждой
территории в выборку, до которой рассчитаны ге
режья Балтийского моря (в восточной Германии,
центре и на востоке Польши). И в то же время со
храняет память о генетическом родстве с поляка
нетические расстояния, включались только инди
ми, словаками и обширным массивом белорусских
виды, обе бабушки и деда которых относили себя
к коренному народу этой территории. Поэтому на
селение Крыма, в соответствии с правилами попу
ляционной генетики, представлено только наибо
и географически далеких русских популяций.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ СЛОВАКОВ (рис. 5.18)
лее коренным населением — крымскими татарами.
Они были изучены содружеством украинских и
В отличие от трех предыдущих карт (от гено
фондов украинцев, поляков и кашубов), генетичес
российских генетиков при заинтересованной под
держке разных организаций крымских татар задол
го до того, как Крым стал объектом мирового вни
мания. Ни русские, ни украинские популяции — в
зеленым покрывалом всю зону «западно-восточнос
полном соответствии с правилами геногеографии
кие расстояния от словаков равномерно покрывают
лавянского» сходства, не делая различий между со
седними украинцами и далекими белорусскими и
русскими популяциями. В этом они обнаруживают
— в анализируемых генетических данных по Кры
му не фигурируют. Поэтому неудивительно, что
территория Крыма, представленная крымскими
неожиданное сходство сгенетическим ландшафтом
белорусов и русских (рис. 5. 13 и 5.12).
Глава 5. Панорама народов на фоне Европы
174
50-
30-
}
10"
D"
10°
20'
30"
40
50'
30"
ту
30"
99"
тру
ПоПяки
приппа ара оснар аса артрса aca at a11 2 32 атландир авантана на p 2 p3 p4 p5 pe of pa at
1
км, имхо моть
и цит и т. д. и к кит.
мна "т.
и и в и,т и сюк
м Китт.
НЕРУСАлкм
* ,
о"
-
10
-
—
-
30
Рис. 5.16. Карта генетических расстояний от поляков (генетический ландшафт по гаплогруппам Y-хромо
сомы).
то"
:
30°
49°
58'
}
КДШувb|
то-то освои отпили от тот от тот сиптотипта от три пити итти
д.
ёы
плитти
и с
акуумму во мо"
п. п.
чции и т.
стели Хассилстив,
епиакатлами лиманита и сил училии
в
ма-а-али сил кашет. сп
алл-гилл
Рис. 5.17. Карта генетических расстояний от кашубов (генетический ландшафт по гаплогруппам Y-хромо
сомы).
175
5.2. Восточные и западные славяне (серия II)
по
22
30"
40
50
80"
10"
8.
90
10}
11 птт и к к: к п. т.
чин" и т.
си и и.т. и цит
г ""
м кать
снин;апахалинудителиакатляч личнингини о шучищлн.г причнлняли см качать опталлинили
Рис. 5.18. Карта генетических расстояний от словаков (генетический ландшафт по гаплогруппам Y-хромо
сомы).
Среди особых чертландшафта генофонда сло
веков история чехов была переплетена систорией гер
ваков — продвижение на юг зоны генетически сход
манских государств, то чехи могли быть онемечены
ных с ними значений. В нее попали Молдова, са
мый север Румынии, вся Венгрия и часть Хорва
— или
тии, так что к Адриатике тянется уже не узкий ко
ридор зеленых значений, а широкий тракт
наоборот, немцы могли ассимилировать и вклю
чить в свой генофонд те славянские племена, кото
рые генетически родственны чехам. Но этой гипоте
зе противоречит например, то, что генетический лан
Наиболее близки генофонду словаков близле
дшафт сорбов (рис. 5.20) — маленького анклава сла
жащие области Польши и Венгрии — как ни удиви
тельно, но они оказались генетически ближе к сло
вян среди немцев — совсем иной, чему чехов, и вновь
воспроизводит общий «западно-восточнославянс
вакам, чем генофонд чехов.
кий» генетический ландшафт Конечно, теоретичес
ки можно возвести особость генофонда чехов к на
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
следию более древних времен (кельтов, обитавших в
ГЕНОФОНДОМ ЧЕХОВ (рис. 5.19)
этом ареале в железном веке, или к народам эпохи
Генофонд ЧеХОВ — единственнОе ИСКЛЮЧение ИЗ
«западно-восточнославянского» паттерна среди
всех западных и восточных славян. Их генетичес
бронзы). Но здесь свое слово смогут сказать только
будущие исследования древней ДНК, если они бу
дут проведены по обширным выборкам и с подроб
ным покрытием территории Европы.
кий ландшафт (рис. 5. 19) убедительно говорит об
особости чешского генофонда. Область наиболь
ГЕНЕТИЧЕСКИЙ ЛАНДШАФТ
шего генетического сходства находится только в
«СЕВЕРНЫХ СЛАВЯН»
самой Чехии, а светло-зеленые тона умеренного
сходства лишь небольшими отдельными языками
заходят в соседние области Польши, Словакии,
О, Запад есть Запад, Восток есть Восток,
не встретиться им никогда,
Словении, Венгрии, Австрии и Германии.
Особость генофонда чехов подтверждается и
Пока будут Небо с Землей таковы,
диаграммами многомерного шкалирования (главы 2
и 6), причем не только по Y-хромосоме, но и по ши
рокогеномным аутосомным панелям. Можно пред
Р. Киплинг (перевод К. Филатова)
полагать, конечно, что поскольку в течение многих
какими их Бог создал.
Переходя от карты к карте этой серии, мы убеж
даемся, что реально существует общий генофонд
Глава 5. Панорама народов на фоне Европы
176
3y
20"
10"
о
то"
??
3.0
49
50
80?
10"
8.
ЧЕхи
похолокосомол, пило, от от от ответствоистон от 22 стоит и от он и
д.
-
„кухмично мо"
и пттии к к: к п. 1.
10"
снинапсих:типудинялиакатляч личнянганн о шучищлн.г причнлнили см качать опталлинили
Рис. 5.19. Карта генетических расстояний от чехов (генетический ландшафт по гаплогруппам Y-хромосо
мы).
50"
га"
3"
др1 : j3, jся 195 и
i}
1g-
й 15 фт: фт? ; 13 11} }
{ь
в"
} }я
іс"
:
30'
15 пь и трё
45°
&#
55'
30"
та
1
шиит щи. д. и к 0 1.
мнат т.
і т. ч. 1 т и на 1:
Рис. 5.20. Карта генетических расстояний от сорбов (генетический ландшафт по гаплогруппам Y-хромосо
мы).
177
5.3. Неславянские народы Восточной Европы (серия III)
50-
40"
3."
20"
10-
по
2
30"
40
50
80
10
8.
90
0
СЕРИЯ|.
восточныв издпддныE
отрасстономом потомом от от отстоилисиат от для с итом он он от он
ёы
олдвянв
*
„кухлодхво ме"
11 пттии к к к щит.
чин" и ".
*
т. п т.
* ".
о"
стен хапсалстинус гепанакатлач личнинганн агитчиннин гигина англи сил к мать апплял гнала
Рис. 5.21. Карта обобщенного генетического ландшафта «северных славян» по гаплогруппам Y-хромосо
мы (Построена как средняя по картам генетических расстояний от белорусов, кашубов, поляков, словаков, сор
бов, украинцев, южных и центральных русских).
западных и восточных славян счетко очерченным
ареалом его распространения. Однако термин «за
падно-восточнославянский» генетический ланд
а образуют вместе со своими географическими
соседями свой собственный (см. раздел 5.1.) гене
тический ландшафт Северо-Восточной Европы. Но
шафт не просто неуклюж и не изящен, он еще и
если считать, что исключения лишь подтвержда
вызывает недоумение — нас уже давно приучили к
ют правила, то мы можем создать карту генетичес
мысли, что «не встретиться им никогда». Тем бо
лее что серия V — карт генетических расстояний от
кого ландшафта «северных славян» (рис. 5.21). В
южных славян — демонстрирует, что и южные сла
там генетических расстояний от всех популяций
северных славян (западных и восточных по линг
вистическому делению), кроме популяций Русского
Севера и чехов. Благодаря этому мы получаем наи
более устойчивый генетический ландшафт «север
ных славян», который можно считать типичным,
вяне также обладают своим общим генетическим
ландшафтом. Это позволяет в дополнение к трех
членному лингвистическому делению (южные, за
падные и восточные) ввести двучленное генети
ческое деление — генофонд южных славян и гено
фонд северных славян. Конечно, задачу осложня
нем исключены исключения — он построен по кар
стандартным, «эталонным» генетическим ланд
етто, «самые-самые северные славяне» — населе
шафтом основного массива популяций западных
ние Русского Севера — в этот ландшафт не входят,
И ВОСТОЧНЫХ СЛаВЯН.
5.3. НЕСЛАВЯНСКИЕ НАРОДЫ ВОСТОЧНОЙ ЕВРОПЫ (СЕРИЯ III)
Но прежде, чем перейти к южным славянам и
другим балканским народам, следует завершить об
зор народов Восточной Европы. Не имея возмож
ности анализировать все этносы, рассмотрим шесть
карт генетических расстояний от народов Волго
Уральского региона. При этом ограничимся попу
ляциями лишь четырех соседствующих друг с дру
гом республик, пересекающих этот регион единой
полосой с востока на запад: Башкортостан, Татар
стан, Чувашия и Мордовия. Этого оказывается дос
таточно, чтобы увидеть всю сложность и загадоч
ность генофонда восточного фланга Европы.
178
Глава 5. Панорама народов на фоне Европы
Каждая из первых двух серий карт обнаружи
ла свой собственный генетический ландшафт, ох
ватывающий обширные пространства Европы —
ландшафт Северо-Восточной Европы (раздел 5.1)
и ландшафт «северных славян» (раздел 5.2). При
чем в каждой из серий все карты за единственным
исключением строго следовали общей модели.
Однако третья серия — Уральская — несмотря на
много меньший охваченный ареал, обнаруживает
и Кавказа. Эта карта дает понять, насколько генети
чески своеобразен каждая из шести рассмотренных
этнических групп, хотя они и являются географи
ческими соседями на относительно небольшом про
странстве Поволжья и Южного Урала. А рассмот
рение карт этой серии подчеркнет, что генофонд
Уральского региона требует особо детального изу
чения и вдумчивого подхода.
родов. Более того — генетические ландшафты всех
На всех генетических ландшафтах серии самое
нижнее течение Волги окрашено в тона генетичес
ки очень далеких популяций. Но на них пока не
шести рассмотренных этнических групп резко раз
отражены генофонды астраханских ногайцев и ас
личны даже по размеру ареала генетически сход
траханских татар: в момент написания книги их
ных с ними популяций — от сходства с популяция
ми половины Восточной Европы до очень локаль
ного варианта. Поэтому общую характеристику
явно внесет коррективы в генетические ландшаф
совершенно разные паттерны для каждого из на
генотипирование нами еще не закончено. Но оно
ты данной серии.
ландшафта этой серии можно обозначить как «мно
гообразие восточного фланга Европы».
Все же приведем этот обобщенный ландшафт
данной серии (рис. 5.22). Он ничем не сможет по
мочь нам отслеживать различия каждого из гено
фондов от общей картины. Мы видим на обобщен
ном ландшафте практически лишь две градации: а)
генетически далекие популяции (оранжевые тона),
занимающие огромный ареал Уральского региона,
Восточной и Центральной Европы; б) совершенно
генетически чуждые популяции остальной Европы
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ БАШКИР (рис. 5.23)
По данным переписи 2010 г в России 1.6 млн.
башкир, из них 1.2 млн. — в Башкортостане. Одна
ко, несмотря на столь большую численность, аре
ал популяций, сходных с генофондом башкир,
очерчен очень четко он тянется по Уральским го
рам и их западным предгорьям вдоль Камы, зани
мая только ее левобережье, и далее продолжает
19"
2:
39°
49°
50'
}
}
3.
}
тр:
СЕРИя ||.
неславянские нАРоды
отрасстаноидиот пипл от от отстаионии отри для с итом он он от он
восточнои ЕвРопы
т
3
*
ёы
и птиц, к к к щит.
чці" и ".
и им в
** *
мl
он и
- изученные популяции
*
с
их псилстику
10"
по-лама ли-и-киш
или
и
ли сил к
опталл-гилл
Рис. 5.22. Карта обобщенного генетического ландшафта неславянских народов Восточной Европы по
гаплогруппам Y-хромосомы (Построена как средняя по картам генетических расстояний от башкир, казанских
татар, мишарей, мокши, чувашей, эрзи).
179
5.3. Неславянские народы Восточной Европы (серия III)
то"
?
:0
49
50
80:
10"
8.
}
10}
БАШКИРы
плохо:гомосомол, пило, от от от отст, отнситон от 2 стоит и от он
".
„кухмим во ме"
и птт и к к: к п. 1.
чин" и т.
o
10"
снин;апахалинудителиакатляч личнитяни оштучнинг причнлнили см качатьопталлинили
Рис. 5.23. Карта генетических расстояний от башкир (генетический ландшафт по гаплогруппам Y-хромосо
мы).
путь на юг вдоль этого же меридиана, доходя до
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
Казахстана. При этом южная часть ареала более
ГЕНОФОНДОМ КАЗАНСКИХ ТАТАР (рис. 5.24)
широка и размыта, протягиваясь на запад почти до
Волги, а на востоке вновь до ареала казахов. Мак
симальные значения генетических расстояний
(темно-красные тона) окружают ареал башкир с
востока, севера и юга, следуя изгибу Оби и ареалу
казахов. На западе же от башкир — от Волги и ниж
него Донадо крайнего европейского севера нахо
дятся оранжевые тона популяций, генофонды ко
торых, конечно, далеки от башкир, но все же не
настолько, как Сибирь и Казахстан.
Детальное изучение генофонда башкир и ок
ружающих народов, проводимое сейчас нашим
коллективом в содружестве с уфимскими коллега
ми (под руководством к.и.н. Ю.М. Юсупова) по
По данным переписи 2010 г. в Татарстане про
живает 2 млн. татар. Но поскольку эти данные
включают и мишарей, и кряшен, и тептярей, то
численность казанских татар Татарстана, видимо,
сопоставима с численностью башкир Башкортос
тана. Однако казанские татары характеризуются
совершенно иным генетическим ландшафтом, чем
башкиры — ареал популяций, генетически сходных
сказанскими татарами, обширен и весь обращен к
Северо-Восточной Европе.
Хотя область популяций, максимально сход
ных сказанскими татарами (темно-зеленые тона,
показывающие минимальные генетические рас
зволит вскоре значительно уточнить эту картину:
стояния 0<d<0.05) невелика, ареал популяций, ок
уже прослеживаются важные генетические связи
рашенных в желто-зеленые тона небольших ге
с рядом народов евразийской степи.
Из характерных черт генетического ландшаф
та отметим явные различия между генофондами
нетических расстояний (0,05<d<0.10), чрезвычай
но обширен (рис. 5.24). Этот ландшафт почти пол
ностью вторит ландшафту Северо-Восточной Ев
башкир и татар. Впрочем, планируемое нами де
ропы (рис. 5.10), детально описанному в первой
тальное изучение генофонда населения Татарста
серии карт (раздел 5.1.). Вся северная и западная
на позволит определить более точно и особеннос
часть ареала сходных популяций практически та
же (за исключением разве что побережья Барен
цева моря) — она включает не только западных
ти каждого из этих двух генофондов, и их взаимо
действие.
Глава 5. Панорама народов на фоне Европы
18()
50"
и
3"
}
10"
у
1с
20
30
49
52'
30"
ту.
30
90
20-г
ТАТАРЫ КАзднскиЕ
др1 ac: j: сс4 0 0; по идт рад, шт атт от? и 13 p14 и 15 ат: аи, ота или от да сл ш5 по ит рек до
&ь
1
и китт.п. 4. . . и т.
мна и т.
с"
20"
снанізадпxaый гусятилягилыни Анниннн ашунгинга Енганн-лн сихична ап ралл=нный
Рис. 5.24. Карта генетических расстояний отказанских татар (генетический ландшафт по гаплогруппам Y
хромосомы).
50-
40"
ми
*
та"
п"
пш"
за
за
до
5
вп:
тр
во
gш"
то?
ми|ШАРИ
прийдтира рана: ас адтиплинии и 11 и12 атлитый 15 ать
iы
италинии: им ин д: р. ат а
ай
1
д.
пиитик" и килт
кхмммме "е"
члингт.
g"
снима истианак"
им
спиннатом тиккинг
ина-жин см каити, оптили-ж и
Рис. 5.25. Карта генетических расстояний от мишарей (генетический ландшафт по гаплогруппам Y-хромо
сомы).
|8|
5.3. Неславянские народы Восточной Европы (серия III)
финнов и балтов, но и запад Фенноскандии (рис.
5. 10). На юге этого ареала границей вновь слу
занских татар — связана с потоком генов к миша
карту (рис. 5.24) — генетического ландшафта ка
жит Волга.
рям от более многочисленного генофонда казан
Но есть и разница. В отличие от народов Севе
ро-Восточной Европы, область сходных генофон
ских татар. В этом случае «правобережно-волжс
кую» часть можно считать «собственным» гене
дов охватывает Татарстан и часть популяций Баш
кортостана, указывая на наличие общего северо
европейского субстрата и у них. Если бы надо было
дать выразительное название наиболее характер
ным чертам этой карты, то ее можно было бы на
тическим ландшафтом мишарей, который, воз
можно, несет следы древнего балтского генофон
Да.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕноФондом ЧУВАШЕй (рис. 526)
звать ландшафтом «левобережья Волги» — так как
Волга практически на всем своем течении ограни
чивает ареал генофондов, сыгравших наиболее
важную роль в сложении генофонда казанских та
тар. И приходится отметить, что Y-хромосомный
генетический ландшафт не подтверждает ни бул
гарскую, ни золотоордынскую версии этногенеза
Следующий генофонд в нашем продвижении
с востока на запад — чувашский, который в дан
ных по широкой панели гаплогрупп Y-хромосомы
пока представлен единственной популяцией, изу
ченной на территории Татарстана. Но вопреки и
казанских татар, а вместо этого подчеркивает мощ
ее географическому соседству с мишарями и ка
ный североевропейский генетический субстрат в
занскими татарами, и их общей принадлежности к
их генофонде.
тюркским языкам, и большой численности (по пе
реписи 2010 года, чувашей в России около 1.5 млн.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
человек) чуваши являют собой генетический ост
ГЕноФондом МИШАРЕй (рис. 5.25)
ров — мы вообще не обнаруживаем других популя
ций, генетически с ними сходных.
Численность мишарей указать не просто, так
Сразу вспоминается, что чувашский язык —
как в последних переписях они не выделялись из
единственный уцелевший из булгарской ветви тюр
кских языков. Уникален он и тем, что ответвляет
ся от общего ветви тюркских языков раньше всех
и, похоже, первым проникает в Европу, двигаясь
на запад сдальней прародины тюрков. Путь этот
был не только длинным, но и долгим — с неизбеж
ными контактами и заимствованиями на пути. По
этому не удивительно, что в культуре чувашей
предполагается значительный пласт, связанный с
совокупности татар, но в переписи 1926 года их
численность оценивалась около 200 тыс. Из их
обширного ареала к настоящему времени по Y
хромосоме изучены только популяции мишарей
Татарстана. И хотя в Татарстане мишари явно ус
тупают по численности казанским татарам, одна
ко они обнаруживают новый, ранее еще невидан
ный, генетический ландшафт Поражает его об
ширность — зона генетического сходства (мини
мальных и небольших расстояний) простирается
от южного Урала до Белого и Балтийского морей
культурой древних земледельцев Передней Азии.
Трудно об этом не вспомнить при взгляде на гене
тический ландшафт чувашей. Впервые, в отличие
(рис. 5.25). Но самая удивительная черта — это то,
всех ранее рассмотренных карт, мы видим, что
что здесь Волга не служит границей, как мы это
видели практически на всех картах. Напротив,
Волгаявляется центром — во всем ее течении об
ласти генетически сходных популяций располо
жены на ее обоих берегах. Генетический ланд
южные территории — Кавказа, Закавказья и Пере
дней Азии — окрашены вовсе не в максимальные
шафт мишарей объединяет карты первой (рис.
5.10) и второй (рис. 5.21) серий. Но при этом ге
нетический ландшафт мишарей ограничен с за
пада и с юга — в отличие от карт второй серии,
зона генетического сходства в западном направ
лении доходит лишь до Прибалтики, но не покры
вает ареал западных славян, не заходит она ни к
украинцам, ни на юг России, но тянется широкой
полосой светло-зеленых интервалов от Прибал
тики до Поволжья и Южного Урала.
Неожиданность генетического ландшафтами
темно-красные тона генетических расстояний как
на всех предыдущих генетических ландшафтах, а
в оранжевые тона умеренно больших генетичес
ких различий. И действительно, своеобразие гено
фонда чувашей задается в первую очередь резко
повышенными (по сравнению со всеми соседями)
частотами гаплогрупп Е и J, типичных для Пере
дней Азии (глава 2).
В целом, генетический ландшафт чувашей не
противоречит (в отличие отландшафта казанских
татар) «булгарской» версии их этногенеза. Одна
ко для решительных выводов необходимо, конеч
но, детальное изучение всех трех этнографичес
ких групп чувашей, каждая из которых испытала
влияние разных соседних этносов. Сложив этумо
шарей позволяет выдвинуть рабочую гипотезу,
требующую тщательной проверки. Можно допу
стить, что «левобережно-волжская» часть ланд
заику, мы, возможно, сумеем разглядеть наиболее
шафта, практически повторяющая предыдущую
ШеИ.
древний генетический пласт в генофонде чува
Глава 5. Панорама народов на фоне Европы
182
50-
30-
ции
}
10"
0"
10°
20'
30"
40
50'
30"
ту
30
99"
тру
ЧyВАШИ
приппа ара оснар; араортосаара ат а11 с 12 апханань с наитаилий 02 02 он по ре ат ра pt
-
и инт и т.
вы
1
км, имело моть
п.кит.
мна "т.
x
*:
:
*:
с.
-
50
и!
:
=
и
—
в . т и и т.
м китт.
=
н
<
10
о"
статисагалстику г-на гемии и тонгин тиг пыт
-
глав тигала
тыли сикс
апплги
гг. и
Рис. 5.26. Карта генетических расстояний от чувашей (генетический ландшафт по гаплогруппам Y-хромо
сомы).
оilia 020 a3, о4 d5 байта,ба 030.10.1ta 120 130 140.157.150.170.18.190.2 п.3 04:й 5 0 3 0 7 0 3 0 3 и
пл.п т. п. м.
имтхммм во
п. п.
мотт
чин, в к.
-
*
с
их псилстику
по-лам ли
и
сил у
или
и
ли си качат. oп
алл
мл
Рис. 5.27. Карта генетических расстояний от мокши (генетический ландшафт по гаплогруппам Y-хромосо
мы).
183
5.3. Неславянские народы Восточной Европы (серия III)
КАРТОГРАФИРОВАНИЕ СХОДСТВА
С ГЕНОФОНДАМИ МОКШИ (рис. 527)
И ЭРЗЯ (рис. 5.28)
генетически не схожи (как северная и южная час
ти русского генофонда), в то время как разные эт
носы могут быть генетическими близнецами (как,
Часто возникающий вопрос о том, являются
например, центрально-южная половинка русского
ли мокша и эрзя разными народами или же су
Отметим лишь, что мордва — это экзо
генофонда и белорусы). Определяющим фактором
может быть лишь самосознание самих русских и
белорусов, мокши и эрзя, и других подобных общ
ностей. Поэтому, ни в коем случае не обращаясь к
этноним, а мокша и эрзя — самоназвания. Линг
решению вопроса, являются ли мокша и эрзя са
бэтническими группами одного этноса — мордвы
— может быть адресован не к генетикам, а лишь к
ЭТНОЛОГaМ.
вистика выделяет их языки как самостоятельные,
мостоятельными этносами или же частями одного
а не диалекты — существенная разница в фонети
этноса — мордвы, рассмотрим их генофонды от
ческом строе, лексике и грамматике не позволяет
дельно, поскольку для них характерны разные ге
их носителям понимать друг друга. Наиболее
близкими к ним являются ныне мертвый мещер
ский язык, а также марийский и языки прибал
ногеографические ландшафты.
Генетический ландшафт мокши (рис. 5.27)
указывает на яркое своеобразие их генофонда —
тийских финнов. По данным переписи 1989 г.
область генетически близких значений охватыва
только в республике Мордовия насчитывалось бо
лее 180 тыс. мокшан. По данным последней пе
реписи, 50 тыс. человек причислили себя к мок
ше, 80 тыс. человек — к эрзе, а 700 тыс. человек
назвали себя мордвой.
Но генетика изучает популяции всех уровней
этнической и субэтнической иерархии, и сходство
или же различия их генофондов не могут служить
ет лишь небольшой ареал популяций среднего те
чения Волги, строго ограничиваясь ее правобе
указанием на то, кто из них является этносом, а
кто — субэтнической группой. В первой серии карт
мы уже видели, что части одного этноса могут быть
режьем.
Генетический ландшафт эрзян (рис. 5.28), на
против, поражает обширнейшим ареалом генети
чески близких популяций. Этот ареал уже хорошо
узнаваем — это все тот же хорошо знакомый нам по
второй серии карт (раздел 5.2.) генетический лан
дшафт «северных славян» (рис. 5.21). При этом
ярко-зеленые области генетически близких значе
ний включают в себя не только ареал белорусов,
цl имтщи. д., к сил.
*1ій тт.
* 1 и 1 т и на 1
& "
"
милии.
cстати лапсаламирус-лиг
:й"
м-то
пил т.к. варила
или сих
операмл-мм
Рис. 5.28. Карта генетических расстояний от эрзян (генетический ландшафт по гаплогруппам Y-хромосо
мы).
184
Глава 5. Панорама народов на фоне Европы
центральных и южных русских популяций, но и
Польшу, и запад Германии, и Словакию, оставляя
Украине и левобережью Волги область умеренно
близких частот, окрашенных желтыми тонами.
Обратим особое внимание, что в отличие от мок
шан, генофондэрзян генетически далек открымс
Такое яркое различие между генетическими
ландшафтами мокши и эрзи служит важным ар
нофонда Мордовии недостаточно просто указа
ние «мордва», и необходимо указывать, популя
ции мокши или же эрзи были включены в ана
ких татар.
лиз.
гументом, что при описании характеристик ге
5.4. НА СЕВЕРЕ БАЛКАН (СЕРИЯ IV)
Карта генетических расстояний от молдаван
(рис. 5.30) — самая яркая иллюстрация этого ланд
шафта: зеленая «река» генетически близких к мол
Возвращаясь в юго-восточную Европу, рас
смотрим пять карт генетических расстояний
(рис. 5.30—5.34) от народов, говорящих на язы
ках трех больших лингвистических семей: мол
даване и румыны — на языке романской ветви ин
доевропейской семьи, а словенцы — на ее сла
вянской ветви; гагаузы — на языке тюркской вет
ви алтайской языковой семьи; венгры — угорс
даванам популяций тянется от Черного моря до Ад
риатического. По обе ее стороны тянутся желтые
«берега» популяций, умеренно близких к генофон
думолдаван. Но основная часть Балкан, Централь
ной и Восточной Европы генетическидалекиот них.
Отметим, что географически соседний украинский
генофонд находится в области умеренных генети
ческих отличий, окрашенных в желтые тона (зеле
кой ветви уральской языковой семьи. Эти разно
языкие народы объединяет то, что они заселяют
северную окраину Балкан, а генетически их
объединяет преобладающий своеобразный лан
ные оттенки в области, пограничной с Молдовой,
связаны с интерполяцией на соседние генетически
неизученные области юго-западной Украины). Та
кой зеленый пояс генетически близких популяций,
окаймляющий Балканы с севера, возможно, фикси
рует зону миграций, связывающую Адриатику и
Причерноморье, но не доходящую до Апеннин.
дшафт в виде широкой полосы генетически сход
ного населения, протянувшейся от Черного моря
до Адриатического (рис. 5.29).
КАРТОГРАФИРОВАНИЕ СХОДСТВА
С ГЕНОФондом молДАВАН (рис. 5.30)
с"
то"
??
30
40
50
80"
70’
82
50"
то?
серия v.
нд СЕВЕРнои окPдинЕ
и циттии к к: к цит.
хммм во мотт
им?
мил p и,
с
п. и.т.
п т.
м цить
* изученные популяции
10"
о"
стен 2апсилстик,
как знатлача Ачиньингченна а л ьчанаан
в
наняли си качать апг-ананала
Рис. 5.29. Карта обобщенного генетического ландшафта народов северной окраины Балкан по гаплог
руппам Y-хромосомы (Построена как средняя по пяти картам генетических расстояний от венгров, гагаузов,
молдаван, румын,
словенцев).
185
5.4. На севере Балкан (серия II)
МОЛДАВАНЕ
приппу прироча, ись адтасиаса птими стиппи и 13 ппвил? птип 19
1инат пттл.
ап да им по ит пи пр
кн.11.
и
клеммеко ме"
н"
сниннснованнннннннннннн пытнанннннннннн сыньинь опьянненены
Рис. 5.30. Карта генетических расстояний от молдаван (генетический ландшафт по гаплогруппам Y-хромо
сомы).
КАРТОГРАФИРОВАНИЕ СХОДСТВА
С ГЕНОФОНДОМ РУМЫН (рис. 5.31)
ландшафт соседних молдаван. Не подтверждает он
Казалось бы, на карте генетических расстоя
ний от румын (рис. 5.31) мы должны увидеть кар
версий происхождения гагаузов связывает их с про
тоболгарами, мигрировавшими с Волги на Балка
ны в середине 1 тыс. н.э., однако генетические свя
зи гагаузов с нынешним Поволжьем на карте от
сутствуют Генофонд гагаузов отличен и от ближай
ших степных тюркоязычных популяций — крымс
ких татар и ногайцев (достаточно сравнить с гене
тическим ландшафтом ногайцев на рис. 5.43), и от
генофондатурок, близость с которым можно было
ожидать, исходя и из истории (вхождения в Осман
тину, ничем не отличающуюся от только что ви
денной у молдаван, ведь не только языки молда
ван и румын считаются вариантами одного языка,
но и в высказываниях официальных лиц часто ут
верждается, что молдаване и румыны — один на
род. Однако генофонды их различны. Если гено
фонд молдаван в равной мере принадлежит и юж
ным славянам Балкан, и лежащим к северу и вос
току от них популяциям западных и восточных
славян, то генофонд румын вторит лишь Балканс
кому генетическому ландшафту отвернувшись от
Черного моря, он обнимает Адриатику с генети
чески близкими к румынам и родными по языку
и «исторические» ожидания — одна из заманчивых
скую империю), и языкового сходства.
Генофонд гагаузов явно обращен к Балканам,
к восточной окраине. Видимо, он хранит генети
ческую память о балканской родине, откуда гагау
зы в XVIII—XIX веках переселились в Бессарабию.
популяциями Апеннин.
КАРТОГРАФИРОВАНИЕ СХОДСТВА
С ГЕНОФОНДОМ ВЕНГРОВ (рис. 5.33)
КАРТОГРАФИРОВАНИЕ СХОДСТВА
С ГЕНОФОНДОМ ГАГАУЗОВ (рис. 5.32)
Еще более впечатляет генетический ландшафт
тюркоязычных гагаузов (рис. 5.32).
Генофонд венгров, напротив, обращен к севе
ру. Хотя таже «зеленая река» генетически близких
популяций протекает по северной окраине Балкан,
Вопреки «лингвистическим» ожиданиям, гено
но зона генетического сходства с венграми охва
фонд гагаузов смотрит не на юго-восток (ведь язык
тывает Австрию и доходит до Польши. Конечно
гагаузов близок к турецкому, азербайджанскому и
же, генетической связи с лингвистическими род
туркменскому), а на запад. Вопреки «географичес
ственниками — угроязычными хантами и манси
ким» ожиданиям он не повторяет генетический
Западной Сибири — мы не видим (рис. 5.33). Мы
186
Глава 5. Панорама народов на фоне Европы
о
то"
?
:0
49
50
g0'
плохо:гомосомол, пило, от оттот, отст, от сииттон от 2 стол пути от он
—
11 пттии к к к щит.
*
чин и т.
2
:
ц
—
*
*
-
50
н.
g
—
=
си,и и.т и щит.
—
м кать
Рис. 5.31. Карта генетических расстояний от румын (генетический ландшафт по гаплогруппам Y-хромосо
мы).
50
о"
по
2,
30
49
50
80:
Гдгдузы
ппппарфурсы п0%ии дип, припра от п.11 a1*a13 атч стыдиш 11 п.1л и 19 от ап пл пу пи птик дь
и
д.
и пттии к c к п т.
о"
10"
„кухмика" мо"
-
снчин;апсихикудинклилитлач личнингини о шучищли гигичнлнили см качить опталлинили
Рис. 5.32. Карта генетических расстояний от гагаузов (генетический ландшафт по гаплогруппам Y-хромо
сомы).
187
5.4. На севере Балкан (серия II)
похолокосомол, пило, от от от отстготвоистон от 22 стоя и пи от он
и птт и к к: к п. т.
чин" и т.
, ,wo+
* ".
o
10"
"о*,
-
снин;апахалинудителиакатляч личнянганн ош училингвичнлнили см качатьопталлинили
Рис. 5.33. Карта генетических расстояний от венгров (генетический ландшафт по гаплогруппам Y-хромосо
мы).
о"
50
по
2,
30
40
50
80"
10"
СловЕНЦы
потохослом совостоит ли по от от от отзотисты сиптопарта 22 сп от им пи от он де
д.
м
}
11 пттии, к к к щит.
вхткл"цент метк
чин и т.
си,и .т и щит.
м кать
10"
—
Рис. 5.34. Карта генетических расстояний от словенцев (генетический ландшафт по гаплогруппам Y-хромо
сомы).
| 88
Глава 5. Панорама народов на фоне Европы
видим окрашенные в желтые тона области умерен
ного генетического сходства, которые охватывают
обширный ареал славянского мира Центральной и
Восточной Европы и доходят до Волги. Однако
«волжские» и «причерноморские» генетические
связи нельзя прямолинейно трактовать как праро
дину и путь угроязычных племен от Волги до ны
нешней Венгрии. На это указывает генетический
ландшафт словенцев (рис. 5.34), полностью вклю
нетических ландшафтов — и второй (рис. 5.21), и
четвертой (рис. 5.29) серий. Мы видим и зеленую
«реку» генетически близких к словенцам попу
ляций, которая тянется от них до Черного моря.
Но к северу и востоку находится область генети
чески близких значений, ареал которых вторит
паттерну генетического ландшафта «северных»
славян. Чтобы убедиться в этом, достаточно срав
нить эту карту от представителя южных славян —
чающий в себя и популяции, генетически сходные
словенцев (рис. 5.34), например, с картой генети
с венграми (рис. 5.33).
И еще раз отметим, что генетический ландшафт
ческих расстояний от представителя западных
славян — словаков (рис. 5. 18). Мы видим тот же
венгров целиком вписывается в этот «славянский»
ареал, отличия же карт состоят лишь в мере гене
ландшафт, указывая на хорошо известный в ант
ропологии факт ведущей роли местного, автохтон
ного населения в сложении генофонда венгров.
тических различий — на карте словенцев этот аре
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ СЛОВЕНЦЕВ (рис. 5.34)
нофонда словенцев согласуется и с их лингвис
тическим своеобразием (Кushniarevich et al.,
ал окрашен в желтые тона умеренных генетичес
ких отличий.
Такое особое промежуточное положение ге
2015), и с их генетическим своеобразием по дру
Карта генетических расстояний от словенцев
объединяет в себе сразу два общих паттерна ге
гим генетическим системам, описанном в гла
ве 6.
5.5. ЮЖНЫЕ СЛАВЯНЕ (СЕРИЯ V)
Македонцы, сербы, хорваты, боснийцы и гер
македонцам: территории современных не только
цеговинцы (а также рассмотренные в предыдущем
разделе словенцы) формируют группу южных сла
окрашены на карте в красные тона генетически
Словении, но и Хорватии, Боснии и Герцеговины,
вян в пределах индоевропейской лингвистической
несходных популяций. Однако популяции сербов
семьи. Географически эти народы объединяет их
генетически близки к македонцам, образуя с ними
принадлежность к Балканам. Их генетическое сво
еобразие не только по Y-хромосоме, но и по ауто
единый массив сходных генофондов, окрашенных
на карте в зеленые тона. Этот массив тянется на
сомным широкогеномным маркерам детально рас
восток, охватывая популяции румын, а окрашен
смотрено в главе 6. Это своеобразие связывается с
сохранением субстратного генофонда тех балкан
ные в желтые тона области умеренных генетичес
ких различий доходят до значительной части севе
ро-западного побережья Черного моря.
ских племен и народов, которые стали говорить на
славянских языках, но сохранили свои особеннос
ти. Их генетический ландшафт можно назвать
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕноФондом СЕРБов (рис. 5.37)
«южнославянским», помня, что рассмотренные
выше словенцы (рис. 5.34) являются исключени
ем (наличие хотя бы одного исключения для каж
дой серии стало уже правилом).
Основной паттерн их обобщенного генетичес
кого ландшафта, приведенного на рис. 5.35, зада
ется тем, что северная граница как раз проходит
по границе Балкан, а южная не затрагивает ареалы
греков и албанцев.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ МАКЕДОНЦЕВ (рис. 5.36)
Впрочем, карта генетических расстояний от
македонцев сразу вносит ожидаемые коррективы
в южную границу ландшафта: она отчасти захо
дит и на северные территории современных Гре
ции и Албании, и на юг Италии. При этом северо
запад южнославянского ареала генетически чужд
Карта генетических расстояний от сербов (рис.
5.37) очень сходна с генетическим ландшафтом ма
кедонцев (рис. 5.36). Их небольшие отличия соот
ветствуют ожиданиям: южная граница зоны сход
ства с сербами не заходит в Албанию и Грецию, но
зато северо-запад южнославянского ареала оказы
вается уже генетически более близок к сербам — ге
нофонды Хорватии, Боснии и Герцеговины окраше
ны на карте в желто-зеленые тона. Этот массив вновь
тянется на восток, охватывая популяции румын и
северо-западного побережья Черного моря.
В целом сербы и македонцы характеризуются
наибольшей площадью ареала генетически сходных
с ними популяций среди всех южных славян. Воз
можно, они в наибольшей степени воспроизводят
генетическую общность южных славян и могут слу
жить основной моделью при ее реконструкции.
189
5.5. Южные славяне (серия И)
50-
40'
3c-
20"
10
с
по
2,
30
49
50
80
70"
8.
90
cЕРИя М.
ножные слдвянв
при драффилиади пипптппу под с 1 и 11 диафтифициати пипит пии для р: ли пл дь пы птик пь
ёы
и
}
„кухмично ме"
11 птти, к к к щит.
чин" и т.
о"
10"
стен хапсалстинус епианатлача личнинганна сил учиннин гигана англи сил к мать апталантилл
Рис. 5.35. Карта обобщенного генетического ландшафта южных славян по гаплогруппам Y-хромосомы.
(Построена как средняя по пяти картам генетических расстояний от боснийцев, популяций Герцеговины, маке
донцев, сербов, хорватов).
МАКЕДонцы
ппп иг?йjйсной, адипп" припра от 111 p1?й 13 ст4 фть дип 11 п.1л 119 ф: фл бы пу пи пт nк дt
ёы
т
д.
ихт*** мутил мотт.
и питти и на с к п. т.
мил p и,
у
осто
о"
10"
стелии Хасси 32тив, Сетепианатлача Алтанангана а им учаилан
в лична или С1 калеть сп
алана алл
Рис. 5.36. Карта генетических расстояний от македонцев (генетический ландшафт по гаплогруппам Y-хро
мосомы).
Глава 5. Панорама народов на фоне Европы
19()
50-
30-
ции
}
10"
0"
10°
20'
30"
40
50
80"
ту
30"
99"
тру
СЕРБы|
приппа ара оснар аса артрса aca at a11 2 32 атландир авантана на р: p3 p4 p5 pe of pa at:
ёы
плит и т.
1
км, имело моть
к.кит.
* и *т.
и и,в и,т и ск к
м китт.
10
ст.л-т апгт.к.
—
Рис. 5.37. Карта генетических расстояний от сербов (генетический ландшафт по гаплогруппам Y-хромо
сомы).
-
50"
40"
30"
20"
10"
о
то"
??
30°
40
50
80:
10"
3.
}
}
хорвдты
ппппу одурсипп, припп) припра от п.11 плуатхатист, пиш 11 п.1ипта от ап см пу пи пт пк ив
ёы
11 атт и к к: к и т.
и
схемцево ме"
мии и т.
см.п. и.т и щит.
*л кать
Рис. 5.38. Карта генетических расстояний от хорватов (генетический ландшафт по гаплогруппам Y-хромо
сомы).
191
5.5. Южные славяне (серия И)
50-
40"
3y
20"
10"
о"
по
2,
30
40
50
80
п0
8.
90
10}
Боснийцы
ппппарфурсы п09 до пишу припра
от оттот, ответствоистон или фа
ёы
ап пл пу пи пт пк дь
„кухлодхво ме"
С 4
11 птти, к к к щит.
чин" и ".
*—
10
-
и
-
-
Рис. 5.39. Карта генетических расстояний от боснийцев (генетический ландшафт по гаплогруппам Y-хро
мосомы).
с
40"
бti gд?й из ар, аб: все 557 об8 ай ай в 11 at: 2.1 п.14 115 aigйттаивал? а? 51 04
iы
10-
30°
30'
до
15 05 0 7 58 29
50
во
и
5.
1 tл тит}, t к чит
п
схемцево мет"
ул и т. к.
* и, т. 1,ттина и,
р
10
—
Рис. 5.40. Карта генетических расстояний от народов Герцеговины (генетический ландшафт по гаплогруп
пам Y-хромосомы).
192
Глава 5. Панорама народов на фоне Европы
КАРТОГРАФИРОВАНИЕ СХОДСТВА
С ГЕНОФОНДОМ ХОРВАТОВ (рис. 5.38),
Естественно, что зеленая зона максимально
близких генетических популяций сосредоточена в
БОСНИЙЦЕВ (рис. 5.39) И ПОПУЛЯЦИЙ
их этнических ареалах, однако желто-зеленые тона
ГЕРЦЕГОВИНЫ (рис. 5.40)
генетического сходства вновь рукавом простира
Все три карты имеет смысл рассматривать вме
сте, поскольку их сходство очень велико. Во-пер
вых, все они имеют меньший, чем у сербов и ма
кедонцев, ареал генетически сходных популяций
(зеленые тона). Во-вторых, они составляют как бы
часть генетического ландшафта сербов и македон
ются на территорию современной Румынии, но не
доходят до черноморского побережья. При этом ге
НеТИЧеСКИе ландшафты хорватов и боснийцев
практически неотличимы друг от друга, а карта
расстояний от генофонда популяций Герцеговины
представляет их локальный вариант, примыкаю
щий к Адриатике.
ЦеВ.
5.6. ОБРАМЛЕНИЕ ЕВРОПЫ (СЕРИЯ VI)
Рас-стояние; вёрсты, мили...
Нас рас-ставили, рас-садили,
Чтобы тихо себя вели
По двум разным концам земли.
Марина Цветаева
К сожалению, объем книги не позволяет при
вести и описать генетические ландшафты от каж
дого из народов Европы — для этого нужна отдель
ная книга. Но чтобы увидеть, насколько велики
различия генофондов даже европейской окраины
Евразии, рассмотрим генофонды трех этносов,
окаймляющих пространство народов, рассмотрен
ных в пяти предыдущих сериях. Эти три этноса
— албанцы, шведы, ногайцы — не только геогра
фически «расставлены» по трем «концам земли»,
но и генетически они оказываются полярно раз
личными, как бы оформляя масштаб разнообра
зия генофонда Европы.
длБднцы
похо: осном отпили от оттот, ответствоистота птн - стол пути от он и
ёы
и птт и к c к п т.
клумкво метк
им"
чь на " ч.
си.т.н.т и цит
г т
м китт.
*
10"
г-н лаптил-и пуп-п.л- л-ин-иш у
или
п
-ли сти к
т. пп галл-мл
Рис. 5.41. Карта генетических расстояний от албанцев (генетический ландшафт по гаплогруппам Y-хромо
сомы).
193
5.б. Обрамление Европы (серия ИП)
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
ГЕНОФОНДОМ АЛБАНЦЕВ (рис. 5.41)
— к северу, а другой — к югу. Лингвистически они
также резко различны: хотя и принадлежат к од
Эта карта является естественным продолжени
ем предыдущей балканской серии (раздел 5.5). Но
она являет совсем иной паттерн: он весь обращен
не только к югу Балкан, но и к Средиземноморью
в целом. Генетически близкими к албанцам оказы
ваются популяции всей Греции, желто-зеленые
тона небольших генетических различий захваты
вают не только Сицилию и запад Малой Азии, но
ной индоевропейской семье, но албанский язык
стоит особняком ото всех и представляет наследие
палеобалканских языков с многочисленными за
имствованиями. Генетический ландшафталбанцев
не позволяет утверждать, что их генофонд сохра
нил генетическое наследие иллирийцев, древние
корни которых по данным археологии ведут насе
вер, в центральную Европу, а не на юг. Но о чем
приведенные карты ясно свидетельствуют, так это
и африканское побережье.
Такой генетический ландшафт можно назвать
«средиземноморским», и албанцы могут выступать
представителем «средиземноморского генетичес
кого полюса» Европы. При этом европейский ге
нофонд в целом оказывается албанцам почти чуж
дым: европейский континентокрашен в интенсив
о том, что одновременно быть наследниками гено
фонда иллирийцев и хорваты (рис. 5.38) и албан
цы (рис. 5.41) не могут, настолько различны их ге
нофонды: кто-то из них или же и те, и другие не
сохранили это наследство Балкан.
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
но красные тона максимальных генетических от
личий, в то время как Средиземноморское побере
жье не только Европы, но и Африки, и части Пере
дней Азии генетически более близки к албанцам,
чем Европа в целом.
Нельзя не заметить разительные отличия меж
ду генетическими ландшафтами двух соседних ге
нофондов — албанцев (рис. 5.41) и македонцев (рис.
5.36). Это два разных генетических мира, как бы
стоящих спиной друг к другу и обращенных один
ГЕНОФОНДОМ ШВЕДОВ (рис. 5.42)
Северо-западный край земли — «скандинавский
генетический полюс» — представляет карта рассто
яний от генофонда шведов. Эта карта (рис. 5.42)
почти альтернативна предыдущей (рис. 5.41): тем
но-красные тона максимальных генетических рас
стояний переместились из Европы как раз на те
территории, к которым были генетически близки
албанцы. Теперь уже Балканы, Средиземноморье,
и птиц, к к к щит.
чин" и ".
t: 1.1i . т и цит.
- изученные популяции
10
c-и лаппсихоливус-епиа-атлами
лиманите- слы
или
в
ма-а-ли сил коллег. сп гала-илл
Рис. 5.42. Карта генетических расстояний от шведов (генетический ландшафт по гаплогруппам Y-хромосо
мы).
194
Глава 5. Панорама народов на фоне Европы
Передняя Азия, Кавказ и циркумкаспийский реги
он окрашены в темно-красные тона максимальных
генетических отличий, в то время как вся Европа,
за исключением южной, являет оранжевые тона
более умеренных генетических отличий.
Темно-зеленая зона генетического сходства
тона минимальных генетических расстояний об
наруживаются лишь в популяциях самих ногайцев
иукрымских татар (рис. 5.43). Однако желтые тона
умеренного генетического сходства тянутся по
прикавказским степям от Каспия до Причерномо
четко ограничена Скандинавией: шведы и норвеж
рья и отдельным рукавом поднимаются вдоль ниж
него течения Волги.
цы являют единый генетический пласт, близок к
ним и генофонд датчан. При этом самый север
Скандинавии уже генетически отличен, как и прак
тически все популяции Финляндии. В первой се
Было бы слишком большим упрощением счи
тать генетический ландшафтногайцев просто степ
ным. Ведь обращают на себя внимание желтые тона
умеренного генетического сходства ногайцев с на
рии карт (раздел 5.1) мы видели, что эти популя
ции севера Скандинавии генетически очень близ
ки к финнам (рис. 5.9), а также к карелам и вепсам
(рис. 5.2), и лишь отчасти — к эстонцам (рис. 5.3).
селением горных областей Передней Азии — от
Анатолии до Иранского нагорья. Не менее впе
чатляет, что практически вся Центральная и Вос
точная Европа, Урал, Западная Сибирь окрашены
в оранжевые тона умеренных генетических отли
КАРТОГРАФИРОВАНИЕ СХОДСТВА С
чий. Можно считать, что генофонд ногайцев впи
ГЕНОФОНДОМ НОГАЙЦЕВ (рис. 5.43)
тал в себя столь многие евразийские генетические
потоки, что может успешно выступать в качестве
Юго-восточный край европейской земли — «ге
нетический полюс евразийской степи» — представ
лен генетическим ландшафтом ногайцев. Зеленые
одного из эталонов «генетического полюса евра
зийской степи».
потохослом совостоит ли по от от от отзотисть сиптопарла 22 слоя и пи от он и
ёы
и птт и к к: к п. 1.
чин" и ".
в изученные популяции
10
стен запахстинус епианатлач личнинганн агитчиннин гигина англи сти к мать апталантилл
Рис. 5.43. Карта генетических расстояний от ногайцев (генетический ландшафт по гаплогруппам Y-хромо
сомы).
ГЛАВА 6.
ГЕНОФОНД СЛАВЯН
действующих дисциплин — археологией, истори
изменения. Логически эта задача является перво
степенной, поскольку только после получения и
осмысления собственных данных популяционная
ей, лингвистикой, этнографией, этнической антро
генетика может предоставлять свои результаты и
пологией. Популяционно-генетическое изучение
изменчивости ДНК маркеров неотделимо от иссле
дований этнической антропологии, поскольку так
же опирается на биологическую изменчивость по
выводы в пользование смежным наукам. В данной
главе мы попытались решить обе задачи примени
Изучение этногенеза и этнической истории
народов традиционно проводится рядом взаимо
тельно к славянским народам, изучение которых
(особенно восточных славян) традиционно для
пуляций, только имеет дело не с фенотипически
ми (внешними) признаками, а с ДНК маркерами.
российской науки. Генетические данные о них на
момент начала нашего исследования были пред
Молекулярно-генетическое изучение популяцион
ставлены в мировой литературе лишь фрагментар
ных генофондов человека с каждым десятилетием
занимает все более важное место в системе наук о
но, и в результате огромный славянский мир, за
нимающий почти половину Европы, исчезал из
народонаселении и решает, на наш взгляд, две за
знаний о генофонде населения.
дачи.
одним историческим источником. Например, гене
Полученные данные находят широкий спектр
приложений — от эколого-генетического монито
ринга и судебно-медицинской экспертизы до пре
подавания и популяризации науки. В данной же
тическое сходство двух географически соседних
главе анализ полученных данных проводится вас
популяций может свидетельствовать об их общем
пекте исторической геногеографии. Его цель—при
При решении первой (наиболее популярной)
задачи информация о генофонде становится еще
происхождении, а генетическое сходство двухуда
близиться к пониманию того, кaкиe исторические
ленных популяций может стать основанием для
гипотезы о миграции. Вторая задача является уже
собственной задачей популяционной генетики:
процессы в народонаселении (в первую очередь,
изучить структуру генофонда и закономерности ее
соотношение исторических миграций и частичной
изоляции популяций) сформировали наблюдаемую
картину генофонда.
6.1. ОСНОВНЫЕ ЧЕРТЫ БАЛТО-СЛАВЯНСКОГО ГЕНОФОНДА
ОБОБЩАЮЩЕЕ ИССЛЕДОВАНИЕ
Исследования генофонда народов балто-сла
вянской лингвистической группы проводятся на
шим коллективом уже 15 лет. Пришла пора подво
дить итоги. Они опубликованы нами в статье
да всех групп славян и балтов одновременно по
трем генетическим системам: по Y-хромосоме (от
цовские линии наследования), по митохондриаль
ной ДНК (материнские линии наследования) и по
широкогеномным данным об аутосомных марке
|Кushniarevich et al., 2015) на английском языке, а
pax (где отцовские и материнские линии представ
лены равноправно). Это генетическое исследова
на русском представлены на нашем сайте (гено
фонд.рф) и в данной главе. Эти исследования по
чти с самого начала проводились совместно с Эс
целью которого было уточнение древа балто-сла
тонским биоцентром. В работе участвовали иссле
ко-статистических данных для расчета тесноты
дователи и из многих других стран, в которых сла
связилингвистической и генетической реконструк
ций балто-славянских народов.
вянские и балтские народы составляют большин
ство населения — Украины, Белоруссии, Литвы,
Хорватии, Боснии и Герцеговины. Для реконструк
ции давней истории народов, говорящих народ
ственных языках, применен междисциплинарный
подход. Прослежены пути формирования генофон
ние проведено параллельно с лингвистическим,
вянских языков и использование новейших лекси
СЛАВЯНИЗАЦИЯ ЕВРОПЫ
На балто-славянских языках говорит примерно
треть современного населения Европы, а по пло
Глава 6. Генофонд славян
196
щади балтские и славянские народы занимают око
ло половины Европы. Лингвисты сходятся во мне
нии, что балтские и славянские языки происходят
от общего корня в семье индоевропейских языков
(балто-славянский узел присутствовал уже на пер
вой реконструкции индоевропейского древа
[Schleicher, 1861]). Прото-балто-славянский язык
отделился от других индоевропейских языков в ин
тервале от 7000 до 4500 лет назад [Fortson, 2004;
Mallory, Adams, 2006; Rexová et al., 2003; Ringe et
al., 2002; Nakhlehet al., 2005; Novotná, Blažek, 2007;
Gray, Atkinson, 2003; Bouckaert et al., 2012] и про
изошло это, вероятнее всего, в Центральной Евро
пе[Bouckaert et al., 2012]. Расхождение балтской и
славянской языковых ветвей датируется временем
3500–2500 назад [Novotná, Blažek, 2007; Gray,
Atkinson, 2003; Bouckaert et al., 2012]. Дальнейшее
разделение славянских языков происходило уже
относительно недавно – 1700–1300 лет назад
[Novotná, Blažek, 2007; Gray, Atkinson, 2003;
Bouckaert et al., 2012; Birnbaum, 1975; Sussex,
Cubberley, 2006; Blažek, 2007]. С ранним средневе
ковьем (примерно 1400–1000 лет назад) связывает
ся так называемая «славянизация Европы» - период
быстрого распространения славянских языков на
огромных территориях. В Восточной Европе сла
вяне распространялись на территории, где прожи
вали балтские, финно-угорские и тюркские попу
ляции, в Западной Европе – на территории носите
лей германских языков, на Балканах – на террито
рии местных разноязыких популяций. Но как эти
изменения в культуре Европы, фиксируемые распро
странением славянских языков, повлияли на гено
фонд Европы? Иными словами, какие были основ
ные черты генетической истории балто-славянских
популяций и их взаимодействия с генофондами по
пуляций, говоривших на других языках – финно
угорских, германских, тюркских и иных?
ТРИ ЗЕРКАЛА БАЛТО-СЛАВЯНСКОГО ГЕНОФОНДА
Для максимально полного изучения балто-сла
вянских популяций использовали все три «зерка
ла» – все три генетические системы, которые на
данный момент наиболее информативны для ис
следования генофонда (рис. 6.1).
1) Y-хромосома, которая наследуется по отцовс
кой линии: изучено 6078 образцов из 62 популяций;
2) Митохондриальная ДНК (мтДНК), которая
наследуется по материнской линии: изучено 6876
образцов мтДНК из 48 популяций;
3) Широкогеномные (полногеномные) марке
ры: 1297 образцов из 16 популяций. Это полимор
фные точки (однонуклеотидного полиморфизма,
SNP), которые разбросаны по всему геному и рас
положены на аутосомах – неполовых хромосомах.
Для анализа методом ADMIXTURE использова
ны 200 тысяч SNP-маркеров, которые являются об
щими для трех использованных панелей Illumina
(610K, 650K и 660K) и несцепленными друг с дру
гом; для анализа общих фрагментов использованы
все 500 тысяч маркеров, которые являются общими
для трех использованных панелей Illumina (включая
маркеры, сцепленные друг с другом); для анализа
главных компонент и расчета генетических расстоя
ний использованы 57 тысяч маркеров, которые явля
ются общими для панелей Illumina иAffimetrix, и при
этом не сцепленными друг с другом.
по широкогеномным маркерам. Остальные данные
взяты из ранее опубликованных работ. Для сравне
ния использованы все накопленные к нынешнему
времени данные по другим генофондам Европы.
По всем трем генетическим системам были
изучены практически все современные народы,
говорящие на языках балто-славянской группы –
шестнадцать народов по единой обширной пане
ли маркеров:
балтские народы – латыши и литовцы;
восточные славяне – белорусы, русские, украинцы;
западные славяне – кашубы, поляки, словаки,
сорбы, чехи;
южные славяне – болгары, боснийцы, македон
цы, сербы, словенцы, хорваты.
Такие подробные и разносторонние данные по
какой-либо группе народов (охват всех этносов, да
еще и по всем основным генетическим системам)
являются большой редкостью в популяционных
исследованиях. Поэтому они позволяют решить не
только конкретную, но и более общую методоло
гическую задачу. Конкретная задача – это описа
ние генофонда самих славян и балтов. Общая за
дача – на их примере изучить, как связаны друг с
другом разные признаки, по которым обычно ха
рактеризуются популяции: Y-хромосомное разно
образие, митохондриальное разнообразие, полно
геномное разнообразие, лингвистическое родство,
географическое положение.
КАКИЕ ПОПУЛЯЦИИ ИЗУЧАЛИ
ВИЗУАЛИЗАЦИЯ ИТОГОВ СРАВНЕНИЯ
Значительная часть этих внушительных масси
вов данных получена впервые – 1254 образцов по
Y-хромосоме, 917 образцов по мтДНК, 70 образцов
Генетические соотношения друг с другом всех
изученных популяций, установленные в результа
те исследования, показаны на рис. 6.2.
КАКИЕ МАРКЕРЫ ИЗУЧАЛИ
197
6.1. Основные черты балто-славянского генофонда
*
}й
*
2*
4
гр
-
Вaltic speakers
East Slavic speakers
О mtDNA data
а
West Slavic speakers
South Slavic speakers
o Y-chromosomal data
~ national borders
autosomal data
Рис. 6.1. Карта изученных балто-славянских популяций.
Зеленым фоном показаны восточные славяне, розовым — западные славяне, бежевым — южные славяне, голу
бым — балтские популяции. Значки обозначают местоположение популяций, в которых собраны образцы; проана
лизированные по мтДНК (белые кружки), проанализированные по Y-хромосоме (черные точки), проанализиро
ванные по широкогеномным аутосомным маркерам (красные треугольники).
Чтобы показать относительную близость иуда
Восточные славяне — русские, белорусы и ук
ленность разных популяций на двумерном графи
раинцы — отчетливо группируются вместе. Они
Ке. В популяционной генетике традиционно исполь
зуются два метода, заимствованные из многомер
ной статистики: Метод ГлавНЫХ КОМПОНеНТ и Метод
образуют свой кластер, хотя внутри него русские,
белорусы и украинцы не перекрываются полнос
тью друг с другом. Исключение составляют север
многомерного шкалирования. По своей сути они
близки, но достоинства и недостатки их противо
далены ОТ ОстальНЫХ ВОСТОЧНЫХ СлаВЯН И ТЯГОТе
положны.
Метод
ГЛаВНЫХ КОМПОНеНТ ПОКaЗЫВаеТ
ные русские популяции, которые генетически от
ют к соседним финно-угорским популяциям.
популяций математически точно, но
теряет порой значительную часть генетической
информации, содержащейся в исходных данных.
А метод многомерного шкалирования, наоборот,
использует всю генетическую информацию, но
щены в сторону немцев и других западноевропей
ских популяций. А вот поляки наиболее близки к
восточным славянам. Фактически на графиках по
геометрические расстояния между популяциями
ляки, русские, белорусы и украинцы формируют
точками на графике могут быть несколько искаже
общий кластер, а словакии особенно чехи несколь
ны относительно рассчитанных генетических рас
ко удалены от него.
ПОЛОЖеНИе
Из западных славян чехи и в меньшей степе
НИ СЛОВаКИ ОТЛИЧaЮТСЯ ОТ ВОСТОЧНЫХ СЛаВЯН И СМе
стояний между ними. В данном случае для ауто
Южные славяне формируют на графике дис
СОМНЫХ Данных был применен метод главных ком
персную группу, которая внутренне поделена на
понент, а для Y-хромосомных имитохондриальных
данных — метод генетических расстояний.
Как видно, и по широкогеномным маркерам
западный (словенцы, хорваты и боснийцы) и вос
точный (македонцы и болгары) регионы с серба
(рис. 6.2. А), и по Y-хромосоме (рис. 6.2. Б) боль
близки к венграм (географически близкий, но не
шинство балто-славянских популяций выстраива
славянский народ), а восточная ветвь южных сла
ются вдоль оси «север-юг».
вян тоже группируется с неславянскими, но гео
ми посередине. При этом словенцы генетически
Глава б. Генофонд славян
198
|
А
Б
они
Finnic speakers
сну
н.
катно
копки
к и
ншн
у.
н
"
Кни
Volga region
катейans кат.
ты
влин
ы,
Russiaпs
North
ншн
Fн
.
ны:
slaпіать
*
-
на
Сепtral East
Europe
р
Russia
5}оны
Гмин speakers
н
ее
se
Slavs Роies
,
вы,
*
- sovie
Sops
мт диго,
м
океан:9"
*ы.
нга
с. зеве
"g"
Сzech
генепв.
-
*
пал
* South
Slaws
ош
нат
South Europe
всз.
-
South Slavs
сепапs
вng
мпт
мс
сто?Croatians
впgьн
в…".
}} *
Serbians
-
-
|
-
"-":
French
её"
*тва|капs
Gтр
*
ма, масепопlans
кпп
Rопипапе
-
spa
ин.
}
вreeks
на.
Spaniards
в
дь
веке Аю
|alпапа
ме
Finnic speakers
Вaltic
speakers
South Slays
с:
Кавказzuыans
во вые.
вое Вosnians
East Slays
в
ме
во Вplaгшsians
во Russians Сспlral (С),
son, Sorts
Сzechg
Lat }
ые инuanians
вaltic
Albanians
West Slays
speakers
апd Russians North
-
ншпgaпапs
вет
ви
}
-
или
ны
e
стан
ме
н.
кrainians
slovenians,
нга
Папея
мпт
} н
ast Slavs
eS
"
East Slavs
5*2 :
e
".* кеей
* w
**e
|
alи
ве
Slavs
*}
}
нам
я
-
-
Sые
в
Lithшапіапs
-
}
или
Europe
в,
speakers
**e }я ваніс
в
деть
В
Вaltic
п:
нинг-
North East
West Europe
}
це
-
во
н
г—
and Russians North
котеки
Fиппs
вы выgarians
cre croatians
Slovaks
Мacedonians
" мопtепegrins
se, Sorbians
sp SI
могth (м), South (5)
-
эту Slovenians
Ukraiпіапs
Non-Slavic populations
дlb
Спv
Albanians
Сhшvashes
Нng Hungarians
на
панапs North (N), Tuscany (т.
пап
Esl
Папев
Estonians
кат катанятв
конт копlis
Епg English
г
South Slays
and other Balkans
e
гиппs
3. 3]
East Slavs
9
ашла:
Мги Монмпь
огc Orkney
*}
ра Spaпатds
ce
Germans Nann (N), South (5)
Swe Swedes
G
Greeks септаp)(смасезона
теssalonк
Falopomnese
(м)т),
т.
ме
татать
Vepsa
Рис. 6.2. Генетическая структура балто-славянских популяций в сравнении с другими народами Евро
пы по трем генетическим системам:
А) по аутосомным SNP-маркерам,
Б) по Y-хромосоме,
В) по митохондриальной ДНК.
графически близкими румынами и до некоторой
степени с греками.
По мтДНК (рисунок В), как обычно, степень
структурированности генофонда выражена значи
Балтские народы — латыши и литовцы — об
наруживают генетическую близость к эстонцам,
тельно слабее, что связано с более низким филогене
говорящим на языке финно-угорской группы, и
к популяциям восточных славян (белорусам).
Оказалось также, что балтские популяции близ
ки к волжской группе финно-угорских народов
(особенно к мордве). Это может отражать исто
мтДНК. Но, хотя и не так четко выраженные, в ре
зультатах по мтДНК проглядывают те же самые за
рические события — в древности ареал балтоя
зычных популяций простирался далеко на вос
ТОК И ПОЧТИ ДОХОДИЛ ДО НЫНешнеГО ареала мок
ши и эрзи.
Важно, что все перечисленные закономернос
ТИ ВЫЯВЛеНЫ ПО НeЗаВИСИМЫМ И
НЫМ ГеНеТИЧеСКИМ СИСТе МаМ —
совершенно раз
Y-хромосоме
рокогеномным аутосомным маркерам.
и ши
тическим разрешением в имеющихся данных по
кономерности. Например, и на графике по мтДНК
большинство восточнославянских популяций пере
крываются друг с другом, северные русские отделе
ны от них, а южные славяне генетически сходны со
своими не-славяноязычными соседями по Балканам.
Сравнение степени выраженности одних и тех
же закономерностей по разным генетическим сис
темам, показывает, что Y-хромосома часто выяв
ляет закономерности более детально, чем не толь
ко мтДНК, но и более модные широкогеномные
маркеры.
199
6.1. Основные черты балто-славянского генофонда
«ПРЕДКОВЫЕ» ГЕНЕТИЧЕСКИЕ КОМПОНЕНТЫ
ПРОГРАММА АГ)МПXTURE
ШЕСТЬ ПРЕДКОВЫХ КОМПОНЕНТОВ
Чтобы сравнить популяции по составу их пред
ковых компонентов, часто используется программа
АDMIXTURE («смешение», или «состав»). Напом
ним (глава 4), что при использовании этого метода
в программу закладывают широкогеномные данные
При исследовании балто-славян мы задавали
разное число предковых популяций (графики пред
ставлены в [Кushniarevich et al., 2015]), но специ
альный тест показал, что статистически наиболее
обоснованные результаты получены в случае, ког
по большому числу популяций и задают число ги
потетических предковых популяций, из которых
сформировались все эти современные популяции.
Программа вычисляет, каков должен быть генети
да число предковых компонентов задавалось рав
ческий состав этих предковых популяций (предко
доли этих предков в ее генофонде. Понятно, что та
спектр представлен двумя цветами: синим (пред
ковый компонент k3) и голубым (предковый ком
понент k2), хотя и в разных пропорциях. Если по
смотреть на Европу в целом, то видно, что k3 (си
вых компонентов), и рисует для каждой современ
ной популяции цветной спектр, указывающий на
ным шести (К=6). В этом случае получена карти
на, показанная на рис. 6.3.
У балто-славянских популяций почти весь
кая модель достаточно условна — в реальности вряд
ний) вносит большой вклад во все европейские
ли современные генофонды сформировались в ре
зультате смешения фиксированного заданного чис
популяции и снижается от северо-востока к югу.
ла предковых популяций. Но такая упрощающая
ких популяций, превалирует у восточных славян
модель часто оказывается полезна, а выявляемые
(80—95%) и снижается у южных славян (55—70%).
Напротив, k2 (голубой) более характерен для по
предковые компоненты обычно имеют реальный
смысл, как подробно описано в главе 4.
Этот предковый компонент максимален у балтс
пуляций средиземноморского и кавказского реги
-
*
:
меамdae
East
West
*
г.
Саисавшs
South
Вalkan region
Сentral
North-East
Volga region п
и в>s = в = 2 2 22 2 2 2 2 2 2 2
3 & 3 & == 2&#:5ёёёёёё225
= = = =
в
& = 5 23 = & = & = & = = = = =
-
ёв 3 5 5 =3 }ёёёё
535 5#55 ё5 ё5 5ё 5
333 2 3 3 55 53 "ёёё"
5ё:
с
й ёёёёёёёё
ёёёё
ёё:
ё
::
=
3
ёё 5
зgE 9:3
8=
ёё
в с= о
o
-
o
та
3 вёё ёё ё =ё =
ё 3
ё
33
Е
* 3* 35 3* 9# =555 5=
Е
:
то
:
9 EE E и E
5 =
—
в
5
=
в = *
= :
=
55
= и
=
38 3 2
*
if
}
ё? ? ? ? ?
";
ге
West
South Slays
Slavs
}
East Slavs
Вalto-Slavic populations
Рис. 6.3. Анализ предковых компонентов у балто-славянских популяций (метод АDMIXTURE).
Число заданных предковых популяций k=6. На нижней панели в увеличенном масштабе показаны спектры
предковых компонентов для популяций Европы. Каждая вертикальная полоса в пределах каждого этноса — это
характеристика одного изученного индивида. Поэтому ширина, занимаемая каждым этносом, соответствует чис
лу изученных индивидов. А различия между вертикальными полосками — различия между индивидами в пределах
этноса (RussiansНGDP соответствует выборке русских неизвестного происхождения — возможно, из Вологодской
области — опубликованной в рамках проекта Нuman Genome Diversity Project).
Глава 6. Генофонд славян
200
онов и снижается к северу Европы. У южных сла
вян на него приходится примерно 30%, у запад
ных славян он снижается до 20%, а у северных рус
ских и балтских популяций – до 5%.
Видно, что у славян есть еще лимонно-желтый
цвет в предковом спектре, это компонент k5, кото
рый представлен сколько-нибудь значимо только у
восточных славян, а из них больше выражен у се
верных русских. По происхождению этот компо
нент сибирский, поскольку, как видно на графике,
он составляет основную часть спектра для попу
ляций Сибири. А вот компонент k6 (темно-жел
тый), который доминирует в Китае, Монголии и
на Алтае, у русских и других славян почти на нуле.
Это означает, что восточный след в генофонде се
верных русских связан, скорее, с древними мигра
циями из лесов и тундр Сибири, чем из степей
Центральной Азии. Темно-зеленый компонент k4
характеризует популяции Южной Азии, он распро
странен также на Ближнем Востоке и Средизем
номорье. Поэтому неудивительно, что он, пусть с
небольшой частотой, но встречается у южных сла
вян и других народов Балканского полуострова, но
почти сходит на нету западных и восточных сла
вян.
Из рассмотрения состава предковых компонен
тов следует вывод о значительном генетическом
сходстве большинства западных и восточных сла
вян на большой территории – от Польши на запа
де до европейской части России на востоке. А юж
ные славяне, географически ограниченные неболь
шим Балканским полуостровом, существенно от
личаются от западных и восточных. Но как воз
никли эти отличия?
ОБЩИЕ ФРАГМЕНТЫ В ГЕНОМАХ
МЕТОД IBD – «IDENTICAL BY DESCENT»
Для ответа на этот вопрос проведен тонкий
анализ генофонда для двух групп славян: в пер
вую вошли западные и восточные славяне (ведь они
генетически оказались очень схожи), а во вторую
– южные славяне. Сравнение проводили по нали
чию одинаковых фрагментов хромосом у людей,
происходящих из этих групп популяций. Этот ме
тод называется IBD анализ – его название проис
ходит от классического понятия популяционной ге
нетики «identical by descent», то есть поиск гене
тических фрагментов, идентичных по происхож
дению. Эти фрагменты разными людьми, предста
вителями разных популяций, унаследованы от од
ного и того же общего для них предка. Понятно,
что чуть ли не в любой популяции мира может най
тись хоть один потомок представителя западных и
восточных славян, и, наоборот, среди восточных
славян может найтись хоть один потомок чуть ли
не любого народа мира. Но это будут лишь еди
ничные совпадения – поэтому популяционная ге
нетика и изучает популяции, а не отдельных ее
представителей. Те популяции, в которых таких
совпадений найдено много, находятся действитель
но в значительном родстве друг с другом, точнее,
имеют значительное число общих предков.
Эти общие фрагменты, по сути, являются гап
лотипами, похожими на гаплотипы мтДНК и Y-хро
мосомы тем, что также имеют одного предка, но
отличными тем, что сходом времени разбиваются
рекомбинациями – обменом участками между хро
мосомами, пришедшими от отца и от матери, при
делении клетки. А гаплотипы дают возможность
датировок–зная скорость рекомбинаций, можно по
длине сохранившихся общих гаплотипов оценить,
сколько времени прошло от общих предков, то есть,
давно ли существовала общность генофондов.
ОБЩИЕ ФРАГМЕНТЫ ГЕНОМОВ «ЗАПАДНО
ВОСТОЧНЫХ» СЛАВЯН И ИХ СОСЕДЕЙ ПО
ЕВРОПЕ
Было подсчитано число общих гаплотипов
между «западно-восточными» славянами (при
шлось пользоваться этим неуклюжим термином за
неимением лучшего) и восемью другими группа
ми народов Европы (рис. 6.4):
1) южными славянами (болгары, боснийцы,
македонцы, словенцы, хорваты);
2) популяциями Западной Европы (итальянцы,
немцы, французы);
3) балтскими популяциями (латыши, литовцы)
4) популяциями Северо-Восточной Европы (за
падно-финские народы – вепсы, карелы, финны,
эстонцы);
5) популяциями Центральной Европы, ареал
которых находится между западно-восточными и
южными славянами – они условно названы «меж
ду-славянскими популяциями» (это удивительно
разноязычные популяции: гагаузы говорят на язы
ке тюркской группы алтайской языковой семьи,
венгры – на языке угорской группы уральской язы
ковой семьи, а румыны – на языке романской груп
пы);
6) греками;
7) популяциями Волжского региона и Приура
лья (башкиры, коми, мордва, татары, удмурты, чу
ваши);
8) северокавказскими популяциями (адыги,
балкарцы, ногайцы).
Если принять за некий эталон число общих
гаплотипов между западно-восточными и южны
ми славянами, то часть окружающих неславянских
популяций будет (по числу общих гаплотипов)
выше уровня этого эталона, часть ниже, а часть
равняться ему. Ниже уровня эталона (то есть име
6.1. Основные черты балто-славянского генофонда
201
ВD sharing between East-Westand South Slavs (within Slavs)
ВD sharing between East-West Slavs and their neighbors
|
ВD sharing between South Slavs andtheir neighbors
м
1.
}
.
.
} "
/
North-East
22
Europeans
(VIII)
/
".
и
Volga
"
Вalticspeakers,
Estonians
(ш)
геgтоп
(VII)
\
East-West
"---",
Slavs (I)
}
-
North
\
5Europeans
(IV)
X-"
и Caucasus
С»
/-,
гы.
|
у
region (V)
o
"
}
их
"24
" " / inter-Slavic
-—
r
* -"
Гy t Greeks .
".
*
(vi)
*
т.
с
д
- South Slavs
}
- Volga region
и Вaltic speakers, Estonians
= Нungarians,Romanians Gagauz
-
Кarels.Vepsa
West Europeans
3
Greeks
North Caucasus
Russians from Northern region
e
>=
}
|—
3
(от
а в
ав?
(225,
25з
(зз5
зви
а из
455
в оп
|ВD segment length, cМ
Рис. 6.4. Схема и результаты анализа общих фрагментов генома (ПВD).
Вверху: схематическое представление групп популяций, использованных в анализе ПВD (подсчет числа общих
фрагментов генома). Внизу: графики среднего числа общих фрагментов генома (ПВD сегментов) между группами
западно-восточных славян и их географическими соседями (северные русские рассматриваются отдельно от груп
пы популяций северо-востока Европы). По оси Х показано 10 классов ПВD сегментов по их длине (в сантиморга
нидах, cМ). По оси Y показано среднее число общих фрагментов для пары индивидов в пределах каждого класса.
Глава 6. Генофонд славян
202
ют меньшее родство с западно-восточными славя
нами, чем южные славяне) оказались народы По
волжья, Западной Европы, Кавказа, а также греки
(рис. 6.4.).
Казалось бы, можно говорить о большем род
стве славянских генофондов друг с другом, чем с
окружающими неславянскими народами. Отчасти
это так, но не все так просто – в два раза выше
уровня эталона оказалось родство генофондов бал
тов и популяций северо-восточной Европы (веп
сы, карелы, финны, латыши, литовцы, северные
русские, эстонцы).
Можно впасть в противоположную крайность
и считать, что «западно-восточные» славяне гене
тически родственны не южным славянам, а только
своим географическим соседям, вероятно, за счет
ассимиляции родственных им народов. Но карти
ну дополнительно осложняет то, что с народами,
живущими сейчас на территориях посередине меж
ду«западно-восточными» и южными славянами –
то есть с венграми, румынами и гагаузами – уза
падно-восточных славян число общих фрагментов
генома такое же, что и с южными славянами (эти
«между-славянские» популяции находятся на уров
не эталона).
ОБЩИЕ ФРАГМЕНТЫ ГЕНОМОВ ЮЖНЫХ СЛАВЯН
И ИХ СОСЕДЕЙ ПО ЕВРОПЕ
Поэтому был проведен еще один аналогичный
анализ, но теперь в центр рассмотрения поставле
ны южные славяне. Сравнивалось число общих
генетических фрагментов у них и окружающих
групп популяций. Оказалось, что число общих
фрагментову южных славянс «западно-восточны
ми» славянами примерно такое же, что и число их
общих фрагментов с «между-славянскими» попу
ляциями (гагаузы, венгры, румыны). А вотчисло
общих фрагментов с географически соседними
греками значительно меньше.
Но учтем и географию. «Западно-восточные»
славяне географически расположены дальше от
южных славян, чем «между-славянские», поэтому
с точки зрения географии число общих фрагмен
тов с «западно-восточными» славянами должно
было бы быть меньше. А раз это не так, значитязы
ковое родство «западно-восточных» и южных сла
вян отчасти проявляется и при этом анализе об
щих фрагментов генома.
Тем более что, хотя общие фрагменты генома,
найденные между двумя группами славян, и раз
нятся подлине, но фрагментов длиной около 2–3
сантиморганид чуть больше, чем других. А имен
но такой длины фрагменты и должны были сохра
ниться со времени славянской экспансии второй
половины I тысячелетия н.э.
ВЫВОД: ОБЩИЕ ФРАГМЕНТЫ ГЕНОМА У СЛАВЯН
ЕСТЬ, НО ИХ ДОЛЯ НЕВЕЛИКА
Эти результаты по славянам, из которых нельзя
сделать однозначных выводов, следует сравнить с
недавним похожим исследованием тюркоязычных
популяций [Yunusbaev et al., 2015]. Казалось бы, в
обоих случаях идет быстрое распространение но
сителей языков (соответственно, тюркских или же
славянских) по обширным территориям, которое
не может не сопровождаться ассимиляцией мест
ного (дотюркского или же дославянского) населе
ния. Но в случае с тюрками метод анализа общих
фрагментов выявил – пусть очень небольшой компонент генома, который тюрки принесли со
своей вероятной алтайской прародины. А в случае
славян картина оказалась гораздо более сложной.
Возможно, это связано с тем, что тюрки в ходе рас
селения часто ассимилировали генетически резко
отличные от них и друг от друга популяции, а сла
вяне распространялись по территории Европы с ее
относительно гомогенным генофондом, и часть ас
симилированных ими популяций была генетичес
ки родственна, по крайней мере, балтским груп
пам.
В целом, из этого анализа общих фрагментов
генома можно сделать два вывода. Прежде всего,
явно видны результаты смешения генофонда запад
но-восточных славян с другими популяциями се
верной части Восточной Европы. Во-вторых –
пусть и далеко не столь выразительно – видна и
несколько большая степень родства западно-вос
точных и южных славян друг с другом, чем можно
было бы ожидать, исходя просто из географичес
кого расстояния между ними.
ДРЕВО СЛАВЯНСКИХ ЯЗЫКОВ И ЕГО ПРОЕКЦИЯ НА ГЕНОФОНД
РЕКОНСТРУКЦИЯ ДЕРЕВА ЯЗЫКОВ
Лексикостатистика занимается выявлением
скорости языковых изменений, определением вре
мени разделения языков и степени родства между
ними. Исходным материалом послужили лексичес
кие списки (списки Сводеша) 20 современных бал
то-славянских языков и диалектов. Эти списки
были перепроверены и уточнены член-корр. РАН
А.В. Дыбо и д.б.н. А.С. Касьяном, что позволило
им получить уточненное древородства балто-сла
вянских языков (рис. 6.5.).
После разделения балтской и славянской вет
вейсамая первая развилка на славянской ветви ока
залась тройной – разделение славян на западную,
восточную и южную ветви – и датированной око
203
6.1. Основные черты балто-славянского генофонда
500
-- ВС 0 дD —-
500
1000
1500
2000
белорусский
—с
украинский
русский
словацкий
г— верхнелужицкий
I- нижнелужицкий
кашубский
сербско-хорватский
н
болгарский
македонский
литовский
латышский
|
2500
2000
1500
1000
500
-- YВР 0
Рис. 6.5. Деревородства балто-славянских языков.
Дерево построено путем сочетания нескольких методов (StarlingNJ, NJ. ВioNJ, UPGМА, ВayesianМСМС, UМР).
Тройные узлы образованы путем объединения соседних двойных узлов, если временное расстояние между ними
было < 300 лет.
ло 1900 лет назад. Дальнейшее разделение сла
вянских языков началось в V—VI веках (около 1300
1500 лет назад): восточная ветвь разделилась на
русский иукраинский/белорусский, западная ветвь
— на чешско/словацкий, протосорбсколужицкий и
польский/кашубский, южная ветвь — на сербско
хорватский, болгарский, македонский. Выделение
современных языков произошло 1000—500 лет на
зад. Такая датировка дерева соответствует истори
ческим и археологическим данным, которые гово
рят о быстром распространении славян по Европе
во второй половине 1-го тысячелетия н.э.
ГЕНЕТИЧЕСКОЕ РАЗНООБРАЗИЕ НА РАЗНЫХ
УРОВНЯХ ЛИНГВИСТИЧЕСКОГО ДРЕВА
Далее, частоты во всех этих популяциях одно
го народа были усреднены и получены среднеэт
нические частоты гаплогрупп Y-хромосомы. А за
тем были рассчитаны генетические различия меж
ду этими среднеэтническими характеристиками
народов в пределах каждой ветви славянских язы
ков. Эти различия оказались не совсем одинако
выми для разных ветвей: например, для западных
славян различия больше, чем для восточных, но
это и можно было ожидать, глядя на графики их
генетических взаимоотношений. Однако в среднем
различия между этносами оказались в три раза
больше — 0,03.
Наконец, были рассчитаны средние частоты
гаплогрупп для трех ветвей славянских языков —
западных, восточных и южных — и различия меж
Поскольку лингвистическое дерево славянских
языков имеет столь четкую и надежно реконстру
ированную структуру, появилась возможность про
анализировать, как распределено по этому дереву
генетическое разнообразие славянских популяций,
оцененное по частотам гаплогрупп Y-хромосомы.
Этот анализ проведен с помощью стандартного
метода АМОVА.
дy ними возросли еще в два раза — до 0,06.
Согласно принципу эквидистантности, разра
ботанному отечественной школой геногеографии,
если система популяций развивается сама по себе,
без больших внешних влияний, то постепенное
разделение популяций приводит к линейному на
коплению и лингвистического, и генетического
разнообразия. В результате генетическое разнооб
Оказалось, что генетические различия между
разие примерно одинаково на всех уровнях — что
популяциями, говорящими на одном и том же язы
между популяциями одного народа, что между эт
ке, хотя и варьируют от почти нулевых значений
носами одной ветви, что между разными ветвями
(для говорящих на чешском или македонском) до
значения 0,05 (для говорящих на северных диа
лектах русского языка), в среднем составили толь
(их усредненными характеристиками). Действи
ко 0,01.
тельно, ведь предки разных групп славян некогда
были лишь близкими друг к другу популяциями
одного народа, и их языки отличались не больше,
204
Глава 6. Генофонд славян
чем сейчас отличаются диалекты одного языка. А
РОДСТВО ИЛИ СОСЕДСТВО?
усредняя частоты по всем современным популя
циям ветви, мы находим ее центр тяжести, точку
происхождения, реконструируем генофонд этой
предковой популяции.
Но все это, как сказано выше, работает лишь
тогда, когда популяции предоставлены самим
себе и мало взаимодействуют с соседями. Одна
Сравнить роли, которые сыграли география и
языки в формировании генетического разнообра
зия балто-славянских популяций, можно с помо
щью теста Мантеля. География играет двойную
роль. Конечно — это фактор географического со
седства, который сближает генофонды через сме
ко для славян величины генетического разнооб
шанные браки между соседями. Но с другой сто
разия на разных иерархических уровнях не оди
роны, география может отражать и происхождение,
наковы: при эквидистантности они должны быть
0,03, 0,03, 0,03, а они резко различаются — 0,06,
когда родственные народы не уходят далеко друг
0,03, 0,01. Это говорит о том, что популяции сла
ми народами. А то, что наибольшая изменчи
Языки — это фактор изначальногородства генофон
дов или частей генофондов, унаследованных от
общих предков вместе с общим языком (или унас
вость приходится на самый древний уровень
ледованных без языка, если язык сменили, а гено
(различия между тремя ветвями славянских язы
ков) указывает, что эти взаимодействия были
фонд остался почти прежним).
вян как раз активно смешивались с окружающи
особенно сильными на ранних этапах истории
славянских популяций.
от друга, а расселяются на соседние территории.
Тест был независимо проведен для трех генети
ческих систем: Y-хромосома, мтДНК и аутосомные
маркеры. Все три варианта теста показали чрезвы
Таблица 6.1. Анализ молекулярной изменчивости (АМОVA) в балто-славянских популяциях
Лингвистическая классификация
Разнообразие
Между
Между
Между локальными
Внутри
группами
ЭТНИЧеСКИМИ
популяциями,
ЛОкальных
(ветвями)
популяциями в
пределах групп
говорящими на одном
популяций
5,93
3,53
1,2
89.34
6,54
3,64
1,6
88.22
языке
Дерево языков
1 — балты: латыши, литовцы,
2 — восточные славяне: белорусы, русские,
А.
украинцы,
3 — южные славяне: македонцы, болгары,
носители сербско-хорватских языков
(хорваты, сербы, боснийцы);
4 — западные славяне: чехи, поляки, кашубы,
словаки, сорбы.
Дерево с диалектами
1 — балты: латыши, литовцы,
2 — восточные славяне: белорусы, русские
Большое Давыдовское, русские Смехново,
русские Архангельск, украинцы Тисив,
украинцы литературный;
3 — южные славяне: македонцы, болгары,
носители сербско-хорватских языков
(хорваты, сербы, боснийцы);
4 — западные славяне: чехи, поляки, кашубы,
словаки, сорбы.
В.
Примечания: Локальные популяции были сгруппированы по их языкам (или диалектам), которые были затем
объединены в 4 группы, в соответствии с лингвистической классификацией. Состав этих групп указан в первом
столбце таблицы. Для вычисления разнообразия на первом иерархическом уровне (локальные популяции в преде
лах языка) включали только языки с двумя и более изученными локальными популяциями. Поэтому латыши,
сорбы и словаки, представленные только одной популяцией, не включались в этот анализ. Для вычисления на
втором уровне рассчитывали разнообразие между среднеэтническими частотами в пределах каждой из четырех
ветвей, а на третьем уровне эти среднеэтнические частоты усреднялись в частоты по лингвистическим ветвям и
рассчитывалось разнообразие между ветвями.
Анализ был выполнен в двух вариантах: в первом популяции на первом уровне были объединены в пределах
языка, во втором — в пределах диалекта.
6.1. Основные черты балто-славянского генофонда
205
Таблица 6.2. Тест Мантеля для генетических, лексикостатистических и географических расстояний
Тип корреляции
Параметры корреляции
парная корреляция
Генетические и
лингвистические
Генетические и
географические
парная корреляция
частная корреляция
частная корреляция
Аутосомные данные
данные
Y-хромосомные
Данные мтДНК
0.78*
0.946*
0.76*
0.924*
0.741*
0.801*
лингвистические
постоянной
географии)
(при
0,171
0,137
0.298*
Генетические и
географические
постоянном
языке)
(при
0.861*
0.812*
0.525*
Генетические и
Примечание: * – статистически достоверный коэффициент корреляции (p-level < 0.05).
чайно высокую корреляцию между генетикой и гео
графическим положением популяций (0,80–0,95).
Но очень высокая корреляция обнаружена и между
генетикой и лингвистикой (0,74–0,78).
Поскольку лингвистические показатели сами
по себе высоко коррелируют с географией, рас
смотрели частную корреляцию, чтобы различить
прямое и непрямое влияние географии на две дру
гие системы. При исключении географического
фактора, частная корреляция с лингвистикой ста
ла намного ниже (0,3 для мтДНК и 0,2 для осталь
ных двух систем), в то время как для всех трех ге
нетических систем корреляция с географией при
исключении фактора лингвистики, осталась боль
шой (0,5 для мтДНК и 0,8 для остальных двух си
стем). Это указывает на то, что связь с географи
ческим фактором – основная, а высокая связь с
лингвистикой часто определяется тем, что наро
ды, говорящие народственных языках, являются
и географическими соседями.
СИНТЕЗ
ПЯТЬ СИСТЕМ ПРИЗНАКОВ
СВЯЗЬ КАЖДОЙ СИСТЕМЫ ДРУГ С ДРУГОМ
В генетических работах на каждом шагу встре
чается слово «анализ», и очень редко – «синтез».
Что же означает «синтез» для исследования сла
вянского генофонда?
Сравнение результатов генетических и лингви
стических реконструкций с географией изучаемых
популяций является традицией в популяционной
генетике [Cavalli-Sforza et al., 1994; Рычков, Ящук
(Балановская), 1980, 1983, 1985]. Уже говорилось
о том, что проведенное исследование уникально
тем, что одни и те же популяции (все современные
народы балто-славянской лингвистической груп
пы) были охарактеризованы по пяти системам:
трем генетическим системам («широкогеномные»
аутосомные данные, Y-хромосома, мтДНК), по
лингвистической (лексикостатистической) систе
ме признаков и по их географическому положению.
Тем самым впервые в мире появилась – наприме
ре балто-славянских популяций – возможность
оценить скоррелированность всех пяти систем друг
с другом. Это позволило напримере славян посмот
реть, как связаны между собой три разные генети
ческие системы, лингвистика и география – и син
тезировать эти разнородные данные в общие вы
воды.
Материалом сравнения пяти систем послужи
ли пять матриц расстояний, рассчитанных для од
ного и того же набора балто-славянских популя
ций по каждой системе. Далее с помощью теста
Мантеля были рассчитаны попарные корреляции
этих матриц друг с другом и получена матрица 5х5
корреляций (сходства) пяти систем друг с другом.
Корреляции всех пяти систем (трех генетических,
лингвистической и географической) друг с другом
показаны на рис. 6.6.
Бросается в глаза очень высокое сходство всех
пяти систем: ни один из коэффициентов корреля
ции не опускается ниже 0,68 – то есть фактически
0,7, что считается в популяционной генетике очень
высокой корреляцией. А самые высокие коэффи
циенты почти достигают максимально возможно
го потолка (корреляция 0,95). Особенно удивитель
ное соответствие обнаружено для Y-хромосомных
и аутосомных маркеров и географического поло
жения. Можно сказать, что эти три характеристи
ки балто-славянских популяций образуют взаимо
связанную триаду (коэффициенты корреляции
выше 0,9, темно-рыжий цвет на рис. 6.6 вверху).
Далее эта матрица сходства была преобразова
на в матрицу расстояний (бралась обратная вели
чина сходства). Полученная матрица расстояний
206
Глава б. Генофонд славян
Аutosomes
0.95
*
о э2
chromosome
0.93
|-
0.80
|-
-
mtDNA
0.80
0.70
0.68
0.70
Linguistics
0.79
0.78
0.76
0.74
Geography
Autosomes
Y-
mtDNA
0.60
chromosome
Стресс = 0,00000
1.4
т
1.2 1.о
мтДнк
-
0.8 |
0,6
|
*
*
сч
Ф.
= 0.4
*
*
*
ё
5
лексикостатистика
0,2
*
0,0
география
-0,2
*
полногеномные маркеры
-0.4
-0,6 |-
-
Y-хромосома
*
9
-0.3 -
.
-1.0
-0.8
-0. б.
-0.4
-0,2
о о
н
-
-
0,2
0,4
0,6
0,8
и
и
1.0
1.2
1.4
1.6
1.8
Измерение 1
Рис. 6.6. Взаимосвязь изменчивости пяти систем признаков (Y-хромосома, мтДНК, полногеномные мар
керы, география, лексикостатистика) в балто-славянских популяциях. Вверху: коэффициенты корреляции
(столбец справа — цветовые обозначения интервалов коэффициентов корреляции). Внизу: график многомерного
шкалирования на основе этих
корреляций.
была визуализирована методом многомерного шка
раллельном анализе разных систем признаков; во
лирования (рис. 6.6 внизу). Этот график наглядно
вторых, в безусловном доверии лишь тем законо
мерностям, которые выявляются не по какой-то
одной системе, а по большинству систем; в-треть
показывает тот же вывод о триаде особенно сход
ных систем: «аутосомная» реконструкция генофон
да, «Y-хромосомная» реконструкция и географи
ческое положение популяций. Остальные две сис
темы — лингвистические характеристики и мтДНК
— на графике отдалены, то есть рисуют чуть отли
чающиеся версии популяционной структуры.
ПОЛИСИСТЕМНЫЙ ПОДХОД
Соответствие результатов по разным системам
признаков подтверждает надежность таких резуль
татов. Оно также указывает на перспективность
полисистемного подхода. Этот подход (Балановс
кая, Балановский, 2007) состоит, во-первых, в па
их, во внимательном рассмотрении случаев, когда
какая-то система выбивается из общего паттерна.
В исследовании балто-славянского генофонда мы
широко использовали полисистемный подход фор
мулируя утверждения о генетическом сходстве или
различии тех или иных народов, каждый раз про
веряли, подтверждаются ли они по большинству
использованных систем. А то, что из общего пат
терна выбивается лингвистика, послужило одним
из аргументов в пользу гипотезы преобладания
субстрата.
Такой паттерн почти полного совпадения трех
генетических систем друг с другом, их совпаде
207
6.1. Основные черты балто-славянского генофонда
ния и с географией, но лишь частичного сходства
с лингвистикой может служить маяком и для буду
щих исследований генофондов других регионов
мира. В то же время этот паттерн не универсален
для всего мира: для популяций с контрастным про
исхождением мужской и женской частей популя
ции данные по Y-хромосоме и мтДНК могут силь
но различаться (что показано, например, в статье
|Оuintano-Murci et al., 2008)), а для популяций, в
которых процессы постепенного роста и дробле
ния преобладали надметисацией, генетика может
быть больше скоррелирована с лингвистикой, чем
с географией (что показано, например, в статье
|Ваlanovsky et al., 2011).
Таким образом, хотя нет указаний на универ
«Центрально-восточноевропейский субстрат» при
няли в себя западные и восточные славяне (этот
субстратможно охарактеризовать различными спо
собами — например, на спектре предковых компо
нентов он выражается синим цветом, а в данных
по Y-хромосоме эти популяции несут высокие ча
стоты гаплогруппы R1a). Другой, «южно-восточ
ноевропейский субстрат», впитали в себя южные
славяне (это голубой цвет в спектре предковых
компонентов, а особенностью Y-хромосомного ге
нофонда являются высокие частоты гаплогруппы
I2a).
В пользу этого вывода о важности субстрата в
формировании генофонда славян говорят три ар
гумента.
сальность выявленного паттерна для всех регио
Во-первых, тот факт, что объединенная группа
нов мира, можно предполагать, что выявленная для
ЗападныX И ВОСТОЧНЫХ СлаВЯН Имеет Меньшее ЧИС
славянских популяций триада систем признаков
окажется тесно связанной друг с другом и для дру
гих групп народонаселения Европы. Положение
лингвистической реконструкции, как будет рас
ло общих фрагментов генома с южными славяна
ми, чем с популяциями северо-восточной Европы,
смотрено в главе 7 (раздел 7.5) зависит от истории
народонаселения исследуемого региона (преобла
дание дифференциации одной общей прапопуля
включая балтские и финно-угорские народы. Осо
бая генетическая близость финно-угров с балтами
видна и на графиках главных компонент, и на гра
фиках многомерного шкалирования. А как раз на
роды балтской и финно-угорской языковых групп
ции или же преобладание экспансии с генетичес
кой ассимиляцией предшествующего населения,
и были расселены натой части Восточно-Европей
ской равнины, которая потом вошла в ареал сла
перешедшего на язык пришлого населения) и от
вян.
того, насколько оба «зеркала» — лингвистическое
и генетическое — будут «незамутненными».
Положение реконструкции по митохондриаль
ному геному будет зависеть от характера брачных
важную роль субстрата, поскольку генетическое
разнообразие между разными ветвями славян на
много превышает разнообразие внутри ветвей, та
Во-вторых, тест АМОVА также указывает на
связей (интенсивности и широты ареала переме
щения женщин при брачной миграции) и отчетко
кая картина и должна была сформироваться, если
сти генетического зеркала мтДНК. Его четкость
будет значительно повышаться при переходе кана
лизу полных геномов мтДНК, однако из-за того,
что размер мтДНК невелик по сравнению с ядер
генетически различные популяции.
ным геномом, эта четкость в пределе все равно
общее происхождение, фиксированное в языке, не
могло не сказаться и на сходстве генофондов, даже
значительно ниже, чем Y-хромосомы. При этом
показательна максимальная близость реконструк
ции по аутосомным маркерам и географическому
восточные и южные ветви славян ассимилировали
В-третьих, преобладающая роль географии в
формировании генофонда славян говорит о том же.
Ведь если бы включения субстрата не было, то
когда какие-то группы славян мигрировали на да
соседству популяций.
Можно предполагать, что в общем случае сте
лекое расстояние от своих родственников. Но та
кой роли лингвистического родства выявлено не
было. И напротив генетическое сходство между
пень «исторической» информативности генетичес
дославянскими популяциями, жившими на терри
ких маркеров будет зависеть от степени их межпо
пуляционной изменчивости и следовать такой при
оритетности: Y-хромосома, аутосомный геном,
митохондриальная ДНК.
тории половины Европы, должно было быть при
мерно пропорционально географическим рассто
яниям между ними, но никак не связанным с язы
ковым родством между славянскими группами,
которые потом пришли на эти земли. Тогда, если в
ДВА СУБСТРАТА В СЛАВЯНСКИХ ГЕНОФОНДАХ
Распространяясь по Европе, славяне должны
были ассимилировать местные популяции, которые
современных славянских генофондах преоблада
ет субстрат, то и сходство этих генофондов долж
но следовать географическим расстояниям. Что и
было выявлено.
жили на данных территориях в дославянские вре
мена. Это тот генетический субстрат, который они
ИСТОРИЯ СЛАВЯНСКИХ ГЕНОФОНДОВ: ИТОГИ
впитали в себя, и этот субстрат различается на раз
ных территориях. Судя по описанным выше резуль
татам, можно выделить два основных субстрата.
Итак,
для генетического изучения славянис
ПОЛЬЗОВаНЫ
обширные генетические данные и воз
208
Глава 6. Генофонд славян
можность синтеза разных наук. Какие же выводы
позволил сделать такой синтез?
Прежде всего, это преобладание в славянских
популяциях дославянского субстрата — двух асси
милированных ими генетических компонентов —
центрально-восточноевропейского для западных и
восточных славян и южно-восточноевропейского
ДЛЯ ЮЖНЫХ СлаВЯН.
Но, несмотря на то, что в генофонде западных
и восточных славян великассимилированный ком
понент их соседей по Восточно-Европейской рав
нине, эти славянские популяции формируют гене
тически довольно целостную группу, отличающу
юся как от своих западных соседей (германоязыч
ных популяций), так и от соседей восточных и се
верных (финно-угорских народов). Конечно, из
этого правила можно найти пару исключений, но
они сосредоточены на периферии ареала западных
внутри славянского ареала, сцементировали запад
ных и восточных славян в единую генетическую
общность.
Можно с осторожностью предположить, что
ассимилированный субстратмог быть представлен
по преимуществу балтоязычными популяциями.
Действительно, археологические данные указыва
ют на очень широкое распространение балтских
групп перед началом расселения славян. Балтский
субстрату славян (правда, наряду с финно-угорс
ким) выявляли и антропологи. Полученные нами
генетические данные — и на графиках генетичес
ких взаимоотношений, и по доле общих фрагмен
тов генома — указывают, что современные балтс
кие народы являются ближайшими генетически
ми соседями восточных славян. При этом балты
являются и лингвистически ближайшими род
ственниками славян. И можно полагать, что к мо
генофонда чехов есть определенное генетическое
менту ассимиляции их генофонд не так сильно
отличался от генофонда начавших свое широкое
сходство с их немецкими соседями на Западе. Од
расселение славян. Поэтому если предположить,
нако другие западнославянские популяции (поля
ки и сорбы) генетически четко отделяются от сво
их соседей-немцев. Аналогично, на другом конце
что расселяющиеся на восток славяне ассимили
и восточных славян. Например, у своеобразного
ровали по преимуществу балтов, это может объяс
нить и сходство современных славянских и балтс
славянского ареала, северные русские имеют ярко
ких народов друг с другом, и их отличия от окру
выраженное сходство с финно-угорскими и балтс
кими популяциями, но такого явного сходства не
жающих их не балто-славянских групп Европы.
Что же касается южных славян, то история их
наблюдается для центральных или южных русских,
генофонда могла протекать схожим образом, хотя
не говоря уже о других славянских народах.
и НеЗаВИСИМО ОТ ЗападныX И ВОСТОЧНЫХ СлаВЯН.
Поэтому можно предполагать, что после того,
как прошел основной этап распространения сла
вянских языков и ассимиляции дославянского суб
часть дославянского населения Балкан, которая
страта, началось формирование местных особен
ностей генофонда. Оно протекало по-разному для
разных частей обширного ареала западных и вос
точных славян, но изначальное родство (общий
субстрат плюс общий славянский суперстрат) и,
вероятно, интенсивный последующий обмен генов
Южные славяне ассимилировали значительную
обладала иным генофондом, чем ассимилирован
НОе ВОСТОЧНЫМИ И Западными Славянами населе
ние Восточно-Европейской равнины. Потому юж
нославянские популяции и обнаруживают большее
сходство с неславянскими популяциями Балкан
(румынами и венграми), чем с другими славянски
ми народами.
6.2. ОТДЕЛЬНЫЕ ЧЕРТЫ ГЕНОФОНДА ВОСТОЧНЫХ СЛАВЯН
Изложенные в предыдущем разделе результа
ВЫБОРКИ, ИЗУЧЕННЫЕ ПО мтДНК
ты изучения генофонда славян являются обобща
ющими в обоих смыслах — и итоговыми, и порой
слишком общими. Чтобы уравновесить эту неко
В ходе работы, потребовавшей многих лет и
неоднократных экспедиций, нами созданы уни
торую отвлеченность и лаконичность предыдуще
кальные по объему и географическому охвату кол
гораздела, в этом разделе я опишу ряд подробнос
лекции биологических образцов от коренного на
селения - русских, украинцев и белорусов, причем
собранных и проанализированных строго по еди
тей — особенности тех или иных славянских гено
фондов. Эти результаты получены в разные годы
и по разным маркерам. Поэтому не стоит на них
ной технологии. Экспериментальный анализ ми
основывать глобальные выводы о генетической
тохондриальной ДНК и Y-хромосомы в созданных
ДНК коллекциях выполнен во многом при поддер
истории славян — для этого есть предыдущий раз
дел. Но их можно использовать для уточнения тех
жке Российского фонда фундаментальных иссле
или иных частных вопросов, а также для прида
дований, Российского гуманитарного научного
ния объемности уже обрисованному генетическо
фонда, международного проекта «Genographic» и
благодаря сотрудничеству с Эстонским биоцент
му профилю славян.
209
6.2. Отдельные черты генофонда восточных славян
ром. Это позволило сделать генофонды восточнос
дедушки и обе бабушки которых родились на тер
лавянских народов одними из наиболее подробно
ритории данного изучаемого региона и относили
изученных этнических генофондов мира.
себя к данному народу. Этот принцип «анкетиро
По мтДНК исследованы тринадцать русских,
пять украинских и пять белорусских популяций. В
таблице 1.6 приведена характеристика изученных
вания до третьего поколения» в последние годы
популяций. В ней (и в последующем анализе) две
популяции из Западной Украины рассматривают
ся суммарно: увеличение объема выборки обеспе
чивает более высокую статистическую достовер
стал общепринятым в мировой науке, а нашим кол
лективом применялся, начиная с наших первых же
экспедиций на Кавказе в 90° годах. Также в обсле
дование не включались родственники (как мини
мум до второй степени родства) — их заведомое
генетическое сходство могло бы сместить и иска
ность результатов. Суммарно проанализирована
зить получаемые генетические характеристики
изменчивость мтДНК у 22 восточнославянских
популяций, причем общий объем собственных дан
ных составил N=2396 образцов.
популяции. Во всех популяциях проводился забор
венозной крови, который всегда сопровождался
Эта внушительная выборка была дополнитель
но расширена за счет привлечения опубликован
ных данных других авторов. Сравнительно с объе
мами нашего исследования их немного - суммар
но 360 образцов. Это данные по двум северным
русским популяциям (Вelyaeva et al., 2003; Тonks
et al., 2006), по населению Ростовской области
|Коrnienko et al., 2004: Richards et al., 2000) и бело
письменным информированным согласием.
Столь строгие требования к сбору первоначаль
ного биологического материала потребовали значи
тельных и постоянных усилий для организации и
проведения множества экспедиций, которые для во
сточных славян начались в 2000 году и проводятся
нашим коллективом ежегодно по настоящее время.
СПЕКТР ГАПЛОГРУПП мтДНК У ВОСТОЧНЫХ
славян
русам Бобруйска (Веharet al., 2006). В работах Б.А.
Малярчука также проанализировано около 500
образцов из различных областей европейской час
ти России, но, к сожалению, стратегия формиро
вания этих выборок (анкетирование лишь по ро
Большинство гаплогрупп мтДНК у восточнос
лавянских народов принято объединять в два клас
банда) делает их несопоставимыми с нашими дан
ными. По сходным причинам мы не рассматрива
са: восточно-eвразийские гаплогруппы (наиболее
распространенные у народов Восточной Азии и
Сибири) и западно-евразийские (свойственные
народам Европы, Передней и Южной Азии).
ем и 101 образец, опубликованный в работе В.А.
Орехова (Оrekhov et al., 1999). То же относится и к
данным из работы (Моrozova et al., 2011). Две дру
При этом восточные славяне целиком относят
ся к западному кругу популяций, поскольку запад
но-eвразийские гаплогруппы составляют подавля
дителям или даже по месту рождения самого про
гие имеющиеся в литературе небольшие выборки
ющее большинство в их генофонде, а суммарная
(русские Магадана — 50 образцов, и русские Баш
кирии — 83 образца) не включены в наше исследо
доля восточно-eвразийских гаплогрупп не дости
гает даже двух процентов. В пределах западно-ев
разийских популяций по спектру гаплогрупп мож
вание, поскольку представляют русские популяции,
проживающие за пределами исторического русско
но выделить две основных региональных группы
го ареала. С учетом используемых литературных
— переднеазиатские и европейские народы (см.,
например, (Нааk et al., 2010)). При таком делении
данных общая анализируемая выборка по восточ
ным славянам составляетN=2756 образцов. Таким
образом, работа основана преимущественно на
восточные славяне полностью примыкают к гено
фонду европейских популяций (что, например,
видно из невысокой частоты типично «переднеа
собственных результатах (90% от суммарной ана
лизируемой выборки).
зиатской» гаплогруппы J). Далее в пределах Евро
Принципиальной особенностью анализируемо
го материала является не столько его объем, сколько
информативно, поскольку все европейские наро
пы простое рассмотрение частот гаплогрупп не
качество сформированных выборок и их геогра
фия. Для выявления географической структуриро
ванности восточнославянского генофонда было
ды практически идентичны по спектру и очень
необходимо охватить всю обширную территорию
расселения восточных славян, для чего требуется
анализ многочисленных популяций. Исследование
пы была даже предметом специальных публика
ций (Richards et al., 2002; Simoni et al., 2000) и под
робно рассмотрена в главе 3.
похожи по частотам гаплогрупп мтДНК. Такая го
могенность митохондриального генофонда Евро
проведено в пределах исторического ареала вос
точнославянских народов. Та же цель — выявить
не сиюминутный портрет генофонда, а его исто
ГЕНЕТИЧЕСКИЕ ВЗАИМООТНОШЕНИЯ МЕЖДУ
ВОСТОЧНЫМИ СЛАВЯНАМИ И ИХ СОСЕДЯМИ ПО
мтДНК
рически устойчивые черты — определила и подход
к формированию выборок. В обследование вклю
Применение базы данных МURКА, содержа
чались только те представители популяций, оба
щей как наши собственные данные, так и практи
21 ()
Глава б. Генофонд славян
о русские
Волго-уральский регион (финно-угры,татары, чуваши)
о белорусы
о западные финно-угры
o западные славяне и балты
украинцы
С северные русские
Балканский регион
2,5
северная осетия
2,0 +
1,5 +
белорусы Бреста
1,с
белорусы Светлогорска
oo
ВОСТОЧНО
-
белорусы Гомеля
=
=
-
румыны
=
*_*
нит
-
ЕВРОПЕИСКИИ
казанскиетатары " ~ белорусы витебска
5
терские казаки" о*
0,
украинцы Белгорода
украинцы черкас -
татары
чуваши
в}
o
латыши
мари
-
М
татары-мишари
чуваши сумм
-0,5
-
o
татары \
0,0 +
ме
e
южные румыны
o
*ь
o
-
-
2-
ст o
" - О мордва
и-
вын
татары-кряшены
- - - - - - -
приурал bСКИИ нерывное
о русские ошевенск
С русские поморы
м
узрелы о
о
С русские пинеги
-1,0
л
чл
ми
СЕВЕРОЕВРОПЕИСКИИ
О коми сумм
-1,5
o
-2,0
-
-3,0
-
-2,5
—
-2,0
-
-1,5
—
-1,0
—
-0,5
финны
—
0,0
0,5
1,0
-
1,5
—
|
2,0
2,5
Рис. 6.7. Структура митохондриального генофонда восточных славян и их соседей. График многомерного
шкалирования.
чески всю опубликованную информацию по ми
тохондриальным генофондам народов Европы,
стер вошли западные и восточные славяне, а так
же народы Балканского региона. В этот же клас
позволило получить четкую картину их генетичес
тер вошли и татары-кряшены — они генетически
ких взаимоотношений (рис. 6.7). При построении
этого графика избегали его чрезмерной перегруз
удалены от всех других изученных нами популя
основным кластерам: Приуральскому, Восточно
ций татар, но приближены к русским, что, возмож
но, является результатом смешанных браков седи
новерным русским населением. В Северно-Евро
пейский кластер вошли западные финно-угорские
народы и северные русские. Из народов Кавказа
два народа, не принадлежащие к северокавказской
языковой семье (представители индоевропейской
семьи на Кавказе: осетины и армяне) в целом близ
ки к восточно-европейскому кластеру, но народы
северокавказской языковой семьи оказались бли
Европейскому и Северно-Европейскому. Условные
границы (пунктирные линии) на рис. 6.7 показы
же к народам Передней Азии, генетически весьма
удалены от генофонда Восточной Европы и пото
вают примерное генетическое пространство, попу
му не могут быть отображены в «генетическом мас
ляции которого относятся к каждому их трех пере
штабе» данного графика. Итак, выявляется единая,
численных кластеров.
генетически гомогенная балто-славянская общ
ность, к которой тяготеют и популяции Балканс
киточками-популяциями и потому оставили лишь
те, которые имеют непосредственное отношение к
этногенезу и этнической истории восточной ветви
С.ЛаВЯН.
Эти группы перечислены в легенде кри
сунку и занимают обширный ареал от Балканско
го полуострова до Урала.
Общая структурамитохондриального генофон
да, выявляемая этим анализом, сводится к трем
В Приуральский кластер вошли восточные
финно-угорские (марийцы, коми) и тюркские на
роды Приуралья (татары, чуваши), в генофонде
которых предполагается значительный финно
но-угорские и тюркские народы Восточной Евро
угорский субстрат. В Восточно-Европейский кла
ляется на западную и восточную части.
кого региона. От этой общности отличаются фин
пы, генофонд которых, в свою очередь, подразде
6.2. Отдельные черты генофонда восточных славян
Сравнение расположения популяций в генети
ческом пространстве и на географической карте
показывает сходство в основных чертах (чтобы
увидеть это сходство, достаточно допустить, что
«восток» в генетическом пространстве находится
слева, а «север» — внизу). Лишь русские популя
ции, которые географически должны бы тяготеть
к Приуральскому кластеру, показывают сходство с
расположенными намного западнее группами бал
тов и западных славян. Конечно, такая картина
могла сформироваться в ходе славянской колони
зации Восточно-Европейской равнины: двигающе
еся с запада славянское население несло с собой
«восточно-европейский» митохондриальный гено
фонд, который замещал ранее существовавший на
211
СоотношЕНИЯ МЕЖДУ
МИТОХОНДРИАЛЬНЫМИ ГЕНОФОНДАМИ
ВОСТОЧНЫХ СЛАВЯН
Определив место восточнославянских групп в
генофонде Европы, перейдем к рассмотрению
внутренней структуры восточнославянского гено
фонда. Для этого построен аналогичный график
многомерного шкалирования, но на него выведе
ны только восточнославянские популяции (рис.
6.8).
График наглядно показывает сходство митохон
дриального генофонда всех восточнославянских
популяций друг с другом: все они образуют еди
ный малодифференцированный кластер. Такая ге
НеТИЧССКaЯ ГОМОГеННОСТЬ ВОСТОЧНЫХ СЛаВЯН НаХО
этих территориях автохтонный «приуральский»
генофонд. Однако результаты полногеномных ис
следований, дающие очень слабый сигнал соб
ственно общеславянского генофонда, позволяют
дит параллели в их антропологическом и лингвис
тическом сходстве друг с другом. Однако при бо
лее пристальном рассмотрении начинает прогля
дывать структура генофонда: все-таки существу
выдвигать гипотезу, что пришлое славянское на
ющие различия между популяциями по мтДНК.
селение и дославянское население в пределах ос
новной части исторического ареала русских (цен
тральные и южные русские популяции) было ге
нетически сходным и, возможно, генетически было
наследником волны расселения балтов по Восточ
но-Европейской равнине.
Эту гипотезу, возможно, подтверждает и свое
образие генофонда северных русских популяций,
сформировавшихся на ином генетическом субстра
те — Северо-Восточной Европы. Вопрос об асси
миляции славянами автохтонного населения, мно
гократно обсуждавшийся в антропологической
литературе, также находит отражение в данных по
митохондриальной ДНК. Митохондриальный гено
фонд северных русских популяций более сходен
не с основной массой русских, украинских и бело
русских популяций, а с неславянскими народами
севера Восточной Европы. Можно предполагать,
Так, большинство белорусских популяций образу
ют скопление в левой части графика. Далеко в пра
вой части графика, отдельно от всех прочих групп,
располагается популяция белорусов Бобруйска
(Вbobr). Эта выборка была изучена другими авто
рами и в частотах гаплогрупп «прочие» гаплогруп
пы достигают очень высокой величины — 17%, что
видимо, связано с методическими особенностями
генотипирования. Это означает, что особость этой
популяции — кажущаяся, и вызвана она, скорее все
го, техническими причинами генотипирования.
Все три северные русские популяции (Оше
венск, Пинега, поморы) смещены вправо. Шесть
русских популяций образуют единое облако со все
ми украинскими популяциями, а также белоруса
ми и кубанскими казаками. Эта группа оказывает
ся ядром восточнославянского генофонда (к ней
относятся 12 из 26 изученных популяций). Осталь
что славянская колонизация на своих поздних эта
пах (Русский Север) включала в себя ассимиляцию
ГеНеТИЧески НеСХОДНОГО СО славянами МестнОГО
населения, и в генофонде северных русских до сих
прослеживается этой компонент. Это и приводит к
тому, что их размещение на графике — промежу
ные шесть русских популяций занимают различ
ное положение на графике. В большинстве случа
ев, видимо, это объясняется статистическими слу
чайностями, неизбежными при многомерном шка
лировании большого числа популяций (поскольку
двумерные геометрические расстояния никогда не
точное между восточнославянскими и неславянс
кими популяциями. Вопрос о том, что представ
лял этот дославянский субстрат, который впитали
северные русские, рассмотрен в конце этой главы
(раздел 6.4).
Что касается украинских популяций, то три из
четырех изученных популяций располагаются
практически в той же области графика, что и за
могут в точности соответствовать реальным мно
гомерным генетическим расстояниям).
Так, парадоксально расположение тамбовских
русских (Rpetr) рядом с северными; кажется стран
ным положение Курской и Орловской групп (Rche,
Rbol), а также одной из двух рязанских популяций
(Rspas), поскольку вторая рязанская популяция
вошла в основную восточнославянскую генетичес
паднославянские, и балтоязычные популяции. Это
согласуется сустановленным по картам генетичес
ких расстояний тяготением украинского митохон
дриального генофонда к популяциям, расположен
ным севернее — поляков, белорусов, южных рус
ских (см. раздел 6.3).
кую общность. Лишь особость русских Ростовс
кой области (Rros) и терских казаков (Rter) легко
может быть объяснима их периферийным положе
нием на самом юге исторического русского ареа
ла. Любопытно, что группа кубанских казаков
212
Глава б. Генофонд славян
Scatterplot 2D
Final Configuration, dimension 1 vs. dimension 2
|
русские
белорусы
украинцы
северные
русские
-15
-1.0
-0.5
00
0.5
1.0
1.5
20
2.5
30
Dimension 1
Рис. 6.8. График многомерного шкалирования русских, украинских и белорусских популяций по мтДНК.
Обозначения: Русские: Rspas — Спасск-Рязанский р-н, Rrost — Ростовская обл., Run) — Унжа (Костромская обл.),
RВel — Белгородская обл., Rbar — Барятинский р-н, RSm — Смоленская обл., Rbor — Боровский р-н, Rbol — Болховский
р-н, Rche — Черемисиновский р-н, Rkub — кубанские казаки, Rter — терские казаки, Rpetr — Петровский р-н, Rpin —
Пинежский р-н, R-osh — Ошевенск (Каргопольский р-н), Rpom —поморы. Белорусы. Вgom — Гомельская обл., ВVit —
Витебская обл., ВStol — Столинский р-н, ВSvet — Светлогорский р-н, Вbre — Брестская обл., ВВobr- Бобруйский р-н.
Украинцы: UW — западные, Uche — Черкасская обл., Ubel — Белгородская обл., UНme — Хмельницкая обл.
(Rkub) неотличима от основного восточнославян
Однородительские маркеры гаплоидны, в отличие
ского ядра. Аналогичное поведение тех же групп
от аутосомных маркеров, что уменьшает генети
казаков выявлено нами по маркерам Y-хромосомы
чески эффективный размер популяции (N) для од
|Ваlanovsky et al., 2008).
нородительских маркеров в два раза. К тому же,
Итак, рассмотрение генетических взаимоотно
шений двадцати шести восточнославянских попу
ляций по маркерам митохондриальной ДНК пока
являясь однородительскими, они отражают гено
ЗЫВаеТ.
результате N, для однородительских маркеров в
— выходящую на первый план гомогенность
восточнославянского генофонда;
— умеренное своеобразие большинства бело
русских популяций (что может объясняться нали
чием балтского компонента в составе их генофон
да);
— выраженное своеобразие северных русских
популяций;
— возможное своеобразие терского казачества.
четыре раза меньше, чем для аутосомных, а дрейф
фонд только одной — мужской или женской - поло
вины генофонда, что уменьшает N, еще в 2 раза. В
генов (1/N), соответственно, действует на них в
четыре раза интенсивнее, чем на аутосомные мар
керы.
Вторая, более важная особенность связана с
уровнем дифференциации популяций. Для населе
ния с патрилокальной традицией межпопуляцион
ное разнообразие по маркерам Y-хромосомы зна
чительно выше, чем разнообразие по мтДНК и по
аутосомным маркерам. В изученных нами восточ
МЕЖПОПУЛЯЦИОННАЯ ИЗМЕНЧИВОСТЬ
нославянских популяциях (рис. 6.9. А) межпопу
ТРЕХ ТИПОВ МАРКЕРОВ
ляционное разнообразие Y-хромосомы в 7 раз
выше, чем разнообразие по мтДНК и по аутосом
ным ДНК маркерам (Пшеничнов, 2007). Те же за
Отметим особенности трех генетических сис
тем — Y-хромосомы, мтДНК и аутосомных ДНК
маркеров, важные для интерпретации результатов.
кономерности выявлены и для коренного населе
ния Кавказа (рис. 6.9. Б). На Кавказе межпопуля
2|3
6.2. Отдельные черты генофонда восточных славян
8
Т—
2
-
1,8
7
1,6
и Y-хромосома
6
-
1,4
5
-
1,2
4
-
1
и Митохондриаль
ная ДНК
0,8
3
0,6
0,4
2
и Аутосомные
маркеры
-
0,2
1
-
-
0
-
0
А
Б
Рис. 6.9. Межпопуляционное разнообразие по Y-хромосоме, мтДНК и аутосомным (преимущественно
АLU) маркерам. А — для восточнославянских популяций (межпопуляционное разнообразие Gsт); Б — для корен
ных народов Кавказа
(генетические расстояния фма).
ционное разнообразие Y-хромосомы в 4 раза выше,
чем по мтДНК (размах изменчивости которой на
Кавказе повышен за счет народов Дагестана, соче
тающих, благодаря кровнородственным бракам,
роды Уральского региона). По частотам изученных
Аlu-инсеpций русский генофонд оказывается ма
лодифференцированным: различия между десятью
региональными популяциями составляют лишь
патри- и матрилокальные традиции) и на 2 поряд
d=0.007, тогда как по классическим маркерам, ми
ка больше, чем по аутосомным ДНК маркерам (Ди
бирова, 2011: Почешхова, 2008).
тохондриальной ДНК и Y-хромосоме гетероген
СРАВНИТЕЛЬНЫЙ АНАЛИЗ С АУТОСОМНЫМИ
ность русского генофонда заметно выше (0.013,
0.033 и 0.142, соответственно). Таким образом,
данный набор из пяти Аlu-инсеpций характеризу
ДНК МАРКЕРАМИ
ется сниженной изменчивостью на внутриэтничес
ком уровне — в пределах русского этноса.
Хотя в «полногеномную эру» исследования,
основанные на малом числе маркеров, вышли из
моды, рискну все же предложить читателю резуль
таты нашего исследования пяти аутосомных мар
керов — Аlu-инсеpций АСЕ, АРОА1, В65, РV92,
ТРА25|Соловьева и др., 2010). Ведь значение име
ет не только число маркеров, но и число популя
ций, и качество формирования выборок, а по этим
параметрам полногеномные исследования не все
гда могут похвалиться первенством. В описывае
мое исследование были включены наши собствен
ные данные по десяти русским популяциям (сум
марная выборка 1088 человек, табл. 6.3), охваты
вающих весь исторический ареал русского наро
да, сопоставленные с другими народами Восточ
ной Европы, изученными по той же панели марке
ров.
По разным локусам русские популяции прояв
ляют сходство то со своими западными (народы
Западной Европы), то с восточными соседями (на
При кластеризации популяций проявляется не
только их географическое соседство, но и этничес
кое (лингвистическое) сходство. Так, на графике
многомерного шкалирования (рис. 6. 10) все рус
ские популяции образуют единый кластер, хотя
географически некоторые из них расположены бли
же к народам других регионов. Впрочем, кубанс
кие и терские казаки, которые географически жи
вут чересполосно с народами Северного Кавказа,
и в генетическом пространстве расположились
вблизи северокавказских популяций.
Однако при межэтнических сравнениях обна
руживается четкая картина: тринадцать рассмот
ренных народов Восточной Европы образуют три
кластера в соответствии с их историко-географи
ческим положением: восточнославянский (ВС),
кавказский и южноуральский кластеры (рис. 6.10).
Отметим, что генетические различия между вос
точнославянскими, кавказскими и уральскими по
пуляциями выявлялись и по данным об аутосом
214
Глава б. Генофонд славян
Таблица 6.3. Частоты аутосомных Аlu-инсеpций и величины межпопуляционного разнообразия рус
ских популяций
Популяции
N
АСЕ
АРОА1
В65
РV92
ТРА25
Лешуконье
91
0.533
0,962
0.489
0,181
0,467
Пинега
142
0,520
0.914
0,492
0.179
0,510
Красноборск
114
0,504
0.944
0,400
0,212
0,550
Вологда
118
0.487
0.912
0,552
0,175
0,504
Кострома
75
0,506
0.905
0,590
0.173
0,514
Кашин
101
0,531
0.913
0,524
0.209
0.530
Псков
111
0,494
0.930
0,514
0,078
0,496
Смоленск
144
0.466
0.922
0,401
0,137
0,445
Казаки Терские
5()
0,500
0.939
0,440
0,290
0,610
Казаки кубанские
142
0,504
0.950
0,602
0.219
0,546
В среднем
1()88
0,505
0,929
0,500
0,185
0,517
Межпопуляционные различия
0,007
0,002
0,000
0,020
0,006
0,008
Обозначения: N — объем выборки в среднем по 5 локусам.
урал
Кавказ
*
*
"
*
— — — — — —
БАШ"СА
- "
,"
\
/
" S.
\
\
/
/
/
|
ЧЕРК
\
О
\
\
}
ДАГЕ
&&
Авлзе
\
О КАРАНОГ
|
о кард
1
}
БАШ"СТ
/
с ногк
балк
"-9
/
|
— чече - - "
|
БАШ"ОР"в
«нака ----Ф РКА"т
2 Pво
"Ф
, Pко
ВС
БАШ"ор"з
Ф РКА
№ 3
I
|
БАШ"ПЕ!
РПЕ
I
/
РПИ
Ф
/
/
вке,"
}
БАШ"АБ
/
I
ФА
РПc
БЕЛ
и
/
*
|
\
о всм"
\
y
у ". ваш вА
/
* д"
- "
\,
*ы
в
= - - "
*
- -
Рис. 6.10. Генетические взаимоотношения русских популяций и соседних народов по аутосомным STR
маркерам (график многомерного шкалирования). Обозначения: русские популяции обозначены ромбами, дру
гие восточнославянские (ВС) народы — треугольниками, народы Урала — квадратиками, народы Кавказа — кружка
ми. РВО — Вологда, РКО — Кострома РСМ — Смоленск, РКА — Кашин, РПИ — Пинега, РПС — Псков, РЛЕ — Лешу
конье, РКР — Красноборск, РКА“Т — Казаки терские, РКА*К — Казаки Прикубанья, УКР — Украинцы, БЕЛ — Бело
русы, ЧЕРК — Черкесы, КАБА — Кабардинцы, АБХА — Абхазы, АБАЗ — Абазины, КАРА — Карачаевцы, БАЛК —
Балкарцы, НОГ*К — Кубанские ногайцы, КАРАНОГ — Караногайцы, ДАГЕ — Дагестан, ЧЕЧЕ — Чеченцы. БАШ*
ОР“З Башкиры Оренбургской области западные, БАШ*ОР*В — Башкиры Оренбургской области восточные, БА
Ш*СА — Башкиры Самары и Саратова, БАШ*БА—Башкиры Баймакского района, БАШ°СТ — Башкиры Стерлиба
шевского района, БАШ*АБ — Башкиры Абзелиловского района, БАШ*ПЕ — башкиры Пермской области.
6.3. Митохондриальный генофонд украинцев
ных классических маркерах, и по данным об ауто
сомных микросателлитных локусах [Лимборская
и др., 2002]. Такое сходство изменчивости Alu-ин
серций с паттернами, выявленными по другим мар
керам, является дополнительным аргументом в
пользу объективности выявляемых закономернос
тей. Итак, три проявившихся кластера популяций
соответствуют трем этногеографическим регионам
(восточные славяне, Кавказ, Южный Урал).
Таким образом, и по аутосомным маркерам, как
по
и
гаплогруппам мтДНК и Y-хромосомы также
вырисовывается единый гомогенный кластер вос
215
точных славян, удаленный и от коренного населе
ния Кавказа, и от народов Волго-Уральского реги
она.
При этом по всем использованным генетичес
ким системам – мтДНК, Y-хромосома, отдельные
аутосомные маркеры, широкогеномные панели рельефно проявляется генетическое своеобразие
северных русских популяций. Это отличие форми
рует основную – широтную – закономерность в
изменчивости русского генофонда. Поэтому важ
но рассмотреть причины генетического своеобра
зия Русского Севера, чему посвящен раздел 6.4.
6.3. МИТОХОНДРИАЛЬНЫЙ ГЕНОФОНД УКРАИНЦЕВ
Задача этого раздела заключается в выявлении
степени связи митохондриального генофонда од
ного из восточнославянских народов – украинцев
– с генофондами других народов Европы. Для ре
шения этой задачи предложен метод, выявляющий
группы гаплотипов мтДНК по принципу сходного
географического распространения.
КАК УЛОВИТЬ РАЗЛИЧИЯ В ГОМОГЕННОСТИ?
Территория современной Украины в древности
входила в зону масштабных демографических про
цессов. Около 45 тысяч лет назад, когда люди со
временного антропологического типа заселяли Ев
ропу, область к северу от Черного моря находилась
на путях интенсивных миграций. Предполагается,
что позднее, во время максимума последнего оле
денения, эта область входила зону одного из рефу
гиумов – тех территорий Европы, где сохранялось
население. Другие рефугиумы находились – около
Пиренеев, Альп и на Балканах. Возможно, что из
этих рефугиумов – в том числе и из причерноморс
кого – в мезолите была заново заселена Европа. В
период от неолита до славянской экспансии При
черноморье приняло множество миграционных
волн, которые привели к смешению популяций и
замещению одних другими. Эти сложные демогра
фические процессы и сформировали генофонд на
родов Причерноморья, в том числе украинцев.
Митохондриальный генофонд Европы изучен
вдоль и поперек. И главный вывод, который был
сделан – о гомогенности этого генофонда, огром
ном генетическом сходстве популяций, живущих
даже на разных концах Европы. Хотя генофонд
Европы относительно гомогенен по всем генети
ческим маркерам, но по митохондриальной ДНК
эта гомогенность особенно сильна. Поэтому при
изучении генофонда какого-то одного народа за
ранее известно, что он будет очень похож на ге
нофонды остальных европейских народов и труд
но будет выделить, на кого он похож в особенно
сти. Отчасти эта проблема преодолевается пол
ным секвенированием мтДНК – тогда выделяют
ся субветви, имеющие не совсем повсеместное
распространение, а приуроченные хотя бы к круп
ным регионам Европы. Но для украинцев таких
данных по полному секвенированию мтДНК пока
очень мало. Выход был в том, чтобы получить
максимально подробные данные по частичному
секвенированию (ГВС1 и ГВС2) и постараться
выявить закономерности с помощью эффектив
ных методов анализа данных. Чтобы в общей кар
тине гомогенности европейских генофондов
мтДНК все же уловить различия в степени сход
ства украинцев с разными народами Европы, были
применены два наиболее информативных подхо
да. Во-первых, один из наиболее чувствительных
методов геногеографии – картографирование ге
нетических расстояний. Во-вторых, был разрабо
тан новый метод – анализ географической скор
релированности гаплотипов.
КАК ФОРМИРОВАЛИСЬ ПОПУЛЯЦИОННЫЕ ВЫБОРКИ УКРАИНЦЕВ
Поскольку изучение украинского генофонда
вызывает в последние годы пристальное внимание
научной и лженаучной общественности, опишем
подробнее методы формирования популяционных
выборок украинцев в нашем исследовании.
ГЕОГРАФИЯ ВЫБОРОК
Мы провели анализ мтДНК украинцев по об
ширной выборке 607 образцов [Pshenichnov et al.,
2013], включившей основные этнорегиональные
подразделения украинцев [Алексеева, Дяченко,
216
Глава б. Генофонд славян
2000; Пономарев, 2000, Гриценко, 2000): это груп
па западных украинцев (Львовская и Ивано-Фран
ковская области, N=142), подольских (Хмельниц
кая область, N=181), днепровских (Черкасская об
ласть, N=174) и восточных (Белгородская область,
N=96). Остальные 15 индивидов отнесены к тем
выборкам, к которым по данным антропологии,
лингвистики и историко-этнографического райо
нирования населения они оказались ближе. По
скольку изучить весь массив популяций украин
но данным антропологии оно чрезвычайно близко
к населению белорусского Полесья, для которого
у нас уже имелись данные по мтДНК (Ваlanovsky
et al., 2008) (рис. 6.11). Итоги изучения генофонда
восточных славян подтвердили правильность та
кого планировании для Y-хромосомы — как мы ви
дели в предыдущей главе (раздел 5.2), генофонд
белорусского Полесья (рис. 5.14), сохраняет исто
рическое сходство с популяциями Украины: пат
терн их генетического ландшафта по Y-хромосо
цев невозможно, при тщательном планировании
ме сходен с паттерном карты генетических рассто
экспедиционного обследования было решено ох
яний от украинцев (рис. 5.15). Также было решено
ватить все разнообразие украинского генофонда,
которое следует линии запад-восток (рис. 6. 11).
Изучение генофонда Карпатского региона пред
на данном этапе не обследовать население южной
части Украины, поскольку оно сформировалось
относительно недавно при смешении многих раз
ставляет собой отдельную научную проблему. По
этому было решено их представить общей попу
ляцией, частично состоящей из представителей
нородных групп населения. И вновь отметим, что
население Крыма, в соответствии с правилами по
пуляционной генетики, представлено только наи
более коренным его населением — крымскими та
закарпатско-верхнеднестровского антропологичес
тарами. Они были изученными содружеством ук
кого типа (обследован юг Львовской области), ча
стично — карпатского антропологического типа (об
следован регион Ивано-Франковска). Такая выбор
кадает представление об основном спектре гап
логрупп мтДНК населения Предкарпатья и Карпат
При планировании было решено не обследовать
население украинского Полесья, поскольку, соглас
)
"
раинских и российских генетиков при заинтересо
ванной поддержке разных организаций крымских
татар задолго до того, как Крым стал объектом
мирового внимания. Ни русские, ни украинские
популяции — в полном соответствии с правилами
геногеографии — в Крыму не анализируются.
минск
Тулд
БЕлдрусь
Брянск
Россиискдя ФЕДЕРАция
ввестО
вДРШАВД
гомель
а
-
и
:-\
*
\
Польшд
:
южны
юкк
восточно-
}е
северные говоры *
, полесский:
:
среднеполесский
\
Белгород
-
.
".
-".
Sл
"..
киев
среднеподнепровский
".
-
-
\
*
словожднскии
О
"-.}им
|-
-
"... 42 ".
*
"к:
Крокутско
".
*
о,
уковинскйй
- Подольскии
под
".
венгрия)*
* ""; *
-
юго-востёчные"…….5
ГОВОРы
".
["""""""
степной
—/
румыния
.
БухдPвот
| 1шипки
|
н
Рис. 6.11. Карта изученных украинских популяций (западные, подольские, днепровские и восточные),
совмещенная с картой говоров украинского языка. Обозначения: Желтые круги — изученные региональные
популяции украинцев. Зеленые круги — изученные популяции белорусского Полесья, привлеченные для характе
ристики Полесского генофонда.
6.3. Митохондриальный генофонд украинцев
МЕТОДЫ СБОРА ВЫБОРОК
Экспедиционное обследование проведено в
2002 году под руководством профессора Е.В. Ба
лановской содружеством российских и украинских
исследователей по той же единой программе, что
и обследование всех других этносов Северной Ев
разии, и под контролем Этической комиссии Ме
дико-генетического научного центра РАМН. На
местах сбор образцов осуществлялся силами двух
экспедиционных групп: на Украине под руковод
ством профессора Харьковского университета Л.А.
Атраментовой, в Белгородской области РФ – под
руководством профессора Белгородского универ
ситета М.И. Чурносова. Сбор образцов проводил
ся не только с ведома, но и при содействии мест
ных администраций и органов здравоохранения
Украины и России.
Для обследования отбирались неродственные
в трех поколениях лица, все предки которых на про
тяжении трех поколений (т.е. включая бабушек и
дедушек) родились в обследуемой популяции и
считали себя украинцами. Такая выборка исклю
чает влияние недавних миграций. Если более да
лекие предки индивида пришли в данный регион
из других областей и, соответственно, оставили в
этом регионе потомство, то такая миграция счита
ется генетически эффективной и отражает уже ус
тоявшиеся миграционные потоки между региона
ми. Такие индивиды (с предками из других регио
нов более 3 поколений назад) уже включаются в
обследование. Поскольку генетическая близость
популяций определяется накопившимся за дли
тельное время эффектом генетических потоков
между ними, крайне важно отделить эффективные
217
миграции от демографических сдвигов, произо
шедших одно или два поколения назад, и в отно
шении которых пока нельзя сказать, насколько они
окажутся генетически эффективны. В тех редких
случаях исключений, когда образцы все же были
взяты от индивидов, у которых бабушка по мате
ринской линии (т.е. линии мтДНК) и дед по отцов
ской линии (т.е. линии Y-хромосомы) оказались из
разных популяций, то данный индивид при изуче
нии мтДНК относился к той популяции, откуда
родом его бабушка по материнской линии, а при
изучении Y-хромосомы – ктой популяции, откуда
родом его дед по отцовской линии. В изучение ауто
сомного генома такие образцы не включались.
Информация о происхождении индивидов со
биралась путем заполнения специальных анкет, в
которых отражалось место рождения и этническая
принадлежность самих добровольцев-участников,
их родителей, бабушек и дедушек. Образцы соби
рались у отобранных вышеописанным способом
представителей коренного населения (достигших
18-летнего возраста), добровольно желающих при
нять участие в обследовании, при получении их
письменного информированного согласия. Образ
цы собирались в виде проб венозной крови с по
мощью системы вакуумных пробирокVacuette. Для
самой процедуры взятия крови привлекался мест
ный медицинский персонал.
Нашу выборку мтДНК из 607 образцов укра
инцев объединили с другими данных: 240 образ
цов украинцев, опубликованных в работе [Gusaret
al., 2006] и 159 образцов украинцев, опубликован
ных в статье [Mielnik-Sikorska et al., 2013], так что
общая база анализируемых далее данных включа
ла 1006 образцов мтДНК украинцев.
УКРАИНЦЫ НА ФОНЕ ЕВРОПЫ: КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
Карты генетических расстояний (как они стро
ятся – подробно описано в главах 1 и 5) между ми
тохондриальными генофондами украинцев и дру
гих народов Европы созданы в двух вариантах: и
по данным о частотах 30 гаплогрупп мтДНК (рис.
6.12), и по данным о частотах 8160 гаплотипов
мтДНК (рис. 6.13). На черно-белых картах (см.
шкалу в левом верхнем углу) более темные тона
означают большие генетические расстояния. И
наоборот – территории, население которых наибо
лее генетически сходно с митохондриальным ге
нофондом украинцев, окрашены в светлые тона.
Обе карты (рис. 6.12 и 6.13) описывают одни и те
же генофонды, но изученные на разных уровнях
разрешения – более общем (гаплогруппы мтДНК)
и более детальном (гаплотипы мтДНК). Сходство
обеих карт подтверждает устойчивость выявлен
ных закономерностей.
На уровне гаплогрупп (рис. 6.12) максималь
ное генетическое сходство по мтДНК (интервалы
генетических расстояний d<0.2) украинцы обнару
живают с генофондом западных славян, а также с
популяциями восточных областей Германии и Ав
стрии. Несколько меньшее (но все же значитель
ное) сходство (интервалы генетических расстояний
0.2<d<0.3) проявляется с генофондами восточных
и южных славян, балтов, а также рядом народов
центральной и южной Европы. Исключение со
ставляют популяции западного Причерноморья,
максимально близкие к генофонду украинцев и
образующие с ними единый ареал минимальных
генетических расстояний. Генетически далекие от
украинцев популяции обнаруживаются лишь на
периферии Европы – юг Пиренейского полуостро
ва, север Фенноскандии, север Восточной Евро
пы, Урал и Предкавказье.
На уровне гаплотипов (рис. 6.13) область мак
симального сходства несколько расширяется – до
бавляются некоторые западноевропейские и рос
сийские популяции, некоторые исчезают (напри
Глава б. Генофонд славян
218
СЕМН Т|С АГН"INITIHIS OF UККА|NIANS (МТП)NА)
ге"
*
*
:
ит
с.
все
не
вт
на
гл
*
*
семепсо=тлмсенком шкклмлмspa
вr"
*
то
ВдевD ON
Зo mtDNA НАРLOGROUPS
шj5
ши:
ипч5
и
1
и 1:
*
*--
*
-
"
т.
„х»мять ""
ч.
вы
Рис. 6.12. Карта генетических расстояний от украинцев до популяций Европы (генетический ландшафт
по 30 гаплогруппам мтДНК).
ег
г."
л"
*
тт
—
тт
:
ил
кг
*
н"
семетcosтАмсенком uкклмлмs он
*
ыт
Чт
тог
ВАчED 0м
8 160 пtDNA НАРLOTYPES
из
*
-
аз
}
в4
a:
не
3.
чииим тип мч.
*
*
имми" " "
.
=
с
*
".
*
} }
Рис. 6.13. Карта генетических расстояний от украинцев до популяций Европы (генетический ландшафт
по 8160 гаплотипам мтДНК).
6.3. Митохондриальный генофонд украинцев
мер, Австрия), но они разбросаны не закономер
но, а случайными пятнами.
Отметим любопытную черту обеих карт: ми
тохондриальный генофонд Полесья обнаруживает
примерно тот же уровень отличий от украинского
генофонда, что и популяции белорусов. При этом
паттерн карты генетических расстояний от бело
русов Полесья по Y-хромосоме (рис. 5.14) оказал
ся сходным с паттерном карты генетических рас
стояний от украинцев (рис. 5.15), а не от белору
сов (рис. 5.13). Это вновь подчеркивает, что раз
ные генетические системы могут описывать раз
219
личные траектории генофонда, и только их срав
нение позволяет выявлять и наиболее устойчивые
закономерности структуры генофонда, и обнару
живать особенности его динамики.
В целом, картографирование генетических рас
стояний подтвердило ожидаемое сходство украин
цев с другими европейскими народами, добавив к
этой ожидаемой картине новый штрих – повышен
ное сходство с западными славянами, восточными
областями Германии и западным Причерноморь
ем. Использование нового метода принесло боль
ше новостей.
АНАЛИЗ МЕТОДОМ «ГЕОГРАФИЧЕСКИХ» ГРУПП ГАПЛОТИПОВ
Для того, чтобы в гомогенном митохондриаль
ном генофонде Европы все-таки выявить, к каким
популяциям наиболее генетически близкиукраин
цы, был разработан новый метод – анализ геогра
фической скоррелированности гаплотипов.
ГЕОГРАФИЧЕСКАЯ СКОРРЕЛИРОВАННОСТЬ
ГАПЛОТИПОВ
Метод состоит в следующем. Обычно гапло
типы объединяют в группы (в гаплогруппы и их
субветви) по признаку общего происхождения,
родства друг с другом. В данном же случае гап
лотипы объединялись в один тип по сходству гео
графического распределения, а не филогенетичес
кого родства. Иными словами, если гаплотипы,
пусть даже неродственные друг другу, распреде
лены по карте по принципу «где один, там и дру
гой», – появляются в одних и тех же популяциях
и отсутствуют в одних и тех же популяциях, то
их относили к одному типу. Если другие гаплоти
пы были распределены не похоже на первый тип,
но зато похоже друг на друга, их относили ко вто
рому типу, потом аналогично выделялся третий
тип и так далее. Можно предполагать, что такая
географическая скоррелированность гаплотипов
(«где один, там и другой») возникла исторически
и сохраняет следы исторического взаимодействия
популяций.
Технически этот подход был реализован с по
мощью кластерного анализа. Была взята обычная
таблица частот встречаемости гаплотипов в раз
ных популяциях. Но обычно по этой таблице рас
считываются генетические расстояния популяций
друг от друга и выделяются группы популяций,
сходные по частотам гаплотипов. А тут матрица
была как бы развернута «наоборот»: по той же ис
ходной таблице были рассчитаны расстояния меж
ду гаплотипами (а не популяциями) и выделены
группы гаплотипов, сходные по «частотам попу
ляций».
КАРТЫ «ГЕОГРАФИЧЕСКИХ» ГРУПП
ГАПЛОТИПОВ УКРАИНЦЕВ
Чтобы можно было сравнить базу данных из
1006 образцов мтДНК украинцев с данными по
другим 129 популяциями Европы, длину анализи
руемой части гипервариабельного сегмента при
шлось уменьшить до интервала позиций нуклео
тидов 16069–16365. Для каждого образца украин
цев определили его принадлежность к одной из 30
гаплогрупп, по которым были изучены 129 попу
ляций Европы, пригодные для сравнения по гап
логруппам мтДНК. В итоге оказалось, что 416 гап
лотипов мтДНК, выявленных в генофонде укра
инцев, принадлежат к 28 из этих 30 гаплогрупп.
При этом 130 из 416 гаплотипов не найдены в по
пуляциях других народов и потому названы «ус
ловно уникальными украинскими гаплотипами».
Условно – потому что по мере дальнейшего увели
чения объемов выборок эти гаплотипы, скорее все
го, обнаружатся и у других народов Европы. Но
даже условно уникальными гаплотипами облада
ют только 15% из 1006 украинцев. Остальные 286
гаплотипов украинцев, охватывающие 85% укра
инского генофонда, являются общими с другими
народами Европы. То есть митохондриальный ге
нофондукраинцев, как и подавляющего большин
ства других народов Европы, сложен из тех же кир
пичиков, что и генофонд Европы в целом.
Для анализа методом географически скоррели
рованных гаплотипов использованы 94 популяции,
а из 8160 анализируемых гаплотипов были отобра
ны «неуникальные» – каждый из них встречается,
по меньшей мере, в двух популяциях. Таких «не
уникальных» гаплотипов оказалось 2098 (26%), и
далее определяли, как они кластеризуются друг с
другом по принципу сходного географического
распространения. Среди выявленных кластеров
отфильтровали те, частота которых у украинцев
превышала 1,5% и которые состояли хотя бы из
трех гаплотипов. В результате выделилось тринад
22()
Глава б. Генофонд славян
-
-
-
-
-
-
-
-
-
-
гREошемсу огндротуре сшsтвR
-
СLUSTER I
18.7% IN UKRAINIAN5
пов п.1 п.15 п.2 п. тк. п т. п.**
-
-
-
-
-
-
-
-
-
гRвошемсу огндротуресшsтек
п.пт. п.п. пле ппв п.
-
СLUSTER П
4,0% IN UKRAINIAN5
п.т. п."
т.
}
н
".
*-s1
л
.***** ***
o
имми" """
-
мт
г
кт
пт
г
л
н
н
т
н
т
FREQUENCYoFнАРШотYРЕсшSTER
вт
вт
СLUSTER III
н:
3.6% IN UKRAINIANS
ода отттттттт
пол шии шишь ош: 0.1
ё
-
нт
л
FREQUENCY огнАРШотYРЕсшSTER
нт
СLUSTER IV
3.3% IN UKRAINIANS
-
-
гRвошемсу огндрцотуре сшsтвR
доль до оттттттт
СLUSTER V
гREошемсу огндршотресшsтвR
сLUSTER VI
3.3% IN UкRAINIANS
0,005 0,01 0.02 0,03 0.04
2,8% IN UкRAINIANS
К у
-
-
..ник" "
с.
."
} \r"
*
"к"
sp
-.
:
}
*
...макин ***
6.3. Митохондриальный генофонд украинцев
-
221
тт cisтей VII
полкуя платтгали
2.7% IIч ШкRAINIANS
поis без соч5 насе плотв
н
-
полкуя плотгали
тт сцjsтек VIII
2.6% IN UкRAINIAN5
плов о ни о.п.2 п.ав оснвоё поё
*
…"-:
л.
-
гRвошемсу огнАРuотуре сшsтвR
сLUSTERIх
гREQUENcy огнАРLoтypЕсшSтER
СLUSTER Х
при поз плз ппу п.1 п.3
18% IN UкRAINIANS
пги по ппв пп7 п.1 п."
18% IN UкRAINIANS
...
-
-
-
-
-
-
гREошемсу огндротуре сшsтвR
поп и,
и,из винт о. 1 р.
-
-
-
-
-
-
-
-
-
*
т
т
н
т
н
н
"""
o
н
т
н"
на
сLUSTER XI
гREошемсvoFндротуресшsтвR
сLUSTER XII
1.7%. IN UкRAINIANo
сопросов рот он ог
1.7%. IN UкRAINIANS
-
и
-
}
-
-
-
222
Глава б. Генофонд славян
гRecueмсvor ндршотуре сцистер
сLUSTER XIII
диатттттт
1.в", IN UкRAINIANS
52.
:
*
-
-
.
"""
С"."
—
Рис. 6.14. Распределения частот тринадцати наиболее частых «географически скоррелированных» групп
гаплотипов мтДНК, встреченных и в украинском генофонде.
цать таких «географических» групп гаплотипов, и
эти группы (кластеры) гаплотипов обозначены под
номерами от I до XIII. Географическое распреде
ление этих 13 кластеров картографировано (рис.
6.14). Таким образом, карты указывают на популя
ции, которые связаны родством по материнской
линии и образуют «географически скоррелирован
ные» группы гаплотипов, встречающихся с часто
той выше 1,5% в украинском генофонде (пример
но 1% критерий полиморфизма).
Оказалось, почти пятая часть украинского ми
тохондриального генофонда (18,7%) принадлежит
к кластеру № I, который распространен по всей
Европе, причем с низкой частотой в Центральной
Европе и с высокой частотой на периферии (рис.
6.14.А). Наиболее частые гаплотипы, относящие
ся к гаплогруппам мтДНК Н и J, составляют более
половины этого кластера в Украине.
Кластеры VI и VIII (рис. 6.14 F. Н) чаще всего
ного происхождения (А, В, С, D и G), остальные —
к гаплогруппам I, N1b, W, X или V.
Примерно десятая часть (9,2%) гаплотипов
мтДНК украинцев принадлежат клиниям, типич
ным для Волжского региона. Это кластеры П, ПП и
XII (рис. 6.14. В. С. L), имеющие высокую частоту
у финно-угорских и тюркоязычных популяций
Поволжья и Приуралья (удмурты, мари, коми, чу
ваши, татары и башкиры).
Около 13% образцов ДНК украинцев демонст
рируют генетическое сродство то с одной, то с дру
гой популяцией Европы. Так, кластер IV (3,3% у
украинцев) с наибольшей частотой встречается в
Литве, кластер V (тоже 3,3% у украинцев) — типи
чен для саамов, а редкие у украинцев кластеры (по
1,5—2% каждого) IX, X, XI, и XIII включают ли
нии, наиболее частые в Эстонии, Корнуолле, унен
цев и на Северном Кавказе. Кластер VII (2,7% у
украинцев) (рис. 6.14 G) встречается в самых раз
встречаются в Украине, реже — в центральных об
ластях Европы и практически отсутствуют в дру
личных частях Европы.
гих регионах. Они вместе составляют 5,4% укра
инского митохондриального генофонда. В совокуп
ности с 14,5% носителей уникальных украинских
гаплотипов получается, что 19,9% — то есть пятая
чески скоррелированных гаплотипов» и карты ге
часть — украинцев относятся к линиям мтДНК,
Но предложенный метод «географически скорре
Подводя итог, мы видим, что метод «географи
нетических расстояний демонстрируют в целом
сходную картину генетических связей украинской
популяции с другими европейскими популяциями.
высокоспецифичным для населения Украины. Сре
лированных гаплотипов» позволяетточнее выявить
ди 148 этих украино-специфичных линий мтДНК
44 принадлежат к гаплогруппе Н. 26 к гаплогруп
пам J или Т. 19 — к U4 или U5, 23 принадлежат к
другим ветвям гаплогруппы U, 10 принадлежат к
различным ветвям НV, 6 — к гаплогруппам восточ
детали, точнее дифференцировать генетически
сходные регионы. Например, этим методом выяв
лены связи (около 10% линий мтДНК украинцев)
с Волго-Уральским регионом. Показано, что пятая
часть передающегося по материнской линии укра
223
6.4. Проблема своеобразия генофонда Русского Севера
инского генофонда представлена линиями, высо
коспецифичными для украинцев (почти не встре
чающимися в других популяциях). Остальные гап
лотипы (их большинство) либо тяготеют к отдель
ным популяциям Европы (редкие кластеры), либо
распределены почти по всей Европе, либо вообще
не кластеризуются на основе «географически скор
релированных» гаплотипов.
При интерпретации результатов, полученных
этим методом, важно помнить, что он не оценива
ет прямой поток генов между украинской и други
ми европейскими популяциями. Кластеры, полу
ченные методом «географически скоррелирован
ных» гаплотипов, указывают лишь на наличие об
щих предков украинцев и других популяций, жив
ших на той или иной территории в прошлом.
6.4. ПРОБЛЕМА СВОЕОБРАЗИЯ ГЕНОФОНДА РУССКОГО СЕВЕРА
ОТЛИЧИЯ СЕВЕРА ОТ ЮГА
зультаты получены и в исследованиях других ав
Освоение Русского Севера признается одной из
торов (Мalyarchuk et al., 2002, 2004; Моrozova et
al., 2011). При этом сравнительный анализ с гено
важнейших вех в этногенезе русского народа. При
фондами народов Европы по маркерам Y-хромо
этом многие исследователи указывают, что гено
сомы (Ваlanovsky et al., 2008) выявил, что популя
фонд и фенофонд северных русских сформирован
не только (или даже не столько) древнерусской
ции Архангельской и Вологодской областей при
ближаются к кластерам не только финских, но так
колонизацией этого края, сколько мощным субстра
же шведских и немецких популяций.
том дославянского (в основном финно-угорского)
населения. Наши предыдущие исследования рус
ЧЕТЫРЕ ЗЕРКАЛА ГЕНОФОНДА
ского генофонда выявили по всем изученным сис
темам — соматологии, дерматоглифики, классичес
ких генетических маркеров, фамилий — широтную
изменчивость русского генофонда, задаваемую
различиями севера и юга (Балановская, Балановс
кий, 2007). Дальнейшие исследования изменчиво
сти Y-хромосомы [Ваlanovsky et al., 2008) и мито
хондриальной ДНК (Балановский и др., 2010) толь
ко подтвердили эту закономерность. Близкие ре
e
Для создания возможно более полного гене
тического портрета населения Русского Севера в
этом заделе использована вся доступная нам ин
формация о полиморфизме четырех систем при
знаков: Y-хромосомы, мтДНК, аутосомных ДНК
маркеров и квазигенетических маркеров (фами
лий). На рис. 6.15 показано географическое по
ложение изученных северных русских популяций.
море
О
Архангельск
o
холмогоры С
пйнвrд
.
}
.
-
*
|-
и и Петрозаводск
Архангельская
.
o
..
и
ком
:
каргополь
3 :
3"
КРАСНОБОРСК
.
*
* Санкт-Петербург
о
вайазадская
н
=
Сыктывкар
Рис. 6.15. Карта расположения пяти изученных районов Архангельской области.
224
Глава б. Генофонд славян
Отметим, что в контексте данного раздела терми
ны «генофонд населения Архангельской области»
и «генофонд Русского Севера» использованы как
синонимы.
КВАЗИГЕНЕТИЧЕСКИЕ МАРКЕРЫ
ВЫБОРКА — ДВА МИЛЛИОНА ЧЕЛОВЕК
ВЗАИМООТНОШЕНИЯ ПОПУЛЯЦИЙ
Данные о квазигенетических маркерах (фами
лиях) не могут быть использованы для межэтни
ческих сравнений, зато неоднократно показана их
Соотношения изученных русских популяций
хорошо иллюстрируются графиком многомерного
шкалирования (рис. 6. 16); разнообразие фонда
эффективность для исследования структуры гено
фонда в пределах одного этноса, в том числе и для
русских популяций (Чурносов и др., 2004; Соро
двумя пограничными районами — Пинежским и
кина и др., 2007; Балановский, Балановская, 2007).
В данной работе использована собранная нами
информация об 1.9 млн. представителей 68 райо
нов 14 областей России.
После отсева редких фамилий (являющихся
обычно следствием миграции из других районов и
областей), в анализ было включено 1,6 млн. чело
век, в том числе 57 тыс. человек из пяти районов
Архангельской области. Частоты фамилий анали
зировались методами многомерной статистики как
аналоги множественных аллелей одного локуса.
2,5
т
п
п
фамилий Русского Севера задается в основном
Лешуконским. Важно, что своеобразие фамилий
северно-русских популяций четко выражено, но
оно вовсе не максимально для русских фамилий.
Средние отличия фамилий Северного региона от
остальных регионов примерно такие же (d=1.2), как
и отличия фамилий Восточного региона (d=1.1), и
заметно меньше, чем отличия фамилий кубанских
казаков (Кавказский регион, d=1.6).
На графике многомерного шкалирования вы
является довольно четкая структура русского ге
нофонда: практически все районные русские по
пуляции кластеризуются в региональные группы.
н
-
н
т
т
Пинежский р-н
2,0 -
1,5 +
-
Краснобарский р-н
1,0 |-
Архангельская обл
ор??
Есте
**ынь-2}
0,5 +
}
*и
Белг-19
}
остр-6
*
костр-11
в
н
*
".
Костр.2 сбл.7"смоля
-
Костр-1
вед-17):
Белг-16
Адыгея Р?
Костр.5 Костр-3 и
—0,5 |-
и
Рязань-2» вел"зв"в"4"#
нчилий в
«Белгz1 велги» и
Костр-4
Костр-10 в
Белг-10
"..велел Белг44
и Смол-3
Костр-7
Костр-9
0,0 |-
велr?
-
елг-6
-
Белг-18
Тамбовская
Белг-8
веронежс».
в лев
—1,0 |-
Белг-11
-
куря
—1,5 -
Курск-2
—2,0
—2,0
И.
—1,5
—1,0
—0,5
0,0
и
0,5
и
1,0
1,5
2,0
Рис. 6.16. Взаимное расположение на графике многомерного шкалирования генофондов 68 районов 14
областей по данным о распределении частот фамилий. (Стресс = 0.22, алиенация = 0.23).
Обозначения: в названии районов указано сокращенное название области и условный номер района (напр.
Костр-11 обозначает район № 11 Костромской области). Для ряда районов в центре графика названия привести не
удалось из-за большого сходства фамильного состава районов. Названия районов Архангельской области приве
ДеНЫ ПОЛНОСТЬЮ И ВЫДеЛеНЫ На графике ОВаЛОМ.
6.4. Проблема своеобразия генофонда Русского Севера
225
При этом график демонстрирует, что по распреде
лению фамилий население Русского Севера цели
ком принадлежит к общему массиву популяций,
представляющих исконный ареал русского наро
да.
Таким образом, детальный анализ русского ге
нофонда по данным о фамилиях позволяет утвер
ждать, что в целом генофонд Русского Севера яв
ляется неотъемлемой составной частью русского
генофонда: он не выходит за пределы изменчиво
сти отдельных регионов и районов исторического
русского ареала, а его своеобразие сформировано
результатами дрейфа генов в периферийных попу
ляциях этого ареала.
АУТОСОМНЫЕ МАРКЕРЫ
ДАННЫЕ ПО ALU-ИНСЕРЦИЯМ
Для анализа аутосомных ДНК маркеров исполь
зованы собственные данные по 10 русским популя
циям (три из них представляют Архангельскую об
ласть), изученным по единой панели Alu-инсерций
(АСЕ, APOA1, B65, PV92, TPA25), а также данные
по СПИД-протекторной делеции в локусе CCR5
(CCR5del32), изученной в 14 русских популяциях.
Большинство русских популяций исследовано,
к сожалению, по разным панелям аутосомных ДНК
маркеров [Лимборская и др., 2002; Балановская,
Балановский, 2007], что затрудняет анализ струк
туры русского генофонда. Наиболее широкое па
норамное исследование, охватывающее весь исто
рический ареал русского народа и включающее три
популяции Архангельской области, проведенное по
панели Alu-инсерций (АСЕ, APOA1, B65, PV92,
TPA25), описано выше (раздел 6.2). При этом об
наружено, что по панели ДНК маркеров русский
генофонд слабо дифференцирован, причем попу
ляции Архангельской области расположены ком
пактно в пределах кластера русских популяций.
Таким образом, как по фонду фамилий, так и
по панели аутосомных ДНК маркеров генофонд
Русского Севера является составной частью рус
ского генофонда: он не выходит за рамки отличий,
характерных для общего массива русских популя
ций, а его гетерогенность на порядок меньше, чем
гетерогенность, например, башкирских популяций,
занимающих значительно меньший географичес
кий ареал.
ДАННЫЕ ПО СПИД-ПРОТЕКТОРНОЙ МУТАЦИИ
CCR5del32
Однако по одному из наиболее изученных ауто
сомных ДНК маркеров – СПИД-протекторной де
леции CCR5del32 – ярко выявляется своеобразие
северных русских популяций. Изменчивость это
го маркера активно изучалась многими российс
кими коллективами [Libert et al., 1998; Сломинс
кий и др., 1997; Limborska et al., 2002; Кожекбаева
и др., 2004]. Поэтому рассмотрим его особо. На
карте (рис. 6.17) видна четкая закономерность: ча
стота максимальна на севере Европы (на побере
жьях Балтийского и Белого морей), и во всех на
правлениях от этой зоны частота плавно снижает
ся. Такой элегантный, четкий и простой простран
ственный тренд крайнередок для аутосомных мар
керов. Тем удивительнее, что распределение му
тации в русском ареале носит довольно сложный
характер. Наибольшие частоты отмечены на Рус
ском Севере – во всех трех изученных популяциях
Архангельской области. Именно они формируют
беломорскую часть беломоро-балтийского миро
вого максимума частоты этого аллеля. К югу и за
паду русского ареала частота снижается. Измен
чивость частоты CCR5del32 в русских популяци
ях столь велика, что заметна даже в глобальном
масштабе [Balanovsky et al., 2005].
Однако, хотя генетически эффективные разме
ры популяций Архангельской области невелики,
необычно высокие частоты CCR5del32 нельзя
объяснить лишь генетическим дрейфом: ведь все
три Архангельские популяции, географически и ге
нетически изолированные друг от друга, отклони
лись от среднерусской частоты (р=0,11 с учетом
Архангельских популяций, без их учета р=0,10) в
сторону увеличения частоты делеции, причем все
три – назначительную величину (Пинежский рай
он р=0,16, Лешуконский район р=0,18, Краснобор
ский район р=0.19), тогда как действие дрейфа
предполагает случайное по направлению и силе от
клонение.
Поэтому можно утверждать, что наблюдаемое
распределение (рис. 6.17) указывает на существо
вание мощного общего генетического пластав на
селении Русского Севера и народов Северной Ев
ропы, где тоже наблюдаются высокие частоты этого
аллеля.
Причем эту генетическую общность никак
нельзя назвать финно-угорской, так как она вклю
чает европейские народы самых разных ветвей
трех лингвистических семей – индоевропейской,
уральской и алтайской. Счастотой более 10% де
леция CCR5del32 встречена у следующих народов
(перечисленных в пределах языковой ветви поубы
ванию частоты делеции): германской ветви (ислан
дцы, шведы, фламандцы, датчане, англичане, нем
цы, норвежцы); славянской (русские, поляки, бе
лорусы, словаки, украинцы, чехи); финской (эстон
цы, мордва, финны, удмурты), угорской (венгры);
балтской (литовцы); романской (французы) и даже
226
Глава б. Генофонд славян
*
1а
го
за
до
во
вт
-
средние
Мини Мальные
о
МаксиМальные
о от o от 0 03 0 04 аса вот воз D 09 он о ни о 12 в 13 от 4 о 15 и 16 отт о 18 п.19 0 2
инни и
и. н ы инт
митт-т
те"да",
всепь
Г.ши
*-тники
"гостов над и,
o
Прочие изученные популяции
o Популяции Архангельской области
с"
гт
пгт
Рис. 6.17. Карта распространения частоты СПИД-протекторной мутации del32 в аутосомном гене ССR5.
Область наиболее высоких частот ВЫДеЛеНа ОВаЛОМ.
тюркской (татары). Как видим, по числу народов с
высокой частотой делеции финноязычные народы
уступают германоязычным и славянским.
В целом, область регулярно встречаемых вы
соких частот ССR5del32, выделенная на карте ова
лом (рис. 6.17), указывает на общность генофонда
населения северной части Европы (в широком гео
графическом смысле этого термина), к которому
полностью принадлежат и популяции Архангель
ской области.
МИТОХОНДРИАЛЬНАЯ ДНК
ГЕНЕТИЧЕСКИЕ ВЗАИМООТНОШЕНИЯ
ПОПУЛЯЦИй
Для анализа митохондриальной ДНК исполь
зованы данные по частотам 16 гаплогрупп (А, С.
D, Н. НV I. J. К. Т. U2, U3, U4, U5a, U5b, V. W).
Для максимально корректного сравнения, при от
боре популяций для многомерного анализа мы
стремились к тому, чтобы возможно большее чис
ло популяций было изучены по гаплогруппам обе
их однородительских систем — и Y-хромосомы, и
митохондриальной ДНК.
Население Русского Севера представлено по
мтДНК тремя популяциями — Пинежского района
(восточная окраина области на границе с респуб
ликой Коми), Каргопольского района (запад обла
сти у истоков Онеги (Вelyaeva et al., 2003]) и сум
марной группы поморов (северное побережье).
Размах различий по мтДНК между этими тремя
северно-русскими популяциями велик: генетичес
кое расстояние между западом и востоком Архан
гельской области d=0,025; между западом и помо
рами d=0,028, между востоком и поморами в два
раза выше d=0,049.
227
6.4. Проблема своеобразия генофонда Русского Севера
Взаимное расположение популяций показыва
ет дендрограмма (рис. 6. 18). Она указывает на воз
можность выделения двух близких кластеров ев
ропейских генофондов и резко отличающихся ге
нофондов финноязычных популяций.
В общий кластер с популяциями Русского Се
амальгамой славянских влияний. Напротив, по ма
теринским линиям наследования мы вновь видим,
как и по аутосомным маркерам, сходство с гено
фондом северной половины Европы, в том числе с
географически далекими популяциями Западной и
Центральной Европы.
вера, помимо норвежцев и немцев, вошли другие
германоязычные народы (австрийцы, швейцарцы,
шотландцы) и ирландцы, славяне (поляки, словен
цы и боснийцы), а также балты (литовцы). Второй
европейский кластер включил в основном славян
ские популяции — все остальные русские популя
ции, белорусов, украинцев, чехов, словаков, а так
же венгров, эстонцев, латышей и шведов. Таким
образом, митохондриальный генофонд Русского
Севера тяготеет в большей степени к Западной и
Центральной Европе, а остальные русские попу
ляции — к генофондам Восточной Европы.
Но более важен иной вывод: все финноязыч
ные популяции (за исключением эстонцев) нахо
дятся в иных кластерах, чем популяции Русского
Севера, причем и западные (финны, карелы) и во
сточные (коми, марийцы, мордва) финноязычные
народы генетически удалены от Русского Севера.
Таким образом, изучение митохондриального
генофондасвидетельствует против распространен
ного мнения, что генофонд Русского Севера пред
ставляет собой финно-угорский субстрат с тонкой
КАРТА ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ ПО мтДНК
Эти выводы полностью подтверждаются кар
той генетических расстояний от генофонда Русско
го Севера (реперные популяции Архангельской об
ласти обозначены крупными оранжевыми кружка
ми), позволяющей включить в анализ много боль
ший массив популяций (рис. 6.19).
Мы видим, что область регулярно встречаемых
минимальных генетических расстояний от Русско
го Севера охватывает страны Центральной и Запад
ной Европы — побережье Северного моря, южную
часть Балтики, Центральную Европу и даже узким
языком доходит до Балкан. Популяции этого ареала
оказываются генетически более близкимик Русско
му Северу, чем популяции Восточной Европы, ок
рашенные втона средних генетических расстояний.
Приуралье и север Фенноскандии окрашены в крас
ные тона максимальных генетических отличий.
В целом, вся совокупность приведенных ре
зультатов по мтДНК указывает на существова
Австрийцы)
Шотландцы
Ирландцы
Немцы|
Норвежцы|
Швейцарцы|
Поляки
Словенцы
Литовцы|
Боснийцы
АРХ-Каргополь
АРХ-Пинега
0,05
0,10
0,15
0,20
0,25
Рис. 6.18. Взаимное расположение на дендрограмме генофондов народов Европы по данным о частотах
гаплогрупп мтДНК. Обозначения: популяции Русского Севера начинаются с обозначения «АРХ» (Архангельская
область), остальные русские популяции — с обозначения «Р».
228
Глава б. Генофонд славян
50
40
3}
20
10"
0"
10
—
30
40
50
60
70
Расстояния от Архангельской области по мтДНК:
сPEднив
8},
"и
2.
МАКСИМАЛьНы|Е
н
МиниМАПьныlЕ
*:
11 и т. п. т. д. и т. п т.
"
*
мии 1" 1.
*
с
вп
?
*--
*
-
"
-
*
?
3}
ч.
50"
вы
*
} } }}
} },
}
".
*
-
—
|
*
* ХЕ:
:-
акки,
-
-
.
-
с
-
},
санкт-Петербург
анкт-пстор
талл
н
"
н
".
.
*} } г»"
н
-
"
.
—
искакнил
мин:
"
}
50
к
| 2твип
*
* Прочие изученные популяции
Г
д
й
С Популяции Архангельской области
0"
10"
20"
Рис. 6.19. Карта генетических расстояний от Русского Севера по мтДНК.
Территории, население которых наиболее генетически близко к генофонду Русского Севера, окрашено в зеле
ные тона, средние генетические расстояния от Русского Севера — в желтые тона, максимальные генетические
отличия — в красные тона. Генетически изученные популяции
Европы обозначены красными точками, популяции
Архангельской области — оранжевыми кружками.
ние общего мощного пласта в генофондах по
пуляций Русского Севера и народов Централь
ной и Западной Европы. При этом как запад
ные, так и восточные финны резко отличаются
от северно-русских популяций, что позволяет
отрицать их преобладающее участие в форми
ровании митохондриального генофонда Русско
го Севера.
Y-ХРОМОСОМА
КАРТА ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
ПО Y-ХРОМОСОМЕ
Для анализа истоков своеобразия генофонда
Русского Севера отобраны именно те шесть гап
логруппY-хромосомы (I1-М253, I2b1-М223, N1b
Р43, N1c1-М178, R1a1-М198, R1b1a2-М269), ко
торые наиболее распространены на севере Евро
пейской России: в изученных нами популяциях Ар
хангельской области они составляют суммарно
229
6.4. Проблема своеобразия генофонда Русского Севера
почти 95% генофонда. Карта генетических рассто
ареал, чем мы видели по мтДНК и по аутосомным
ДНК маркерам. Этот ареал теперь наряду с При
балтикой охватывает также север Фенноскандии
и доходит вплоть до Печоры, а также узкой поло
сой тянется вдоль Приуралья — эта полоса образо
вана популяциями коми, удмуртов и одной из не
скольких изученных популяций тюркоязычных
башкир (рис. 6.20). Таким образом, генофонд от
цовских линий — в отличие от материнских — свя
зан в основном с финно- и балтоязычными наро
яний (рис. 6.20) демонстрирует, насколько каждая
ее точка генетически близка к средним парамет
рам популяций Русского Севера и читается анало
гично карте расстояний по мтДНК (рис. 6.19). На
помним, что на карте распространения СПИД-про
текторной делеции ССR5del32, представляющей
аутосомные ДНК маркеры (рис. 6.17), шкала чита
ется иначе: она отражает диапазон частот от ми
нимальных (зеленые тона) до максимальных (крас
ные тона) частот
Карта генетических расстояний от популяций
ДаМИ.
Русского Севера по Y-хромосоме выявляет иной
тельствовать в пользу популярного мнения «по
5}
dj"
3}
2:'
1c-
Однако даже этот результат не может свиде
П"
10°
20'
3}
}*
5}:
55°
т?
3]"
*
Расстояния от Архангельской области по Y-хромосоме: |
МИНИМДПьныE
средние
1г0"
"в
МАКСИМАПьныE
}
н
*
0
}
0.05 0,1 0,15 0,2 0,25 0,3 0,35 0.4 0,45 0,5 0,55 0.35 0,7 0,75 0.8 0,85 0,9 0,95
--
т сит" т, т. """, "тч гит
.
м ни 1" и
с
E0"
*--
:
50"
—
и
=
г-
с т т' т т'ти гит
с
"и т т' F
*:
-
o
Москву,
-
* *
н-
3,
* .
=*
*
*
н.
А. 2
}
*
ea
t=
--
|
"
}
.:
-
-
в"
".
}
22:
1"
* :
2.Л:
-т
.*
-
-
и
-
т
*
«}
-
-
* -"
2.
С
p
с
Г.
н:
ге
,
ГЕРлн
".
-т
"*"
тут]й
БЕЙРут
"Г"--—
-
30"
апп, чл
зали, -
в Прочие изученные популяции
С Популяции Архангельской области
о.
12"
—*
20"
30°
Рис. 6.20. Карта генетических расстояний от Русского Севера по Y-хромосоме.
Территории, население которых наиболее генетически близко к генофонду Русского Севера, окрашено в зеле
ные тона, средние генетические расстояния от Русского Севера — в желтые тона, максимальные генетические
отличия — в красные тона. Генетически изученные популяции Европы обозначены красными точками, популяции
Архангельской области — оранжевыми кружками.
23()
Глава 6. Генофонд славян
скреби северного русского и увидишь финна». Во
раза (d=0.48), несмотря на то, что географически
первых, это мнение должно быть тогда распрост
ранено и на балтов (литовцев и латышей), и на
Красноборск ближе к другим русским популяци
ям. Поэтому своеобразие красноборской популя
тюркоязычных башкир, и даже на германоязычных
ции отражает не ее «оторванность» от русского
шведов. Во-вторых, этот результат отражает миг
рации лишь мужского населения. В-третьих, сте
генофонда по происхождению, а эффект дрейфа
генов — частота мажорной для русского генофонда
финноязычными
гаплогруппы R1a1-М198 в красноборской популя
ции составляет только 19.8%.
В целом анализ гаплогрупп Y-хромосомы об
наруживает более устойчивое сходство Русского
пень генетического сходства с
популяциями различна для разных северно-рус
ских популяций.
ГЕНЕТИЧЕСКИЕ РАССТОЯНИЯ ОТ ОТДЕЛЬНЫХ
СЕВЕРНОРУССКИХ ПОПУЛЯЦИЙ
Например, самая восточная популяция Архан
Севера с балтами, а не с финно-уграми, то есть
выявляет западные, а не восточные влияния.
ПАЛЕОЕВРОПЕЙСКИЙ СУБСТРАТ
гельской области (Пинега) оказывается генетичес
ки ближе к географически далеким балтам (до ла
тышей d=0,10, до литовцев d=0,13), чем к своим
Однакомы далеки оттого, чтобы просто поме
нять финно-угорский субстрат на балтский. Выяв
географическим соседям — коми (d=0.14). При этом
генетические расстояния до финно-угров в целом
ленное генетическое сходство и с балтскими, и с
намного выше, чем до балтов: до эстонцев d=0,14,
ями севера Европы указывает, на наш взгляд, на
до карелов, вепсов, ижорцев d=0,30, до венгров
d=0,46, до финнов Карелии d=0,63, до финнов
Финляндии d=0,65. Среднее генетическое рассто
яние до финно-угров составляет d=0,39 (включая
соседей коми), в то время как среднее расстояние
сохранение более древних пластов генофонда, су
вянских и финноязычных общностей и роднящих
разноязыкие ныне генофонды севера Европы.
Отметим, что по данным антропологии (сви
до других русских популяций почти в два раза
детельства которой подробно рассмотрены в работе
меньше (d=0.22). При этом наибольшие отличие
дает географически близкая к Пинеге костромская
популяция русских (d=0,30), демонстрируя эффек
ты дрейфа генов.
Северо-восточная популяция Архангельской
антропологический тип не был единственным в
ряду реликтовых расовых вариантов Европы, со
области (Мезень) еще более генетически близка к
географически далеким балтам (расстояние доли
товцев d=0,03, до латышей d=0,03) и к соседним
коми (d=0.03). Генетические расстояния до других
финно-угров вновь выше, чем до балтов: до эстон
цев d=0.06, до карелов, вепсов, ижорцев d=0,10. до
финнов Карелии d=0,28, до финнов Финляндии
d=0,37, до венгров d=0,74.
Среднее генетическое расстояние до финно
угров составляет d=0,26, в то время как отличия от
балтов на порядок ниже (d=0.03).
При этом среднее генетическое расстояние от
Мезени до других русских популяций такое же, как
финноязычными, и с германоязычными популяци
ществовавших задолго до разделения балто-сла
[Балановская и др., 2011)) ильменско-белозерский
хранившихся до настоящего времени. Об этом сви
детельствуют и материалы по псковским поозерам,
где представлен очень архаичный западно-балтий
ский антропологический тип, и материалы М.В.
Витова (Беневоленская, Давыдова, 1986, Витов,
1997). В современном населении Архангельской
области также фиксируются популяции, для кото
рых характерно заметно более высокое лицо, дос
таточно широкий нос и средняя длина тела. К ним
относятся и русские Лешуконского и Мезенского
районов. Характерно, что морфологическое свое
образие некоторых современных популяций Ар
хангельской области находит себе аналогии в па
леоантропологическом материале с территории
северо-запада. Особенно хотелось бы обратить
и до финно-угров d=0.29.
Популяция юго-востока Архангельской облас
ти (Красноборский и Ленский районы) вновь ге
деляются и по данным ДНК полиморфизма. Как
нетически ближе всего к балтам (d=0.06). Расстоя
ным палеоантропологии они тяготеют к западно
ния до финно-угров в три раза больше (d=0.20), а
европейским популяциям — можно полагать, что в
силу общего генезиса на палеоевропейской антро
средние расстояния до других русских популяций
по сравнению с Пинегой и Мезенью возросли в два
внимание на то, что это те же популяции, что вы
по данным молекулярной генетики, так и по дан
пологической основе.
ГЛАВА 7.
ГЕНОФОНДЫ И ЯЗЫКИ
Анализ связи между генетической и лингвис
тической структурой народонаселения проведен
нашим коллективом для нескольких регионов мира,
но наиболее подробно – намногообещающем при
мере Кавказа. Такие особенности этого региона,
как наличие географических барьеров (горных
хребтов), детальная изученность родства языков
северокавказской лингвистической семьи и под
робные собственные данные о генофондах этих
народов позволяют корректно исследовать вопрос
о взаимосвязи генетической, географической и
лингвистической изменчивости популяций чело
века. Попытки решить эту проблему традицион
ны для популяционной генетики человека [Рычков,
Ящук, 1980, 1983, 1985; Cavalli-Sforza et al., 1994;
Rosser et al., 2000; Nasidze et al., 2003, 2004; Спи
цын и др., 2009; Кутуев, 2010]. Ее решение легче
осуществить на Кавказе, поскольку горный рель
еф способствовал изолированности даже соседних
популяций. Это создавало условия для формиро
вания как большого лингвистического разнообра
зия путем дифференциации из единого праязыка
северокавказской семьи, так и для формирования
четкой популяционной структуры генофонда.
7.1. СТРУКТУРА И ИСТОРИЯ НАРОДОНАСЕЛЕНИЯ КАВКАЗА
НАРОДОНАСЕЛЕНИЕ КАВКАЗА ПО ДАННЫМ АРХЕОЛОГИИ И АНТРОПОЛОГИИ
ПАЛЕОЛИТ-МЕЗОЛИТ
Территория Кавказа была прочно освоена людь
ми современного антропологического типа еще в
верхнем палеолите: археологические памятники
этой эпохи обнаружены во всех ландшафтных зо
нах Кавказа[Бжания, 1996; Бадер, Церетели, 1989].
Следующая эпоха – мезолит – на Кавказе развива
ется преемственно и настолько связана сверхним
палеолитом, что «критерии разделения нечетки,
нижняя граница мезолита условна» [Бадер, Цере
тели, 1989, с. 93] и ориентировочно может быть
проведена на уровне 15 000 лет назад. В голоцене
открываются от ледников перевалы, связывающие
население Северного Кавказа с Передней Азией не
только приморскими, но и горными путями.
МЕСТНЫЕ КОРНИ КАВКАЗСКОГО НЕОЛИТА
Уже 8000 лет назад высокоразвитый мезолит
сменяется неолитом. Причем для всех регионов Се
верного Кавказа – от Западного до Восточного –
характерна преемственность культуры (и, следова
тельно, населения) на этапах мезолит-неолит. Важ
но, что на Северном Кавказе уже в начале VI тыс.
до н.э. (8000 лет назад) появляются местные очаги
скотоводства и земледелия, включая одомашнива
ние скота и окультуривание местных сортов ячменя
и пшеницы [Массон и др., 1982;. Бжания, 1996].
В это же время в центральное Закавказье про
никли из Передней Азии племена энеолитической
культуры, которые принесли навыки земледелия,
скотоводства, керамики и плавки меди. Под их вли
янием местный неолит Закавказья очень быстро
перешел в стадию энеолита (раннего металла) V–
IV тыс. до н.э. (7000–6000 лет назад).
Таким образом, в отличие от неолита Закавка
зья, для неолита Северного Кавказа археологи под
черкивают его преемственность и то, что к северу
от Большого Кавказского хребта «развитие земле
дельческо-скотоводческой культуры … шло своим,
особым путем» [Массон и др., 1982]. В неолите от
мечаются налаженные контакты племен Кавказа с
Закавказьем и Крымом, но не обнаруживаются свя
зи с Передней Азией. Даже неолитическая культу
ра Прикаспия (8000 тыс. лет назад) тяготеет к при
кавказским степям, но не к Передней Азии [Бжа
ния, 1996]. Для неолита Северного Кавказа «харак
терно сочетание … орудий …, весьма близких к
мезолитическим… и примитивной керамикой. Не
которые из этих поселений свидетельствуют о зна
комстве их обитателей со скотоводством и земледе
лием уже в начале VI тыс. до н.э., до появления в
Закавказье энеолитических культур переднеазиатс
кого типа с глинобитной архитектурой и развитым
производящим хозяйством» [Бжания, 1996].
Таким образом, тезис о том, что Кавказ являл
ся одним из первичных очагов формирования зем
232
Глава 7. Генофонды и языки
ледельческо-скотоводческого хозяйства, сейчас
временных народов Северного Кавказа» (Мелюко
(особенно после открытия высокогорной дагестан
ской стоянки Чох, фиксирующей момент перехода
ва, 1989, с. 295). Кобанская культура занимала гор
ные области центрального Кавказа по обе сторо
ны Большого Кавказского хребта и простиралась
от Кубани на западе до Дагестана на востоке (Ко
зенкова, 1989).
от собирательства и охоты к производящей эконо
мике) уже не вызывает дискуссий. Если неолит
Закавказья попал под влияние Передней Азии и
быстро сменился энеолитом, то неолит Северного
ПОЗДНИЕ МИГРАЦИИ С СЕВЕРА
Кавказа продолжал идти своим путем, вырастая из
традиций мезолита и создавая свое земледелие,
керамику И ОДОМашнивая ЖИВОТНЫХ.
Около 2500 лет назад впервые важную роль
начинают играть миграции на Северный Кавказ с
ВЛИЯНИЯ ПЕРЕДНЕЙ АЗИИ В РАННЕБРОНЗОВОМ
севера, из степей Евразии — сначала ираноязычных
ВЕКЕ
народов (скифов, сарматов и их потомков — алан),
затем тюркоязычных (готов, гуннов и т.д.). Под их
Однако на следующем этапе развития культу
давлением не только местное население оттесня
ры населения Кавказа — в бронзовом веке - отмеча
ется смена векторов миграций. В это время в зна
ется в горы, но и кочевое население проникает
вплоть до высокогорий Кавказа, постепенно сме
чительной части Северного Кавказа распространя
шиваясь с автохтонным населением и переходя на
ется Майкопская культура раннебронзового века
оседлый образ жизни (Абрамова, 1989; Мелюко
(ее расцвет приходится на период 5200-4300 лет
назад), «представляющая собой из ярчайших фе
ва, 1989; Агеева, 2000).
номенов бронзового века Европы и всего евразий
ского пограничья» (Мунчаев, 1994, с. 225). Имен
Разгром Алании татаро-монголами (XIII век,
1222—1229 гг.) и Тамерланом (конец XIV века, 1395
1396 гг.) вновь изменил этническую карту Кавка
но в это время предполагается проникновение на
за: в освободившийся ареал, ранее занятый ирано
Северный Кавказ инородных этнических и куль
язычными аланами, стали проникать с запада пле
турных элементов.
«Ни в предшествующую эпоху, ни в последу
ющий период развития бронзового века связи Се
верного Кавказа и Передней Азии не были столь
интенсивными, как в конце IV—III тысячелетии до
мена адыгских народов — будущих кабардинцев и
черкесов. Завершили формирование этнической
картины Северного Кавказатюркоязычные ногай
цы, осевшие в XVI—XVII веках в его степных пред
горьях — от Дагестана до Кубани.
н.э. Не исключено, что на Северный Кавказ про
В начале XVI века начинается последняя мощ
никли и осели здесь отдельные группы населения
из Передней Азии, которые и занесли сюда куль
турные достижения Передней Азии. Одним из ос
ная волна миграций — славянского населения: на
Кавказе появляются первые славянские поселения
— терские казаки, а, начиная с XIX века, в резуль
новных путей, по которому шло это проникнове
тате Кавказской войны славянское население Кав
ние на Северный Кавказ, являлся, по-видимому,
каза (преимущественно русские и украинцы) ста
морской — по Черному морю. Нужда в металле, и
прежде всего в золоте, была, как нам представля
ется, одной из главных причин, привлекших вни
новится все более и более многочисленным.
ИТОГИ
мание населения Передней Азии к Северному Кав
Итак, в формировании населения Кавказа уча
казу» (Мунчаев, 1994, с.225]. Исходная террито
рия переднеазиатских миграций включала ареал от
ствовали четыре основных компонента:
Тигра на востоке до северной Сирии и смежной
части Восточной Анатолии на западе (Мунчаев,
литу;
1994).
Позднее, около 4000 лет назад в значительной
назад);
(1) автохтонное население, восходящее к палео
(2) миграции из Передней Азии (5—4 тыс. лет
банская археологическая культура, расцвет кото
рой приходится на период 3200—2400 лет назад
|Крупнов, 1960, 1969), а постепенное развитие
прослеживается с эпохи поздней бронзы до сар
матского времени, а в горных районах - до раннего
(3) миграции из степей Евразии ираноязычных
и тюркоязычных народов (2,5-0,5 тыс. лет назад);
(4) миграции славянского населения (0,5 тыс.
лет назад — современность).
Роль каждого из этих сценариев в формирова
нии генофонда Северного Кавказа неизвестна, и
средневековья. Эта культура местная и восходит к
даже данные антропологии дают весьма противо
древнему автохтонному населению Центрального
Кавказа. Причем «большинство кавказоведов при
речивую картину формирования населения Кавка
за|Абдушелишвили, 1964: Алексеев, 1974: Гера
части Северного Кавказа развивается местная ко
держиваются мнения, что эта древняя кавказская
симова, Рудь, Яблонский, 1987). Так, академик В.П.
этническая общность являлась мощным субстра
Алексеев считал кавкасионный массивный тип
том в последующем формировании почти всех со
древнейшим, а грацильный понтийский — произ
7.1. Структура и история народонаселения Кавказа
водным. Его позицию в отношении кавкасионного
типа можно в нескольких словах охарактеризовать
как «древность, преемственность, масштабность,
консервация» [Кашибадзе, 2006]. Другой, не менее
знаменитый, антрополог М.Г. Абдушелишвили на
стаивал, что, напротив, в ареале кавкасионного
типа шло локальное увеличение массивности, толь
ко лишь имитирующее палеоевропеоидность. Его
позицию можно в нескольких словах охарактери
зовать как «древность, преемственность, автохтон
ность, динамизм» [Кашибадзе, 2006].
При этом по данным одонтологии формирова
ние народонаселения Кавказа представляло собой
233
развитие единой популяционной системы, связан
ной общностью происхождения и сохраняющей в
совокупности исходный предковый фенофонд за
падных групп Евразии [Кашибадзе, 2006].
Таким образом, велика потребность в новом
историческом источнике, чтобы решить, какие
из миграций оказали основное влияние на его ге
нофонд, а какие проявились лишь в культуре, не
затронув генетические основы. Таким новым ис
точником, дополняющим антропологические и
археологические данные, могут стать современ
ные генетические и лингвистические исследова
ния.
НАРОДОНАСЕЛЕНИЕ КАВКАЗА ПО ДАННЫМ ЛИНГВИСТИКИ
СЕВЕРОКАВКАЗСКИЕ ЯЗЫКИ ПО ДАННЫМ
ГЛОТТОХРОНОЛОГИИ
РАСПРЕДЕЛЕНИЕ ОСНОВНЫХ ЯЗЫКОВЫХ ГРУПП
НА КАВКАЗЕ
В результате многочисленных исследований
языков северокавказской языковой семьи[Гигене
ишвили, 1977; Шагиров, 1977; Талибов, 1980; Бо
карев, 1981; Chirikba, 1996] был накоплен большой
массив лингвистических данных и выявлены за
кономерные фонетические соответствия между
языками. В результате была создана классифика
ция [Николаев, Старостин, 1994], которая стала
наиболее общепринятой с некоторыми частными
изменениями[Kuipers, 1963; Comrie, 1987; Ruhlen,
1987; www.ethnologue.com].
Эта классификация основана на распростра
ненном методе анализа инноваций и на глоттохро
нологическом методе [Старостин, 1989], который
в настоящее время широко используется в проекте
«Эволюция языков человека» и координируется
институтом Санта-Фе, США (http://ehl.santafe.edu/
intro1.htm, http://starling.rinet.ru/main.html). Напри
мер, применение этого метода к современным язы
кам романской группы вывело дату их разделения
от общего праязыка примерно 1600 лет назад. Это
соответствует времени распада Римской империи,
когда вульгарная латынь (Latina Vulgata, общий
язык в провинциях империи) стала подразделять
ся на региональные диалекты [Blazhek, Novotna,
2008]. Этот пример подтверждает правомерность
иточность такой методологии. Достоверность глот
тохронологического метода датирования языков
продемонстрирована на временных отрезках до 10
тысяч лет [Gell-Mann и др., 2008; Starostin, 2003].
Отметим, что имеются и иные лексико-статис
тические методы, в которых используется байесов
ский подход к увеличению статистической надеж
ности языковой классификации [Gray, Atkinson,
2003; Kitchen et al., 2009; Greenhill et al., 2010].
Использование этих методов для сравнительного
анализа лингвистического и генетического разно
образия Кавказа, видимо, будет предпринято в бу
дущих исследованиях лингвистов.
С точки зрения лингвистики Кавказ представ
ляет собой мозаику, состоящую из более чем 50
языков, подавляющее большинство которых при
надлежит к северокавказской языковой семье. Наи
более многочисленными представителями двух
других языковых семей являются: а) ираноязыч
ные осетины и пришлые славянские народы (ин
доевропейская семья); б) тюркоязычные народы
(алтайская семья) [Ruhlen, 1987].
Обширные пространства от побережья Черно
го моря до Центрального Кавказа занимают народы
абхазо-адыгской группы северокавказской лингви
стической семьи. Еще несколько столетий назад
почти все они пользовались собирательным само
названием «адыге», а европейцами столь же соби
рательно именовались «черкесами». Огромное раз
нообразие племенных иродовых групп, говоривших
на абхазо-адыгских языках, в XIX веке резко сокра
тилось в результате Кавказской войны, и к настоя
щему времени выделяются только пять народов:
абазины, абхазы, адыгейцы, кабардинцы, черкесы.
К востоку от абхазо-адыгской группы расселе
ны осетины Центрального Кавказа – единственный
народ на Кавказе, который говорит на иранской
ветви индоевропейской языковой семьи и который
оседлал Большой Кавказский хребет, образовав по
его северному и южному склонам Северную и
Южную Осетию.
На востоке они граничат с нахскими народами
северокавказской языковой семьи – ингушами, че
ченцами и бацбийцами.
Еще восточнее, у Каспийского моря прожива
ют народы Дагестана, столь многочисленные и
лингвистически разнообразные, что идут споры о
количестве языков и народов Дагестана – от 30 до
50. Однако все они, за исключением тюркоязыч
ных караногайцев и кумыков, говорят на языках
дагестанской ветви северокавказской языковой
семьи.
Глава 7. Генофонды и языки
234
Тюркоязычные народы алтайской языковой
семьи на Кавказе не имеют приуроченности к оп
ределенному региону и представлены отдельны
ми вкраплениями: на Западном и Центральном
Кавказе балкарцы, карачаевцы и кубанские ногай
цы, на Восточном Кавказе – кумыки и караногай
цы.
Однако для оценкироли лингвистическогород
ства в формировании генетического разнообразия
такая классификация может рассматриваться лишь
как вспомогательная. Она является качественной,
а не количественной, и очерчивает лишь основные
контуры лингвистического древа. Тем более, что
далеко не все лингвисты согласны с таким деле
нием и для северокавказской языковой семьи пред
лагают новые ветвления и подразделения. Впро
чем, ни одна из этих классификаций не позволяет
провести прямое количественное сравнение гене
тики и лингвистики, что является одной из задач
нашего исследования. Поэтому для выявления роли
лингвистического родства мы использовали дос
тижения современных направлений лингвистики
– лексикостатистики и тесно с ней связанной глот
тохронологии.
МЕТОДОЛОГИЯ ЛИНГВИСТИЧЕСКИХ ДАТИРОВОК
МЕТОДЫ ЛЕКСИКОСТАТИСТИКИ
Для реконструкции родства языков необходи
мо рассмотреть, какими методами языки могут
быть классифицированы как точки на древе, ото
бражающем их происхождение от праязыка. Язы
ковые “знаки”, как правило, двухсоставные: они
включают и семантику (значение), и текст, а связь
между ними задается традицией конкретного язы
ка. Случайное совпадение текста изначения в двух
разных языках при рассмотрении большого набо
ра слов является статистически маловероятным.
Поэтому основной постулат сравнительно-истори
ческого языкознания состоит в том, что такие со
впадения показывают, что эта пара знаков в двух
языках является двумя различными отражениями
одного прото-знака. Две формы слов на двух язы
ках могут быть выведены из третьей (гипотетичес
кой) прото-формы этого слова, следуя регулярным
фонетическим правилам. Эти прото-знаки могут
быть или унаследованы от общего праязыка, или
же могут быть результатом контакта языков (заим
ствований). Чтобы различать эти два случая, ис
пользуется определенный набор правил, касаю
щихся набора слов (знаков) с их прото-формами.
Основное предположение специальной ветви
сравнительно-исторического языкознания – глот
тохронологии – состоит в следующем: процесс за
мены слов в языке может быть описан как случай
ная вероятность, и может быть вычислен средний
коэффициент замещения.
Для этого необходимо включить в анализ сло
со
ва значениями, принадлежащими к так называ
емой предварительной (базовой, докультурной)
лексике. Такие слова, как правило, не заимствуют
ся при контакте народов, поскольку они являются
базовыми для любой человеческой культуры, при
сутствуют в любом языке, и потому нет необходи
мости взаимствовании их из другого языка. Таким
образом, списки слов, используемые в лексико-ста
тистических расчетах, составляют из тех темати
ческих групп, в которых заимствование слов про
исходит редко [Swadesh, 1955; Старостин, 1989].
Редкие заимствованные слова считаются “инфор
мационным шумом” и исключаются из расчетов
[Старостин, 1989].
Этот подход в его первоначальном варианте
был предложен Сводешем [Swadesh, 1955]. В со
временных исследованиях вместо формулы линей
ной скорости замещения слов используется модель
“релаксирующие часы” (“relaxed clock”) [Kitchen
еt al., 2009] или экспоненциальная формула. Спис
кислов Сводеша недавно были успешно исполь
зованы для реконструкции языков индоевропейс
кой [Gray, Atkinson, 2003], семитской [Kitchen et
al., 2009], австронезийской [Greenhillet al., 2010] и
других языковых семей. В этих исследованиях
большинство усилий было предпринято в направ
лении статистического анализауже существующих
наборов данных, в том числе математического мо
делирования и использования передовых подходов
расчета (например, байесовские цепи Маркова,
метод Монте-Карло), аналогичные тем, которые
используются в эволюционной биологии.
Другая исследовательская группа – московской
школы глоттохронологии – применила списки слов
Сводеша для классификации тюркской [Дыбо,
2006], палеосибирской [Мудрак, 2008], северокав
казской [Николаев, Старостин, 1995], алтайской
[Старостин, 1991] и ряда других языковых семей.
В этих исследованиях значительные усилия были
вложены в создание новых высококачественных
наборов данных, в том числе проведены этимоло
гические исследования, установлены фонетичес
кие правила, а также исключены заимствования.
Аналитические методы Сводеша были скорректи
рованы С.А. Старостиным [Старостин, 1989], и с
тех пор существенно не изменялись.
МЕТОД ЛИНГВИСТИЧЕСКОГО ДАТИРОВАНИЯ
Лингвистические датировки рассчитываются
по числу замененных слов, которые накопились
после распада праязыка [Старостин, 1989;
7.1. Структура и история народонаселения Кавказа
Embleton, 2000]. Этот глоттохронологический под
ход был впервые использован С.А. Старостиным
для северокавказских языков [Николаев, Старо
стин, 1995].
Распад стабильных лексических элементов из
первоначального списка может быть математичес
ки описан формулой, предложенной С.А. Старо
стиным [Старостин, 1989]:
ttC
)(
eCtC
 0
где С(t) – частота слов из основного списка, со
хранившихся в данном языке в момент времени t,
С0 – первоначальный основной список,
λ – коэффициент скорости замены слов из ос
новного списка.
Для лексической глоттохронологии использу
ют 100-словники (список Сводеша), для которого
λ = 0.05 [Старостин, 1989].
При расчете датировки распада двух языков, эта
зависимость приобретает вид:
)(2
tCt
2 )(
 0 
eCtC
где С2 (t) частоты слов, выживших в обоих язы
ках-потомках.
На основе этой формулы можно вычислить
время t, используя коэффициент λ и частоту слов,
сохранившихся в языковой паре:
2)(
22
tC
2
)(ln
2
C
0
t  
2 tC
2
)(
В нашем исследовании[Balanovsky et al., 2011]
ведущими российскими лингвистами – член-кор
респондентом РАН Анной Владимировной Дыбо
и профессором Олегом Алексеевичем Мудраком приложены особые усилия для создания высоко
качественной, расширенной и переработанной язы
ковой базы северокавказских языков. К этим дан
ным А.В. Дыбо и О.А. Мудраком был применен
глоттохронологический подход. Благодаря этому в
нашем исследовании появилась уникальная воз
можность провести прямое – полностью количе
ких данных
для одних и техязыковых
ственное
– сопоставление
же этнических
и генетичесгрупп.
СХОДСТВО МЕЖДУ ЛИНГВИСТИЧЕСКИМИ И
ГЕНЕТИЧЕСКИМИ МЕТОДАМИ ДАТИРОВАНИЯ
Расчет лингвистических дат основывается на
подсчете различий, которые накопились после мно
гочисленных разделений языков [Старостин,
1989]. Генетические даты рассчитываются по чис
лумутаций, которые накопились после роста дре
235
ва гаплотипов в пределах гаплогруппы, как под
робно описано в главе 1. Оба подхода используют
коэффициент (скорость возникновения измене
ний), который преобразует разнообразие (генети
ческое или же языковое) во время. Илингвистика,
и генетика получают этот коэффициент по калиб
ровке на конкретных примерах с известным раз
нообразием и известным временем, за которое на
копилось это разнообразие. Столь выраженное
методологическое сходство лингвистических и ге
нетических датировок позволяет напрямую срав
нить генетические и языковые даты. Эти даты да
лее можно сопоставлять с событиями в истории
популяции, которые привели к разделению языков
и к появлению генетического разнообразия. Кро
ме сравнения генетических и лингвистических
датировок, возможно сравнение генетических и
лингвистических расстояний между одними и теми
же популяциями. Для этого потребовалось только
преобразовать лингвистическое сходство в рассто
яние, взяв обратные величины.
Отметим еще одну особенность, общую гене
тическим и лингвистическим датировкам.
С генетической точки зрения, когда прапопу
ляция распадается, и в одной из дочерних популя
ций возникает кластер гаплотипов Y-хромосомы,
он будет ограничен этой популяцией (предполага
ется, что миграция мужчин между популяциями
незначительна). Возраст кластера является не да
тировкой распада прапопуляции, а датировкой рас
пространения кластера, которое могло произойти
в любое время после распада прапопуляции.
С лингвистической точки зрения, нововведе
ния, представленные в одном языке/диалекте, но
отсутствующие в другом, возникают после разде
ления прото-популяции на частично изолирован
ные субпопуляции. Языковая датировка разделе
ния, таким образом, покажет тот момент, когда язы
ковые различия уже стали фиксированными, а не
момент самого разделения. Таким образом, нача
ло популяционной дивергенции могло произойти
за несколько поколений до даты, определяемой по
лингвистическим данным. Возможно и дополни
тельное отставание языковой датировки на вели
чину времени, необходимого для включения вновь
вводимых слов из устной речи в письменные ис
точники, которые используются для лексико-ста
тистического анализа.
С учетом этих особенностей и языковой, и ге
нетический методы датирования рассматривались
в нашем исследовании как наиболее поздняя (ниж
няя, более близкая к современности) оценка вре
мени разделения популяции.
Глава 7. Генофонды и языки
236
7.2. СРАВНЕНИЕ ЛИНГВИСТИЧЕСКОЙ И ГЕНЕТИЧЕСКОЙ СТРУКТУРЫ
КАВКАЗА
Изучение взаимосвязи лингвистической и ге
нетической изменчивости народонаселения Кавка
за проведено на обоих уровнях анализа Y-хромо
сомы – гаплогрупп и гаплотипов. На уровне гап
логрупп (данный раздел) разными методами срав
нивается распределение частот гаплогрупп и рас
пределения языков в одних и тех же популяциях.
На уровне гаплотипов (раздел 7.3) выделяются и
датируются кластеры гаплотипов, определяется их
популяционная «принадлежность», и затем гене
тические датировки гаплотипов данной группы
популяций сравниваются с лингвистическими да
тировками языков, на которых говорят эти попу
ляции. Эти два вида анализа (на уровне гаплогрупп
и на уровне гаплотипов) независимы друг от дру
га, что дает дополнительный контроль правильно
сти выводов.
Отметим, что если анализ науровне гаплогрупп
на Кавказе проводился во многих исследованиях
[Nasidze et al.,2003, 2004a,b; Bulaeva et al., 2006;
Caciagli et al., 2009; Tofanelli et al., 2009; Кутуев,
2010; Дибирова и др., 2010; Yunusbaev et al., 2012;
ряд других работ тех же коллективов], то анализ
многосотенной выборки на уровне гаплотипов
впервые был проведен в нашем исследовании и
опубликован в [Balanovsky et al., 2011].
Выборки, изученные по Y-хромосоме, были
охарактеризованы в главе 2 (табл. 2.3, рис. 2.1).
Планирование этих выборок было проведено та
ким образом, чтобы охватить и основные регионы
Северного Кавказа, географически подразделяемо
го на Западный, Центральный и Восточный, и ос
новные лингвистические группы этих регионов.
Исследование, охватившее все народы тюркской
ветви алтайской семьи Северного Кавказ и Закав
казья, является самостоятельным направлением,
разрабатываемым нашим коллективом [Схаляхо и
др., 2013; Схаляхо, 2013] в рамках взаимодействия
народов Кавказа и евразийской степи, и потому в
этой книге не рассматривается. Остальные изучен
ные нами тринадцать народов относятся к трем
ветвям (абхазо-адыгской, нахской и дагестанской)
северокавказской языковой семьи, к трем ветвям
(иранской, армянской и славянской) индоевропей
ской языковой семьи и представляют население
четырех географических регионов: Западного,
Центрального, Восточного Кавказа и Закавказья,
как следует из приводимого ниже перечня.
Северокавказская языковая семья:
– адыго-абхазская группа (шапсуги, абхазы,
черкесы);
– нахская группа (ингуши, чеченцы);
– дагестанская группа (аварцы, даргинцы, ку
бачинцы, кайтагцы и лезгины).
Индоевропейская языковая семья:
– иранская группа (осетины);
– армянская группа (армяне);
– славянская группа (терские и кубанские ка
заки).
Сравнение генетической и лингвистической
структурированности популяций на уровне частот
гаплогрупп проведено четырьмя независимыми
методами. Результаты всех четырех видов анализа
поочередно описываются в данном разделе.
СРАВНЕНИЕ МЕТОДОМ ДЕНДРОГРАММ
Самым простым методом является кластерный
анализ – построение дендрограмм отдельно по ге
нетическим и по лингвистическим данным, и за
тем их сравнение. Такой подход традиционен для
популяционной генетики человека [Cavalli-Sforza
et al., 1994].
Эти две дендрограммы для генетически изучен
ных нами народов Кавказа представлены на рис.
7.1. На генетической дендрограмме кубачинцы и
кайтагцы оказались наиболее схожими популяци
ями, образуя тесный кластер, к которому последо
вательно присоединяются аварцы и даргинцы, а
затем лезгины (рис. 7.1, слева). На лингвистичес
ком древе (рис. 7.1, справа) мы видим ту же топо
логию, за исключением того, что даргинцы присо
единились к кубачино-кайтагскому кластеру до
аварцев.
Следующий кластер идентичен на генетичес
ком и лингвистическом деревьях (рис. 7.1) и со
держит только народы нахской ветви – чеченцев и
ингушей.
Третий кластер объединяет сперва шапсугов и
черкесов, а затем к нему присоединяются абхазы.
И вновь эта топология идентична на обеих денд
рограммах.
Наконец, осетины, говорящие на индоевропей
ском языке, далеко отстоят на лингвистической
дендрограмме от других народов. Аналогично и на
генетической дендрограмме они занимают особое
место, обнаруживая лишь небольшое сходство с
абхазо-адыгским кластером.
Таким образом, дендрограмма, основанная на
генетических расстояниях, точно отражает линг
вистическую дендрограмму практически со всеми
ее деталями.
7.2. Сравнение лингвистической и генетической структуры Кавказа
237
Рис. 7.1. Сравнение генетической и лингвистической дендрограмм родства народов Кавказа.
СРАВНЕНИЕ МЕТОДОМ ГЕНЕТИЧЕСКИХ ГРАНИЦ
Выявление генетических границ, то есть зон
резких изменений между соседними генофондами,
является традиционной задачей для популяцион
ной генетики [Womble, 1951; Cavalli-Sforza et al.,
1994]. Анализ, проведенный с помощью програм
мы Barrier 2.2, позволил объективным методом
выделить положение генетических границ на кар
те Кавказа (рис. 7.2). Эти границы подразделяют
генофонд Кавказана отдельные сегменты.
Первая – самая резкая – граница «A» (рис. 7.2)
разделяет генофонд Кавказана народы Восточно
го Кавказа (нахско-дагестанская лингвистическая
группа) и все прочие популяции.
Следующая по значимости граница «B» про
ходит внутри Восточного Кавказа и отделяет че
тыре популяции чеченцев и ингушей от народов
Дагестана.
Следующая граница «C» разделяет ираноязыч
ных осетин Центрального Кавказа и абхазо-адыг
ские народы Западного Кавказа.
Таким образом, первые три основные генети
ческие границы разделили Кавказ на четыре реги
она. Важно, что каждый из этих регионов совпа
дает с зоной преобладания одной из четырех ос
новных гаплогруппY-хромосомы. Рассмотрим это
совпадение поочередно для каждого региона.
1. На Западном Кавказе в генофонде народов
абхазо-адыгской группы мажорной является гап
логруппа G-P303. Ее средняя частота составляет
54%, варьируя счастотой от 21% у черкесов до 86%
у шапсугов. Во всех других популяциях Кавказа
частота этой гаплогруппы не поднимается выше
10%, в среднем составляя всего лишь 2%.
2. На Центральном Кавказе в генофонде
осетин мажорной является гаплогруппа G-P18.
Ее средняя частота составляет 63%, варьируя от
60% у дигорцев до 73% у иронцев. У других на
родов Кавказа частота этой гаплогруппы не под
нимается выше 12%, в среднем составляя всего
лишь 3%.
3. Для генофонда нахских народов Восточ
ного Кавказа – ингушей и чеченцев - характер
на гаплогруппа J-М67(xM92). Ее средняя час
тота составляет 70%, варьируя от 51% у чечен
цев из Ингушетии до 84% у ингушей. У осталь
ных этносов Кавказачастота этой гаплогруппы
не превышает 9%, в среднем составляя всего
лишь 3%.
4. У народов Дагестана мажорной является
гаплогруппа J-M267(xP58). Ее средняя частота со
ставляет 70%, варьируя у аварцев, даргинцев, кай
тагцев, кубачинцев и лезгин от 44% до 99%. Сча
стотой менее 25% она встречается у чеченцев и
ингушей (нахская языковая группа), а у остальных
народов Кавказа ее частота менее 5%.
Таким образом, приуроченность каждой из че
тырех гаплогрупп к одному из четырех доменов
на Кавказе выражена очень ярко. Эту закономер
ность можно интерпретировать двумя способами.
С одной стороны, она показывает четкую связь
с географией, так как каждая из четырех гаплог
рупп Y-хромосомы преобладает в конкретном гео
графическом регионе Кавказа.
С другой стороны, обнаруженная закономер
ность не менее четко вписывается в языковую клас
сификацию, поскольку каждая из четырех гаплог
рупп приурочена к популяциям, говорящим на язы
ках одной из четырех основных лингвистических
групп Кавказа.
Глава 7. Генофонды и языки
-
39"
2
40°
45°
46°
47-
шапсуги
48"
—
-
-
2.*
S
км
S
К а
S (S\
44"
-
о *
-
44"
гг.
o
ст.
м.
*
x —
Эётины-дигорцы
43"|
,
гт
а
7
42
2
Со о
*
г.
г.
4з"
АБХА3ы
*
42°
Гаплогруппы
G2a3-Р303
Лингвистические группы
АБХАЗО-АДЫГСКАЯ
иранская
НАХСКАЯ
G2a1-Р18
пл:a4b-м67
* ил-м267
йуи,
}
-2
ДАГЕСТАНСК
другие
""}/Т-2 ати Z ил:}","
39°
40°
41"
2
42"
Рис. 7.2. Географическая приуроченность четырех гаплогрупп и анализ генетических границ.
Обозначения. Каждая изученная популяция показана круговой диаграммой, размер секторов разного цвета от
ражает частоту соответствующей гаплогруппы Y-хромосомы согласно легенде. Пунктирные линии обозначают
объективные генетические границы, полученные с помощью программы Ваrrier 2.2 и обозначенные буквами ла
тинского алфавита по степени убывания значимости границ (черным пунктиром обозначены первые три наиболее
значимые границы — А, В, С). Цветным фоном показаны ареалы лингвистических групп.
СРАВНЕНИЕ МАТРИЦ РАССТОЯНИЙ
В предыдущем подразделе получено идеальное
соответствие распределения гаплогрупп Y-хромо
(табл. 7.3). Из всех изученных коренных народов
сомы и с географической, и с лингвистической
лишь осетины, говорящие на языке индоевропей
ской семьи, поскольку расчет лингвистических
расстояний международами, относящимися к раз
ным языковым семьям, проблематичен. Данные о
популяциях, говорящих на одном языке, были для
структурой Кавказа. Необходимо решить, какой из
этих факторов является определяющим. Предыду
щие исследователи Кавказа пришли к выводу о том,
что основным фактором в формировании структу
ры генофонда выступал географический фактор, а
не лингвистический (Nasidze et al., 2003: 2004;
Кутуев, 2010). Однако в нашем исследовании мы
не только располагали намного более обширными
выборками для всех основных этносов Северного
Кавказа, генотипированными по намного более
Северного Кавказа в анализ не были включены
этого вида анализа усреднены.
широкой панели SNР-маркеров, но и, благодаря
Сравнение скоррелированности этих трех мат
риц проводилось с помощью теста Мантеля. В ре
зультате (табл. 7.4) обнаружены достоверные
(p=0.002) корреляции—как между генетикой и лин
гвистикой (r = 0.64) так и между генетикой и гео
графией (r= 0,60). Отметим, что корреляция с лин
тесному сотрудничеству с ведущей школой лекси
гвистикой оказалась несколько выше.
костатистики, впервые имели возможность прове
сти не качественный, а точный количественный
При проведении корреляционного анализа
нужно учитывать зависимость от взаимодей
анализ лингвистического сходства.
ствия факторов. Корреляция двух показателей
Для сравнения роли географического и линг
вистического факторов мы вычислили три матри
может быть следствием того, что они оба скор
релированы стретьим признаком. В этом случае
необходим анализ корреляций между двумя при
цы попарных расстояний между всеми изученны
ми народами: матрицу генетических расстояний
(табл. 7.1), матрицу лингвистических расстояний
(табл. 7.2) и матрицу географических расстояний
знаками при фиксированных значениях осталь
ных признаков (анализ частных корреляций).
Поэтому частные корреляции рассчитаны меж
7.2. Сравнение лингвистической и генетической структуры Кавказа
239
Таблица 7.1. Генетические расстояния (по частотам гаплогрупп) международами Кавказа
Абхазы
| Аварцы
Ингуши
Даргинцы
Лезгины
Черкесы
Шапсуги
Чеченцы
Абхазы
()
1.40
1.42
3.39
| ()2
().07
().04
| 15
Аварцы
1.40
()
| 50
() ()5
() ()6
1. 14
1.66
().81
Ингуши
1.42
| 50
()
| 88
1 87
().74
2.62
().03
Даргинцы
3.39
() ()5
| 88
()
(). 19
| 80
4.32
| ()2
Лезгины
| ()2
() ()6
1 87
(). 19
()
| ()|
| 38
1.03
Черкесы
().08
1. 14
().74
| 80
| ()|
()
(). 17
(). 61
Шапсуги
().04
1.66
2.62
4.32
| 38
(). 17
()
| 83
Чеченцы
1. 14
().81
(). 034
| ()2
1.03
(). 61
| 83
()
Таблица 7.2. Лингвистические расстояния (доля общих слов") международами Кавказа
Абхазы
Аварцы
Ингуши
Даргинцы
Лезгины | Черкесы
Шапсуги
Чеченцы
Абхазы
()
4.55
5.26
5.26
5.26
2.04
2.08
5.26
Аварцы
4.55
()
3.23
3.33
3.23
4.76
4.76
3.03
Ингуши
5.26
3.23
()
4
3.85
4.35
4.35
| ()8
Даргинцы
5.26
3.33
4.00
()
3.23
4.35
4. 17
4.35
Лезгины
5.26
3.23
3.85
3.23
()
4.76
4.76
3.85
Черкесы
2.04
4.76
4.35
4.35
4.76
()
| ()8
4.55
Шапсуги
2.08
4.76
4.35
4. 17
4.76
| ()8
()
4.55
Чеченцы
5.26
3.03
| ()8
4.35
3.85
4.55
4.55
()
*Лингвистические расстояния рассчитаны по методу С.А. Старостина (Старостин, 1989) в сотрудничестве с
представителями московской школы глоттохронологии (член-корр. РАН А.В. Дыбо и проф. О.А. Мудраком). Рас
стояния между парой языков представляют собой величину, обратную доле совпадающих слов из стословного
стандартного списка М. Сводеша, после исключения лингвистических заимствований.
Таблица 7.3. Географические расстояния (в километрах) международами Кавказа
Абхазы | Аварцы | Ингуши | Даргинцы | Лезгины | Черкесы | Шапсуги | Чеченцы
Абхазы
()
47()
33()
52()
54()
| 90
28()
370
Аварцы
47()
()
170
6()
| 20
440
650
140
Ингуши
33()
170
()
23()
28()
28()
490
40
Даргинцы
52()
6()
23()
()
70
5()()
710
200
Лезгины
54()
| 20
28()
70
()
550
76()
260
Черкесы
| 90
440
28()
5()()
550
()
21 ()
3 ] ()
Шапсуги
28()
650
490
710
76()
21 ()
()
52()
Чеченцы
370
140
40
200
260
3 ] ()
52()
()
Таблица 7.4. Корреляция между генетическими, лингвистическими и географическими расстояниями
Тип корреляции
Корреляция между параметрами
Коэффициент
Уровень
корреляции
ЗНaЧИМОСТИ
Парная корреляция
Генетика и лингвистика
0.64
() ()()2
Парная корреляция
Генетика и география
0.60
() ()()|
0.34
(). 12()
(). 21
(). 180
Генетика и лингвистика
Частная корреляция
(без влияния географии)
Частная корреляция
Генетика и география
(без влияния лингвистики)
Глава 7. Генофонды и языки
240
ду генетикой и каждым из других признаков –
лингвистики и географии – по отдельности, при
фиксированных значениях второго фактора. К
сожалению, анализ осложняется тем, что линг
вистическая изменчивость на Кавказе сама тес
но связана с географией (r = 0.78). Поэтому час
тные корреляции с обоими факторами не дости
гают уровня достоверности (табл. 7.4). Но важ
на тенденция: связь генетики с лингвистикой (r
= 0.34) почти в полтора раза сильнее, чем с гео
графией (r = 0.21). Таким образом, коэффициен
ты и общей, и частной корреляции указывают на
более выраженную связь генетики с лингвисти
кой, чем с географией.
СРАВНЕНИЕ МЕЖПОПУЛЯЦИОННОГО РАЗНООБРАЗИЯ
Для проверки этой тенденции был использо
ван независимый метод AMOVA (табл. 7.5). Ме
тод AMOVA позволяет сгруппировать популяции
согласно различным классификациям и сравнить
получившиеся величины генетического межпопу
ляционного разнообразия. В качестве одной клас
сификации послужили географические регионы
(популяции группировались согласно географичес
кому соседству), в качестве альтернативной клас
сификации взята лингвистическая (популяции
группировались по их лингвистическому родству).
Немаловажно, что в этом виде анализа мы можем
учесть генофонды не только народов северокавказ
ской языковой семьи (как при анализе матриц рас
стояний), но и осетинские популяции, представ
ляющие индоевропейскую языковую семью в ко
ренном населении Северного Кавказа.
В первом случае доля генетической изменчи
вости между географическими группами состави
ла FST=0.15. Во втором варианте доля генетичес
кой изменчивости между лингвистическими груп
пами оказалась почти в два раза выше: FST=0.27.
Таким образом, лингвистическая классификация
популяций выявляет намного большую часть меж
популяционной изменчивости генофондов, чем
классификация по географическим регионам. То
есть именно лингвистическое сходство, а не гео
графическое соседство объясняет основную часть
изменчивости Y-хромосомы на Кавказе.
Этотрезультат был получен впервые нашим кол
лективом [Дибирова и др., 2010; Balanovsky et al.,
2011]. В предшествовавших работах достоверные
корреляции первоначально вообще неудавалось вы
явить [Nasidze et al., 2004]. Это могло быть связано
с малыми выборками и недостаточным уровнем
филогенетического разрешения (анализировались
всего десять гаплогрупп, тогда как в нашем иссле
довании – в четыре раза больше). В работе [Кутуев,
2010] была снова предпринята попытка оценить
роль географического и лингвистического фактора
в структурировании генофонда Кавказа по Y-хро
мосоме, и обнаружена несколько более высокая
связь с географией. Вероятно, это объясняется от
части вновь недостаточной дробностью гаплогрупп
(в особенности отсутствием подразделения гаплог
руппы G-P15 на субтипы, которые как раз и диффе
ренцируют осетин от популяций Западного Кавка
за), а отчасти использованием не количественных,
аменее точных качественных лингвистических дан
ных. В более поздней статье того же коллектива
[Yunusbaev et al., 2012] использованы большие и
подробно охарактеризованные выборки, но вопрос
внутренней структуры генофонда Кавказа по Y-хро
мосоме специально не ставился, поскольку основ
ная задача работы состояла в сравнении Кавказа с
другими регионами мира, причем главным образом
по аутосомным маркерам.
Итак, все четыре вида проведенного анализа
(кластерный анализ, анализ генетических границ,
тест Мантеля и AMOVA) убедительно демонстри
руют, что для народонаселения Кавказалингвис
тическое родство является более важным, чем гео
графическое соседство, фактором формирования
разнообразия Y-хромосомы.
Таблица 7.5. Сравнение генетической информативности географической и лингвистической
классификаций методом AMOVA
Уровни популяционной системы
Лингвистические
группы
Географические
группы
0.268
0.146
0.099
0.235
Суммарные межпопуляционные генетические различия
0.367
0.381
Генетические различия внутри популяций
0.633
0.619
Генетические различия между группами
Генетические
различия между популяциями внутри
групп
7.3. Филогенетические датировки на Кавказе
241
7.3. ФИЛОГЕНЕТИЧЕСКИЕ ДАТИРОВКИ НА КАВКАЗЕ
Если предыдущий раздел был посвящен ана
лизу на уровне гаплогруппY-хромосомы, то теперь
мы переходим канализу на уровне гаплотипов.
Поскольку все образцы изучались не только по
панели SNP-маркеров, но и по панели 17 STR-мар
керов, то был впервые получен обширный массив
данных о STR-гаплотипах кавказских популяций.
На основании этого массива данных были постро
ены филогенетические сети всех основных кавказских гаплогрупп, выделены кластеры гаплотипов
и определена их популяционная принадлежность.
Наиболее существенно, что генетические датиров
ки этих популяционно-специфичных кластеров
гаплотипов были сопоставлены с лингвистически
ми датировками языков, на которых говорят эти
популяции.
ДАТИРОВКИ ПОПУЛЯЦИОННО-СПЕЦИФИЧНЫХ КЛАСТЕРОВ ГАПЛОТИПОВ
Были построены филогенетические сети для
одиннадцати основных гаплогрупп Кавказа: G2a*
P15(xP16,M406,P303), G2a1a-P18, G2a3b1-P303,
J1*-M267(xP58), J2*-M172(xM47,M67,M12),
J2a3b*-M67(xM92), L-M20, R1a1*-M198(xM458),
R1a1a1g-M458, R1b1a2-M269 и Q-M242. Почти
на всех сетях обнаружено явление популяционной
специфичности кластеров гаплотипов.
Наиболее яркой в этом отношении является фи
логенетическая сеть гаплогруппы G2a1a-P18 (рис.
7.3). Эта гаплогруппа встречается почти исключи
тельно на Кавказе. Сеть состоит из ветвей STR
гаплотипов, соединенных в центральной ретику
лярной зоне. На рисунке видно разделение на два
крупных и один меньший кластер, обозначенные,
соответственно, α, β и γ.
Кластерα включает в основном STR-гаплоти
пы, встреченные у осетин-иронцев. Структура кла
стера звездчатая, счастым центральным гаплоти
пом основателя и несколькими основателями вто
рого порядка. В кластер β попали преимуществен
но гаплотипы осетин-дигорцев. Для него тоже вид
на звездчатая структура. Третий, менее многочис
ленный кластер γ включает обе осетинские попу
ляции и имеет более сложную структуру.
Если бы эта гаплогруппа распространялась на
Кавказе долгое время, она имела бы совершенно
другой вид. Звездчатая же структура обоих клас
теров указывает на их сравнительно молодой воз
раст. Для кластеровα и β среднее число мутацион
ных шагов сходно (1,46 и 1,41), что указывает на
одно время возникновения.
Таким образом, филогенетическая сеть гаплог
руппы, наиболее частой у осетин, демонстрирует
подразделение осетин на две субпопуляции. Мы
видим запечатленную в филогенетической сети
микроэволюцию осетинской популяции: ее разде
ление на две дочерних, возникновение в каждой
из них своего гаплотипа-основателя, и постепен
ное нарастание генетического разнообразия обе
их субпопуляций в ходе мутационного процесса.
Совпадение датировок показывает, что, скорее все
го, оба кластера возникли почти сразу же после
разделения на субпопуляции.
Подобное явление обнаруживается и на фило
генетических сетях для остальных гаплогрупп Кав
каза (рис. 7.4). Для каждой гаплогруппы обнару
жено наличие специфичных кластеров гаплотипов,
характерных для отдельной популяции и отсутству
ющих у других народов.
Таких популяционно-специфичных кластеров
обнаружены десятки, что позволяет провести ста
тистически обоснованный анализ. Обилие попу
ляционно-специфичных кластеров, вероятно, выз
вано высокой эндогамией и изоляцией кавказских
популяций. Для последующего анализа отбирались
лишь наиболее надежные кластеры, которые соот
ветствовали следующим критериям:
а) кластер не должен быть слишком мелким –
входящие в него гаплотипы должны быть встрече
ны суммарно у не менее чем 10 человек;
б) кластер должен четко идентифицироваться
на медианной сети: все гаплотипы кандидатного
кластера должны соединяться с центральным гап
лотипом-основателем, и все дистальные по отно
шению к нему гаплотипы обязательно должны
быть включены в кластер;
в) кластер должен обладать высокой популя
ционной специфичностью: не меньше 85% образ
цов в кластере гаплотипов должны относиться к
данной популяции. У многих кластеров этот пока
затель составлял 100%.
Несмотря на строгость этих требований, выяв
лено восемнадцать соответствующих им кластеров.
Их характеристика представлена в табл. 7.6. Кро
ме обозначения кластера и указания на его специ
фичность для той или иной популяции, в таблице
также указаны генетические датировки кластера и
лингвистические датировки выделения того язы
ка, на котором говорит данная популяция (или груп
пы языков, на которых говорит группа популяций,
обладающих данным кластером). Последний стол
бец таблицы указывает на то событие в истории
формирования популяционной структуры Кавка
за, которое, на наш взгляд, маркируется данным
кластером.
Как указано в табл. 7.6, датировки кластеров
были рассчитаны с применением двух скоростей
242
Глава 7. Генофонды и языки
-
1
Аварпы
Татары
Кпргизы
Лезгины
o
Черкесы
Чеченцы (Ингушетия)
Чеченцы (Дагестан)
Иронцы
Дигорцы
o
Абхазы
один мутационныи шаг
о
-»
гаплотип основателя
0.
название кластера
о
о
о
*о
——
y
o
--
Рис. 7.3. Филогенетическая сеть гаплогруппы G2a1a-Р18.
Обозначения: площадь кружка пропорциональна числу носителей данного STR-гаплотипа. Цветовые обозна
чения указаны в легенде. Описание кластеров приведено в тексте.
мутирования — эволюционной скорости (Zhivotov
sky et al., 2004) и генеалогической скорости, полу
ченной при прямом сравнении на парах «отец-сын»
(Ge et al., 2009). Близкие значения генеалогичес
кой скорости получены и в других работах. Воп
росы, связанные с датировками и оценкой скорос
тей мутаций подробно рассмотрены в специально
посвященном этим вопросам разделе 1.5 первой
ГЛаВЫ.
ной популяции от родственных групп. Ведь в про
тивном случае (если кластер возник до разделения
популяций) кластер не был бы специфичным, и
встречался бы у всех потомков той прото-популя
ции, в которой он возник. Поэтому, как указыва
лось в начале этого раздела, совпадением генети
ческой и лингвистической (или исторической да
тировки) можно считать случаи, когда генетичес
кая дата меньше или равна лингвистической, а не
Напомним, что наша интерпретация популяци
онно-специфичных кластеров основывается на
совпадением — случаи, когда генетическая дата
предположении их появления после отделения дан
лингвистическая дата может быть более поздней
более древняя. (В разделе 7.1 обсуждалось, что и
243
7.3. Филогенетические датировки на Кавказе
G-Р15 (xР16, xР303, хм406)
с)
o
н.
о"
си
R1a1a7-М458
с.
с.
-
-
н.
* * *
-
о»
н.
Си
г.
н-
J-М67 (xМ92)
.
*
*
J-м267(xР58)
о
.
и
J-М172 (xМ12, xМ46, xМ67)
L3
."
ки
-
.
в
* :
e =
-
* .
а о" " .
.
в
на
в
г.
н.
с.
}
б,
с.
*
*
**
-
*.
.
*
--
к.
-
*.
R1a1a"-м198 (xМ458)
R1b1b2-М269
o
***
0
а
" .
е *
фо
о
са
с.
г.
го
o
е
o
ф
* о
с.
но
o
o Algerian
o Аппеnians
o Jews
o Jordan
Ironians
С Аyar
о Кaitak
o Chechen (Chechnya) о Кіrghiz
ба
ее
o Abkhaz
го
о
o
го
с.
с.
с.
o chechen (Dagestan) о Кubachi
o chechen (Ingushetia)* Lebanon
9 Сircassians
о Lezghins
o Dargins
o Digorians
o Near East
О Рalestinian
o Ingush
o Shapsug
е
С Тatars
гап
a
cluster name
— one microsatellite
mutational step
" founder haplotype
Рис. 7.4. Филогенетические сети для десяти основных кавказских гаплогрупп.
244
Глава 7. Генофонды и языки
Таблица 7.6. Генетические датировки кластеров гаплотипов и лингвистические датировки языков
(в числе лет от современности)
кластеры
р303-0.
р303-6
Популяции
Шапсуги
Шапсуги и
ДАТИРОВКА по
ДАТИРОВКА по
«генеалогической»
«эволюционной»
скорости мутаций
скорости мутаций
600+200
1900+700
Лингвистическая
aТИрОвка
Примечание
датир
800
Отделение адыгов
(шапсугов) от черкесов
Отделение черкесов от
1400+500
4300+ 1400
3600
черкесы
абхазов
р18-о.
Иронцы
1400+500
4200+ 1400
1300
р18-в
Дигорцы
1300+500
4100+ 1400
1300
R1b1b2-В
Дигорцы
800+300
2300+800
1300
Деление осетин на
иронцев и дигорцев
Р18- у
Иронцы и дигорцы
1200+500
3500+ 1400
-
-
М67-В
Чеченцы и ингуши
1300+7()()
4100+2100
5600
Отделение популяции
М67-y
Чеченцы и ингуши
1600+600
4800+1800
5600
группы от собственно
м67— о.
Ингуши
1100+500
3300+1600
1400
М67—8
Чеченцы
100+100
400+300
1400
деление нахской
| 3
Чеченцы
900+400
2900+1100
1400
чеченскую и ингушскую
нахской языковой
дагестанской
-
языкОВО и Ветви на
О-o
Чеченцы
1100+500
3300+1600
1400
М267(xР58)а
Даргинцы
Кубачинцы
1000+500
3100+ 1400
3400
М267(xР58)В
к}
1300+600
3900+1900
3400
М267(xР58)у
Даргинцы
Кубачинцы
yoачинцы
Отделение даргинцев,
кубачинцев и кайтагцев
от других дагестанских
популяций
1000+600
3200+2000
3400
Кайтагцы
R1a1a*-o
Даргинцы
900+400
2700+1300
1900
Отделение кубачинцев
R1b1b2-о.
Лезгины
2000+7()()
6100+2300
4300
Отделение лезгин от
р15°-о.
Лезгины
2400+7()()
7400+2200
4300
даргинской популяции
от даргинцев
НО ЭТО ЗаПОЗдание касается лишь НеСКОЛЬКО ПОКО
STR-маркерам; этот вопрос наиболее основатель
но исследован в [Каrmin et al., 2015) и авторы при
лений и носит систематический характер, тогда как
ходят к выводу, что «эволюционная» скорость хо
генетическое запоздание может быть на тысячеле
рошо работает лишь для гаплогрупп старше 30 000
тия и является случайным; поэтому целесообраз
но брать за ориентирлингвистическую дату и смот
лет, а на меньшей глубине времени (особенно для
гаплогрупп возрастом около 5 тысяч лет) приме
по сравнению со временем разделения популяций,
реть относительно нее датировки генетических
няемая скорость мутирования должна быть значи
кластеров).
тельно более быстрой. (Фактически это означает,
По сравнению с соответствующими лингвис
тическими датировками "эволюционные датиров
ки в большинстве случаев оказались слишком за
вышены, тогда как датировки, основанные на "ге
неалогической скорости мутаций, в основном хо
рошо соответствовали лингвистическим датиров
кам. Справедливость именно этих дат как мини
что для подавляющего большинства гаплогрупп
быстрая «генеалогическая» скорость дает более
точные оценки, чем медленная «эволюционная»).
Одно из возможных объяснений этого наблю
дения — зависимость оценки возраста отразмера
кластера и способа выбора гаплотипа-основате
ля. При калибровке эволюционной скорости
мум в двух случаях подтверждается и историчес
(Zhivotovsky et al., 2004) использовались класте
кими сведениями, как описано в следующем под
ры с 2—4 гаплотипами, и выбор гаплотипа поэто
разделе. Отметим, что к похожим выводам пришли
и авторы работы [Кing, Jobling, 2009), где исследо
валась связь Y-хромосомы с фамилиями получен
му не был формализован. В нашем исследовании,
ная ими скорость мутирования близка к «генеало
благодаря изобилию кластеров, отбирались клас
теры с не менее чем 10 гаплотипами, исходящи
ми из одного основателя. Эти методологические
гической», а не к «эволюционной». Оценки скоро
различия могли сказаться на среднем уровне раз
стей мутирования, основанные на полногеномном
секвенировании Y-хромосомы, также дают резуль
таты, близкие к «генеалогической» скорости по
нообразия выявляемых кластеров, а, следователь
но, и на получаемых оценках времени накопле
ния этого разнообразия.
7.3. Филогенетические датировки на Кавказе
245
СРАВНЕНИЕ ИСТОРИЧЕСКИХ, ЛИНГВИСТИЧЕСКИХ И ГЕНЕТИЧЕСКИХ ДАННЫХ
Из серии популяционных событий, перечислен
ных в табл. 7.6, рассмотрим те два события, по ко
торым имеются исторические данные, что помо
жет независимо проконтролировать правильность
совпадающих друг с другом генетических и линг
вистических дат.
ОСЕТИНЫ
Первое событие – разделение осетин на два
основных субэтноса – иронцев и дигорцев. Суще
ствует три гипотезы этого распада. Первая гипо
теза состоит в происхождении иронцев и дигор
цев от различных, хотя и родственных друг другу
сарматских племен, обитавших в степях за преде
лами Кавказа. Вторая гипотеза связывает появле
ние иронцев и дигорцев на Центральном Кавказе
в III–II веках до н.э. с ираноязычными сираками и
аорсами до нашествия гуннов (III–IV века н.э.).
Третья гипотеза, имеющая наибольшее число сто
ронников, постулирует происхождение иронцев и
дигорцев от алан в VI веке н.э. в горах и предгорь
ях Центрального Кавказа [Ковалевская, 1981]. Эта
гипотеза подтверждается и первым письменным
упоминанием о дигорцах, которое находится в ле
тописях “Армянской географии” в VII веке н. э.
[Агеева, 2000]. Напомним (табл. 7.6), что лингви
стической датировкой является VII векитаже дата
получена по обоим осетинским кластерам гапло
типов в нашем исследовании. В итоге все три ис
точника – исторический, лингвистический и гене
тический – согласуются с распадом осетинского
этноса на иронцев и дигорцев в период с VI в. по
VIII в. нашей эры.
ЧЕРКЕСЫ
Второе событие – это разделение черкесов и
шапсугов. Черкесы и шапсуги выделились из на
дэтнической общности адыгов, состоявшей из мно
гих племен [Федоров, 1983; Бетрозов, 1991]. При
этом предки генетически изученных нами популя
ций шапсугов и черкесов проживали на смежных
территориях в низовьях реки Кубани [Агеева,
2000]. В начале XI в. в Предкавказье стали прони
кать кочевники-тюрки, под давлением которых
часть адыгов стала продвигаться на юго-восток.
Разгром алан монголо-татарами способствовал
дальнейшему продвижению в XII–XIV веках адыг
ских племен на обширные пространства Централь
ного Кавказа [Федоров, 1983]. Позднее, вместе с
некоторыми другими родственными племенами в
результате обособления и ассимиляции части ко
ренного населения Центрального Кавказа образо
вался черкесский этнос [Федоров, 1983; Агеева,
2000].
Таким образом, разделение шапсугской и чер
кесской популяции, согласно историческим датам,
происходит между X и XIV вв., а лингвистические
датировки устанавливают XIV век, то есть 700 лет
назад.
Для шапсугов популяционно-специфическим
кластером является P303-α. Его генетическое раз
нообразие составляетρ=0.64, что (при использо
вании «генеалогической» скорости) дает датиров
ку 500±200 лет назад. Таким образом, и в этом
примере можно видеть соответствие генетичес
кой датировки историческим и лингвистическим
данным.
ПАРАЛЛЕЛИЗМ ЛИНГВИСТИЧЕСКОЙ И ГЕНЕТИЧЕСКОЙ МИКРОЭВОЛЮЦИИ
Впервые обнаруженное нами явление популя
ционной специфичности кластеров гаплотипов на
родов Северного Кавказа позволило совместить
генетическую и лингвистическую реконструкции
их микроэволюции. На рис. 7.5 приведено рекон
струированное лингвистами древо северокавказс
ких языков, иллюстрирующее разделение праязы
кана его ветви, языки и диалекты. На это лингви
стическое древо были наложены все 18 обнаружен
ных популяционно-специфичных генетических
кластеров: каждый кластер был наложен нату
ветвь, специфичным для которой он является. Мож
но видеть многочисленные примеры соответствия
лингвистической и генетической эволюции, что
позволяет предположить, что генетическая струк
тура Кавказа развивалась параллельно с формиро
ванием многообразия языков Северного Кавказа.
Предполагаемой нами причиной такой парал
лельной эволюции генетических и лингвистичес
ких изменений являются демографические процес
сы в популяциях Кавказа. Имеются в виду обыч
ные процессы увеличения численности и расши
рения ареала, которые приводят к географическо
муразделению прото-популяции и последующей
изоляции ее дочерних групп, чему в немалой сте
пени должен был способствовать горный рельеф
региона. Вследствие такой изоляции, новые гап
лотипы Y-хромосомы (неизбежно возникающие в
силу мутационного процесса) в каждой из дочер
них групп оказываются различными, специфичны
ми для нее, и не распространяются к соседям. Од
нако, когда при увеличении численности этой до
черней популяции она, в свою очередь, делилась
на несколько «внучатых», то и внутри этих попу
246
Глава 7. Генофонды и языки
ляций со временем возникали кластеры гаплоти
пов. И эти новые возникающие кластеры окажут
ся специфичны уже для этих изолированных по
пуляций третьего порядка.
Перечисленные события постепенного разде
ления прото-популяций и изоляции дочерних групп
му совпадению общей картины и многих деталей,
хорошо
ИЗВеСТНЫ И ЛИНГВИСТaМ - ОНИ ЯВЛЯЮТСЯ
за наук — использованием количественных линг
необходимым условием для разделения языков.
Именно поэтому те, демографические по своей
сути, процессы, которые приводят к образованию
в каждой популяции своего генетического класте
ра, приводят и к образованию в ней своего языка.
При таком подходе к микроэволюции популяций
вистических данных, единообразной организаци
ей лингвистической и генетической информации,
цифика самого региона, характеризующегося, бла
годаря горному рельефу, особой консервативнос
следует удивляться скорее не тому поразительно
тью и устойчивостью популяционной структуры.
которая выявлена между генетическими и лингви
стическими данными на Кавказе, а тому, что такое
совпадение не было до сих показано ни для одно
го другого региона мира. На наш взгляд, это объяс
няется отчасти продуманной методологией синте
формализованным анализом филогенетических
сетей. Но во многом этому способствовала и спе
|
о.
оп
=
=
-
—
*
-
-
—
-"
-
-
—
-"
=
ш.
=
—
=
—
3
—
>—
5
—
2
-
5
2
=
«"
"==
3
—-
- -
—
>=
-
-
|-
-
НА
-
Е
—
*
--
--
*
—
н
=
--
_-
3
—
+
=
—
=
-
2
=:
|
Н
|-
Г1
E =
н
н
ги
не
|-
- -
||
}
в 3- в и
— 3
|
и
ca
|-
-
-
-
б.
|-
}
в
в2 3
; }
; ;
|-
си
-
с.
3
|
-
гч.
цо
д.
-
гч
-
с
Е
}
Е3
:
Е
Е4
5
|
6
т со
3}
3 :
- г
Е
3
гч це.
по гч
с —
Рис. 7.5. Комбинированная схема микроэволюции генофонда Кавказа.
Серым фоном показано древо ветвления языков. На это древо наложены генетические кластеры (выделены
цветом), характерные для отдельных популяций. В целом схема показывает постепенное разделение единой пра
популяции населения Кавказана отдельные группы. В каждой из этих групп формировался особый диалект или
язык, и параллельно возникали генетические кластеры. В большинстве случаев прослеживается совпадение гене
тических датировок (кластеров гаплотипов Y-хромосомы), полученных для данной популяции (доверительный
интервал показан цветным пунктиром) и времени обособления языка, на котором говорит данная популяция.
7.4. Возможности полного секвенирования Y-хромосомы
247
7.4. ВОЗМОЖНОСТИ ПОЛНОГО СЕКВЕНИРОВАНИЯ Y-ХРОМОСОМЫ
Из предыдущих главчитатель уже мог прий
ти к выводу обособой роли Y-хромосомы в со
временном арсенале популяционной генетики –
не заменяя собой ни полногеномные, ни митохон
дриальные данные, Y-хромосома все же характе
ризуется максимальной межпопуляционной из
менчивостью и информативностью для реконст
рукций истории популяций. Y-хромосома – это
подзорная труба туманным днем: то, что иссле
дователь разглядит вдалеке с ее помощью, может
оказаться неверным, но без подзорной трубы он
вообще не сможет смотреть вдаль и будет огра
ничен тем, что видит вблизи невооруженным гла
зом. Поэтому тому, что видно в подзорную трубу,
не стоит безоговорочно доверять, а нужно потом
подойти ближе и проверить – но еще менее стоит
отвергать эти данные с порога. Точно так же и
результаты по Y-хромосоме нуждаются в после
дующей проверке другими системами, когда на
копленные по ним данные и методы анализа по
зволят «подойти поближе и проверить», но при
этом показания Y-хромосомы заслуживают само
го пристального внимания исследователя.
Именно поэтому эта глава по связи генофон
дов и языков основана в основном на данных Y
хромосомы. И важно, что увеличительная сила и
четкость изображения этой подзорной трубы рез
ко возросла в последние два-три года благодаря
появившейся возможности полного секвенирова
ния Y-хромосомы. В этом разделе я кратко опишу
эти возможности и приведу один из примеров –
возможную связь «полногеномных» результатов по
Y-хромосомной гаплогруппе G1-M285 и распрос
транения языков иранской группы.
ОБЗОР МЕТОДОВ И ПЕРВЫХ РЕЗУЛЬТАТОВ
«ПОЛНОЕ» СЕКВЕНИРОВАНИЕ Y-ХРОМОСОМЫ
Среди всех генетических систем Y-хромосома
характеризуется наибольшей межпопуляционной
изменчивостью и, следовательно, наиболее высо
кой разрешающей способностью при анализе ге
нофондов. Использование технологий полногеном
ного секвенирования для углубленного анализа Y
хромосомы стало новейшей тенденцией в этой
области: в 2013-2014 годах по этой тематике выш
ли 2 статьи в Science, статьи в Nature Communi
cations и Genome Research, не считая менее знако
вых журналов.
Эти статьи основывались на небольшом числе
образцов, поскольку данные по Y-хромосоме по
ступали только в рамках дорогостоящего полного
секвенирования геномов. Но начиная с 2014 года
целый ряд коллективов (в том числе и наш) начал
широкомасштабные исследования. Это стало воз
можным благодаря тому, что в конце 2013 г. стало
коммерчески доступным избирательное секвени
рование только Y-хромосомы – соответствующие
технологии ее обогащения были независимо раз
работаны двумя компаниями: FtDNA (США) и BGI
(Китай), а в 2014 году появилась и работа англий
ских специалистов, разработавших третью техно
логию. Отметим, что приоритетность полного сек
венирования Y-хромосомы в изучении истории
человечества была очевидна для мирового сооб
щества – потому-то ведущие коллективы стреми
лись к решению этой задачи. Однако полное сек
венирование отдельной хромосомы является тех
нически более сложной задачей, чем секвенирова
ние всего генома, поэтому решение этой задачи и
было осуществлено позднее (2013–2014 гг.), при
чем на основе различающихся технологий.
Поскольку действительно полное секвенирова
ние всей длины Y-хромосомы существующими ме
тодами практически невозможно (по причине изо
билия повторяющихся элементов вдоль большей
части хромосомы), существует так называемый
«золотой стандарт» избранных для ресеквениро
вания регионов Y-хромосомы. К этому стандарту
различные технологии добавляют дополнительные
регионы, поэтому суммарная длинаресеквениро
вания варьирует от 9 млн. до 17 млн.п.н. из при
мерно 60 млн. пар нуклеотидов общей длины Y
хромосомы. Именно эти последовательности (фор
мально это не полная Y-хромосома, а лишь при
мерно ее шестая или четвертая часть) принято обо
значать как «полные сиквенсы Y-хромосомы».
Впрочем, само по себе ресеквенирование яв
ляется не наиболее интересной, а напротив, лишь
технической стадией работы. Значительно боль
ший интерес представляют последующие, соб
ственно научные этапы: биоинформационная об
работка результатов, построение филогенетичес
ких деревьев, популяционный скрининг новых от
крытых маркеров (то есть мутаций, маркирующих
новые открытые ветви на древе Y-хромосомы) на
сотнях и тысячах образцов разных популяций, кар
тографический анализ, получение и интерпрета
ция данных по тонкой структуре генофонда.
АЛГОРИТМ АНАЛИЗА ДАННЫХ
О логике анализа данных полного секвениро
вания Y-хромосомы мы уже говорили в главе 1 (раз
248
делы 1.3 и 1.5). Чтобы реализовать эту логику, не
обходимо создать алгоритм анализа данных. К на
стоящему времени такие алгоритмы разработаны
уже целым рядом коллективов, активно работаю
щих с данными по полным Y-хромосомам, и все
эти алгоритмы довольно похожи. Кратко опишу
алгоритм, который был разработан, апробирован
и отлажен нашим коллективом.
Первичные данные о секвенированных корот
ких фрагментах (риды) были картированы на ге
номе человека (сборка 37й версии) и определены
полиморфные сайты (отличия отреференсной пос
ледовательности). Для целей контроля качества
отслеживалось общее числоридов, среднее покры
тие и среднее качество секвенирования на нуклео
тид. В результирующих файлах, кроме обнаружен
ных в секвенированных образцах отличий отре
ференсной последовательности, также был указан
статус 37 000 филогенетически информативных
SNP-маркеров, присутствовавших на моментана
лиза в базах данных International Society of Genetic
Genealogy (www.isogg.org) и Family Tree DNA
(www.familytreedna.com). Также применялись до
полнительные фильтры, среди которых важнейшим
был фильтр по отсутствию гетерозиготности. Учи
тывалась и согласованность результатов прямого
и обратного прочтений: если все генотипы данно
го сайта были получены только при чтении в од
ном направлении, они рассматривались как менее
достоверные. Генотипы, не поддающиеся одно
значной автоматической обработке, направлялись
на ручную корректировку оператору, которому
предоставлялись все исходные данные с указани
ем числа и качества ридов, перекрывающих дан
ный нуклеотид, и результатов каждого рида подан
ной позиции.
Кроме генотипирования каждого образца, для
решения общей задачи необходимо, чтобы каждый
обнаруженный SNP маркер был генотипирован во
всех образцах. Это представляет собой техничес
кую проблему, поскольку большинство методов
определения полиморфных сайтов оставляют нео
днозначность в интерпретации позиций, для кото
рых не обнаружено наличие «варианта» (т.е. отли
чия от референсной последовательности): это мо
жет быть как надежно показанное соответствие с
референсом, так и отсутствие надежных данных в
силу, например, недостаточного покрытия данно
го участка в данном образце. Чтобы обеспечить
различение этих двух ситуаций, для каждого об
разца был определен список надежно генотипиро
ванных регионов на основании данных о качестве
секвенирования (вероятности правильности ука
занного аллельного состояния на основании phred
показателя) каждого нуклеотида в данном образ
це. Суммарная длина этих надежно секвенирован
ных участков составляет, в среднем, около 10 млн.
п.н., т.е. примерно на 10% меньше, чем полный
Глава 7. Генофонды и языки
секвенируемый регион (11 млн. п.н.). Благодаря
наличию этих данных, при последующей обработ
ке можно считать, что если для данного образца в
данной позиции не указано отличия от референс
ной последовательности и данная позиция попа
дает в интервал надежно секвенированных регио
нов для данного образца, то в данной позиции на
дежно показано соответствие с референсной пос
ледовательностью.
По итогам анализа были созданы отдельно по
каждой анализируемой гаплогруппе итоговые таб
лицы генотипов по данным секвенирования Y-хро
мосомы. Эти таблицы были обработаны филоге
нетическими программами построения деревьев
(TNT, MURKA, BEAST) и получены итоговые
филогенетические деревья.
УЖЕ ПРОВЕДЕННЫЕ ИССЛЕДОВАНИЯ
Несмотря на молодость этого научного направ
ления (менее трех лет) уже вышли или готовятся к
печати целая плеяда работ ведущих популяцион
но-генетических коллективов мира, включая ста
тьи в наиболее престижных научных журналах.
Эти исследования можно условно разделить на три
направления: работы по оценке «полногеномной»
скорости мутирования Y-хромосомы, работы по
отдельным гаплогруппам и работы по оценке об
щих параметров генофонда мира. Правда, многие
статьи развивают сразу два или даже все три на
правления.
Попытки определить «полногеномную» ско
рость мутирования уже описывались в разделе 1.5
и суммированы на рисунке 1.22. Первым методом
был классический метод калибровок, соответству
ющий понятию «эволюционной» скорости в тер
минах, разработанных при дискуссии о скоростях
по STR-гаплотипам Y-хромосомы. Это были ка
либровки по заселению Сардинии [Francalacci et
al., 2013] и Америки [Poznik et al., 2013]. Вторым
методом был анализ числа мутаций в известных
родословных, соответствующий понятию «генеа
логической» скорости. Это работы по многочис
ленным исландским родословным [Helgason et al.,
2015] и с более ранней оценкой по одной английс
кой родословной [Xue et al., 2008]. Третьим, про
межуточным способом является «клановая» оцен
ка – хотя все члены клана восходят к общему пред
ку (как при «генеалогической» оценке), клан пред
ставляет собой популяцию, эволюционирующую
в течение многих поколений (как при «эволюци
онной» оценке). Этот подход реализован в работе
нашего коллектива [Balanovsky et al., 2015]. Чет
вертый подход основан на анализе древней ДНК
образцов, надежно датированных радиоуглерод
ным методом, и оценке генетического разнообра
зия современных потомков линий, близкородствен
ных этим древним образцам. Этот подход реали
7.4. Возможности полного секвенирования Y-хромосомы
зован в работе [Karmin et al., 2015]. Принципиаль
но важно, что эти скорости, оцененные шестью
различными коллективами на основе четырех раз
личных подходов, оказались близки и варьируют
около величины 0,8*10-9 мутаций на нуклеотид в
год (рис. 1.22).
Исследования, сосредоточенные на отдельных
гаплогруппах, почти столь же многочисленны, и,
несомненно, их число будет стремительно увели
чиваться в самые ближайшие годы. Среди них надо
назвать статью [Rootsi et al., 2013], в которой под
робно анализируется гаплогруппа R1a у евреев
ашкенази и выявляется ее ближневосточное (а не
восточно-европейское, как предполагалось ранее)
происхождение в популяциях евреев Европы. О
втором исследовании – нашей собственной работе
по гаплогруппе G1 [Balanovsky et al., 2015] – речь
пойдет чуть ниже. Третьим исследованием, уже
представленном в научном мире (хотя пока только
в форме доклада на конференции, а не полноцен
ной статьи), является работа B. Trombetta (из кол
лектива под руководством Cruciani) по филогеог
рафии гаплогруппы E-M35 в Африке. В этой ра
боте четко видны все три составляющие полноге
номных исследований отдельных гаплогрупп:
1) полное секвенирование Y-хромосомы иссле
дуемой гаплогруппы с построением детального
дерева;
2) выбор для популяционного скрининга неко
торых ветвей дерева (выделившихся субгаплог
рупп), выбор для них SNP-маркеров, скрининг на
наличие этих маркеров большого числа популяций
и определение частоттестируемых субгаплогрупп
во всех этих популяциях;
249
3) совместный анализ данных по географичес
кому распространению (картографирование час
тот) и по возрасту (анализ дерева) выбранных суб
гаплогрупп и выводы по истории миграций попу
ляции (и более широко – их демографической ис
тории).
Кроме этих исследований, Эстонским биоцен
тром с участием нашего коллектива завершается
работа по филогеографическому анализу гаплог
руппы N1, нашим коллективом завершаются ис
следования гаплогрупп С3-М217 и R1b, и, несом
ненно, другими коллективами сейчас тоже ведут
ся интенсивные исследования других гаплогрупп,
которые будут опубликованы в ближайшие пару
лет.
Третье направление – исследования, нацелен
ные на общие выводы о демографической исто
рии человечества по полным сиквенсам Y-хромо
сомы, – пока представлены только одной работой
[Karmin et al., 2015], выполненной под руковод
ством Тоомаса Кивисилда. Но она одна стоит де
сятка. В ней не только обнаружено «бутылочное
горлышко», через которое в конце неолита про
шла мужская часть популяции (именно мужская,
потому что общий эффективный размер в это вре
мя только возрастал), но и дано подробнейшее фи
логенетическое дерево как в целом, так и по от
дельным гаплогруппам, оценены параметры раз
нообразия для отдельных регионов мира, прими
рены «эволюционная» и «генеалогическая» ско
рости мутирования по Y-STR маркерам и многое
другое. Можно надеяться, что это обобщающее
направление вскоре привлечет внимание и дру
гих исследователей.
ИССЛЕДОВАНИЕ ГАПЛОГРУППЫ G1: СКОРОСТЬ МУТАЦИЙ И МИГРАЦИИ
ИРАНСКОЙ ГРУППЫ
Y-хромосомная гаплогруппа G1-М285 извест
на уже много лет, но не привлекала большого вни
мания исследователей из-за ее в среднем низкой
частоты. В то же время было известно, что в неко
торых популяциях Юго-Западной и Центральной
Азии она достигает частоты 80%. Когда в 2011 году
мы создавали Атлас изменчивости Y-хромосомы в
мире, то картографировали все изученные к тому
времени гаплогруппы Y-хромосомы. И обнаружи
ли, что паттерн географического распределения
гаплогруппы G1 очень своеобразен: в отличие от
подавляющего большинства евразийских гаплог
рупп ее нельзя назвать однозначно восточноевра
зийской или западноевразийской. К тому же ее
ареал интригующим образом объединял горы Юго
Западной Азии и Евразийскую степь – то есть ре
гионы, которые в историческом плане объединяет
только эпоха широкого расселения народов иранс
кой группы. Поэтому, когда появилась возможность
полного секвенирования Y-хромосомы, мы реши
ли применить ее к этой любопытной гаплогруппе
и заодно отладить методологию анализа на этом
не слишком сложном примере гаплогруппы G1.
КАРТА ЧАСТОТЫ
Прежде всего, мы провели генотипирование в
дополнительных популяциях, собрали новые опуб
ликованные данные и построили уточненную кар
ту распространения гаплогруппы G1 (рис. 7.6).
Карта основывается на данных о ненулевых час
тотах гаплогруппы G1-M285 в 27 популяциях, изу
ченных нашим коллективом, на данных из литера
туры о 33 популяциях, а также на данных по не
скольким сотням популяций, где эта гаплогруппа
не была обнаружена (информация о нулевых час
тотах важна для точного картографирования). Кар
та показывает, что гаплогруппа G1 имеет доста
25()
Глава 7. Генофонды и языки
точно широкий ареал: от Италии до Монголии, но
с наивысшими частотами обнаружена в централь
ноазиатских степях и на Переднеазиатском наго
рье. Так, один пик ее частот приходится на Арме
нию, причем среди армян она наиболее распрост
ранена лишь в одной группе — у амшенских армян
(42%). Второй пик приходится на Казахстан, где
она преобладает уродоплеменной группы аргын.
Среди 288 казахских индивидов, принадлежащих
потезой, носители иранских языков распространи
лись с территории евразийских степей на террито
рию современного Ирана. Альтернативная анато
лийская гипотеза помещает прародину индоевро
пейцев в восточную Анатолию, предполагая, что
ираноязычные популяции именно оттуда мигриро
вали в степи. Таким образом, две гипотезы пред
полагают противоположные направления мигра
ции
к G1, 90% оказалось аргынами, и, наоборот, среди
аргынов 80% несли эту гаплогруппу. Как аргыны,
так и амшенские армяне являются сейчас много
численными группами, поэтому подобное увели
КАРТА РАЗНООБРАЗИЯ
чение частоты G1 у них нельзя объяснить недав
ним действием дрейфа генов.
Вторым шагом исследования было построение
карты гаплотипического разнообразия (показатель,
пропорциональный числу выявленных гаплотипов
Таким образом, уточненная карта подтверди
в пределах гаплогруппы). Эта карта (рис. 7.7) по
ла, что гаплогруппа G1 связывает народонаселе
казывает исключительно четкий тренд убывания
разнообразия от максимальных значений (выше
0.8) на западе Ирана до нулевого разнообразия в
Монголии. Можно предполагать, что этот тренд
ние степей и гор, причем как раз в древнем ареале
ираноязычных популяций. Миграция ираноязыч
ных популяций между центральноазиатскими сте
пями и возвышенностями Юго-Западной Азии —
это один из важных вопросов в поиске прародины
индоевропейцев. В соответствии с курганной ги
60°
90
соответствует направлению распространения гап
логруппы, поскольку в общем случае разнообра
зие максимально в предковой популяции, а мигри
240°
210
Нарlogroup G1 frequency
ё
—=
—
*
a studied populations
*
с " "
*
}
0.08
0,021 ||30°
пах = 0,86
Рис. 7.6. Карта распространения гаплогруппы G1-М285.
7.4.
Возможности полного секвенирования
Y-хромосомы
251
часть разнообразия из родительской популяции. И
потому их гаплотипическое разнообразие — в об
щем случае — меньше, чем в родительской популя
ции. Конечно, в частном случае возможна утрата
гаплотипического разнообразия и в родительской
популяции, например за счет эффекта бутылочно
го горлышка. Но такие случаи могут сказываться
не узнаем о том, что эта ветвь существует. Поэто
мук отбору образцов мы подошли очень тщатель
но и использовали 4 критерия.
— географический и этнический (образцы из
разных частей ареала гаплогруппы и из разных эт
носов);
— филогенетический (образцы изо всех класте
ров, выявленных на сети по STR-маркерам, по
прилокальных исследованиях и маловероятны при
скольку эти кластеры могут отражать реальные
изучении обширных географических регионов.
филогенетические ветви);
— «клановый» (критерий применим только к
популяциям с сохранившейся родовой структурой
и состоитво включении образцов не из одного-двух,
ровавшие дочерние популяции захватывают лишь
ФИЛОГЕНЕТИЧЕСКАЯ СЕТЬ ПО STR
ГАПЛОТИПАМ
а из возможно большего числа разных родов).
Следующим логическим шагом должен был
По сути, все эти критерии основаны на той
стать полногеномный анализ. Но поскольку он яв
ляется слишком дорогостоящим, чтобы проводить
его для всех образцов, возникает вопрос, как ото
брать образцы на полное секвенирование так, что
бы при минимальном числе образцов охватить мак
симальное филогенетическое разнообразие. Ведь
если какая-либо филогенетическая ветвь не будет
представлена хотя бы одним образцом (а на самом
деле необходимы хотя бы два образца), мы никак
информации об образцах, которая известнадо их
60°
секвенирования и которая может оказаться скор
релированной с распространением разных ветвей
гаплогрупп.
Для применения филогенетического критерия
было нужно сперва построить эту сеть по STR-гап
лотипам. Обратим внимание на эту ситуацию — хотя
полногеномное дерево является более точной и на
дежной филогенетической реконструкцией и по
90°
240°
210°
Нарlogroup G1 diversity
* :
м
и к
т
п не
ни в
1,
"
",
піп = 0
пах = 0.93
Рис. 7.7. Карта гаплотипического разнообразия в пределах гаплогруппы G1-М285.
252
Глава 7. Генофонды и языки
*
Sl
Аrmenian cluster2
-* о
*
*
о
Каzakh cluster
Population
—?
П Каzakhs
Вashkirs
ПАrmenians
D East Europe
Iranians
ПSouth-West Asia
Caucasus
Пcentral Asia
Mongols
ПРakistani
П Italians
o
Аrmenian cluster1
Рис. 7.8. Филогенетическая сеть STR-гаплотипов в пределах гаплогруппы G1. Стрелки указывают на об
разцы, отобранные для полногеномного секвенирования Гаплотипы представителей разных народов обозначены
разными цветами. Выделяются: казахский кластер, два армянских кластера и башкирский кластер гаплотипов.
наилучшего построения полногеномного дерева
тически информативные SNP-маркеры от «част
ных» (private) маркеров, свойственных только од
весьма желательно построить сперва эту сеть по
ной семье.
STR-гаплотипам (рис. 7.8).
На сети четко выделились четыре кластера: два
Применение остальных критериев побудило
нас включить в анализ также монгольский обра
из них были представлены образцами из Армении,
зец, а для казахов включить различные родовые
один — самый большой — образцами из Казахста
на, и один — из Башкирии. Гаплотипы из других
популяций представлены в сети разрозненно и не
сгруппировались в кластеры. Из каждого кластера
были отобраны хотя бы по два образца для полно
го секвенирования Y-хромосомы: анализ одиноч
подгруппы в пределах аргынов. Кстати, клановая
ных образцов не позволил бы отличить филогене
пы G1 принадлежат к роду канглы.
этому заменяет собой сеть по STR-маркерам, для
(более широко — субэтническая) приуроченность
гаплогруппы G1 проявилась у всех народов, для
которых обнаружилось ее накопление: у казахов
она типична для рода аргынов, у армян она частав
группе амшен, у башкир все носители гаплогруп
7.4.
Возможности полного секвенирования
Y-хромосомы
ФИЛОГЕНЕТИЧЕСКОЕ ДЕРЕВО ПО ДАННЫМ
ПОЛНОГО СЕКВЕНИРОВАНИЯ
В итоге для полного секвенирования были ото
браны 19 образцов гаплогруппы G1 и в качестве
внешнего таксона (outgroup) был взят один обра
зец «братской» гаплогруппы G2. Для секвениро
вания отобранных образцов использовали метод
ВigY разработанный компанией FamilyTreeDNА.
253
каждый нуклеотид был прочитан 67 раз). Данные
по еще двум образцам G1 (из популяций Западной
Индии) были взяты из проекта «1000 геномов», но
эти образцы были секвенированы с низким покры
ТИеМ.
После того, кaк к полученным данным был
применен наш алгоритм, описанный в предыдущем
разделе, и была полученатаблица, содержащая для
каждого из 20 секвенированных нами образцов
значения 636 обнаруженных нами маркеров, кото
Как указывалось выше, этот метод позволяет сек
венировать участки Y-хромосомы, составляющие
рые в этом массиве данных, во-первых, надежно
в сумме 11 миллионов нуклеотидов. Эти участки
генотипированы для каждого образца и, во-вторых,
секвенировали с высоким покрытием (в среднем
полиморфны среди данного набора образцов (и,
ст-Р287
н:1-мl:85
I
I
сняю
п
с1-1.1324
С1-0031},
|
П
ни-анна:
п
С1-L20I
г-н
} } }
|| |
С1-1.1323
c1-GG001
|
} }
| |
ское
С1-00162
пет
} } }
}|
}
}
}
|
Рис. 7.9. Филогенетическое древо гаплогруппы G1-М285, построенное по данным полного секвенирова
Y-хромосомы.
нИя
254
Глава 7. Генофонды и языки
ми источниками по казахским кланам и откалиб
следовательно информативны для выявления внут
ренней филогенетической структуры). Для пост
ровать таким образом скорость мутирования Y-хро
роения дерева на основе этой таблицы были при
мосомы.
менены как методы, основанные на парсимонии,
Родоплеменная группа аргынов, в которой доми
так и байесовский подход, и полученные деревья
практически совпали. Это показывает, что данные,
нирует гаплогруппа G1, по преданиям восходит к
общему предку (Аргыну) и впоследствии раздели
полученные при полном секвенировании, настоль
лась на 12 кланов. Исторических свидетельств су
ко обширны и надежны, что реконструируемое на
их основе дерево перестает зависеть от применяе
ществования Аргына нет, но Караходжа (согласно
легенде — правнук Аргына) — это историческая лич
мых методов и их настроек, и однозначно опреде
ность. Например, он упоминается как посланник хана
ляется СаМИМИ ИСХОДНЫМИ данными.
Полученное филогенетическое древо представ
лено на рис. 7.9. На нем очень четко видно нали
чие четырех ветвей, условно названных как «ар
мянский», «казахский», «башкирский» и «индий
ский» кластеры. Каждый из них характеризуется
100% специфичностью для соответствующих эт
Тохтамыша — предводителя Золотой орды — к Тамер
лану в 1405 году. Большинство родов аргынов счита
ют себя потомками Караходжи, а другие кланы счи
тают, что происходят от его брата Сомдыка.
Пока вся эта картина генеалогии аргынов лишь исторические сведения, достоверность кото
Армянский и башкирский кластеры гаплогруп
пы G1 имеют общего предка, тогда как казахи и
рых неизвестна. Но в нашем исследовании, как
упоминалось, одним из критериев отбора образ
цов был охват различных кланов, поэтому в полу
ченных данных из двенадцати родов аргынов было
индийцы располагаются на отдельных ветвях. Ветвь
представлено девять. Это позволило получить
гаплогруппы G1, образованная единственным мон
объективную генетическую реконструкцию реаль
ного биологического родства по мужской линии
девяти изученных представителей казахов-аргы
нов. И достоверность этой реконструкции уже
нотерриториальных групп популяций.
гольским образцом, объединяется сказахским кла
стером, что хорошо согласуется и с географическим
положением этих народов, и с их историей. Казахс
кая ветвь соответствуетранее описанной субгаплог
руппе G-L1323, в то время как армянская (G1
GG265), башкирская (G1-GG162), монгольская (G1
очень велика — по сути, можно подвергать сомне
нию только мелкие детали дерева (случайно про
изошла дополнительная мутация, что немного уд
GG1) и индийская (G1-GG362) ветви выявлены в
линило ветку в числе мутаций по сравнению с ее
нашем исследовании впервые. Аббревиатура GG в
реальной длиной в числе поколений), но основная
названиях обнаруженных нами маркеров означает
геногеографию (Gene Geography) — принято, что
структура реальной генеалогии этих 9 человек,
несомненно, такова, какой она предстает на гене
имена маркеров начинаются с букв, показывающих,
тическом дереве.
каким научным коллективом они были открыты (так,
Сравнение «легендарного» генеалогического
маркеры, начинающиеся на букву М, открыты кол
лективом Реter Underhill. Р — Мichael Наmmer, L —
родства изученных 9 казахов и генеалогии, рекон
струированной генетическими методами, пред
ставлено на рис. 7.10. Их сходство — практически
совпадение — очевидно. Действительно, мы видим,
FamilyTreeDNA и тд.).
Если сравнить обе филогенетические реконст
рукции — сеть по STR-гаплотипам (рис. 7.8) и де
рево по полногеномным данным (рис. 7.9) видно
согласие во всех основных чертах. Разумеется, есть
и отличия: несколько армянских кластеров, обна
что все люди, восходящие к одному предку по тра
диционной генеалогии, и по генетическим резуль
татам имеют общего недавнего предка (а сравне
тами единого кластера по полногеномным данным;
ние с деревом на рис. 7.9 показывает, что, напри
мер, башкиры и монголы, не восходящие к обще
му предку с аргынами по традиционной генеало
иное положение занимает и монгольский образец.
гии, и генетически относятся совсем к другим вет
руженных по STR маркерам, оказываются вариан
Отметим, что все ветви на дереве (рис. 7.9)
вям). Более того, сама топология генетического
сходны по длине, как и должно быть при постоян
ных скоростях мутаций. Единственное исключе
ние — очень длинные ветви из образцов проекта
«1000 геномов» — вероятно, это связано с тем, что
дерева соответствует топологии генеалогического
используемые фильтры не совсем подходят к об
ходя к общему предку. Более того, даже внутри этой
ветви образцы 7 и 9 относятся к одной субветви и
разцам, секвенированным с малым покрытием.
дерева: образцы 7, 8 и 9, генеалогически представ
ляющие одну линию (восходящую к Сомдыку), и
на генетическом дереве группируются вместе, вос
по генеалогическому, и по генетическому дереву
ГЕНЕТИЧЕСКОЕ И ГЕНЕАЛОГИЧЕСКОЕ ДЕРЕВЬЯ
В этом исследовании у нас появилась редкая
возможность сравнить данные по Y-хромосомно
му секвенированию с достоверными исторически
(рис. 7.10).
Конечно, для идеального соответствия двух
деревьев было бы желательно, чтобы образцы 1—6
(потомки Караходжи) несли бы и общую мутацию,
формируя отдельную ветвь и на генетическом де
255
7.4. Возможности полного секвенирования Y-хромосомы
реве. Но для этого необходимо, чтобы хотя бы одна
мутация отличала Караходжу от его отца, а судя
по опубликованным скоростям мутирования, при
использованной длине секвенирования мутации
происходят примерно 1 раз в 4 поколения. Это зна
чит, что вероятность появления у Караходжиму
тации в секвенируемом диапазоне составляет лишь
около 25%, то есть куда более вероятно (около
75%), что такой мутации не будет. Вот она и не
произошла. Удивительно скорее то, что за 4 поко
ления (при передаче от Акжола к Сомдыку и далее
к Ермену) произошла не одна, а целых две мута
ции (замена цитозина натимин в позиции 23081087
Y-хромосомы и аденина на гуанин в положении
23526483). Тем более удивительно, что за одно
поколение (Шагир — Аманжол) произошли целых
две мутации. Вероятность этого невелика (как не
трудно подсчитать, около 6%), поэтому можно даже
предложить специалистам по шежире (традицион
ной генеалогии казахов) вопрос: насколько точно
А
1 пшtation
Каzаkh6
кагаkh3
Кагакh1
Каzаkh8
Каzаkh2
Каzаkh5
Каzаkh7
Каzаkh4
Каzаkл9
к
Каzakh1
Каzаkh2
Каzаkh3
Каzаkh4
Каzakhti
Kazakh5
—
ф
загугнетт
т
Каzаkh8
Каzаkh9
Каzаkhт
в
Рис. 7.10. Генетическая и традиционная генеалогическая реконструкции биологического родства свя
зей между представителями родов аргынов, для которых проведено полное секвенирование Y-хромосомы:
А) Генетическое дерево, построенное по данным полного секвенирования Y-хромосомы,
В) Генеалогическое дерево, отражающее традиционные генеалогические представления (шежире). Каждый
казах, Y-хромосому которого секвенировали, принадлежит к одному из кланов. Серым квадратом отмечен генеа
логический предок казахов с номерами 1-6, известный по историческим источникам.
256
Глава 7. Генофонды и языки
реконструирована генеалогия на этом отдельном
Это значение очень близко к «генеалогической»
отрезке? Но общее сходство генеалогического и
скорости мутаций, показанной во многих иссле
генетического деревьев не оставляет сомнений в
дованиях при сравнении пар «отец-сын».
справедливости традиционного генеалогического
дерева в целом.
КОМПЛЕКСНЫЙ ФИЛОГЕОГРАФИЧЕСКИЙ
Получается следующая ситуация. Казахское
шежире утверждает: «Изученные представители
АНАЛИЗ И РЕКОНСТРУКЦИЯ МИГРАЦИЙ
казахов происходят от Караходжи и его брата Сом
Совместный анализ карты частоты гаплогруп
пы G1, карты ее гаплотипического разнообразия,
дыка». И генетические данные тоже утверждают:
«Изученные представители происходят от двух
близких родственников». Тогда мы вынуждены
полногеномных данных по ее четкому разделению
на ветви и филогенетических оценок их возраста
признать и то, что они происходят именно от Ка
позволил реконструировать историю распростра
pаходжи и его брата, а это позволяет нам восполь
нения этой гаплогруппы.
Глядя на карту распространения гаплогруппы
зоваться историческими свидетельствами о време
ни жизни Караходжи для расчета скорости мути
рования.
ОЦЕНКА СКОРОСТИ МУТИРОВАНИЯ
G1, возникает вопрос, где ее прародина — в горах
или степях? Намного большее разнообразие по
STR-гаплотипам в западной части Иранского и
Армянского нагорий делает горную прародину
более вероятным кандидатом. Поэтому можно по
Чтобы определить скорость, с какой происхо
дят мутации на Y-хромосоме, мы подсчитали чис
ло мутаций, произошедших за известный проме
жуток времени — от Караходжи до современности.
Мы исходили из того, что Караходжа (бывший во
время своего посольства в 1405 году уже весьма
зрелым мужчиной) вероятно, стал отцом около
1385 года, а время рождения его самого и его бра
лагать, что гаплогруппа G1 выделилась из предко
вого варианта G" в горных областях Передней
Азии. Оттуда она затем распространилась в степ
ную зону Евразии и далее была разнесена по об
ширной территории миграциями степных кочев
ников. Такая миграция хорошо согласуется сана
толийской гипотезой происхождения индоевропей
ской языковой семьи. Миграции из Ирана в Цент
та примерно на 30 лет раньше (30 лет — средняя
длина мужских поколений). Средняя дата рожде
ральную Азию надежно подтверждаются также
ния обследованных ныне живущих казахов при
шлась на 1982 год. Таким образом, наблюдаемые
на дереве мутации накапливались с 1355 по 1982
годы, т.е. 627 лет. Разумеется, эти расчеты являют
ся лишь наилучшей возможной аппроксимацией,
но ошибка вряд ли превышает одно поколение.
популяциям Таджикистана и Туркмении.
Общая длина Y-хромосомных сегментов, секвени
рованных в каждом из 9 образцов казахов, соста
вила 9 972 660 нуклеотидов, а среднее числому
таций в каждом ныне живущем представителе рода
по сравнению с родоначальником составило 4.89
мутаций. По этим исходным данным легко вычис
лить скорость мутаций в изученном участке Y-хро
мосомы. Скорость составила 0,78х10° на нуклео
тид в год (то есть каждый год с вероятностью 0,78
смутирует каждый миллиардный нуклеотид).
палеоантропологическими данными по древним
Таким образом, гаплогруппа G1 могла быть
одним из генетических маркеров миграции неко
торых индоевропейских групп в евразийские сте
пи. Но сама по себе гаплогруппа G1, конечно, не
может служить универсальным маркером распро
странения даже отдельных ветвей индоевропейцев,
поскольку при любой миграции перемещается
часть популяции, состоящая из носителей разных
гаплогрупп. Ее можно рассматривать только как
один из генетических компонентов, принесенный
волной ираноязычной миграции, двигающейся на
север к степям Евразии. Генетические данные сви
детельствуют, что все основные ветви уже суще
ствовали к тому времени, когда миграция началась.
Тот же подход применили и к Y-хромосомным
Действительно, последняя развилка на башкирс
кий и армянский кластеры произошла около 8000
STR. Для 221 образцов аргынов, генотипирован
ных по 15 STR-маркерам, была построена филоге
значительно позже (армянская лингвистическая
нетическая сеть, и среднее число мутаций от гап
лотипа-основателя составило 0,68. Время от обще
го предка до современных изученных образцов для
предыдущего случая составило 627 лет, что соот
ветствует 21 поколению (хотя средний год рожде
ния генотипированных по STR-маркерам немного
отличался от среднего года рождения секвениро
ванных, отличия в несколько лет тут не имеют зна
чения). Отсюда легко рассчитать скорость мути
рования: 0,0022 мутации на локус на поколение.
лет назад, а ираноязычные популяции появились
ветвь отделилась около 4600 лет назад, а индои
ранские языки отделились около 4200 лет назад).
Гаплогруппа G1, вероятно, оставалась редким
генетическим компонентом среди многих евразий
ских и особенно ираноязычных популяций. Не
сколько выше ее частота на предполагаемой пра
родине — в Иране и Армении. Когда иранские язы
ки в степях были замещены тюркскими (вероятно,
в середине 1-го тысячелетия н.э.), носители гап
логруппы G1 должны были оказаться ассимили
7.5. Три модели взаимосвязи генофондов и языков: Кавказ, славяне, тюрки
257
рованы в тюркские и потом — в монгольские попу
гаплогруппы G1 указахов рода аргын оказывает
ляции, и в их составе распространились как запад
ся вполне вероятной.
нее (Башкирия, Крым), так и восточнее (Монго
лия). Еще позднее в различных географических
генетически датируется временем 1150 лет назад.
регионах независимо и в разное время произошла
Это хорошо соотносится с историческими источни
экспансия этой гаплогруппы — некоторым из ее
носителей посчастливилось быть «отобранными»
ками, говорящими, что амшены произошли отрод
дрейфом генов в быстро растущих по численнос
ти популяциях.
Экспансия этой гаплогруппы (быстрый рост
численности ее носителей) указахов генетически
датируется временем 470—750 лет назад, в зависи
мости от того, какую скорость мутации использо
вать. Генеалогический предокаргынов жил 600 лет
назад, как раз посередине этого интервала. Распро
Экспансия этой гаплогруппы у армян-амшенов
ственников и слуг князя Шапух Аматуни, который
приехал в 791 году из Аббасидского халифата.
Экспансия этой гаплогруппы среди башкир (у
рода канглы) генетически датируется XV веком н.э.
Считается, что этот род сформировался среди пе
ченегов около VIII века н.э., затем принял участие
в этногенезе башкир. Возрастание его численнос
ти может быть связано с
демографическими ИЗМе
нениями в XIV веке, когда Башкирия стала частью
странение гаплогруппы от одного человека к по
Золотой орды, и в XVI веке, когда она стала час
лумиллиону людей за 600 лет (20 поколений) хотя
тью России.
и удивительно, но в принципе возможно. При пред
Стоит отметить, что, несмотря на географичес
положении, что в каждом поколении два выжив
кое соседство Башкирии и Казахстана, предкино
ших сына оставляют в потомстве снова двух вы
сителей G1 в этих двух регионах не имеют недав
него общего происхождения. Эти ветви (как и тре
тья ветвь в Монголии) присутствовали в евразийс
живших сыновей — итак по всей цепи поколений:
в этом случае в 19-м поколении уже имеется пол
миллиона потомков. Поскольку указахов в семьях
было в среднем 3,5 ребенка, то такая экспансия
ких степях, по всей видимости, начиная с эпохи
скифов.
7.5. ТРИ МОДЕЛИ ВЗАИМОСВЯЗИ ГЕНОФОНДОВ И ЯЗЫКОВ:
КАВКАЗ, СЛАВЯНЕ, ТЮРКИ
Среди многих наук, исследующих те или иные
аспекты истории народонаселения (археология, эт
нография, физическая антропология, лингвистика,
лингвистикой: если лингвистически родственные
генетика), синтез данных генетики и лингвистики
привлекает в последние годы все большее внима
друга, это является сильным аргументом в пользу
ние. Одна из причин этого в том, что обе науки
являются в большой мере формализованными и
же генетически сходными оказываются географи
хотя бы отчасти количественными — это позволяет
пени их лингвистического родства, это означает,
проводить статистически обоснованное сопостав
ление их результатов. Другая причина — бурный
рост объема генетических данных, характеризую
щих генофонды большинства народов мира по все
более информативным генетическим системам -
популяции проявляют генетическое сходство даже
в случае их географической удаленности друг от
неслучайности связи генетики и лингвистики; если
чески соседние популяции безотносительно сте
что поток генов между соседними популяциями
являлся более важным фактором формирования
генофондов, чем генетический компонент, унасле
дованный от носителей праязыка. Аппарат част
ных корреляций, на которых основан тест Манте
митохондриальной ДНК, Y-хромосоме, полноге
ля, является статистически строгим инструментом
номным панелям маркеров, полному секвенирова
для различения этих двух ситуаций - реальное про
явление лингвистического родства в генетической
НИЮ ГеНОМОВ.
структуре или же связь генетики преимуществен
ПОДХОД
но с географическим фактором.
В популяционной генетике классическим ме
ПРОТИВОРЕЧИВОСТЬ И ЕЕ ПРИЧИНЫ
тодом определения степени согласованности гене
классифи
За последние два десятилетия генетиками про
КаЦИЯМИ ЯВЛЯeТСЯ Тест Мантеля: расчет парных и
ведено множество сравнений получаемых генети
тических данных с лингвистическими
ЧаСТНЫХ
корреляций
между генетическими, линг
ческих данных с лингвистическими классифика
вистическими и географическими расстояниями
циями. Хотя часть из этих оценок была только ка
для одного и того же набора популяций. Геогра
чественной (самый известный пример — визуаль
фия здесь выступает в качестве контроля объек
ное сравнение генетических и лингвистических
тивности выявляемых связей между генетикой и
деревьев в монографии (Сavalli-Sforza et al., 1994)),
258
многие другие работы опирались на строго коли
чественные оценки. Тем не менее, результаты раз
ных исследований противоречивы: структура ге
нофонда воспроизводит то географическое поло
жение популяций, то их лингвистическое родство,
то рисует совершенно особую, третью картину.
Такая противоречивость отчасти может быть
вызвана методологическим разнобоем в генетичес
ких исследованиях: одни работы опирались надан
ные по мтДНК (материнская линия наследования),
другие – на Y-хромосому (отцовская линия насле
дования), третьи – на аутосомные (в последние
годы – полногеномные) маркеры. Кроме того, раз
ные исследования часто посвящены населению
разных регионов мира, поэтому выводы разных
работ о сходстве структуры генофонда с лингвис
тикой или же с географией оказываются трудно
сопоставимы. Наконец, даже исследования одно
го итого же региона по одной итой же генетичес
кой системе могут приводить к противоположным
результатам, если одно из них (или оба) опирают
ся на недостаточно обширные или недостаточно
подробные генетические данные. Например, в ис
следовании генофонда Кавказа [Nasidze et al., 2003]
был сделан вывод об отсутствии связи генетичес
кой структуры как с географическим, так и с линг
вистическим факторами. А спустя несколько лет,
при накоплении намного более подробных данных,
была выявлена достоверная связь с обоими этими
факторами, причем по Y-хромосоме она оказалась
более тесной с лингвистическим родством [Bala
novsky et al., 2011], а по полногеномным (аутосом
ным) данным – с географическим соседством по
пуляций [Yunusbaev et al., 2012].
СРАВНИМ РЕЗУЛЬТАТЫ ДЛЯ ТРЕХ ЯЗЫКОВЫХ
ГРУПП
Поэтому попробуем сопоставить итоги иссле
дований связи генетических и лингвистических
данных, проведенных для трех групп народонасе
ления: популяций северокавказской лингвистичес
кой семьи, популяций балто-славянской группы
индоевропейской семьи, популяций тюркской
группы алтайской семьи.
Изучение генофонда Кавказа проведено под
руководством автора по маркерам Y-хромосомы и
опубликовано в[Balanovsky et al., 2011]. Изучение
тюркоязычных популяций проведено при участии
автора по полногеномным (аутосомным) маркерам
[Yunusbaev et al., 2015]. Изучение балто-славянс
ких популяций проведено под руководством авто
ра по всем трем генетическим системам (Y-хромо
сома, мтДНК, полногеномные панели маркеров) и
опубликовано в[Kushniarevich et al., 2015]. Таким
образом, мы получаем возможность сравнить как
результаты, полученные по разным генетическим
системам для одних и тех же популяций (балто
Глава 7. Генофонды и языки
славянское исследование), так и результаты для
разных лингвистических семей Евразии (сравне
ние трех исследований). Такая широкая панорама
может помочь лучше понять степень и причины
согласованности – или несогласованности – гене
тических и лингвистических данных.
НАРОДЫ КАВКАЗА
Кратко обрисуем итоги исследования, описан
ного в разделах 7.2 и 7.3 этой главы.
Генетические и лингвистические данные были
организованы однотипным образом и потому со
поставимы друг с другом. Было возможно оценить
как степень сходства генетической и лингвистичес
кой реконструкций родства популяций Кавказа, так
и датировки разделений прапопуляций (сопровож
давшихся разделением генофондов и языков). Это
сравнение структур генофонда и «глоттофонда»
было проведено четырьмя методами.
Во-первых, визуальное сравнение выявило
практически полное сходство полученных генети
ческого и лингвистического деревьев родства.
Во-вторых, тест Мантеля (и по парным, и, что
наиболее важно, по частным корреляциям) показал
более значимую связь структуры генофонда с линг
вистическим, а не с географическим фактором.
В-третьих, анализ методом AMOVA выявил
большую генетическую дифференциацию при
группировке кавказских популяций по лингвисти
ческому, чем по географическому принципу. Это
означает, что сведения о лингвистической принад
лежности популяции являются в данном случае
более информативными для прогноза ее генофон
да, чем ее географическое положение.
В-четвертых, датировки выявленных генети
ческих кластеров гаплотипов (многие из которых
оказались специфичны для отдельных народов или
лингвистических групп Кавказа) в первом прибли
жении совпали сдатировками разделения соответ
ствующих языков, полученными лексикостатисти
ческими методами.
Полное согласие результатов, полученных че
тырьмя различными методами, делает весьма на
дежным вывод о том, что генетическая и лингвис
тическая структуры народонаселения Северного
Кавказа жестко связаны друг с другом.
БАЛТО-СЛАВЯНСКИЕ НАРОДЫ
Как описано в главе 6 (раздел 6.1) изучение ге
нофонда балто-славянских народов проведено с
высокой степенью подробности: все 16 современ
ных балто-славянских народа изучены по всем
трем современным генетическим системам
(мтДНК, Y-хромосома, аутосомные полногеном
ные маркеры), при этом большинство народов изу
чены в нескольких региональных популяциях. Ис
7.5. Три модели взаимосвязи генофондов и языков: Кавказ, славяне, тюрки
259
пользованные для сравнения лингвистические дан
анализированы по полногеномным панелям мар
ные, как и в случае исследования народов Кавка
за, представляли собой показатели попарного
керов (Yunusbaev et al., 2015). Большинство из тюр
лексикостатистического сходства балто-славянс
друг с другом, а каждый со своими географичес
ких языков.
кими соседями, относящимися к другим лингвис
кских народов оказались генетически сходными не
Проведенный тест Мантеля состоял в сравне
тическим семьям. Таким образом, доминирование
нии скоррелированности друг с другом трех мат
риц: матрицы генетических расстояний, матрицы
географического фактора над лингвистическим в
структуре генофонда проявляется в данном случае
лингвистических расстояний и матрицы географи
очень ярко и объясняется преобладанием в гено
ческих расстояний между изученными балто-сла
вянскими народами. Парные корреляции выявили
практически полную согласованность генетики,
фонде большинства тюркоязычных народов асси
милированного дотюркского компонента (модель
«доминирования элиты»). Но в то же время, удает
лингвистики и географии: корреляции генетичес
ся выявить и генетический компонент свойствен
ких расстояний с лингвистическими варьировали
от 0,69 до 0,81, а корреляции генетических рассто
ный большинству тюркоязычных народов (хотя и
составляющий лишь небольшую часть их генофон
да). Можно предполагать, что именно этот выяв
яний с географическими — от 0,80 до 0.96. Однако
частные корреляции выявили, что связь генетичес
ленный компонент и маркирует общность проис
кой и лингвистической структуры является не пря
хождения всех тюркоязычных народов, столь яв
мой, а опосредованной географическим фактором
ную лингвистически. Этот компонент является
наиболее частым в популяциях Южной Сибири и
— при исключении влияния лингвистики корреля
ции генофонда с географическим фактором оста
ют почти до незначимых величин.
Монголии, что может рассматриваться как допол
нительный — генетический — аргумент в пользу
алтайской прародины тюркоязычных народов. Ге
нетические датировки событий ассимиляции, по
Такое преобладание географического фактора
над лингвистическим в формировании генофонда
с V в. до XV в. н.э., что также хорошо согласуется
ются высокими, но при исключении влияния гео
графии корреляции генетики и лингвистики пада
балто-славян может объясняться быстрой экспан
сией славян по обширной территории Восточно
Европейской равнины и Балкан, сопровождавшей
ся интенсивной ассимиляцией дославянского на
селения. Если этот дославянский компонент чис
ленно преобладал, то генетические взаимоотноше
ния современных балто-славянских популяций и
должны отражать в большей мере генетические
лученные для тюркоязычных народов, варьируют
с историческими данными о времени экспансии
тюрков.
СТЕПЕНЬ СОГЛАСОВАННОСТИ ГЕНЕТИЧЕСКОЙ
И ЛИНГВИСТИЧЕСКОЙ СТРУКТУРЫ
ОПРЕДЕЛЯЕТСЯ МОДЕЛЬЮ ИСТОРИИ
ПОПУЛЯЦИИ: САМОРАЗВИТИЕ, СМЕШЕНИЕ
ИЛИ ДОМИНИРОВАНИЕ ЭЛИТЫ
паттерны, предшествовавшие расселению славян;
Характер и степень связи генетических и лин
тогда неудивительно, что эти паттерны отражают
гвистических данных оказываются различными
не (лингвистические) взаимоотношения между
для народонаселения разных регионов и зависят
расселившимися на эти территории славянами, а
скорее (отраженные в географическом положении)
складывавшиеся тысячелетиями направления по
токов генов между этими территориями.
Отметим все же, что, несмотря на эту общую
количественно выявляемую тенденцию, на каче
ственном уровне в ряде случаев виден явный па
раллелизм генетической структуры все же с линг
вистическими данными (например, в генетической
оттого, по какой модели шло формирование наро
ДОНаселения.
Так, тесная связь генетической и лингвистичес
кой структуры народов Кавказа лучше всего объяс
няется следующей моделью: народонаселение Се
верного Кавказа произошло преимущественно из
одной общей прапопуляции, саморазвитие которой
заключалось в постепенном дроблении на субпо
гомогенности восточнославянских народов, не
пуляции (современные лингвистические группы),
далее на субсубпопуляции (современные народы)
смотря на обширный ареал их расселения, или в
генетическом сходстве славян с балтами при бо
и так далее. При таком поэтапном разделении по
пуляций происходило одновременное разделение
лее выраженных отличиях от генофонда финноя
зычных народов).
как языков, так и генофондов. Именно этот — де
мографический по своей сути процесс «дробления»
прапопуляции — и отразился, как в двух зеркалах,
ТЮРКОЯЗЫЧНЫЕ НАРОДЫ
в генетической и в лингвистической панорамах
Северного Кавказа.
Популяции 22 народов, говорящих натюркс
Поэтому можно предполагать, что совпадение
ких языках и представляющих различные части
ГеНеТИКИ И ЛИНГВИСТИКИ ЯВЛЯeТСЯ еСТе СТВеННЫМ И
обширного ареала тюркской ветви алтайской се
мьи (общая выборка N=390 человек), были про
ожидаемым как на Кавказе, так и в других регио
нах мира при соблюдении двух условий.
260
Глава 7. Генофонды и языки
1) Оба «зеркала» являются незамутненными в
ность: даже если формирование народонаселения
генетических данных надежно реконструируется
шло по модели доминирования элиты, т.е. ассимиля
реальная структура генофонда (что определяется
объемами и качеством сбора выборок, надежнос
ции в своем крайнем выражении, общий генетичес
кий компонент, унаследованный от предковой попу
тью их генотипирования, адекватностью методов
ляции вместе с ее языком, хотя и составляет лишь
анализа и т.д.), а лингвистические данные, анало
небольшую часть генофонда, но реально существу
гично, надежно реконструируют реальное родство
ет и может быть выявлен генетическими методами.
языков.
Правда, для такого выявления, похоже, требуется,
чтобы экспансия происходила на генетически кон
трастные популяции в случае тюркской экспансии
по генетически гетерогенной Евразии такие следы
обнаружены, а в случае славянской экспансии пого
могенной Европе их выявить неудается, хотя мигра
ция славян, скорее всего, была более массовой.
2) История народонаселения исследуемого ре
гиона сводится преимущественно к постепенной
дифференциации одной общей прапопуляции.
Если одно из этих условий нарушено, совпаде
ния генетических и лингвистических данных ожи
дать трудно.
славянских народов: отсутствие связи генетики с
Можно надеяться, что детальные филогеогра
фические реконструкции, основанные на возмож
лингвистикой при соблюдении первого, но нару
шении второго условия. В этом регионе народона
ностях полного секвенирования Y-хромосомы, по
зволят найти генетические маркеры, частично ас
селение сформировалось не из единой прапопуля
социированные с миграциями отдельных лингви
ции, а в результате смешения одной группы насе
стических групп и поэтому позволяющие выявлять
ления с рядом разнородных групп (экспансии прас
их следы в генофонде.
Именно это мы и обнаружили в случае балто
лавян на территории, населенные генетически раз
В качестве еще одного — методологического —
личными популяциями). И в этом случае фактор
наблюдения отметим, что тривиальная связь гене
лингвистического родства оказывается менее зна
тической структуры с географическим положени
чимым, чем фактор географического соседства.
ем всегда существует, лежит на поверхности и по
При этом все три генетические системы дают сход
этому легко выявляется даже при неполной гене
тической изученности. Напротив, связь структуры
ные описания структуры генофонда и проявляют
одни и те же тенденции в своей связи с географи
ЧеСКИМ И ЛИНГВИСТИЧеСКИМ факторами.
Исследование тюркоязычных народов, проведен
ное по полногеномным данным, добавляет еще один
важный штрих в вырисовывающуюся закономер
генофонда с лингвистическими данными для сво
его выявления требует подробного генетического
изучения и применения развитого аналитического
аппарата, но зато позволяет глубже понять исто
рию популяций.
ГЛАВА 8.
ДРЕВНЯЯ ДНК ЕВРОПЫ
При исследованиях генофонда в явном или
скрытом виде всегда присутствует время. В явном
— когда речь идет об истории формирования гено
фонда, а в скрытом — при каждом виде анализа,
ведь воздействие на генофонд любого фактора про
исходит во времени и обычно измеряется поколе
ниями. Для отечественной геногеографии тради
ционной стала идея Элизе Реклю, что «География
является Историей во времени», и анализ простран
ственной структуры генофонда рассматривается
как ключ к реконструкции динамики генофонда во
тывается в даты абсолютного времени (Рычков,
1986; Вandelt et al., 1995; Richards et al., 1996; 2000;
Zhivotovsky et al., 2004 и другие работы); в том
ЧИСле В ПОСледние ГОДЫ ПО Данным ПОЛНОГеНОМ
ного секвенирования Y-хромосомы (Poznik et al.,
2013; Каrmin et al., 2015: Вalanovsky et al., 2015 и
другие работы). Полученные датировки дают бо
лее прямые оценки изменения генофонда во вре
мени, чем при интерпретации географических
(пространственных) закономерностей.
Третий путь к изучению изменчивости гено
времени (Рычков. Ящук, 1986; Балановская, Рыч
фонда во времени является самым прямым. Он
ков, 1990, Рычков и др., 1997). Этот подход, хотя
специально и не формулируемый, свойственен и
многим зарубежным исследованиям [Сavalli-Sforza
et al., 1994: Semino et al., 2000 и множество других
зе образцов ДНК от представителей давно ушед
ших поколений, благо такие образцы в виде кост
ных останков в большом количестве предоставля
работ). Такой путь к реконструкции прошлого ге
ет палеоантропология.
состоит в непосредственном генетическом анали
нофонда — через анализ его современной простран
В данной книге, ориентированной на изуче
ственной структуры — является самым распрост
ние изменчивости генофонда Европы не только в
раненным, но не единственным.
пространстве, но и во времени, использовались
Другой путь, используемый еще в «классичес
кую» эпоху популяционной генетики, но ставший
особенно популярным при исследованиях мтДНК
и Y-хромосомы в последние два десятилетия, зак
все три пути. Догадками о прошлом генофонда,
лючается в получении генетических датировок
популяционных событий. Хотя и в этом случае
начальной точкой являются данные о современном
генофонде, но накопленное разнообразие пересчи
сделанными на основании его современной про
странственной структуры, пестрят главы 2, 3, 4,
5 и 6. Использование генетических датировок яв
ляется основным содержанием главы 7, а ее тео
рии уделено большое внимание в главе 1. А на
стоящая глава 8 посвящена третьему пути — ана
лизу древней ДНК.
8.1. ОСОБЕННОСТИ АНАЛИЗА ДРЕВНЕЙ ДНК
ИДЕЯ
палеоантропологии: изучаются те же самые наход
ки, также они сравниваются друг с другом и с со
Идея анализа древней ДНК (палеоДНК) про
ста: вместо того, чтобы на основании данных о со
временных популяциях догадываться, какими были
генофонды их предков, изучать генофонды древ
временным населением, также делаются выводы
о миграциях или же преемственности населения.
ПЕРСПЕКТИВЫ
ности напрямую — проанализировав ДНК из кост
Анализ древней ДНК и сравнение полученных
ных останков (палеоантропологического материа
ла). Таким образом, анализ палеоДНК, продолжая
результатов с исследованиями современного гено
быть генетикой, является одновременно отраслью
палеоантропологии, добавляя к используемым в
фонда является одной из наиболее перспективных
областей среди современных наук о жизни. Это
палеоантропологии системам признаков (кранио
метрия, краниоскопия, одонтология, остеология)
подтверждается большим числом публикаций в
тическому анализу и осмыслению результатов при
наиболее престижных научных журналах.—Science,
Nature и других (Рддbo et al., 1989: Наndtetal., 1996;
Соорer et al., 2000, 2001; Нofreiter et al., 2001; Наак
анализе древней ДНК те же, что и в классической
et al., 2005, 2010, 2015; Noonan et al., 2006;
еще и «ДНКметрию». При этом подходы к статис
262
Глава 8. Древняя ДНК Европы
Вrotherton et al., 2007; Sampietro et al., 2007; Вurbano
et al., 2010; Lazaridis et al., 2014: Raghavan et al.,
лиза единственной молекулы). Поэтому попадание
2014: Аllentoft et al., 2015: Gыnthera et al., 2015). В
настоящее время исследования древней ДНК ве
дутся во многих лабораториях разных стран мира.
Высокая научная значимость и перспективность
ДНК (неизбежно присутствующей во всех поме
щениях, где находятся люди) приведет к тому, что
фактически будет изучена современная ДНК (на
пример, ДНК с рук самого исследователя), но ис
этих исследований общепризнанна в научном со
обществе, поскольку позволяет получать прямые
ная нуклеотидная последовательность характери
Данные О
генофондах прошлых эпох и их динами
в образец даже ничтожных количеств современной
следователь будет ошибочно считать, что получен
зует древний образец.
ке, которые иначе можно реконструировать только
Эта наиболее технически сложная проблема
менее надежным косвенным путем из данных о
контаминации в настоящее время хотя и не может
быть решена полностью, но минимизация рисков
современном народонаселении.
контаминирования и многократное сокращение
ПРОБЛЕМЫ
ожидаемой частоты ошибок генотипирования ре
ально достижимы в условиях специализированных
Это научное направление является технически
центров анализа древней ДНК. Такие центры со
сложным, и его развитие наталкивается наряд
здаются с учетом всех потенциальных факторов
объективных проблем.
Прежде всего, к ним относятся проблемы кон
нических, методологических, методических, кад
таминации (загрязнения) древних образцов состо
контаминации и реализуют широкий спектр тех
роны современной ДНК, малого количества и хи
ровых и организационных аспектов всех извест
ных способов минимизации рисков контаминации.
мической модификации ДНК, выделяемой из древ
Такие центры к настоящему времени созданы в
них образцов.
Другой нередко возникающей проблемой яв
ряде стран мира.
ляется неполнота информации о современном ге
нофонде, сравнение с которым является одним
ЛАБОРАТОРИИ ЗА РУБЕЖОМ
из важнейших инструментов при интерпретации
данных по древней ДНК.
В области анализа древней ДНК успешно ра
ботает большое число зарубежных исследователь
Методы сравнения с современным генофондом
и выявления структуры генофондов во многих слу
чаях также оказываются недостаточно эффектив
ских коллективов. Среди них наиболее известны
ны.
Паабо (Professor Svante Paabo, Institute for
МИ ЯВЛЯЮТСЯ НеСКОЛЬКО КОЛЛeКТИВОВ:
1) коллектив под руководством проф. Сванте
Наконец, существуют проблемы крайне малых
Еvolutionary Anthropology, Лейпциг, Германия):
объемов выборок по древней ДНК (как правило,
только 5—10 образцов из популяции), и неравно
именно этот коллектив выполнил нашумевшие ра
мерной представленности различных эпох и тер
риторий в накапливающихся данных по изменчи
вости древней ДНК в популяциях человека.
Есть еще и методологическая проблема. Ведь
ного генома неандертальца и недавно геномаче
когда мы изучаем современное население, то мы
знаем, что у него имелась цепочка предков на всем
протяжении жизни человечества — и пытаемся ее
проследить на тех или иных отрезках времени. Но
когда мы изучаем древнюю ДНК, у нас нет уве
боты по анализу мтДНК неандертальца, затем пол
ловека из Денисовой пещеры на Алтае,
2) коллектив под руководством проф. Алана
Купера (Professor Alan Сooper, Australian center for
ancient DNА, Австралия), работавшего сначала в
Оксфорде, а затем создавшего лабораторию в Ав
стралии и известного как методическими работа
ми, так и исследованиями древней ДНК популя
ций человека и различных видов животных;
уверенности, что они оставили своих генетичес
3) новый организованный институт под руко
водством проф. Иоганнеса Краузе (Professor
ких потомков и что их гены дошли до современно
Johannes Кrause, Institute for the Science of Human
сти или хотя бы до следующей за ними эпохи.
Нistory, Йена, Германия), объединивший целый ряд
ренности, что это не «засохшая» ветвь истории, нет
КОНТАМИНАЦИЯ
Основной проблемой при изучении ДНК и ос
новным источником ошибок является контамина
ция — случайное попадание современной ДНК в
исследуемый древний образец. В результате раз
рушения ДНК в древних костях, количество ДНК
ведущих специалистов в области археологии, лин
гвистики и древней ДНК, в том числе известных
генетиков Wolfgang Наак из лаборатории Алана
Куперa и Guigo Вrandt из лаборатории Курта Аль
та из Майнца (Германия):
4) коллектив под руководством проф. Эске Вил
лерслева (Professor Eske Willersley, Сentre of
столь мало, что для анализа используются методы
Еxcellence in GeoGenetics, Копенгаген, Дания), на
чавший с секвенирования полного генома эскимо
максимальной чувствительности (вплоть до ана
са по единственному волосу (Rasmussen et al.,
263
8.1. Особенности анализа древней ДНК
2010), а сейчас изучивший уже более сотни пол
ных древних геномов.
Большое число других научных коллективов,
работающих в этой области, можно разделить на
две категории: коллективы, обладающие высокой
ности анализа деградированных ДНК в кримина
листике и судебно-медицинской экспертизе.
СХЕМА РАБОТЫ
научной репутацией (например, David Reich,
Из изложенного становится понятным, поче
Наrward Medical School, США; Professor Kurt Alt,
му в настоящее время эффективное изучение древ
University of Маinz, Германия; Dr Carles Laluezа
Fox, Universitat Pompeu Fabra, Испания) и коллек
ней ДНК из антропологических серий с террито
рии России возможно только в рамках сотрудни
тивы со спорной или неизвестной репутацией.
Вопрос о научной репутации для данной обла
сти исследований является принципиально важ
ным потому, что технические особенности анали
за древней ДНК легко могут привести к ложным
чества с зарубежными центрами. Среди них Авст
ралийский центр древней ДНК, возглавляемый
проф. Аланом Купером, обладает высокой репута
результатам, и высокую профессиональную репу
цией и является одним из лидеров данного направ
ления исследований в мире. Поэтому результаты,
приведенные в данной главе, были получены во
тацию заслуживают только те исследователи и те
многом в результате нашего многолетнего сотруд
лаборатории, которые тщательно минимизируют
ничества с Австралийским центром древней ДНК.
За это время были проведены взаимные команди
рования сотрудников (д-р Вольфганг Хаак в Рос
сию в 2008 г., О.П. Балановский в Австралию в 2010
г), ежегодные встречи и обсуждения на научных
конференциях в разных странах (Китай в 2007 г.,
Эстония в 2008 г, США в 2009 и 2011 гг, Австра
лия в 2010 г). Это сотрудничество проходило в рам
ках международного проекта «Генографик» (2005—
2012 гг.), в котором участвовали оба наших кол
риски ошибок. Особенно важна репутация лабо
раторий древней ДНК и потому, что полученные
результаты иногда нельзя даже попробовать вос
произвести, если уже израсходован весь пригод
ный для анализа ДНК материал из палеоантропо
логической находки. В этом случае остается лишь
уповать на репутацию лаборатории и призывать
коллег из смежных наук с большой осторожнос
тью относиться к сенсационным выводам лабора
торий «второй категории».
лектива. По окончании проекта центр тяжести ис
следования древних популяций человека из Авст
ЛАБОРАТОРИИ В РОССИИ
ралийского центра древней ДНК переместился в
новый мощный центр в Йене (Institute for the
В России отсутствуют специализированные
центры анализа древней ДНК, признанные науров
не мировой науки, хотя попытки такого анализа
периодически предпринимаются отдельными ла
бораториями. Не рассматривая ряд провинциаль
ных коллективов, осуществлявших такие попыт
ки, но не достигших серьезных научных результа
тов (в частности, не имеющих значимых научных
статей по этой теме), нужно отметить коллектив
новосибирских исследователей, ведущих работы
по древним популяциям Западной Сибири и Ал
тая (Молодин и др., 2000: Воевода и др., 2000;
Pilipenko et al., 2015). Хотя оснащение этой лабо
Science of Human Нistory), объединивший целый
ряд ведущих специалистов, в том числе и д-ра
Вольфганга Хаака.
За это время была выработана наиболее эффек
тивная схема сотрудничества, согласно которой за
рубежная сторона проводитэкспериментальный ана
лиз (2 этап исследования) и статистическое модели
рование (3 этап), российская сторона — сбор образ
цов (1 этап) и картографо-статистический анализ
полученных экспериментальных данных (4 этап).
Однако мне довелось поучаствовать и в эксперимен
тальной работы (при исследовании генофонда ски
фов), что было необходимо для понимания особен
ветствует требованиям к полноценному центру
анализа древней ДНК, а число научных статей не
ностей технологии анализа древней ДНК и путей
решения проблем, при таком анализе возникающих.
Кроме результатов нашей совместной работы
велико, этот коллектив является единственным
с Австралийским центром древней ДНК, в этой
(кроме нашего), активно ведущим в России попу
главе описываются опубликованные при участии
ляционно-генетические исследования древней
ДНК, и единственным, проводящим этап собствен
но анализа древней ДНК в России.
автора работы лабораторий David Reich и Eske
Willerslеy, а для полноты картины приводятся и
Также в ИОГен РАН коллективом под руковод
ством проф. Е.И. Рогаева ведутся исследования
гих научных коллективов.
ратории, насколько можно судить, не вполне соот
деградированной и древней ДНК человека, резуль
таты которых опубликованы в высокорейтинговых
литературные данные, взятые из публикаций дру
ОСОБЕННОСТИ ЭКСПЕРИМЕНТАЛЬНОГО
АНАЛИЗА ДРЕВНЕЙ ДНК
журналах (Rogaev et al., 2009 a,b; Григоренко и др.,
2009). В рамках этих исследований получены ре
Этап экспериментального анализа палеоДНК
зультаты, применимые для повышения эффектив
отличается как от палеоантропологии, так и от эк
264
Глава 8. Древняя ДНК Европы
спериментального анализа ДНК современных об
вышенной чистоты и точности при постановке эк
разцов. От палеоантропологии он отличается тем,
что проводятся не измерения или описания фор
спериментов (на практике это выглядит как «рабо
та в скафандрах»);
3) технологические требования, связанные с
особенностями ПЦР-анализа фрагментированной
мы или химического состава костей, а экстрагиро
вание из костного материала ДНК и затем прямой
анализ ДНК теми же методами и на таком же обо
рудовании, что и при анализе современной ДНК.
днк.
Соответственно, лаборатории, обладающие
А от анализа современного генофонда анализ древ
ПОЛНЫМ КОМПЛеКТОМ ТехничеСКОГО ОСНащеНИЯ ДЛЯ
ней ДНК отличается чрезвычайно жесткими тре
бованиями к чистоте и стерильности эксперимен
та. Дело в том, что чувствительность методов ДНК
минимизации контаминации и строго следующие
правилам тщательной постановки экспериментов,
со временем заслуживают высокую репутацию, что
анализа очень высока, и единичных молекул мо
подтверждается как получаемыми ими результата
жет быть достаточно для получения результата. В
древнем образце, как правило, сохраняются лишь
единичные молекулы. Но такие же молекулы ДНК
ми, так и проведением независимого дублирующе
го анализа в других центрах, получивших миро
вое признание.
примерно в тех же концентрациях витают в возду
Например, в Австралийском центре древней
хе любого помещения и находятся на любых пред
ДНК применяются различные рекомендуемые при
работе с палеоДНК подходы для минимизации
риска контаминации: боксирование лабораторных
помещений; защита образца от контаминации со
стороны ДНК самого исследователя; удаление по
верхностного слоя образца; работа в многослой
ной спецодежде - маски, перчатки, очки, комбине
метах (в том числе ДНК костных останков изря
дом лежащих коллекций, еслита ДНК сохранилась
лучше), которых касается сам исследователь или
которых когда-либо касались другие люди, вклю
чая археологов, антропологов и работников музе
ев. И чрезвычайно велика опасность, что анализи
роваться будет не ДНК древнего образца, а посто
ронняя ДНК совсем другого человека, случайно
попавшая в пробирку из какого-либо современно
ГО ИСТОЧНИКа.
ПРОБЛЕМА КОНТАМИНАЦИИ
Именно поэтому в тех лабораториях, где зани
маются анализом современной ДНК и где поэтому
концентрация «витающей в воздухе» ДНК (в том
числе амплифицированной) особенно велика, про
тивопоказаны попытки анализа древней ДНК. Для
анализа древней ДНК необходимо создавать спе
циальные лаборатории, вся организация которых
специально продумывается так, чтобы свести к
минимуму риск контаминации древних образцов
зоны (рис.8.1); непрерывное обеспечение стериль
ности помещений и рабочих мест, положительное
давление воздуха для исключения воздушного по
тока извне, шлюзовые отсеки при входе в лабора
торию и между основными рабочими зонами внут
ри лаборатории; тщательный выбор поставщиков
реактивов и пластика (гарантия от случайной кон
таминации при фасовке и т.д.); специальное обу
чение персонала; исключение работы с современ
ной ДНК в той же лаборатории, пространственная
отдаленность здания лаборатории древней ДНК от
любых зданий, в которых проводятся или прово
дились в прошлом работы с современной ДНК;
многочисленные другие требования. Хотя каждый
из этих методов по отдельности описан и рекомен
со стороны современной ДНК. Среди специалис
дован в специализированных научных работах, но
комбинация всех этих методов, осуществляемая в
тов существует даже негласное ранжирование ла
Австралийском центре древней ДНК, имеет очень
бораторий древней ДНК по степени, в которой в
них соблюдаются требования к чистоте экспери
мента и, соответственно, по степени достовернос
немного аналогов, обеспечивая максимально воз
можный уровень снижения рисков контаминации.
Дополнительным методическим приемом, при
ти получаемых результатов.
меняемым нашим коллективом, является конт
В настоящее время разработано большое чис
ло правил для минимизации рискатакой контами
рольное сравнение всех получаемых нуклеотидных
нации. К ним относятся:
1) технические требования (разделение лабо
последовательностей древней ДНК со специально
полученными последовательностями ДНК лиц,
которые могли контаминировать древние образцы
ратории по зонам в соответствии с этапами анали
(археологов, палеоантропологов, сотрудников му
за, боксирование этих зон, повышенное давление
воздуха внутри лаборатории, выделение отдельных
зданий, в которых никогда не проводились работы
с современной ДНК, территориальная отдален
ность этих зданий от лабораторий, изучающих со
зеев, самих исследователей-генетиков).
При исследовании митохондриальной ДНК
важным аспектом является разработанный австра
лийскими коллегами метод одновременного муль
временную ДНК и тд.);
2) методические требования, состоящие глав
деляющих принадлежность образца к одной из
основных гаплогрупп митохондриальной ДНК.
ным образом в неукоснительном соблюдении по
Одновременное получение для древнего образца
типлексного анализа панели SNР-маркеров, опре
8.1. Особенности анализа древней ДНК
данных по всем основным SNР маркерам повыша
ет достоверность результата за счет многократно
го взаимного контроля и позволяет провести ана
лиз при использовании меньшего количества ДНК.
ПРОБЛЕМА НЕМНОГОЧИСЛЕННОСТИ
Другая проблема состоит в немногочисленно
сти палеоантропологического материала, пригод
ного для анализа древней ДНК. Поэтому большин
ство исследований палеоДНК основаны на выбор
ках всего лишь в несколько образцов, тогда как для
надежных сравнений генофондов нужны выборки
265
Во-вторых, широко используется метод срав
нения (немногочисленных) данных по древней
ДНК с (многочисленными) данными по современ
ному населению. Также, поскольку данные по древ
ней ДНК, очевидно, представляют большую науч
ную ценность, то на их статистический анализ и
осмысление затрачиваются и куда большие усилия,
чем было бы целесообразно затратить на анализ
выборки столь же небольшого объема из какой
либо современной популяции.
Таким образом, преимущества и ограничения
анализа древней ДНК и анализа современных гено
в десятки и сотни проанализированных индивиду
фондов противоположны. При анализе современной
ДНК доступны обильные данные о генофондах, но
умов. Эта проблема решается двумя путями.
возникает проблема вычленения, какая из чертге
Во-первых, по мере того как направление ана
лиза древней ДНК набирает силу, совершенствует
свои методы и создает новые лаборатории, посте
пенно увеличиваются как средние объемы выбо
рок, так и число уже проведенных исследований.
И, объединяя результаты сразу нескольких иссле
дований древней ДНК, можно уже получить вы
борку разумного объема (хотя она и будет пред
нофонда сформировалась в какую эпоху. А при ана
ставлять не локальную популяцию, а в целом оп
ределенную эпоху на определенном континенте).
лизе древней ДНК доступны прямые данные о ге
нофонде прошедших эпох, но на первый план вы
ходит проблема ограниченности исходных данных.
Совместный же анализ как современной, таки древ
ней ДНК позволяет отчасти взаимно компенсиро
вать эти недостатки и приблизиться к более надеж
ной реконструкции истории формирования генофон
дов и тех событий в истории популяций, которые яви
лись причиной этих генетических процессов.
Рис. 8.1. «Скафандровый» стиль работы в Австралийском центре древней ДНК. На фотографии автор
книги высверливает скифский зуб.
266
Глава 8. Древняя ДНК Европы
8.2. СРЕДНИЙ ПАЛЕОЛИТ (НЕАНДЕРТАльцы)
МИТОХОНДРИАЛЬНЫЙ И ЯДЕРНЫЙ ГЕНОМЫ
НЕАНДЕРТАЛЬЦА
В июне 2015 года мне довелось слушать об этом
в лекции Сванте Паабо, и в ответах на вопросы он
рассказал следующий случай. В одном из наибо
Исследования древнейших геномов человека
лее известных музеев мира на экспозиции, посвя
связаны, прежде всего, с именем немецкого иссле
щенной неандертальцам, на основании первой ста
дователя Сванте Паабо. Эти исследования начались
с секвенирования митохондриальной ДНК неан
тьи (по мтДНК) утверждалось, что они совсем не
дертальца в 1997 г. Она оказалась значительно от
личающейся от всех вариантов мтДНК современ
ного человека, то есть по мтДНК не было обнару
смешивались с человеком современного вида. Но
после выхода следующей статьи сотрудники му
зея оперативно сменили табличку. Это хороший
урок и самим генетикам, и тем представителям
жено никакого смешения между кроманьонцами и
смежных наук, которые часто доверяют всему, что
неандертальцами. Этот результат был подтверж
ден и дальнейшими исследованиями других лабо
раторий мира. Был сделан вывод, получивший са
«показано по ДНК». Дело в том, что оба результа
та с точки зрения генетики верны, точны и под
тверждены многочисленными исследованиями.
мое широкое освещение в СМИ, что неандерталь
цы полностью тупиковая ветвь эволюции челове
ка, поскольку в формировании генома современ
Просто молекуламитохондриальной ДНК корот
кая и не сохранила следов общих генов с неандер
тальцами, обнаруженных НеСКОЛЬКИМИ ГОДaМИ ПОЗ
ного человека нет вклада неандертальцев.
же при исследовании всего остального генома —
Но совершенствование генетических техноло
гий позволило перейти уже от изучения митохон
ядерной ДНК.
дриального генома — ко всему геному неандерталь
В СОВРЕМЕННЫХ ГЕНОМАХ ЕВРАЗИИ
ца. Эта работа, начавшаяся в 2006 году, сначала
ЦИРКУЛИРУЮТ 20% НЕАНДЕРТАЛЬСКОГО
также не позволяла выявить «неандертальские
ГЕНОМА
гены» в геноме современного человека. Но техно
логии анализа стремительно развивались, и в 2010
году был получен «черновой» геном неандерталь
ца с покрытием около 1, то есть каждый участок
генома был секвенирован в среднем только один
раз. Это для технологий секвенирования следую
щего поколения (NGS) крайне недостаточно — при
секвенировании современных геномов в последние
годы считается «нормой» покрытие в 60—70, и уж
в любом случае не менее 30. Однако плохая сохран
ность древней ДНК приводит к тому, что, как мы
увидим из дальнейшего изложения, покрытие при
секвенировании древних геномов зачастую мень
Итак, представление о том, что неандерталец
нам не родственник, было опровергнуто после того,
как в 2010 году Сванте Паабо секвенировал его
ядерный геном. В отличие от мтДНК неандерталь
ца, которая не обнаруживает сходства ни с одним
из вариантов мтДНК современного человека, в
ядерной ДНК обнаружились признаки метисации.
Это привело исследователей к выводу, что Ното
sapiens и Ното театderialensis смешивались, и
около 1—4% генома в современных популяциях
Евразии имеют неандертальское происхождение.
Дальнейшие исследования и более глубокий
ше даже единицы. Поэтому надо всегда оценивать
аналИЗ ПОЗВОЛИли Вытащить на Свет МНОГИе ПОС
вероятность биоинформационной ошибки, завися
щей от степени «покрытия» — надежности прочте
ледовательности неандертальской ДНК, спрятан
ные в современных геномах. У разных людей не
НИЯ ГеНОМa.
андертальское генетическое наследство неодина
В результате анализа этого «чернового» гено
ково как по размеру, так и по набору фрагментов
манеандертальца выявилось, что около 1—2% ге
ДНК. Популяционные генетики из Вашингтонско
нома современного населения Евразии имеют не
андертальское происхождение. Дальнейшие иссле
го университета (Vernot, Аkey, 2014) подсчитали
дования показали, что эта доля варьирует от 1% до
3—4% по Евразии (в Азии чуть больше, чем в Ев
ропе), но очень невелика (по более ранним дан
ным — даже полностью отсутствует) у современ
ного населения Африки южнее Сахары. Это позво
вательностей, сохранившихся в современных ге
номах. Для этого они проанализировали 665 гено
лило сделать вывод, что небольшая метисация меж
все участки интрогрессии (включения неандер
тальской ДНК) и сравнили их с эталонным гено
ду неандертальцами и кроманьонцами (неоантро
пом) в Евразии все же была. Напомню, что ареал
неандертальцев простирался от Западной Европы
через Крым и Кавказ до Средней Азии и Алтая,
включая в себя Переднюю Азию.
суммарное количество неандертальских последо
мов современных людей (379 жителей Европы и
286 — Восточной Азии), которые были секвениро
ваны в рамках проекта «1000 геномов», выделили
мом неандертальца, секвенированным коллекти
вом Сванте Паабо. Проверенные таким образом
«неандертальские» последовательности составили
около 600 Мb (мегабаз, миллионов пар оснований),
267
8.2. Средний палеолит (неандертальцы)
что составляет около 20% неандертальского гено
ми, чем с европейцами. Этим он отличается от дру
ма. Иными словами, большая доля — пятая часть
гого почти столь же древнего европейца — со сто
янки Костенки-14, возрастом 36—39 тыс. лет, кото
рый проявляет большее сходство с современными
европейскими популяциями, чем с восточноазиат
генома неандертальцев — хранится и циркулирует
в геномах человечества. Эта величина никак не
противоречит тому, что в геноме каждого челове
ка (неафриканского происхождения) содержится не
более 1—4% неандертальской ДНК. Ведь у разных
людей эти фрагменты разные, и только в сумме они
скими. Эта особенность привела авторов к заклю
чению, что Оase 1 принадлежал к ранней европей
приводят к такой большой доле.
Неандертальские последовательности в гено
которая практически не внесла вклад в генофонд
ской популяции анатомически современных людей,
ме современных людей довольно короткие — не
более поздних европейцев.
Чтобы оценить неандертальский вклад в геном
больше 57 Кb (килобаз, тысяч нуклеотидов). Это
Оase 1, было подсчитано число неандертальских
объясняется тем, что со времени гибридизации с
аллелей во многих современных и нескольких
неандертальцами прошло много времени, и длин
древних геномах (взяв за исходный геном алтайс
ких неандертальцев). Доля неандертальских пос
ледовательностей у Оase 1 оказалось существенно
ные последовательности оказались разбиты реком
бинациями. В разных популяциях и у разных лю
дей в ДНК прячутся разные неандертальские пос
ледовательности. В среднем на человека приходит
ся по 23 Мb неандертальской ДНК.
В этом исследовании было также показано, что
современные популяции Азии унаследовали в
среднем на 21% неандертальских последователь
ностей больше, чем европейцы.
выше, чем у современных людей и чем у древних
людей анатомически современного вида. Подсчет
показал, что Оase 1 несет 3746 аллелей неандер
тальского происхождения, образцы из Усть-Иши
ма(42—43 тыс. лет назад) и Костенок-14 (36—39 тыс.
лет назад) — в два-три раза меньше (1586 и 1121
аллелей соответственно), образцы из Китая и
Франции — 1322 и 1033. То есть, неандертальс
САПИЕНСЫ И НЕАНДЕРТАЛЬЦЫ — НЕДАВНИЙ
кий вклад в Оase I оказался в несколько раз выше,
ОБМЕН ГЕНАМИ
чем в остальных геномах. Долю неандертальской
ДНК в геноме Оase 1 определили тремя методами,
Одно из самых интересных открытий после
которые дали несколько различающиеся результа
днего года (Fu et al., 2015) показывает, что метиса
ты — от 6,0% до 9,4%, в среднем ее оценили в 7,3%.
ция сапиенсов и неандертальцев происходила не
50—60 тысяч лет назад, но и гораздо позже. И не
только на Ближнем Востоке, как до сих пор счита
При этом неандертальские последовательности
были распределены по хромосомам неравномер
но: в семи участках их было особенно много, а ког
да исключили эти участки, доля неандертальской
ли, а и в Европе. Этот результат получен в работе
коллектива Сванте Паабо, в которой исследовали
ДНК упала до 4,8%.
Важнее всего то, что фрагменты неандерталь
ДНК древнейшего современного человека на тер
ской ДНК в геноме Оase 1 достигали значитель
ной длины, в некоторых участках генома они пре
только после выхода сапиенсов из Африки, то есть
ритории Европы, возрастом 37—42 тыс. лет (по ра
диоуглеродной датировке). Нижнюю челюсть Оase
пещере Реstera cu Оase (название означает «пеще
ра с костями»). Строение челюсти соответствова
вышали 50 cМ (сантиморганид). Это означает, что
данные фрагменты еще не успели разбиться реком
бинациями. Проанализировав длину фрагментов,
определили, что метисация предков Оase 1 с неан
лоанатомически современному человеку, хотя не
дертальцами произошла совсем недавно — это
которые признаки указывали на его родство с не
случилось всего за 4—6 поколений до его рожде
1 в 2002 году обнаружили в Румынии, в подводной
андертальцами. А вскоре после этого из пещеры
был извлечен череп другого индивида (Оase 2), и
этот череп подтвердил догадки о неандертальских
предках. Оставалось проверить это генетически.
Из челюсти Оase 1 извлекли митохондриаль
ную и ядерную ДНК. Анализ показал, что это муж
чина, его Y-хромосомный гаплотип относился к
макрогаплогруппе F, которая объединяет большин
ство гаплогрупп, распространенных сегодня на
территории Евразии. Ядерный геном Оase 1 по
маркерам однонуклеотидного полиморфизма (SNP)
ния.
Итак, смешение предков этого неоантропа про
изошло примерно за пять поколений до времени
жизни этого человека. То есть около 40 тыс. лет
назад происходила метисация неоантропов с не
андертальцами в Европе. И поскольку столет — это
немного, то и само событие метисации скорее все
го случилось в том же регионе, где был обнаружен
сам Оase 1, то есть на Балканах. Так что геном Оase
1 показал, что метисация неоантропов с неандер
тальцами происходила не только непосредствен
проверили на сходство с большим количеством
но после выхода из Африки и не только на Ближ
геномов современных людей. Оказалось, что Оase
нем Востоке, но случалась и позже, когда сапиен
сы одновременно с неандертальцами жили в Ев
1 имеет больше общих аллелей с восточноазиатс
кими популяциями и с американскими индейца
ропе.
Глава 8. Древняя ДНК Европы
268
Однако, поскольку Oase 1 генетически не по
хож на поздних европейцев, нельзя исключать, что
он мог быть членом первоначальной ранней попу
ляции сапиенсов, которая смешалась с неандер
тальцами, но не оставила заметного следа в пос
ледующем генофонде. Для более точных предпо
ложений нужно проанализировать другие останки
из пещеры Oase и исследовать прочие популяции
древнейших сапиенсов Европы.
ДЕНИСОВСКИЙ ЧЕЛОВЕК
Следующий виток исследований был связан с
обнаружением в Денисовой пещере на Алтае в сло
ях большой древности фрагмента кости пальца –
настолько маленького, что антропологическими
методами было невозможно определить, к какому
виду гоминид он относится. А когда был секвени
рован геном, оказалось, что это третий вид (или
подвид – классификации разные) человека разум
ного. Этот вид назвали «денисовцем» (от названия
места находки – Денисовой пещеры, а название, в
свою очередь, происходит от имени спасавшегося
в ней монаха Дионисия). Происхождение названия
«денисовец», таким образом, полностью аналогич
но происхождению названия «неандерталец», на
званному по месту первой находки – небольшому
гроту около Неандерской пещеры. Денисовцы –
единственный вид гоминид, выявленный не мор
фологическими, а генетическими методами.
На дереве родства популяций гоминиддени
совцы объединяются сначала с неандертальцами,
а уже потом санатомически современным челове
ком, но эти развилки столь близки, что три вида
(или подвида Homo sapiens) – кроманьонцы, неан
дертальцы, денисовцы – можно рассматривать и
как три равноправных таксона.
В последующих исследованиях было обнару
жено, что вклад денисовцев особенно велик в на
селение Меланезии (до 5%). Это удивительно, по
тому что – где Меланезия, и где Алтай с Денисо
вой пещерой! Поэтому большинство исследовате
лей, включая и самого Сванте Паабо, предполага
ют, что ареал денисовцев включал не только Си
бирь, но чуть ли не всю Азию – не только к северу,
но и к югу от Гималаев. Поэтому возможно, что
предки меланезийцев встретили денисовцев и сме
шались с ними в Юго-Восточной Азии – по пути
предков меланезийцев из Африки в Меланезию.
НЕАНДЕРТАЛЬЦЫ ИЗ ДЕНИСОВОЙ
В геномах денисовцев и неандертальцев выяв
ляются и смешения друг с другом, что неудиви
тельно, поскольку в той же Денисовой пещере об
наружены останки и неандертальцев. Обнаружен
в их геноме вклад и еще одной – неизвестной –
популяции, которую можно гипотетически считать
еще неизвестным, четвертым подвидом Homo
sapiens. Таким образом, изучение древних геномов
начинает прорисовывать сложную картину: в сред
нем палеолите Евразии были не разделенные друг
от друга неандертальцы и кроманьонцы, а суще
ствовала метапопуляция гоминид, включающая
несколько видов или подвидов.
Если первоначально данные по геному неан
дертальца ограничивались анализом единственно
го образца, то впоследствии коллективом Сванте
Паабо было проанализировано большое их число,
в том числе были проанализированы останки не
скольких неандертальцев, найденных в Денисовой
пещере. И, по крайней мере, у одного из них по
длине не разбитых рекомбинацией кусочков гено
мастало понятно, что он потомок очень инбред
ного брака – людей, состоящих примерно во вто
рой степени родства [Prüfer et al., 2014]. Нужно
отметить, что сам Сванте Паабо не спешит припи
сывать практику близкородственных браков всем
неандертальцам: он считает, что нужно секвени
ровать больше неандертальцев, чтобы понять, ти
пичен ли для них высокий инбридинг или это ис
ключение.
САМЫЙ ДРЕВНИЙ ГЕНОМ НЕАНДЕРТАЛЬЦА
Одно из последних громких открытий, связан
ных с неандертальцами, произошло при совмест
ном исследовании антропологами и генетиками
«альтамурского человека», найденного в 1993 году
в карстовой пещере Ламалунга возле города Аль
тамура в Италии [Lari et al, 2015].
Этот скелет был почти полностью погружен в
отложения известняка, на поверхности оставалась
лицевая часть черепа и некоторые кости. Из-за это
го даже спустя много лет после находки исследо
вание ограничивалось лишь описанием внешнего
вида, доступного для обозрения. Судя по антропо
логическим признакам, скелет принадлежал чело
веку опохи среднего-начала позднего плейстоце
на. И хотя по некоторым чертам черепа он похо
дил на неандертальца, по другим чертам отличал
ся от большинства известных неандертальских ске
летов. В 2009 году, фрагмент скелета (часть пра
вой лопатки) удалось осторожно извлечь для ант
ропологического и генетического исследования.
Эта работа проведена итальянскими специалиста
ми под руководством Джорджио Манци (Giorgio
Manzi) из Римского университета приучастии спе
циалистов из Австралии и Испании.
Возраст скелета был определен методом ура
но-ториевой датировки известковых отложений на
поверхности кости. На срезе были последователь
но датированы слои этих отложений, от внешних
к внутренним, что позволило датировать находку
интервалом от 130 до 170 тыс. лет назад, то есть
можно условно принять среднюю датировку око
269
8.2. Средний палеолит (неандертальцы)
ло 150 тыс. лет Антропологи провели детальное
исследование фрагмента лопатки и по совокупно
манипуляциях с ним не был загрязнен ДНК совре
МеННОГО ЧeЛОВeКа.
сти признаков поместили ее в неандертальский
По полученному фрагменту мтДНК было
кластер. «Альтамурский человек» по имеющимся
проведено сравнение всех известных митохонд
антропологическим признакам занял место меж
риальных геномов неандертальца иденисовско
дуранними и поздними неандертальцами.
го человека и построено филогенетическое де
рево (рис. 8.2). Как можно видеть на построен
ном дереве, «Альтамурский человек» вошел в
Генетикам тоже удалось извлечь из останков
ДНК, но она была очень фрагментирована, что не
удивительно для останков такого возраста. Все же
один кластер с другими неандертальскими об
один фрагмент митохондриальной ДНК удалось
разцами из Западной Европы. Таким образом, это
секвенировать. Несколько позиций мтДНК несли
самый древний неандерталец, из останков кото
рого была извлечена ДНК, и полученные резуль
типично неандертальские варианты (А16230G,
G16244А, С16256А, А 16258G) и отличались отгап
лотипов как Ното sapiens, так иденисовского че
ловека. Прежде всего это означает, что образец при
таты указывают на то, что популяция неандер
тальцев около 150 тыс. лет назад была неодно
родна.
Altamura
вlsidron1253(Fм865409)
Е|Sidron634
Е|Sidron76a,
ElSidron 1634
E|Sidron500
Е|Sidron586
ElSidron763a
ElSidron753/1161
64 | ElSidron1327h
Е|Sidron331c
в Sidron011
Е|Sidтоп1240
ElSidron1252(441)(DO8590142
Feldhofer1(Fм865407)
Vindija3316(АМ948965)
Vndja75(AF282971)
vindja77
vindja3325(Fм865410)
МоntiLessini(DO836132)
Feldhofer2(Fм865408)
Mezmaiskaya(FM865411)
okladnikov(EU078680)
29|Engis2
50
LaChapelle-aux-Saint
Rochers deVilleneuve
Valdegoba(JO670672)
теshik-тash(EU078679)
Sciadina(DO464008)
Denisova(FN673705)
н
0,02
Рис. 8.2. Филогенетическое дерево изученных образцов неандертальцев, включая «Альтамурского чело
века» (Lari et al., 2015). Дерево построено по данным о мтДНК. Геном «денисовца» использован в качестве внеш
ней группы.
270
Глава 8. Древняя ДНК Европы
ЭФФЕКТЫ ОТБОРА: ОТ НЕАНДЕРТАЛЬЦА
которые экспрессируются в кератиноцитах — клет
К НЕОАНТРОПУ
Данные по геному неандертальца, включенно
му в генофонд современного человечества, позво
ляют провести и функциональный анализ этих
фрагментов генома. По этому поводу возникает
еще больше эмоций и вопросов, чем по поводу
родства неандертальцев и людей современного
ках кожи — и регулируют ее пигментацию. Возмож
но, здесь приобретение неандертальских аллелей
повысило способность сапиенсов адаптироваться
к разным климатическим условиям при расселе
нии по планете. А аллель адаптации к жизни на
большой высоте у тибетцев считается заимство
ванным ОтдеНИСОВЦев.
Кроме всплесков, есть и «впадины» — участки
ВИДа.
хромосомы, в которых последовательности или не
Даже если только один процент нашего генома
унаследован от неандертальцев — этого достаточ
но, чтобы проводить статистический анализ. Рас
сматривая разные участки генома вдоль хромосо
мы, естественно предполагать, что в любом сег
менте чисто случайно будет примерно одинаковое
количество неандертальских последовательностей.
Но геном неоантропа (то есть наш геном) оказался
очень неоднородным по содержанию неандерталь
ской ДНК: например, 8-я и 17-я хромосомы совсем
не содержат неандертальской ДНК, а есть участки
и отдельные гены, в которых ее намного больше
среднего. Поэтому, если мы где-то видим досто
верный «всплеск» — повышение долинеандерталь
ских последовательностей — то можно предпола
гать действие естественного отбора, который под
хватил неандертальские по происхождению алле
ли, если они были адаптивны и полезны для нео
антропа. Оказалось (Vernot, Аkey, 2014), что при
мерно 26% от всех кодирующих белки генов име
ют кроме чисто сапиентных аллелей еще и такие
передавались от неандертальцев или передавались,
но потом отсекались отбором. Например, такие
участки типичны вблизи генов, участвующих в
сперматогенезе. К участкам генома, обедненным
неандертальскими последовательностями, относят
и участок на седьмой хромосоме, содержащий ген
FОХР2, фактор транскрипции, игравший, как счи
тает ряд исследователей, важную роль в появле
нии человеческой речи.
Некоторые из участков, обогащенных неан
дертальской ДНК, являются общими для совре
менных популяций Азии и Европы, другие встре
чаются только в одной из частей Евразии. По
этому можно рассмотреть две модели гибриди
зации (рис. 8.3). В соответствии с первой, поток
неандертальских генов был принят популяцией
— общим предком населения и Западной и Вос
точной Евразии. Вторая модель предполагает,
что помимо этого, основного потока, случилось
еще одно, меньшее вливание неандертальских
аллели, в которых один или больше экзонов (учас
тков, несущих информацию о белках) несут неан
генов в популяции Азии уже после их отделения
от общего предка с европейцами. В пользу вто
рой модели говорит большая доля неандерталь
дертальские последовательности. К генам с повы
ского генома, циркулирующая в азиатских попу
шенным неандертальским вкладом относятся гены,
ляциях.
Оne Pulse
м.
ТwО РUlSe
NАмс
Т. 1— — — — — —
т.Н. — — — — —
Present
мне
Neanderthal N"
N деN
N дем
European
Asian
European
Neanderthal
Asian
Рис. 8.3. Две модели интрогрессии неандертальской ДНК в геном европейских и азиатских популяций:
один поток генов к предковой популяции или дополнительный поток генов в Азии (Vernot, Аkey, 2014).
271
8.3. Верхний палеолит и мезолит
ЭФФЕКТЫ ОТБОРА: ОТ ОБЩЕГО ПРЕДКА
возникли на самых последних этапах эволюции,
К НЕОАНТРОПУ
ведущей к человеку современного вида. Найдено
всего лишь 30 тысяч таких SNР из них меньше
сотни приводят к аминокислотным заменам. К
настоящему времени подробно проанализирова
Еще один вариант анализа — это поиск гене
тических вариантов, специфичных только для че
ловека современного вида. То есть тех вариантов,
которые есть у всех современных людей, но их
нет не только у шимпанзе, но и у неандерталь
цев. Получается, что эти генетические варианты
ны и осмыслены не все из них, поскольку в пер
вую очередь исследователи концентрировались на
анализе тех из этой сотни генов, которые связаны
сработой мозга.
8.3. ВЕРХНИЙ ПАЛЕОЛИТ И МЕЗОЛИТ
ГЕНОМ ИЗ ВОСТОЧНОЙ ЕВРОПЫ (КОСТЕНКИ)
РОДСТВЕННИК ОЧЕНЬ МНОГИМ
ся временем 36—39 тыс. лет назад — он один из са
мых древних неоантропов Европе. А его геном —
Яркий штрих к картине формирования гено
один из самых древних секвенированных геномов
фонда Европы добавил секвенированный геном
из наиболее изученных в Восточной Европе (рис.
Ноmo sapiens: древнее его только геном образца
из Усть-Ишима (45 тыс. лет) и практически синх
ронен рассмотренный выше геном Оase 1 из Ру
мынии (37—42 тыс. лет).
Митохондриальный геном образца Костенки
8.4). Скелет найденного здесь мужчины датирует
14 (К 14) был секвенирован еще в 2010 году — он
верхнепалеолитического человека со стоянки Ко
стенки-14 под Воронежем, на берегу Дона. Это
всемирно известная археологическая стоянка, одна
А Locations of analyzed samples
Forest steppe
Temperate deserts
Tropical semi-desert
тropical semi-deserts
*s------
Мосіегп hшпапе
нunter-Gatherers (нG)
Upper Paleolithic UРНG)
1. Ковlenki (К14) (38,684-36.262 calВР)
2. мета (мА1, -24,000 cal ВР
Меsolithic (МнG)
Denisova
3. La Brana
10. Denisova Cave -40.000ВР)
(7,940-76908 7960-5.750 calвP)
4. Alvide (Ajv56,5,100-4,150 calВР)
5. Loschbour (8,013-7850cal ВР)
6. Моiala (— 7,000 ВР)
Neolithic Farmers (NEоL)
7. Gбkhеп (Gok2) (5.050-4.750 85,280-4,890 calВР)
!" Maximum extent ofice at
Neandertals
"---"Lсм (25-15 ka)
10. Denisova Cave (> 50,000 ВР)
11. Mezmaiskaya (-50.000 ВР)
12. VIndia (- 33,000 ВР)
13. El Sidron (- 49,000 ВР)
14. Кleine Feldhofer Grotte (- 40,000 ВР)
Роiential ice coverage during
МlS3 cold intervals
Типdra 8 steppe-tuпdra,
polar 8. alpine deserts
8. Оtzi (сепап. —5,300 calВР)
9 Stuttgart (7050-6.750 calВР)
Рис. 8.4. Местоположение стоянки Костенки-14 и мест нахождения образцов других изученных древних
геномов (Seguin-Оrlando et al., 2014).
ВЕРХНИЙ ПАЛЕОЛИТ: 1. Костенки (К14, 387—36,3 тыс. лет), 2. Мальта (МА1, 24 тыс. лет). МЕЗОЛИТ. 3. Ла
Бранья (7.9—7.7 тыс. лет и 8—5,8 тыс. лет), 4. Альвиде (5.1—4,1 тыс. лет), 5. Лошбор (8—7.9 тыс. лет), 6. Мотала (7
тыс. лет). НЕОЛИТ: 7. Гёкхейм (Gok2), (5-48 тыс.лет и 5.3—4,9 тыс. лет), 8. Отзи (тирольский ледяной человек,
5.3 тыс. лет). 9 Штуттгарт (7-6,8 тыс. лет). ДЕНИСОВЕЦ. 10. Денисова пещера (ок. 40 тыс. лет). НЕАНДЕРТАЛЬ
ЦЫ 10. Денисова пещера (>50 тыс. лет), 11. Мезмайская (ок. 60 тыс. лет), 12. Пещера Виндия (ок. 33 тыс. лет), 13.
Эль Синдрон (ок. 49 тыс. лет), 14 Малый Фельдхофер грот (ок. 40 тыс. лет).
272
Глава 8. Древняя ДНК Европы
относится к гаплогруппе U2. А в 2014 году кол
лективом под руководством Eske Willersley (Дания)
удалось секвенировать и его ядерный геном
(Seguin-Оrlando et al., 2014). Y-хромосома образца
из Костенок принадлежит к гаплогруппе С-М130,
так же как и у мезолитического охотника-собира
теля Ла Бранья из Испании. Аутосомный геном
Костенок-14 сравнили (рис. 8.5) c другими древ
ними секвенированными геномами (их локализа
При этом обнаружена удивительная картина:
геном из Воронежских Костенок так же, как и ге
ном из Байкальской Мальты, содержит все восемь
генетических компонентов из восьми крупных ре
гионов современной ойкумены. Похоже, что в его
геноме содержатся аллели, которые впоследствии
разошлись по всем основным группам современ
НОГО
НаСеЛеНИЯ.
Из всех древних геномов образец из Костенок
ция и датировки даны на рис. 84) и геномами со
наиболее близок к геномам мезолитических охот
временного населения Евразии (2091 человек из
167 популяций).
к геному верхнепалеолитического мальчика со сто
ников-собирателей (Лошбор, Ла Бранья), а также
янки Мальта в Восточной Сибири (МА1, 24 тыс.
лет). На основании этого сходства в работе сделан
В Сlustering analysis
UРНG
МНG
вывод об интенсивных потоках генов, связываю
NEOL
щих верхнепалеолитические популяции Сибири с
предками мезолитических жителей Европы.
Эта работа несколько проясняет и загадочный
«четвертый элемент» — тот «базальный» компонент
генофонда Европы, который проявился при моде
лировании истории сложения генофонда Европы
в работе (Lazaridis et al., 2014) (см. раздел 84, рис
8.20) — предковой евразийской группой, которая
внесла свой большой вклад и в геном неолитичес
ких земледельцев. Из аналогичной по методам
модели, созданной в рассматриваемой работе
(Seguin-Оrlando et al., 2014), следует (рис. 8.6), что
в геном человека из Костенок эти таинственные
«базальные евразийцы» внесли не менее важный
вклад, чем и верхнепалеолитические западные ев
разийцы. Также из модели следует, что он имел и
общих, хотя и более отдаленных, предков с древ
ними северными евразийцами восточного ствола.
Из рассмотренных геномов 167 современных
сN c -
популяций геном из Костенок (К 14) наиболее схо
3 : 3 = 5 , &5 &
ден с населением Европы, а в ее пределах — с гено
мами северных европейцев. Некоторое сходство от
т—
: cc о со
>< > 5 9 5 2. В Е 5
3
5 = < Ф 9 =В
5 с
о —
сло
—!
мечалось с современными популяциями Сибири
(из изученных — особенно с хакасами), с популя
циями Ближнего Востока и Кавказа, при этом прак
тически отсутствует генетическое сходство с со
"central Asia"
"Middle East"
"America"
"Africa"
"East Asia"
"на"
менного населения разных географических регионов
(метод кластерного анализа) (Seguin-Оrlando et al.,
временным населением Восточной Азии (рис. 8.7).
Исходя из сравнительного анализа человека из
Костенок и накопленных данных о геномах древ
него и современного населения Евразии, сделан
вывод (Seguin-Оrlando et al., 2014) о раннем разде
лении популяций Восточной и Западной Евразии:
верхнепалеолитический человек из Костенок при
надлежал к западной евразийской линии микроэво
люции (по антропологической классификации их,
видимо, можно отнести к европеоидам), которая
уже отделилась от населения Восточной Евразии
2014). UР — верхний палеолит, М — мезолит НG — охот
ники-собиратели, NЕОL — неолитические земледельцы.
мо, можно отнести к монголоидам). Исходя изда
"Siberia"
"Осеania"
"South Asia"
Рис. 8.5. Оценка доли в древних геномах генома
охотников-собирателей и восьми компонентов совре
К14 — Костенки-14, МА1 — Мальта, Loschbour — Лош
бор, La Brana — Ла Бранья, Мotala — Мотала, Аіv58 —
Альвиде, Gok2 — Гёкхем, Iceman — тирольский «ледя
ной человек», Stuttgart — Штуттгарт.
(по антропологической классификации их, види
тировки человека из Костенок (К14), разделение
этих двух стволов генофонда Евразии (западноев
разийского и восточноевразийского) произошло не
позже, чем 36 тыс. лет назад. Поскольку у костен
8.3. Верхний палеолит и мезолит
273
ию
Non-African
Вasal Eurasian
на.
выми
West Eurasian UР
(ы:
-
ч.
...
.
. -а
(а)
-
за
Ancient North Eurasian
МА1
ы
.
Eurasian
4—
мне
-
".
}
(с)
-
(а) D(Мbuti, К14; East Asia, Europe) > 0
f(Мbuti; К14, X) maximized with мнG
European
(b) D(Мbuti, East Asia, НG, К14) < 0
D(Мbuti, East Asia. NEOL, К14) = 0
NEOL component for к14 in ADMIXTURE
(c)}(Sardina, к14; X, Papuan) > 0
/(Sardinia, Scandinavian мнG, X, Papuan) < 0
дtх, моtala, Evens) < 0 and lowest}, for Venisei
Рис. 8.6. Предполагаемые генетические связи между восточноевропейским образцом из Костенок (К14),
сибирским образцом из Мальты (МА1) и генофондами древнего и современного населения (Seguin-Оrlando
et al., 2014).
Обозначения:
Вasal Eurasia — базальная евразийская группа популяций,
West Eurasian UР — верхнепалеолитические западные евразийцы,
Аncient North Eurasian — древние популяции Северной Евразии,
МНG — мезолитические охотники-собиратели,
NЕОЦ — неолитические земледельцы,
Yenisei — современные популяции на Енисее (хакасы),
European — современные европейцы,
Мbuti — пигмеи мбути.
274
Глава 8. Древняя ДНК Европы
о/(мbuti; К14, x) - Europe
с /(мbuti, к14,x)-worldwide
o О
60
60
О
С
Оo
o
-
4?
40 —
50
оо
о
20 —
40- О
o
с
т
—100
п
I
0
100
30 —
оо
9 об
О
и
I
|
0
10
20
Рис. 8.7. Генетическое сходство между верхнепалеолитическим человеком из Костенок (К14) и современ
ными популяциями мира (слева) и Европы (справа) (Seguin-Оrlando et al., 2014).
Обозначения: более теплые цвета, в соответствии со шкалой (справа) указывают на большее генетическое
СХОДСТВО, ХОЛОДНЫe ТОна — На МеНЬШее СХОДСТВО.
ковского образца не обнаружена генетическая связь
с современным населением Меланезии (напомним,
что такая связь была выявлена сденисовцем) и
Австралии, сделан вывод, что предки австралий
цев и меланезийцев отделились от общего ствола
еще раньше развилки западноевразийских и вос
точноевразийских генофондов.
ОСКОЛКИ МЕТА-ПОПУЛЯЦИИ ЕВРАЗИИ
В целом, обобщая накопленные данные по
изучению древних геномов, можно сделать важ
ный вывод, что в Европе, начиная с верхнего па
леолита, существовала метапопуляция, нераз
рывно связанная с другими генофондами Евра
зии, и генетический след этой метапопуляции
прослеживается и сегодня. Причем этот верхне
палеолитический генетический вкладу совре
менных северных европейцев относительно
выше, чем у южных. В целом генетическая кар
тина колонизации Европы от верхнего палеоли
та до наших дней оказалась гораздо сложнее, чем
представлялось ранее — до подробного изучения
древней ДНК.
ЕВРОПЕОИДНЫЙ КОМПОНЕНТ В СИБИРИ (МАЛЬТА)
ДРЕВНИЙ ОБРАЗЕЦ ИЗ ЭРМИТАЖА
няшний день геномов происходит с позднепалео
литической стоянки Мальта, близ озера Байкал
Еще один важный, уже не раз упоминавшийся
выше и один из древнейших изученных на сегод
(рис. 8.8), возрастом около 24 тысяч лет. Он был
изучен под руководством Eske Willerslev между
Аfontoya Gora-2
А"
Ма|'ta
Рис. 8.8. Географическое положение верхнепалеолитических стоянок Мальта (красный треугольник) и
Афонтова гора (красный кружок) в Сибири (Ragvalan et al., 2013).
Также указаны: местоположения палеолитических образцов с гаплогруппой U мтДНК (черные треугольни
ки): 1. Оберкассель (Германия), 2. Холе Фельс (Германия), 3. Дольни Вестонице (Чехия), 4. Костёнки-14 (Россия);
местоположения палеолитических образцов с гаплогруппой В мтДНК (черный квадрат); 5. Пещера Тяньюань
(Китай), другие палеолитические стоянки с фигурками «палеолитических Венер» (коричневые кружки); 6. Лос
сель (Франция), 7. Леспюг (Франция), 8. Гримальди (Италия), 9. Виллендорф (Австрия), 10. Гагарино (Россия);
другие известные палеолитические стоянки (серые кружки): 11. Сунгирь (Россия), 12 Яна RHS (Россия).
275
8.3. Верхний палеолит и мезолит
народной командой, включившей и меня в числе
многочисленных других коллег (Ragvalan et al.,
2013).
Части скелета, принадлежащего мальчику со
стоянки Мальта (МА-1), находились в коллекции
Эрмитажа. Ведь Мальта (ударение на последний
слог) — это одна из самых известных стоянок чело
века позднего палеолита, место множества архео
логических находок. Например, именно там были
найдены 30 знаменитых сибирских «палеолитичес
ких Венер» — скульптурных женских изображений
верхнего палеолита (другие «палеолитические Ве
неры» обнаружены лишь в Европе, рис. 8.8). Бла
годаря полногеномному исследованию мальчика из
от современных популяций Восточной Азии. И
многие современные популяции Сибири удаляют
ся от Мальты на значительное генетическое рас
стояние. А те современные сибирские геномы, ко
торые более близки к Мальте, все же находятся от
нее примерно на том же расстоянии в генетичес
ком пространстве 1 и 2 главных компонент, что и
народы Европы, Америки и Центральной Азии
(рис. 8.9). Эту картину уточняетрис 8.10 — древо
родства популяций, построенное методом ТreeМіх,
допускающим не только разветвления, но некото
рое число слияний ветвей древа.
Подчеркнем, что не отдельные геномы, а пред
ставители всех 48 столь разных популяций совре
возросла.
менного коренного населения Америки оказались
генетически сходны с верхнепалеолитической Си
бирью (МА-1). Можно предполагать, что именно
ЗАПАДНОЕВРАЗИЙСКИЙ КОМПОНЕНТ В ДРЕВНЕЙ
мета-популяция северной части Евразии верхнего
палеолита, охватывающая ареал от Европы до Во
Мальты и его неожиданным результатам, мировая
известность этой сибирской стоянки еще больше
СИБИРИ И АМЕРИКЕ
сточной Сибири, дала вклад 14—38% в генофонд
Как и в других исследованиях, геном из Маль
ты (МА-1) сравнивался с современным населени
ем всего мира методом главных компонент (рис.
8.9). Результат оказался неожиданным: геном из
верхнепалеолитической Сибири обнаружил сход
ство и с современным населением Западной Евра
зии, и с современными индейцами Америки, но
оказался далек от своих географических соседей —
современных индейцев Америки. Причем «запад
ный» компонент должен был появиться в Сибири
до того, как мигрировавшие через берингийский
перешеек переселенцы из Сибири стали расселять
ся по Американскому континенту. Предполагает
ся, что именно таким образом, коренное населе
ние обеих Америк вобрало в себя два потока генов
— из Восточной и из Западной Евразии. Такая мо
дель объясняет, например, каким образом у индей
0,04 + Native Americans:
Amerind
|
-
Na-Deme
-
Eskimo-Aleut
0.02 -
9
"A}е
2
*
Europeans
сч
-
С
о
0.00 П
Siberians
Сentral and
South Asians
--
—0.02
Осеаnians
East Asians
|
—0.03
I
—0.02
Т
—0.01
|
0.00
0.01
I
|
0.02
0.03
РС1
Рис. 8.9. Положение верхнепалеолитического генома Мальта (МА-1) из Восточной Сибири среди гено
фондов современного коренного населения Евразии и Америки (график главных компонент) (Ragvalan et
al., 2013).
276
Глава 8. Древняя ДНК Европы
San
М9ration
Мbuti
weight
0.5
Yoruра
Мапdenka
Dinka
Tajik
Sardinian
French
Аvar
МА-1
Кaritiana
Denisova
0.00
0.02
0.04
0.06
|
|
|
|
0.08
0.1 0
0.12
0.14
Рис. 8.10. Реконструкция вероятного родства 15 современных и 2 древних сибирских геномов (денисовец
взят в качестве генетического масштаба) (Ragvalan et al., 2013).
Обозначения: МА-1 — Мальта, Каritiana — одна из популяций американских индейцев, Наn и Dai — представи
тели генофонда Восточной Азии. Полные геномы современного населения Сибири не были доступны авторам
этого исследования и отсутствуют на графике, поэтому генофондамериканских индейцев выводится из един
ственных присутствующих на дереве монголоидов (Наm и Dai), но реконструируется и генетический вклад Маль
ты (красная стрелка). Сам геном Мальты по этим результатам выводится хотя и из западноевразийских генофон
дов, но почти так же близко к месту их развилки с популяциями Восточной Азии, как и геном из Индии.
цев Америки появилась митохондриальная гаплог
руппа Х, которая распространена в Европе, но от
сутствует в Восточной Азии.
Этот западноевразийский компонент, свой
ственный верхнепалеолитическому населению
Сибири и пришедший через Берингию из Сибири
в Америку, может объяснить и «парадокс черепов»,
который долгое время является предметом дискус
сий палеоантропологов. Парадокс заключается в
том, что некоторые ископаемые черепа палеоаме
риканцев не обладают восточноевразийскими
(монголоидными) чертами и не очень похожи на
черепа современных индейцев.
Кроме того, и у современных индейцев есть
некоторые европеоидные черты. Предполагалось,
что эти антропологические черты у индейцев —
результат позднего смешения в ходе послеколум
бовой европейской колонизации. Но, в соответ
ствии с генетическими данными, они могли прий
ти и из Берингии с самым древним населением
Америки.
ЛЮДИ ЖИЛИ В СИБИРИ И НА МАКСИМУМЕ
ОЛЕДЕНЕНИЯ
Геном мальчика из Мальты (МА-1, 24 тыс. лет
назад) сравнили с другим древним сибирским ге
номом — из скелета с датировкой 17 тысяч лет на
зад, найденного на стоянке позднего палеолита
близ Афонтовой горы (АС-2), на берегу Енисея
(рис. 8.8). Оказалось (Ragvalan et al., 2013), что ге
нетический профиль АG-2 сходен с МА-1, то есть
за это время в населении Сибири не произошло
больших генетических изменений. Но этих двух
сибиряков разделяют не только семь тысяч лет —
их разделяет сама природа. Дело в том, что время
жизни мальчика из Мальты (МА-1) приходится на
время последнего ледникового максимума (26-20
тыс. лет назад) - самого серьезного максимума оле
денения за всю историю человечества. А сибиряк
с Афонтовой горы (АС-2) жил уже после прохож
дения пика оледенения, когда климат стал значи
тельно теплее. Из этого следует важный для ре
8.3. Верхний палеолит и мезолит
конструкции истории населения Евразии вывод,
что часть Сибири в течение последнего леднико
вого периода была заселена людьми постоянно,
даже на пике оледенения. И что их генетический
277
следне исчез в этот самый суровый период жизни
человечества, а они оставили потомство, которое
продолжило цепь передачи генофонда и уже в при
ближении к эпохе мезолита.
МЕЗОЛИТВОСТОЧНОЙ ЕВРОПЫ (ЮЖНЫЙ ОЛЕНИЙ ОСТРОВ)
Генетическое исследование могильника Юж
ного Оленьего Острова проведено нами в сотруд
ничестве с Центром древней ДНК университета
Аделаиды (Австралия), музеем этнографии и ант
ропологии имени Петра Великого (Кунсткамера)
и Институтом археологии РАН и опубликовано в
статье [Sarkissian et al., 2013].
Как известно, этот Оленеостровский могиль
ник (см. табл. 1.7 в 1 главе), который оставило древ
нее население южной Карелии около 7,5 тысяче
летий назад, является не только опорным памят
ником мезолита лесной зоны Восточной Европы,
но и самым знаменитым. Он очень долго вызывал
бурную дискуссию о степени и истоках монголо
идности оставившего этот памятник населения, и
соответственно о силе, направлении и географи
ческом размахе миграций в Северной Евразии в ту
эпоху. Недавнее антропологическое исследование,
представляющее обобщающий анализ многочис
ленных древних и современных серий [Моисеев,
Хартанович, 2012], склоняет чашу весов в пользу
интерпретации этой популяции как раннего пред
ставителя недифференцированной уральской расы,
которая является «третьей» расой Евразии, а не
результатом метисации монголоидов и европеои
дов (как предполагает альтернативная гипотеза).
В этом контексте результаты независимого гене
тического исследования становятся особенно ин
тересны и востребованы.
СПЕКТР ГАПЛОГРУПП
Проведен анализ митохондриальной ДНК не
скольких десятков образцов от индивидуумов, за
хороненных на Южном Оленьем острове. Из них
для 11 образцов удалось получить воспроизводи
мые и полные результаты по гаплогруппе и гапло
типу мтДНК (для увеличения выборки сюда вклю
чены и образцы из могильника Попово, антропо
логически и археологически близкого к Южному
Оленьему острову). Обнаружены следующие гап
логруппы мтДНК (в порядке убывания частоты):
U4, C, U2, U5, J, H.
Первая из этих гаплогрупп – U4, происходя из
начально из южных регионов Евразии, в настоя
щее время распространена по всей Западной Ев
разии, достигая максимальных частот в Уральском
регионе (причем по обе стороны хребта – как в
Приуралье, так и в Западной Сибири). Поэтому
обнаружение гаплогруппы U4 в древних образцах
свидетельствует, во-первых, о том, что примерно
та же география была свойственна этой гаплогруп
пе и семь тысяч лет назад. Во-вторых, эти резуль
таты можно рассматривать как косвенное указание
на генетическую связь мезолитического населения
Северной Европы с современным населением
Уральского региона.
Следующая по частоте обнаруженная на Юж
ном Оленьем острове гаплогруппа С сейчас явля
ется типичной сибирской гаплогруппой. В случае,
если гаплогруппу Собнаруживают с небольшими
частотами в современных популяциях северо-вос
тока Европы, исследователи рассматривают это как
свидетельство потока генов в эти популяции из-за
Уральского хребта. Естественно сохранить ту же ин
терпретацию и для наличия гаплогруппы С в древ
ней мезолитической популяции. Но только если в
современных популяциях Восточной Европы гап
логруппа С встречается у одного-двух людей насто
проанализированных (или обычно не встречается
вовсе), то в популяции Южного Оленьего острова
гаплогруппа С встреченау трех из двенадцати про
анализированных образцов. Правда, пока нельзя
исключить, что эти образцы происходят отродствен
ных индивидуумов, и в таком случае они фактичес
ки являются копиями одной и той же митохондри
альной ДНК. Но и в этом случае наличие гаплог
руппы Сявляется значимым индикатором генети
ческих связей популяции Южного Оленьего остро
вас мезолитической или палеолитической Сибирью.
Остальные четыре гаплогруппы, встреченные
в образцах из Южного Оленеостровского могиль
ника (U2, U5, J, H), являются типичными западно
евразийскими гаплогруппами, преобладающими в
современном населении как Восточной, так и За
падной Европы.
В целом, обнаруженный спектр гаплогрупп
мтДНК (самые частые U4 и C, присутствуют так
же U2e, U5a, J, H) позволяет сделать два вывода.
Во-первых, найдено сходство с другими мезоли
тическими популяциями Европы (изученными в
работе [Bramanti et al., 2009]), в особенности по
преобладанию субвариантов гаплогруппы U. Во
вторых, выявленный баланс западно-евразийских
и восточно-евразийских гаплогрупп характерен для
современных популяций Западной Сибири и отча
сти Урала. Впрочем, более информативным явля
ется не описание генетических связей между древ
ним и современным населением Евразии, а их кар
тографирование.
278
Глава 8. Древняя ДНК Европы
КАРТА ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
Карта генетических расстояний (рис. 8.11)
обобщает данные по всем гаплогруппам и визуа
лизирует степень близости реконструируемого
древнего генофонда к современным популяциям
Евразии. В основе такой карты лежит не только
анализ палеоДНК, но и обширная информация
базы данных МURКА по изменчивости мтДНК в
жие популяции (большие генетические расстояния)
окрашиваются в коричневые цвета гор. Чем более
генофонд современной популяции схож с изучае
мым древним генофондом (чем меньше генетичес
кие расстояния), тем в более светлые тона окра
шиваются ареалы таких популяций. При макси
мальном сходстве ареалы окрашиваются в зеленые
нетические расстояния были рассчитаны по час
цвета равнин (шкала расстояний от 0 до 1 приве
дена в легенде внизу карты, рис. 8.11). В результа
те мы собственными глазами можем видеть сте
пень генетического сходства древней популяции с
тотам 31 гаплогруппы мтДНК: А, В, С, D, F, G, Н,
разными современными популяциями.
современном населении. Картографированные ге
НV, I, J, К, L, N1a, N1b, R, Т, U1, U2, U3, U4, U5a,
При интерпретации такой карты необходимо
U5b, U6, U7, U8, V, W, X, Y, Z, other (сумма про
чих редких гаплогрупп). При построении такой
учитывать два момента.
карты важно использовать не только те гаплогруп
и современном генофондах. Поэтому для учета
Во-первых, ограниченность данных о древнем
пы, что обнаружены в мезолитической популяции,
изученности современного населения на карте
но и всю возможную панель гаплогрупп, посколь
красными кружками обозначены генетически изу
ку отсутствие какой-либо гаплогруппы — это не
ченные современные популяции. Это позволяет
менее важная характеристика популяции, чем ее
осторожно относиться к тем ареалам генетическо
наличие. Конечно, всегда остается вопрос, что
выборка древних образцов слишком мала, и образ
цы с иной гаплогруппой просто не попали в вы
борку. Но такие вопросы снимаются только в ре
зультате дальнейшего разворачивания исследова
ний древней ДНК, а по меркам древней ДНК вы
борка 11 образцов для эпохи мезолита считается
весьма представительной.
го сходства, которые обеспечены информацией
Карта для каждой области географического
пространства показывает генетическое расстояние
от современной популяции, населяющей эту об
ласть, до изучаемой древней популяции. При ви
зуализации карты наиболее генетически непохо
лишь о единственной современной популяции (как,
например, популяция уйгуров в ареале северо-за
пада Китая на рис. 8.11). Более надежны оценки в
тех случаях, когда генетическое сходство подтвер
ждено несколькими современными популяциями
(как например, бассейн Оби на рис. 8.11).
Второе ограничение связано с тем, что гено
фонды «не стоятнаместе» — они меняются не толь
ко в современном пространстве (что показывает
карта), но и во времени, поэтому экстраполяция со
временного генофонда на генофонд той же терри
110-
130-
тип
140"
Genetic distances from ancient Yuzn oleniostrov population
-
| к = 144
N = 291609
пп = 0.21
пах = 4.69
и
аут = 1,04
и
зд | о
зоо воокт|| 30"
studied populatons
ап
ом
50
во-
от
и т.
п.
9"
4
шт
100-
std = 0.38
и
се
20"
|ип"
Рис. 8.11. Карта генетических расстояний от мезолитической популяции Южного Оленьего Острова до
генофондов 144 современных популяций Евразии.
Обозначения: звездочкой отмечено положение изученной древней популяции; красными точками — положение
генетически изученных современных
ции с современным
генофондом.
популяций, стрелкой указана
зона наибольшего СХОДСТВa
древней
популя
279
8.3. Верхний палеолит и мезолит
тории в древности является хотя и допустимой, но
все же условностью. Снять это ограничение помо
гут лишь будущие обширные исследования древ
ней ДНК, которые позволят постепенно прослежи
вать динамику генофондов Евразии во времени и
в пространстве. Помня об этих ограничениях, по
пробуем состорожностью приступить к интерпре
тации карты генетических расстояний.
Карта на рис. 8.11 демонстрирует, в какой сте
пени современное население разных территорий
Евразии является сходным с оленеостровской ме
золитической популяцией. Легко заметить, что
популяции, генетически сходные с оленеостровца
ми (светлые тона карты со значениями генетичес
ких расстояний от 0,20 до 0,40) наиболее распрос
транены на Урале, в Западной Сибири и на северо
o ancient North East Europe
U5b
-
-
оапсient Eurasia
"" | -
U5a
}
V
ч
9 central / East Siberia
ца
* :
}}
}
"
О Мiddle East
****
|
o
ни
о
>
сч
"
?
н
—
с
---
: ""
U2
FIN
-
:
авро
*
н
----сев SWE
удовёт
*, *"
SVN
2
*
ве}}
|RL
с.
с
ар
-
гва] }}вbas:
*}- - 1}*
- - - - st+jм В989
ков :
:
н
т
меч *
"" ?п
екольк]":
о GRс****
с.
с
...",
*
w --::::::*тд
...",,
- - - сув
-,
аКА"
к (8 .*" /
J
пog
К- -
3
SётURe,
Ф PSE - "
-
o
"е" дел."
сго
syR
н
JoR
ex R} 5 за
N1359
."
'
"
o
м? А
||
пga
a
- - - - -
-- -- 2
--г. - - - - - - tub
----
o
o
}аве 8°
}аLIST ** }еет
-
a
."
".
3
с.
o
ва
-
-
5 =
:
* West Siberia
o
* :
—
8
5
>S
с.
- Volga-Ural Basin
арWС
} }
Europe
je
мN
г
ass
со
.
ед
."
-
-."
,-
D
-
EAS
н
НV
ч
}
-
--
-
"8"
0.
sА }
пу
,"
misc
|
|
|
|
|
-4
-2
0
2
4
Principal component 1 - 28.5% variance
Рис. 8.12. Положение генофонда древних популяций северо-востока Европы относительно современного
населения Европы и Ближнего Востока в пространстве 1 и 2 главных компонент (Sarkissian et al., 2013).
Обозначения: серым пунктиром показаны векторы гаплогрупп, показывающие вклад каждой гаплогруппы,
красные кружки — древние популяции, анализируемые в данной статье, черно-белые кружки — другие древние
популяции, использованные для сравнения, желтые кружки — современные популяции Европы, светло-зеленые
кружки — современные популяции Волго-Уральского региона, темно-зеленые — современные популяции Западной
Сибири, желтые кружки — современные популяции Центральной и Восточной Европы, серые кружки — современ
ные популяции Передней Азии.
Древние популяции: aUzРо — Южный Олений остров и Попово (мезолит Северо-Восточной Европы, 7 500 лет
назад), аВОО —Большого Олений остров (ранний металл Северо-Восточной Европы, 3 500 лет назад), аНG — охотни
ки-собиратели палеолита и мезолита (Центральная и Восточная Европа, 30 000—4250 лет назад), аLВК — неолит
Германии (7 500—7 100 лет назад), аLОК — могильник Локомотив китойской культуры (ранний неолит Прибайкалья,
7 140—6 130 лет назад), а0ST — могильник Усть-Ида (развитый неолит Прибайкалья, 5 800—4 000 лет назад); aSP —
неолит Испании (5 500—5000 лет назад), аРWС — скандинавская культура ямочной керамики (5 300—4500 лет назад);
aЕG — объединенная группа кочевников Ксионгну (Xiongnu) (азиатские гунны, 4 250—2300 лет назад), аКUR— курга
ны Сибири (3 800—1600 лет назад), аКАZ — кочевники Казахстана (3 400—2 100 лет назад).
Глава 8. Древняя ДНК Европы
28()
Современные популяции:
АLВ — албанцы, АLE — алеуты, АLТ— алтайцы, АRМ — армяне, АRО — аромуны, АUT — австрийцы, АZE — азер
байджанцы, ВА— башкиры, ВАS — баски, ВЕЦ — белорусы, ВGR — болгары, ВIН — боснийцы, ВU— буряты, СНЕ —
швейцарцы, СНU — чукчи, СU — чуваши, СYР — Сургiots, СZE — чехи, DEU — немцы, ESК — эскимосы, ESP —
испанцы, EST — эстонцы, ЕVE - эвенки, ЕVN — эвены, FIN — финны, FRА — французы, GBR — британцы, GЕО —
грузины, GRС — греки, НRV Сroatians HUN — венгры, ING - Ingrians IRL — ирландцы, IRN — иранцы, IRО —
иракцы, ISL — исландцы, ГТ-88 — сардинцы, ПТА — итальянцы, ЛОR- иорданцы, КАВ — кабардинцы, КЕТ — кеты,
КНАМ — хамнигане, КНАN — ханты, КК — хакасы, КОМ — коми, КОR — коряки, КR — карелы, КUR — курды, LTU —
литовцы, LVA — латыши, МАN — манси, МЕ— марийцы, МNG — монголы, МО — мордва, NEN A — восточные
ненцы, NEN E — западные ненцы, NGА — нганасаны, NIV — нивхи, NОG — ногайцы, NOR — норвежцы, РОL —
поляки, РRT — португальцы, PSE — палестинцы, RОU — румыны, RUS — русские, SA — якуты, SАА — саамы, SAU —
арабы Саудовской Аравии, SE — осетины, SEL — селькупы, SНО — шорцы, SVК — словаки, SVN — словенцы, SWЕ —
шведы, SYR — сирийцы, ТА — татары, ТЕL — теленгиты, ТОF — тофалары, ТUВ — тубалары, TUR — турки, TUV —
тувинцы, UD — удмурты, UKR — украинцы, ULС — ульчи, VЕР — вепсы, YUК — юкагиры.
западе Средней Сибири, причем ядром этой обла
сти является Западная Сибирь. Это позволяет —
весьма гипотетично — говорить о Западной Сиби
ри как о возможной прародине мезолитического
населения Восточной Европы.
Более осторожная интерпретация карты тако
ва: соотношение западноевразийского и восточно
нии гаплотипов, распространенных практически
повсеместно (как правило, это гаплотипы-основа
тели для частых гаплогрупп мтДНК, например,
rСRS для гаплогруппы Нили 16069—16126 для гап
логруппы J). Эти и подобные им гаплотипы явля
ются как бы фоновым уровнем сходства почти для
евразийского генофондов на Южном Оленьем ос
любой пары западноевразийских популяций. И чем
меньше объем выборки, тем больше будет относи
трове было примерно таким, как в современном
тельная доля таких гаплотипов. Чтобы избежать
населении Западной Сибири. То есть (в сравнении
это соотношение было значительно сдвинуто в
этого нежелательного влияния объема выборки на
получаемые результаты, мы предложили|Баланов
ская, Балановский, 2007) использовать выборки
большого и одинакового объема для всех сравни
пользу восточного генетического ствола.
ваемых популяций. Этот подход был применен и к
с современным населением Восточной Европы, где
доминируют западно-евразийские гаплогруппы)
анализу общих гаплотипов в данном исследовании
АНАЛИЗ ГЛАВНЫХ КОМПОНЕНТ И АНАЛИЗ
(табл. 8. 1). На практике это делалось так. Сначала
ОБЩИХ ГАПЛОТИПОВ
составлялись обширные сборные выборки путем
К сходным выводам приводит и анализ двумя
объединения имеющихся выборок из географичес
ки и лингвистически близких популяций. Затем из
другими независимыми методами.
этих выборок методом случайных чисел извлека
При анализе методом главных компонент (пер
вые две главные компоненты вбирают 41,5% об
лось одно и то же число образцов (по 500 образ
цов), а все прочие образцы не включались в ана
щей генетической изменчивости) четко выдели
лись европейский, ближневосточный, уральский и
лиз общих гаплотипов.
сибирский кластеры (рис. 8.12). На этом графике
В таблице 8.1 представлены результаты прове
денного таким образом сравнения митохондриаль
оленеостровцы расположены между уральским и
ного генофонда древней оленеостровской популя
сибирским кластерами, что подтверждает вывод об
ции и 34 крупных выборок из современных попу
их принадлежности к «пограничному» генофонду.
ляций Европы и Азии. Таблица показывает, что
При анализе методом общих гаплотипов мы
переходим суровня гаплогрупп мтДНК науровень
отдельных гаплотипов мтДНК (митотипов). В свя
формативных методов анализа оказывается под
только семь современных популяций имеют по два
общих гаплотипа с оленеостровской мезолитичес
кой популяцией, при этом число образцов с таки
ми гаплотипами колеблется от 2 до 17. Особенно
важно, что эти семь популяций примерно поровну
счет доли гаплотипов, совпадающих между двумя
распределены между Сибирью и Европой. То есть
зи с их большим числом одним из наиболее ин
популяциями. По смыслу, это аналог генетическо
и этот вид анализа указывает на генетические свя
горасстояния между популяциями, но рассчитан
зи оленеостровцев и с западноевразийскими, и с
ный не на уровне гаплогрупп, а на уровне гапло
восточноевразийскими популяциями Северной Ев
типов.
разии.
Как было показано нами ранее|Балановская,
Балановский, 2007), при таком подсчете исследо
Таким образом, все методы анализа получен
ных данных по древней ДНК показывают проме
вателя подстерегает опасность значительного за
жуточное положение населения, оставившего
вышения показателей сходства при использовании
выборок малого объема. Причина в существова
Южный Оленеостровский могильник в целом при
надлежа к западноевразийскому генетическому
8.3. Верхний палеолит и мезолит
28|
Таблица 8.1. Доля общих гаплотипов между древними популяциями (мезолитической ЮОО и эпохи
раннего металла БОО) и современными популяциями Европы и Азии (Sarkissian et al., 2013).
Современные популяции
Популяция
КООО
N
БОО
Nнт || Ns | Nнт || Ns
Балканы 1 (боснийцы, словенцы)
5()()
|
14
2
9
Балканы 2 (хорваты)
5()()
|
14
3
|8
Ближний Восток 1 (Аравийский п-ов, Марокко)
5()()
|
8
|
|
Ближний Восток 2 (Турция)
489
|
2
2
4
Британские острова 1 (англичане и валлийцы, группа 1)
5()()
|
19
3
7
Британские острова 2 (англичане и валлийцы, группа 2)
5()()
|
19
2
2
Британские острова 3 (шотландцы)
5()()
|
27
2
8
Волго-Уральский регион (коми, мари, мордва, удмурты, татары)
5()()
|
19
4
25
Восточная Европа 1 (русские)
5()()
|
22
3
4
Восточная Европа 2 (украинцы)
5()()
2
|2
3
Восточная Европа 3 (карелы, ингры, вепсы)
5()()
|
|5
|
Восточная Европа 4 (башкиры, ногайцы, казахи, чуваши)
499
|
4
4
28
Западная Сибирь (ханты, манси, ненцы, селькупы)
5()()
()
()
5
29
Прибалтика 1 (латыши, литовцы)
5()()
|
||
3
4
Прибалтика 2 (эстонцы)
497
2
|3
|
Северная Европа 1 (норвежцы)
5()()
|
25
5
Северная Европа2 (шведы восточные)
5()()
|
14
4
|3
Северная Европа 3 (шведы прочие)
5()()
|
14
3
Северная Европа 4 (саамы)
5()()
()
()
2
Северная Европа 5 (финны)
5()()
|
8
|
Северная Сибирь (нганасаны, кеты, эвенки, якуты)
500
2
5
5
48
Северо-Восточная Сибирь 1 (чукчи, эвены, коряки, юкагиры)
5()()
()
()
2
48
Северо-Восточная Сибирь 2 (эскимосы)
5()()
()
()
()
Средний Восток (Иран, Ирак, Сирия)
5()()
|
3
()
()
Центральная Азия (монголы, хамнегане)
5()()
2
2
5
26
Центральная Европа 1 (немцы, австрийцы, швейцарцы)
5()()
|
9
2
4
Центральная Европа2 (чехи, словаки)
5()()
|
16
3
6
Центральная Европа 3 (поляки)
5()()
2
17
3
5
Южная Европа 1 (португальцы)
5()()
|
|3
2
5
Южная Европа 2 (испанцы, французы)
5()()
2
7
|
3
Южная Европа 3 (итальянцы)
5()()
|
9
|
2
Южная Сибирь 1 (алтайцы, хакасы, шорцы, тофалары)
5()()
|
4
4
43
Южная Сибирь 2 (тувинцы)
5()()
()
()
2
61
Южная Сибирь 3 (буряты)
5()()
2
7
5
31
Примечания: приведены результаты анализа совпадающих гаплотипов мтДНК между современными митохон
дриальными генофондами и двумя древними популяциями: мезолитической популяцией Южного Оленьего ост
рова и популяцией эпохи раннего металла Большого Оленьего Острова.
Обозначения:
ЮОО — Южный Олений Остров, Карелия, 7500 лет назад.
БОО — Большой Олений Остров, Кольский п-ов, 3500 лет назад.
N — объем выборки (все современные выборки приведены к единому объему 500 образцов).
Nнт — число общих гаплотипов (разных вариантов мтДНК) между современной и древней популяциями.
N. — число образцов, несущих эти общие гаплотипы.
282
Глава 8. Древняя ДНК Европы
стволу, оно несло в своем генофонде и следы гене
тической связи с Уралом и Западной Сибирью.
Учитывая многолетнюю антропологическую
дискуссию о частичной монголоидности оленеос
тровцев, можно заключить, что в мезолите (или
раньше) взаимосвязи населения Восточной Евро
пы, Урала и прилежащих районов Сибири были
намного интенсивнее, чем в последующие эпохи.
Вероятно, население востока Европы, Урала, За
падной Сибири представляло единый континуум.
ди них гаплогруппа С1, широко распространенная
на Азиатском и Американском континентах, чрез
вычайно редко встречается в современных евро
пейских популяциях: всего несколько ее носите
лей найдены среди современных жителей Герма
нии, Канарских островов, Исландии и Башкирии.
Генетики предполагают, что гаплогруппа С1 стала
редкой в Европе из-за демографических событий:
«бутылочного горлышка» и других разновиднос
тей дрейфа генов, а также многочисленных мигра
Отметим, что это согласуется с зоной распростра
ций. Место ее происхождения, вероятно, находит
нения уральских языков и теорией «уральской
расы» (Бунак, 1980, Моисеев, 1999: Перевозчиков,
2003).
ся в Восточной Сибири, о чем свидетельствует ее
ПОЛНОЕ СЕКВЕНИРОВАНИЕ мтДНК ВЫЯВИЛО
новую гаплогруппу в мезолите
Продолжением нашего исследования древней
ДНК из Оленеостровского могильника стало сек
венирование полного митохондриального генома
мезолитического охотника-собирателя с Южного
Оленьего острова (Sarkissian, 2014). МтДНК этого
образца относилась к уже упомянутой выше гап
логруппе С. Эта гаплогруппа чаще всего встреча
ется в аборигенных популяциях Азии и Америки
(рис. 8.13). На сегодня известно четыре основных
варианта этой гаплогруппы: С1, С4, С5 и С7. Сре
высокая частота у местного населения.
Гаплогруппу С1 подразделяют на несколько
субгаплогрупп: до сих пор были известны С1а,
С1b, С1с, С1d и С1e, отличающиеся разным гео
графическим распределением (рис. 8.14). Три из
них (С1b, С1с и С1d) характерны для коренного
населения Америки и широко распространены по
всему Американскому континенту. Поскольку пер
вое заселение Америки происходило в ходе миг
рации людей из Восточной Сибири через переше
ек на месте нынешнего Берингова пролива, веро
ятно, эти субгаплогруппы были принесены в Аме
рику из Азии. Субгаплогруппа С1а в небольшом
количестве встречается у коренного населения
Восточной Евразии. Последняя из известных до
сих пор субгаплогруппа С1е недавно найдена в
Global distribution of the mitochondrial DNA haplogroup М8С
*:
:
-
-
к = 619
N = визор
піп = 0
max = 0.84
awr = 0,11
std = 0,16
crealва28 0:t2011 by ceлесеоваhware. Ашthcrs of theпир ваалдынку с глоссы:hchenko V кселен5., Weн5. Ваапсывал с
Рис. 8.13. Географическое распределение гаплогруппы Смитохондриальной ДНК человека. Цветом обо
значена частота встречаемости гаплогруппы (шкала слева внизу).
283
8.3. Верхний палеолит и мезолит
Исландии (рис. 8.14), причем всего у нескольких
Из трех образцов с Южного Оленьего острова
мтДНК одного индивида (UZОО-74) была полно
стью секвенирована. Так же, как и в других рабо
к той же субгаплогруппе С1f. Таким образом,
мтДНК всех трех мезолитических охотников-со
бирателей оказалась очень сходной, что говорит об
их родстве по материнской линии, все они были
носителями субгаплогруппы С1f. Сравнение ее с
базой данных подтвердило, что речь идет о дей
ствительно новой линии, которая не представлена
тах по полному секвенированию древних митохон
в современных популяциях.
дриальных геномов, использовали метод секвени
Тоrrent). В мтДНК обнаружили 58 нуклеотидных
Относительно появления гаплогруппы С1 в
Европе имеется три гипотезы. Первая отводит ве
дущую роль позднему потоку генов из Азии в Ев
ропу в историческое время. Вторая предполагает,
замен, отличающих ее от реконструированного
что С1 появилась в Европе через Америку, в ре
исходного предкового варианта мтДНК человека
(«корня» митохондриального древа человечества).
В том числе пять мутаций, отличающих ее от всех
зультате того, что шло смешение генов между ко
человек, и довольно сильно отличается от своих —
американских и азиатских — сестринских вариан
тов.
рования нового поколения, в данном случае ион
ного полупроводникового секвенирования (Ion
остальных вариантов С1, что и позволило отнести
ее к новой субгаплогруппе С1. Следуя по алфави
ту, ее назвали С1f(рис. 8.15).
ренными американцами и европейцами в период
европейской колонизации Американского конти
нента. Или же во время более ранней колонизации
Америки, еще в доколумбовы времена она была
принесена исландскими викингами, которые, как
После того, как генотипировали другие два
известно, создавали первые поселения на северо
образца, UZОО-7 и UZОО-8 из Оленеостровского
западном побережье Америки в X веке. Ну, а тре
тья гипотеза допускает, что гаплогруппа С1 была
представлена в Европе с древнейших времен. В
могильника, выяснилось, что в их мтДНК имеют
ся те же пять новых мутаций, поэтому их отнесли
Рис. 8.14. Примерное географическое распределение субгаплогрупп С1а, С1b, С1с, С1е и С1f в современ
ных популяциях и в мезолитической популяции Южного Оленьего острова (Sarkissian et al., 2014). Локали
зация Южного Оленьего Острова (YuznnyОleni Оstrov) показана красной точкой.
Глава 8. Древняя ДНК Европы
284
Рис. 8.15. Филогенетическое дерево гаплогруппы С1 [Sarkissian et al., 2014].
Показаны все известные к настоящему времени субгаплогруппы в пределах С1. Цифры вдоль ветвей дерева
обозначают номера позиций в последовательности митохондриальной ДНК человека, в которых произошли мута
ции, специфичные для данной ветви (в качестве референтной последовательности использован RSRS (Behar et al.,
2012)). “i” обозначает инсерцию, “d” – делецию, “!” – обратную мутацию.
пользу именно этой гипотезы говорит ее обнару
жение в мтДНК мезолитических охотников-соби
рателей с Южного Оленьего острова.
Где же возникла субгаплогруппа С1f? Пока на
этот вопрос нет однозначного ответа. По нашим
предположениям, скорее всего, она возникла в Си
бири, но довольно рано отделилась от других евра
зийских линий С1, и в дальнейшем они оказались
привязаны к разным региональным популяциям.
Наибольшее родство С1f, по-видимому, имела с
«исландской» субгаплогруппой С1e. Возможно, они
разделились от общего предка где-то в Азии и по
зднее достигли Северной Европы разными путями
независимых миграций. Субветвь С1fможно срав
нить с мостом, соединяющим исландские (С1е) и
восточноазиатские (С1а) линии гаплогруппы С1.
8.4. НЕОЛИТИЗАЦИЯ ЕВРОПЫ
По данным археологии, палеоантропологии и
генетики первая волна заселения Европы связана с
палеолитом. В качестве второй волны часто выде
ляют мезолитическую реколонизацию Европы пос
ле отступления ледника (один из наиболее север
ных памятников этой эпохи рассмотрен в предыду
щем разделе). Но больше всего споров вызывает
третья волна – неолитических земледельцев, по
скольку именно с неолитом связан резкий демогра
фический взрыв численности населения, и поэто
му именно неолит может быть претендентом на оп
ределение основных черт европейского генофонда.
ПЕРВЫЕ ЗЕМЛЕДЕЛЬЦЫ (МИТОХОНДРИАЛЬНЫЙ ГЕНОФОНД)
ГИПОТЕЗЫ «ДЕМИЧЕСКОЙ» И «КУЛЬТУРНОЙ»
ДИФФУЗИИ
В классическом труде археолога Аммермана и
генетика Кавалли-Сфорца была сформулирована
гипотеза «демической диффузии», постулирую
щая, что именно третья – неолитическая – волна
сформировала основные черты европейского гено
фонда [Ammerman, Cavalli-Sforza, 1984]. Важным
элементом гипотезы «демической диффузии» яв
ляется демографический эффект перехода от при
сваивающего хозяйства к производящему: экспо
ненциальный рост численности населения и посте
пенное расселение земледельческих популяций, за
мещающих или вбирающих в себя малочисленные
аборигенные популяции охотников-собирателей потомков палеолитического и мезолитического на
селения Европы.
Археологически земледельческие (неолитичес
кие) культуры прослеживаются с 7 тыс. лет до н.э.
на Ближнем Востоке, откуда они затем проникают
на Балканы и оттуда распространяются на осталь
285
8.4. Неолитизация Европы
ную территорию Европы в 5—3 тысячелетиях до
ку дают прямую информацию о генофонде древ
н.э. (7000—5000 лет назад). При этом по мере уда
них популяций.
ления от Ближнего Востока и Балкан доля мигри
ровавшего населения убывала, и соответственно,
должна была убывать доля мигрантных генов в
мтДНК ПОПУЛЯЦИЙ НЕОЛИТИЧЕСКИХ
земледельцев европы
генофонде и возрастать доля генофонда автохтон
ствительно, исследования классических генетичес
Примерно в то же время, когда на севере Вос
точной Европы существовал мезолитический па
ких маркеров выявили географический градиент
мятник Южного Оленьего острова, рассмотренный
на карте первой главной компоненты изменчивос
в предыдущем разделе, Центральная Европа уже
была охвачена процессом неолитизации. На тер
ного палеолитического населения Европы. Идей
ти генофонда (Сavalli-Sforza et al., 1994), полнос
тью соответствующий предполагаемой доле миг
рантных генов неолитического населения и ее убы
вания по мере удаления от Ближнего Востока и Бал
КаН.
ритории Центральной и отчасти Южной Европы
(Балканы) возникла и распространилась первая
обширная неолитическая культура Европы — архе
ологическая культура линейно-ленточной керами
ки.
Однако позднее данные по митохондриальной
ДНК показали значительно более древний — палео
литический (порядка 20—30 тыс. лет назад) — воз
Данные по поздним неолитическим культурам
Иберийского полуострова выявили сходство нео
раст большинства гаплогрупп мтДНК, распрост
литического населения с современным митохонд
раненных в населении Европы (Richards et al.,
риальным генофондом (Sampietro et al., 2007). Но
1996). Из этого следовал вывод, что распростране
данные по ранней неолитической культуре линей
ние неолита в Европе было «культурной» диффу
но-ленточной керамики (Нааk at el, 2005), напро
зией: культура неолита распространялась не ее не
тив, выявили ее резкие отличия от современного
посредственными генетическими потомками — вы
генофонда Европы. Эти отличия наиболее ярко
ходцами из популяций Ближнего Востока, а мест
ным европейским населением, перенявшим эту
проявились в высокой частоте гаплогруппы N1а
мтДНК, почти отсутствующей у современных ев
культуру, но сохранившим свой генофонд.
ропейцев. Специально проведенное байесовское
Последовала длительная и бурная дискуссия
моделирование показало, что такая элиминация
сторонников неолитического и палеолитического
гаплогруппы в современном населении Европы не
времени формирования европейского генофонда
|Ваrbujani et al., 1998; Вarbujani, Веrtorelle, 2001;
Сhikhi et al., 2002). Точку в ней поставила работа
2005).
(Richards et al., 2000), обобщившая все имевшиеся
к тому времени данные о полиморфизме мтДНК в
населении Европы и методологически корректно
подошедшая к проблеме соотнесения возраста по
пуляции и возраста распространенных в ней гап
логрупп. В этой работе было показано, что боль
шинство субгаплогрупп мтДНК, свойственных
населению Европы и отсутствующих на Ближнем
Востоке, имеют палеолитический возраст. Это про
тиворечит гипотезе демической диффузии, ведь
если гипотеза справедлива, то современный гено
фонд Европы имеет преимущественно ближнево
сточное происхождение, и тогда «старые» гаплог
руппы, принесенные земледельцами с Ближнего
Востока, должны быть общими между Европой и
Ближним Востоком, а гаплогруппы, возникшие уже
в Европе и потому ограниченные Европой, долж
ны быть «молодыми».
В то же время, обе конкурирующие гипотезы
основываются нареконструкции генофонда былых
эпох по генетической структуре их современных
популяций-потомков. Поэтому очевидно, что дан
ные по древней ДНК (полученные в надежных ла
бораториях и получившие мировое признание)
имеют большое, если не решающее, значение для
выбора между этими двумя гипотезами, посколь
могла произойти за счет дрейфа генов (Нааk at el.,
Эта работа 2005 года ответила на вопрос "что
произошло с генофондом первых земледельцев
после их появления в Европе". Она показала, что
генофонд первых неолитических земледельцев
Европы резко отличался и от предшествующего, и
от современного населения Европы, но постепен
но растворился в окружающем населении и почти
не дошел до нашего времени.
Чтобы ответить на следующий вопрос "откуда
появились первые земледельцы", в нашем иссле
довании (Наак, Вalanovsky et al., 2010) был прове
ден анализ дополнительных 17 образцов древней
ДНК и сопоставление неолитической популяции с
современными популяциями из нашей базы дан
ных МURКА. Все новые проанализированные об
разцы принадлежали к популяциям культуры ли
нейно-ленточной керамики. Более того, они про
исходили из одного археологического сайта (Де
ренбург), что снимает часто возникающие у архе
ологов вопросы о «целостности» изучаемой гене
тиками древней выборки и принадлежности ее к
одной популяции и одной археологической куль
туре. Вместе с ранее проанализированными образ
цами, общий объем выборки для Деренбурга со
ставилN=22, а суммарный объем выборки по куль
туре линейно-ленточной керамики (включая Де
ренбург и другие популяции, относившиеся к той
Глава 8. Древняя ДНК Европы
286
Таблица 8.2. Доля общих гаплотипов между популяциями неолита и современности (Наак, Вalanovsky
et al., 2010).
Современные популяции
2
2
}
на
на
}={
—
—
на
ё с=
5 =с
<
54
ра
s.
\e
=<
3 =
* —
=
:-(
ё | B3 || 3= E= ||| 53 || 33 5ё || 3в 5ё =3
>
—
s =
5 = | = в =
ра
на
бе
н
\e
2.
ф
С
*-
\e
с
-е- :
2.
—
<
—
2.
\e
не- с
—
<
ё. \eс
=
2.
Ближний Восток 3 (Иран)
500 ||
15
4
83
6
7%
Ближний Восток 2 (Сирия, Ирак, Палестина, Кипр)
500 ||
13
3
88
4
5%
Центральная Европа 5 (чехи, словаки)
5()() |
|3
3
144
5
3%
Балканы 1 (хорваты, словенцы)
5()() |
|3
2
148
5
3%
Ближний Восток 1 (турки, курды, армяне)
500 ||
12
3
97
3
3%
Кавказ
5()() |
|3
2
97
3
3%
Британские острова 1 (центр и север Англии)
500 |
|6
5
| 64
5
3%
Восточная Европа 3 (южные русские)
500 ||
14
3
| 30
3
2%
Балканы 2 (венгры, румыны)
500 ||
14
3
| 38
3
2%
Британские острова 4 (шотландцы)
500
|2
|
|62
3
2%
Балканы 4 (греки)
5()() |
||
2
| ()9
2
2%
Центральная Европа 1 (австрийцы, швейцарцы, южные
немцы)
500 ||
14
3
| 64
3
2%
Северная Европа 1 (шведы, норвежцы)
5()() |
|3
2
| 80
3
2%
Восточная Европа 4 (северные русские)
500 ||
13
2
|2|
2
2%
Центральная Европа 2 (немцы Нижней Саксонии)
5()() |
||
|
137
2
|%
Прибалтика (литовцы, латыши, эстонцы)
500
||
2
| 49
2
|%
Центральная Европа 6 (поляки)
500 ||
13
2
| 58
2
|%
Волго-Уральский регион 2 (башкиры, татары, чуваши)
5()() |
||
|
| 14
|
|%
Балканы 3 (сербы, албанцы, болгары, боснийцы, македонцы)
5()()
9
|
| 28
|
|%
Британские острова 6 (Оркнейские, северные)
500 ||
|()
|
| 32
|
|%
Британские острова 2 (запад и восток Англии)
500 ||
12
|
|45
|
|%
Восточная Европа 2 (белорусы)
499 ||
12
|
|48
|
|%
Южная Европа 4 (итальянцы)
500 ||
12
|
| 54
|
|%
Южная Европа 1 (португальцы)
5()() |
||
|
| 63
|
|%
Южная Европа 5 (сицилийцы, сардинцы, корсиканцы)
5()()
|2
|
|66
|
|%
Британские острова 3 (валлийцы, ирландцы)
500
||
()
199
()
()%
Центральная Европа 3 (немцы прочие)
5()() |
||
()
| 66
()
()%
Восточная Европа 1 (украинцы)
5()() |
||
()
| 36
()
()%
Центральная Европа 4 (северные французы)
5()() |
||
()
159
()
()%
Южная Европа 2 (баски, северные испанцы)
500 ||
|()
()
| 69
()
()%
Южная Европа 3 (прочие испанцы)
500 ||
|()
()
| 53
()
()%
Британские острова 5 (Шетландские о-ва)
499
9
()
142
()
()%
Северная Африка
498
9
()
103
()
()%
Волго-Уральский регион 1 (коми, мари, мордва, удмурты)
5()()
9
()
| 69
()
()%
Восточная Европа 5 (финны, карелы)
500
9
()
| 36
()
()%
Северная Европа 2 (исландцы)
500
9
()
|46
()
()%
Примечание: Современные популяции расположены по степени убывания генетической бюлизости с неолити
Европы.
ЧеСКИМ НaceЛение М
287
8.4. Неолитизация Европы
же культуре) составил N=42. Отметим, что по мер
кам анализа древней ДНК эти объемы выборок
велики и позволяют проводить полноценный по
пуляционный анализ.
популяций). Одиннадцать «повсеместных» гапло
типов представляли собой преимущественно гап
лотипы-основатели для частых западно-евразийс
ких гаплогрупп Н. НV, V, К, Т. W. В силу своей
повсеместности они малоинформативны для вы
явления того, какие из современных популяций в
АНАЛИЗ ОБЩИХ ГАПЛОТИПОВ
наибольшей степени сходны с неолитическим ге
Анализ на уровне гаплотипов мтДНК (совпа
дения гаплотипов между неолитической популя
нофондом.
Поэтому более информативны те десять гап
лотипов, которые обнаружены в древней популя
цией и широким кругом современных популяций)
проведен точно так же, как и аналогичный анализ
для мезолитической популяции в предыдущем раз
ции и приурочены лишь к некоторым их современ
ных популяций. Из результатов анализа общих гап
лотипов, представленных в табл. 8.2, следует, что
семь современных популяций характеризуются
наибольшим сходством с неолитической популя
деле. Среди 42 образцов неолитической популяции
были выявлены 25 различных гаплотипов. Из них
11 оказались широко распространенными среди
почти всех изученных современных популяций, 10
цией. Это следующие популяции (условно пере
имели ограниченное географическое распростра
числим входящие в их состав отдельные народы,
нение в современном населении, а оставшиеся 4
были уникальны для древней популяции (отсут
тина, Кипр, чехи, словаки, хорваты, словенцы, тур
ствовали среди включенных в анализ современных
ки, курды, армяне, Кавказ, Англия. Из этих попу
страны или регионы): Иран, Сирия, Ирак, Палес
|
222 024 028 028 оз оз: ози озвоззо" os os
0.7
},
*
.
*
:
=
Рис. 8.16. Карта генетических расстояний от неолитической популяции Центральной Европы до гено
фондов 118 современных популяций Европы и Азии (Наак, Вalanovsky et al., 2010).
Звездочкой отмечено положение изученной древней популяции; черными точками — положение генетически
изученных современных популяций, стрелкой — зона наибольшего сходства древней популяции с современным
генофондом.
288
Глава 8. Древняя ДНК Европы
КАРТА ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
ляций часть (чехи, словаки, хорваты, словенцы)
расположены в предполагаемом географическом
Объективное представление о степени близос
центре культуры линейно-ленточной керамики в
Центральной Европе и, вероятно, именно они час
ти современных
популяций
к неолитическому ге
нофонду дают геногеографические карты. При
тично сохранили генофонд эпохи неолита. Одна
ко все прочие популяции (за исключением Англии)
происходят с Ближнего Востока (или зон его мощ
ного влияния), то есть из региона, откуда, по архе
анализе на уровне гаплогрупп мтДНК были рас
считаны и картографированы генетические рассто
яния (рис. 8.16) от популяции европейского нео
лита (ее географическое положение показано звез
дочкой) до современных популяций (их географи
ологическим данным, неолитическая волна засе
ления пришла в Европу.
4
LВК34
О
o
Ч* "вкzo
DEE22
3
o
N1а
2
1
ну
"----------.....
0
** .
|R|
но о
н"
н"
-
не
ово
-1
*
SAU
o
-2
}
JoR
--
дж
|
|
|
|
|
|
|
-3
-2
-1
0
1
2
3
Рис. 8.17. Положение генофонда неолитических популяций относительно современного населения Евро
пы и Ближнего Востока (Наак, Вalanovsky et al., 2010).
Древние популяции: DЕВ22 — популяция «Деренбург» культуры линейно-ленточной керамики, LВК20 — попу
ляции культуры линейно-ленточной керамики, кроме Деренбурга; LВК42 — все популяции культуры линейно
ленточной керамики, LВК34 — все популяции культуры линейно-ленточной керамики после исключения образцов
возможных родственников, НG — мезолитические охотники-собиратели.
Современные популяции: АLВ — албанцы, АКМ — армяне, АRО — аромуны, АUT - австрийцы, АZE — азербайд
жанцы, ВАS — баски, ВLR — белорусы, ВОS — боснийцы, ВUL — болгары, СНЕ — швейцарцы, СНМ — марийцы,
СНV — чуваши, СRО — хорваты, СZE — чехи, DEU — немцы, ENG — англичане, ESP — испанцы, EST — эстонцы, FIN
— финны, FRА — французы, GЕО — грузины, GRС — греки, НUN — венгры, IRL — ирландцы, IRN — иранцы, IRО —
иракцы, ISL — исландцы, ГТА-итальянцы, ЛОR- иорданцы, КАВ — кабардинцы, КАR — карелы, КОМ — коми, КUR
— курды, LTU — литовцы, LVA — латыши, МАR — марокканцы, МОR — мордва, NОG — ногайцы, NOR — норвежцы,
ОSS — осетины, РОL — поляки, РRT — португальцы, PSE — палестинцы, RОU — румыны, RUS — русские, SAR —
сардинцы, SAU — арабы Саудовской Аравии, SСО — шотландцы, SIС — сицилийцы, SVК — словаки, SVN — словен
цы, SWЕ — шведы, SYR — сирийцы, ТАТ — татары, TUR — турки, UKR — украинцы.
8.4. Неолитизация Европы
ческое положение показано черными точками).
Шкала приведена в верхней части карты. Наимень
шие генетические расстояния (т.е. наибольшее ге
нетическое сходство) окрашены в зеленые тона
низменностей. По мере роста величин генетичес
ких различий между генофондами современных
популяций и неолитической, по аналогии с картой
физической географии, тона становятся сначала
песочных оттенков, а затем красноватых тонов воз
вышенностей. Карта (рис. 8.16) четко показывает,
что наименьшие расстояния (со значениями от 0,22
до 0,38) локализуются в северной части Ближнего
Востока (северная Месопотамия, Закавказье, вос
точная Анатолия). Хотя генофонд Ближнего Вос
тока, конечно же, мог с неолита несколько изме
ниться, все же все имеющиеся данные указывают,
что именно эта зона была наиболее вероятным ис
точником миграции для неолитического населения
культуры линейно-ленточной керамики Европы.
АНАЛИЗ ГЛАВНЫХ КОМПОНЕНТ
Еще одним независимым методом анализа на
уровне частот гаплогрупп является анализ главных
компонент. На графике (рис. 8.17) показаны гене
тические взаимоотношения неолитической попу
ляции (представленной в виде четырех точек, не
сколько различающихся способами расчета частот
гаплогрупп), 55 современных популяций Европы
и Ближнего Востока, а также мезолитической по
пуляции охотников-собирателей. На графике пер
вая главная компонента (горизонтальная ось),
объясняющая 25% общей изменчивости, разделя
ет ближневосточные и европейские популяции, при
этом неолитическая популяция присоединяется к
популяциям Ближнего Востока и Закавказья.
Однако вторая главная компонента (вертикаль
ная ось, 18% общей дисперсии) четко отделяет
289
неолитическую популяцию от всех современных.
На графике обозначен и вклад каждой из гап
логрупп (пунктирные линии). Сходство неолити
ческой популяции с Ближним Востоком по первой
главной компоненте определяется повышенными
частотами гаплогрупп мтДНК HV, J, U3 в неоли
тической популяции, тогда как ее своеобразие (по
второй компоненте) определяется, главным обра
зом, гаплогруппами T, N1a, Kи W.
ОБЩИЙ ВЫВОД
Таким образом, все три вида независимого ана
лиза – и общих гаплотипов, и главных компонент,
и в особенности карта генетических расстояний указывают, что генофонд одной из первых в Евро
пе неолитических популяций (культуры линейно
ленточной керамики) наиболее сходен с генофон
дом популяций Ближнего Востока.
Выше указывалось, что более раннее исследо
вание палеоДНК [Haak et al., 2005] показало, что
современный генофонд Европы значительно отли
чается от неолитического. Это означало, что пер
вое земледельческое население Европы не остави
ло многочисленных потомков, что согласуется с
гипотезой «культурной диффузии» земледелия. Но
вые данные, представленные в этом разделе, по
зволяют уточнить этот вывод: они показали, что
эта неолитическая популяция генетически близка
к популяциям Ближнего Востока.
В результате проведенного исследования древ
ней ДНК теперь можно утверждать, что хотя рас
пространение земледелия внутри Европы носило
характер «культурной диффузии», но появление
земледелия в Европе связано с далекой миграцией
первых земледельцев. Этот вывод стал своеобраз
ным синтезом «демической» и «культурной» ги
потез распространения земледелия по Европе.
ТРИ ИСТОЧНИКА ГЕНОФОНДА ЕВРОПЕЙЦЕВ
ГЕНОФОНДЫ ОХОТНИКОВ-СОБИРАТЕЛЕЙ И
ЗЕМЛЕДЕЛЬЦЕВ ПО ПОЛНОГЕНОМНЫМ ДАННЫМ
«Полногеномный» ответ на вечный вопрос: «Из
каких предковых популяций сформировался гено
фонд Европы в неолите?» – был получен в иссле
довании большого международного коллектива под
руководством Дэвида Райха (David Reich) и Иохан
неса Краузе (Johannes Krause) с участием многих
соавторов, включая именя самого. Результаты этой
работы опубликованы в журнале Nature [Lazaridis
et al., 2014]. Это исследование основано не нами
тохондриальном геноме неолитического населения
(на изучении которого основано исследование,
описанное в предыдущем подразделе) и который в
современном населении Европы, как уже не раз
описано в этой книге, крайне гомогенен. Новое
исследование сделано уже на новом витке разви
тия генетических технологий и использует много
больший объем данных о геноме–результаты пол
ногеномного секвенирования, включающего, кро
ме аутосомного генома, также анализ митохондри
альной ДНК и Y-хромосомы.
Были секвенированы девять древних геномов
из трех популяций (рис. 8.18). Названия образцов,
как всегда, даются по названиям археологических
сайтов, из которых извлечен изученный палеоант
ропологический материал.
1) «Образец Штуттгарт» - от скелета женщи
ны из Центральной Европы с датировкой 7 тыс.
лет назад, найденного близ Штуттгарта, Германия,
который относят к популяции первых европейских
29()
Глава 8. Древняя ДНК Европы
земледельцев культуры линейно-ленточной кера
мосомного генофонда мезолитических охотников
мики.
собирателей Европы.
При исследовании аутосомного генома показа
но, что уровень средней гетерозиготности «земле
дельца» из Штуттгарта располагается у верхнего
предела гетерозиготности современных европей
цев, а у «охотника-собирателя» из Лошбора гете
2) «Образец Лошбор» - от скелета мужчины из
Центральной Европы с датировкой 8 тыс. лет назад,
найденный в горах Лошбор в Люксембурге, принад
лежащий к одной из археологических культур охот
ников-собирателей и относимый к мезолиту.
3) «Образцы Мотала12» — от семи скелетов из
Северной Европы возрастом 8 тыс. лет из захоро
нения в северной части ареала охотников-собира
телей, найденного в городе Мотала в Швеции и
относимом к мезолиту.
В работе также использовали и результаты ис
следования некоторых других древних геномов,
секвенированных и опубликованных ранее, напри
мер, верхнепалеолитический образец со стоянки
Мальта близ озера Байкал (МА-1, с датировкой
около 24 тыс. лет) и мезолитический «образец Ла
Бранья» из Иберии (с датировкой около 8 тыс. лет).
Хотя главные выводы исследования основаны
на изучении аутосомных маркеров, у всех образ
цов проанализированы также гаплогруппы мито
хондриальной ДНК, а у принадлежащих мужчи
нам — гаплогруппы Y-хромосомы. Выяснилось, что
«земледелец» из Штуттгарта обладал гаплогруп
пой Т2 мтДНК, типичной для неолитических ев
ропейцев, а «охотники-собиратели» из Лошбор и
все семь образцов из Мотала принадлежат к гап
логруппам U5 или U2, типичным для митохондри
ального генофонда мезолитических охотников-со
бирателей Европы. Что касается Y-хромосомы, то
все шесть образцов мужского пола из двух попу
ляций (образец из Лошбор и пять образцов из Мо
тала) обладали гаплогруппой I, так что, по-види
мому, эта гаплогруппа была характерна для Y-хро
o
розиготность ниже, чем у всех существующих ев
ропейских популяций. Это позволило предполо
жить, что предки «охотника-собирателя» из Лош
бора прошли через узкое популяционное «буты
лочное горлышко» (резкое снижение генетическо
го разнообразия внутри популяции). Такие собы
тия могли быть нередкими в малочисленных по
пуляциях охотников-собирателей. Геном «земле
дельца» из Штуттгарта отличался от геномов «охот
ников-собирателей» большим числом копий гена
амилазы слюны (АМY1), что связывают с высо
ким содержанием крахмала в рационе — признак
перехода к сельскому хозяйству.
Удалось реконструировать некоторые черты
внешности древних европейцев по вариантам ауто
сомных генов. Жители Центральной Европы — и
«земледелец» из Штуттгарта, и «охотник-собира
тель» из Лошбора — с высокой с вероятностью
(>99%) были темноволосыми. При этом «охотни
ки-собиратели» и Южной Европы (Ла Бранья), и
Центральной (Лошбор) и Северной (Мотала12) с
вероятностью >75% имели голубые или иные свет
лые глаза, а «земледелец» из Штуттгарта с вероят
ностью >99% — карие глаза. Представитель пер
вых земледельцев, так же, как и современные ев
ропейцы, обладал аллелем светлой кожи в гене
SLС24А5 в гомозиготном состоянии, в отличие от
охотников-собирателей. В то же время, у «охотни
Моtala
x
e
* LoschbourС»
vsiotaan
}
x
о
o
н-
ж
*
А
.
x
л.
А
А.
o
Ф
e
x
оА
Рис. 8.18. Карта изученных западноевразийских геномов (Lazaridis et al., 2014).
Географическое местоположение изученных современных образцов обозначено мелкими цветными значками.
Местоположение древних образцов Loschbour, Stuttgart, Мotala обозначено крупными значками и подписано.
291
8.4. Неолитизация Европы
Оrigins (охарактеризована в главе 4). Для выделе
ка-собирателя» Мотала12 присутствовала, по край
ней мере, однакопия этого аллеля, а значит, он был
в наличии у европейцев уже в мезолите, до появ
ния кластеров популяций использовали програм
му АDMIXTURE и метод анализа главных компо
ЛеНИЯ Земледелия.
НеНТ.
Эти результаты анализа главных компонентмы
уже рассматривали в главе 4 (рис. 4.3), но тогда
ТРИ ПРЕДКОВЫХ ПОПУЛЯЦИИ
сосредоточились лишь на генетических взаимоот
Древнюю ДНК исследователи сравнили с ДНК
более чем двухтысяч ныне живущих людей из 203
популяций. Для анализа использовали генотипи
рование по панели 500 тысяч однонуклеотидных
полиморфизмов (SNP) с помощью панели Нuman
ношениях современных популяций, теперь же об
ратим внимание в первую очередь на положение
древних образцов.
На графике главных компонент все геномы
сгруппировались в четыре кластера (рис. 8. 19):
Ancients (projected)
v Stuttgart
ф Мotala12
v Skoglund farmer о Моtala merge
v Iceman
o Skoglund НG
o Loschbour
ф МА"
o LaЕrafia
ф ас2
Ф
, ***
А
Scandinavian hunter-gatherers
С»
-
*
,
.
7
EarlyyEuropean
tamers
* - у
|-
*
«»
*
}
**
Western European hunter-gatherers
ф
в"
Моdern west Eurasians
e Armenian
- English
п Iranian
и French
и Adygei
А Тurkish
А Icelandic
и Balkar
- Albanian
* Norwegian
и Веrgamo
* Вulgarian
* Сypriot
х Оrcadian
x Greek
п ЕedouinЕ
в Italian South
А Jordanian
* North Ossetian
Ashкепazi Jew
+ Маitese
* Palestinian
и Georgian Jew
o Druze
+ Sicilian
x Saudi
* Iranian Jew
и Lebanese
в Tuscan
в Syrian
* Iraqi Jew
- Веlarusian
в Scottish
* ВесiouinA
Abkhasian
Сhechen
x Georgian
в Кumyk
+ Lezgin
x Libyan Jew
и Сroatian
в
+
+
в
* Сгеch
Моroccan Jew
Tunisian Jew
Turkish Jew
Yemenite Jew
и и
* Estonian
x Hungarian
".
в Lithuanian
- Вasaue
+ Ukrainian
и French South
* Сanary_Islanders
Spanish
Spanish North
ции
и Sardinian
FlппіSh
и Мordovian
Russian
Рис. 8.19. Структура мезолитического, неолитического и современного генофонда Европы - анализ глав
ных компонент по широкогеномной панели (Lazaridis et al., 2014).
Каждая точка соответствует одному образцу современной или древней ДНК. Тип и цвет значка каждой популя
ции указаны в легенде карты. Древние образцы: Stuttgart (Штуттгарт), Skoglund farmer (Скогланд, земледельцы),
Iceman (тирольский «ледяной человек»), Loschbour (Лошбор), LaBrana (Ла Бранья), Мotala (Мотала), Skoglund НG
(Скогланд, охотники-собиратели), МА1 (образец с верхнепалеолитической стоянки Мальта), АG2 (образец свер
хнепалеолитической стоянки Афонтова гора).
292
Глава 8. Древняя ДНК Европы
— Западноевропейские охотники-собиратели
(WНG — Western Hunter-Gatherers), к которым от
носятся европейские охотники-собиратели из Ис
пании, Люксембурга и Швеции (в том числе Лош
бор и Ла Бранья), а также скандинавские охотни
ки-собиратели (в том числе Мотала).
— Охотники-собиратели верхнего палеолита из
Сибири, в том числе индивидуум со стоянки Маль
та (МА-1), предположительно входящие в метапо
пуляцию древних северных евразийцев (АNE —
Аncient North Eurasians).
— Земледельцы Ближнего Востока (сюда вош
ли геномы современного населения и, предполо
—*
(Мbuti )
жительно, сюда же относились геномы древних
жителей Ближнего Востока).
— Посередине между этими тремя находятся
современные европейцы, составляющие четвертый
кластер, в который также вошли ранние европейс
кие земледельцы (ЕЕF); к нему относятся земле
делец из Штуттгарта, тирольский «ледяной чело
век» (датировка — около 5300 лет) и шведские зем
ледельцы с датировкой около 5 тыс. лет.
Европейские охотники-собиратели не только
находятся вне кластера современных европейцев,
но и смещены относительно него в сторону боль
шего удаления от Ближнего Востока. Земледелец из
—
С Non-Aricano
—*—
С Ваsal Eurasian
-
—————
-<
1
С Eastem non-African D
/
>
—*-
---—
Г-----
| Conge) с Ancientnorth Eurasian
|
*----
…"
"--—
}
—2
------
>
» С west Eurasan >
Г
-----
г------
-----
44 + 10%
.
и
*
и!-|
«Амер
41=18% | \
*
* СмАл)
Рис. 8.20. Филогенетическое дерево популяций западной Евразии (Lazaridis et al., 2014).
Обозначения: Современные популяции обозначены фиолетовым цветом, изученные в данной работе древние
популяции — розовым, статистически реконструированные древние популяции — зеленым. Сплошные линии обо
значают переход от предковой популяции без генетического смешения, пунктирные линии обозначают смешение.
Модель смешения популяций из трех источников удовлетворяет имеющимся данным для большинства популя
ций.
Изученные образцы: Мbuti (пигмеи), Каritiana (индейцы каритиана), Оnge (этническая группа в Индии), АNЕ
(древние северные евразийцы), WНG (западно-евразийские охотники-собиратели), ЕЕF (ранние европейские зем
ледельцы), Вasal Eurasian (базальная евразийская линия), МА1 (образец со стоянки Мальта), Louschbour (Лош
бор), Stuttgart (Штуттгарт).
8.4. Неолитизация Европы
293
Штуттгарта попадает в кластер с другими неолити
ческими европейцами. Образец с сибирской палео
литической стоянки Мальта (МА-1, около 24 тыс.
лет) отклоняется от современных западных евразий
цев в третьем направлении, далеком и от ближнево
сточных, и от западноевропейских популяций.
Были рассмотрены две гипотезы-модели о по
пуляциях, послуживших источниками формирова
ния генофонда Европы. В соответствии с первой
моделью, популяций было две: западноевропейс
кие охотники-собиратели (WHG) и ранние евро
пейские земледельцы (EEF). В соответствии со
второй гипотезой – три популяции сформировали
генофонд современных европейцев: к первым двум
добавляются еще и древние северные евразийцы
(ANE). Гены ранних европейских земледельцеву
современных европейцев составляют от 30% в бал
тийском регионе до 90% в средиземноморском.
Гены древних северных евразийцев предположи
тельно присутствуют почти у всех современных
европейцев (составляя максимум 20%).
Основной вывод этого исследования – трехком
понентное происхождение генофонда Европы – был
признан столь важным, что попал на обложку Nature.
Впервые было показано, что генофонд современ
ного населения Европы сформировался в результа
те смешения не двух, а трех групп населения:
1) первоначального населения Европы, сохра
нившегося еще с древнекаменного века (WHG);
2) мигрантов с Ближнего Востока, принесших
Европу
в
технологии земледелия (EEF);
3) населения Северной Евразии, в том числе
Европейской части России и Сибири (ANE).
ЗАГАДКА «БАЗАЛЬНЫХ» ЕВРАЗИЙЦЕВ
Для детализации вопроса о путях сложения
генофонда, был применен и третий метод – пост
роено особое древо родства древних популяций
(рис. 8.20), для которого, в отличие от традицион
ных методов построения деревьев, ветвям разре
шили не только разделяться, но и сливаться, что
лучше соответствует причудливым реалиям попу
ляционной истории человечества. Большая часть
дерева отражала уже известные события древней
шей истории. Так, от вышедшего из Африки чело
вечества отделилась ветвь восточных евразийцев,
которые внесли свой генетический вклад в фор
мирование коренного населения Америки (пред
ставленные индейцами каритиана). В формирова
ние генофонда коренного населения Америки вне
сли большой вклад и древние северные евразий
цы (ANE), популяция которых широко расселилась
на восток ойкумены (как мы выше рассматривали
в подразделе по Мальте). Древние западные евра
зийцы внесли вклад как в генофонд западноевро
пейских охотников-собирателей (Лошбор), так и
ранних европейских земледельцев (Штуттгарт).
Но в этой уже известной картине было две но
вости. Первая – выявленная и всеми предыдущи
ми методами – важный вклад населения Северной
Евразии (ANE) в формирование не только генофон
да населения самого севера Европы, но всего ев
ропейского генофонда. Вторая новость обнаружи
лась на смоделированном дереве – на нем возник
ла и совершенно новая, неизвестная до сих пор
ветвь – это «базальная линия евразийцев» (basal
Eurasian на рис. 8.20). Эта популяция выделилась
уже после выхода из Африки, но до разделения на
западных евразийцев (европеоидов) и восточных
евразийцев (монголоидов) – возможно, в период
раннего заселения Ближнего Востока. Что и гово
рить, популяция загадочная, и ей сложно найти
соответствия в известной картине древних групп
человечества, но ее существование в прошлом уп
рямо вылезало из статистического анализа. В со
ответствии с реконструированной историей потом
ки этой (пока что виртуальной) популяции соста
вили почти половину (44±10%) генофонда ранних
европейских земледельцев.
В заключение отметим, что в окончательную
модель происхождения европейского генофонда
хорошо вписывается большинство современных
европейских популяций за двумя исключениями.
Первое исключение составляют сицилийцы, жи
тели средиземноморского острова Мальта (не пу
тать сверхнепалеолитическим образцом со стоян
ки Мальта из Сибири) и евреи ашкенази, которые
имеют большую долю ближневосточных предков,
чем остальные. Второе исключение – финны, мор
два и северо-западные русские, в генофонде кото
рых велик вклад «восточноазиатских» генов.
НЕОЛИТИЗАЦИЯ В ПИРЕНЕЯХ
ГЕНЕТИЧЕСКИЕ ОСОБЕННОСТИ ИБЕРИЙСКОГО
ЭНЕОЛИТА
Секвенирование полных геномов древних образ
цов с Пиренейского полуострова [Güntheraetal., 2015]
добавило важный элемент в мозаику формирования
генофонда европейцев и, по-видимому, стало клю
чом к разгадке происхождения народа басков, кото
рое уже давно интригует археологов и лингвистов.
Шведские и испанские исследователи секвени
ровали полные геномы восьми останков людей из
пещеры Эль Порталон в Съерра-де-Атапуэрка в
Испании (рис. 8.21). Пиренейский полуостров из
вестен как место длительного обитания человека
с палеолита до исторических времен. Останки, из
которых была извлечена ДНК (четыре мужских и
четыре женских индивида) относятся к энеолиту
(медно-каменному веку – конец эпохи неолита, с
294
Глава 8. Древняя ДНК Европы
Рис. 8.21. Местоположение анализируемых образцов древней ДНК (Günthera et al., 2015).
Красным цветом обозначены образцы с Иберийского полуострова: треугольник — мезолит (Ла-Бранья), кружки
— энеолит (медно-каменный век), ромбик — бронзовый век (Эль Порталон). Желтым цветом обозначены образцы
из Центральной Европы: треугольник — мезолит (Лошбор), кружок — энеолит (медно-каменный век, Тирольский
ледяной человек), квадрат — неолит (Штуттгарт). Зеленым цветом обозначены образцы из Венгрии: кружок — эне
олит (медно-каменный век), квадраты — неолит Голубым цветом обозначены образцы из Скандинавии: треуголь
ник вершиной вниз — поздние охотники-собиратели, треугольники вершиной вверх — мезолит, квадрат — неолит
датировкой около 5500 лет назад) и бронзовому
веку (с датировкой около 3500 лет назад). Дати
другим древним геномам из разных частей Евро
пы и геномам современных европейцев провели
ровки всех древних образцов, анализируемых в
этой работе приведены на шкале рис.8.22. Из вось
ми индивидов, изученных в Пиренеях, семь были
анализ главных компонент (рис. 8.23).
На графике видно, что в пространстве 1 и 2
главных компонентгенофонды охотников-собира
представлены фрагментарными останками, но
телей, так же, как и ранних земледельцев, четко
группируются независимо от их географической
локализации. Причем наиболее близко к охотни
кам-собирателям и Южной Европы (Пиренейско
го полуострова), и Центральной Европы, и Север
ной (Скандинавия) находятся современные наро
ды Северной Европы. А к ранним земледельцам и
Южной Европы, и Центральной, и Северной, на
против, более близки современные южные евро
один был почти полным скелетом мальчика. Ядер
ную ДНК из этих образцов секвенировали с по
крытием от 0,01х до 4,08х.
В ДНК восьми древних обитателей Пиренеев
определили гаплогруппы митохондриальной ДНК
(мтДНК) и Y-хромосомы. Материнские линии ми
тохондриальной ДНК оказались характерными для
ранних европейских земледельцев (К, Jи X), охот
ников-собирателей (U5) или и тех, и других (Н).
Отцовские линии Y-хромосомы принадлежали к
гаплогруппам Н2 и I2a2а. Таким образом, эти ге
нетические маркеры демонстрируют смешение ге
нофондов ранних европейских земледельцев, при
пейцы.
Образцы из Атапуэрки, несмотря на то, что они
относятся к энеолиту (переходная эпоха от финала
неолита к бронзе), по результатам разных видов
анализа несут значительный генетический след
охотников-собирателей. В этом они сходны со скан
шедших на Пиренейский полуостров, с местными
охотниками-собирателями, причем сучастием обо
ДинаВСКИМИ НеОЛИТИЧеСКИМИ Земледельцами и ОТ
их полов.
личаются от земледельцев Центральной Европы
По данным секвенирования полных геномов
(образцы NE1 и Штуттгарт). Это показывает, что
обитателей пещеры Эль Порталон в Атапуэрке,
когда ранние земледельцы распространялись по
8.4. Неолитизация Европы
295
Вronzeage
фатр9
О Iceman
оатр16
Сhalcolithic
оатр12—1420
О СО1
ОАТР2
кот
е1
ран
t
}
Neolithic
NE5
пNE7
Go
вg
/v58
АМotala12
ДLoschbour
Меsolithic
АLaBrana
|
|
|
|
|
|
8000
7000
6000
5000
4000
3000
Age Сal ВР
Рис. 8.22. Датировка анализируемых образцов древней ДНК (Günthera et al., 2015).
Красным цветом обозначены образцы с Иберийского полуострова: треугольник — мезолит (Ла-Бранья), кружки
— энеолит (медно-каменный век), ромбик — бронзовый век (Эль Порталон). Желтым цветом обозначены образцы
из Центральной Европы: треугольник — мезолит (Лошбор), кружок — энеолит (медно-каменный век, Тирольский
ледяной человек), квадрат — неолит (Штуттгарт). Зеленым цветом обозначены образцы из Венгрии: кружок — эне
олит (медно-каменный век), квадраты — неолит Голубым цветом обозначены образцы из Скандинавии: треуголь
ник вершиной вниз — поздние охотники-собиратели, треугольники вершиной вверх — мезолит, квадрат — неолит
---9
с
л---
А
."
|
А Меsolithic Iberian
o chalcolithic|berian
-
"
в а
Нипter-gatherer
а
в Neolithic Scandinavian armer
в j,
п
y
у Late Scandinavian Hunter-gatherer
А Меsolithic Scandinavian
Liтипап
Цго
с
Ф Вronze Age Iberian
-
iА
o
Chalcolithic
Central
European
o Neolithic
Central
European
п
А Меsolithic Central European
—
NeolithicНungarian
o Chalcolithic Hungarian
с
}
Осadian нungarian
Erash
5
ё
Си
с
Fтепнт
-
Браган
Вавgше
на|ап
5
Ф
п
о пFarmer
о
О
о а Во
Saron an
во
с
|
|
I
I
I
|
I
—0.10
—0,05
0.00
0.05
0.10
0.15
РС2
Рис. 8.23. Генетические взаимоотношение неолитической популяции Иберийского полуострова с други
ми древними и современными популяциями (анализ главных компонент по полногеномным данным)
(Günthera et al., 2015).
Пунктирные линии обозначают группы охотников-собирателей и земледельцев. Обозначения образцов указаны в
легенде. Цветным фоном залиты представители каждого изученного этноса современного населения Европы.
296
Глава 8. Древняя ДНК Европы
Европе и ассимилировали местные популяции
охотников-собирателей, то в разных регионах доля
популяции Северной Африки (желтый). А у бас
ассимилированного местного генетического ком
ков и у населения Сардинии их нет (рис. 8.24). Эти
две южноевропейские популяции в наиболее пол
понента резко различалась.
ном виде сохранили генетическое наследие ранних
них популяций и множество современных — из
европейских земледельцев и местных охотников
собирателей. Кроме того, именно баски оказались
генетически ближе всего к людям из пещеры Эль
Порталон в Атапуэрке. Эти новые данные значи
тельно «омолодили» генофонд басков, показав, что
немалая его часть получена от популяций ранних
земледельцев. При этом изоляция басков подтвер
Евразии и Северной Африки (рис. 8.24). У всех со
ждается — отсутствием кавказско-азиатского и аф
временных популяций Пиренейского полуострова
риканского предковых компонентов, присутству
АНАЛИЗ ПРЕДКОВЫХ КОМПОНЕНТОВ
ПОДТВЕРДИЛ ИЗОЛЯЦИЮ
Этот вывод был подтвержден и анализом ме
тодов АDMIXTURE. В анализ включены 16 древ
выявились два основных предковых компонента —
это европейские земледельцы (розовый цвет) и ев
ропейские охотники-собиратели (голубой).
Удивительным оказалось то, что баски (как
ющих у большинства народов Европы. Видимо, к
популяциям басков недокатились волны миграций,
как времен Римской империи, так и вторжений му
сульман из Северной Африки, начавшихся в 711
предполагается, говорящие на древнем языке на
году.
селения «до-индоевропейской» эпохи) в этом от
НОШеНИИ. Не ОТЛИЧaЮТСЯ ОТ ОСТaЛЬНЫХ популяций
полуострова. Отличаются они в другом. У всех по
пуляций, кроме басков и популяций Сардинии,
Происхождение же языка басков пока так и
остается неясным. Можно только предположить,
что их язык сохранился либо от первых земледель
цев (если они говорили не на индоевропейских
языках), либо от еще более древних охотников-со
бирателей и избежал влияния распространивших
ся по Европе индоевропейских языков.
имеются еще два предковых компонента — один
маркирует современные популяции Кавказа/Цен
тральной Азии (черный), а другой — современные
caucasus/central Asia
European Hunter-gatherer
North African
Early European farmer
К=10
А}
Ф.
S'S'S
атмо
5358°}}
А
а
5-7S
м
статко
чS
ч-
ч/
Раппет
Ншnter
gatherer
Рис. 8.24. Результаты анализа полных геномов методом АDMIXTURE (показаны только популяции Юго
западной Европы) (Günthera et al., 2015).
Предковые компоненты обозначены на цветной панели слева Кавказ/Центральная Азия (черный), европейс
кие охотники-собиратели (голубой), Северная Африка (желтый), ранние европейские земледельцы (розовый). Общее
число предковых компонентов, заложенных в данный вариант модели k=10.
8.5. Эпоха металла
297
8.5. ЭПОХА МЕТАЛЛА
РАННИЙ МЕТАЛЛ НА СЕВЕРЕ ЕВРОПЫ
Археологический памятник Могильник Боль
шого Оленьего острова — с названием, столь похо
жим на знаменитый мезолитический Южный Оле
ний Остров, — расположен примерно в том же гео
графическом регионе, но не так широко известен.
Он датируется примерно 3,5 тыс. лет назад (табл.
стоты, рисуют своеобразный генетический про
филь пост-неолитического населения Большого
Оленьего острова: С. U5, D, Z, U4, Т. Как и в насе
лении мезолитического Южного Оленьего остро
ва, в этом перечне мирно соседствуют типичные
европейские и сибирские варианты. Но в генофон
1.7) и относится к эпохе раннего металла (следую
де населения эпохи раннего металла именно си
щей после неолита). Географически он располо
бирским гаплогруппам (С, D, Z) принадлежат ли
дирующие места, причем появляются (не встречен
ные в мезолите) восточноевразийские гаплогруп
пы D и Z. Все это заставляет сделать вывод, что в
популяции, оставившей могильник на Большом
Оленьем острове, сибирский генетический компо
нент преобладал над европейским. А это заставля
жен на севере Кольского полуострова, на неболь
шом острове рядом с берегом.
Анализ антропологических данных из этого
могильника, рассматриваемых с учетом нового ма
териала, полученного в раскопках последнего де
сятилетия, указывает промежуточный антрополо
гический облик населения, оставившего могиль
ник Большого Оленьего острова, между европео
идными и монголоидными популяциями (Моисе
ев, Хартанович, 2011).
ет предполагать миграционную волну с востока —
причем, вероятно, не из ближайших районов за
Уралом, а из более отдаленных внутренних частей
Сибири. Отметим, что ни в одной из современных
популяций Европы (за исключением тундровых
СПЕКТР ГАПЛОГРУПП мтДНК
ненцев, являющихся совсем недавними пришель
цами из Сибири) нет столь высоких частот сибир
Благодаря хорошей сохранности материала, для
ских гаплогрупп.
Большого Оленьего острова удалось для 23 образ
цов провести анализ палеоДНК, то есть в нашем
распоряжении оказалась выборка в два раза боль
шая, чем для мезолитического памятника Южно
го Оленьего острова. Обнаруженные гаплогруппы
мтДНК, выстроенные по порядку убывания их ча
КАРТА ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
Картографированные генетические расстояния
были рассчитаны по частотам 3 1 гаплогруппы
мтДНК: А, В, С, D, F, G, Н, НV, I, J, К, L, N1a, N1b,
ит
имт
ими
тыс
Gепetc astances froпaлcent Bosho oen ostrow populaton
м
2a"воа
пип = 0 2e
пах = 4 51
имг
т.
|
—н
ут
о"
чт
"с
в"
пты
плы
го"
и
тоy
14
вно в оте
пи
т.
ттт
Рис. 8.25. Карта генетических расстояний от популяции эпохи раннего металла Большого Оленьего Ос
трова (Кольский п-ов) до генофондов 144 современных популяций Евразии.
Звездочкой — отмечено положение изученной древней популяции, красными точками — положение генетически
изученных современных популяций, стрелкой — зона наибольшего сходства древней популяции с современным
генофондом.
298
Глава 8. Древняя ДНК Европы
R,Т, U1, U2, U3, U4, U5a, U5b, U6, U7, U8, V, W, X,
бирских популяций (при том, что в общем списке
Y, Z, other (сумма прочих редких гаплогрупп). Кар
включенных в анализ популяций резко преоблада
та на рис. 8.25 демонстрирует, в какой степени сход
ным с древней популяцией является современное
население разных территорий Евразии. Шкала ге
нетических расстояний приведена внизу карты и
читается как обычно: наименьшие обнаруженные
ют европейские) указывает, что и на уровне гапло
типов митохондриальный генофонд Большого Оле
ньего Острова тяготеет к Сибири.
расстояния (наибольшая близость генофондов) на
ВРЕМЕНИ
СРАВНЕНИЕ С ГЕНОФОНДОМ ЭПОХИ НОВОГО
этой карте отражены как светлые области песочных
тонов, а генетически далекие генофонды — корич
невыми тонами гор и возвышенностей.
Для более точного прослеживания динамики
генофонда во времени была изучена еще одна древ
Популяции, генетически сходные с оленеост
няя популяция, происходящая стой же территории
ровцами Кольского полуострова (светлые тона кар
ты) отсутствуют в Европе, но характерны для со
временного населения Сибири. Этот ареал попу
ляций, близких к генофонду древнего населения
— с Кольского полуострова. Но эта популяция (Чаль
мны-Варрэ) была уже далеко не столь древней и
датируется Новым временем (около XVIII века, табл.
1.7. в 1 главе). По антропологическим данным мож
Кольского полуострова, начинается от бассейна
но полагать, что эта популяция представляет саа
Оби, захватывает не только Среднюю, но и Вос
точную Сибирь, а на юге простирается до Казах
мов. К тем же выводам привело и генетическое ис
следование. В этой популяции обнаружены только
три гаплогруппы мтДНК, перечисляемые в поряд
ке убывания частоты: V, U5b, U5а. Такой спектр
стана, Монголии и северо-запада Китая. Наиболее
генетически близкая к древним пост-неолитичес
ким оленеостровцам географическая область, пред
ставленная не одной, а рядом современных попу
ляций, находится в сердце этого ареала — в бассей
не Енисея, в Южной Сибири и Прибайкалье.
В целом карта генетических расстояний пока
зывает, что современное население отнюдь не Во
сточной Европы, а многих частей Сибири, и глав
гаплогрупп (среди которых почти полностью пре
обладают U5b и V) среди всех современных попу
ляций мира встречается только у саамов. К тому же
в этой популяции Нового времени с высокой часто
той обнаружены гаплотипы мтДНК с так называе
мым «саамским» мотивом. Хорошая сохранность
образцов позволила проанализировать обширную
ным образом бассейна Енисея, проявляет наиболь
выборку (N=42), что снимает вопросы о статисти
шее генетическое сходство с древним генофондом
Большого Оленьего острова. Это позволяет выд
вигать гипотезу о Средней Сибири как о возмож
ческой достоверности этих результатов.
Из этого можно сделать два вывода. Первый
вывод относится к саамам и указывает на стабиль
ной прародине населения Кольского полуострова
3500 лет назад. При более осторожной интерпре
ность их генофонда: по крайней мере, на протяже
тации карты можно утверждать, что соотношение
нии трех-четырех столетий заметных изменений
он не претерпел. Второй вывод относится уже к
западноевразийского и восточноевразийского ге
популяции Большого Оленьего Острова эпохи ран
нофондов в населении Кольского полуострова 3500
него металла, древнюю территорию которой сей
лет назад было примерно таким, как и в современ
час занимают саамы: кардинальное различие их
ном населении Средней и Южной Сибири. То есть
(в сравнении с современным населением Восточ
генофондов указывает, что популяция эпохи ран
него металла не оставила следов в современном
ной Европы, где доминируют западноевразийские
населении региона. Более подробный анализ на
гаплогруппы) это соотношение еще более, чем для
уровне отдельных гаплотипов показал, что даже в
мезолитического населения (Южный Олений Ос
тех немногих случаях, когда одна и та же гаплог
тров), было сдвинуто в пользу восточного генети
ческого ствола Северной Евразии.
руппа встречена и в популяции Большого Оленье
го Острова, и у современных популяций саамов,
то конкретные гаплотипы не совпадают. Вырисо
АНАЛИЗ ОБЩИХ ГАПЛОТИПОВ
вывается картина практически стопроцентного за
мещения генофонда (полной смены населения) на
Похожие результаты дал и анализ общих гап
этой территории.
лотипов. Этот анализ выполнен аналогично рас
смотренному выше анализу для мезолитической и
ОБЩИЙ ВЫВОД
неолитической популяций, поэтому, не останавли
ВаЯСЬ На ТеХНИЧеСКИХ подробностях, перечислим
группы популяций, обладающих наибольшим сход
эпохи раннего металла (Большой Олений Остров,
ством с оленеостровцами по спектру гаплотипов.
3500 лет назад), так же, как и мезолитический
Это популяции Северной, Западной, Южной Си
бири, Центральной Азии, а также Северной Евро
пы (норвежцы). Преобладание в этом списке си
Южный Олений остров (7 500 лет назад), несет в
своем генофонде четкие свидетельства сибирско
го влияния. Это выявляется и по спектру гаплог
Таким образом, популяция северной Европы
8.5. Эпоха металла
299
рупп мтДНК, и картой генетических расстояний,
и при анализе совпадающих гаплотипов мтДНК.
Однако, в отличие от мезолита (7500 лет назад), в
этом более позднем населении восточноевразийс
кие гаплогруппы преобладают: вероятным источ
ником миграции была уже не Западная, а Средняя
Сибирь.
Можно заключить, что популяция эпохи ран
него металла (Большого Оленьего острова) сфор
мировалась в результате миграции из Сибири (ве
роятно, вдоль арктического побережья по тундро
вой зоне). Впоследствии эта миграция из Сибири,
вероятно, угасла, не оставив значимого следа в со
временном генофонде.
БРОНЗОВЫЙ ВЕК В ЕВРОПЕ
Полногеномное исследование большого числа
образцов древней ДНК, недавно проведенное ко
мандой Дэвида Райха (David Reich), привело к от
крытию миграции в центральную Европу из при
черноморских степей около 4,5 тысяч лет назад
[Haak et al., 2015], связанную со степными попу
ляциями ямной культуры. В контексте двух гипо
тез о появлении в Европе индоевропейских язы
ков – анатолийской и степной (курганной), эти но
вые генетические данные хорошо согласуются
именно со степной гипотезой. Неудивительно, что
после появления этих генетических данных спо
ры о происхождении индоевропейцев разгорелись
с новой силой. Рассмотрим эти важные результа
ты подробнее.
БОЛЬШОЕ ЧИСЛО ДРЕВНИХ ОБРАЗЦОВ
В исследование вовлечены новые данные о ге
номах 69 древних европейцев, живших от 8000 до
3000 лет назад, изученных по полногеномной па
нели, включающей 400 тысяч однонуклеотидных
полиморфизмов (SNP). А при добавлении к ним
25 секвенированных ранее образцов ДНК древних
европейцев, изучаемая выборка достигла знаковой
отметки – почти сто (94) древних геномов (рис.
8.26). Среди носителей изученной древней ДНК:
19 охотников-собирателей (>5500 лет до н.э.); 28
ранненеолитических земледельцев (6000–4000 лет
до н.э.); 11 средненеолитических земледельцев
(4000–3000 лет до н.э.), включая тирольского «ле
дяного человека»; 9 представителей позднего мед
ного/раннего бронзового века (ямная культура
3300–2700 лет до н.э.); 15 представителей поздне
го неолита (2500–2200 до н.э.); 9 представителей
раннего бронзового века (2200–1500 лет до н.э.),
два – позднего бронзового века (1200–1100 лет до
н.э.), и один – железного века (около 900 лет до
н.э.). Образцы происходят из археологических сай
тов (рис. 8.26) Германии (41), Испании (10), Рос
сии (14), Швеции (12), Венгрии (15), Италии (1) и
Люксембурга (1).
ПОТОК ГЕНОВ В ПОЗДНЕМ НЕОЛИТЕ
Сравнение всех образцов древней ДНК и 777
образцов из современных популяций Западной Ев
разии традиционно проведено с помощью анализа
главных компонент (PCA). Важно подчеркнуть, что
основные черты этого итогового графика (рис. 8.27)
во многом вторят аналогичному графику из рабо
ты по трем источникам генофонда Европы (рис.
8.19), что подчеркивает устойчивость обнаружи
ваемых закономерностей. Генофонд современных
европейцев (множество серых точек в центре гра
фика) оказался расположен между генофондами
Ближнего Востока (множество серых точек в пра
вой части графика) и европейских охотников-со
бирателей. Первые европейские земледельцы сме
щены от большинства современных европейцев и
совпадают лишь с современными жителями Сар
динии. Это не удивительно, поскольку население
Сардинии традиционно считается сохранившим
свой генофонд со времени первого появления зем
ледельцев в Европе.
Но благодаря большому массиву новым образ
цов древней ДНК на графике появились новые чер
ты, которые обнаруживают доселе неизвестные
детали генетической истории европейцев.
Во-первых, если до сих пор охотники-собира
тели были представлены по их популяциям в За
падной Европе, Северной Европе (Скандинавия)
и в Сибири (стоянка Мальта), то теперь добави
лись охотники-собиратели из Восточной Европы
(из Карелии и Самарской области). В полном со
гласии с их географическим расположением они и
на графике расположились между североевропей
скими и сибирскими охотниками-собирателями.
Во-вторых, новые изученные образцы ДНК
среднего неолита несколько отличаются отранее
изученных популяций раннего неолита. Если срав
нить на графике образцы раннего неолита (треу
гольники вершиной вниз) и среднего неолита (тре
угольники вершиной вверх), то видно, что сходом
времени неолитическая популяция Европы гене
тически вполне ощутимо сдвинулась в сторону
генофонда европейских охотников-собирателей
(ромбики слева), что указывает на продолжение
ассимиляции автохтонного населения Европы и
перехода его на неолитические технологии и от
ношения.
В-третьих, новые изученные образцы европей
цев позднего неолита и бронзового века (кружки
на графике) попали в тот же кластер, что и совре
менные европейцы (серые точки) – довольно да
леко отойдя от популяций раннего и среднего нео
3()()
Глава 8. Древняя ДНК Европы
пешку ВСЕ
Gпошp
Нungary lА (1)
гог Age
Late Bronze Age
22-16 Eary BronzeAge
0.9
oнalberstad (1)
1
-
О Unetice (8)
НungaryВА (2)
О Alberstedt (1)
С ВепzigerodeHeimburg (3)
2.5.22
О Ве|Беакет (6)
Late Neolithic
О каrsdorf (1)
О Сorded Ware (4)
Нungary СА (1)
.
3. 3-27
Late С
st
LateCopper
Age (steppel
4.3
Mid Nвоithic
"ш"
и
ли
"аппама 19
o Sweden Nна (3) D Yamnaya
(9)
-
Ацамina (4)
Iceman (1)
А
д Esperstedt (1)
sweden мм (1)
а Ваа!berge (3)
Stuttgart (1)
6-55
Early Neolithic
К7 Els Trocs (5)
V7 Lвк (12)
Loschbour (1)
*** "
Laвana и,
у Lвкт (1)
Нungary EN (8)
К7 Starcevo (1)
o Sweden мнG (1)«» каrelia (1)
напоаунса) о моаа 7,
3 samaaa,
в МА1 (1)
43-22
Pleistocene Hunter-gatherer
Фковlenкі14 (1)
х Ust Ishim (1)
Рис. 8.26. Географическое местоположение находок образцов древней ДНК (69 новых и 25 из литерату
ры) и их хронология от палеолита до железного века (Нааk et al., 2015).
Стрелочками обозначено то, что местоположения образцов МА1 (Мальта) и Усть-Ишим находятся восточнее,
за пределами карты Iron Age — железный век, Late ВronzeAge — поздний бронзовый век, Early Bronze Age — ранний
бронзовый век, Late Neolithic — поздний неолит, Late Сopper Age — поздний медный век, Міd Neolithic — средний
неолит, Early Neolithic — ранний неолит, Ноlocene Нunter-gatherer — охотники-собиратели голоцена, Pleistocene
Нunter-gatherer — охотники собиратели плейстоцена.
лита. А значит, именно на этом отрезке времени —
В-четвертых — что стало ключом к пониманию
при переходе от среднего неолита к финальному —
в генофонде Европы последний раз произошли
происходивших процессов — появились данные по
степному населению Восточной Европы (ямная
существенные изменения (последний — потому что
культура, голубые квадраты на графике). Их гено
после этого он практически совпал с современным
мы расположились между охотниками-собирателя
ми Восточной Европы и некоторыми популяциями
из круга Юго-Западной Азии и смежных регионов
генофондом, а значит, более уже кардинально не
менялся).
8.5. Эпоха металла
301
2200 гг до н.э., то есть 5000—4200 лет назад). На
(в частности, Предкавказья). Напомню, что ареал
археологической ямной культуры — «степняков-ко
чевников» — занимал всю южную часть Восточно
Европейской равнины от Приуралья до Подунавья
с востока на запад и от Предкавказья до среднего
Поволжья с юга на север, а датируется эпохой по
зднего неолита-ранней бронзы (период около 3000—
основании новых генетических данных выдвинута
гипотеза, что именно эта популяция ямной культу
ры могла стать той решающей «добавкой» к неоли
тическому генофонду Европы, которая изменила
генофонд раннего и среднего неолита Европы на
этапе его перехода к позднему неолиту/бронзе.
5) Ust Ishim
Фковенки4
н
Ancient North Eurasians (ANE)
Мотана НG
swedenskogшпамна
фSлedenskooluпd_мна
Lсвеhbour
5
Labraha1
нungaryGamba на
"7 starcovo Eч
С
ушвкт вы
ш
нungaryGamна Ем
v7цвкем
sungап
V Span_EN
с,
п
eastern European hunter-gatherers (ЕНG)
o
Yamnaya
ш
сепал
А span мм
Пlution of внG
ё
-
А взарегов мм
п
н
-
—5,000-3,000 все
Esperstaal_мм
А Swedenskooluпd_мм
Птитлауа
o
HungaryGamba cА
С согdea ware_Lм
о кагsзон Lм
о Ве|ввакет Lм
С вепzigerodeнeimhцид Цы
egжемме
во
о дlberetect LN
С Unelice_ЕВА
НungaryGamba_ВА
о нашегstadi LВА
нungaryGamba A
о
o 9о
|
3
Ф
к»
o
«2.o 3,
ф
е.
Scandinavian hunter-gatherers (SнG)
*
-
е
y
western European hunter-gatherers (WнG)
Мнldle Neo|hic IMN)
ва"Конс (EN)
ту
Vу
Д
\,v
А
}
y
WнG replaced by early European farmers
и
>5.500 ВСЕ
Resurgence of wнG
—5,000—3.000 все
|
—0,05
ооо.
Рис. 8.27. Анализ главных компонент 94 древних и 777 современных представителей населения Европы
(Нааk et al., 2015).
Обозначения: Ancient North Eurasians (ANE) — древние северные евразийцы, Eastern European hunter-gatherers
(ЕНG) — восточноевропейские охотники-собиратели, «Dilution of ЕНG» — «разбавление» генофонда восточноев
ропейских охотников-собирателей генофондом, родственным ближневосточному, и формирование генофонда ям
ной культуры; Соrded Ware — культура шнуровой керамики, Late Neolithic/Bronze Age (LN/ВА) — поздний неолит/
бронзовый век; Scandinavianhunter-gatherers (SНG) — скандинавские охотники-собиратели Western Europeanhunter
gatherers (WНG)- западноевропейские охотники-собиратели; «Аrrival of eastern migrants» — миграция из восточно
европейских степей; Мiddle Neolithic (МN) — средний неолит, Early Neolithic (EN) — ранний неолит, «WНG replaced
by early European famers» — западноевропейские охотники-собиратели сменились ранними европейскими земле
дельцами; Resurgence of WНG — возвратное усиление доли генетического компонента западноевропейских охот
ников-собирателей.
302
Глава 8. Древняя ДНК Европы
8.5. Эпоха металла
РЕКОНСТРУКЦИЯ СТЕПНОЙ МИГРАЦИИ
303
стоящее время период ее существования оценива
ется как 3000—2300 гг до н.э., то есть 5000—4300
Реконструкция миграций групп населения и
генетических потоков между ними показывает, что
лет назад) практически синхронна ямной культуре
(период около 5000—4200 лет назад, а при более
строгих оценках — 4600—4200 лет назад). А во-вто
популяции Германии и Испании в среднем неоли
те имели на 18—34% больше генетического вклада
западноевропейских охотников-собирателей
рых, ее ареал расположен к северу и северо-запа
(WНG), чем в раннем неолите. Это говорит о по
ронных смежных культурах, что позволяет думать
степенном увеличении доли генетического компо
не об их «вертикальной» по времени генетичес
кой преемственности, а об их «горизонтальном»
нента охотников-собирателей в популяциях, пере
шедших на неолитическое ведение хозяйства (рис.
8.27). Но в позднем неолите и начале бронзового
века население этой же территории уже обнару
живает довольно резкий генетический сдвиг на 22
39% больше сходства с генофондом популяций
Восточной Европы (ЕНG-компонент), чем их пред
ки в среднем неолите. Именно этот генетический
ду от ямной. Скорее речь может идти о двух синх
генетическом родстве, то есть о том, что они вос
ходят к некоему общему генетическому субстрату,
поиск которого еще предстоит провести. Или же
необходимо доказывать, что ямная культура суще
ствовала уже в IV тыс. до н.э., и выяснять гено
фонд и ареал этой ранней «протоямной» культу
ры.
сдвиг позволяет выдвинуть гипотезу о важном вли
В целом, благодаря этому исследованию добав
янии миграции с востока популяций «степняков»,
лены три новых фрагмента в паззл общей картины
формирования генофонда Европы. Основа этой
картины уже была очерчена в работе (Lazaridis et
al., 2014), выявившей три основных источника ге
нофонда Европы (раздел 8.4): западноевропейские
носителей ямной культуры (или генетически сход
ных с ней популяций).
Древнеямная культурно-историческая общ
ность занимала все степные территории Восточ
ной Европы, ограничиваясь Причерноморьем и
Прикаспием на юге, Южным Приуральем на вос
токе, а на западе доходила до Подунавья и Балкан,
заканчиваясь в Венгерских степях. Это кочевая и
полукочевая культура скотоводов с элементами
мотыжного земледелия. Они хоронили своих умер
ших в ямах под курганами (отчего культура и по
лучила название), и что важно — у них были колес
ные повозки, запряженные волами (были и кони,
но их использовали как мясо).
По представленным в статье результатам гене
тический вклад популяций ямной культуры в ге
нофонд Центральной Европы оказался гораздо зна
охотники-собиратели, древние северные евразий
цы и ранние европейские земледельцы. Три новых
фрагмента в этой картине: во-первых, равноправ
ное включение генофонда охотников-собирателей
Восточной Европы (ЕНG) в общую картину гено
фонда Европы; во-вторых — значительная роль ге
нофонда популяции ямной культуры в формиро
вании современного облика генофонда Европы; в
третьих — гипотеза о формировании генофонда
популяций культуры шнуровой керамики в резуль
тате смешения популяций ямной культуры и по
томков европейцев эпохи среднего неолита.
Полученная в результате картина сложения ев
чительнее, чем предполагалось ранее. Изучение
ДНК представителей более поздней культуры шну
ропейского генофонда основана на двух больших
ровой керамики показало, что их генофонд на три
четверти (73%) родственен генофонду ямной куль
в предыстории Европы. Первая — в раннем неоли
те — принесла на территорию Европы культуру и
туры. Поэтому была выдвинута логичная с точки
зрения генетики гипотеза генетической преем
ственности от популяций ямной культуры к попу
ляциям культуры шнуровой керамики.
тока. Вторая — в позднем неолите — привела к по
явлению кочевников-скотоводов ямной культуры,
Однако следуетучесть, что не все так однознач
но. Во-первых, культура шнуровой керамики (в на
миграционных волнах, сыгравших ведущую роль
генофонд первых земледельцев с Ближнего Вос
пришедших из степей Восточной Европы (рис.
8.28). Причем, как показали генетические данные,
за обеими миграциями последовало частичное воз
Рис. 8.28. Географическое местоположение археологических культур и иллюстрация предположитель
ных миграций (Нааk et al., 2015).
а) вероятный путь миграции ранних земледельцев в Европу 9000—7000 лет назад; b) возвращение охотников
собирателей в течение среднего неолита 7000—5000 лет назад; с) появление степных мигрантов в центральной
Европе в позднем неолите, около 4500 лет назад.
Белыми стрелками обозначены две альтернативные гипотезы появления в Европе индоевропейских языков:
а) анатолийская неолитическая гипотеза, b) степная гипотеза.
Обозначения: Linear pottery (LВК) — культура линейно-ленточной керамики, Сardial Ware — культура импрессо,
Starcevo — Старчево-Кришская культура, Funnel Веaker (TRВ) — культура воронковидных кубков; Вell Веaker —
культура колоколовидных кубков; Соrded Ware — культура шнуровой керамики, Yamnaya — ямная культура.
304
Глава 8. Древняя ДНК Европы
вращение генофонда к предыдущему облику вслед
ствие ассимиляции пришельцами предшествующе
го населения Европы.
археологическими культурами — ямной и шнуро
вой керамики. Такие параллели действительно упо
минаются некоторыми археологами, но большин
ство из них все же подчеркивают, напротив, кар
ОДНОРОДИТЕЛЬСКИЕ МАРКЕРЫ У ЯМНИКОВ
динальные и многочисленные различия между эти
ми культурами, а не их немногочисленные сход
Описанные выше результаты основаны на ана
лизе аутосомных маркеров из полногеномных па
нелей. Но получены и данные по однородительс
ким маркерам — мтДНК и Y-хромосомы. Гаплог
руппы Y-хромосомы определены для 34 древних
образцов. Самыми распространенными, как и в
наши дни, оказались гаплогруппы R1a и R1b - они
встречены у 60% европейцев от позднего неолита
ные элементы. Поэтому гипотеза, в которой миг
рация из степей приравнивается к миграции ям
ной культуры, не нашла поддержки у многих архе
ологов, в том числе Л.С. Клейна. Он подчеркива
ет, что представления об археологическом сходстве
ямной культуры скультурами шнуровой керамики
и боевого топора не выдерживают критики. Тем
более, что генетики прослеживают лишь миграции
до бронзового века. Причем среди образцов, най
населения, а культура далеко не всегда двигалась
денных на территории России, все 100% принад
временном интервале — от 9700 до 4700 лет назад.
вместе с населением — у нее свои пути. Это дает
генетикам право говорить о преемственности (или
родстве) населения, но не о преемственности этих
Самые ранние изученные носители этих гаплог
двух археологических культур.
лежали к носителям этих гаплогрупп, и на всем
рупп — два охотника-собирателя с территории Рос
На рис. 8.29 представлена модель вклада в ге
сии из Карелии (R1a) и Самары (R1b). Характер
нофонды древних и современных популяций Ев
но, что их Y-хромосомные варианты не принадле
жали к линиям R1a-М417 и R1b-М269, которые
сегодня доминируют у европейцев. В то же время,
более поздние образцы — все семь мужчин ямной
культуры были носителями линии гаплогруппы
ропы трех предковых компонентов — ранних нео
R1b-М269.
В целом, данные по однородительским гене
тическим маркерам — Y-хромосоме и митохондри
альной ДНК — не противоречат предложенной мо
дели миграций. Считается, что Y-хромосомная гап
логруппа G2a и митохондриальная гаплогруппа
N1а, обычные уранних земледельцев Централь
ной Европы, почти исчезают в течение позднего
неолита и бронзового века, когда они по большей
части замещаются Y-хромосомными гаплогруппа
ми R1a и R1b и мтДНК гаплогруппами I, Т1, U2,
U4, U5a, W и Н. Это не только подтверждает вклад
степных популяций в генофонд неолитической
Европы, но также говорит о том, что в миграциях
принимали участие оба пола. А по пути в Цент
литических популяций (Early Neolithic), западно
европейских охотников-собирателей (Western
Еuropean Hunter-Gatherers) и представителей ям
ной культуры (Yamnaya). Она показывает, что в
Северной Европе, как ни парадоксально, генети
ческий вклад представителей ямной культуры го
раздо выше, чем в южной. А в Южной Европе, в
свою, очередь, гораздо больше генетический вклад
ранних неолитических популяций. Итак, за счет
древних внутриевропейских миграций (которые
пока еще практически не изучены) картина полу
чается более сложной, чем простая модель двух
миграций — «земледельческой» и «степной».
ИНДОЕВРОПЕЙЦЫ ЛИ?
Как известно, существует множество гипотез
прародины и путей распространения индоевропей
цев, в том числе две основные: анатолийская ут
ральную Европу степные мигранты-кочевники,
вероятно, смешивались с земледельцами Восточ
ной Европы. В то же время, среди изученных муж
чин ямной культуры все обладали только гаплог
руппой R1b Y-хромосомы, а у мужчин культуры
шнуровой керамики преобладала гаплогруппа R1a.
верждает, что индоевропейцы расселились из Ана
толии (Малой Азии) около 8500 лет назад, а кур
это плохо согласуется с результатами по аутосом
жены, на мой взгляд, чрезмерно схематично с точ
ному геному о наследовании «шнуровиками» трех
ки зрения географии и археологии.
Дэвид Райх и его соавторы (Нааk et al., 2015)
четвертей генофонда «ямников». Но и не дает по
ганная постулирует миграцию индоевропейцев из
причерноморских степей. И та, и другая гипотеза
отражены в статье (Нааk et al., 2015) белыми стрел
ками на карте миграций (рис. 8.28), хотя изобра
вода отвергнуть такую гипотезу — поскольку пока
считают, что полученные ими результаты вносят
изучено слишком мало образцов в каждой из вы
борок.
решающий вклад в дебаты о путях экспансии ин
доевропейских языков в Европу. В связи с этим мне
вспомнилась одна из работ Майта Метспалу, по
О СВЯЗИ «ЯМ НИКОВ» И «ШНУРОВИКОВ»
священная сравнению митохондриальных гено
В статье (Нааk et al., 2015] упоминается неко
фондов Крита и Кипра. (Интересная, кстати, ситу
ация — два острова в Восточном Средиземноморье
торое сходство между обеими рассматриваемыми
изначально имели сходное население, но потом их
8.5. Эпоха металла
305
п Early Neolithic (LВК_EN)
п Western European Hunter-Gatherer (Loschbour)
п Yamnaya
Norwegian
Lithuanian
Estonian
Icelandic
Scottish
Сzech
Вelarusian
|
|
|
|
|
|
Нungarian
Ukrainian
}
English
Оrcadian
French South
Сroatian
French
Spanish North
Вulgarian
Tuscan
Вasque
Вergamo
Spanish
Greek
Albanian
Sardinian
Нalberstadt_LВА |
Unetice ЕВА |
НungaryGamba ВА
А
|
Ве|| Веaker LN
Alberstedt_LN |
Вenzigerode_LN
|
Кarsdorf_LN |
Сorded Ware LN |
НungaryGamba_СА
В
}
Iceman
Spain MN
Esperstedt MN
Вааlberge MN
Spain EN
Stuttgart
НungaryGamba EN
|
|
|
|
lвкт en |
Starcevo_EN |
|
|
|
||
|
|
|
П
П
П
|
с
+
o
со
с
во
в
в
с
н=
Рис. 8.29. Пропорция генетического вклада ранних неолитических популяций (Early Neolithic), западно
европейских охотников-собирателей (Western European hunter-gatherers) и представителей ямной культу
ры (Yamnaya) в генофонды различных современных и древних популяциях (Нааk et al., 2015).
генофонды разошлись). И один из выводов статьи
был шутливым: «Ни один из результатов генети
полагавшиеся ранее. И обнаруженная миграция,
действительно, очень похожа нату, которая долж
ческого исследования не противоречит широко
на была иметь место согласно степной гипотезе
известному утверждению, что Афродита родилась
на Кипре». Вот и здесь — ни один из результатов
распространения индоевропейцев. Но похожесть,
генетического исследования не противоречит ут
тельный аргумент в пользу правдоподобности. Ос
новной аргумент, который приводят сами авторы,
— не «за степную гипотезу», а «против анатолийс
верждению, что индоевропейцы расселились из
степей.
Говоря серьезно, результаты статьи|Наak et al.,
2015), конечно, к вопросаммиграций индоевропей
цев отношение имеют. Ведь хотя древняя ДНК не
корреляция — не доказательство, а лишь дополни
кой». Аргумент состоит в том, что обнаружены мас
совые миграции после распространения земледе
лия в Европе (около 4500 лет назад популяция, ге
может ответить на вопрос, на каком языке говори
нетически родственная носителям ямной культу
ли люди, она выявляет миграции самих этих лю
ры, переместилась в Центральную Европу). А ана
дей. Разные гипотезы распространения индоевро
пейских языков предполагают определенные миг
толийская гипотеза во многом опиралась на то, что
после неолитизации очень больших подвижек на
селения уже не было, а неолитизация-то явно шла
через Анатолию.
рации, а генетика может их подтвердить, опровер
гнуть или же обнаружить новые миграции, не пред
306
Глава 8. Древняя ДНК Европы
Кроме того, авторы статьи (Нааk et al., 2015)
осторожны в своих лингвистических выводах. Они
не утверждают, что все индоевропейские языки в
Европе могли появиться в результате первых зем
ледельческих миграций. И подчеркивают, что их
данные ничего не говорят о прародине индоевро
пейских языков, а лишь о том, каким путем часть
этих языков могла достигнуть Центральной Евро
пы. А если прародину индоевропейцев допустить
в восточной Анатолии, то с тем, что одна ветвь этих
языков достигла северного Причерноморья и от
туда со степными кочевниками разошлась по боль
шой части Евразии, не спорит, насколько я знаю,
почти никто из сторонникованатолийской гипоте
зы. Так что большого спора гипотез — если огра
ничивать его событиями внутри Европы — возмож
Но все же надо задуматься о том, что если была
миграция из Восточной Европы (больше, похоже,
неоткуда), то по Восточной Европе в распоряже
нии пока данные только по трем популяциям:
— мезолитическим охотникам-собирателям
(всего два генома!):
— носителям ямной культуры;
— современному населению.
И больше ничего!
То, что охотники-собиратели хуже подходят на
роль добавки в средненеолитический генофонд,
чем «ямники», авторы статьи (Нааk et al., 2015)
проверили. Но от охотников-собирателей до совре
менного населения простирается десяток тысяче
летий. И хотя то, что миграция должна была про
изойти не позднее финала неолита, сокращает вре
менной интервал в два раза, но и на этом времен
ном интервале и в пространстве Восточной Евро
но, и нет.
пы кто только не жил!
МИГРАНТЫ, ПОХОЖИЕ НА «ЯМНИКОВ»
Хоть похоже на Россию,
Лично я считаю, что авторы статьи выбрали
вполне вероятного кандидата. Например, правдо
подобнее предполагать миграцию не из лесной, а
Только все же не Россия...
действительно из степной полосы Восточной Ев
Александр Городницкий
ропы (в лесах и плотность населения меньше, и
доля генофонда охотников-собирателей должна
Размышляя о результатах этой ключевой рабо
быть больше, а вклад, как упоминалось, был не
ты (Нааk et al., 2015), я выделил в ее внутренней
«охотничий»). Но все же «вероятно» и «правдопо
ЛОГИКе Два ГлаВНЫХ СИЛЛОГИЗМа:
добнее» — это предположения, а не доказательства.
И учитывая, что большинство археологов отрица
1а) генофонд раннего неолита и среднего нео
лита Европы отличается от генофонда позднего
ют возможность прямого мощного влияния «ям
неолита Европы;
ников» на «шнуровиков», стоит предполагать, что
1б) генофонд позднего неолита Европы прак
тически совпадает с генофондом современной Ев
реальный поток генов был более сложным, хотя и
ропы.
Восточной Европы в Европу Центральную.
действительно вел во 2—4 тысячелетии до н.э. из
Вывод 1: при переходе от среднего к позднему
неолиту Европа (имеется в виду Западная и Цент
ральная Европа) приняла какую-то массовую миг
КАРТЫ ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
ОТ ДРЕВНИХ ПОПУЛЯЦИЙ
рацию.
более мутации так подействовать не могли — остает
Одним из дополнительных аргументов сход
ства «шнуровиков» и «ямников» в работе (Нааk et
al., 2015) является то, что «шнуровики» генетичес
ся миграция! Но далее следует второй силлогизм:
2а) была массовая миграция при переходе к
нимальное Fst расстояние). Ну, судя по таблице в
позднему неолиту;
статье (Extended Data Table 3 (Нааk et al., 2015]).
2б) генофонд носителей ямной культуры хоро
шо подходит на роль мигрантов (если добавить к
генофонду среднего неолита Европы генофонд
«ямников», то получится как раз генофонд поздне
го неолита Европы).
популяция унетицкой культуры (Unetice) еще бо
лее похожа на шнуровиков. А среди современного
С этим выводом трудно поспорить из четырех
факторов микроэволюции нидрейф, ни отбор, нитем
Вывод 2: «ямники» и мигрировали.
А вот этот вывод, строго говоря, логически не
обоснован, потому что вместо «ямников» могли
мигрировать и носители других археологических
культур — генетически похожие на них. Правда,
точное следование аристотелевской логике в био
логии большая редкость. И было бы несправедли
во предъявлять к этой статье требования на поря
док более строгие, чем ко всем прочим статьям.
ки более всего похожи именно на «ямников» (ми
населения на шнуровиков похожи самые разные
популяции — и венгры, и англичане, и скандинавы,
и русские с мордвой.
Поэтому по данным этой таблицы из статьи я
построил карты генетических расстояний (рис.
8.30—8.33) от основных древних популяций до со
временных популяций. Как обычно на картах рас
стояний, области, которые генетически далеки от
генофонда реперной популяции, окрашиваются в
красно-коричневые тона возвышенностей, а те об
ласти, до которых генетическое расстояние мало,
— в интенсивно зеленые тона низменностей. Для
8.5. Эпоха металла
307
всех четырех карт использована одна и та же шка
ла (приведенная в верхней части каждой карты),
что позволяет сравнивать их напрямую.
Вот карта генетических расстояний от «шну
ровиков» (рис. 8.30): темно-зеленые пятна генети
ческого сходства с современными популяциями
разбросаны по всей Европе.
А вот карта генетических расстояний от попу
ляции ямной культуры (рис. 8.30): очень большого
сходства (темно-зеленые тона) нет нигде. Умерен
ное генетическое сходство (ярко-зеленые тона)—ox
ватывает всю Восточную Европу (изучены русские,
мордва, лезгины). А прочая Европа генетическиеще
Европе. Ну, это ожидаемый результат. Показатель
на, конечно, близость генофонда восточно-евро
пейских охотников-собирателей к Северной Евро
пе и северу Центральной Европы, хотя она и мень
ше, чем к Восточной.
А вот культуры позднего неолита/бронзы Цен
тральной Европы (приведена карта от культуры ко
локоловидных кубков, рис. 8.32) кажутся родны
ми почти всей современной Европе, окрасившей
ся в темно-зеленые тона минимальных расстояний.
Что это? Результат того, что они — «общие дети»
обеих половинок Европы, соединившихся на из
лете неолита, как предполагают авторы статьи
меньше похожа на «ямников». Это не очень-то со
|Наak et al., 2015)? Или напротив, результат рас
гласуется с идеей, что именно ямники во многом
пространения потомков этих культур по всей Ев
сформировали генофонд Европы (хотя если гово
ропе уже в более поздние времена?
рить о сравнительно небольшом влиянии, то это
Правда, на картах бросается в глаза очень не
большое число опорных точек — современных по
пуляций, изученных к моменту выхода статьи
карте не противоречит). Особенно непохож на «ям
ников» генофонд современной южной Европы — что
мы видели и в результатахADMIXTURE (рис. 8.29).
Взглянем еще на карту расстояний от восточ
но-европейских охотников-собирателей (рис. 8.32).
Тональность карты — красноватые тона очень боль
ших расстояний (генофонд Европы сейчас совсем
иной, чем в мезолите), но все же вклад этого ком
понента прослеживается на «своей» территории —
Восточной Европе — явственнее, чем в Западной
|Наak et al., 2015) по панели Нuman Оrigin. Поэто
му выявляемые как картах географические зако
номерности наверняка еще уточнятся и скоррек
тируются по мере более подробного изучения со
временного генофонда.
Будем надеяться, что Давид Райх и его коман
да, ежегодно выпускающие статьи в Nature, не за
ставят нас долго ждать следующей серии их увле
генетические расстояния
от генофонда населения культуры
шнуровой наряминн (Согdad Wяга)
-
н
"ин
ни
Рис. 8.30. Карта генетических расстояний от генофонда населения культуры шнуровой керамики (Соrded
Ware).
308
Глава 8. Древняя ДНК Европы
тт
нт
л"
н
-т
-
Генетические расстоинин
от генофонда населения
ямнои культуры
а
он
ид
н.
или
н
н
а
н.
("аппяya)
** я
нит
и
чин
„хомом мог
ни
*
и
.
*
вннннннннннннннннн
Рис. 8.31. Карта генетических расстояний от генофонда населения ямной культуры (Yamnaya).
ми
ины
ин
aj
-
и
лин
я
ни
и
ин
-
тт
-
-
Генетические расстоинии
оттенофонда населения
охотников-собирателем
восточной Европы (Енгу
*
и
*
ли
*ннннннннннннннннн
Рис. 8.32. Карта генетических расстояний от генофонда охотников-собирателей Восточной Европы (ЕНG).
8.5. Эпоха металла
309
тт
и
ни
лу.
или
ё.
т"
или
вин
инит
на
и ни
п
ли
и
ана
и
ин
тп
тт
-т
по
Генетические расстоинин
оттенофонда населения
культуры колоколовидных кубков
(вы Веакет
.wммммм "
ли
члнять
и
тт
1
члтать
Рис. 8.33. Карта генетических расстояний от генофонда населения культуры колоколовидных кубков
(Вell Beaker).
кательного «бостонского сериала», потому что,
ПОХОже, только полногеномный анализ других — и
древних, и современных —
популяций
может луч
ше всего распутать пути миграций. Похоже, они
окажутся сложнее, чем цепочка «ямники» — «шну
ровики» — «европейцы».
БРОНЗОВЫЙ ВЕК В ЕВРАЗИИ
ГЕНЕТИЧЕСКАЯ МОЗАИКА БРОНЗОВОГО ВЕКА
тральную, Южную и Восточную Европу, Южный
Бронзовый век, как становится ясно, был пери
одом важных миграционных событий, во многом
сформировавших современный генофонд Евразии.
Наиболее полно генетическая мозаика бронзового
века выявлена в исследовании команды Eske
Willerslev |Allentoft et al., 2015). Эта статья по сво
им выводам близка к только что описанному иссле
Урал и Центральную Сибирь (рис. 8.35).
Полногеномное секвенирование проведено для
101 образца, но покрытие варьировало очень силь
но — от 0,01х до 7,4x (цифра показывает, сколько
раз был прочитан каждый нуклеотид). С относи
тельно высоким (по меркам древней ДНК) покры
тием от 1,1х до 7,4х секвенированы 19 геномов, а
также использовали ранее опубликованные дан
дованию (Нааk et al., 2015), но рассматривает попу
НЫe.
ляции бронзового века не только Европы, но и зна
На втором этапе из каждой древней популяции
выбрали образцы, в которых успешно генотипи
чительной части Азии. Также эта работа (Аllentoft
et al., 2015) важна тем, что в ней представлен ана
ровано не менее 300 тысяч SNР маркеров. В ре
лиз самого большого до сих пор числа древних ге
номов представителей разных археологических
культур (рис. 8.34). Как видно из этого рисунка, в
исследование были отобраны образцы в основном
бронзового века, а также несколько образцов до и
зультате выборка составила 17 индивидуумов,
ПОСле — ЭПОХ ПОЗДНеГО НеОлита и желеЗНОГО века.
за авторами статьи, отдельно рассмотрим их ре
Географически они охватывают Скандинавию, Цен
зультаты по Европе и по Азии.
представляющих 16 популяций. Анализ главных
компонент выявил в этих данных 11 генетических
кластеров, соответствующих географической и
археологической принадлежности образцов. Вслед
3 ] ()
Глава 8. Древняя ДНК Европы
Iron Age
Аfontova Gora
Nordic Late ВА
Ме2hovskaya
Кarasuk
Late ВА
Дndronovo
Vatya
Мiddle ВД
Sintashta
Nordic LN-ЕВА
Nordic LN
Мaros
Unetice
Окшnevo
Ве|Веакет
StalingradО.
Nordic MN в
вас, сwс
Yamnaya
Afanasievo
Remedello
3400 вс
2600 вс
1800 ВС
1000 ВС
200 вс
600
Рис. 8.34. Название (или местоположение) и датировка изучаемых культур (Аllentoft et al., 2015).
По горизонтальной оси: датировки в годах относительно н.э. (ВС — до н.э.)
По вертикальной оси (сверху вниз): железный век, Афонтова гора, северный поздний бронзовый век, межовс
кая, карасукская, поздний бронзовый век, андроновская, Ватя, средний бронзовый век, синташтинская, северный
поздний неолит — ранний бронзовый век, северный поздний неолит, Марос, унетицкая, окуневская, колоковидных
кубков, сталинградский карьер, северный средний неолит, культура шнуровой керамики или боевых топоров (ВАС,
СWС), ямная, афанасьевская, Ремеделло.
Remedello, СА
Ве|Веaker, СА
С Мiddle ВА
евд
() каrasuk, LВА
ф Stalingrad guarry,
сд-евд
А
Yamnaya, СА-
А Окшnevo, ЕВА
А Unetice, ЕВА
О LВА
ЕВД
о Маros, МВА
А Late ВА
9 Аtanasievo. ЕВА 6 smashta. евд
Вattle Axe and
*}"
О Nordic MN В
-
Nordic LN
вуарамвд
А NordicLN-ЕВА
іг I МI—
()
Ме2hovskaya,
Nordic Late ВА
Аfontova Gora,
9, Velika
}
LВА-lАGruda,
тш
Andronovo, ВА
С Iron Age
Рис. 8.35. Местоположение изученных образцов древней ДНК, слева вверху перечислены названия куль
тур и их обозначения (Аllentoft et al., 2015).
ЕВРОПА ЭПОХИ БРОНЗЫ
Основной результат состоит в том, что популя
зья, представленной ямной культурой (рис. 8.36). По
сути, этот вывод (Аllentoft et al., 2015) идентичен
подробно разобранному выше выводу (Нааk et al.,
ции в Северной и Южной Европе были сформиро
ваны смешением ранних охотников-собирателей и
неолитических земледельцев, а в начале бронзово
го века получили поток генов из степей Предкавка
2015). Похожи — с небольшими уточнениями — и
выводы о том, что европейские культуры позднего
неолита и бронзового века — шнуровой керамики,
колоколовидных кубков, унетицкая и скандинавс
8.5. Эпоха металла
3|1
Меsolithic
a
ВronzeAge
Neolithic
Siberia
0.10 —
ва.
0.05-
ти
Europe
ме.
8 ооо
*
ним,
й
———
*
|
EuropeS
*
—0,05- о
-0.10
I
|
—0,05
0.00
0.05
b
* 5
=
gё =
g
&
&
&
**
* 8ё
*
*
*
Е
—
шо
*?
5
5 5
п.
т.
та
*
шо
5
".
ил
та
т.
}
сл
Меsolithic
пг
с ог
}
Neolithic
hunter-gatherers farmers
го
*
&
==
*
5
=
5
* *5
53
>—
:
з
55
ё*
ча
си
ил
ё
В
— 2в
т
—
ВronzeAge
Europe
BronzeAge
steppe / Caucasus
р- 1000 вс
вооо вс
л
з
5 55 5
5 ёё
5 5 5ё
Соntemporary Eurasians
2900 вс —ь- 800 вс
Рис. 8.36. Генетическая структура древней Европы и причерноморских степей (Аllentoft et al., 2015).
а) Анализ главных компонент (РСА) древних образцов (n=93) из разных археологических эпох, спроецирован
ный на современный генофонд Европы, Западной Азии и Кавказа. Серым представлены положение в генетичес
ком пространстве 1 и 2 главных компонент отдельных индивидуумов (мелкий шрифт) и популяций (крупный
шрифт). Цветные кружки обозначают древние образцы.
b) Анализ ADMIXTURE предковых компонентов (К=16) для геномов древних (n=93) и современных индиви
дуумов. Цветные кружки обозначают те же древние образцы, что и на рис 8.36а (на графике РСА). Пунктирной
линией обозначен предполагаемый генетический поток от ямной культуры.
кая — оказались генетически близки друг другу и
проявляют сходство также с ямной культурой. Наи
более близка к ней культура шнуровой керамики,
наименее — культуры Венгрии, промежуточное по
ложение занимает культура колоколовидных кубков
Центральной Европы. Доля этого «ямного» компо
нента, по данным (Аllentoft et al., 2015), как и по
даным (Нааk et al., 2015), различается в разных ре
гионах Европы. Так, генофонд популяции культу
ры медного века Ремеделло в Италии не имеет его
вовсе, но он широко представлен в культурах по
здней бронзы в Черногории.
Есть, правда, и одно — кажущееся — расхожде
ние. В статье (Аllentoft et al., 2015) часто упомина
ется «кавказский компонент», но это лишь расхож
дение в географических терминах: под «Сaucasus»
в работе (Аllentoft et al., 2015) понимается никак
не Южный Кавказ и даже не Северный, а те же
самые степные области Предкавказья и Причер
ми и замещением популяций (рис. 8.37). Популя
ция раннего бронзового века — афанасьевская куль
тура в Алтае-Саянском регионе — генетически нео
тличима от ямной. Это свидетельствует о том, что
популяция ямной культуры из степей распростра
нялась сразу в двух направлениях — как на запад в
Центральную Европу, так и на восток в азиатские
степи (рис. 8.38). Таким образом, потоки генов на
большие расстояния в раннем бронзовом веке со
единили такие отдаленные регионы, как Алтай и
Скандинавию.
При этом синташтинская культура — географи
чески промежуточная между ямной и афанасьевс
кой — имеет несколько меньшую долю «ямного»
генетического компонента и приближается к куль
туре шнуровой керамики из географически дале
кой от нее Центральной Европы. Пока можно толь
ко гадать, означает ли это далекую восточную миг
рацию шнуровиков или в синташтинскую культу
номорья, которые в статье (Нааk et al., 2015) назы
ваются "steppe".
ры влился какой-то местный субстрат, имеющий
древние общие корни с центральноевропейским
субстратом «шнуровиков».
АЗИЯ В ЭПОХУ БРОНЗЫ
Следующая, культура, андроновская, возник
шая в Центральной Азии в эпоху поздней бронзы,
Бронзовый век в Азии был столь же динами
генетически близка к синташтинской, но четко от
чен — он характеризуется обширными миграция
личается и от ямной, и от афанасьевской. Из чего
Глава 8. Древняя ДНК Европы
312
Early / Middle BronzeAge
Рaleolithic
a
Late Bronze Age/Iron Age
0.050
eastAsia
о.025-
*
----
|
West Eшгазів
-
с осо-
3
г.
ма"ta
—о.025-
п -
-
—о.050—
—0,075—
"
—0.02
т
0.00
т
0.02
т
—0,02
0.00
т
0,02
т
—0.02
0.00
0.02
рси
b
-
|
s=
23
3 & =ё ё : 5 * 3 =
s :
5
ё
53
5 **
ёёёёё* *3 5 *3
5
ё
*3= 8 ё ?
5
5
-
-
Early
ё =
3 =
= 2
o
=
Мicole
Late
-
IгопAge
Pagolithic
Сспtепрогary Eurasians
ЕronzeAge
вооот пс
н 2900 вс
н 200 до
Рис. 8.37. Генетическая структура Азии бронзового века (Аllentoft et al., 2015).
Обозначения те же, что и на предыдущем рисунке (8.36). Пунктирная линия обозначает предполагаемую гене
тическую связь ямной и окуневской культуры с палеолитическим образцом со стоянки Мальта.
вытекает гипотеза, что андроновская культура
представляет собой продолжение генофонда син
таштинской культуры во времени и пространстве
(рис. 8.39).
К концу бронзового века в Алтае-Саянском
регионе андроновская культура замещается кара
сукской и межовской культурами и культурами
железного века. Эти культуры, вероятно, появились
в результате миграции в Южную Сибирь (Алтае
Саяны) популяций из Восточной Азии или других
регионов Сибири, принесшими более «азиатский»
генофонд. Действительно, в результатах
АDMIXTURE в генофондах этих популяций резко
возрастает доля «синих» компонентов, свойствен
ных современному населению Сибири (рис. 8.37).
Наиболее интригующие результаты получены
для популяции окуневской культуры бронзового
ке, дали начало афанасьевской культуре близ Ал
тая около 3000 лет до н.э. А представителиафана
сьевской культуры, в свою очередь, могли продви
нуться немного южнее, и этим можно объяснить
загадочное присутствие одного из старейших ин
доевропейских языков, тохарского, в бассейне реки
Тарим.
В целом, совокупность описанных результатов,
и в особенности своеобразное положение окунев
ской культуры, хорошо согласуется с предыдущи
ми исследования палеоантропологов. Это не толь
комое мнение на конференции в Йене (Linguistics,
archaeology, and genetics, 2015) Мортен Аллентофт
в докладе привел цитату из рецензента своей ста
тьи в Nature. Смысл цитаты сводился к тому, что
многие из обнаруженных в его статье генетичес
ких взаимоотношений популяций были описаны в
века из Саяно-Алтайского региона, которая демон
русскоязычной научной литературе по физической
стрирует генетическое сходство с современными
коренными американцами. Этот фактозначает, что
антропологии, и кто бы мог подумать, что русские
антропологи были так близки к истине. Пожалуй,
окуневская культура может представлять часть по
это явное указание, что такие исследования гене
пуляции, генетически родственной верхнепалеоли
тическому охотнику-собирателю со стоянки Маль
та, который, в свою очередь, был родственен по
тикам стоит проводить в содружестве с предста
пуляции, отправившейся заселять Америку,
Реконструированные миграции третьего и вто
рого тысячелетий до нашей эры схематически по
казаны, соответственно, нарис. 8.38 и 8.39. Напри
мер, мигрирующие на восток «ямники», предпо
ложительно говорившие на индоевропейских язы
вителями более старых и опытных наук.
КОГДА ВЗРОСЛЫЕ НАУЧИЛИСЬ ПИТЬ МОЛОКО
В работе (Аllentoft et al., 2015) проанализиро
вана также динамика в европейском генофонде от
дельных генетических вариантов (всего 104), ко
торые связаны с важными фенотипическими при
8.5. Эпоха металла
3|3
S>_—
* .
Рис. 8.38. Местоположение культур раннего бронзового века — ямной, шнуровой керамики и афанасьев
ской (Аllentoft et al., 2015).
Стрелками показана экспансия ямной культуры.
* SimtaShta
.
Andromoyo
Early/idSecond
Рис. 8.39. Культуры среднего и позднего бронзового века: синташтинская, андроновская, окуневская и
карасукская, возникшие из миграции на восток (Аllentoft et al., 2015).
Черные ромбы обозначают места находок колесных повозок и лошадей как доказательство распространения
кочевых культур. Пунктиром обозначено место распространения тохарского языка, второго по древности среди
индоевропейских языков.
знаками, что позволяет предположить, что некото-
ваются в частоте. Аллель, обеспечивающий голу
рые из этих генетических вариантов поддерживались естественным отбором.
бые глаза, хотя возникает еще у мезолитических
охотников-собирателей, но отсутствует в черно
Например, выяснилось, что два аллеля, ассо-
морско-каспийских степных популяциях. Однако
циированных со светлой пигментацией кожи, у европейцев сходом времени стремительно увеличи-
у европейцев бронзового века достигает заметной
частоты.
3 |4
Глава 8. Древняя ДНК Европы
Генетический вариант, связанный столерантно
стью клактозе (rs4988235), дает возможность взрос
лым людям употреблять в пищу молоко. Распрост
среднем 10%. Особенно он был характерен для по
пуляции ямной культуры, поэтому авторы полага
ют, что именно от «ямников» он распространился
Таты Оказались неожидаННЫМИ. В
нительный источник питания. Полученные резуль
бронзовом ВеКе
по Европе. Однако своих высоких частот (среди
современных европейцев его частота в среднем
70%) этот вариант достиг в более позднее время.
Видимо, молоко вошло в обычный рацион далеко
частота даННОГО аллеля была довольно низкой — в
не сразу после того, как люди одомашнили скот
ранение этого аллеля традиционно связывали с по
явлением животноводства — он обеспечивал допол
СКИФЫ ДОНА
Античное время Европы (около 2500 лет на
зад, VI—III вв. до н.э.) пока представлено в иссле
дованиях древней ДНК не так подробно, как более
ранняя эпоха бронзового века. Но и изучая этот
период времени, большое внимание вновь уделя
лось популяциям евразийской степи. В том числе
нами совместно с Австралийским центром древ
ней ДНК был изучен митохондриальный генофонд
европейских скифов (низовья Дона, табл. 1.7. в 1
главе).
генофонде скифов Причерноморья западноевра
зийских гаплогрупп.
Другие авторы (Lalueza-Fox et al., 2003) обна
ружили сходный генофонду родственных скифам
культур на территории Казахстана. Это указывает,
что не только в эпоху бронзы, но и в скифскую эпо
ху «западноевразийский» митохондриальный гено
фонд распространялся много дальше на восток, чем
сейчас.
КАРТА ГЕНЕТИЧЕСКИХ РАССТОЯНИЙ
СПЕКТР ГАПЛОГРУПП
Была исследована митохондриальная ДНК 16
Этот вывод подтверждает и карта генетических
расстояний (рис. 8.40). Картографированные гене
образцов из скифских могильников на территории
тические расстояния были рассчитаны по частотам
Ростовской области и обнаружены следующие гап
логруппы, перечисленные в порядке убывания: Т,
U5a, Н, I, D, А, С, F, U2e, U7. Столь обширный
перечень гаплогрупп при сравнительно небольшом
числе проанализированных образцов указывает на
большое генетическое разнообразие популяции
скифов. Также можно отметить преобладание в
31 гаплогруппы мтДНК: А, В, С, D, F, G, Н, НV, I,
J, К, L, N1a, N1b, R, Т, U1, U2, U3, U4, U5a, U5b,
U6, U7, U8, V, W, X, Y, Z, other (сумма прочих ред
ких гаплогрупп). Карта демонстрирует, в какой мере
сходным с древним генофондом донских скифов яв
ляется современное население разных территорий
Евразии (144 современных популяции).
ип"
изо-
15c'
Genets astances from DспScyphlans
па
па
по
Рис. 8.40. Карта генетических расстояний от популяций скифов Причерноморья до генофондов 144 со
временных популяций Евразии.
Звездочкой
генофондом.
изученной древней популяции,
популяций, стрелкой — зона наибольшего
ОТМеЧенО ПОЛОЖение
изученных современных
красными точками — положение генетически
СХОДСТВa
древней
популяции с современным
8.5. Эпоха металла
315
Популяции, генетически сходные со скифами
Причерноморья (более светлые тона карты) обна
руживаются как в Европе, так и в Азии. Однако в
древних популяций, относилась почти полностью
Европе лишь три области обнаруживают значения
генетических расстояний в интервале от 0,6 до 0,7
этот «европейский» генофонд географически да
(т.е. генетически довольно «далекие» популяции)
— это низовья Днепра, Дона и Волги. Вся осталь
ная территория Европы еще более генетически
далека от генофонда скифов (расстояния в интер
вале от 0,7 до 0,9). А ареал популяций, близких к
генофонду скифов (расстояния в интервале от 0,3
до 0,6) охватывает Южный Урал, юг Западной Си
бири, Казахстан и отчасти Южную Сибирь. И наи
более генетически близкие к скифам современные
к «европейскому», а не к «азиатскому» генофонду.
Во-вторых, результаты указывают, что в то время
леко выходил за пределы Европы на восток.
В этом плане большой интерес представляют
результаты, полученные другими авторами |Кеуser
et al., 2009), по древней популяции носителей род
ственной скифам курганной культуры в Южной
Сибири. Эти результаты приводят по сути, к тем
же выводам о «европеоидности» генофонда ски
фов и об их широком распространении на восток,
что не является удивительным, поскольку хорошо
согласуется и сантропологическими, и с археоло
популяции обнаруживаются в низовьях Камы и
Гическими данными.
Вятки.
зывает, что к генофонду донских скифов наиболее
Скорее вызывает удивление сравнение с наши
ми собственными данными по Большому Оленье
му Острову (см. рис. 8.25): две популяции, обе
близко современное население не западного, а цен
представляющие Восточную Европу и не так уж
трального сегмента степного пояса Евразии (вклю
чающего юг Урала, Западной Сибири, Алтай и
Казахстан). Это позволяет говорить, что западно
евразийский генофонд доминировал в генетичес
ком портрете скифов Дона, но что сейчас область
сходных генофондов находится не в Европе, а не
сильно различающиеся по датировкам (3500 лет
В целом карта генетических расстояний пока
сколько восточнее — в центральном сегменте евра
зийской степи.
назад на севере Восточной Европы и 2500 лет на
зад на юге Восточной Европы), выявляют проти
воположно направленные миграции: северная по
пуляция Большого Оленьего Остова выявляет миг
рации из Сибири в Европу, а южная популяция
скифов Дона — распространение «европейского»
генофонда в Сибирь. Это является указанием на
то, что результаты, полученные по отдельным древ
ОБЩИЙ ВЫВОД
ним популяциям, следует с большой осторожнос
тью экстраполировать на крупные регионы, но
Таким образом, рассмотрение и спектра гаплог
рупп, и в особенности карты генетических рассто
яний указывает, во-первых, на то, что популяция
скифов Дона, в отличие от других изученных нами
вместе с тем и вселяет надежду, что по мере гене
тического изучения все новых древних популяций
сложная картина разнонаправленных миграций в
населении Евразии будет все больше проясняться.
ЗАКЛЮЧЕНИЕ
... И вот она — подобная кораллу,
Приросшая к Кавказу и к Уралу,
Земля морей и полуостровов,
Здесь вздутая, там сдавленная узко,
В парче лесов и в панцире хребтов,
Жемчужница огромного моллюска,
Атлантикой рожденная из пен —
Опаснейшая из морских сирен.
Страстей ее горючие сплетенья
Мерцают звездами на токах вод —
Извилистых и сложных, как растенья.
Как средиземный крабили звезда морская,
Был выброшен последний материк.
К широкой Азии, к Америке привык,
Слабеет океан, Европу омывая.
Она водами дышит и живет
Европа цезарей! С тех пор, как в Бонапарта
Гусиное перо направил Меттерних, —
Впервые за столет и на глазах моих
Меняется твоя таинственная карта!
Ее провидели в лучистой сфере
Блудницею, сидящею на звере,
На водах многих с чашею в руке,
И девушкой, лежащей на быке...
Максимилиан Волошин. «Европа» (1918)
Я пишу эти строки еще столет спустя. Но на
моих глазах карта Европы показывала не только та
инственные перемены, но и удивительную неизмен
ность. Неизменность была в картах ее современно
Изрезаны ее живые берега,
И полуостровов воздушны изваянья,
Немного женственны заливов очертанья:
Бискайи, Генуиленивая дуга.
(...)
Осип Мандельштам. «Европа» (1914)
нялся в неолите. Сейчас, спустя десятилетия, ана
лиз древней ДНК уверил нас, что последняя мас
штабная перемена случилась в бронзовом веке. Но
и то, и другое было очень давно. Тысячелетиями
го генофонда — как ни менялась научная мода, как
измеряются времена, проходящие от одного изме
ни расширялись технологии анализа и не сужались
нения до другого. А изменения, происходящие раз
подходы к синтезу, генофонд народонаселения Ев
в сто лет, важны для истории стран — но не для
ропы являл все те же черты — однородность боль
истории генофондов.
шую, чем другие регионы мира, а его изменчивость
Потому желающих найти в этой книге подтвер
ждения своих исторических или тем более полити
была мала и следовала очертаниям «морей и полу
островов». Перемены же случаются не раз в столет,
ческих взглядов ждет разочарование: не замечает
а ежегодно — но касаются они генофондов былых
генофонд Европы тех потрясений, о которых писа
эпох, реконструкций генетической карты древней
Европы. Перемены разительны: среди специалис
ли поэты и пишут блогеры. Похоже, что не замеча
ет он и «глобализаций». Например, считалось, что
тов одно время даже ходила шутка, что различия
между палеолитическим, мезолитическим, неоли
европейские генофонды перемешались из-за второй
мировой войны. Можно ли это проверить? Можно,
тическим и современным генофондами Европы луч
так как к этому времени уже широко изучались груп
ше всего объясняются внезапными колонизациями
пы крови АВ0. И были сопоставлены все европейс
кие популяции, изученные по АВ0 до второй миро
с Марса. Но в последние годы анализ древней ДНК
набрал силу и набрал объем выборок. И калейдос
коп непохожих кадров — моментальных снимков
вой, и изученные после нее, причем так, чтобы их
разделяло не меньше, чем одно поколение — 25 лет.
генофондов разных эпох — начал складываться в
захватывающий фильм истории генофонда Европы.
пределах одного народа, так и между европейски
И уже не нашествия марсиан, а земные миграции
ми народами не изменилось.
Сравнение показало, что средние различия как в
начинают объяснять изменения геногеографической
Зато какой простор такая стабильность откры
карты Европы. И очередность этих изменений на
вает тем, кто хочет понять единство и многообра
зие населения Европы, а заодно и его историю.
Можно век за веком изучать народонаселение Ев
ропы — и не опасаться, что объект изучения изме
нится. И действительно, такие исследования био
логической основы народонаселения Европы ведут
глядна, если рассмотреть временные срезы генофон
ДОВ СОСeДНИХ ЭПОХ.
Как примирить эти перемены прошлых гено
фондов Европы и неизменность ее современного
генофонда? Легко — взглянув на шкалу времени. В
классический период популяционной генетики мы
ся уже не одно столетие — сперва по признакам фи
верили, что последний раз генофонд Европы ме
зической антропологии, затем по классическим мар
Заключение
317
керам генетики, а сейчас уже и по полным геномам.
Как дерево, растут наши знания о генетической из
менчивости народонаселения Европы — о ее гено
фонде. И в этой книге предпринята попытка пред
ставить срез этого дерева знаний, каков он есть на
10е годы XXI века. Это дерево будет расти и даль
ше. Но я честно попробовал подвести итоги и обоб
щить то, что известно о генофонде Европы сейчас.
ЗАДАЧА ЗАКЛЮЧЕНИЯ
Заключение книги нередко является един
ственной частью, которую прочитывает большин
ство читателей, не имеющих нужды в подробном
изучении всего исследования. Поэтому я попы
тался представить тут не один-два самых инте
ресны мне вывода, а подытожить все разделы мо
нографии, проведя перед мысленным взором чи
тателя многочисленные результаты исследования
в их тезисном виде. Неизбежным недостатком та
кого подхода является большой объем заключе
ния, и, несмотря на это, все же отсутствие в нем
многих существенных частностей. Возможным
достоинством — краткое (по сравнению с основ
ным текстом) изложение главных мыслей и вы
водов, за обоснованием которых можно при же
лании обратиться к соответствующим главам.
Судить об эффективности такого подхода предо
ставляю читателю в надежде на его снисходитель
ность.
ДАННЫЕ И МЕТОДЫ ИХ АНАЛИЗА
РАЗНЫЕ МАРКЕРЫ — ОДНА ЕВРОПА
таты исследования всех трех современных генети
Y-хромосомы, митохондриальной
ДНК и полногеномных панелей маркеров.
ЧеСКИХ СИСТеМ —
В последние четверть века популяционная ге
нетика переживает новый подъем, связанный сис
пользованием нерекомбинирующих систем (мито
хондриальной ДНК и Y-хромосомы), а в последние
пять-семь лет — еще и с использованием широко
геномного и полногеномного анализа. На рисунке
9.1 приведены графики — как менялось число ста
тей, ежегодно публикуемых в мире по разным ге
нетическим системам. На них хорошо видно по
степенное появление в арсенале популяционной
генетики все новых систем. Видна и меняющаяся
модана маркеры. В этой книге объединены резуль
БАЗА ДАННЫХ ПО Y-ХРОМОСОМЕ «Y-ВАSE»
Чтобы изучить генофонд всей Европы, надо
сначала собрать всю информацию о нем. Сделать
это легко с собственными данными, хотя их у на
шего коллектива много — каждая пятая популяция,
изученная в Европе по маркерам Y-хромосомы,
изучена нами. Но чтобы узнать эту долю — и, глав
ное, чтобы проанализировать все имеющиеся дан
ные — потребовалось собрать и все данные, опуб
150
Классические
140
Y-хромосома
иммунологические
Классические
\ биохимические
мтДНК
ноген
ы е
"
|
"
№.3}}.}.}.}.}
s*s*s*s*s*s*s**
*
33 3
5. e4
c5
3. " ",
* 3 *
5- 3,
к 3°5
" "
м
S"5"S" }S}3°58 38
5 3°588}
3*3 }}}}}
геногеографических исследований.
По оси абсцисс указаны годы, по оси ординат — число статей, опубликованных в данном году по данной гене
тической системе. Приведены данные по пяти наиболее широко использовавшимся типам генетических марке
ров. Публикации по классическим маркерам подсчитаны по библиографическому приложению в [Сavalli-Sforza et
al., 1994), по остальным типам маркеров — по данным Рubmed.
Рис. 9.1. Использование разных генетических маркеров за столет
318
Заключение
ликованные другими. База содержит 144 тысячи -
образцов, генотипированных по SNР-маркерам (по
гаплогруппам), из них для 32 тысяч есть и данные
по STR-маркерам. А в главном зарубежном анало
ге — базе данных криминалистов YНRD — все на
оборот: 143 тысячи по STR-маркерам (для крими
налистики они важнее), из них только для 17 ты
сяч есть данные по SNР-гаплогруппам.
из лавины статей по изменчивости мтДНК в попу
ляциях, сошедшей в мировой науке в конце про
шлого — начале нынешнего века. В ней сейчас дан
ные по двум тысячам популяций мира — суммарно
132 тысячи образцов, для каждого из которых сек
венирован хотя бы ГВС1, а для многих — и полный
мт-геном. Это данные из пятисот публикаций по
населению всех континентов, а также наши (в том
ми: один определяет в популяции какую-то гаплог
числе еще неопубликованные) данные по народам
Северной Евразии.
Как и база по Y-хромосоме, МURКА отличает
руппу, а другой определяет не ее, а какую-то ее
часть. Конечно, все гаплогруппы Y-хромосомы
ся тщательным описанием популяций: не только
их название и объем выборки, но и принадлежность
Но собрать данные — этого еще мало. Ведь раз
ные авторы часто пользуются разными маркера
вложены одна в другую, точнее, вырастают одна
к стране и провинции, этническая и лингвистичес
из другой, как ветви на дереве. Но чтобы восполь
зоваться этим свойством, пришлось придумать и
реализовать в программной оболочке принцип ис
пользования данн
Download