811 Вестник ВОГиС, 2009, Том 13, № 4 МНОГОМЕРНЫЙ АНАЛИЗ ИЗМЕНЧИВОСТИ МОРФОЛОГИЧЕСКИХ, ХИМИЧЕСКИХ И ХОЗЯЙСТВЕННЫХ ПРИЗНАКОВ В РОДЕ АМАРАНТ (AMARANTHUS L.) В.М. Ефимов, Н.Б. Железнова, А.В. Железнов Учреждение Российской академии наук Институт цитологии и генетики Сибирского отделения РАН, Новосибирск, Россия, e-mail: [email protected] Исследованы 25 морфологических, химических и хозяйственных признаков у 80 образцов рода Амарант. С помощью многомерного анализа выявлены основные направления совокупной изменчивости, в том числе дискриминантное, характеризующее изменчивость между подродами. Его можно интерпретировать как противоположность между «зерновым» (урожайность зерна, красный оттенок зерна и метелки, масса 1000 семян, округлая, с бортиком, форма зерна, содержание белка в зерне, содержание сахара в листьях), и «кормовым» (зеленый оттенок зерна и метелки, содержание сухого вещества в листьях, облиственность, минимальный и максимальный вегетационный периоды, содержание лизина в зерне) направлениями. Следует отметить, что содержание сахара в листьях коррелирует с «зерновым» направлением, а содержание лизина в зерне – с «кормовым». Эта информация может быть полезна для селекционеров. Ключевые слова: амарант, изменчивость, многомерный анализ. Введение Материалы и методы Несмотря на то, что род Амарант в последнее время активно изучается с помощью молекулярно-генетических методов (Xu, Sun, 2001; Wassom, Tranel, 2005), его систематика все еще остается крайне запутанной и неясной. Неясными остаются также принципы разделения видов по направлениям их использования: зерновое, кормовое, овощное и декоративное. Вместе с тем этот вопрос является актуальным, так как в формировании растений того или иного направления использования принимают участие разные признаки. Отсюда стратегия селекции должна быть привязана к направлению использования будущих сортов. Цель настоящего исследования – с помощью многомерного анализа признаков у 80 образцов, принадлежащих к 14 видам амаранта, определить принципы разделения этих видов по направлениям их использования. Для исследования из коллекции Института цитологии и генетики СО РАН взяты 80 образцов рода Амарант, у которых анализировались следующие признаки: для зерна – форма, светлость и три оттенка окраски, масса 1000 семян, процентное содержание белка, лизина и жира; для метелки – форма, светлость и три оттенка окраски; химические признаки: процентное содержание сухого вещества, белка, лизина, сахара, аскорбиновой кислоты в сухом веществе (листья); хозяйственные признаки: урожайность зерна, минимальный и максимальный вегетационные периоды, облиственность, минимальная и максимальная высота растений. Форма зерна кодировалась двумя значениями: 0 – округлое, 1 – округлое с бортиком. Форма метелки также кодировалась двумя значениями: 1 – прямостоячая, 0 – все другие варианты. Цвет зерна и метелки описывался сначала визуально, а потом 812 каждому описанию ставились в соответствие три координаты по стандартной шкале RGB (красный, зеленый, синий). Например, цвету «коричневый» соответствуют координаты (165, 42, 42) и т. д. Сумма координат характеризует светлость (яркость) окраски, а отношение каждой цветовой координаты к их сумме – оттенок окраски. Отсутствующие значения, не более одного для каждого образца, заменялись их средними по данному признаку. Образцы с двумя и более пропусками в анализ не включались. Бинарные признаки обрабатывались вместе с количественными по формулам для количественных признаков. В большинстве учебников по статистике вопросы обработки качественных и количественных признаков излагаются раздельно. Алгоритмы и методы выглядят столь различно, что не возникает и мысли об их внутреннем единстве. На самом деле основные формулы, применяемые для анализа качественных признаков, прямо выводятся из соответствующих формул для количественных признаков. Пусть признак x у N объектов принимает только два значения: 0 и 1. Пусть число единиц равно k. Вычисляя среднее и дисперсию признака по формулам для количественных признаков (Васильева, 2000), получим: = p; s2 = pq, где p – частота признака, q = 1– p. Таким образом, и среднее, и дисперсия признака полностью выражаются через его частоту. Распределение p подчиняется биномиальному закону, который приближенно аппроксимируется нормальным распределением с параметрами p и pq/N. Приближение применимо при Npq ≥ 9 (Корн Г., Корн Т., 1970). Поэтому грубое сравнение двух средних для бинарных признаков можно проводить так же, как и для количественных признаков, с помощью обычного t-критерия. Для более точного сравнения необходимо, конечно, применять φ-преобразование Фишера (Плохинский, 1961). Пусть теперь значения двух признаков, x и y, у N объектов равны только 0 или 1. Вычислим корреляцию между признаками по формулам для количественных признаков: rxy = (ad – bc) / √(a + b)(c + d)(a + c)(b + d) , где a – число объектов со значениями 1 обоих Вестник ВОГиС, 2009, Том 13, № 4 признаков; b – число объектов со значениями 1 признака x и 0 – признака y; c – число объектов со значениями 0 признака x и 1 – признака y; d – число объектов со значениями 0 обоих признаков. Результат полностью совпадает с формулой коэффициента сопряженности φ Пирсона (Pearson, 1900) для бинарных признаков, который вычисляется по общеизвестной четырехпольной таблице (Плохинский, 1961). Рассмотрим теперь ситуацию, когда один из признаков, например y, является количественным и подчиняется нормальному распределению, а другой, x, может принимать только два значения: 0 и 1. Пусть число единиц в x равно N1, а число нулей – N0. Фактически выборка разбивается на две с числом объектов N1 и N0, N1 + N0 = N. Вычисляя корреляцию между признаками по формулам для количественных признаков, получим: rxy = ( y1 – y0 ) / , где y1 и s12 – среднее и дисперсия единичной выборки; y0 и s02 – среднее нулевой выборки. Отсюда В случае нормального распределения для двух количественных признаков при нулевой гипотезе ρ = 0 статистика справа имеет t-распределение с N–2 степенями свободы. Cтатистика слева есть t-критерий Стьюдента равенства средних для двух выборок объема N0 и N1 из одного и того же нормального распределения и также подчиняется t-распределению с N–2 степенями свободы (Большев, Смирнов, 1983). Отсюда следует, что в случае бинарного и количественного признаков вычисление коэффициента корреляции между ними и определение его достоверности можно проводить по формулам для двух количественных признаков. В этом случае критерий достоверности коэффициента корреляции совпадает с критерием Стьюдента равенства средних для двух выборок. Таким образом, вычисление среднего значения бинарного признака по формуле для Вестник ВОГиС, 2009, Том 13, № 4 количественного признака эквивалентно вычислению его частоты. Сравнение двух средних для бинарных признаков можно проводить так же, как и для количественных признаков, с помощью обычного t-критерия. Вычисление корреляции между количественным и бинарным признаками по формулам для количественных признаков эквивалентно сравнению средних по t-критерию Стьюдента. Вычисление корреляции между двумя бинарными признаками по формулам для количественных признаков эквивалентно вычислению коэффициента сопряженности φ Пирсона по четырехпольной таблице. Поэтому во всех случаях вычисления можно проводить по формулам для количественных признаков, пользуясь, например, стандартными статистическими пакетами. Все признаки центрировались и нормировались, после чего вычислялась матрица попарных евклидовых расстояний между образцами, которая обрабатывалась методом многомерного 813 шкалирования с размерностью 9, максимально допустимой в пакете Statistica6. В этом методе каждому объекту исходного множества ставится в соответствие точка в евклидовом пространстве малой размерности. Далее точки в этом пространстве передвигаются таким образом, чтобы матрица расстояний между ними как можно лучше соответствовала матрице различий между объектами исходного множества (Дэйвисон, 1988; Taguchi, Oono, 2005). На рис. 1 приведена диаграмма Шепарда, показывающая вполне удовлетворительное соответствие между исходными и вычисленными расстояниями по 9 осям многомерного шкалирования. Все образцы на основании их видовой принадлежности (Mosyakin, Kenneth, 1996) были отнесены либо к подроду Amaranthus, либо к подроду Albersia, либо к прочим. Далее к совокупности осей многомерного шкалирования был применен дискриминантный анализ, позволяющий найти направления с максимальными различиями Рис. 1. Соответствие между исходными попарными расстояниями между образцами и вычисленными по 9 осям многомерного шкалирования (диаграмма Шепарда). 814 Вестник ВОГиС, 2009, Том 13, № 4 между 3 классами, и вычислены коэффициенты корреляции между этими направлениями и исходными признаками (табл. 1). Различия достоверны (χ2 = 34,1; df = 18; p < 0,0123). На рис. 2 приведена конфигурация образцов на плоскости дискриминантных осей и на рис. 3 – проекции признаков на эту плоскость. Результаты и обсуждение Судя по рис. 3, все признаки, давшие достоверный вклад в первую дискриминантную ось, четко разбиваются на две группы. В первую группу входят урожайность зерна, красный оттенок зерна и метелки, масса 1000 семян, округлая, с бортиком, форма зерна, содержание белка в зерне, содержание сахара в листьях. Во вторую, направленную в противоположную сторону, входят зеленый оттенок зерна и метелки, содержание сухого вещества в листьях, облиственность, длина минимального и максимального вегетационного периода, содержание лизина в зерне. Эти два направления можно условно интерпретировать как «зерновое» и «кормовое». Вопрос о делении амарантов на кормовые и зерновые формы имеет свою историю. Сауэр (Sauer, 1955, 1957) на основе экогеографических, морфологических, этнографических и археологических работ из всего видового разно- Таблица 1 Коэффициенты корреляции морфологических, химических и хозяйственных признаков рода Амарант с дискриминантными осями выделены коэффициенты с p < 0,05 Признаки Округлое с бортиком (форма зерна) Светлость (зерно) Красный (зерно) Зеленый (зерно) Синий (зерно) Масса 1000 семян, г Содержание белка в зерне, % Содержание лизина, г/100г зерна Содержание жира в зерне, % Прямостоячая (метелка) Светлость (метелка) Красный (метелка) Зеленый (метелка) Синий (метелка) Содержание сухого вещества, % содержание белка в сухом веществе (листья), % Содержание лизина в сухом веществе (листья), г/100г Содержание сахара в сухом веществе (листья), % Содержание аскорбиновой кислоты в сухом веществе (листья), мг % Урожайность зерна, г/м2 Вегетационный период, дней (min) Вегетационный период, дней (max) Облиственность, % Высота растений (min), см Высота растений (max), см Ось_1 0,24 –0,15 0,30 –0,44 –0,08 0,31 0,30 –0,41 0,08 –0,01 0,08 0,29 –0,37 0,18 –0,39 0,09 –0,14 0,32 0,20 0,27 –0,63 –0,65 –0,43 0,09 0,00 Ось_2 –0,36 –0,31 –0,01 –0,08 0,10 –0,05 –0,17 0,05 –0,16 0,12 –0,01 –0,42 0,42 0,02 0,23 –0,70 –0,19 0,16 0,17 0,21 –0,27 –0,28 –0,05 –0,53 –0,49 Вестник ВОГиС, 2009, Том 13, № 4 Рис. 2. Конфигурация образцов на плоскости дискриминантных осей. Рис. 3. Корреляции признаков с дискриминантными осями. 815 816 образия рода Amaranthus L. выделил группу доместицированных видов: A. hypochondriacus L., A. caudatus L. и A. cruentus. Позже Пал и Козху (Pal, Khoshoo, 1973) подтвердили правильность такого выделения. Они показали, что доместицированные виды существенно отличаются от всех остальных видов по длине листовой пластинки, индексу урожайности, окраске семян, содержанию протеина в зерне и некоторым другим признакам. Стало понятным, что доместицированные виды – это те виды, которые возделывались древними инками и ацтеками более 5 тыс. лет тому назад. В дальнейшем «остальные» формы по направлениям использования были визуально разделены на овощные, кормовые и декоративные амаранты. Среди «остальных» выделена также группа сорных видов (Amaranth: …, 1984). Примечательно, что зерновые амаранты относятся к подроду Amaranthus, а большинство кормовых и овощных форм к подроду Albersia. Это разделение видов четко прослеживается на плоскости дискриминантных осей. На рис. 2 видно, что зерновые формы сосредоточены в правой части рисунка, в то время как кормовые и сорные виды сосредоточены преимущественно в центре рисунка с захождением в левую часть. Таким образом, проведенный нами многомерный анализ количественных и качественных признаков в целом подтверждает неоднородность рода Amaranthus, установленную блестящими исследованиями Saurs, Pal и Khoshoo, и заложенные ими принципы таксономии этого рода. Интересно отметить, что содержание сахара в листьях коррелирует с «зерновым» направлением, а содержание лизина в зерне – с «кормовым». Отсюда следует, что вряд ли возможен одновременный отбор на высокое содержание лизина в зерне и остальные зерновые признаки. Эта информация может быть полезна для селекционеров. Она подтверждается тем, что подрод Amaranthus, который наиболее интенсивно подвергается селекции, сдвинут в «зерновую» сторону (рис. 2). Можно предположить, что за этим стоят определенные генетические системы. Таким образом, анализ рис. 3 показал, что группа зерновых амарантов характеризуется определенным набором признаков, по которым она существенно отличается от многочислен- Вестник ВОГиС, 2009, Том 13, № 4 ных видов и форм, условно названных кормовыми. Это можно объяснить, если мы снова обратимся к истории доместикации зерновых амарантов. В течение длительной селекции отбор проводился на большой габитус растений, особенно большие соцветия, которые дают огромный урожай зерна без увеличения его размера. При этом имелось решительное предпочтение для белых семян, так как белые, желтые и кремовые семена имеют хорошие взрывные качества и вкус. Отбирая растения с хорошими вкусовыми качествами, древние «селекционеры» неосознанно отбирали растения с высоким содержанием протеина, углеводов и масляных компонентов, что балансировало пищу с более высокой калорийной ценностью. Следует подчеркнуть также, что селекция была направлена на развитие более коротких прицветников, что существенно облегчало обмолот растений, осуществляемый, в основном вручную (Pal, Khoshoo, 1973). Что касается красной окраски соцветий, то этому тоже имеется объяснение. Древние ацтеки использовали амарант не только как продовольственную, но и как ритуальную культуру. Собираясь в завоевательные походы, воины раскрашивали свои тела краской, извлеченной из соцветий амаранта, для устрашения своего противника и привыкания к красному цвету – цвету крови. Сейчас мы знаем, что красная окраска метелок определяется химическим соединением – амарантином. В последние годы установлено, что амарантин является биологически активным соединением, которое воздействует на фотосинтетические и биохимические реакции в хлоропластах и митохондриях, регулируя их на уровне клетки. Установлено также, что амарантин обладает сильными антиоксидантными свойствами, бактерицидным, антифунгицидным и общеукрепляющим действием на человека (Кононков и др., 2008). Не зная всего этого, древние ацтеки и инки, тем не менее, неосознанно отбирали растения с красноокрашенными соцветиями. Так, в результате тысячелетий сложился особый тип растений амаранта зернового направления, который мы смогли рассмотреть с помощью многомерного анализа. Рис. 3 показывает, что в первую компоненту дали вклады такие признаки, как урожайность зерна и содержание сахара в листьях, характер- 817 Вестник ВОГиС, 2009, Том 13, № 4 ные для зерновых амарантов. Очевидно, что сахара, являясь продуктами фотосинтеза, депонируются в листьях, а когда наступает время цветения, они транспортируются в соцветия и используются для налива зерна, превращаясь в крахмал (зерно амаранта содержит около 60 % крахмала). Совсем другой набор признаков имеют формы амаранта кормового направления. Для них характерны высокое содержание сухого вещества, сильная облиственность, черная окраска зерна и зеленая окраска метелки. Еще один признак кормовых амарантов – тесная сопряженность содержания лизина в листьях с облиственностью растений. По-видимому, у этих форм продукты фотосинтеза идут на образование новых листьев, в то время как у зерновых типов они в основном используются на формирование зерна. Следует подчеркнуть, что в эту группу включены в основном формы дикого типа, которых не затронуло рукотворное влияние человека. На основе проведенных исследований можно сделать следующие выводы. 1. Многомерный анализ позволил исследовать и визуализировать образцы амаранта по комплексу признаков, каждый из которых представлен в многомерном евклидовом пространстве отдельной координатной осью, ортогональной всем остальным. 2. Условное разделение амарантов на зерновые и кормовые формы полностью подтверждено результатами многомерного анализа 80 образцов, принадлежащих 14 видам. 3. Определен круг признаков, характеризующих как зерновую, так и кормовую группу амаранта. 4. Полученные данные могут быть использованы селекционерами для разработки стратегии селекции и моделей будущих сортов. Благодарности Работа поддержана грантами НШ-2447. 2008.4, РФФИ 07-04-00441-а и программой РАН «Молекулярная и клеточная биология» (проект № 10.7). Литература Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. М.: Наука, 1983. 416 с. Васильева Л.А. Биологическая статистика. Новосибирск: ИЦиГ СО РАН, 2000. 123 с. Дэйвисон М. Многомерное шкалирование. М.: Финансы и статистика, 1988. 254 с. Кононков П.Ф., Гинс М.С., Гинс В.К., Рахимов В.М. Технология выращивания и переработки листовой массы амаранта как сырья для пищевой промышленности. М.: Рос. ин-тут дружбы народов, 2008. 195 с. Корн Г., Корн Т. Справочник по математике для научных работников и инженеров. М.: Наука, 1970. 720 с. Плохинский Н.А. Биометрия. Новосибирск: Изд-во СО АН СССР, 1961. 364 с. Amaranth: Modern Prospects for an Ancient Crop / Ed. D.S. Washington. Nat. Acad. Press, 1984. P. 3–80. Mosyakin S.L., Kenneth R.R. New infrageneric taxa and combination in Amaranthus (Amaranthaceae) // Ann. Bot. Fennici. 1996. V. 33. P. 275–281. Pal M., Khoshoo T.N. Evolution and improvement of cultivated Amaranthus. VI. Cytogenetic relationships in grain tipes // Theor. Appl. Genet. 1973. V. 43. № 5. P. 242–251. Pearson K. On the criterion that a given system of deviations from the probable in the case of correlated system of variables is such that it can be reasonably supposed to have arisen from random sampling // Philos. Mag. 1900. V. 50. P. 157–175. Sauer J.D. Revision of Dioecious Amaranths. Madrono, 1955. 13. Р. 5–46. Sauer J.D. Recent migration and evolution of the dioecious amaranths // Evolution. 1957. № 11. Р. 11–31. Taguchi Y.H., Oono Y. Relational patterns of gene expression via non-metric multidimensional scaling analysis // Bioinformatics. 2005. V. 21. № 6. P. 730–740. Wassom J.J., Tranel P.J. Amplified fragment length polymorphism-based genetic relationships among weedy Amaranthus species // J. Hered. 2005. V. 96(4). Р. 410–416. Xu F., Sun M. Comparative analysis of phylogenetic relationships of grain amaranths and their wild relatives (Amaranthus; Amaranthaceae) using internal transcribed spacer, amplified fragment length polymorphism, and double-primer fluorescent intersimple sequence repeat markers // Mol. Phylogenet. Evol. 2001. V. 21. № 3. P. 372–387. 818 Вестник ВОГиС, 2009, Том 13, № 4 MULTIDIMENSIONAL ANALYSIS OF VARIATION OF MORPHOLOGICAL, CHEMICAL, AND ECONOMIC TRAITS IN THE AMARANTHUS L. GENUS V.M. Efimov, N.B. Zheleznova, A.V. Zheleznov Institute of Cytology and Genetics, SB RAS, Novosibirsk, Russia, e-mail: [email protected] Summary Twenty five morphological, chemical and economic traits were investigated among eighty amaranth accessions. The principal directions of the total variability in the genus were determined by multidimensional analysis. A discriminant direction, characterizing variability between subgenera was also determined. It can be interpreted as a contrast between the «grain» and «fodder» directions. It should be noted that sugar content in leaves correlates with the «grain» direction, but lysin content in grain, with the «fodder» direction. This result can be useful for plant breeders. Key words: amaranth, variability, multidimensional analysis.