Стационарный рост кончика корня растения - на главную

advertisement
СТАЦИОНАРНЫЙ РОСТ КОНЧИКА КОРНЯ РАСТЕНИЯ: ПОЛОСА ДВУКРАТНЫХ
РАЗЛИЧИЙ ДЛИН КЛЕТОК КАК ОСНОВА ДЛЯ ОПИСАНИЯ РОСТА
Васильев А.А.1,2,3, Иванов В.Б.1
Москва
1
Институт физиологии растений РАН им. К.А.Тимирязева
2
Московский физико-технический институт
3
Институт теоретической и экспериментальной физики
Введение
В кончике корня растущая часть состоит из двух зон: меристемы, где клетки делятся, и
зоны растяжения, на протяжении которой клетки за счет быстрого роста достигают
окончательной длины. В отличие от других органов растений зоны роста в корнях
пространственно разделены. Рост происходит преимущественно в одном направлении, т.е.
его можно описывать одномерными характеристиками. Длительное время после прорастания
корень растет с постоянной скоростью, и размеры зон роста не меняются во времени. Такой
рост называют стационарным. Благодаря четкости и относительной простоте строения,
резкому разделению зон роста и хорошей воспроизводимости получаемых результатов,
корни проростков на этапе стационарного роста представляют собой очень удобный объект
для экспериментального изучения роста и деления клеток.
При стационарном росте связь основных количественных характеристик роста дает
уравнение непрерывности [14, 4, 8]
D = d(vc)/dL,
(1)
где L – расстояние до кончика корня, D = D(L) – это скорость образования клеток
(производства новых поперечных перегородок) на единицу длины L в единицу времени, v =
v(L) = dL/dt – скорость удаления клетки от кончика корня, с = c(L) = 1/l –концентрация
клеток в единице длины L, l = l(L) – длина клеток.
Формула (1) выражает тот факт, что изменение числа перегородок в элементе ΔL при
делениях клеток со скоростью D определено балансом поступления клеток со скоростью v(L)
в концентрации c(L) и их ухода со скоростью v(L+ΔL) в концентрации c(L+ΔL).
Интегрируя уравнение (1), получим
L
L
∫ D( L)dL = vc |
0
0
= v(L)c(L),
(2)
принимая, что координата L отсчитывается от кончика корня (или границы с покоящимся
центром), где скорость v = v(0) = 0 (как обычно принимают для определенности).
Отсюда
L
v(L) = l(L) ∫ D( L)dL
(3)
0
и
L
k(L) = v'(L) = l'(L) ∫ D( L)dL + l(L) D(L),
(4)
0
где k = dv/dL – относительная скорость роста (определяемая как прирост корня на малом
участке dL).
Определение относительной скорости роста k(L)через зависимость l(L)
L
При достаточно больших L после прекращения делений D(L) = 0, а интеграл
∫ D( L)dL
0
не изменяется с дальнейшим ростом L (т.е. это некоторая фиксированная величина). Таким
1
образом, зная точно зависимость l(L) и дифференцируя ее, можно вычислить относительную
скорость роста k(L) с точностью до коэффициента пропорциональности (в области, где D(L)
= 0). Такой простой подход можно непосредственно применить для установления
относительной скорости роста почти во всей зоне роста [15], поскольку есть проводящие
ткани (метаксилема и/или протофлоэма), где деления заканчиваются очень рано в сравнении
с другими тканями.
Отметим, что такое вычисление в принципе можно было бы провести по данным для
всего лишь одного (любого) ряда, т.к. зависимость k(L) не может отличаться у различных
рядов клеток одного корня, поскольку ряды на всем протяжении связаны клеточной стенкой
(рост происходит симпластно) [4, с. 11].
Препятствие для реализации такого подхода возникает в связи с тем, что результаты
измерений имеют вид, подобный представленному на рисунке 1 в виде набора точек –
последовательности значений длин клеток li(L) (индекс i пробегает все клетки ряда, что в
дальнейшем отдельно не оговаривается). Иными словами, зависимость l(L), затем ее
производную l'(L), нужно установить по исходным данным, неизбежно имеющим большой
разброс.
Неизбежность большого разброса следует в силу того, что перед делением и после него
размер клетки отличается двукратно (или даже значительно более при асимметричных
делениях), а затем различие в размерах соседних клеток не может измениться в силу
симпластности роста [4], что означает пропорциональный рост смежных клеток в соседних
рядах (имеющих жесткую общую клеточную перегородку). Пропорциональный рост
фиксирует и относительные различия размеров соседних клеток одного ряда за пределами
зоны деления. Клетки, которые вступили в зону растяжения, имея относительно больший
размер, останутся клетками большего размера до окончания растяжения и наоборот.
Следовательно, относительное различие размеров, которое было в области деления, будет
сохраняться и после окончания делений.
Исходные данные в виде последовательностей длин клеток принято интерпретировать
непосредственно как зависимость l(L), определяемую с большим статистическим разбросом.
Далее мы хотим показать, что такие интерпретации не дают точного описания, а напротив,
приводят к утрате информации, которая является критической при установлении
зависимости l(L) (для уменьшения видимого разброса последовательности объединяют,
усредняют и сглаживают – см., например, [10]).
1. Определение понятия «полоса двукратных различий»
Традиционным интерпретациям есть альтернатива, свободная от их недостатков, и
соответствующая интерпретация представлена на рисунке 1 в виде огибающих пар кривых –
верхней и нижней (соответственно lm(L) и ld(L), см. ниже), после определения положения
которых можно рассчитать саму зависимость l(L). Суть предлагаемой интерпретации в том,
чтобы зафиксировать тот двукратный разброс длин клеток, который возникает из-за их
делений и не зависит от любой конкретной последовательности li(L).
Зависимость lm(L) как кривая с относительно малым разбросом
Если исходные данные в виде последовательностей длин клеток li(L) интерпретировать
непосредственно как зависимость l(L), то большой разброс делает невозможным
практическое использование подхода к вычислению относительной скорости роста в силу
неточности расчета значений функции l(L), тем более ее производной l’(L).
Увеличения точности при нахождении зависимости l(L) можно достичь за счет
определения вспомогательных кривых, которым отвечает значительно меньший разброс.
2
Как показывают данные для зоны деления, разброс длин клеток в момент деления
гораздо меньше, чем разброс значений последовательности li(L), составляя для отдельного
ряда 10% и даже менее [3]). После окончания деления соотношение длин клеток не
изменяется и разброс длин клеток, которые были близки к максимальному значению,
предшествующему делению, также не изменяется. Это означает, что кривой длин клеток
максимальных размеров при данном (любом) L (кривой lm(L)) отвечает разброс, который
относительно мал (по сравнению с разбросом значений для последовательности li(L)).
Очевидно (и это подтверждают данные на рисунках), кривой lm(L) принадлежит
относительно небольшая доля всех клеток. На первый взгляд, может казаться, что
интерпретация с использованием такой кривой мало что дает практически, учитывая, что
немногочисленные точки, которые принадлежат или близки к этой кривой, еще нужно
идентифицировать, выделяя среди многих других (что более сложно сделать в зоне
растяжения, где происходит значительное изменение длин клеток, а общее число значений
длин мало).
Но есть целый ряд важных возможностей, которые позволяют реально использовать
кривую lm(L) при переходе к зависимости l(L).
Полоса двукратных различий как область между кривыми ld(L) и lm(L)
Прежде всего, установление положения кривой lm(L) облегчает ее связь с аналогичной
кривой для клеток минимальных длин. Из одной делящейся клетки получается пара клеток,
разделяющих между собой ее длину.
Для полусуммы длин пары (т.е. средней длины образовавшихся клеток), определяемой
в качестве кривой ld(L) имеем ld(L) = lm(L)/2.
Такая связь формально удваивает (или утраивает, если клетки в парах на нижней
границе учитывать раздельно, как допустимо делать при приближенно симметричном
делении) число значений длин клеток, которые (после их идентификации в качестве
принадлежащих граничным кривым) прямо указывают на положение связанных между
собой граничных кривых ld(L) и lm(L).
Другие значения длин клеток, как правило, располагаются между кривыми ld(L) и lm(L),
т.е. в пределах полосы между ними, которую естественно назвать «полосой двукратных
различий» учитывая, что граничные кривые по определению отличаются двукратно.
За пределы полосы выше lm(L) выходят клетки из-за разброса длин при делении, а
ниже ld(L) – по той же причине, а также меньшие по размеру клетки в парах после деления
(сохраняющих относительно меньшую длину и при последующем растяжении). Асимметрия
деления увеличивает число последних и величину отклонения их длины от нижней границы
полосы.
Что получается при таком представлении данных, видно из рисунка 1. На рисунке
объединены данные нескольких рядов (как видно, их характеристики достаточно близки,
чтобы совокупность многих точек можно было описать общей полосой двукратных
различий). Для сравнения на рисунке 2 можно видеть две отдельно показанные
последовательности li(L) одного корня, которые совпадают по характеристикам в зоне
деления.
В зоне деления пары поделившихся клеток можно установить независимо (по рисунку
клеточных оболочек). Анализ значений длин в парах дает характерное значение асимметрии
(как среднего отношения длины клетки с меньшим значением L к длине клетки с большим
значением L) и разброс асимметрии как среднеквадратичное отклонение (СКО) отношения
длин в паре по всем парам клеток. В силу пропорциональности роста эти величины
описывают соответствующие составляющие разброса длин при всех возможных L.
3
Если пары удается выделить (независимо по данным в зоне деления и/или путем
реконструкции родственных отношений) и характеризовать одним средним значением, то
разброс длин на нижней границе в относительном выражении (δld/ld) не отличается от
разброса на верхней границе (δlm/lm). Для уменьшенного вдвое значения на нижней границе
отклонение в 2 раза меньше (считая, что разброс при делении в большую и меньшую сторону
не отличается), но само значение ld в 2 раза меньше, чем lm. Поэтому δld/ld = δlm/lm.
Критерий выбора при сравнении между вариантами интерполяции полосой
Выход длин клеток за пределы полосы двукратных различий позволяет использовать
сумму квадратов отклонений точек, выходящих за пределы полосы (для значений, которые
больше lm(L) или меньше ld(L)), для количественного выражения качества описания полосой.
Такой критерий необходим при выборе между различными сравниваемыми вариантами
расположения полосы и аналогичен критерию при интерполяции с использованием обычных
функций, переходя в него (совпадая с ним), если сближать границы полосы до полного их
совпадения (тогда это полоса 1-кратных различий).
По аналогии со среднеквадратичным отклонением обычной функции (полосы 1кратных различий) полосу любой ширины характеризует сумма квадратов S = S1 + S2, где S1
= Σ(li(L) – lm(L))2 для li(L) > lm(L), а S2 = Σ(ld(L) – li(L))2 для li(L) < ld(L) (или в относительном
выражении соответственно S1 = Σ(li(L)/lm(L) – 1)2 и S2 = Σ(1 – li(L)/ld(L))2).
Минимизация величины S при выборе варианта интерполяции полосой очевидно
аналогична выбору варианта интерполяции на основе минимизации СКО для обычной
функции.
Определение зависимости l(L)
Интерпретацию полосой можно рассматривать как усреднение с промежуточным
этапом фиксации неизбежно (объективно) существующего разброса, который не зависит от
исходных данных.
По сути, фиксированный разброс в форме граничных кривых является некоторым
расширением (окаймлением) зависимости l(L), которое повторяет ее форму и в этом смысле
подобен ей. Зависимость l(L) – это линия, на которой в среднем должны находиться значения
длин клеток.
При равномерном распределении длин клеток (в пределах полосы) кривая l(L) должна
была бы быть определена как центральная линия lc(L) = [lm(L) + ld(L)]/2. Однако,
распределение клеток при симпластном росте (когда клетки растут экспоненциально [4, с.
34]) отличается от равномерного. Это экспоненциальное распределение, при котором клеток
меньшего размера больше, чем крупных. Тогда кривая l(L) оказывается несколько ниже
центральной линии, т.е.
l(L) = b [lm(L) + ld(L)]/2,
(5)
где b < 1.
Известное положение кривой lm(L) или кривой ld(L) = lm(L)/2 делает возможным
точный расчет положения кривой l(L) относительно границ полосы. А именно, l(L) = r ld(L) =
r/2 lm(L), где r = 3/2 b – это среднее отношение li(L)/ld(L), определяемое как эмпирическое
значение. Коэффициент пропорциональности b можно рассчитать также теоретически. При
пропорциональном росте и обычных характеристиках разброса (для тканей, где асимметрия
невелика) b = 2/3 r = 0,85–0,9.
Расчет коэффициента b (или r) не требуется, если последовательность li(L)
использовать для расчета производной l’(L) как величины, которая пропорциональна
относительной скорости роста k. При использовании формулы (4) за пределами зоны
деления (где второе слагаемое в формуле обращается в нуль) величины k и l’ отличаются на
множитель в форме интеграла, значение которого не определяемо из измерений длин клеток.
4
Это означает потребность в зависимости l(L) лишь с точностью до произвольного
коэффициента пропорциональности.
Зависимости l(L), lm(L) и ld(L) подобны по своему определению, поэтому задача
определения относительной скорости роста k с точностью до коэффициента
пропорциональности решена сразу же после того, как найдены граничные зависимости lm(L)
и ld(L).
Иными словами, уже на промежуточном этапе установления lm(L) и ld(L),
предшествующем переходу к зависимости l(L), получена вся информация, которая требуется
для практического использования формулы (4).
2. Выражение типовых свойств зависимости l(L) при интерполяции
Типовые свойства зависимости l(L)
Предлагаемая интерпретация полосой двукратных различий (так же, как и
непосредственная интерпретация наборов li(L) зависимостью l(L)) требует определения
общих свойств зависимости l(L). В противном случае, если считать, что свойства
зависимости l(L) не определены (абсолютно произвольны) и должны быть установлены,
основываясь исключительно на последовательности значений li(L), при установлении
положения граничных кривых возникает существенная неоднозначность. При расчете
требуемого значения производной l'(L) неприемлемо, например, наложение высокочастотной
составляющей (периодической или случайной, т.е. шума) с малой амплитудой на медленно
изменяющуюся составляющую зависимости l'(L). Уже только одно наличие такой
составляющей (если ее характер не установлен, а это, очевидно, невозможно сделать по
данным отдельного набора) означает почти произвольный результат интерпретации для
производной l'(L).
Общие (типовые) свойства зависимостей l(L) следуют из физиологии роста и уже
известных данных (с учетом возможных эффектов при их традиционной обработке –
усреднении, сглаживании, объединении). Усредненные зависимости показывают, что: 1)
значение l почти не изменяется в зоне деления, 2) затем возрастает и 3) выходит на
максимальное значение. Последнее свойство обусловлено окончанием роста. Второе
свойство столь же очевидно, поскольку растяжение – это по определению увеличение
размера клеток. Первое свойство соответствует наиболее естественной реализации
механизма делений, когда клетки достигают заданного размера и затем делятся. Его
подтверждают проведение полосы двукратных различий (в частности, см. рисунки 1 и 2) в
зоне делений (где число точек измерений достаточно велико, чтобы практически исключить
какую-либо другую интерпретацию) и прямые экспериментальные наблюдения – измерения
длин делящихся или только что поделившихся клеток [5, 2].
Значительно увеличивают однозначность интерпретации данных уже перечисленные
свойства зависимости l(L) при их простейшем выражении через определение знаков двух
первых производных [1, с. 20, 31]. Для первой производной – это не убывание (с ростом L)
во всей области роста, исключая начало зоны деления (где данные часто можно
интерпретировать как слабо выраженное убывание). Для второй производной – это одно
изменение знака (происходящее в зоне растяжения) с положительного (точнее, не убывания)
на отрицательный (не возрастание). Определение более высоких производных (даже с
точностью до знаков) не имеет смысла, т.к. при обычной для биологических измерений
воспроизводимости экспериментальные данные практически не позволяют проверить
сделанные по отношению к ним утверждения [1, с. 18–19].
5
Выражение типовых свойств при интерполяцией полосой
На рисунке 1 граничные зависимости представлены набором принадлежащих им пар
точек (значение на кривой lm(L) и соответствующее ему двукратно уменьшенное значение на
кривой ld(L); символы «•»).
Показанная на рисунке интерполяция полосой двукратных различий выражает
сформулированные типовые свойства следующим образом. Не убывание первой
производной (с ростом L) означает, что каждая следующая точка, принадлежащая граничной
зависимости (для определенности будем говорить о зависимости lm(L)), должна быть не
ниже предыдущей. До точки изменения знака второй производной, пока вторая производная
не отрицательна (т.е. зависимость l(L) выпукла вниз, точнее, не выпукла вверх), каждая
промежуточная точка должна быть не выше отрезка, соединяющего две соседние с ней
точки. И наоборот после точки изменения знака промежуточные точки должны быть не ниже
такого отрезка.
Практически при интерполяции точками поиск места изменения знака второй
производной не требуется, т.к. в области изменения ее знака два или несколько отрезков,
соединяющих точки, почти не отличаются по наклону.
Число
точек
выбрано
как
заведомо
избыточное
в
соответствии
с
невоспроизводимостью (которая, как предполагается, составляет не менее 2-3%, исходя из
того, что разброс длин клеток при делении не меньше этой величины). При такой
невоспроизводимости экспериментов для эквивалентного описания кривой на одну область,
где не меняется знак первых двух производных, достаточно 5 промежуточных точек [1, с.
23], расположенных рационально (т.е. с большей плотностью в области, где изменение
функции сильнее выражено), но достаточно свободно. Абсцисса выбрана произвольно, а
значение по ординате определялось (при выполнении типовых свойств) так, чтобы
минимизировать число точек за пределами полосы двукратных различий, тем самым
уменьшая сумму квадратичных отклонений длин за пределы полосы (S).
Как видно, для представленного варианта интерполяции полосой удается достичь,
чтобы лишь небольшая часть точек оказалась за пределами полосы, а их отклонения
очевидно значительно меньше, чем ширина полосы.
Изменения положения полосы при манипуляции в таком представлении сильно
ограничены, как можно проверить, анализируя данные на рисунке 1 или моделируя похожий
набор исходных данных. А именно, положение каждой точки при заданном положении
других практически однозначно определено (фиксировано), т.к. даже при малом изменении
значения произойдет нарушение типовых свойств (иными словами, ошибка отдельного
значения в таком представлении практически равны нулю). Если же несколько сдвинуть
группу точек или кривую как целое (при выполнении типовых свойств), то уже небольшой
сдвиг заметно увеличивает число точек за пределами полосы и сумму квадратичных
отклонений S.
В результате варианты с близким качеством описания (в указанном смысле) по
сравнению с вариантом, представленным на рисунке, мало отличаются от него и поэтому не
показаны, чтобы не загромождать рисунок.
Интерполяция через набор точек как эквивалентная
Представление граничных точками выбрано как способ, позволяющий адекватно и
простейшим способом (контроль типовых свойств с помощью неравенств для соседних
значений в ясной графической интерпретации) выразить сформулированные типовые
свойства.
Отметим, что в соответствии с общим обоснованием [1, с. 16–23] при не полностью
воспроизводимых измерениях (что справедливо по отношению к биологическим
6
измерениям) любую кривую можно эквивалентно представить набором принадлежащих ей
точек.
В этом смысле представление точками можно использовать как информационно
эквивалентное любой представляемой кривой (зависимости). Различные зависимости (в том
числе, как различные математические выражения) не различаются между собой (в т.ч. и от
интерполяции точками) в пределах наблюдаемого разброса. Число точек в представляемой
зависимости (при заданных типовых свойствах) следует из наблюдаемого (минимального)
разброса [1, с. 20–23].
Заданные типовые свойства (и заданный разброс) позволяют осуществить процедуру
фиксации свободных параметров при интерполяции любого типа (в т.ч. если использована
полоса двукратных различий) подобно фиксации свободных параметров в зависимости
заданного вида, как это делают при традиционной интерпретации.
В данном случае такими являются значения по ординате в точках с заданной абсциссой.
При такой интерполяции (с большим числом промежуточных точек, как для
рассматриваемого варианта интерполяции на рисунке 1) значения в промежуточных точках
выступают как связанные подгоночные параметры (см. выше обсуждение возможности
сдвига отдельных точек и групп точек).
В силу такой связи увеличение числа промежуточных точек (по сравнению с числом,
необходимым для эквивалентного описания) не изменяет качество описания. При большем
числе точек та же информация (которая эквивалентна выбору между различимыми
вариантами описания которую можно оценить, как указано в [1, с. 19–22, 30–33])
распределяется между большим число параметров.
Обсуждаемое представление зависимостей через набор точек можно рассматривать как
универсальное обобщение при интерполяции зависимости, определяемой с разбросом. Из-за
наличия разброса допустимы различные представления (в пределах разброса), поэтому в
любом представлении (в частности, при интерполяции точками) нужно сравнивать
допустимые варианты интерполяции в пределах разброса и проверять инвариантность
получаемых выводов относительно допустимых вариантов.
В данном случае важны контрастные варианты по значению производной (а не самому
значению длины), т.к. именно она нужна для расчета относительной скорости роста.
Связь типовых свойств с механизмом роста
Типовые свойства зависимости l(L) определяет механизм роста.
В первом приближении естественно принять, что рост происходит однородно [6, 1999],
т.е. относительная скорость роста не изменяется (постоянна) на каждом из двух этапов –
делении и растяжении. Обозначим для определенности относительную скорость роста в
режиме деления как k1, а при растяжении – как k2. Тогда зависимость l(L) должна иметь
некоторый весьма характерный вид. Это ломаная линия из трех или четырех отрезков.
Соответствующая интерпретация приведена на рисунках.
До тех пор, пока в меристеме происходят деления клеток (при достижении заданного
значения длины материнской клетки lm0, которое практически не изменяется в меристеме –
см. обсуждение выше), значение l(L) не изменяется, т.е. зависимость l(L) идет
горизонтально. Если во всех рядах деления прекращаются при одном и том же значении L =
Lm, то горизонтальный участок сразу переходит в отрезок прямой, для которой (в
Lm
соответствии с формулой (4)) производная l'(L) = a k2, где a = 1/ ∫ D( L)dL .
0
7
Для некоторых рядов (прежде всего, в проводящих тканях) деления клеток
прекращаются раньше, чем в других рядах. Последние гораздо более многочисленны,
поэтому скорость роста определяется рядами, не перешедшими к растяжению.
Тогда зависимость l(L) на участке от окончания деления в этом ряду до начала
растяжения в других тканях – это еще один отрезок прямой с наклоном a k1. Пользуясь
уравнениями (1)–(4), можно вычислить также, что lm0/Lm = a k1 (где lm0 и Lm – это
соответственно длина материнских клеток в меристеме для этого ряда и протяженность
области, в которой происходят деления).
Таким образом, по отношению наклона зависимости l(L) в зоне растяжения и
характеристике lm0/Lm в меристеме можно рассчитать отношение k1/k2.
Рисунок 1 показывает, что обсуждаемая интерполяция ломаной (которая не
противоречит физиологии роста и данным обобщенных зависимостей с учетом возможного
эффекта усреднения) практически не отличается от интерполяции точками (т.е. для варианта
интерпретации со значительно большим числом свободных параметров) по числу значений
длин за пределами полосы и соответственно не увеличивает сумму квадратов отклонений.
Интерполяция ломаной (когда производная меняется скачком) демонстрирует, в
частности, что выбор точки изменения знака второй производной мало влияет на качество
интерполяции. Иными словами, в области растяжения зависимость l(L) близка к прямой (т.е.
диапазон, где вторая производная близка к нулю, достаточно широк), что можно
рассматривать как возможное дополнение (уточнение) набора типовых свойств.
Полезность приближения однородного роста, в частности, ясна, если учитывать
наличие существенной проблемы, которая не позволяет получать такие последовательности
значений длин клеток (на всем протяжении растущей части кончика корня от меристемы до
окончания роста), как на рисунке 1. Для достаточно полных последовательностей
интерполяция точками весьма удобна, и положение полосы двукратных различий можно
определить с высокой точностью, учитывая, что в меристеме и зоне окончания роста
зависимость l(L) идет горизонтально. Тогда даже малое число точек, принадлежащих
граничным кривым в области растяжения, практически однозначно (с учетом типовых
свойств) фиксирует положение полосы в зоне растяжения и переходах между зонами. Но
такие полные последовательности трудно получить в экспериментах (по крайней мере, до
сих пор они не были получены), даже объединение нескольких рядов на рисунке 1 – это
редкие данные.
Если последовательности неполные, как, например, на рисунке 2, то для изучения роста
можно предложить подход на основе интерпретации в приближении однородного роста.
Интерпретация полосой двукратных различий по данным отдельного ряда (прежде всего, по
данным для проводящих тканей, где зависимость при полном наборе исходных данных
включает 4 линейных участка) позволяет сформулировать приближенное гипотетическое
утверждение о виде общей для всех рядов зависимости k(L), а затем уточнить это
предположение по данным всей совокупности рядов этого же корня.
Обсуждение
Полоса двукратных различий как способ представления данных
При прямом переходе от исходных данных (измерений длин клеток в форме
последовательности li(L)) к зависимости l(L) нет той однозначности и устойчивости
интерпретации, как при интерполяции тех же данных полосой двукратных различий. Гораздо
большая однозначность и устойчивость интерпретации, при интерполяции полосой, по сути,
достигается за счет использования дополнительной информации (в форме фиксации 2кратного разброса) и явного (тем самым контролируемого) выражения типовых свойств
граничных зависимостей.
8
Устойчивость процедуры определения граничных зависимостей lm(L) и ld(L)
иллюстрирует простейший пример. Пусть получены две последовательности li(L), которые
различаются лишь тем, что одна отвечает случаю, когда деление одной материнской клетки
еще не произошло, а в другом случае из той же материнской клетки образовались две
дочерних. Аналогичного рода различие легко представить себе не только в зоне деления, но
и в зоне растяжения, когда вместо точки на максимальной кривой lm(L) имеем две точки,
близкие к минимальной кривой ld(L).
Такое случайное событие не связано с изменением относительной скорости роста, т.к.
наличие перегородок между клетками непосредственно не влияет на скорость роста. При
пропорциональном росте две клетки половинной длины дают тот же прирост, что и одна
клетка единичной длины (в частности, после выхода в зону растяжения, где D=0, а значит, в
силу (4) зависимости k(L) и l’(L) должны быть пропорциональны). Поэтому случайное
событие такого рода не должно приводить к изменению зависимости l(L), получаемой по
исходным данным.
Описание граничными кривыми (в соответствии с предлагаемым подходом) в
сравниваемых двух случаях совсем не отличается (если набор значений в исходной
последовательности достаточен, чтобы определить положение полосы, об этом – см. далее).
В том же примере зависимость l(L), получаемая при традиционной интерпретации
набора значений в последовательности li(L) (если набор li(L) рассматривать непосредственно
как значения функции l(L), определенной с ошибкой), заметно различается в двух
описываемых случаях, не говоря уже о ее производной l’(L). Это сочетается с
систематическим искажением исходной информации в зависимости от способа
интерполяции (см. обсуждение ниже).
Интерполяция данных полосой двукратных различий не восприимчива и к более
сильно выраженному случайному фактору, который является нормальным для получаемых
данных и создает практически неразрешимую проблему при традиционной интерпретации.
Таким случайным событием является одновременный переход нескольких клеток (а не
одной, как в уже рассмотренном примере) с одной границы на другую. Для соседних клеток,
которые образовались из одной общей клетки, такой согласованный переход следует из того,
что после деления общей последующие деления произойдут в близкие времена (т.е.
приблизительно синхронно). Другой вариант выражения эффекта синхронизации – это
фиксация относительного положения длин клеток группы в пределах полосы как
систематическое наложения некоторого профиля относительного соотношения длин,
который сохраняется в группе из-за пропорционального роста. Ясно, что такой профиль не
имеет отношения к зависимости l(L), но при усреднении неизбежно будет проявлять себя как
существенная случайная аномалия.
Иными словами, из-за синхронизации деления клеток отдельные значения длин не
являются независимыми случайными величинами, а это означает низкую эффективность
любых процедур усреднения, основанных на предположении о статистической
независимости отдельных измеряемых значений.
Наличие и смещение в пределах полосы двукратных различий синхронизованного
профиля относительного соотношения длин (в том числе, в крайнем варианте перехода
значительного числа точек с одной границы на другую) в широких пределах не влияет на
определение положения граничных кривых. Пока остается достаточное число точек на
границах, типовые свойства однозначно фиксируют вариант описания (насколько это
возможно при наблюдаемом разбросе на верхней и нижней границе для данной ткани). При
этом даже значительное смещение большой группы клеток в пределах полосы не влияет на
выбор граничных зависимостей.
Отметим, что фиксация за счет большого числа значений на границах также может
быть следствием синхронизации, из-за которой ряд соседних клеток оказывается в
9
состоянии, отвечающем близости верхней и нижней границам. Такой ряд можно назвать
«пилообразным» профилем, т.к. соединенные значения выглядят как зубья пилы.
Напротив, последовательность с малым числом значений длин вблизи граничных
кривых не позволяет надежно фиксировать положение полосы двукратных различий. Такой
ряд можно назвать, напротив, «гладким» профилем.
Невозможность фиксации границ для «гладкого» профиля выявляет неполноту
данных. В этом случае интерполяция полосой двукратных различий не только эффективный
индикатор неполноты, но дает также способ выбрать лучший способ интерполяции таких
данных (если по каким-то причинам ими все-таки необходимо воспользоваться).
В простейшем случае ожидания равномерного распределения клеток внутри полосы
(или как первое приближение в других случаях) критерий качества при сравнении вариантов
интерполяции полосой дает «квадратичное отклонение внутрь полосы» – сумма Sin = S3 + S4,
где S3 = Σ(li(L) – lm(L))2, S4 = Σ(ld(L) – li(L))2 и обе суммы определяются для всех li(L). (С
учетом того, что двукратный разброс не является малым, более точно ожидание
равномерного распределения будет выражать аналогичное относительное выражение, т.е. S3
= Σ(li(L)/lm(L) – 1)2 и S4 = Σ(1 – li(L)/ld(L))2). Для неравномерного распределения требуется
дополнительная корректировка как вычисление весовых множителей для сумм S3 и S4 (или
для слагаемых в суммах в зависимости от значений слагаемых), определяемое ожидаемым
распределением значений длин.
Преимущество такого подхода в сравнении с обычной минимизацией СКО для кривой
следует в силу того, что остается фиксированным двукратный разброс и свойства
распределения клеток по размерам. Таким образом, с математической точки зрения развитие
излагаемого здесь подхода в ситуациях, когда разброс задан (а это характерная ситуация при
биологических измерениях [1, 2002, с. 15]), – это использование интерполяции полосой в
общем случае. В частности, и для рассматриваемой задачи на следующем шаге важно общее
решение при вычислении различных весовых коэффициентов для сумм Sin и S, возможности
использовать их комбинации и т.д.
В любом случае при переходе от последовательности li(L) к полосе двукратных
различий информация формально даже возрастает по сравнению с информацией для
последовательности (т.к. вносится дополнительная информация о механизме деления и
характерном разбросе).
А именно, к каждому значению длины добавляется характеристика относительной
длины, т.к. кривые lm(L) и ld(L) позволяют характеризовать относительный размер любой
клетки. Такое описание в зоне деления позволяет судить о состоянии клетки по отношению к
клеточному циклу, а в зоне растяжения дает информацию о том состоянии, в котором была
клетка при переходе к растяжению.
Использование полосы двукратных различий при изучении роста
Перспектива использования зависимости l(L) (как некоторой усредненной кривой,
определяемой в связи с вычислениями относительной скорости роста) потенциально гораздо
менее значима, чем адекватное выражение реальной информативности исходных измерений
длин клеток.
Любое усреднение – это неизбежная потеря информации. Альтернативой усреднению
является переход к более информативному представлению исходных данных (эквивалентно
представляющую последовательность li(L) вместе с дополнительной информацией о
механизме роста с последующим и/или параллельным дополнением этой информации)
Возможна трактовка стационарного роста (она не противоречит известным данным),
при которой рост (в каждом ряду) определяет непосредственно зависимость lm(L). А именно,
можно считать, что в зоне деления, клетки делятся, дорастают до значения lm(L). После
перехода к растяжению изменение длин (и в частности, значение lm(L)) для клеток каждого
10
ряда определяет относительная скорость роста k(L), общая для всех рядов в силу
симпластности роста.
Тогда набор значений в последовательности определяет исходный размер клетки,
генерирующий ряд при переходе из покоящегося центра (ПЦ), и случайные факторы –
разброс длин делящихся клеток и разброс размеров при делении. Последние можно
установить по данным в зоне деления (что уже обсуждалось). В результате ряд в принципе
может быть генерирован обратной реконструкцией родственных отношений – перебором от
двух параметров (исходная длина и момент времени перехода из ПЦ) с корректировкой по
значениям длин последовательности.
Существенно, что при такой трактовке зависимости lm(L) множества рядов одного
корня (каждую из которых можно установить гораздо более однозначно, чем зависимость
l(L) при традиционном подходе) могут быть использованы для расчета единственной
неизвестной зависимости – общей для всех рядов относительной скорости роста k(L). Иными
словами, при такой трактовке непосредственно необходима для расчетов только зависимость
lm(L) (процедура определения положения полосы дает эту зависимость), а зависимости l(L) и
D(L) совсем не используются.
Однозначная фиксация положения полосы двукратных различий позволяет
анализировать распределения длин клеток по размерам. Экспериментальное изучение
распределений, прежде всего, в связи с представлением полосой двукратных различий
(например, определение коэффициента b как среднего по большому набору данных), важно,
в частности, для подтверждения о пропорциональном росте как основы количественного
описания роста..
С другой стороны, важно определение альтернатив роста, которые бы можно было
различить через свойства наблюдаемых распределений, и теоретическое предсказание
свойств распределений для их экспериментальной проверки (подтверждения).
Например, исходные данные, представленные на рисунке 1 демонстрируют более
широкое распределение значений длин в области деления (в крайних случаях значения длин
различаются 4-кратно) по сравнению с окончившими рост клетками, где различие не
выходит за пределы полосы двукратных различий.
Для объяснения можно предположить, что в зоне перехода от деления к растяжению
действует механизм выравнивания длин (как прекращение деления в одних рядах по
сравнению с другими; как регуляция длины делящихся клеток через объем; как изменение
асимметрии деления и т.д.). Интерполяция полосой позволяет выявить изменение ширины
полосы и установить распределение значений по ширине полосы.
Самосогласованная задача уточнения типовых свойств
Случайные изменения в последовательности li(L), обсуждаемые выше (переход
значения длины с верхней кривой на нижнюю; фиксация относительных значений длин в
синхронизованных агрегатах клеток), являются общей проблемой при интерпретации
данных.
Для расчета значения функции l(L) и ее производной можно использовать только
данные в локальной области (к которой они собственно и относятся, но где число точек N
относительно мало). Тогда переход лишь одного значения в последовательности li(L) с
верхней кривой на нижнюю означает изменение значения l(L) на величину Δl = lm/N.
Значение производной при расчете по локальным данным при таком переходе может
измениться даже по знаку (легко представить получаемый результат, анализируя данные на
рисунках, особенно применительно к зоне растяжения). Для последующего расчета
относительной скорости роста такое большое изменение очевидно неприемлемо.
Поэтому необходимо объединять данные в локальных областях во избежание
предположительно невозможного (недопустимого) изменения производной. При таком
11
подходе фактически для получения значений l(L) и l’(L) в одной локальной области
используются данные из других областей, которые не имеют к ней отношения.
Проблема в том, что нужно исключить (игнорировать) изменения в наборе одного рода
(прежде всего, как наиболее значимые при интерпретации без разделения разброса
фиксацию относительных значений длин в синхронизованных агрегатах, см. выше) и
напротив, обеспечить высокую чувствительность к изменениям другого (изменение
собственно l(L)). Это невозможно делать, не разделяя разброс на соответствующие
составляющие, что собственно и обеспечивает представление полосой. Такое разделение,
тем более необходимо, если считать, что разброс велик (как неявно предполагает
традиционная интерпретация).
Если зависимость l(L) получать непосредственно, то разделения разброса на
составляющие нет (в том числе, при использовании интерполяции зависимости l(L)
непосредственно набором точек с явно формулируемыми типовыми свойствами, что дает
значительные преимущества в сравнении с использованными ранее способами
интерполяции). Отсутствие такого разделения означает, что любой выбор в такой ситуации
влечет неизбежное искажение информации, а значит, и результата интерпретации. Если при
этом еще не контролировать адекватное выполнение установленных типовых свойств, то
выбор будет к тому же произвольным. Практически выражением является искажение
рассчитываемых характеристик (значений параметров в интерполирующем выражении),
особенно относящихся к зоне растяжения, где изменения значения l(L) существенные, а
число значений длин относительно мало.
Варианты интерполяции, которые ранее были использованы:
– многоэтапное сглаживание (как, например, в работе [8]) или усреднение по большому
числу рядов ([12, 13]) сопровождает утрата информации о критических изменениях (при
наличии резкого перехода после усреднения или наложения рядов с разными точками
переход сглаживается или исчезает) и вообще делокализация свойств. Как пример
последнего (искажающего эффекта объединения данных при многократном сглаживании),
по всей видимости, можно рассматривать вывод о делении в зоне растяжения в работе [8];
– малопараметрическая интерполяция (например, как логистическая кривая [7, 16])
фиксирует в качестве типовых свойства, которые не совпадают с типовыми свойствами
искомой зависимости (и в общем случае [1, с. 30] для интерполяции принятого вида не будет
информационно эквивалентна представляемой зависимости);
– полиномиальная интерполяция [11]. В общем случае, если это полиномиальная
малопараметрическая
интерполяция,
то
справедливо
последнее,
а
если
многопараметрическая (типа сплайна), то первое (или одновременно оба, т.к. типовые
свойства полинома в общем случае не соответствуют представляемой зависимости);
– использование при интерполяции последовательностей li(L) с кажущимся (т.е.
фиктивно) малым разбросом – подбор «гладких» профилей. Такие данные неполны (см.
выше), т.е. изначально мало информативны. Произвол интерпретации в этом случае
проявляется на этапе предварительного отбора данных;
– интерполяции, исходящие из критического описания представляемой зависимости
(например, на основе утверждения о ступенчатом изменении скорости роста – наличии
критических переходов между зонами роста [6]). Такое представление, противоположное
сглаживанию соответственно исключает отсутствие критических переходов и подразумевает
неустойчивый произвольный выбор критических точек.
Общим недостатком использованных подходов является не только то, что выбор во
всех случаях произвольный, но и то, что интерполяции разными способами невозможно
сравнивать между собой по критерию качества описания, а главное их невозможно
12
трансформировать к адекватному описанию (т.е. это взаимоисключение возможных в
принципе альтернатив).
Интерполяция точками, подобная обсуждаемой в данной работе интерполяции для
граничных зависимостей полосы, значительно лучше перечисленных по двум важным
критериям – явному выражению типовых свойств и возможности представить различные
альтернативы, например, резкий переход и плавный за счет непрерывного изменения
положения промежуточных точек. Рисунок 1 представляет такие альтернативы при
интерполяции через граничные зависимости.
Интерполяция зависимости l(L) непосредственно набором точек – это адекватная
форма представления, отвечающая низкой точности. Поэтому получаемые выводы в этом
случае будут справедливы (непроизвольны), но чувствительность (разрешающая
способность) при таком подходе очень низкая в сравнении с аналогичным представлением
полосой двукратных различий.
Из-за перечисленных недостатков традиционных подходов к интерпретации
сформулированные типовые свойства зависимости l(L), используемые для нахождения
граничных кривых, нельзя считать окончательно установленными.
Возможно – это неполный набор свойств, и нужны дальнейшие уточнения как
изменение в нем или дополнительные связи. Например, однородный рост [6] дает резкость
переходов. Это меньшее число параметров и промежуточных точек в кусочно-линейной
интерполяции.
Дальнейшее изучение роста – это последовательное согласование выражения свойств
механизма роста через типовые свойства граничных кривых и в результате уточнение этих
свойств для зависимости l(L), а в перспективе – и для зависимости k(L).
Иными словами, изучение процесса роста имеет смысл последовательного решения
самосогласованной задачи – постепенной корректировки типовых свойств, определяемых (в
явном виде) в связи с реальными или гипотетическими характеристиками механизма роста.
Требуемое изменение подхода к получению и анализу данных
Представление зависимости l(L) полосой двукратных различий (с выполнением
сформулированных в явном виде типовых свойств) требует не только изменения процедуры
получения интерполирующих зависимостей. Предлагаемый подход к интерпретации данных
влечет за собой также и другой подбор данных, получаемых в эксперименте. Для
установления относительной скорости роста и характеристик разброса длин клеток и
распределений длин по относительным размерам необходимы отнюдь не многочисленные
последовательности (наборы li(L)) для большого числа корней. Гораздо информативнее
последовательности, полученные для одного корня (включающие, прежде всего, данные для
проводящих тканей, а наряду с ними – данные для других тканей, которые дают больше
возможностей проверять предположение об общей для всех рядов зависимости k(L)).
Таким образом, можно сформулировать требования к получению и обработке данных
позволяющие избежать утраты информации:
•
Данные для отдельных рядов (получаемых в виде последовательностей li(L)) необходимо
анализировать индивидуально (до какого-либо объединения рядов). В противном случае
расчет относительной скорости роста k(L) по производной l’(L) теряет смысл и
характеристики распределений длин клеток по относительным размерам установить
невозможно. (Если же это не сделано, тем более, сразу объединены последовательности li(L)
из различных тканей, как в работах [12, 13], то характеристики полученных распределений
не имеют какой-либо связи с действительным распределениями длин клеток по
относительным размерам. В частности, они не дают информации для проверки утверждения
о пропорциональном росте.)
13
•
Положение полосы двукратных различий очень важно определить по возможности точно.
При пропорциональном росте следует ожидать слабое отклонение от равномерного
распределения, поэтому для расчета характеристик распределений положение полосы нужно
знать с точностью не хуже 10%.
•
Усреднение по совокупности последовательностей li(L) (до определения их индивидуальных
характеристик) недопустимо при обработке исходных данных из-за того, что после этого
утрачивается информация критического характера.
•
Нельзя также сглаживать исходные данные в виде последовательности li(L), т.к. при этом
теряется информация о точках, принадлежащих к граничным зависимостям.
•
Наконец, критерий оценки качества исходных данных в виде последовательностей li(L) для
отдельных рядов также изменяется, по сути, на полностью противоположный. Наиболее
информативны (и поэтому оказываются особо ценными) данные, которые позволяют точнее
установить положение полосы за счет большого числа точек, принадлежащих граничным
зависимостям (т.е. максимально «пилообразные» профили li(L)). При традиционном подходе
такие данные («пилообразные» наборы li(L)) дают значительно большее СКО в сравнении с
другими данными (более «гладкими» наборами) и были бы отброшены (при статистической
интерпретации набора li(L) непосредственно зависимостью l(L)) как бесполезные при
попытке с хоть сколько-нибудь приемлемой точностью рассчитать значение производной
l’(L).
Интерпретация полосой двукратных различий, напротив, выявляет неполноту тех
наборов данных («гладких» последовательностей li(L)), которые предпочтительны при
традиционном подходе. Очевидная неоднозначность интерпретации этих данных полосой
двукратных различий выявляет то, что в действительности они не несут требуемой
информации, т.е. информация, полученная из них после применения стандартных процедур
(сглаживания, полиномиальной интерполяции и т.п.), фиктивна. Легко представить, к чему
приведет традиционная интерпретация данных для каждой из двух последовательностей на
рисунке 2 по отдельности, сколь существенно результаты такой интерпретации будут
различаться между собой, и сколь велики будут различия результатов раздельной
интерпретации от общей интерпретации, которую дает приводимая там же для них полоса
двукратных различий в приближении однородного роста.
Обобщая сказанное, предлагаемый подход – это переход к описанию со сложной
структурой (длина l, относительная длина l/lm, а также характеристики разброса и
распределения длин клеток), которая необходима для разделения составляющих разброса. За
счет более сложной структуры возможно разрешение имеющихся проблем количественного
описания роста клеточных систем, включая, в частности, применение того же подхода к
описанию роста листа [9]. И шире, представление о типовых свойствах, их выражение в
явном виде, а затем оценка информативности данных на их основе [1] – это новые
перспективы количественного описания в биологии.
Авторы выражают благодарность Доброчаеву А.Е. (ИФР РАН) и Окштейну И.Л.
(ИТЭФ) за обсуждение работы.
Данная работа выполнена при поддержке гранта РФФИ 03-04-48578.
Литература
1. Васильев А.А. Теоретическая биология, часть 1. М.: МФТИ, 2002, 300 с.
2. Демченко Н.П. Последовательность перехода к митозу сестринских клеток в корнях
пшеницы и их различия по продолжительности митотических циклов //Ботан. журн. 1975.
Т.60. С.188-198.
14
3. Доброчаев А.Е., Иванов В.Б. Вариабельность размеров митотических клеток в меристеме
корня // Онтогенез. Т.32, №4, С. 252–262. 2001.
4. Иванов В.Б. Клеточные основы роста растений. М.: Наука, 1974. 224с.
5. Иванов В.Б. Критический размер и переход клетки к делению. Последовательность
перехода к митозу сестринских клеток и обязательность перехода клетки к митозу (в кончике
корня проростка кукурузы).// Онтогенез, 1971. Т.2. С.888-898.
6. Иванов В.Б., Максимов В.Н. Изменение относительной скорости роста клеток корня на
протяжении меристемы и начала зоны растяжения.//Физиология растений, 1999. Т.46. №1,
С.87-97.
7. Barlow P.W., Brain P., Parker J.S. Cellular growth in roots of a gibberellin-deficient mutant of
tomato (Lycopersicon esculentum Mill.) and its wild-type // J. Exp. Bot V.42, N.236: 239–251.
1991.
8. Beemster G.T.S., Baskin T.I. Analysis of cell division and elongation underlying the
developmental acceleration of root growth in Arabidopsis thaliana // Plant Physiology 132(3):
1515–1526. 1998
9. Bultynck L., Fiorani F., Volkenburgh E,. Lambers H. Epidermal cell division and cell elongation
in two Aegilops species with contrasting leaf elongation rates //Functional Plant Biology, 30: 425–
432. 2003.
10. Erickson R.O., Sax K.B. Rates of cell division and cell elongation in the growth of the primary
root of Zea mays // Proceedings of the American Philosophical society 100(5): 499–514. 1956.
11. Erickson R.O. Modeling of plant growth //Ann. Rev. Plant Physiol. 27: 407-434/ 1976.
12. Evans L.S. Diversity of cell lengths in terminal portions of roots: implications to cell
proliferation // Env. Exp. Bot 43: 239–251. 2000.
13. Evans L.S., Lagrazon. K., Pancrudo J. Diversity of cell lengths in terminal portions of roots:
location of the proliferative cell population // Env. Exp. Bot 45: 85–94. 2001.
14. Goodwin R.H., Stepka W. Growth and differentiation in the root tip of Phleum pratense// Amer.
J. Bot. 32(1): 36. 1945.
15. Heinowicz Z., Brodzky P. The growth of the root cells as the function of time and their position
in the root // Acta Societatis Botanicorum Poloniae XXIX(4): 625–644. 1960
16. Morris A.R., Silk W.R. Use of a flexible logistic function to describe axial growth of plants //
Bull. Math. Biol. 54(6): 1069–1081. 1992
17. Silk W.K. Steady form from changing cells // Int. J. Plant Sci. 153(3): S49–S58. 1992.
Подписи к рисункам
Рис. 1. Длина клеток (◊) эпидермиса вдоль кончика корня арабидопсиса. Объединенные
данные нескольких рядов любезно предоставил G. Beemster. Интерполяция полосой
двукратных различий в представлении точками (–––, символы «•») и в пределе однородного
роста (–– ––, символы «х»).
Рис. 2. Длина клеток коры для двух продольных рядов (Δ, ο) одного корня Phleum
pratense (тимофеевки): (–– ––, символы «х») – интерполяция полосой двукратных различий в
пределе однородного роста. Исходные данные получены В.Б. Ивановым в лаборатории Т.
Баскина.
15
200
Длина клетки,
мкм
180
160
140
120
100
80
60
40
20
Расстояние до границы с покоящимся центром, мкм
0
0
500
1000
1500
2000
2500
РИС1
200
Длина
клеток, мкм
150
100
50
Расстояние до кончика корня, мкм
0
0
500
1000
РИС2
16
1500
2000
Download