ЧЕТЫРЕ МАТРИЦЫ ПЕРЕХОДА К НОВОМУ БАЗИСУ

advertisement
Сушков В.И. ( СПбГТУ.).
ЧЕТЫРЕ МАТРИЦЫ ПЕРЕХОДА К НОВОМУ БАЗИСУ
(матрицы замены базиса и матрицы линейной замены переменных).
(текст исправлен 17.04.2008)
Предисловие
Стандартные задачи, которые требуют понимания этого вопроса, таковы: линейной заменой
переменных привести квадратичную форму к каноническому виду (к сумме квадратов), переходом к
Жорданову базису привести матрицу линейного оператора к каноническому Жорданову виду и т.п.
Это - очень важные для инженера задачи. Первая связана с отысканием экстремумов функций
нескольких переменных, с понятием кинетической энергии в механике и в физике, с метриками в
пространствах, а вторая - с решением системы линейных дифференциальных уравнений, с теорией
автоматического регулирования и управления, с математическим моделированием динамики систем (от
движения самолетов и ракет до движений сердца и развития общества).
Обычно на лекциях и в учебниках по линейной алгебре ради экономии времени и бумаги упоминается
только одна матрица перехода к новому базису (к новой системе координат, выражаясь на языке геометрии).
Но на самом деле их можно насчитать не менее четырех, и каждая из них имеет право называться двумя
способами: "матрица перехода от старого базиса к новому базису" и "матрица перехода от нового базиса к
старому базису". В разных книгах такими словами называют разные матрицы. А когда студент, знакомый
лишь с одним толкованием этого понятия, начинает решать задачи, то с изумлением обнаруживает, что
матриц много и в них легко запутаться. По моему почти 35-летнему опыту преподавания я знаю: экономия
на количестве "матриц перехода" ведет к беспомощности студентов. Поэтому мы должны честно
предупредить студента о наличии нескольких матриц с такими двусмысленными названиями и научить его
быстро восстанавливать в памяти всю информацию о них и не зависеть от названий и обозначений.
Разумеется, сильные студенты, старающиеся "аккуратно все разложить по полочкам в своей голове",
рано или поздно сами приходят к пониманию наличия нескольких "матриц перехода", и к пониманию связей
между ними. Но на осознание этого факта, выяснение связей между матрицами и на привыкание уходит
много времени.
Я несколько лет в начале моей преподавательской практики отрабатывал приемы изложения этого
вопроса, стремясь научить студентов быстро запомнить и быстро восстанавливать в памяти всю
информацию о матрицах перехода к новому базису. По-моему у меня это получилось. Предлагаю
вниманию преподавателей и студентов отработанный мною способ.
* * *
Итак, речь идет о следующем. Мы хотим заменить в пространстве одну прямолинейную систему
координат другой. Начало координат у обеих систем одно. Будем называть их старой и новой системами
координат. Базисные векторы старой системы координат обозначим s1 , s2 , .. sn. Базисные векторы новой
системы координат обозначим e1 , e2 ,.. en . Пространство, как видно из обозначений, n - мерное.
Базис, по определению, - это такой набор векторов, по которым может быть разложен, и притом
единственным образом, любой другой вектор пространства. Поскольку e1 , e2 ,.. en - базис, то вектор s1
можно разложить по этому базису. Вектор s2 - тоже, …вектор sn - тоже. Обозначим коэффициенты этих
разложений буквами a c соответствующими индексами:
s1 = a11 e1 + a12 e2 +… + a1n en
s2 = a21 e1 + a22 e2 +… + a2n en
…………..
(1)
sn = an1 e1 + an2 e2 +… + ann en
Матрицу коэффициентов aij этих формул обозначим буквой A. Сразу заметим: по смыслу формул ясно,
что коэффициенты aij следует называть новыми координатами старых базисных векторов (эти
слова будут использоваться как важнейший инструмент решения задач и потому прошу обратить на них
внимание; всюду далее я слова такого вида выделяю жирным прямым шрифтом ).
Итак, строки матрицы A, - это новые координаты старых базисных векторов.
Теперь наоборот, каждый из векторов e1 , e2
разложения обозначим буквами b c индексами:
,.. en разложим по базису s1 , s2 , .. sn . Коэффициенты
e1 = b11 s1 + b12 s2 +… + b1n sn
e2 = b21 s1 + b22 s2 +… + b2n sn
…………..
(2)
en = bn1 s1 + bn2 s2 +… + bnn sn
Матрицу коэффициентов bij этих формул обозначим буквой B. Сразу заметим: по смыслу формул ясно,
что коэффициенты bij следует называть старыми координатами новых базисных векторов.
Итак, строки матрицы B, - это старые координаты новых базисных векторов.
Как связаны друг с другом матрицы A и B ? По виду формул ясно, что они взаимно обратны (как
матрицы коэффициентов взаимно обратных отображений: в первой группе формул векторы si выражаются
через векторы ej , а во второй группе - наоборот).
Итак, отметим:
A-1 = B.
Причем в строках матрицы A стоят новые координаты старых базисных векторов, а в строках
матрицы B - старые координаты новых базисных векторов.
Теперь рассмотрим один какой-нибудь вектор x. Если его разложить по базису s1 , s2 , .. sn , затем в
разложении заменить векторы si по формулам (1) векторами ej , а потом сгруппировать при них
коэффициенты, то можно увидеть, что старые координаты и новые координаты ОДНОГО и ТОГО ЖЕ
вектора x выражаются друг через друга линейно. В лекциях и книгах так и делают, и на этой основе
получают все нужные формулы. Но для практики будет гораздо проще осознавать лишь сам факт
линейности формул, связывающих старые координаты с новыми. А связь между матрицами разных формул
обнаруживается с помощью следующего наблюдения. Запишем вид линейных формул, выражающих старые
координаты вектора через новые (3) и наоборот (4).
x1стар = c11 x1нов + c12 x2нов +...+ c1n xnнов
x2стар = c21 x1нов + c22 x2нов +...+ c2n xnнов
.............................
xnстар = cn1 x1нов + cn2 x2нов +...+ cnn xnнов
(3)
В этих формулах старые координаты вектора x выражаются через новые его координаты.
В матричном виде эти же формулы:
Xстар = C Xнов
где, естественно,
коэффициентов.
(3')
Xстар , Xнов - столбцы старых и новых координат вектора x,
C - матрица
И наоборот:
x1нов = d11 x1стар + d12 x2стар +...+ d1n xnстар
x2нов = d21 x1стар + d22 x2стар +...+ d2n xnстар
.............................
xnнов = dn1 x1стар + dn2 x2стар +...+ dnn xnстар
(4)
В матричном виде:
Xнов = D Xстар
(4')
Попутно заметим: из этих формул мы можем понять причину двусмысленности слов "переход к новому
базису", "матрица перехода к новому базису". Посмотрим, например на формулы (3) или (3'). Ведь их можно
использовать для двух (!) целей:
1.
С их помощью можно по заданным новым координатам вектора вычислить старые
его координаты. И поэтому формулы (3) следовало бы назвать формулами "перехода от нового
базиса к старому".
2.
А с другой стороны, эти же самые формулы можно использовать для замены
аргументов в какой-либо функции Y=F(X). Если мы в пространстве иксов меняем систему
координат, то формулы (3') дают нам возможность сделать замену переменных, выразив
фукнцию
через
Xнов
Y=F(CXнов) - то есть преобразовали функцию к виду Y=Ф(Xнов). И поэтому эти же
формулы с полным правом можно называть также и формулами "перехода от старого базиса к
новому".
Как правило, лекторы и авторы учебников имеют в виду один из этих двух смыслов этих слов. Студент,
приученный верить в четкую обоснованность названий и терминов в математике, на первых порах, следуя за
мыслью лектора, полагает, что используемая лектором терминология является естественной. Но рано или
поздно (часто - увы - поздно, уже на экзамене) студент обнаруживает, что оба эти названия формул (3')
равноправны. Точнее говоря, студент это не обнаруживает, а упирается в такое препятствие и быстро
осознать и преодолеть его не может.
Будет гораздо лучше, если мы сразу четко объясним студенту, что матриц - четыре, и каждая из них
имеет право называться и так и этак.
Теперь для того, чтобы обнаружить связь матрицы C с матрицей B, выясним смысл столбцов матрицы
C. Для этого подставим в правую часть формул (3') вместо Xнов числовой столбец (1,0,0,0,...0)T . С одной
стороны это означает, что мы подставили туда новые координаты первого нового базисного вектора e1
(посмотрите сами на эти формулы: ведь там в правой части написан столбец новых координат вектора в
базисе e1, e2,.. en ). С другой стороны, по смыслу этих формул мы после умножения получим столбец
старых координат этого же вектора, т.е. старые координаты нового базисного вектора e1. С третьей
стороны в результате умножения матрицы C на столбец с числами (1,0,0,...0) T мы получим просто первый
столбец матрицы.
Вывод: в первом столбце матрицы C стоят старые координаты первого из новых базисных векторов.
Аналогично и в остальных столбцах стоят старые координаты новых базисных векторов. А в
матрице B старые координаты новых базисных векторов составляют строки. Отсюда следует:
С T = B.
Точно так же, подставляя столбцы вида (1,0,0..), (0,1,0,..), (0,0,1,..) в правую часть формул (4) или (4'),
мы можем понять, что столбцами матрицы D являются новые координаты старых базисных
векторов. Отсюда:
DT = A.
Ну а связь между матрицами C и D очевидна из формул (3) - (4):
С-1 = D.
Основные факты, которые должен усвоить студент:
1.
Замена базиса в векторном (или точечно-векторном) пространстве автоматически (на
основе определения базиса) подразумевает наличие линейных связей (1)-(2) между старым и новым
базисами. Матрицы этих формул очевидно взаимнообратны.
2.
Замена базиса порождает линейные формулы (3)-(4) замены координат произвольного
вектора. Матрицы этих формул также очевидно взамнообратны. (Надо обратить внимание студента на
существенное отличие этих двух групп формул: формулы первой группы выражают друг через друга
разные векторы, а формулы второй группы выражают друг через друга старые и новые коррдинаты
одного и того же вектора).
3.
Связь между этими двумя группами матриц осуществляется транспонированием. Для
уяснения этого достаточно заметить, что в матрицах (1)-(2) строки являются "старыми координатами
новых базисных векторов" или "новыми координатами старых базисных векторов" соответственно. А в
матрицах формул (3')-(4') такой же смысл имеют столбцы. Это можно обнаружить при подстановке в
правые части формул числовых столбцов (1,0,0…) T , (0,1,0..) T и т.д., являющихся новыми координатами
новых базисных векторов или старыми координатами старых базисных векторов, соответственно.
4.
Всякая линейная замена переменных вида (3) или (4) (с невырожденной матрицей,
разумеется) соответствует замене базисных векторов. Координаты этих базисных векторов можно
увидеть в столбцах или строках соответствующих матриц.
Итак, способ быстрого усвоения и восстановления информации о матрицах
перехода к новому базису:
написать (или представить себе в уме) формулы вида (1) -(4). Затем указанными выше приемами
выяснить смысл столбцов или строк их матриц коэффициентов. Это даст связь между матрицами формул
(1)-(2) для базисных векторов и формул (3)-(4) для координат, а также ключ к их построению по данным
задачи.
ВАЖНЕЙШИЕ ПРИМЕРЫ.
Поскольку основная цель статьи - вопрос о четырех матрицах замены базиса и матрицах линейной
замены переменных, то здесь разобраны примеры не самой большой общности.
1. Квадратичную форму f = x2 - 4xy +5y2 привести к сумме квадратов линейной заменой переменных.
Указать базис, в котором она имеет такой вид. Указать вид линий уровня (изоквант) этой функции и вид ее
графика.
Решение. Группируем все слагаемые, содержащие переменную x, и дополняем их до полного квадрата
суммы двух чисел: f = (x2 - 4xy +4y2) - 4y2+5y2 = (x - 2y)2 +y2. Теперь сделаем замену переменных:
u = x - 2y
v = 0x + y
Она приводит функцию к виду f = u2 + v2 , т.е. к сумме квадратов переменных.
Если бы система координат (u,v) была ортонормированной (т.е. прямоугольной с одинаковыми
единицами измерения по осям координат), то линии уровня функции f - система концентрических
окружностей u2 + v2 = const, а графиком функции в пространстве (u,v,f) был бы параболоид вращения.
Но в задаче подразумевается, что исходная система координат - прямоугольная, c традиционным
обозначением базисных векторов буквами i, j, k. А что в новой системе координат?
Из формул замены переменных мы можем найти новые координаты старых базисных векторов i и j. Для
этого подставим в формулы замены переменных числа (1,0) или (0,1) вместо (x,y) (это старые координаты
старых базисных векторов i и j). В результате мы получим новые координаты этих же векторов - это (1,0) и
(-2,1) (столбцы матрицы коэффициентов). Очевидно, на нашем рисунке это будут не ортогональные
векторы, а второй вектор даже не единичной длины.
Чтобы получить рисунок для случая ортогональных единичных векторов i и j, нарисуем новую сетку
координат (u, v) в старой системе координат (x, y). Для этого нам нужны старые координаты новых
базисных векторов. Их можно получить тем же способом, что и выше, но для этого нужны формулы,
обратные предыдущим. Обращаем формулы замены переменных:
x = u + 2v
y = 0u + v
Из них мы подстановкой (1,0) и (0,1) можем получить старые координаты новых базисных векторов, (1,0) и (2,1). Это и есть ответ на вопрос о базисе, в котором наша форма имеет вид суммы квадратов. Ответ
не единствен (можно было, например, изменить длину новых базисных векторов).
Здесь я должен заметить для читателя-студента: вопросы в задачах по математике часто бывают
вообще-то некорректными. Вот и в этой задаче ведь не сказано же было, что нужно указать именно старые
координаты новых базисных векторов. Эта та информация, которая подразумевается по умолчанию. В
математике вообще много таких условностей. И учеба заключается, в частности, в знакомстве с ними. Это
замечание я приписал для тех студентов, которые верят, будто в математике до всего можно догадаться
логическим путем.
Итак, рисуем эти векторы. Дорисовываем параллельными им прямыми координатную сетку (голубого
цвета на рисунке). Координатная сетка (u, v) стала косоугольной. Квадраты, которых касались окружности,
превратились в параллелограммы, а сами окружности - в эллипсы. Соответственно, параболоид вращения
превратится в эллиптический параболоид.
2.
Квадратичную форму f = 52x2 - 72xy +73y2 привести к сумме квадратов ортогональным
линейным преобразованием. Указать базис, в котором она имеет такой вид.
Решение. Запишем эту функцию в матричном виде f = X Т A X. Здесь X = (x, y)T = столбец переменных,
A = cимметричная матрица коэффициентов:
[ 52 -36 ]
[ -36 73 ]
Вычисляем определитель det(A - E) = (52-)*(73-) - 36*36 = 2 - 125  + 2500, т.е. характеристический
полином. Его корни 1 =25 и 2 =100. Теперь ищем собственные векторы матрицы A, т.е. решаем методом
Гаусса две вырожденные системы уравнений
(A - 1 E)*X = 0
(A - 2 E)*X = 0
У этих систем, у каждой, - бесконечно много решений (мы же обеспечили вырожденность их матриц с
помощью подбора числа ). Решения каждой из этих систем образуют одномерное векторное
подпространство. Решения первой системы пропорциональны вектору (3,4). Другая система имеет
решениями векторы, пропорциональные вектору (-4, 3). Эти два вектора ортогональны, об этом говорит нам
их скалярное произведение: (3, 4)*(-4,3)T = -12+12 =0. Их длина = 5. Нормируем их до единичной длины
e1 = (3/5, 4/5)T и e2 = (-4/5, 3/5)T .
Полученные орты используем в качестве нового базиса. Мы имеем их старые координаты. Поставим их
в столбцы матрицы C перехода к новому базису. Матрица, столбцы которой являются взаимно
ортогональными векторами единичной длины (ортами), называется ортогональной; ее очевидное свойство
CCT=E (т.к. скалярные произведения базисных векторов, из которых образована C, равны либо 1 либо 0). в
столбца, т.е. C-1 =CT.
Делаем замену по формулам (3): X=CXНОВ.
Тогда получим f = (CXНОВ)TA(CXНОВ) = (XНОВ )T CTACXНОВ = (XНОВ )T AНОВ XНОВ.
Т.е. подстановка в квадратичную форму дала AНОВ= CTAC. Умножая, получим AНОВ :
[25,
0]
[ 0, 100]
И это означает, что в новом базисе наша квадратичная форма является суммой квадратов переменных с
коэффициентами 25 и 100:
f = 25 xнов1 2 + 100 xнов2 2
Линиями уровня этой функции являются эллипсы
x12 / 100 + x22 / 25 = const
с отношением полуосей 2 / 1. Рисунок изоквант будет похож на предыдущий, но сиреневые линии
новой системы координат образуют прямоугольную сетку и новые оси координат будут направлены вдоль
наибольшей и наименьшей полуосей эллипсов.
Разумеется, тот факт, что коэффициентами оказались собственные числа 1 и 2 , не случаен. Его можно
доказать в общем случае. Но доказательства в известных мне книжках громоздкие. Я могу предложить
короткое доказательство. Вот оно.
C - ортогональная матрица, т.е. CCT=E, это равноценно тому, что C-1 =CT.
При замене базиса в пространстве {X} матрица линейного оператора Y=AX, отображающего
пространство {X} в себя, меняется на новую по формуле:
AНОВ= C-1AC.
Эту формулу легко получить, сделав замены переменныз вида (3) в формуле Y =AX:
C Y НОВ = A C XНОВ
отсюда
Y НОВ = C -1 A C XНОВ
что и требовалось получить.
Теперь напомним, что в том случае, когда C - ортогональная матрица, C-1 =CT . И тогда формула замены
матрицы в квадратичной форме и в линейном операторе совпадают. Но столбцы матрицы A линейного
оператора Y=AX являются образами базисных векторов, получающихся при таком отображении (чтобы
убедиться в этом, напомню, достаточно умножить матрицу на столбцы (1,0,0...)T , (0,1,0,..)T и т.д.). Этим и
можно воспользоваться для вычисления матрицы AНОВ .
. У нас в качестве базисных векторов использованы собственные оператора A:
A e1 = 1 e1 = 25 e1 +
0 e2
A e2 = 2 e2 = 0 e1 + 100 e2
Таким образом, мы увидели столбцы матрицы - это строки коэффициентов этих формул. Это
вычисление несложно проделать и в общем виде. Таким способом легко доказать, что ортогональное
преобразование переменных,
порожденное переходом к базису, состоящему из ортогональных и
нормированных собственных векторов матрицы A, превращает квадратичную форму в сумму квадратов,
коэффициентами при которых служат собственные числа этой матрицы.
Download