. ЭЛЕМЕНТЫ АЛГЕБРЫ §1. Арифметическое пространство 1. Понятие арифметического пространства Из школьного курса математики известно, что если на плоскости или в пространстве задана система декартовых координат, то всякий вектор определяется соответственно упорядоченной парой или тройкой действительных чисел, называемых координатами или компонентами вектора. Над векторами можно производить операции сложения и умножения на число (скаляр), которые для векторов пространства выражаются в координатах следующим образом: ~a = (a1 , a2 , a3 ) =⇒ ~a + ~b = (a1 + b1 , a2 + b2 , a3 + b3 ) , ~b = (b1 , b2 , b3 ) ~a = (a1 , a2 , a3 ) =⇒ λ~a = (λa1 , λa2 , λa3 ) . Применение понятия вектора, указанных выше (и других) операций над векторами и знание свойств этих операций позволяет более рационально и изящно решать многие задачи геометрии и физики. Однако в геометрии, механике и физике часто приходится изучать такие объекты, для задания которых недостаточно трёх чисел. Так, например, положение твёрдого тела в пространстве определяется упорядоченной системой из 6 действительных чисел (6 степеней свободы). Этот пример и многие другие указывают на целесообразность рассмотрения всевозможных систем из n действительных чисел, где n любое натуральное число. Над такими системами чисел мы будем производить операции сложения и умножения на число по аналогии с соответствующими операциями над векторами плоскости или трёхмерного пространства, заданными своими компонентами. При этом мы будем пользоваться аналогичной терминологией. Упорядоченная система n чисел a = (a1 , a2 , . . . , an ) (1 ) называется n -мерным вектором. Числа ai (i = 1, 2, . . . , n) называются компонентами (или координатами ) вектора a . Пусть, кроме вектора a , дан ещё один вектор b = (b1 , b2 , . . . , bn ) . Говорят, что векторы a и b равны и пишут a = b , если ai = bi (i = 1, 2, . . . , n) , то есть a1 = b 1 , a 2 = b 2 , . . . , a n = b n . 1 (2) Примеры: 1. Направленные отрезки (векторы), выходящие из начала координат на плоскости или в пространстве, являются (при фиксированнгой системе координат) соответственно 2-мерными и 3-мерными векторами в смысле данного выше определения. 2. Коэффициенты всякого линейного уравнения с n неизвестными составляют n -мерный вектор. 3. Всякое решение системы линейных уравнений с n неизвестными есть n мерный вектор. 4. Если дана матрица из s строк и n столбцов, то её строки являются n -мерными векторами, а столбцы - s -мерными векторами. 5. Сама матрица из s строк и n столбцов может рассматриваться как sn -мерный вектор (разными способами). Суммой векторов (1) и (2) называется вектор a + b = (a1 + b1 , a2 + b2 , . . . , an + bn ) , (3) компоненты которого суть суммы соответствующих компонент слагаемых векторов. Легко убедиться, что сложение векторов, определённое равенством (3), коммутативно и ассоциативно: a + b = b + a, (a + b) + c = a + (b + c) . Это следует из свойств коммутативности и ассоциативности сложения чисел. Вектор o = (0, 0, . . . , 0) (4) называется нулевым вектором. Он обладает тем свойством, что для любого вектора a a + o = a. Вектор −a = (−a1 , −a2 , . . . , −an ) (5) называется противоположным вектору a . Очевидно, для любого вектора a a + (−a ) = o . Для n -мерных векторов имеет смысл и операция, обратная к сложению, т. е. вычитание. Разностью векторов (1 ) и (2) называется вектор a − b = (a1 − b1 , a2 − b2 , . . . , an − bn ) , (6) Произведением вектора (1 ) на число λ называется вектор λa = (λa1 , λa2 , . . . , λan ) , (7) компоненты которого равны произведению на k соответственных компонент вектора a . Из этого определения вытекают следующие свойства умножения вектора на число: λ (a ± b) = λa ± kb , 2 (λ ± µ)a = λa ± µa , λ(µa) = (λµ)a , 1 · a = a. Легко проверить также следующие свойства (следствия из предыдущих): o · a = o, (−1) a = −a , λ · o = o, λa = o =⇒ либо λ = 0 , либо a = o . Множество всех n -мерных векторов вместе с определёнными в нём операциями сложения векторов и умножения вектора на число называется n -мерным арифметическим пространством. 2. Линейная зависимость векторов Будем говорить, что n -мерный вектор b пропорционален n -мерному вектору a , если существует такое число λ , что b = λa. В частности, нулевой вектор пропорционален любому вектору a (o = 0 · a) . Если же b = λ a , но b 6= o , то λ 6= 0 и a = λ1 b , т. е. и вектор b пропорционален вектору a . Т. о. для ненулевых векторов понятие пропорциональности взаимно. Пусть дана система n -мерных векторов a1 , a2 , . . . , ar−1 , ar . (1 ) Линейной комбинацией векторов (1 ) называется всякий n -мерный вектор вида λ 1 a1 + λ 2 a2 + . . . + λ r ar , (2) где λ1 , λ2 , . . . , λr - произвольные числа, называемые коэффициентами линейной комбинации (2). Пример. a1 = (4, 3, −2), a2 = (1, −1, 2), a3 = (1, 2, 0) ; вектор b = a1 + 2a2 − a3 = (4, 3, −2) + 2 · (1, −1, 2) − (1, 2, 0) = (5, −1, 2) линейная комбинация векторов a1 , a2 , a3 с коэффициентами 1, 2, −1 . Линейная комбинация (2) называется тривиальной, если все её коэффициенты равны нулю, и нетривиальной, если среди её коэффициентов λ1 , λ1 , . . . , λr имеется хотя бы один, отличный от нуля. Система векторов (1 ) называется линейно зависимой, если существует хотя бы одна нетривиальная линейная комбинация векторов (1 ), равная нулевому вектору, то есть если существуют числа λ1 , λ2 , . . . , λr , не все равные нулю, такие, что λ 1 a1 + λ 2 a2 + . . . + λ r ar = o . 3 (3) Система векторов (1) называется линейно независимой, если равенство (3) возможно только в том случае, когда λ 1 = λ 2 = . . . = λr = 0 . Рассмотрим основные свойства линейной зависимости векторов. 1. Если один из векторов системы (1) является линейной комбинацией остальных, то система (1) линейно зависима. Пусть для определённости вектор ar является линейной комбинацией векторов a1 , a2 , . . . , ar−1 : ar = µ1 a1 + µ2 a2 + . . . + µr−1 ar−1 . (4) В таком случае говорят, что вектор ar линейно выражается через векторы a1 , a2 , . . . , ar−1 . Переписав равенство (4) в виде µ1 a1 + µ2 a2 + . . . + µr−1 ar−1 + (−1) · ar = o , получим нулевую линейную комбинацию векторов системы (1), нетривиальную, т. к. коэффициент при ar отличен от нуля. 2. Если система векторов (1) линейно зависима, то хотя бы один из векторов этой системы линейно выражается через остальные. Пусть система (1) линейно зависима. Тогда существует нетривиальная линейная комбинация (3), равная нулевому вектору. В силу нетривиальности линейной комбинации, хоть один коэффициент отличен от нуля. Пусть для определённости kr 6= 0 . Тогда равенство (3) можно переписать в виде (4), где µi = λi λr (i = 1, 2, . . . , r − 1) . А это значит, что вектор ar является лиейной комбинацией остальных векторов системы (1). 3. Система, состоящая из одного вектора, линейно зависима тогда и только тогда, когда этот вектор нулевой. Действительно, если a = o , то равенство (3), которое теперь принимает вид (30 ) λa = o, выполняется при любом λ 6= 0 . Обратно, λa = o =⇒ λ 6= 0 a = o. 4. Система, состоящая из двух векторов, линейно зависима тогда и только тогда, когда эти векторы пропорциональны. Это следует непосредственно из свойств 1 и 2 при r = 2 . 5. Если часть (подсистема) системы векторов (1) линейно зависима, то и вся система (1) линейно зависима. 4 Пусть для определённости векторы a1 , a2 , . . . , as образуют линейно зависимую подсистему системы (1). Тогда существуют числа λ1 , λ2 , . . . , λs , не все равные нулю, такие, что λ 1 a1 + λ 2 a2 + . . . + λ s as = o . Переписав это равеннство в виде λ1 a1 + λ2 a2 + . . . + λs as + 0 · as+1 + . . . + 0 · ar = o , получим нетривиальную линейную комбинацию векторов системы (1), равную нулевому вектору. Значит, система (1) линейно зависима. 6. Если система векторов (1) линейно независима, то любая её пдсистема также линейно независима. Действительно, противное противоречило бы свойству 5. Из свойства 6 следует, что линейно независимая система не может содержать нулевого вектора или двух пропорциональных (в частности, равных) векторов. 3. Базис и ранг системы векторов Возникает вопрос: сколько векторов может содержать линейно независимая система n -мерных векторов? Теорема 1. Существуют линейно независимые системы n -мерных векторов, состоящие из n векторов. Для доказательства рассмотрим произвольную систему из n n -мерных векторов a1 = (a11 , a12 , . . . , a1n ) , a2 = (a21 , a22 , . . . , a2n ) , ........................ an = (an1 , an2 , . . . , ann ) , подчинённую единственному требованию, a11 a12 a a ∆ = 21 22 ... ... an1 an2 чтобы определитель . . . a1n . . . a2n 6= 0 . . . . . . . . . ann (1) (2) и покажем, что она линейно независима. Действительно, пусть существуют такие числа λ1 , λ2 , . . . , λn , что λ 1 a1 + λ 2 a2 + . . . + λ n an = o . Тогда λ1 = λ2 = . . . = λn = 0 , так как в противном случае один из векторов ai был бы линейной комбинацией остальных, а это означало бы, что одна из строк определителя ∆ является линйной комбинацией остальных, что невозможно в силу условия (2). Таким образом, в n -мерном векторном пространстве существуют линейно независимые системы, состоящие из n векторв. Очевидно, таких систем бесконечно много. 5 Одной из них является так называемая система единичных векторов: e1 = (1, 0, . . . , 0) , e2 = (0, 1, . . . , 0) , .................. en = (0, 0, . . . , 1) . (3) Теорема 2. Всякая система s векторов n -мерного арифметического пространства при s > n линейно зависима. Пусть даны векторы a1 = (a11 , a12 , . . . , a1n ) , a2 = (a21 , a22 , . . . , a2n ) , ........................ as = (as1 , as2 , . . . , asn ) , (4) Теорема будет доказана, если мы покажем, что существуют такие числа λ1 , λ2 , . . . , λs , не все равные нулю, что λ1 a1 + λ2 a2 + . . . + λs as = o . (5) Переходя от равенства (5) к соответствующим равенствам между компонентами векторов (4), получим: a11 λ1 + a21 λ2 + . . . + as1 λs = 0 , a12 λ1 + a22 λ2 + . . . + as2 λs = 0 , (6) .............................. a1n λ1 + a2n λ2 + . . . + asn λs = 0 . Мы должны доказать, что система (6) имеет ненулевое решение. Но это очевидно, так как речь идёт о системе линейных однородных уравнений, в которой число уравнений меньше числа неизвестных (методом Гаусса она может быть приведена только к трапецодальному виду). Теорема 3. Если n векторов a1 , a 2 , . . . , a n (7) n -мерного арифметического пространства образуют линейно независимую систему, то всякий вектор b этого пространства через них линейно выражается. Действительно, если b - один из векторов системы (7), например ai , то его можно представить в виде b = 0 · a1 + . . . + 1 · ai + . . . + 0 · an . Если же b отличен от векторов системы (7), то он образует вместе с ними линейно зависимую систему (см. п. 2). Следовательно, существует нетривиальная линейная комбинация λ 1 a1 + λ 2 a2 + . . . + λ n an + λ · b = o . Здесь не может быть λ = 0 , так как это означало бы, что система (7) линейно зависима. Значит, λ 6= 0 . А тогда вектор b линейно выражается через векторы системы (7): λ2 λn λ1 a2 − . . . − an . b = − a1 − λ λ λ 6 Определение. Пусть дана конечная или бесконечная система n -мерных векторов U . Базисом системы U называется любая её подсистема V , удовлетворяющая двум условиям: 1) система V линейно независима; 2) всякий вектор системы U линенйно выражается через векторы её подсистемы V . Теорема 4 (о базисе). Всякая система n -мерных векторов U , содержащая ненулевые векторы, имеет базис. Любой базис системы U содержит конечное число векторов, не превосходящее n . Пусть a1 - ненулевой вектор системы U . Может оказаться, что все векторы системы U пропорциональны вектору a1 . Тогда система, состоящая из одного вектора a1 , есть базис системы U . Пусть не все векторы системы U пропорциональны вектору a1 . Тогда существует вектор a2 такой, что векторы a1 и a2 линейно независимы. Если все другие векторы системы U через них линейно выражаются, то система {a1 , a2 } - базис системы U . В противном случае будем последовательно присоединять к ней по одному вектору из U так, чтобы каждая новая система была линейно независимой. По теореме 2 линейно независимая система n -мерных векторов не может содержать больше n векторов. Поэтому в нашем процессе наступит момент, когда мы придём к линейно независимой системе векторов a1 , a2 , . . . , ak , (8) к которой не сможем больше присоединять новые векторы из U , не нарушая её линейной независимости, ввиду того, что все остальные векторы системы U будут их линейными комбинациями. Система (8) и будет базисом системы U . Ясно, что она не может содержать больше чем n векторов ( k 6 n ). Теорема 5. Два базиса одной и той же системы векторов содержат одинаковое число векторов. Доказательство. Пусть даны два базиса одной и той же системы векторов: a1 , a 2 , . . . , a r (9) b1 , b 2 , . . . , b s (10) Докажем, что r = s . Для этого разложим векторы (9) по базису (10): a1 = a11 b1 + a12 b2 + . . . + a1s bs , a2 = a21 b1 + a22 b2 + . . . + a2s bs , .............................. ar = ar1 b1 + ar2 b2 + . . . + ars bs , Коэффициенты этих линейных комбинаций составляют систему из векторов: c1 = (a11 , a12 , . . . , a1s ) , c2 = (a21 , a22 , . . . , a2s ) , ........................ cr = (ar1 , ar2 , . . . , ars ) . 7 (11) r s -мерных (12) Допустим, что r > s . Тогда векторы (12) линейно зависимы (т. к. количество векторов больше чем их размерность). Значит, существуют числа λ1 , λ2 , . . . , λr , не все равные нулю, такие, что λ 1 c 1 + λ2 c 2 + . . . + λ r c r = o . (13) Но равенство (13) равносильно s аналогичным равенствам между соответствующими компонентами векторов (12): λ1 a11 + λ2 a21 + . . . + λr ar1 = 0 , λ1 a12 + λ2 a22 + . . . + λr ar2 = 0 , .............................. λ1 a1s + λ2 a2s + . . . + λr ars = 0 . (14) Следовательно, λ 1 a1 + λ 2 a2 + . . . + λ r ar = = λ1 (a11 b1 + a12 b2 + . . . + a1s bs )+ +λ2 (a21 b1 + a22 b2 + . . . + a2s bs )+ ................................. +λr (ar1 b1 + ar2 b2 + . . . + ars bs ) = = (λ1 a11 + λ2 a21 + . . . + λr ar1 ) b1 + +(λ1 a12 + λ2 a22 + . . . + λr ar2 ) b2 + ................................. (14) +(λ1 a1s + λ2 a2s + . . . + λr ars ) bs = 0 , а это противоречит линейной независимости векторов системы (9). Значит, r не может быть больше s . Аналогично доказывается, что s не может быть больше r . Следовательно, r = s . Определение. Рангом системы векторов называется число векторов, содержащихся в каждом базисе. 4. Ранг матрицы Пусть дана система n -мерных векторов и требуется выяснить, является ли она линейно зависимой или нет. Не следует думать, что это всегда легко сделать. Рассмотрим простой пример. Пусть дана система векторов a = (2, −5, 1, −1) , b = (1, 3, 6, 5) , c = (−1, 4, 1, 2) . При поверхностном рассмотрении этих векторов трудно заметить какую-либо линейную зависимость между ними. Тем не менее, как легко проверить, они связаны между собой соотношением 7 a − 3 b + 11 c = o . Один из методов решения данного вопроса состоит в следующем. Обозначим коэффициенты искомой линейной комбинации через x, y, z . Они должны удовлетворять условию x · a + y · b + z · c = o. 8 Перейдя к соответствующим равенствам между компонентами, получим систему уравнений 2x + y − z = 0 , −5x + 3y + 4z = 0 , x + 6y + z = 0 , −x + 5y + 2z = 0 . Решая её (например, методом Гаусса), получим: x = 7 , y = −3 , z = 11 . Так поступают с любой системой векторов. Если при этом получается однородная система, имеющая лишь нулевое решение, то это означает, что векторы линейно независимы. Однако существует и другой подход к этому вопросу. Он связан с понятием ранга матрицы. Пусть дана прямоугольная матрица a11 a12 . . . a1n a21 a22 . . . a2n A= ... ... ... ... , as1 as2 . . . asn содержащая s строк и n столбцов. Будем рассматривать её строки как n -мерные векторы, а столбцы - как s -мерные векторы. Определение. Наивысший порядок отличных от нуля миноров матрицы A называется её рангом. Теорема 1 (о ранге матрицы). Ранг системы столбцов матрицы A равен рангу матрицы A . Доказательство. Пусть ранг матрицы A равен r . Это значит, что существует хотя бы один минор r -го порядка матрицы A , отличный от нуля, и что все её миноры порядка выше r равны нулю. (Такой минор обычно называют базисным). Не нарушая общности рассуждений, будем считать, что минор r -го порядка , расположенный в левом верхнем углу матрицы A , отличен от нуля: a11 ... a1r a1,r+1 . . . a1n ... ... ... ... ... ... a11 . . . a1r ar1 ... arr ar,r+1 . . . arn A= ar+1,1 . . . ar+1, r ar+1, r+1 . . . ar+1, n , M = . . . . . . . . . 6= 0 . ar1 . . . arr ... ... ... ... ... ... as1 ... asr as,r+1 . . . asn Тогда первые r столбцов матрицы A линейно независимы. Действительно, если бы между ними существовала бы какая-либо линейная зависимость, то такая же линейная зависимость существовала бы между столбцами минора M и поэтому минор M был бы равен нулю. Докажем теперь, что всякий столбец матрицы A линейно выражается через первые r её столбцов. Это очевидно для самих этих столбцов, т. е. для столбцов с номерами 1, 2, . . . , r . Рассмотрим столбец с номером l , где r < l 6 r + 1 . Построим 9 вспомогательный определитель (r + 1) -го порядка a11 . . . a1r a1l ... ... ... ... Mi = ar1 . . . arr arl ai1 . . . ai r ai l , получающийся "окаймлением"минора M соответствующими элементами l -го столбца и i -ой строки, где 1 6 i 6 s . При любом i определитель Mi равен нулю. Действительно, если i 6 r , то Mi = 0 как определитель с двумя одинаковыми строками, а если i > r , то Mi = 0 как минор (r + 1) -го пордка матрицы A . Разложив определитель Mi по последней строке, будем иметь ai1 A1 + ai2 A2 + . . . + air Ar + ai l M = 0 . Мы обозначили здесь алгебраические дополнения элементов aij в не через Aij , т. к. в действительности они не зависят от i : a11 . . . a1,j−1 a1,j+1 . . . a1r a1l (r+1)+j ... ... ... ... ... Aj = (−1) ... ... ar1 . . . ar,j−1 ar,j+1 . . . arr arl (1) Mi через Aj , а . Так как M 6= 0 , то из (1) получаем равенство ai l = − A2 Ar A1 ai1 − ai2 − . . . − air , M M M (2) которое справедливо для всех i = 1, 2, . . . , s . Поскольку коэффициенты разложения (2) от i не зависят, то это означает, что l -ый столбец матрицы A есть линейная комбинация первых r столбцов этой матрицы с коэффициентами − A1 , M − A2 , M ... , − Ar . M Таким образом, первые r столбцов матрицы A образуют базис системы всех столбцов этой матрицы. Следовательно, ранг системы столбцов матрицы A равен r . Совершенно аналогично доказывается, что ранг системы строк матрицы A также равен r . Впрочем, это следует из доказанного, если транспонировать матрицу A . Замечание 1. Из доказанной теоремы следует, что рангом матрицы мы могли бы назвать ранг системы её столбцов или ранг системы её строк. Замечание 2. Из доказанной теоремы видно, что если матрица A содержит отличный от нуля минор r -го порядка M , а все миноры (r + 1) -го порядка, окаймляющие M , равны нулю, то ранг матрицы A равен r . Поэтому на практике нет необходимости вычислять все миноры (r +1) -го порядка данной матрицы и убедиться, что они равны нулю. Достаточно проверить это лишь для тех миноров (r + 1) -го порядка, которые окаймляют ненулевой минор r -го порядка M . Замечание 3. Дказанная выше теорема о ранге матрицы даёт метод для практического вычисления ранга матрицы, а вместе с тем и для решения вопроса о существовании линейной зависимости между векторами данной системы. Действительно, 10 составляя матрицу, столбцами которой служат данные векторы, и вычисляя её ранг, мы найдём максимальное число линейно независимых векторов данной системы и даже её базис. Пример. 0 2 −4 −1 −4 5 0 2 1 7 , M = A= 3 = 2 6= 0 ; −1 −4 0 5 −10 2 3 0 0 0 2 −4 2 0 −1 −3 = 0, M3 = −1 −4 5 = −1 −4 −3 = −2 3 9 3 1 7 3 1 9 0 2 −4 2 −4 = 0, M4 = −1 −4 5 = 5 −10 0 5 −10 0 2 −4 M5 = −1 −4 5 = 20 + 12 − 32 = 0 ; 2 3 0 rgA = 2 . Заметим, что всего миноров 3-го порядка матрицы A данного примера C53 = 10 . Следствие. Определитель n -го порядка равен нулю тогда и только тогда, когда его столбцы (строки) линейно зависимы. Действительно, если столбцы или строки определителя ∆ линейно зависимы, то ∆ = 0 по свойству 8. Обратно, пусть ∆ = 0 . Тогда мы имеем квадратную матрицу n -го порядка, единственный минор n -го порядка которой равен нулю. Следовательно, наивысший порядок тличных от нуля миноров этой матрицы меньше n , т. е. её ранг меньше n . На основании доказанной теоремы отсюда заключаем, что столбцы (строки) этой матрицы линейно зависимы. Для вычисления ранга матрицы существует ещё один метод, не связанный с теоремой о ранге матрицы и не требующий вычисления определителей. Он применим, впрочем, только в том случае, когда мы хотим знать лишь ранг матрицы и не интересуемся тем, какие столбцы или строки образуют базис. Этот метод связан с понятием элементарных преобразований матрицы. Элементарными преобразованиями матрицы называются следующие её преобразования: 10 . транспозиция двух строк или столбцов, 20 . умножение строки или столбца на произвольное число, отличное от нуля, 30 . прибавление к одной строке (или столбцу) другой строки (или столбца), умноженной на некоторое число. Теорема 2. Элементарные преобразования не меняют ранга матрицы. 11 Для доказательства достаточно заметить, что элементарные преобразования матрицы не могут привести к равенству нулю какого-либо базисного минора или к неравенству нулю минора большей размерности. На этой теореме онован упомянутый способ вычисления ранга матрицы. Проиллюстрируем его на рассмотренном уже примере. Пример. A= 0 2 −1 −4 3 1 0 5 2 3 0 −1 ∼ 3 0 2 0 2 0 0 2 0 −1 −4 −3 −1 0 −3 ∼ 3 1 9 ∼ 3 0 9 0 0 0 0 5 0 2 3 6 2 0 6 0 0 2 0 1 0 0 0 −1 0 0 0 1 0 0 ∼ 0 0 0 ∼ 0 0 0 ; 0 0 0 0 0 0 0 0 0 0 0 0 0 0 4 5 7 −10 0 2 0 0 0 0 ∼ rgA = 2 . §2. Квадратичные формы 1. Понятие квадратичной формы Квадратичной формой от n переменных x1 , x2 , . . . , xn называется однородный многочлен 2-ой степени от этих переменных, т. е. выражение, содержащее квадраты переменных x1 , x2 , . . . , xn и их парные произведения, взятые с некоторыми коэффициентами. Условимся обозначать коэффициент при x2i через cii , а коэффициет при произведении xij (i 6= j) через 2cij . Тогда подробная запись квадратичной формы от n переменных будет иметь вид: ϕ (x1 , x2 , . . . , xn ) = c11 x21 + c22 x22 + . . . + cnn x2n + +2c12 x1 x2 + 2c13 x1 x3 + . . . + 2c1n x1 xn + 2c23 x2 x3 + . . . + 2c2n x2 xn + + . . . + 2cn−1,n xn−1 xn . Если члены, содержащие произведения переменных 2cij xi xj , представить в виде сумм cij xi xj + cji xj xi , считая cij = cj i , то предыдущей записи можно придать вид: ϕ (x1 , x2 , . . . , xn ) = n X cij xi xj = i,j=1 = c11 x21 + c12 x1 x2 + . . . + c1n x1 xn + +c21 x2 x1 + c22 x22 + . . . + c2n x2 xn + +..............................+ +cn1 xn x1 + cn2 xn x2 + . . . + cnn x2n . 12 (1) Матрица c11 c21 C= ... cn1 c12 c22 ... cn2 . . . c1n . . . c2n , ... ... . . . cnn (2) из коэффициентов выражения (1), называется матрицей квадратичной формы. Заметим, что она обладает следующим свойством: Ct = C. Такая матрица называется симметрической. Очевидно, всякая квадратичная форма от n переменных однозначно определяется заданием симметрической матрицы n -го порядка и наоборот. Ранг матрицы (2) называется рангом квадратичной формы (1). Будем рассматривать главным образом квадратичные формы от вещественных переменных и с вещественными коэффициентами. Очевидно, значения таких квадратичных форм также вещественны. Перейдём к новой системе координат по формулам x1 = p11 y1 + p12 y2 + . . . + p1n yn , x2 = p21 y1 + p22 y2 + . . . + p2n yn , (3) .............................. xn = pn1 y1 + pn2 y2 + . . . + pnn yn . Здесь (x1 , x2 , . . . , xn ) - старые координаты, а (y1 , y2 , . . . , yn ) - новые координаты одной и той же точки n -мерного пространства. Возникает вопрос: что произойдёт с квадратичной формой (1) при замене координат (3)? Легко сообразить, что она превратится в квадратичную форму от новых переменных y1 , y2 , . . . , yn уже с другими коэффициентами, а значит с другой матрицей. Пример. Пусть ϕ(x1 , x2 ) = x21 − 3x22 + 4x1 x2 и при этом x1 = 2y1 + y2 , x2 = y1 − y2 Тогда ϕ(x1 , x2 ) = (2y1 + y2 )2 − 3 (y1 − y2 )2 + 4 (2y1 + y2 )(y1 − y2 ) = 9y12 − 6y22 + 6y1 y2 . Таким образом, квадратичная форма ϕ(x1 , x2 ) = x21 − 3x22 + 4x1 x2 с матрицей 1 2 2 −3 преобразуется в квадратичную форму ϕ0 (y1 , y2 ) = 9y12 − 6y22 + 6y1 y2 с матрицей 9 3 3 −6 Рассмотрим этот вопрос более детально. Заметим сначала, что квадратичную форму (1) можно представить в виде: 13 ϕ (x1 , x2 , . . . , xn ) = x1 (c11 x1 + c12 x2 + . . . + c1n xn )+ +x2 (c21 x1 + c22 x2 + . . . + c2n xn )+ +........................···+ +xn (cn1 x1 + cn2 x2 + . . . + cnn xn ) = c11 x1 + c12 x2 + . . . + c1n xn c21 x1 + c22 x2 + . . . + c2n xn = (x1 x2 . . . xn ) · ........................... = cn1 x1 + cn2 x2 + . . . + cnn xn c11 c12 . . . c1n x1 c21 c22 . . . c2n x2 = (x1 x2 . . . xn ) · ... ... ... ... · ··· cn1 cn2 . . . cnn xn или короче ϕ = X t CX , (4) где x1 x2 X= ··· , xn X t = (x1 x2 . . . xn ) . Перепишем формулы (3) в матричной форме: x1 p11 p12 . . . p1n x2 p21 p22 . . . p2n ··· = ... ... ... ... xn pn1 pn2 . . . pnn или короче X = PY , y1 y2 ··· yn (5) (6) где p11 p21 P = ... pn1 p12 p22 ... pn2 . . . p1n . . . p2n ... ... . . . pnn - невырожденная матрица, называемая матрицей перехода. Подставляя (6) в (3) и учитывая, что (P Y )t = Y t P t , получим: ϕ = (P Y )t C(P Y ) = Y t (P t CP )Y или ϕ(x1 , x2 , . . . , xn ) = Y t C 0 Y = ϕ0 (y1 , y2 , . . . , yn ) , (7) C 0 = P t CP . (8) где Таким образом, при переходе от координат (x1 , x2 , . . . , xn ) к новым координатам (y1 , y2 , . . . , yn ) по формулам (3), квадратичная форма (1) превращается в квадратичную форму n X 0 ϕ (y1 , y2 , . . . , yn ) = c0ij yi yj (9) i,j=1 14 от новых переменных (y1 , y2 , . . . , yn ) с матрицей (8). При этом значение квадратичной формы в любой точке n -мерного пространства остаётся прежним. В рассмотренном выше примере 1 2 2 1 9 3 t 0 C= , P =P = , C = ; 2 −3 1 −1 3 −6 2 1 1 2 2 1 t P CP = · · = 1 −1 2 −3 1 −1 4 1 2 1 9 3 = · = =B. −1 5 1 −1 3 −6 Можно доказать, что при умножении любой матрицы слева или справа на невырожденную матрицу ранг исходной матрицы не изменяется. Так как матрица перехода невырожденна, то из равенства (8) следует, что при замене координат ранг квадратичной формы не меняется. 2. Канонический вид квадратичной формы Возникает вопрос: нельзя ли выбрать новую систему координат так, чтобы новые коэффициенты c0ij квадратичной формы, у которых i 6= j , равнялись нулю? Если это возможно, то преобразованная квадратичная форма (9) будет иметь вид: ϕ0 = λ1 y12 + λ2 y22 + . . . + λn yn2 , (10) а её матрица станет диагональной: λ1 0 . . . 0 0 λ2 . . . 0 C0 = ... ... ... ... . 0 0 . . . λn Специальный вид (10) квадратичной формы называется её каноническим видом, а ответ на поставленный вопрос даёт следующая теорема. Теорема 1. Всякая квадратичная форма может быть приведена к каноническому виду с помощью подходящей замены координат. Доказательство проведём по индукции по числу переменных в квадратичной форме. При n = 1 квадратичная форма уже имеет канонический вид: ϕ = c11 x21 . Остаётся доказать, что если теорема верна для квадратичной формы от n − 1 переменных, то она верна и для квадратичной формы от n переменных. Для этого рассмотрим два возможных случая. 1-ый случай. Среди коэффициентов c11 , c22 , . . . , cnn при квадратах переменных хотя бы один отличен от нуля. Пусть, например, c11 6= 0 . Рассмотрим выражение 1 ( c11 x1 + c12 x2 + . . . + c1n xn )2 . c11 15 Это - квадратичная форма от переменных x1 , x2 , . . . , xn и, как легко убедиться, содержит те же члены с x1 , что и квадратичная форма (1). Следовательно, разность ψ =ϕ− 1 ( c11 x1 + c12 x2 + . . . + c1n xn )2 c11 будет квадратичной формой от x2 , . . . , xn . Таким образом, ϕ= 1 ( c11 x1 + c12 x2 + . . . + c1n xn )2 + ψ , c11 где ψ - квадратичная форма от n − 1 переменных x2 , . . . , xn . По предположению индукции существует замена переменных q22 . . . q2n y2 = q22 x2 + . . . + q2n xn , . . . . . . . . . 6= 0 , ........................ qn2 . . . qnn yn = qn2 x2 + . . . + qnn xn , приводящая квадратичную форму ψ к каноническому виду ψ = λ2 y22 + . . . + λn yn2 . Тогда замена переменных y1 = c11 x1 + c12 x2 + . . . + c1n xn , y2 = q22 x2 + . . . + q2n xn , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. yn = qn2 x2 + . . . + qnn xn , c11 c12 . . . c1n q22 . . . q2n 0 q22 . . . q2n = c11 . . . . . . . . . ... ... ... ... qn2 . . . qnn 0 qn2 . . . qnn 6= 0 , очевидно приведёт квадратичную форму к каноническому виду: ϕ= 1 2 y1 + λ2 y22 + . . . + λn yn2 . c11 2-ой случай: c11 = 0, c22 = 0, . . . , cnn = 0 . переменных 1 −1 0 x1 = y1 − y2 , 1 1 0 x2 = y1 + y2 , 0 x3 = y3 , 0 1 ............ ... ... ... 0 xn = yn , 0 0 Пусть c12 6= 0 . Проведём замену ... 0 ... 0 ... 0 ... ... ... 1 = 2 6= 0 . Тогда член 2c12 x1 x2 примет вид 2c12 (y1 − y2 )(y1 + y2 ) = 2c12 y12 − 2c12 y21 . Таким образом, преобразованная квадратичная форма будет содержать квадраты (новых) переменных и задача сводится к 1-ому случаю. 16 Замечание. В процессе доказательства теоремы был описан практический метод приведения квадратичной формы к каноническому виду. Он называется методом Лагранжа. ϕ(x1 , x2 , x3 ) = 2x21 − x22 + 4x1 x2 − 2x1 x3 = Пример 1. = 1 1 ( 2x1 + 2x2 − x3 )2 − 2x22 − x23 + 2x2 x3 − x22 = 2 2 1 1 ( 2x1 + 2x2 − x3 )2 − 3x22 − x23 + 2x2 x3 = 2 2 1 1 1 1 = ( 2x1 + 2x2 − x3 )2 − ( 3x2 − x3 )2 + x23 − x23 = 2 3 3 2 1 1 1 = ( 2x1 + 2x2 − x3 )2 − ( 3x2 − x3 )2 − x23 = 2 3 6 1 1 1 = y12 − y22 − y32 ; 2 3 6 y1 = 2x1 + 2x2 − x3 , 2 2 −1 0 3 −1 = 6 6= 0 . y2 = 3x2 − x3 , 0 0 1 y3 = x3 , = Пример 2. ϕ(x1 , x1 x2 x3 x2 , x3 ) = 2x1 x2 − 6x2 x3 + 2x3 x1 . = y1 − y2 , y1 = 12 ( x1 + x2 ) , = y1 + y2 , y2 = 21 (−x1 + x2 ) , y3 = x3 . = y3 ; ϕ = 2 (y1 − y2 )(y1 + y2 ) − 6 (y1 + y3 ) y3 + 2y3 (y1 − y2 ) = = 2y12 − 2y22 − 4y1 y3 − 8y2 y3 = = 2 (y1 − y3 )2 − 2y32 − 2y22 − 8y2 y3 = = 2 (y1 − y3 )2 − 2 (y2 + 2y3 )2 + 8y32 − 2y32 = = 2 (y1 − y3 )2 − 2 (y2 + 2y3 )2 = 6y32 = = 2z12 − 2z22 + 6z32 ; z1 = y1 − y3 = 21 x1 + 21 x2 − x3 , z2 = y2 + 2y3 = − 12 x1 + 21 x2 + 2x3 , z3 = y3 = x3 , 1 1 −1 2 1 21 1 − = 6= 0 . 2 2 2 0 0 1 2 Канонический вид квадратитчной формы определяется неоднозначно: всякая квадратичная форма может быть приведена к каноническому виду многими различными способами. Так, например, квадратичная форма ϕ(x1 , x2 , x3 ) = 2x1 x2 − 6x2 x3 + 2x3 x1 из примера 2 с помощью замены переменных x1 = t1 + 3t2 + 2t3 , x2 = t1 − t2 − 2t3 , x3 = t2 17 приводится к каноническому виду ϕ = 2t21 + 6t22 − 8t23 , который отличается от полученного ранее. 3. Знакоопределённые квадратичные формы Пусть квадратичная форма приведена к каноническому виду (10). Среди чисел λ1 , λ2 , . . . , λn имеются столько отличных от нуля, каков ранг квадратичной формы. Некоторые из них могут быть положительными, другие - отрицательными. Возникает вопрос: что общего у всех канонических видов одной и той же квадратичной формы? Для вещественных квадратичных форм ответ на этот вопрос даёт следующая теорема, называемая законом инерции и принимаемая нами без доказательства. Теорема 2 (закон инерции). Если одна и та же квадратичная форма приводится к каноническому виду разными способами, то во всех случаях число положительных квадратов и число отрицательных квадратов (а значит и общее число квадратов) одинаково. Число положительных квадратов в каноническом виде квадратичной формы называется положительным индексом инерции этой формы и обозначается символом i+ , а число отрицательных квадратов называется её отрицательным индексом инерции и обозначается символом i− . Разность σ = i+ − i− между положительным и отрицательным индексами инерции квадратичной формы называется сигнатурой этой формы. Квадратичная форма от n переменных называется: положительно определённой, если её канонический вид состоит из n положительных квадратов, т. е. если i+ = n , отрицательно определённой, если её канонический вид состоит из n отрицательных квадратов, т. е. если i− = n , неопределённой, если её канонический вид содержит как положительные, так и отрицательные квадраты, полуопределённой (положительно или отрицательно), если её канонический вид содержит только квадраты одного знака, но меньше, чем n . Следует отметить, что в действительности всегда можно добиться того, чтобы в каноническом виде квадратичной формы коэффициенты при квадратах равнялись 1 или -1. Действительно, пусть квадратичная форма ранга r приведена к каноническому виду 2 − . . . − λr yr2 , (11) ϕ = λ1 y12 + . . . + λk yk2 − λk+1 yk+1 где λ1 , . . . , λk , λk+1 , . . . , λr все положительны. Тогда, если провести дополнительную замену переменных p p z1 = λ1 y1 , . . . , zk = λk yk , p p zk+1 = λk+1 yk+1 , . . . , zr = λr yr , zr+1 = yr+1 , . . . , zn = yn , квадратичная форма (11) примет вид 2 − . . . − zr2 , ϕ = z12 + . . . + zk2 − zk+1 18 называемый нормальным видом квадратичной формы. Во многих вопросах большую роль играют положительно определённые формы. Они характеризуются следующим свойством. Теорема 3. Для того, чтобы квадратичная форма от n переменных x1 , x2 , . . . , xn была положительно определённой, необходимо и достаточно, чтобы она принимала положительные значения при любых значениях переменных x1 , x2 , . . . , xn , не равных одновременно нулю. Доказательство. Пусть квадратичная форма ϕ (x1 , x2 , . . . , xn ) положительно определённая. Тогда она приводима к нормальному виду ϕ (x1 , x2 , . . . , xn ) = x21 + x22 + . . . + x2n , откуда ясно, что если переменные x1 , x2 , . . . , xn не все равны нулю, то ϕ (x1 , x2 , . . . , xn ) > 0 . Обратно, пусть ϕ (x1 , x2 , . . . , xn ) > 0 при любых значениях x1 , x2 , . . . , xn , не равных нулю одновременно. Тогда в её нормальном виде все коэффициенты при квадратах равны +1. Действительно, в противном случае можно подобрать значения переменных x1 , x2 , . . . , xn так, чтобы ϕ (x1 , x2 , . . . , xn ) < 0 или ϕ (x1 , x2 , . . . , xn ) = 0 . Например, квадратичная форма ϕ1 (x1 , x2 , x3 ) = x21 + x23 равна нулю при x1 = 0, x2 6= 0, x3 = 0 , а квадратичная форма ϕ1 (x1 , x2 , x3 ) = x21 − x22 + x23 при тех же значениях переменных отрицательна. Доказанная теорема может служить другим определением положительной определённости квадратичной формы. Как критерий положительной определённости квадратичной формы на практике она мало пригодна. Более удобный критерий положительной определённости даёт следующая теорема (без доказательства). Теорема 4 (критерий Сильвестра). Для того, чтобы квадратичная форма ϕ (x1 , x2 , . . . , xn ) (12) была положительно определённой, необходимо и достаточно, чтобы все диагональные миноры её матрицы были положительными: ∆1 = c11 > 0 , c c ∆2 = 11 12 c21 c22 ... > 0, c11 c12 c13 ∆3 = c21 c22 c23 c31 c32 c33 > 0, ... ∆n = det C > 0 . Для того, чтобы квадратичная форма (12) была отрицательно определённой, необходимо и достаточно, чтобы диагональные миноры её матрицы удовлетворяли условиям: ∆1 < 0 , ∆2 > 0 , ∆3 < 0 , . . . , (−1)n ∆n > 0 . 19 Линейные пространства и линейные операторы 1. Понятие линейного пространства В разных разделах курса высшей математики мы имели дело с объектами различной природы - числами (действительными и комплексными), векторами (направленными отрезками) на плоскости и в пространстве, функциями одной или нескольких переменных и т. д. Над объектами каждого типа производились т. н. линейные операции: сложение и умножение на число (скаляр). Эти операции, несмотря на различие в их определении и в природе объектов, над которыми они производятся, обладают существенными общими свойствами. Благодаря этому, отвлекаясь от конкретной природы этих объектов и от конкретного смысла (линейных) операций над ними, можно построить содержательную общую теорию, результаты которой применимы к каждому конкретному типу перечисленных (и некоторых других) объектов. Основным понятием этой теории является понятие линейного (векторного) пространства, которое определяется аксиоматически. В определении линейного пространства фигурируют два множества: множество K скаляров или чисел ("числовое поле") и множество L объектов, называемых "векторами". В нашем курсе под множеством чисел K будем понимать либо множество всех действительных чисел (числовое поле R ), либо множество всех комплексных чисел (числовое поле C ). Под "векторами" будем понимать объекты самой различной природы: направленные отрезки, матрицы, функции одной или нескольких переменных и т. д. Числа (скаляры) будем обозначать греческими буквами, а "векторы" малыми латинскими буквами. Определение. Множество L называется линейным (векторным) пространством над полем K , если над его элементами определены операции сложения и умножения на число, удовлетворяющие следующим требованиям (аксиомам): 1◦ . x + y = y + x , ∀ x, y ∈ L (коммутативность сложения); 2◦ . (x + y) + z = x + (y + z) , ∀ x, y, z ∈ L (ассоциативность) сложения ◦ 3 . ∀ x ∈ L , ∃ 0 ∈ L : x + 0 = 0 + x = x (существование нулевого) вектора ; ◦ 4 . ∀ x ∈ L , ∃ x0 ∈ L : x + x0 = x0 + x = 0 (x0 = −x) (существование противоположного вектора); ◦ 5 . α(βx) = (αβ)x , ∀ x ∈ L , ∀ , α , β ∈ K (ассоциативность умножения на число); ◦ 6 . α(x + y) = αx + αy , ∀ x, y ∈ L , ∀α ∈ K (дистрибутивность умножения вектора на число отностельно сложения векторов); 7◦ . (α + β)x = αx + βx , ∀ x ∈ L , ∀α , β ∈ K (дистрибутивность умножения вектора на число отностельно сложения чисел); ◦ 8 . 1 · x = x , ∀x ∈ L , (1 ∈ K) . 20 Линейное пространство L называется действительным (или вещественным), если K = R , и комплексным, если K = C . Аксиомы 1◦ − 8◦ представляют собой обычные свойства векторов, известные из элементарной векторной алгебры. Из них выводятся и другие привычные свойства линейных операцийнад векторами. В частности, с помощью аксиомы 4◦ можно ввести в линейное пространство L операцию вычитания, называя разностью векторов x − y сумму x + (−y) . 2. Базис, координаты, размерность Определение. Базисом линейного пространства L называется всякая система векторов из L , удовлетворяющая следующим двум условиям: 1) она линейно независима, 2) всякий вектор из L через неё линейно выражается. Линейное пространство L называется конечномерным, если в нём имеется конечный базис. В противном случае линейное пространство называется бесконечномерным. Пусть линейное пространство L имеет базис, состоящий из n векторов e1 , e2 , . . . , en . (1) Тогда по условю 2) всякий вектор x ∈ L можно представить в виде x = ξ 1 e1 + ξ 2 e2 + . . . + ξ n en . (2) Выражение (2) называется разложением вектора x по базису (2). Покажем, что разложение (2) единственно. Действительно, пусть x = ξ˜1 e1 + ξ˜2 e2 + . . . + ξ˜n en . (3) - другое разложение вектора x по базису (1). Тогда вычитая (1) из (2), плучим (ξ˜1 − ξ 1 )e1 + (ξ˜2 − ξ 2 )e2 + . . . + (ξ˜n − ξ n )en = 0 , откуда, в силу условия 1), ξ˜1 = ξ 1 , ξ˜2 = ξ 2 , . . . , ξ˜n = ξ n . Коэффициенты ξ 1 , ξ 2 , . . . , ξ n разложения (2) называются координатами вектора x относительно базиса (1). Очевидно, два вектора равны тогда и только тогда, когда они имеют равные координаты относительно данного базиса. Легко видеть, что при сложении векторов их координаты складываются, а при умножении вектора на число его координаты умножаются на это число. Действительно, пусть векторы x и y имеют в базисе (1) соотвественно координаты (ξ 1 , ξ 2 , . . . , ξ n ) и (η 1 , η 2 , . . . , η n ) , то есть x = ξ 1 e1 + ξ 2 e2 + . . . + ξ n en = n X i=1 21 ξ i ei , 1 2 n y = η e1 + η e2 + . . . + η en = n X η i ei . i=1 Тогда 1 1 2 2 n n x + y = (ξ + η )e1 + (ξ + η )e2 + . . . + (ξ + η )en = n X (ξ i + η i )ei . i=1 λ x = (λξ 1 )e1 + (λξ 2 )e2 + . . . + (λξ n )en = n X (λξ i ) . i=1 Можно доказать, что в конечномерном линейном пространстве L все базисы содержат одно и то же число векторов. Это число называется размерностью линейного пространства L и обозначается dimL . Если dimL = n , то линейное пространство L называется n -мерным и обозначается Ln . 3. Примеры линейных пространств Пример 1. Множество всех геометрических векторов (направленных отрезков) плоскости представляет собой 2-мерное вещественное линейное пространство. Проверить! Аналогично, множество всех геометрических векторов пространства представляет собой 3-мерное вещественное линейное пространство. Пример 2. Множество C всех комплексных чисел α + βi можно рассматривать как 2-мерное вещественное линейное пространство или как 1-мерное комплексное линейное пространство. В первом случае базисом может служить пара (1 , i) , а во втором - число 1. Аналогично, множество всех вещественных чисел R можно рассматривать как 1-мерное вещественное линейное пространство (базисом может служить, например, число 1). Пример 3. Арифметическое пространство Rn n -мерных векторов вида (α1 , α2 , . . . , αn ) (векторов-строк или векторов-столбцов) является n -мерным вещественным линейным пространством. Указать один из базисов этого пространства! Аналогично, Cn - n -мерное комплексное линейное пространство. Пример 4. Множество всех квадратных матриц n -го порядка представляет собой линейное пространство размерности n2 , вещественное или комплексное в зависимости от того, вещественны или комплексны элементы этих матриц. Указать один из базисов пространства квадратных матриц 2-го порядка! Пример 5. Множество всех многочленов P (t) = α0 + α1 t + α2 t2 + . . . + αn tn степени 6 n есть линейное пространство размерности n + 1 , вещественное или комплексное в зависимости от того, вещественны или комплексны коэффициенты этих многочленов. Одним из базисов этого пространства может служить система 1 , t , t2 , . . . , tn . Действительно, всякий многочлен P (t) степени 6 n можно разложить по этой системе. Покажем, что она (система) линейно независима. Пусть λ0 · 1 + λ1 t + λ2 t2 + . . . + λn tn ≡ 0 . 22 Тогда все коэффициенты λ0 , λ1 , . . . , λn равны нулю, так как в противном случае многочлен, стоящий слева, имел бы не более n корней, т. е. равенство выполнялось бы не тождественно, а лишь для конечного числа значений переменной t . Замечание. Множество всех многочленов степени = n не является линейным пространством, т. к. сумма двух многочленов степени n может иметь степень < n . Пример 6. Множество всех многочленов P (t) всех возможных степеней - также линейное пространство. Оно бесконечномерно, т. к. в нём можно найти любое число линейно независимых векторов, например, 1 , t , t2 , . . . , tn . Определение. Подмножество M линейного пространства L называется его подпространством, если оно само является линейным пространством. Для этого необходимо выполнение двух условий: 1) x , y ∈ M =⇒ x + y ∈ M , 2) x ∈ M =⇒ λx ∈ M , ∀λ ∈ K . Напрмер, линейное пространство из примера 5 является подпространством линейного пространства из примера 6. 4. Функциональные пространства Нас будут интересовать главным образом такие линейные пространства, элементами которых являются функции. Ради краткости, условимся называть такие пространства "функциональными пространствами", не давая однако точного определения этому термину. Рассмотрим несколько примеров таких пространств. Пример 1. Множество C [ a , b ] всех вещественных функций вещественного аргумента f (t) , определённых и непрерывных на отрезке [ a , b ] . Пример 2. Множество C [ a , b ] всех комплекснозначных функций одного вещественного аргумента f (t) , определённых и непрерывных на отрезке [ a , b ] . Пример 3. Множество C k [ a , b ] всех вещественных функций одного вещественного аргумента f (t) , определённых и k раз непрерывно дифференцируемых на отрезке [ a , b ] . Пример 4. То же множество функций, что и в предыдущем примере, при дополнительном условии вида: a) f (a) = 0 , f (b) = 0 , b) f(a) = 0 , f 0 (b) = 0 , αf (a) + βf 0 (b) = 0 , c) γf (a) + δf 0 (b) = 0 , d) f 0 (a) = 0 , f 00 (b) = 0 (k > 2) и т. д. Все пространства из примеров 1 - 4 бесконечномерны. 23 (1) Пример 5. Рассмртрим множество решений линейного однородного дифференциального уравнения L [ y ] = y (n) + p1 (x) y (n−1) + p2 (x) y (n−2) + . . . + pn (x) y = 0 (2) в области изменения [ a , b ] аргумента. Из теорем о решениях уравнения такого вида известно, что они образуют линейное пространство. Любое решение уравнения (2) выражается в виде линейной комбинации y = C1 y1 + C2 y 2 + . . . + Cn yn , (3) где y1 , y2 , . . . , yn составляют фундаментальную систему частных решений. Так как эти частные решения линейно независимы, то они образуют базис линейного пространства решений уравнения (2), которое, следовательно, имеет размерность n , равную порядку уравнения (2). Коэффициенты C1 , C2 , . . . , Cn из соотношения (3) можно рассматривать как координаты решения y в базисе {y1 , y2 , . . . , yn } . Пример 6. Множество функций 2 переменных u(x , y) , определённых в некоторой области D на плоскости xOy . Пример 7. Подмножество пространства предыдущего примера, состоящее из функций, удовлетворяющих уравнению Лапласа ∆u = ∂2u ∂2u + = 0. ∂x2 ∂y 2 (4) Как линейное пространство из примера (6), так и его подпространство из примера (7), бесконечномерны. Пример 8. Подмножество пространства решений дифференциального уравнения (2), которые удовлетворяют каким-либо граничным (краевым) условиям вида y 0 (b) = 0 . y(a) = 0 , (5) Замечание. Возвращаясь к примеру 4, заметим, что добавочные условия вида (1), наложенные на функции некоторого линейного пространства, выделяют из последнего линейное подпространство только при соблюдении условия: вместе со всякими функциями f (x) и g(x) , удовлетворяющими добавочным условиям, им должны удовлетворять также и функции f (x) + g(x) и λf (x) , где λ - скаляр (почему?); другими словами, если некоторые функции удовлетворяют добавочным условиям, нужно, чтобы им удовлетворяла всякая линейная комбинация этих функций. Добавочные условия, удовлетворяющие этому требованию, называются однородными. Заметим, что условия (1) и (5) однородны. Легко проверить, что функции из примера (3), подчинённые неоднородному добавочному условию, например, f (a) = 0 , f (b) = 1 , не образуют линейного пространства. 24 5. Евклидовы и унитарные пространства Определение 1. Говорят, что в вещественном линейном пространстве L(R) задано скалярное произведение, если каждой паре векторов x, y ∈ L(R) сопоставлено вещественное число, обозначаемое (x, y) , так, что выполняются следующие условия (аксиомы): 1) (x, y) = (y, x) , ∀x, y ∈ L (коммутативность), 2) (x1 + x2 , y) = (x1 , y) + (x2 , y), ∀x1 , x2 , y ∈ L (дистрибутивность относительно сложения), 3) (λx, y) = λ (x, y), ∀x, y ∈ L , ∀λ ∈ R , (однородность) 4) (x, x) > 0 , ∀x ∈ L , причём (x, y) = 0 ⇐⇒ x = 0 . Вещественное линейное пространство L(R) , в котором определено скалярное произведение, удовлелетворяющее аксиомам 1) - 4), называется евклидовым линейным пространством . Обозначение: E , En . Определение 2. Говорят, что в комплексном линейном пространстве L(C) задано скалярное произведение, если каждой паре векторов x, y ∈ L(C) сопоставлено комплексное число, обозначаемое (x, y) , так, что выполняются следующие условия (аксиомы): 10 ) (x, y) = (y, x) , ∀x, y ∈ L (коммутативность), 20 ) (x1 + x2 , y) = (x1 , y) + (x2 , y), ∀x1 , x2 , y ∈ L (дистрибутивность относительно сложения), 30 ) (λx, y) = λ (x, y), ∀x, y ∈ L , ∀λ ∈ C , (однородность) 40 ) (x, x) > 0 , ∀x ∈ L , причём (x, y) = 0 ⇐⇒ x = 0 . Комплексное линейное пространство L(C) , в котором определено скалярное произведение, удовлелетворяющее аксиомам 1’) - 4’), называется унитарным линейным пространством . Обозначение: U , Un . Заметим, что из аксиом 1’) и 3’) следует, что (λx, y) = λ̄ (x, y), ∀x, y ∈ L , ∀λ ∈ C . Два вектора евклидоа или унитарного пространства называются ортогональными, если их скалярное произведение равно нулю. Модулем |x| вектора x называется квадратный корень из его скалярного кадрата (в случае функционального пространства употребляется термин "норма"и обозначение ||.|| ). Пример 1. Пространство вещественных функций C [ a , b ] , определённых и непрерывных на отрезке [ a , b ] , со скалярным произведением Z (x, y) = (f (t) , g(t)) = b f (t) g(t) dt (1) a есть евклидово пространство. Норма функции f (t) в C [ a , b ] определяется поформуле s Z b f 2 (t)dt . (2) ||x|| = ||f (t)|| = a 25 Пример 2. Пространство комплекснозначных функций C [ a , b ] , определённых и непрерывных на отрезке [ a , b ] , со скалярным произведением Z b f (t) g(t) dt (x, y) = (f (t) , g(t)) = (3) a есть унитарное пространство. Норма функции f (t) в C [ a , b ] определяется поформуле s Z b f (t)f (t)dt . ||x|| = ||f (t)|| = (4) a Пример 3. Пусть в пространстве C [ a , b ] задана положительная непрерывная функция ρ(t) . Тогда скалярное произведение в C [ a , b ] для произвольных векторов x = f (t) и y = g(t) можно определить по формуле Z b ρ(t) f (t) g(t) dt . (x, y) = (f , g) = (5) a Норма функции в C [ a , b ] определяется в этом случае формулой Z 2 ||f || = b ρ(t) f 2 (t) dt . (6) a Функция ρ(t) называется весовой функцией. Если Z b (f , g) = ρ(t) f (t) g(t) dt = 0 , a то говорят, что функции f (t) и g(t) ортогональны с весом ρ(t) . 6. Гильбертово пространство В дальнейшем мы будем иметь дело главным образом с бесконечномерными евклидовыми или унитарными пространствами (как правило, функциональными). Среди таких пространств особую роль играют так называемые гильбертовы пространства. Так называются бесконечномерные евклидовы (или унитарные) пространства, удовлетворяющие одному дополнительному условию (условию полноты), о котором мы можем дать здесь лишь общее представление. Пусть в обычном 3-мерном (или вообще конечномерном) евклидовом пространстве дана последовательность векторов x 1 , x2 , . . . , x n , . . . (1) Говорят, что последовательность (1) сходится к вектору a , если lim |xn − a| = 0 . n→∞ Вопрос о сходимости последовательности векторов бесконечномерного пространства не так прост, так как могут рассматриваться различные, неравносильные между 26 собой, виды сходимости. Например, в функциональном пространстве сходимость последовательности f1 (t) , f2 (t) , . . . , fn (t) , . . . (2) к некоторой функции можно понимать как обычную сходимость (т. е. как сходимость в каждой точке t ), как равномерную сходимость (о ней известно из теории рядов) или как сходимость "по норме": lim ||fn (t) − f (t)|| = 0 . (3) n→∞ Дополнительное требование (полноты), о котором говорилось выше, может быть сформулировано так: для любой последовательности функций (2) данного евклидова (или унитарного) пространства L выполнение условия lim ||fk (t) − fl (t)|| = 0 k,l→∞ всегда влечёт за собой существование для этой последовательности предельной ("по норме") функции f (t) , также принадлежащей пространству L . 7. Линейные операторы Определение. Линейным оператором, действующим в векторном пространстве L , называется всякая векторная функция векторного аргумента y = A(x) , определённая на L и удовлетворяющая условиям (линейности): 1) ∀ x1 , x2 ∈ L , A(x1 + x2 ) = A(x1 ) + A(x2 ) , 2) ∀ x ∈ L , ∀ λ ∈ K , A(λx) = λA(x) . Пример 1. Пусть в линейном пространстве L задан базис e1 , e2 , . . . , en и пусть вектор x имеет в этом базисе координаты x1 , x2 , . . . , xn , т. е. x = x1 e1 + x2 e2 + · · · + xn en , Тогда линейное преобразование 1 y = a11 x1 + a12 x2 + · · · + a1n xn , 2 y = a21 x1 + a22 x2 + · · · + a2n xn , .............................. n y = an1 x1 + an2 x2 + · · · + ann xn (x = xi ei ) . (y i = cij xj ) (1) определяет вектор y = y 1 e1 + y 2 e2 + · · · + y n en (y = y i ei ) того же пространства L . Таким образом, линейное преобразование (1) каждому вектору x ∈ L n сопоставляет некоторый вектор y ∈ L n и при этом, как легко видеть, выполняются условия линейности: A(x1 + x2 ) = A(x1 ) + A(x2 ) , A(λx) = λA(x) . Значит, линейное преобразование является линейным оператором, действующим в L n , в смысле нашего определения. 27 Заметим при этом, что уравнения (1) линейного преобразования можно представить в матричной форме следующим образом: 1 1 1 y x a1 a12 . . . a1n y 2 a21 a22 . . . a2n x2 ... = ... ... ... ... ... yn an1 an2 . . . ann xn или короче Y = AX . Определение. Вектор x 6= 0 называется собственным вектором линейного оператора A , если существует число λ такое, что Ax = λx . (2) Число λ при этом называется собственным значением оператора A . В случае линейного преобразования пространства Ln условие (1) можно представить в виде 1 1 1 x x a1 a12 . . . a1n x2 a21 a22 . . . a2n x2 ... ... ... ... ... = λ ... xn xn an1 an2 . . . ann или короче AX = λX , т. е. (A − λE) X = O или подробно a11 − λ a12 2 2 a1 a2 − λ ... ... n an2 a1 1 x ... a1n x2 ... a2n ... ... ... . . . ann − λ xn 0 0 = ... . 0 (3) Для того, чтобы это матричное уравнение имело ненулевое решение (почему ненулевое?), необходимо, чтобы 1 a1 − λ a12 ... a1n a21 a22 − λ . . . a2n = 0. (4) ... ... ... . . . an an2 . . . ann − λ 1 Равенство (4) представляет собой алгебраическое уравнение n -ой степени относительно λ , называемое характеристическим уравнением. Решая его, мы найдём собственные значения линейного преобразования (1). Подставляя их поочерёдно в (3) и решая соответствующие системы линейных уравнений, мы найдём для каждого собственного значения соответствующие собственные векторы данного линейного преобразования. 28 Пример 1. Найти собственные значения и собственные векторы линейного преобразования 1 y = x1 − 3x2 + x3 , y 2 = 3x1 − 3x2 − x3 , 3 y = 3x1 − 5x2 + x3 . Матрица линейного преобразования: 1 −3 1 A = 3 −3 −1 . 3 −5 1 Характеристическое уравнение: 1−λ −3 1 3 −3 − λ −1 3 −5 1−λ = λ3 + λ2 − 4λ − 4 = 0 , Собственные значения: λ1 = −1 , λ2 = 2 , λ3 = −2 . Для λ1 = −1 система уравнений (3) примет вид: 1 2x − 3x2 + x3 = 0 , 3x1 − 2x2 − x3 = 0 , 1 3x − 5x2 + 2x3 = 0 . Решая эту систему, найдём собственные векторы, соответствующие собственному значению λ1 = −1 : x1 = (x1 , x2 , x3 ) = c (1 , 1 , 1) , где c - произвольное число. Аналогично для собственных значений λ2 = 2 и λ3 = −2 соствим системы уравнений 1 −x1 − 3x2 + x3 = 0 , 3x − 3x2 + x3 = 0 , 3x1 − 5x2 − x3 = 0 , 3x1 − x2 − x3 = 0 , 1 3x − 5x2 − x3 = 0 , 3x1 − 5x2 + 3x3 = 0 , решая которые, найдём соответствующие собственные векторы: x2 = c (4 , 1 , 2) и x3 = c (2 , 3 , 3) . Пример 2. Для линейного преобразования 1 y = 7x1 − 12x2 + 6x3 , y 2 = 10x1 − 19x2 + 10x3 , 3 y = 12x1 − 24x2 + 13x3 составим характеристическое уравнение 7−λ −12 6 10 −19 − λ 10 312 −24 13 − λ = λ 3 − λ2 − λ + 1 = 0 . 29 Решая его, найдём собственные значения λ1 = 1 , λ2 = λ3 = −1 . 1 8x − 12x2 + 6x3 = 0 , 10x1 − 18x2 + 10x3 = 0 , λ1 = −1 : x = c (3 , 5 , 6) ; 1 2 3 12x − 24x + 14x = 0 . 1 1 6x − 12x2 + 6x3 = 0 , x = 2x2 − x3 , 1 2 3 10x − 20x + 10x = 0 , x2 = x2 , λ2 = λ3 = 1 : 12x1 − 24x2 + 12x3 = 0 , x3 = x3 , 1 x 2 −1 x2 = c1 1 + c2 0 , x = c1 (2 , 1 , 0) + c2 (−1 , 0 , 1) . x3 0 1 Определение. Линейный оператор A∗ , действующий в евклидовом или унитарном пространстве L , называется сопряжённым к линейному оператору A , если ∀ x, y ∈ L , (Ax , y) = (x , A∗ y) . Определение. Линейный оператор A , действующий в евклидовом или унитарном пространстве L , называется самосопряжённым, если A∗ = A , т. е. если ∀ x, y ∈ L , (Ax , y) = (x , Ay) . Отметим два важных свойства самосопряжённого оператора: 1. Все собственные значения самосопряжённого линейного оператора вещественны. 2. Собственные векторы самосопряжённого оператора, соответствующие неравным между собой собственным значениям, попарно ортогональны. 8. Задача Штурма - Лиувилля и её обобщения Пусть C k [a, b] - линейное пространство всех вещественных функций вещественного аргумента , определённых и k раз непрерывно дифференцируемых на отрезке [a, b] . Важнейшим примером линейного оператора в таком пространстве является так называемый линейный дифференциальный оператор L[y] = a0 (x) y (n) + a1 (x) y (n−1) + · · · + an (x) y . Нас будет интересовать дифференциальный оператор более специального вида dy d p (x) + r(x) y , p (x) > 0 , L[y] = dx dx называемый оператором Штурма - Лиувилля. Его можно записать в развёрнутом виде так: L[y] = p (x) y 00 + p0 (x) y 0 + r(x) y . 30 Задача Штурма - Лиувилля состоит в отыскании собственных значений и собственных функций оператора Штурма - Лиувилля. При этом на функции, кроме условий дифференцируемости, налагаются ещё граничные условия одного из типов: 1) 2) 3) 4) y (a) = 0 , y (b) = 0 , y 0 (a) = 0 , y 0 (b) = 0 , y 0 (a) = h1 y (a) , y 0 (b) = h2 y (b) , y (a) = y (b) , p (a) y 0 (a) = p (b) y 0 (b) . Задача Штурма - Лиувилля может быть сформулирована ещё так: найти вещественные ненулевые решения дифференциального уравнения L[y] = λy, где L [ y ] - оператор Шттурма - Лиувилля, удовлетворяющий граничным условиям одного из 4 указанных типов. Отметим без доказательства некоторые свойства оператора (задачи) Штурма Лиувилля: 1. Все собственные значения оператора Штурма - Лиувилля вещественны. 2. Собственные функции оператора Штурма - Лиувилля, соответствующие неравным собственным значениям, попарно ортогональны: Z b L[u] = λu L[v] = µv u(x) v(x) dx = 0 =⇒ a λ 6= µ 3. Собственные значения задачи Штурма - Лиувилля с граничными условиями типов 1), 2) и 3) являются простыми, т. е. каждому из них соответствует (с точностью до числового множителя) одна единственная собственная функция. 4. Задача Штурма - Лиувилля имеет бесконечное множество собственных значений, которые можно расположить так, что −λ1 < −λ2 < . . . < −λn < · · · Соответствующая система собственных функций u1 (x) , u2 (x) , . . . , un (x) , . . . ортогональна. Её можно нормировать так, чтобы kuk (x)k = 1 , т. е. чтобы Z (uk , ul ) = a b k = 1 , 2, . . . , n , . . . , ( 1 при k = l , uk (x) ul (x) dx = 0 при k 6= l . Рассмотрим теперь некоторые обобщения задачи Штурма - Лиувилля. Пусть ρ(x) - непрерывная положительная функция на отрезке [a ,b]. Тогда рассмотренная нами задача Штурма - Лиувилля может считаться частным случаем более общей задачи, состоящей в отыскании ненулевых решений дифференциального уравнения L [ y ] = λ ρ(x) y 31 с теми же граничными условиями, что и ранее. Функция ρ(x) называется весовой функцией, а сама задача - задачей Штурма - Лиувилля с весовой функцией. Свойства - те же (ортогональность - с весом). Мы получим новое обобщение задачи Штурма - Лиувилля, если допустим, что в операторе Штурма - Лиувилля dy d p (x) + r(x) y L[ y ] = dx dx функция p (x) , которая раньше считалась положительной всюду на [a , b] , может обращаться в нуль в точках x = a и x = b (или хотя бы в одной из них), оставаясь положительной в остальных точках отрезка [a , b] . Но тогда появляется новый тип граничных условий: решения должны быть ограниченными в точках, где p (x) = 0 , т. е. при x = a или x = b (или в обеих этих точках). Это объясняется тем, что точки, в которых коэффициент при старшей производной в дифференциальном уравнении равняется нулю, являются особыми для его решений. Поясним это на простом примере. Уже уравнение 1-го порядка x y 0 = 1 имеет решение y = ln |x|+C , разрывное в точке x = 0 (оно неограниченно возрастает при x → 0 ). Аналогичная ситуация может иметь место при обращении в нуль коэффициента при y 00 в операторе Штурма - Лиувилля. Ещё одно обобщение задачи Штурма - Лиувилля возникает при замене промежутка [ a , b ] бесконечным промежутком [ a , +∞) или (−∞ , +∞) . При этом вводятся разные виды граничных условий при x → ±∞ . Таким условием может служить, например, требование ограниченности решений y(x) при x → ±∞ . Более слабым условием является требование, чтобы решения росли (по модулю) при x → ±∞ не быстрее, чем степенная функция при некотором значении показателя степени. Ещё слабее является требование y(x) → 0 при x → ±∞ ex и т. д. Важно, чтобы условия были однородными. Обобщения задачи Штурма - Лиувилля для комплекснозначных функций и для функций нескольких переменных рассматривать не будем. 32