Несобственный интеграл. Определение 1. Пусть 𝑎 - произвольное действительное число, и пусть функция 𝑓(𝑥) 𝐴 интегрируема на отрезке [𝑎, 𝐴] для любого числа 𝐴 > 𝑎. Обозначим 𝐹(𝐴) = ∫𝑎 𝑓(𝑥)𝑑𝑥. Выражение lim 𝐹(𝐴) называется несобственным интегралом первого рода функции 𝑓(𝑥) 𝐴→+∞ +∞ и обозначается ∫𝑎 𝑓(𝑥)𝑑𝑥. Замечание. Обычно, если этот предел существует и конечен, то говорят, что интеграл +∞ сходится, если он не существует или равен бесконечности, то выражение ∫𝑎 𝑓(𝑥)𝑑𝑥 понимают как символ и говорят, что интеграл расходится. 𝑎 𝑎 Аналогично ∫−∞ 𝑓(𝑥)𝑑𝑥 = lim ∫𝐴 𝑓(𝑥)𝑑𝑥 (если функция 𝑓(𝑥) интегрируема на отрезке 𝐴→−∞ [𝐴, 𝑎] для любого 𝐴 < 𝑎); +∞ 𝑎 +∞ ∫−∞ 𝑓(𝑥)𝑑𝑥 = ∫−∞ 𝑓(𝑥)𝑑𝑥 + ∫𝑎 𝐴″ 𝑎 𝑓(𝑥)𝑑𝑥 = ′lim ∫𝐴′ 𝑓(𝑥)𝑑𝑥 + ″lim ∫𝑎 𝑓(𝑥)𝑑𝑥 𝐴 →−∞ 𝐴 →+∞ +∞ для любого действительного числа 𝑎, причем интеграл ∫−∞ 𝑓(𝑥)𝑑𝑥сходится в том и только в том случае, когда сходится каждый из интегралов в правой части. Теорема 1 (замена переменной в несобственном интеграле). Пусть 1) функция 𝑓(𝑥) непрерывна на промежутке [𝑎, +∞); 2) функция 𝑥 = 𝑔(𝑡) определена, строго монотонна и непрерывно дифференцируема на промежутке [𝛼, +∞) (или на промежутке (−∞, 𝛼]); 3) множеством значений функции 𝑔(𝑡) является промежуток [𝑎, +∞); 4) 𝑔(𝛼) = 𝑎. +∞ +∞ +∞ 𝛼 Тогда ∫𝑎 𝑓(𝑥)𝑑𝑥 = ∫𝛼 𝑓(𝑔(𝑡))𝑔′ (𝑡)𝑑𝑡 (или ∫𝑎 𝑓(𝑥)𝑑𝑥 = − ∫−∞ 𝑓(𝑔(𝑡))𝑔′ (𝑡)𝑑𝑡). Доказательство. Пусть 𝐴 > 𝑎. Тогда функция 𝑥 = 𝑔(𝑡) строго монотонна на отрезке [𝛼, 𝛽] (или на отрезке [𝛽, 𝛼]), где 𝛽 - действительное число, такое, что 𝑔(𝛽) = 𝐴. Отсюда, применяя теорему о замене переменной в определенном интеграле, получим: A f ( x)dx = f ( g (t )) g (t )dt (= − ∫𝛽 𝑓(𝑔(𝑡))𝑔′(𝑡)𝑑𝑡). 𝛼 Так как функция 𝑔(𝑡) строго a монотонна, то 𝐴 → +∞ тогда и только тогда, когда 𝛽 → +∞(𝛽 → −∞). Значит, переходя к + + a пределу, имеем f ( x)dx = f ( g (t )) g (t )dt (= − ∫−∞ 𝑓(𝑔(𝑡))𝑔′ (𝑡)𝑑𝑡). Теорема доказана. 𝛼 Теорема 2 (интегрирование по частям в несобственном интеграле). Пусть функции 𝑓(𝑥), 𝑔(𝑥) непрерывно дифференцируемы на промежутке [𝑎, +∞) и пусть существует конечный предел lim (𝑓(𝑥)𝑔(𝑥)) = 𝐿. Тогда из сходимости одного из интегралов 𝑥→+∞ +∞ +∞ ′ ∫𝑎 𝑓(𝑥)𝑔 (𝑥)𝑑𝑥 или ∫𝑎 𝑓 ′ (𝑥)𝑔(𝑥)𝑑𝑥 следует сходимость +∞ +∞ ∫𝑎 𝑓(𝑥)𝑔′(𝑥)𝑑𝑥 = 𝐿 − 𝑓(𝑎)𝑔(𝑎) − ∫𝑎 𝑓′(𝑥)𝑔(𝑥)𝑑𝑥. второго и равенство Доказательство. Из формулы интегрирования по частям в определенном интеграле 𝐴 следует, что для любого действительного числа 𝐴 > 𝑎: ∫𝑎 𝑓(𝑥)𝑔′ (𝑥)𝑑𝑥 = 𝑓(𝐴)𝑔(𝐴) − 𝐴 𝑓(𝑎)𝑔(𝑎) − ∫𝑎 𝑓 ′ (𝑥)𝑔(𝑥)𝑑𝑥. Если существует предел при 𝐴 → +∞ одной из частей последнего равенства, то существует предел и второй, и они равны. Теорема доказана. Пусть теперь функция 𝑓(𝑥) интегрируема на отрезке [𝑎, 𝐴] для любого 𝐴 > 𝑎. Теорема 3 (критерий Коши сходимости несобственного интеграла). Интеграл +∞ ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится тогда и только тогда, когда для любого числа 𝜀 > 0 найдется число 𝐴 𝐵 = 𝐵(𝜀) > 0 такое, что для любых чисел 𝐴1 , 𝐴2 > 𝐵 выполнено: |∫𝐴 2 𝑓(𝑥)𝑑𝑥| < 𝜀. 1 𝐴 Доказательство. Пусть 𝐹(𝐴) = ∫𝑎 𝑓(𝑥)𝑑𝑥. Тогда по критерию Коши существования предела функции в точке функция 𝐹(𝐴) имеет предел в точке +∞тогда и только тогда, когда для любого 𝜀 > 0 найдется число 𝐵 = 𝐵(𝜀) > 0 такое, что для любых 𝐴1 , 𝐴2 > 𝐵 выполнено: |𝐹(𝐴1 ) − 𝐹(𝐴2 )| < 𝜀. Теорема доказана. +∞ Теорема 4 (признак сравнения). Если интеграл∫𝑎 𝑔(𝑥)𝑑𝑥 сходится и для любого 𝑥 ≥ +∞ 𝑎 имеем: |𝑓(𝑥)| ≤ 𝑔(𝑥), то ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится. +∞ Доказательство. Так как ∫𝑎 𝑔(𝑥)𝑑𝑥 сходится, то, согласно критерию Коши, для любого 𝜀 > 0 найдется число 𝐵 = 𝐵(𝜀) > 0 такое, что для любых 𝐴1 , 𝐴2 > 𝐵 выполняется: 𝐴 𝐴 𝐴 𝐴 |∫𝐴 2 𝑓(𝑥)𝑑𝑥| ≤ ∫𝐴 2|𝑓(𝑥)|𝑑𝑥 ≤ ∫𝐴 2 𝑔(𝑥)𝑑𝑥 = |∫𝐴 2 𝑔(𝑥)𝑑𝑥| < 𝜀. Это означает, что 1 1 1 1 +∞ ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится. Теорема доказана. +∞ Следствие 1. Если интеграл ∫𝑎 𝑔(𝑥)𝑑𝑥 расходится и для любого 𝑥 ≥ 𝑎 имеем: 0 ≤ +∞ 𝑔(𝑥) ≤ 𝑓(𝑥), то интеграл ∫𝑎 𝑓(𝑥)𝑑𝑥 расходится. +∞ Доказательство. Если 0 ≤ 𝑔(𝑥) ≤ 𝑓(𝑥) и интеграл ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится, то по теореме +∞ 4 интеграл ∫𝑎 𝑔(𝑥)𝑑𝑥 должен сходиться, а это не так. Замечание. Удобнее всего сравнивать подынтегральную функцию со степенью. Легко +∞ 𝑑𝑥 видеть, что интеграл ∫1 𝑥 𝛼 сходится тогда и только тогда, когда 𝛼 > 1. +∞ 𝑓(𝑥) +∞ Следствие 2. Если lim 𝑔(𝑥) = 𝐶 ≠ 0, то интегралы ∫𝑎 𝑓(𝑥)𝑑𝑥 и ∫𝑎 𝑥→+∞ 𝑔(𝑥)𝑑𝑥 сходятся и расходятся одновременно. +∞ Определение 2. Говорят, что интеграл ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится абсолютно, если сходится +∞ +∞ интеграл ∫𝑎 |𝑓(𝑥)|𝑑𝑥, и сходится условно, если он сходится, а интеграл ∫𝑎 |𝑓(𝑥)|𝑑𝑥 расходится. Замечание. Если интеграл сходится абсолютно, то он сходится (теорема 4). Теорема 5 (признак Абеля сходимости несобственного интеграла). Пусть функции 𝑓(𝑥) и 𝑔(𝑥) определены на промежутке [𝑎, +∞), причем: +∞ 1) 𝑓(𝑥) ∈ 𝑅[𝑎, 𝐴] при всех 𝐴 > 𝑎 и интеграл ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится; 2) функция 𝑔(𝑥) монотонна на [𝑎, +∞) и существует такая постоянная 𝑀 > 0, что |𝑔(𝑥)| ≤ 𝑀 при всех 𝑥 ≥ 𝑎. +∞ Тогда ∫𝑎 𝑓(𝑥)𝑔(𝑥)𝑑𝑥 сходится. Доказательство. Воспользуемся критерием Коши сходимости несобственного интеграла. +∞ Выберем произвольное число 𝜀 > 0. Так как интеграл ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится, то найдется такое число 𝐵(𝜀) > 𝑎, что для любых чисел 𝐴1 , 𝐴2 , 𝐵 < 𝐴1 < 𝐴2 , выполнено: 𝐴2 | ∫ 𝑓(𝑥)𝑑𝑥| < 𝐴1 𝜀 . 2𝑀 Поскольку функция 𝑔(𝑥) монотонна на любом промежутке [𝐴1′ , 𝐴′2 ], 𝐵 < 𝐴1 ′ < 𝐴2 ′, то (согласно второй теореме о среднем) найдется такая точка 𝜉 ∈ [𝐴1′ , 𝐴′2 ], что 𝐴′2 𝐴′2 𝜉 𝜀 𝜀 + )=𝜀. 2𝑀 2𝑀 | ∫ 𝑓(𝑥)𝑔(𝑥)𝑑𝑥| = |𝑔(𝐴1′ ) ∫ 𝑓(𝑥)𝑑𝑥 + 𝑔(𝐴′2 ) ∫ 𝑓(𝑥)𝑑𝑥| < 𝑀 ∙ ( 𝐴′1 𝐴′1 𝜉 Поскольку последнее неравенство выполнено при всех 𝐴1′ , 𝐴2 ′, 𝐵 < 𝐴1 ′ < 𝐴2 ′, то по +∞ критерию Коши получаем, что интеграл ∫𝑎 𝑓(𝑥)𝑔(𝑥)𝑑𝑥 сходится. Теорема доказана. Теорема 6 (признак Дирихле сходимости несобственного интеграла). Пусть функции 𝑓(𝑥) и 𝑔(𝑥) определены на промежутке [𝑎, +∞), причем: 1) функция 𝑓(𝑥) интегрируема на промежутке [𝑎, 𝐴] при всех 𝐴 > 𝑎 и существует 𝐴 постоянная 𝐶 > 0 такая, что |𝐹(𝐴)| = |∫𝑎 𝑓(𝑥)𝑑𝑥| ≤ 𝐶 для любого 𝐴 > 𝑎; 2) функция 𝑔(𝑥) монотонна на [𝑎, +∞) и lim 𝑔(𝑥) = 0. 𝑥→+∞ +∞ Тогда ∫𝑎 𝑓(𝑥)𝑔(𝑥)𝑑𝑥 сходится. Доказательство. Пусть функция 𝑔(𝑥) не возрастает на [𝑎, +∞) (случай, когда 𝑔(𝑥) не убывает, рассматривается аналогично). Тогда 𝑔(𝑥) ≥ 0 для любого 𝑥 ∈ [𝑎, +∞) (так как lim 𝑔(𝑥) = 0). Выберем произвольное число 𝜀 > 0. Существует 𝐵 = 𝐵(𝜀) > 0 такое, 𝑥→+∞ 𝜀 что 0 ≤ 𝑔(𝑥) < 2𝐶 для любого 𝑥 > 𝐵. Отсюда и из второй теоремы о среднем следует, что для любых чисел 𝐴1 , 𝐴2 > 𝐵 выполняется: 𝜉 𝐴2 | ∫ 𝑓(𝑥)𝑔(𝑥)𝑑𝑥 | = |𝑔(𝐴1′ ) ∫ 𝑓(𝑥)𝑑𝑥| < 𝐴1 𝐴1 𝜀 𝜀 ∙ |𝐹(𝜉) − 𝐹(𝐴1 )| ≤ ∙ (𝐶 + 𝐶) = 𝜀 , 2𝐶 2𝐶 где 𝜉 − некоторая точка из отрезка [𝐴1 , 𝐴2 ]. По критерию Коши это означает, что +∞ интеграл ∫𝑎 𝑓(𝑥)𝑔(𝑥)𝑑𝑥 сходится. Теорема доказана. С методической точки зрения полезно также рассмотреть следующий частный случай признака Дирихле (другой прием доказательства). Теорема 7. Пусть 1) функция 𝑓(𝑥) непрерывна на промежутке [𝑎, +∞) и существует постоянная 𝐶 > 0 𝐴 такая, что |𝐹(𝐴)| = |∫𝑎 𝑓(𝑥)𝑑𝑥| ≤ 𝐶 для любого 𝐴 > 𝑎; 2) функция 𝑔(𝑥) монотонна на [𝑎, +∞) и lim 𝑔(𝑥) = 0; 𝑥→+∞ 3) 𝑔(𝑥) непрерывно дифференцируема на [𝑎, +∞). +∞ Тогда ∫𝑎 𝑓(𝑥)𝑔(𝑥)𝑑𝑥 сходится. Доказательство. Пусть функция 𝑔(𝑥) не возрастает на [𝑎, +∞) (случай, когда 𝑔(𝑥) не убывает, рассматривается аналогично). Тогда 𝑔(𝑥) ≥ 0, 𝑔′ (𝑥) ≤ 0 для любого 𝑥 ∈ [𝑎, +∞) (так как lim 𝑔(𝑥) = 0). Выберем произвольное число 𝜀 > 0. Существует 𝐵 = 𝐵(𝜀) > 0 𝑥→+∞ 𝜀 такое, что 0 ≤ 𝑔(𝑥) < 2𝐶 для любого 𝑥 > 𝐵. Отсюда и из формулы интегрирования по частям в определенном интеграле следует, что для любых чисел 𝐴1 , 𝐴2 > 𝐵 выполняется: 𝐴 𝐴 𝐴 |∫𝐴 2 𝑓(𝑥)𝑔(𝑥)𝑑𝑥| = |𝐹(𝑥)𝑔(𝑥)|𝐴12 − ∫𝐴 2 𝐹(𝑥)𝑔′ (𝑥)𝑑𝑥| ≤ ≤ |𝐹(𝐴2 )𝑔(𝐴2 ) − 𝐹(𝐴1 )𝑔(𝐴1 )| + 1 𝐴 |∫𝐴 2 𝐹(𝑥)(−𝑔′ (𝑥))𝑑𝑥|. 1 1 Применим к интегралу в правой части последнего неравенства 𝐴 первую теорему о среднем значении и получим: |∫𝐴 2 𝑓(𝑥)𝑔(𝑥)𝑑𝑥| ≤ С(𝑔(𝐴1 ) + 𝑔(𝐴2 )) + 1 𝐴 𝐶 ∫𝐴 2(−𝑔′ (𝑥))𝑑𝑥 = 𝐶(𝑔(𝐴1 ) + 𝑔(𝐴2 )) + 𝐶(𝑔(𝐴1 ) − 𝑔(𝐴2 )) = = 2𝐶𝑔(𝐴1 ) < 𝜀. +∞ означает, что ∫𝑎 𝑓(𝑥)𝑔(𝑥)𝑑𝑥 сходится (критерий Коши). Теорема доказана. 1 Замечание. Сходимость интеграла в теоремах 5 – 7, вообще говоря, не абсолютная Это +∞ sin 𝑥 Пример. Исследуем на сходимость интеграл 𝐼(𝛼) = ∫1 sin 𝑥 +∞ 1 1 1) Если 𝛼 > 1, то | 𝑥 𝛼 | ≤ 𝑥 𝛼 . Так как интеграл ∫1 +∞ sin 𝑥 то интеграл ∫1 𝑥𝛼 𝑥𝛼 𝑥𝛼 𝑑𝑥 (интеграл Дирихле). 1−𝛼 +∞ 𝑑𝑥 = 𝑥 𝛼−1 | 1 = 𝛼 − 1 при 𝛼 > 1, 𝑑𝑥 сходится абсолютно (признак сравнения). 1 2) Если 0 < 𝛼 ≤ 1, то функция 𝑔(𝑥) = 𝑥 𝛼 непрерывно дифференцируема и монотонно стремится к нулю на [1, +∞), а функция 𝑓(𝑥) = sin 𝑥 имеет на этом промежутке 𝐴 ограниченную первообразную 𝐹(𝐴) = ∫1 sin 𝑥 𝑑𝑥 = cos 1 − cos 𝐴. Значит, интеграл +∞ sin 𝑥 ∫1 𝑑𝑥 сходится по признаку Абеля-Дирихле. 𝑥𝛼 sin 𝑥 Но | 𝑥 𝛼 | ≥ sin2 𝑥 𝑥𝛼 1 +∞ cos 2𝑥 cos 2𝑥 = 2𝑥 𝛼 − 2𝑥 𝛼 . Так как интеграл ∫1 𝑑𝑥 сходится при 𝛼 > 0 по 2𝑥 𝛼 +∞ 1 признаку Абеля-Дирихле, а интеграл ∫1 2𝑥 𝛼 𝑑𝑥 расходится при 0 < 𝛼 ≤ 1, то интеграл +∞ sin 𝑥 ∫1 | 𝑥 𝛼 | 𝑑𝑥 расходится (признак сравнения). Значит, при 0 < 𝛼 ≤ 1 интеграл 𝐼(𝛼) сходится условно. 3) При 𝛼 ≤ 0 применим критерий Коши: существует 𝜀 = 1, т.ч. для любого 𝐵 > 1 𝜋 найдутся 𝐴1,𝑛 = 2𝜋𝑛, 𝐴2,𝑛 = 2 + 2𝜋𝑛 (𝐵 < 𝐴1,𝑛 < 𝐴2,𝑛 ) такие, что 𝜋 +2𝜋𝑛 2 𝜋 +2𝜋𝑛 2 | ∫ 𝑥 −𝛼 ∙ sin 𝑥 𝑑𝑥 | ≥ (2𝜋𝑛)−𝛼 | ∫ 2𝜋𝑛 2𝜋𝑛 sin 𝑥 𝑑𝑥| ≥ (2𝜋𝑛)−𝛼 ≥ 1 = 𝜀 . Следовательно, 𝐼(𝛼) расходится при 𝛼 ≤ 0. Ответ: 𝐼(𝛼) сходится абсолютно при 𝛼 > 1, сходится условно при 0 < 𝛼 ≤ 1 и расходится при 𝛼 ≤ 0. +∞ Замечание. Возможно, что интеграл ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится, хотя функция 𝑓(𝑥) не +∞ стремится к нулю при 𝑥 → +∞. Например, сходится интеграл ∫𝑎 sin(𝑥 2 ) 𝑑𝑥 (заменой 𝑥 = √𝑡 сводится к интегралу Дирихле). Определение 3. Пусть функция 𝑓(𝑥) определена на полуинтервале [𝑎, 𝑏) и не ограничена на нем. Если для любого 𝛼 ∈ [𝑎, 𝑏) функция 𝑓(𝑥) интегрируема на отрезке 𝛼 [𝑎, 𝛼], то выражение lim ∫𝑎 𝑓(𝑥)𝑑𝑥 называется несобственным интегралом второго рода 𝛼→𝑏−0 𝑏 от функции 𝑓(𝑥) на отрезке [𝑎, 𝑏] и обозначается ∫𝑎 𝑓(𝑥)𝑑𝑥. Если предел существует и конечен, то говорят, что интеграл сходится, в противном случае – расходится. Точка 𝑏 называется особой точкой несобственного интеграла. 𝑏 𝑏 Аналогично ∫𝑎 𝑓(𝑥)𝑑𝑥 = lim ∫𝛼 𝑓(𝑥)𝑑𝑥 в случае, если 𝑎 - особая точка. 𝛼→𝑎+0 b c b a a c Если особая точка 𝑐 лежит внутри интервала (𝑎, 𝑏), то f ( x)dx = f ( x)dx + f ( x)dx = 𝛼 𝑏 𝑏 lim ∫ 𝑓(𝑥)𝑑𝑥 + lim ∫𝛼 𝑓(𝑥)𝑑𝑥, причем интеграл ∫𝑎 𝑓(𝑥)𝑑𝑥 сходится в том и только в 𝛼→𝑐−0 𝑎 𝛼→с+0 том случае, когда оба предела в правой части существуют и конечны. Замечание. Свойства интегралов второго рода аналогичны свойствам интегралов 𝑏 первого рода (интеграл второго рода ∫𝑎 𝑓(𝑥)𝑑𝑥 можно свести к интегралу первого рода, 1 например, заменой 𝑡 = 𝑏−𝑥, если 𝑏 - особая точка). 𝐴 Определение 4. Число 𝑙 = lim ∫−𝐴 𝑓(𝑥)𝑑𝑥 называется главным значением (в смысле 𝐴→+∞ +∞ +∞ Коши) интеграла ∫−∞ 𝑓(𝑥)𝑑𝑥 и обозначается 𝑙 = 𝑣. 𝑝. ∫−∞ 𝑓(𝑥)𝑑𝑥. Определение 5. Если 𝑐 - особая точка несобственного интеграла второго рода, 𝑐 ∈ 𝑏 𝑐−𝛿 𝑏 (𝑎, 𝑏), то 𝑣. 𝑝. ∫𝑎 𝑓(𝑥)𝑑𝑥 = lim (∫𝑎 𝑓(𝑥)𝑑𝑥 + ∫𝑐+𝛿 𝑓(𝑥)𝑑𝑥). 𝛿→0+0 Замечание. Интеграл может не сходиться в обычном смысле, но сходиться в смысле главного значения. Например, пусть функция 𝑓(𝑥) определена всюду на действительной +∞ 0 оси и 𝑓(−𝑥) = −𝑓(𝑥) для любого 𝑥. Тогда 𝑣. 𝑝. ∫−∞ 𝑓(𝑥)𝑑𝑥 = lim (∫−𝐴 𝑓(𝑥)𝑑𝑥 + 𝐴→+∞ 𝐴 0 𝐴 ∫0 𝑓(𝑥)𝑑𝑥) = lim (∫𝐴 𝑓(−𝑥)𝑑(−𝑥) + ∫0 𝑓(𝑥)𝑑𝑥) = 0, в то время как в обычном смысле 𝐴→+∞ +∞ интеграл ∫−∞ 𝑓(𝑥)𝑑𝑥 может и не сходиться (например, для функции 𝑓(𝑥) = 𝑥). Если несобственный интеграл сходится, то его значение совпадает с его главным значением. Геометрические приложения определенного интеграла. Длина дуги кривой. Определение 1. Пусть функции (t ) и (t ) непрерывны на отрезке [ , ] . Множество L всех точек ( x, y ) таких, что x = (t ) , y = (t ) , t [ , ] , называется плоской кривой. Аналогично пространственной кривой называется множество точек ( x, y, z ) таких, что x = (t ) , y = (t ) , z = (t ) , t [ , ] , где функции (t ) , (t ) , (t ) непрерывны на отрезке [ , ] . Определение 2. Точка ( x, y ) L называется кратной точкой кривой L , если существуют два числа t1 , t 2 [ , ] , t1 t 2 , такие, что (t1 ) = (t 2 ) = x , (t1 ) = (t 2 ) = y . Точки кривой L , не являющиеся кратными, называются простыми. Если кривая L не имеет кратных точек (кроме, может быть, начала и конца), то она называется простой кривой. Если единственная кратная точка кривой L - точка ( x , y ) такая, что ( ) = ( ) = x , ( ) = ( ) = y , то L называется простой замкнутой кривой. Если кривую L можно разбить на конечное число простых кривых, то есть существует разбиение отрезка [ , ] такое, что на любом отрезке разбиения [t k −1 , t k ] функции (t ) и (t ) задают простую кривую, то L называется параметризуемой кривой. Замечание. В определениях 1 и 2 можно положить = − и (или) = + . Тогда в определении 2 разбиение может быть и бесконечным (счетным). Определение 3. Функция (t ) , непрерывная на отрезке [ , ] , называется кусочнолинейной функцией на этом отрезке, если существует разбиение [ , ] такое, что (t ) = a k t + bk на k -том отрезке разбиения [t k −1 , t k ] . Здесь ak , bk - произвольные действительные числа. Определение 4. Простая кривая l называется ломаной линией, если задающие ее функции (t ) и (t ) являются кусочно-линейными. Ломаная состоит из отрезков, которые называются ее звеньями; концы этих отрезков называются узлами ломаной. Пусть ломаная l = A1 A2 An , где A1 = ( x1 , y1 ) , … , An = ( xn , y n ) . Тогда ее длина n вычисляется по формуле: l = ( x k − x k −1 ) 2 + ( y k − y k −1 ) 2 . k =2 Определение 5. Ломаная l называется вписанной в кривую L , если ее начало и конец совпадают с началом и концом L и все ее узлы лежат на этой кривой. Определение 6. Кривая L называется спрямляемой, если длины всех ломаных, вписанных в L , ограничены сверху. Длиной L спрямляемой кривой L называется число sup{ l } , где точная верхняя грань берется по всем возможным ломаным, вписанным в L . l Замечание. Пусть кривая L спрямляема. Можно выбрать другой способ параметризации, то есть сделать замену t = f (s) , где функция f (s ) непрерывна и строго монотонна на отрезке [a, b], f ([a, b]) = [ , ] . Тогда можно сказать, что кривая L задается функциями: x = 1 ( s) = ( f ( s)) , y = 1 ( s) = ( f ( s)) , s [a, b] . Очевидно, что длина L при этом не изменится. Лемма 1. Пусть ломаная l 0 вписана в кривую L и соответствует разбиению T0 отрезка [ , ] ; ломаная l1 также вписана в кривую L и соответствует разбиению T1 того же отрезка, причем T0 T1 . Тогда l0 l1 . Доказательство. Пусть l0 = A1 Ak Ak +1 An , l1 = A1 Ak AAk +1 An . Так как Ak Ak +1 Ak A + AAk +1 (неравенство треугольника), то l0 l1 . Лемма 1 доказана. Утверждение 1. Если спрямляемая кривая L представляет собой объединение кривых: m L = L1 L2 Lm , то все кривые L1 , L2 ,, Lm спрямляемы и L = Li . i =1 Доказательство. Пусть кривая L задается функциями x = (t ) , y = (t ) , t [ , ] ; кривая L1 : x = (t ) , y = (t ) , t [ , ] ; кривая L2 : x = (t ) , y = (t ) , t [ , ] (тогда L = L1 L2 ). Пусть T1 - разбиение отрезка [ , ] , l1 - ломаная, соответствующая этому разбиению; T2 - разбиение [ , ] , ломаная l 2 соответствует T2 . Тогда T = T1 T2 разбиение отрезка [ , ] ; ломаная l = l1 l 2 соответствует разбиению T . Так как l = l1 + l 2 , то l1 l , l 2 l . Это означает, что длины ломаных, вписанных в кривые L1 и L2 , ограничены сверху (например, длиной кривой L ). Значит, L1 и L2 спрямляемы. Обозначим через C точку кривой L с координатами ( ( ), ( )) . Выберем произвольное число 0 . Так как кривая L спрямляема, то существует ломаная l , вписанная в кривую L , такая, что l L − . Добавим к узлам ломаной l точку C ; получим ломаную l . Из леммы 1 следует, что l l L − . Очевидно, что l = l1 l 2 , причем ломаная l1 вписана в кривую L1 , l 2 - в L2 . Значит, l1 + l 2 = l L − . Отсюда L1 + L2 l1 + l 2 L − . Поскольку 0 - произвольное число, то окончательно получаем: (1) L1 + L2 L . Докажем теперь неравенство с противоположным знаком. Снова выберем произвольное число 0 . Так как кривая L1 спрямляема, то существует ломаная l1 , вписанная в кривую L1 , такая, что l1 L1 − / 2 . Аналогично существует ломаная l 2 , вписанная в кривую L2 , такая, что l 2 L2 − / 2 . Пусть l = l1 l 2 . Тогда ломаная l вписана в кривую L , причем l = l1 + l 2 L1 + L2 − . Значит, L L1 + L2 − . Отсюда в силу произвольности выбора числа получаем: (2) L1 + L2 L . Из неравенств (1) и (2) следует, что L = L1 + L2 . Утверждение доказано. Сформулируем еще одну вспомогательное утверждение, которое понадобится нам при доказательстве основной теоремы. Лемма 2. Для любых действительных чисел a, b, c справедливо неравенство (3) a2 + b2 − a2 + c2 b − c . Доказательство. Если b 2 + c 2 = 0 , то неравенство очевидно. Пусть b 2 + c 2 0 . Тогда имеет место следующая цепочка неравенств: 2 2 b −c b − c (b + c ) b−c b+c = b−c . a2 + b2 − a2 + c2 = b+c a2 + b2 + a2 + c2 b2 + c2 Лемма 2 доказана. Теорема 1. Пусть функции (t ) и (t ) непрерывно дифференцируемы на отрезке [ , ] . Тогда кривая L : x = (t ) , y = (t ) , t [ , ] , спрямляема и L = (4) ( (t ) )2 + ( (t ) )2 dt . Доказательство. Зафиксируем произвольное число 0 . Так как функция (t ) непрерывна на отрезке [ , ] , то она равномерно непрерывна на нем. Значит, существует число 1 = 1 ( ) 0 такое, что для любых точек t , t [ , ] , t − t 1 , выполнено: (t ) − (t ) . Обозначим ( (t ) )2 + ( (t ) )2 . Так как по условию f (t ) = 4( − ) теоремы функция f (t ) непрерывна на отрезке [ , ] , то она интегрируема на этом отрезке и существует число A = f (t ) dt . Тогда, по определению интегрируемости функции, найдется число 2 = 2 ( ) 0 такое, что для любого размеченного разбиения V отрезка [ , ] , V 2 , имеет место неравенство (V ) − A (здесь (V ) - интегральная сумма 4 для функции f (t ) , соответствующая разбиению V ). Пусть = min 1 , 2 ; T = x0 , x1 ,, xn - произвольное разбиение отрезка [ , ] , T . Пусть l - ломаная, вписанная в кривую L и соответствующая разбиению T . Тогда (5) n n k =1 k =1 l = ( (t k ) − (t k −1 )) 2 + ( (t k ) − (t k −1 )) 2 = ( ( k )) 2 + ( ( k )) 2 t k , где k , k [t k −1 , t k ] (мы применили теорему Лагранжа к функциям (t ) и (t ) на отрезке [t k −1 , t k ] ). Значит, l n sup ( (t )) 2 + sup ( (t )) 2 t k = t t k =1 sup ( (t )) 2 + sup ( (t )) 2 ( − ) . Мы t t доказали, что длины всех ломаных, вписанных в кривую L , ограничены сверху. Это означает, что кривая L спрямляема. Перейдем к доказательству формулы для вычисления длины кривой. Согласно неравенству (3), имеем ( ( k )) 2 + ( ( k )) 2 − ( ( k )) 2 + ( ( k )) 2 ( k ) − ( k ) 4( − ) , так как k − k t k . Пусть V = V (T ) = x0 , x1 ,, xn ; 1 ,, n - размеченное разбиение n отрезка [ , ] , V . Значит, (V ) − A . Но (V ) = ( ( k )) 2 + ( ( k )) 2 t k . 4 Отсюда и из соотношения (5) k =1 получим, что n (V ) − l k =1 = 4( − ) t k n t = 4 . Следовательно, 4( − ) k k =1 (6) l − A l − (V ) + (V ) − A . 2 (Заметим, что соотношение (6) доказано нами для произвольной ломаной соответствующей разбиению отрезка [ , ] , диаметр которого меньше ). l, Так как по определению длины кривой L = sup{ l } , то существует ломаная l , вписанная в кривую L и такая, что l L − l . Пусть ломаная l соответствует разбиению 2 T отрезка [ , ] . Существует измельчение T разбиения T , удовлетворяющее условию T . Пусть ломаная l соответствует разбиению T , тогда l l L − 2 (лемма 1) и, . Отсюда заключаем, что L − A . Но 2 произвольное положительное число, значит, L = A . Теорема доказана. согласно неравенству (5), l − A Следствие. 1) Если кривая L является графиком непрерывно дифференцируемой на b отрезке [a, b] функции y = f (x) , то эта кривая спрямляема и L = 1 + ( f ( x) ) dx (для 2 a доказательства нужно положить в формуле (4) (t ) = t , (t ) = f (t ) , t [a, b] ). 2) Если кривая L задана уравнением r = r ( ) в полярных координатах ( x = r ( ) cos , y = r ( ) sin ), причем функция r ( ) непрерывно дифференцируема на отрезке [1 , 2 ] , то 2 эта кривая спрямляема и L = (r ( ) )2 + (r ( ) )2 d (так как ( ) = r ( ) cos , 1 ( ) = r ( ) sin , то ( ( ))2 + ( ( ))2 = = (r ( ))2 + (r ( ))2 ). Замечание. Если L - пространственная кривая: x = (t ) , y = (t ) , z = (t ) , t [ , ] , где функции (t ) , (t ) , (t ) непрерывно дифференцируемы на отрезке [ , ] , то L спрямляема и ее длина вычисляется по формуле, аналогичной (4): L = ( (t ) )2 + ( (t ) )2 + ( (t ) )2 dt (доказательство этого факта не вполне аналогично доказательству теоремы 1, поэтому данная формула не является следствием формулы (4)). Площадь плоской области. Определение 1. Рассмотрим множество R 2 всех точек плоскости. Пусть точка -окрестностью точки x называется множество x( x 0 , y 0 ) R 2 . U ( x) = {( x, y) R 2 | ( x − x0 ) 2 + ( y − y0 ) 2 2 } . Пусть M - подмножество R 2 . Точка x M называется внутренней точкой множества M , если существует число 0 такое, что U ( x) M . Точка x называется внешней точкой множества M , если существует число 0 такое, что U ( x) R 2 \ M . Точка x называется граничной точкой множества M , если она не является ни внутренней, ни внешней его точкой. Совокупность всех граничных точек множества называется его границей. Определение 2. Множество M R 2 называется открытым, если все его точки – внутренние. Множество M R 2 называется замкнутым, если множество R 2 \ M открыто. Множество M R 2 называется ограниченным, если существует число R 0 такое, что M U R (0) . Определение 3. Плоской фигурой называется любое ограниченное множество F R 2 . Определение 4. Простейшей будем называть плоскую фигуру, состоящую из конечного числа прямоугольников со сторонами, параллельными координатным осям. Обозначим площадь простейшей фигуры P через (P ) . Очевидно, что площади простейших фигур обладают следующими свойствами: 1) Если P = P1 P2 , P1 P2 = , то ( P) = ( P1 ) + ( P2 ) (аддитивность); 2) если P1 = P2 , то ( P1 ) = ( P2 ) (инвариантность); 3) если P1 P2 , то ( P1 ) ( P2 ) (монотонность); 4) ( P) 0 для любой простейшей фигуры P (неотрицательность). Определение 5. Пусть F - произвольная плоская фигура. Обозначим ( F ) = sup{ ( P)} - нижняя площадь F ; ( F ) = inf { (Q)} - верхняя площадь F , где P F Q F точная верхняя грань берется по всем замкнутым простейшим фигурам P , вписанным в F ; точная нижняя грань – по всем открытым простейшим фигурам Q , описанным около F . Замечание. 1) Точная верхняя грань существует, поскольку F - ограниченное множество, точная нижняя грань – в силу неотрицательности площадей простейших фигур. 2) Любую замкнутую фигуру можно представить в виде объединения открытой фигуры и ее границы. Очевидно, что площадь простейшей фигуры не зависит от того, открыта она или замкнута (так как площадь ее границы всегда равна 0). В дальнейшем, применяя определения верхней и нижней площади, не будем делать различий между открытыми и замкнутыми простейшими фигурами. 3) Так как площадь любой простейшей фигуры, вписанной в F , не превосходит площади любой простейшей, описанной около F , то всегда ( F ) ( F ) . Определение 6. Плоская фигура F называется квадрируемой, если ( F ) = ( F ) . Число = ( F ) = ( F ) будем называть площадью квадрируемой фигуры F . Лемма 1. Плоская фигура F квадрируема тогда и только тогда, когда для любого числа 0 найдется простейшая фигура P F и простейшая фигура Q F такие, что (Q) − ( P) . Доказательство. Докажем необходимость. Пусть фигура F квадрируема, тогда ( F ) = ( F ) . По определению точной грани для любого числа 0 найдется простейшая фигура P F такая, что ( F ) − ( P) ( F ) . Аналогично найдется 2 ( F ) (Q) ( F ) + . Так как простейшая фигура Q F такая, что 2 то, учитывая полученные неравенства, имеем: ( F ) = ( F ) = ( F ) , ( F ) − ( P) (Q) ( F ) + . Значит, (Q) − ( P) . 2 2 Теперь докажем достаточность. Пусть для любого числа 0 найдутся простейшие фигуры P F и Q F такие, что (Q) − ( P) . Так как ( P) ( F ) ( F ) (Q) , то 0 ( F ) − ( F ) (Q) − ( P) . Но число 0 произвольно, значения верхней и нижней площади фигуры F от него не зависят, значит, ( F ) = ( F ) . Лемма 1 доказана. Лемма 2. Плоская фигура F квадрируема тогда и только тогда, когда для любого числа 0 найдется квадрируемая фигура P F и квадрируемая фигура Q F такие, что (Q) − ( P) . Доказательство. Необходимость сразу следует из леммы 1, так как любая простейшая фигура является квадрируемой. Докажем достаточность. Пусть для любого числа 0 найдутся квадрируемые фигуры P F и Q F такие, что (Q) − ( P) . Так как 2 фигуры P и Q квадрируемы, то для них, согласно предыдущей лемме, найдутся простейшие фигуры P и Q такие, что P P , ( P ) − ( P ) , Q Q , 4 (Q ) − (Q) . Тогда P F Q и (Q ) − ( P ) (Q) + − ( P) + + = . 4 4 2 2 4 Отсюда и из леммы 1 следует, что фигура F квадрируема. Лемма 2 доказана. Определение 7. Пусть функция y = f (x) непрерывна на отрезке [a, b] и f ( x) 0 для любого x [a, b] . Криволинейной трапецией назовем плоскую фигуру, ограниченную графиком функции y = f (x) , прямыми x = a и x = b , и отрезком оси Ox , заключенным между точками a и b . Теорема 1. Криволинейная трапеция F квадрируема и b ( F ) = f ( x)dx . a Доказательство. Так как функция f (x) непрерывна на отрезке [a, b] , то она интегрируема на этом отрезке. Значит, для любого числа 0 существует разбиение T = x0 , x1 ,, xn отрезка [a, b] такое, что S (T ) − s(T ) , где S (T ), s(T ) - соответственно верхняя и нижняя суммы Дарбу для функции f (x) , соответствующие разбиению T (критерий Римана интегрируемости функции на отрезке). Рассмотрим простейшие фигуры P и Q , состоящие из прямоугольников со сторонами [ xk −1 , xk ] ; [0, inf f ( x)] и [ xk −1 , xk ] ; [0, sup f ( x)] , k = 1,, n , соответственно. Тогда xk −1 x xk xk −1 x xk очевидно, что P F Q , причем ( P) = s(T ) , (Q) = S (T ) . Значит, (Q) − ( P) , то b есть фигура F квадрируема (лемма 1). С другой стороны, так как s (T ) f ( x)dx S (T ) и a b ( P) ( F ) (Q) , то получаем, что для любого 0 выполнено: ( F ) − f ( x)dx . a Так как площадь фигуры и интеграл от функции f (x) по отрезку [a, b] - числа, не b зависящие от выбора , то из последнего неравенства следует, что ( F ) = f ( x)dx . a Теорема доказана. Определение 8. Пусть функция r ( ) непрерывна на отрезке [ , ] и r ( ) 0 для любого [ , ] . Криволинейным сектором назовем плоскую фигуру, ограниченную кривой r = r ( ) , заданной в полярных координатах, и лучами = и = . Теорема 2. Криволинейный сектор F - квадрируемая фигура и 1 2 r ( )d . 2 (F ) = Доказательство. Так как функция r ( ) непрерывна на отрезке [ , ] , то функция 1 2 r ( ) интегрируема на этом отрезке. Значит, для любого числа 0 существует 2 разбиение T = 0 , 1 ,, n отрезка [ , ] такое, что S (T ) − s(T ) , где S (T ), s(T ) 1 соответственно верхняя и нижняя суммы Дарбу для функции r 2 ( ) , соответствующие 2 разбиению T . Рассмотрим квадрируемые фигуры P и Q , состоящие из круговых секторов раствора [ k −1 , k ] с радиусами rk = inf r ( ) и Rk = sup r ( ) , k = 1,, n , соответственно. k −1 k Тогда (Q) = очевидно, что k −1 k P F Q, причем ( P) = 1 n 2 rk k = s(T ) , 2 k =1 1 n 2 Rk k = S (T ) . Значит, (Q) − ( P) , то есть фигура F квадрируема (лемма 2 k =1 1 2). С другой стороны, так как s (T ) r 2 ( )d S (T ) и ( P) ( F ) (Q) , то получаем, 2 что для любого 0 выполнено: ( F ) − 1 1 2 r ( )d . Значит, ( F ) = r 2 ( )d . 2 2 Теорема доказана. Объем тела в пространстве. Определение 1. Рассмотрим множество R 3 всех точек трехмерного пространства. окрестностью точки называется множество x( x0 , y 0 , z 0 ) R 3 U ( x) = {( x, y, z ) R 3 | ( x − x0 ) 2 + ( y − y0 ) 2 + ( z − z 0 ) 2 2 } . Понятия внутренней, внешней, граничной точки, а также открытого, замкнутого и ограниченного множества в R 3 полностью аналогичны соответствующим понятиям в R 2 . Определение 2. Телом называется любое ограниченное подмножество R 3 . Определение 3. Простейшими назовем тела, состоящие из конечного числа прямоугольных параллелепипедов со сторонами, параллельными координатным осям. Определение 4. Пусть F - произвольное тело. Верхним объемом тела F называется число ( F ) = inf { (Q)} ; нижним объемом F - число ( F ) = sup{ ( P)} , где точная Q F P F верхняя грань берется по всем замкнутым простейшим телам P , содержащимся в F ; точная нижняя грань – по всем открытым простейшим телам Q , содержащим F . Определение 5. Тело F называется кубируемым, если ( F ) = ( F ) . Число = ( F ) = ( F ) будем называть объемом кубируемого тела F . Лемма 1. Тело F кубируемо тогда и только тогда, когда для любого числа 0 найдется простейшее тело P F и простейшее тело Q F такие, что (Q) − ( P) . Лемма 2. Тело F кубируемо тогда и только тогда, когда для любого числа 0 найдется кубируемое тело P F и кубируемое тело Q F такие, что (Q) − ( P) . Доказательства лемм 1 и 2 являются полностью аналогичными доказательствам лемм 1 и 2 для плоских фигур. Определение 6. Цилиндрическим телом назовем тело, ограниченное цилиндрической поверхностью с образующими, параллельными некоторой оси, и двумя плоскостями, перпендикулярными этой оси. Эти плоскости в пересечении с цилиндрической поверхностью образуют плоские фигуры, которые называются основаниями цилиндрического тела; расстояние h между основаниями называется высотой этого тела. Теорема 1. Если основанием цилиндрического тела F является квадрируемая фигура G , то тело F кубируемо и ( F ) = (G ) h . Доказательство. Так как фигура G квадрируема, то для любого числа 0 найдутся простейшие фигуры P и Q такие, что P G Q и (Q) − ( P) . Пусть FP и FQ h простейшие тела с основаниями P и Q соответственно и высотой h . Тогда FP F FQ и ( FQ ) − ( FP ) = h (Q) − h ( P) . Значит, тело F кубируемо (лемма 1). С другой стороны, так как то Но ( P) (G ) (Q) , ( FP ) h (G) ( FQ ) . ( FP ) ( F ) ( FQ ) (поскольку FP F FQ ), следовательно, ( F ) − h (G) для любого числа 0 . Из произвольности выбора заключаем, что ( F ) = (G ) h . Теорема доказана. Следствие. Пусть тело F представляет собой объединение цилиндрических тел Fk , k = 1,, n ; причем любые два тела Fi и F j , i j , могут пересекаться только по основаниям n (такие тела называют ступенчатыми). Тогда тело F кубируемо и ( F ) = ( Fk ) . k =1 Доказательство. Пусть F = F1 F2 . Выберем произвольное число 0 . Построим так же, как в теореме 1, простейшие тела FP1 , FP2 , FQ1 , FQ2 такие, что FP1 F1 FQ1 , FP2 F2 FQ2 , причем ( FQ1 ) − ( FP1 ) , ( FQ2 ) − ( FP2 ) . Пусть FP = FP1 FP2 , 2 2 FQ = FQ1 FQ2 . Тогда FP и FQ - простейшие тела и FP F FQ . Заметим, что тела FP1 , FP2 могут пересекаться только по основанию; тела FQ1 , FQ2 могут пересекаться только по Значит, ( FQ ) = ( FQ ) + ( FQ ) . ( FP ) = ( FP ) + ( FP ) , ( FQ ) − ( FP ) , то есть тело F кубируемо. С другой стороны, ( FP ) ( F1 ) + ( F2 ) ( FQ ) , ( FP ) ( F ) ( FQ ) , основанию. Отсюда 1 2 следовательно, ( F ) = ( F1 ) + ( F2 ) . Следствие доказано. 1 2 Теорема 2. Пусть функция y = f (x) непрерывна на отрезке [a, b] ; тело F образовано вращением криволинейной трапеции, ограниченной графиком функции f (x) , прямыми x = a , x = b и отрезком [a, b] оси Ox . Тогда тело F кубируемо и b ( F ) = f 2 ( x)dx . a Доказательство. Так как функция f (x) непрерывна на отрезке [a, b] , то функция f 2 ( x) интегрируема на этом отрезке. Значит, для любого числа 0 существует разбиение T = x0 , x1 ,, xn отрезка [a, b] такое, что S (T ) − s(T ) , где S (T ), s(T ) соответственно верхняя и нижняя суммы Дарбу для функции f 2 ( x) , соответствующие разбиению T . На каждом отрезке разбиения [ xk −1 , xk ] построим два прямоугольника с высотами mk = inf xk −1 x xk f ( x) и M k = sup f ( x) , k = 1,, n . При вращении этих прямоугольников xk −1 x xk n вокруг оси Ox получаются цилиндрические тела Pk и Qk соответственно. Пусть P = Pk k =1 n , Q = Qk . Тогда очевидно, что P F Q , причем P и Q кубируемы (как ступенчатые k =1 тела) и n n k =1 k =1 ( P) = ( Pk ) = mk2 xk , n mk2 xk = s(T ) , k =1 n n k =1 k =1 (Q) = (Qk ) = M k2 x k . Но n M x = S (T ) . Значит, (Q) − ( P) , то есть тело F 2 k k =1 k b кубируемо (лемма 2). С другой стороны, так как s (T ) f 2 ( x)dx S (T ) и a ( P) ( F ) (Q) , то получаем, что для b b a a любого 0 выполнено: ( F ) − f 2 ( x)dx . Это означает, что ( F ) = f 2 ( x)dx . Теорема доказана. Лекция 14. Пространство R n . Определение 1. Пространство R n - n-мерное действительное пространство – это множество упорядоченных всех наборов x = ( x1 ,, xn ) , где x k R , k = 1, 2,, n . Числа xk называются координатами точки (вектора) x R n . Из курса линейной алгебры известно, что пространство R n - это линейное пространство относительно операций сложения: x + y = ( x1 + y1 ,, xn + y n ) , где x = ( x1 ,, xn ) , y = ( y1 ,, y n ) , и умножения на скаляр R : x = (x1 ,, xn ) . Это пространство является евклидовым относительно скалярного произведения ( x, y) = x1 y1 + + xn y n ; в нем можно ввести норму: x = ( x, x) = ( x1 ) 2 + + ( x n ) 2 и расстояние (метрику): ( x, y ) = x − y = ( x1 − y1 ) 2 + + ( x n − y n ) 2 . Определение 2. Открытым n-мерным шаром радиуса R с центром в точке x = ( x10 ,, xn0 ) называется множество BR ( x 0 ) = {x R n | ( x, x 0 ) R} . 0 Замкнутым n-мерным шаром радиуса R с центром в точке x 0 называется множество BR ( x 0 ) = {x R n | ( x, x 0 ) R} . Множество S R ( x 0 ) = {x R n | ( x, x 0 ) = R} называется n-мерной сферой радиуса R с центром в точке x 0 . Множество d ( x 0 ) = {x = ( x1 , , x n ) R n | x1 − x10 d1 , , x n − x n0 d n } , d1 0,, d n 0 , называется открытым n-мерным параллелепипедом где размера d = (d1 ,, d n ) с центром в точке x 0 . Определение 3. -окрестностью точки x 0 R n называется открытый шар радиуса 0 с центром в точке x 0 . Для обозначения -окрестности часто применяют 0 специальное обозначение 𝐵𝜀 ( x 0 ) или просто 𝐵( x 0 ). Множество B ( x 0 ) = B ( x 0 ) \ {x 0 } называется проколотой -окрестностью точки x 0 . Понятия внутренней, внешней, граничной точки, а также открытого и замкнутого множества в R n полностью аналогичны соответствующим понятиям в R 2 (см. занятие 6). Точка x 0 называется предельной точкой множества A R n , если для любого числа 0 0 найдется точка x A такая, что x B ( x 0 ) . Приведем несколько эквивалентных определений замкнутого множества (в дальнейшем мы сможем пользоваться тем из определений, которое нам будет удобно в данный момент). Утверждение 1. Следующие утверждения эквивалентны: 1) Множество A замкнуто; 2) множество A содержит все свои предельные точки; 3) множество A содержит все свои граничные точки. Доказательство. Докажем сначала следствие 1) 2) . Пусть точка x 0 R n \ A . Тогда существует число 0 0 такое, что B 0 ( x 0 ) R n \ A (так как дополнение к замкнутому множеству открыто). Значит, B 0 ( x 0 ) A = . Это означает, что точка x 0 не является предельной точкой множества A (поскольку в любой окрестности предельной точки должен содержаться хотя бы один элемент множества). Значит, A содержит все свои предельные точки. 2) 3) . Пусть x 0 - граничная точка множества A . Тогда для любого 0 пересечение -окрестности точки x0 с множеством A не пусто. Пусть x 0 A . Тогда 0 получаем, что для любого 0 : B ( x 0 ) A . Это означает, что x 0 - предельная точка A . Но по условию множество A содержит все свои предельные точки. Мы пришли к противоречию. Значит, A должно содержать все свои граничные точки. 3) 1) . Пусть точка x 0 R n \ A . Тогда x 0 - внешняя точка множества A (так как по условию A содержит все свои внутренние и граничные точки). Значит, существует число 0 0 такое, что B 0 ( x 0 ) R n \ A (по определению внешней точки). Это означает, что множество R n \ A открыто. Значит, множество A замкнуто. Утверждение полностью доказано. Определение 4. Множество A R n называется ограниченным, если существует число R 0 такое, что A BR (0) . Rn Определение 5. Непрерывной кривой в называется множество n L = {x = ( x1 ,, xn ) R | x1 = 1 (t ),, xn = n (t )} , где t [ , ] и все функции k (t ) непрерывны на отрезке [ , ] . Говорят, что точки x1 = ( x11 ,, x1n ) и x2 = ( x21 ,, x2 n ) можно соединить непрерывной кривой, если существуют такие функции k (t ) , k = 1, 2,, n , непрерывные на отрезке [ , ] , что x11 = 1 ( ),, x1n = n ( ) , x21 = 1 ( ),, x2 n = n ( ) . Определение 6. Множество A R n называется линейно связным, если любые две точки этого множества можно соединить непрерывной кривой, целиком лежащей внутри A. Областью называется открытое линейно связное множество. Определение 7. Если каждому натуральному числу поставить в соответствие какуюлибо точку пространства R n , то полученное множество точек x1 , x 2 ,, x m , называется последовательностью точек R n и обозначается x m m =1 или просто x m . Говорят, что последовательность x сходится, если существует точка a R n такая, что для любого 0 найдется натуральное число N = N ( ) такое, что для любого натурального m N выполнено: ( x m , a) . Точка a называется пределом m последовательности. Обозначение: lim x m = a или x m ⎯m⎯ ⎯→ a . → m → сходится к точке a = (a ,, a ) тогда и только Лемма 1. Последовательность x m тогда, когда x ⎯m⎯ ⎯→ a1 , → m 1 1 x ⎯m⎯ ⎯→ an , → …, m n где n x = ( x1m ,, xnm ) m (т.е. последовательность сходится тогда и только тогда, когда она сходится покоординатно). Доказательство. Необходимость. Пусть lim x m = a . Значит, для любого 0 найдется N = N ( ) m → такое, что для любого mN выполнено: ( x1m − a1 ) 2 + + ( x nm − a n ) 2 . Тогда очевидно, что для любого m N : x1m − a1 , x nm − a n . Значит, x1m ⎯m⎯ ⎯→ an . ⎯→ a1 , …, xnm ⎯m⎯ → → Достаточность. Пусть x1m ⎯m⎯ ⎯→ an . Тогда для любого 0 ⎯→ a1 , …, xnm ⎯m⎯ → → существует натуральное число N1 = N1 ( ) такое, что для любого m N 1 : x1m − a1 И так далее. Наконец, существует x nm − a n n . Пусть . n N n = N n ( ) такое, что для любого m N n : N = maxN1 ,, N n . ( x1m − a1 ) 2 + + ( xnm − a n ) 2 n 2 n Тогда для любого mN имеем: = . Значит, x m ⎯m⎯ ⎯→ a . Лемма 1 доказана. → Определение 8. Последовательность x m называется фундаментальной, если для любого 0 существует натуральное число N = N ( ) такое, что для любого натурального m N и для любого натурального p выполнено: ( x m+ p , x m ) . Лемма 2. Последовательность x m является фундаментальной тогда и только тогда, когда фундаментальна каждая из координатных последовательностей x1m , …, xnm . Доказательство леммы 2 аналогично доказательству леммы 1. Оно предоставляется читателю в качестве упражнения. Теорема 1 (критерий Коши сходимости последовательности). Последовательность точек пространства R n сходится тогда и только тогда, когда она является x фундаментальной. Доказательство. Последовательность фундаментальна тогда и только тогда, когда она фундаментальна покоординатно (лемма 2). Каждая из координатных последовательностей является обычной числовой последовательностью. Она сходится тогда и только тогда, когда она фундаментальна (критерий Коши сходимости числовой последовательности). Но последовательность точек R n сходится тогда и только тогда, когда она сходится покоординатно (лемма 1). Значит, последовательность точек пространства R n сходится тогда и только тогда, когда она является фундаментальной. Теорема доказана. m Определение 9. Последовательность x m точек пространства R n ограничена, если существует число R 0 такое, что x m BR (0) для любого натурального m . Определение 10. Пусть m1 m2 mk , где m1 , m2 ,, mk , - натуральные числа. Последовательность последовательности x m . x m1 , x m2 ,, x mk , называется подпоследовательностью Теорема 2 (Больцано-Вейерштрасса). Из любой ограниченной последовательности x точек пространства R n можно выделить сходящуюся подпоследовательность. Доказательство. Последовательность x m ограничена, значит, существует число m R 0 такое, что ( x1m ) 2 + + ( x nm ) 2 R для любого натурального m . Тогда очевидно, что для любого m N : x1m R , x nm R , то есть числовые последовательности x1m , …, x ограничены. m n Выделим из последовательности x сходящуюся подпоследовательность x , m 1 mk1 1 x1 k1 ⎯k⎯ ⎯→ a1 (теорема Больцано-Вейерштрасса для числовых последовательностей). 1 → m m Рассмотрим последовательность x 2 k1 . Она ограничена (как подпоследовательность ограниченной последовательности), значит, из нее можно выделить сходящуюся m m ⎯→ a2 . И так далее. В конце концов, из подпоследовательность x2 k2 , x2 k2 ⎯k⎯ 2 → выделим сходящуюся подпоследовательность x , последовательности x mk n −1 n mk n n xn kn ⎯k⎯ ⎯→ an . n → m m Рассмотрим последовательность x k n . Так как все последовательности ее координат ⎯→ a1 , …, xn kn ⎯k⎯ ⎯→ an , то сама последовательность также сходится сходятся: x1 kn ⎯k⎯ n → n → m m к точке a = (a1 ,, an ) (лемма 1). Теорема доказана. Лекция 15. Предел функции многих переменных. Определение 1. Если каждой точке x из множества X ℝ𝑛 ставится в соответствие по известному закону действительное число f (x) , то говорят, что на множестве X задана функция n переменных f (x) (или f ( x1 ,, xn ) ). Множество X называется областью определения функции f (x) и обозначается D f . Определение 2 (предел функции по Коши). Число b ℝ называется пределом функции f (x) в точке a ℝ𝑛 , если для любого 0 найдется число = ( ) 0 такое, что для любой точки x D f такой, что 0 ( x, a) , выполнено: f ( x) − b . Обозначения: lim f ( x) = b или lim f ( x1 ,, x n ) = b . x→a x1 →a1 xn → a n Определение 3 (предел функции по Гейне). Число b ℝ называется пределом функции f (x) в точке a ℝ𝑛 , если для любой последовательности аргументов x m , x ⎯m⎯ ⎯→ a , → m x a, m соответствующая последовательность значений функции f ( x m ) ⎯m⎯ ⎯→ b . → Доказательство эквивалентности определении по Коши и по Гейне проводится точно так же, как в одномерном случае. Определение 4. Число b ℝ называется пределом функции f (x) при x → , если любого 0 найдется число = ( ) 0 такое, что для любой точки x D f , x , выполнено: f ( x) − b . Теорема 1. Пусть функции f (x) и g (x) заданы на множестве X ℝ𝑛 ; lim f ( x) = b , x→a f ( x) b lim g ( x) = c . Тогда lim ( f ( x) g ( x)) = b c , lim ( f ( x) g ( x)) = b c , lim (если = x→a x→a x→a x→a g ( x) c c 0 ). Доказательство. Рассмотрим последовательность x m точек множества X такую, что x ⎯m⎯ ⎯→ a , x a . Тогда f ( x ) ⎯m⎯ ⎯→ b , g ( x ) ⎯m⎯ ⎯→ c (определение предела → → → m по Гейне). m m В силу свойств m числовых последовательностей получаем: m f (x ) b ( f ( x m ) g ( x m )) ⎯m⎯ ⎯→ b c , ( f ( x m ) g ( x m )) ⎯m⎯ ⎯→ b c , ⎯m⎯ ⎯→ (если c 0 ). → → → m c g(x ) Отсюда и из определения предела функции по Гейне сразу следует утверждение теоремы. Определение 5. Функция f (x) удовлетворяет условию Коши в точке a ℝ𝑛 (при x → ), если для любого 0 найдется число = ( ) 0 такое, что для любых двух точек x, x D f таких, что 0 ( x , a) , 0 ( x , a) ( x , x ), выполнено: f ( x) − f ( x) . Теорема 2 (критерий Коши существования предела функции многих переменных). Функция f (x) имеет конечный предел в точке a ℝ𝑛 (при x → ) тогда и только тогда, когда она удовлетворяет условию Коши в точке a (при x → ). Доказательство. Будем проводить доказательство для случая, когда a ℝ𝑛 (случай a = рассматривается аналогично). Докажем сначала необходимость. Пусть lim f ( x) = b . x→a Зафиксируем число 0 . Тогда найдется = ( ) 0 такое, что для любых точек x , x D f , 0 ( x , a) , 0 ( x , a) , выполнено: f ( x ) − b , f ( x ) − b 2 2 (определение предела функции по Коши). Значит, f ( x) − f ( x) f ( x) − b + f ( x) − b = , то есть в точке a выполнено условие Коши. 2 2 Теперь докажем достаточность. Пусть функция f (x) удовлетворяет условию Коши в + точке a . Выберем последовательность аргументов x m такую, что x m ⎯m⎯ ⎯→ a , x m a . → Пусть 0 - произвольное число. Согласно критерию Коши, найдется такое = ( ) 0 , что для любых точек x, x D f , 0 ( x , a) , 0 ( x , a) , выполнено: f ( x) − f ( x) . Так как x m ⎯m⎯ ⎯→ a , то существует натуральный номер N такой, что → 0 ( x m , a) Тем более, 0 ( x m+ p , a) mN. для любого натурального числа p и любого m N . Значит, f ( x m+ p для любого ) − f (x ) . m Мы показали, что для любого 0 найдется такое натуральное N , что для любого m N , для любого натурального p выполнено: f ( x m + p ) − f ( x m ) . Это означает в точности, что числовая последовательность f ( x m ) фундаментальна. Значит, она сходится (критерий Коши сходимости числовых последовательностей). Осталось показать, что для любого выбора последовательности аргументов x m все последовательности значений функции f ( x m ) будут сходиться к одному и тому же числу. Пусть x m ⎯m⎯ ⎯→ a , → f ( y m ) ⎯m⎯ ⎯→ c . → xm a , y m ⎯m⎯ ⎯→ a , → Рассмотрим ym a ; f ( x m ) ⎯m⎯ ⎯→ b , → последовательность аргументов z = x , y , x , y ,, x , y ,. Тогда очевидно, что z ⎯⎯⎯→ a , z a . Значит, по m 1 1 2 2 m m m m m→ уже доказанному нами, существует число d такое, что f ( z m ) ⎯m⎯ ⎯→ d . Но → последовательности и являются подпоследовательностями f (xm ) f (ym ) m последовательности f ( z ) и должны сходиться к тому же пределу. Отсюда b = c = d . Теорема полностью доказана. Определение 6. Функция f (x) называется бесконечно малой в точке a ℝ𝑛 , если lim f ( x ) = 0 . Обозначение: f ( x) = o (1), x → a . x→a Определение 7. Пусть функция f ( x, y) определена в некоторой проколотой окрестности точки ( x0 , y0 ) ℝ2 . Если найдется такое 0 , что для любого числа 0 y B ( y 0 ) существует lim f ( x, y ) = ( y ) и существует lim ( y ) = b , то говорят, что x → x0 y → y0 существует повторный предел lim lim f ( x, y ) = b . y → y0 x → x0 Аналогично можно определить повторный предел lim lim f ( x, y ) . x → x0 y → y 0 Заметим, что существование повторных пределов функции в точке и существования ее предела как функции двух переменных (такой предел называют также двойным) не эквивалентны. Приведем соответствующие примеры. xy , x2 + y2 0 2 2 f ( x, y ) = x + y Примеры. 1) Пусть . Если y 0 , то 0, x2 + y2 = 0 xy 0 y lim 2 = = 0 , значит, lim lim f ( x, y ) = 0 . Аналогично lim lim f ( x, y ) = 0 . 2 x →0 y →0 y →0 x →0 x →0 x + y 0 + y2 Покажем, что не существует lim f ( x, y ) . Рассмотрим две последовательности: x →0 y →0 1 1 Тогда {( xm , y m )} ⎯m⎯ ⎯→(0, 0) , {( x m , y m )} = ,− . → m m 1 1 {( xm , y m )} ⎯m⎯ ⎯→(0, 0) , но { f ( x m , y m )} = , { f ( x m , y m )} = − , то есть для различных → 2 2 последовательностей аргументов, стремящихся к точке (0, 0) , соответствующие последовательности значений функции могут сходиться к разным числам. Это означает, что функция f ( x, y) не имеет предела в точке (0, 0) . Значит, из существования обоих повторных пределов не следует существования двойного. 1 1 {( x m , y m )} = , m m и Покажем, что и из существования двойного предела не следует существование повторных. 1 1 2 2 ( x + y ) sin sin , xy 0 x y 2) Рассмотрим функцию f ( x, y ) = . Если x 2 + y 2 → 0 , то 0, xy = 0 f ( x, y ) → 0 (как произведение бесконечно малой функции на ограниченную). Значит, lim f ( x, y ) = 0 (определение предела функции по Коши). x →0 y →0 Покажем, что не существует ни один из повторных пределов (поскольку переменные входят в нашу функцию симметричным образом, то достаточно рассмотреть один из таких 1 1 пределов). Пусть, например, y 0 . Тогда очевидно, что lim x 2 sin sin = 0 , а x →0 x y 1 1 lim y 2 sin sin не существует. Значит, не существует предел lim f ( x, y ) при любом x→ 0 x →0 x y фиксированном y 0 , и тем более, не существует предел lim lim f ( x, y ). y →0 x →0 Легко показать также, что у функции могут существовать двойной и один из повторных пределов, но не быть второго повторного предела. Для этого немного изменим функцию из примера 2: 1 2 2 ( x + y ) sin , y 0 y 3) Пусть f ( x, y ) = . Тогда lim f ( x, y ) = 0 , lim lim f ( x, y ) = 0 , x →0 y →0 x →0 0, y →0 y = 0 lim lim f ( x, y ) не существует (проверьте это самостоятельно!) x →0 y →0 И наконец, рассмотрим пример того, что оба повторных предела могут существовать, но не быть равными. x2 − y2 , x2 + y2 0 2 2 4) . Тогда ясно, что lim lim f ( x, y ) = −1 , а f ( x, y ) = x + y y →0 x →0 0, 2 2 x + y = 0 lim lim f ( x, y ) = 1 . Покажите, что lim f ( x, y ) в этом случае не существует. x →0 y →0 x →0 y →0 Упражнение. Покажите, что если существует lim f ( x, y ) = b и lim lim f ( x, y ) = c , то x → x0 y → y0 𝑏 = 𝑐. x → x0 y → y 0 Лекция 16. Непрерывность функции многих переменных. Пусть функция f (x) задана на множестве X ℝ𝑛 , a X , a является предельной точкой множества X . Определение 1 (формальное). Функция lim f ( x) = f ( a ) . f (x) непрерывна в точке a , если x→a Определение 2 (Коши). Функция f (x) непрерывна в точке a , если для любого 0 найдется число = ( ) 0 такое, что для любой точки x D f , для которой ( x, a) , выполнено: f ( x) − f (a) . Определение 3 (Гейне). последовательности Функция f (x) непрерывна в точке a , если для любой аргументов x , m x m ⎯m⎯ ⎯→ a , → соответствующая последовательность значений функции f ( x ) ⎯m⎯ ⎯→ f (a) . → m Эквивалентность определений 1, 2 и 3 сразу следует из эквивалентности определений предела функции по Коши и по Гейне. Пусть множество X ℝ𝑛 таково, что любая его точка является для него предельной. Определение 4. Функция f (x) , определенная на множестве X , называется непрерывной на этом множестве, если она непрерывна в каждой точке x X . x1 = x1 − a1 , ..., xn = xn − an - приращения аргументов. Тогда f ( x) = f ( x) − f (a) = f (a1 + x1 ,, an + xn ) − f (a1 ,, an ) - приращение функции f (x) в точке a . Отметим, что функция f (x) непрерывна в точке a тогда и только тогда, когда lim f ( x) = 0 , что равносильно: lim f ( x) = 0 . Обозначим x→a x1 →0 xn →0 Определение 5. Пусть k f ( x) = f (a1 ,, ak −1 , ak + xk , ak +1 ,, an ) − f (a1 ,, an ) частное приращение функции f (x) в точке a , соответствующее ли приращению xk . Функция f (x) называется непрерывной в точке a по переменной xk , если lim k f ( x) = 0 . xk →0 Замечание. Если функция непрерывна в некоторой точке, то она непрерывна в этой точке по каждой из переменных. Обратное, вообще говоря, неверно. ( x + y) 2 , x2 + y2 0 2 2 Примеры. 1) Пусть f ( x, y ) = x + y . Тогда lim f (0 + x,0) − f (0,0) = x →0 1, 2 2 x + y = 0 ( x ) 2 = lim − 1 = 0 . Значит, функция 2 x → 0 ( x ) f ( x, y) непрерывна по x в точке (0, 0) . Аналогично доказывается непрерывность по y в точке (0, 0) . Однако f ( x, y) не является 1 1 непрерывной в начале координат: пусть x m = , y m = − , тогда f ( xm , y m ) 0 . Мы m m получили, что последовательность {( xm , y m )} ⎯m⎯ , но { f ( xm , y m )} не стремится ⎯ → ( 0 , 0 ) → при m → к f (0, 0) = 1 , то есть функция f ( x, y) не является непрерывной в точке (0, 0) по совокупности аргументов (т.к. не выполняется определение Гейне). 𝑥2𝑦 , 𝑥 2 + 𝑦 2 ≠ 0, 2) Рассмотрим функцию 𝑓(𝑥, 𝑦) = {𝑥 4 +𝑦 2 . 0, 𝑥2 + 𝑦2 = 0 На любой прямой 𝑦 = 𝑘𝑥, 𝑘 ≠ 0, имеем: 𝑘𝑥 3 𝑘𝑥 lim 𝑓(𝑥, 𝑦) = lim 4 = lim 2 = 0 = 𝑓(0,0) 2 2 (𝑥,𝑦)→(0,0) 𝑥→0 𝑥 + 𝑘 𝑥 𝑥→0 𝑥 + 𝑘 2 При этом на кривой 𝑦 = 𝑥 2 : 𝑥4 1 1 lim 𝑓(𝑥, 𝑦) = lim 4 = lim = ≠ 𝑓(0, 0) 4 (𝑥,𝑦)→(0,0) 𝑥→0 𝑥 + 𝑥 𝑥→0 2 2 то есть функция разрывна в точке (0, 0) Теорема 1. Пусть функции f (x) и g (x) определены на множестве X ℝ𝑛 . Если f ( x) f (x) и g (x) непрерывны в точке a X , то функции ( f ( x) g ( x)) , ( f ( x) g ( x)) , g ( x) (при g (a) 0 ) непрерывны в точке a . Доказательство теоремы 1 следует из определения непрерывности функции в точке и теоремы об арифметических операциях над функциями, имеющими предел. Определение 6. Пусть x1 = 1 (t1 ,, t k ) , ..., xn = n (t1 ,, t k ) - функции, заданные на множестве T ℝ𝑘 . Тогда любой точке t T можно поставить в соответствие точку x = ( x1 ,, xn ) = (1 (t ),, n (t )) ℝ𝑛 . Пусть X ℝ𝑛 - множество всех таких точек x . Если на множестве X задана функция f ( x) : X → ℝ, то говорят, что на множестве T задана сложная функция f ( x1 (t1 ,, t k ),, xn (t1 ,, t k )) = f ( x(t )) : T → ℝ. Теорема 2 (непрерывность сложной функции). Пусть функции x1 = 1 (t1 ,, t k ) , ..., xn = n (t1 ,, t k ) непрерывны в точке a = (a1 ,, ak ) T , а функция f ( x1 ,, xn ) непрерывна в точке b = (b1 ,, bn ) , где b j = j (a1 ,, ak ) , j = 1,, n . Тогда сложная функция f ( x(t )) непрерывна в точке a . Доказательство. Пусть последовательность {t m } = {(t1m ,, t km )} точек множества T сходится к точке a = (a1 ,, ak ) T . Обозначим {x m } = {( x1m ,, xnm )} . Так как все функции последовательность {x m } сходится к j (t ) x mj = j (t1m ,, t km ) , j = 1,, n ; непрерывны в точке b = (1 (a),, n (a)) a , то (здесь мы пользуемся определением непрерывности функции по Гейне, а также тем фактом, что последовательность точек пространства ℝ𝑛 сходится тогда и только тогда, когда она сходится покоординатно). Поскольку функция f ( x1 ,, xn ) , в свою очередь, непрерывна в точке b = (b1 ,, bn ) , b j = j (a1 ,, ak ) , то числовая последовательность { f ( x m )} сходится к f (b) . Мы получили, что для любой последовательности аргументов {t m } = {(t1m ,, t km )} , сходящейся к точке a , соответствующая последовательность значений функции { f ( x(t m ))} сходится к f ( x(a)) . Это означает, что сложная функция f ( x(t )) непрерывна в точке a . Теорема доказана. Теорема 3 (сохранение знака). Если функция f (x) определена в некоторой окрестности точки a ℝ𝑛 , непрерывна в точке a и f (a) 0 ( 0) то существует число 0 такое, что f ( x) 0 ( 0) для любой точки x B (a) . Доказательство. Пусть f (a) 0 (случай противоположного знака рассматривается f (a ) аналогично). Обозначим = . Тогда 0 и существует 0 такое, что 2 f ( x) − f (a) для любого x , (a, x) (определение Коши непрерывности функции в точке). Раскрывая модуль, получим: 0 f (a) 3 f (a) для любого x B (a) . f ( x) 2 2 Теорема доказана. Теорема 4 (прохождение через промежуточные значения). Пусть множество X ℝ𝑛 линейно связно, и функция f (x) непрерывна в каждой точке множества X . Если точки a, b X , а число лежит между f (a ) и f (b) , то на любой непрерывной кривой, соединяющей точки a и b и принадлежащей множеству X , найдется точка c такая, что f (c) = . Доказательство. Пусть кривая L задается уравнениями x1 = 1 (t ) , ..., xn = n (t ) , t , все функции k (t ) непрерывны на отрезке [ , ] , причем L целиком принадлежит множеству X . Тогда на отрезке [ , ] задана функция f ( x1 (t ),, xn (t )) , которая является непрерывной на [ , ] по теореме о непрерывности сложной функции. Поскольку f ( x(t )) является числовой функцией аргумента t , то (по теореме о прохождении непрерывной функции через любое промежуточное значение) для любого числа , лежащего между f ( x( )) и f ( x( )) , найдется точка [ , ] такая, что f (x( )) = . Пусть c ℝ𝑛 - точка с координатами (1 ( ),, n ( )) . Тогда c L , f (c) = . Теорема доказана. Теорема 5 (первая теорема Вейерштрасса). Если функция f (x) непрерывна на замкнутом ограниченном множестве X ℝ𝑛 , то она ограничена на этом множестве. Доказательство. Пусть это не так. Тогда для любого натурального числа m найдется точка x m X такая, что f ( x m ) m . Последовательность {x m } ограничена (поскольку ограничено множество X ), значит, из нее можно выделить сходящуюся подпоследовательность {x km } (теорема Больцано-Вейерштрасса). Пусть x km ⎯m⎯ ⎯→ x0 . → Так как множество X замкнуто, то оно содержит все свои предельные точки. Следовательно, x0 X . Тогда функция f (x) непрерывна в точке x0 и последовательность { f ( x km )} должна сходиться при m → к числу f ( x0 ) . Но последовательность { f ( x km )} - бесконечно большая (так как f ( x km ) k m для любого m ). Значит, наше предположение неверно, и функция f (x) ограничена на множестве X . Теорема доказана. Определение 7. Точной верхней (нижней) гранью функции f (x) на множестве X ℝ𝑛 называется действительное число M ( m ) такое, что 1) f ( x) M ( f ( x) m) для любого x X ; 2) для любого числа 0 найдется точка x X такая, что f ( x ) M − ( f ( x ) m + ). Теорема 6 (вторая теорема Вейерштрасса). Если функция f (x) непрерывна на замкнутом ограниченном множестве X ℝ𝑛 , то она достигает на этом множестве своих точной верхней и точной нижней граней. Доказательство. Пусть M = sup f ( x) . Если f ( x) M для любого x X , то функция X 1 непрерывна на множестве X и F ( x) 0 для любого x X . Значит, M − f ( x) согласно первой теореме Вейерштрасса, существует число A 0 такое, что F ( x) A при 1 всех x X . Тогда f ( x) M − M для любого x X . Мы пришли к противоречию с A определением точной верхней грани. Значит, наше предположение неверно, и существует точка x0 X такая, что f ( x0 ) = M . Случай точной нижней грани рассматривается аналогично. Теорема доказана. F ( x) = Определение 8. Пусть множество X ℝ𝑛 таково, что любая его точка является предельной. Функция f (x) равномерно непрерывна на множестве X , если для любого 0 найдется число = ( ) 0 такое, что для любых двух точек x , x X , ( x, x) , выполнено: f ( x) − f ( x) . Теорема 7 (теорема Кантора). Если функция f (x) непрерывна на замкнутом ограниченном множестве X ℝ𝑛 , то она равномерно непрерывна на этом множестве. Доказательство. Пусть f (x) непрерывна, но не равномерно непрерывна на X . Тогда существует 0 такое, что для любого натурального числа m найдутся точки 1 xm , xm X , для которых ( x m , x m ) , но m f ( xm ) − f ( xm ) . (1) Последовательность {x m } ограничена, следовательно, из нее можно выделить сходящуюся подпоследовательность {x k m } . Пусть xkm ⎯m⎯ ⎯→ x0 . Так как множество X → замкнуто, то x0 X . Функция f (x) непрерывна в точке x0 , значит, f ( xk m ) ⎯m⎯ ⎯→ f ( x0 ) → . 1 , то последовательность {x km } также km при m → . Значит, f ( xkm ) ⎯m⎯ ⎯→ f ( x0 ) . Тогда получаем, что → С другой стороны, так как ( x k m , x km ) сходится к точке x0 f ( x k m ) − f ( x km ) ⎯m⎯ ⎯→ 0 . Это противоречит неравенству (1). Следовательно, наше → предположение неверно, и функция f (x) равномерно непрерывна на множестве X . Теорема доказана. Лекция 17. Дифференцирование функции многих переменных. Пусть функция 𝑓(𝑥) определена на множестве 𝑋 ⊂ ℝ𝑛 , точка 𝑥 0 = (𝑥10 , 𝑥20 , . . . , 𝑥𝑛0 ) −внутренняя точка множества 𝑋; ∆𝑥 = (∆𝑥1 , . . . , ∆𝑥𝑛 ), где ∆𝑥𝑘 ∈ ℝ, 𝑘 = 1,2, . . . , 𝑛 −приращения аргументов, такие, что точка 𝑥 = 𝑥 0 + ∆𝑥 ∈ 𝑋. Определение 1. Частной производной функции 𝑓(𝑥) по переменной 𝑥𝑘 в точке 𝑥 0 называется предел: 0 0 0 0 ∂𝑓 0 ∆𝑘 𝑓 𝑓(𝑥10 , . . . , 𝑥𝑘−1 , 𝑥𝑘0 + ∆𝑥𝑘 , 𝑥𝑘+1 , . . . , 𝑥𝑛0 ) − 𝑓(𝑥10 , . . . , 𝑥𝑘−1 , 𝑥𝑘0 , 𝑥𝑘+1 , . . . , 𝑥𝑛0 ) (𝑥 ) = lim = lim . ∆𝑥𝑘 →0 ∆𝑥𝑘 ∆𝑥𝑘 →0 ∂𝑥𝑘 ∆𝑥𝑘 ∂𝑓 Часто вместо ∂𝑥 (𝑥 0 ) применяют обозначение 𝑓𝑥′𝑘 (𝑥 0 ). 𝑘 Заметим, что частная производная – это обычная производная функции одной переменной, которая получается из функции 𝑓(𝑥), если зафиксировать и считать постоянными все её переменные, кроме 𝑥𝑘 . А поскольку из дифференцируемости функции одной переменной следует её непрерывность (в данной точке), то отсюда сразу следует, что если существует частная производная ∂𝑓 (𝑥 0 ), то функция 𝑓(𝑥) непрерывна в точке 𝑥 0 по переменной 𝑥𝑘 . ∂𝑥 𝑘 𝑦 Пример. Для функции 𝑓(𝑥, 𝑦, 𝑧) = 𝑥 𝑧 частные производные в точке (𝑥, 𝑦, 𝑧) (при 𝑥 > 0, 𝑧 ≠ 0) следующие: 𝑦 𝑦 𝑦 1 𝑦 1 𝑓𝑥′ = ⋅ 𝑥 𝑧 −1 , 𝑓𝑦′ = ⋅ 𝑥 𝑧 ⋅ ln 𝑥 , 𝑓𝑧′ = 𝑦𝑥 𝑧 (− 2 ) ln 𝑥. 𝑧 𝑧 𝑧 Определение 2. Говорят, что функция 𝑓(𝑥) дифференцируема в точке 𝑥 0 , если существует такая окрестность 𝐵𝛿 (𝑥 0 ) точки 𝑥 0 , что для любого 𝑥 ∈ 𝐵𝛿 (𝑥 0 ) приращение ∆𝑓 = 𝑓(𝑥) − 𝑓(𝑥 0 ) имеет вид: ∆𝑓 = 𝐴1 ∆𝑥1 +. . . +𝐴𝑛 ∆𝑥𝑛 + 𝑜̄ (𝜌), 𝜌→0, (1) 2 2 где 𝐴1 , . . . , 𝐴𝑛 - фиксированные числа, не зависящие от 𝑥, 𝜌 = ‖∆𝑥‖ = √∆𝑥1 +. . . +∆𝑥𝑛 . Заметим, что 𝑜̄ (𝜌) = ∆𝑥 𝑜̄ (𝜌) 𝜌 ⋅ 2 ∆𝑥12 +...+∆𝑥𝑛 Поскольку | 𝜌𝑘| ≤ 1, а величина 𝜌 𝑜̄ (𝜌) 𝜌 = 𝑜̄ (𝜌) 𝜌 ∆𝑥 𝑜̄ (𝜌) ∆𝑥 ⋅ 𝜌1 ⋅ ∆𝑥1 +. . . + 𝜌 ⋅ 𝜌𝑛 ⋅ ∆𝑥𝑛 . бесконечно мала при 𝜌 → 0, то, обозначив 𝛼𝑘 = 𝑜̄ (𝜌)⋅∆𝑥𝑘 𝜌2 , 𝑘 = 1,2, . . . , 𝑛, получаем: 𝑜̄ (𝜌) = 𝛼1 ⋅ Δ𝑥1 +. . . +𝛼𝑛 ⋅ Δ𝑥𝑛 , где 𝛼1 , . . . , 𝛼𝑛 - бесконечно малы при 𝜌 → 0, или, равносильно, при ∆𝑥1 → 0, … ∆𝑥𝑛 → 0. Это позволяет получить следующее представление приращения дифференцируемой функции: ∆𝑓 = 𝐴1 ∆𝑥1 +. . . +𝐴𝑛 ∆𝑥𝑛 + 𝛼1 ∆𝑥1 +. . . +𝛼𝑛 ∆𝑥𝑛 = (𝐴, ∆𝑥) + (𝛼, ∆𝑥). (2) Здесь в скалярных произведениях участвуют векторы 𝐴 = (𝐴1 , . . . , 𝐴𝑛 ), 𝛼 = (𝛼1 , . . . , 𝛼𝑛 ), ∆𝑥 = (∆𝑥1 , . . . , ∆𝑥𝑛 ). ∆𝑥1 ∆𝑥𝑛 Наоборот, 𝛼1 ∆𝑥1 + ⋯ + 𝛼𝑛 ∆𝑥𝑛 = 𝜌 ∙ (𝛼1 𝜌 + ⋯ + 𝛼𝑛 𝜌 ) = 𝑜̅ (𝜌), 𝜌 → 0. При этом выражение 𝐴1 Δ𝑥1 +. . . +𝐴𝑛 Δ𝑥𝑛 = (𝐴, Δ𝑥) есть главная, линейная относительно приращений переменных, часть приращения функции ∆𝑓. Определение 3. Дифференциалом (первым дифференциалом) функции 𝑓(𝑥) в точке 𝑥 0 (соответствующим вектору ∆𝑥 приращений переменных) называется главная, линейная относительно приращений переменных, часть приращения функции: 𝑑𝑓(𝑥 0 ; ∆𝑥) = 𝐴1 ∆𝑥1 +. . . +𝐴𝑛 ∆𝑥𝑛 , где константы 𝐴1 , . . . , 𝐴𝑛 определены из равенства (1). Что же представляют собой эти константы 𝐴1 , . . . , 𝐴𝑛 ? Ответ на этот вопрос мы получим из следующей теоремы. Теорема 1. (Необходимое условие дифференцируемости функции). Если функция 𝑓(𝑥) дифференцируема в точке 𝑥 0 , то в этой точке существуют её частные производные 𝑓𝑥′𝑘 по всем переменным 𝑥𝑘 , 𝑘 = 1, . . . , 𝑛. Кроме того, 𝑓𝑥′𝑘 (𝑥 0 ) = 𝐴𝑘 , 𝑘 = 1, . . . , 𝑛, где 𝐴𝑘 − постоянные из формулы (1). 1 Доказательство. Возьмём вектор приращений Δ𝑥 = Δ𝑘 𝑥 = (0, . . . ,0, Δ𝑥𝑘 , 0, . . . ,0), то есть переместимся от точки 𝑥 0 в некоторую точку 𝑥 вдоль координатной оси 𝑥𝑘 . Поскольку 𝑓(𝑥) дифференцируема в 𝑥 0 , то её приращение (согласно (1)) в данном случае имеет вид: ∆𝑓 = 𝐴𝑘 ∆𝑥𝑘 + ∂𝑓 ∆ 𝑓 𝑜̄ (𝜌), 𝜌 = |∆𝑥𝑘 |. Следовательно, ∂𝑥 (𝑥 0 ) = lim ∆𝑥𝑘 = 𝐴𝑘 , что и завершает доказательство теоремы. 𝑘 ∆𝑥𝑘 →0 𝑘 Отметим, что теорема 1 также показывает, что константы 𝐴1 , . . . , 𝐴𝑛 в определении 2 являются однозначно определёнными. Следствие. Если функция 𝑓(𝑥) дифференцируема в точке 𝑥 0 , то при достаточно малом 𝜌 приращение функции имеет вид: ∂𝑓 ∂𝑓 ∆𝑓 = ∂𝑥 ⋅ ∆𝑥1 +. . . + ∂𝑥 ⋅ ∆𝑥𝑛 + 𝑜(𝜌), (3) 1 𝑛 где все частные производные вычислены в точке 𝑥 0 . Из теоремы 1 вытекает также, что для дифференцируемой функции можно определять дифференциал как главную, линейную относительно приращений переменных, часть приращения функции, задаваемую равенством: ∂𝑓 ∂𝑓 𝑑𝑓(𝑥 0 ; ∆𝑥) = ∂𝑥 (𝑥 0 ) ⋅ ∆𝑥1 +. . . + ∂𝑥 (𝑥 0 ) ⋅ ∆𝑥𝑛 . (4) 1 𝑛 Теорема 2. Если функция 𝑓(𝑥) дифференцируема в точке 𝑥 0 , то она непрерывна в этой точке. Доказательство. Используя представление (3) и неравенства: |Δ𝑥𝑘 | ≤ 𝜌, 𝑘 = 1, . . . , 𝑛, получаем: ∂𝑓 ∂𝑓 |∆𝑓| = | ⋅ ∆𝑥1 +. . . + ⋅ ∆𝑥𝑛 + 𝑜̄ (𝜌)| ≤ ∂𝑥1 ∂𝑥𝑛 𝑛 ∂𝑓 ∂𝑓 ∂𝑓 ≤| ⋅ ∆𝑥1 | +. . . + | ⋅ ∆𝑥𝑛 | + |𝑜̄ (𝜌)| ≤ (∑ | |) ⋅ 𝜌 + |𝑜̄ (𝜌)| ∂𝑥1 ∂𝑥𝑛 ∂𝑥𝑘 𝑘=1 Отсюда ясно, что lim ∆𝑓 = 0. Это и означает непрерывность функции 𝑓(𝑥) в данной точке. 𝜌→0 Теорема доказана. Геометрический смысл дифференцируемости функции двух переменных. Касательная плоскость к поверхности. Известно, что дифференцируемость функции одной переменной равносильна существованию (в соответствующей точке) касательной у графика этой функции. Оказывается, понятие дифференцируемости функции двух переменных имеет, как мы увидим ниже, аналогичный геометрический смысл. Пусть задана некоторая поверхность 𝑆: 𝐹(𝑥, 𝑦, 𝑧) = 0. Определение 4. Плоскость 𝑃 называется касательной к поверхности 𝑆: 𝐹(𝑥, 𝑦, 𝑧) = 0 в точке 𝑀0 = 𝑀0 (𝑥0 ; 𝑦0 ; 𝑧0 ), если угол между плоскостью 𝑃 и всякой секущей 𝐿, проходящей через точку 𝑀0 и (любую) другую точку 𝑀 = 𝑀(𝑥; 𝑦; 𝑧) поверхности 𝑆, стремится к нулю при 𝑀 → 𝑀0 . Заметим, что, согласно этому определению, для любой кривой 𝑙, 𝑙 ⊂ 𝑆, проходящей через точку 𝑀0 , касательная к ней (если она существует) в точке 𝑀0 обязательно лежит в плоскости 𝑃. Лемма 1. Пусть функция 𝑧 = 𝑓(𝑥, 𝑦) дифференцируема в точке (𝑥0 ; 𝑦0 ), и 𝑧0 = 𝑓(𝑥0 ; 𝑦0 ). Тогда у поверхности Γ: 𝑓(𝑥, 𝑦) − 𝑧 = 0 (представляющей собой график данной функции) в точке 𝑀0 = 𝑀0 (𝑥0 ; 𝑦0 ; 𝑧0 ) имеется касательная плоскость, задаваемая следующим образом: 𝑃 = 𝑃𝑀Γ 0 : 𝑓𝑥′ (𝑥0 ; 𝑦0 )(𝑥 − 𝑥0 ) + 𝑓𝑦′ (𝑥0 ; 𝑦0 )(𝑦 − 𝑦0 ) − (𝑧 − 𝑧0 ) = 0. Доказательство. Покажем, что 𝑃 удовлетворяет определению касательной плоскости. Как известно из курса аналитической геометрии, вектор 𝑛̄ 𝑃 = {𝑓𝑥′ (𝑥0 ; 𝑦0 ); 𝑓𝑦′ (𝑥0 ; 𝑦0 ); −1} является нормальным к 𝑃 в точке 𝑀0 = 𝑀0 (𝑥0 ; 𝑦0 ; 𝑧0 ) ∈ 𝑃. Пусть 𝑀 = 𝑀(𝑥; 𝑦; 𝑧) − некоторая другая точка графика Γ. Тогда |𝑓𝑥′ (𝑥0 ; 𝑦0 )(𝑥 − 𝑥0 ) + 𝑓𝑦′ (𝑥0 ; 𝑦0 )(𝑦 − 𝑦0 ) − (𝑧 − 𝑧0 )| |(𝑀0 𝑀, 𝑛̄ 𝑃 )| | cos ∠( 𝑀0 𝑀, 𝑛̄ 𝑃 )| = = . ‖𝑀0 𝑀‖ ⋅ ‖𝑛̄ 𝑃 ‖ ‖𝑀0 𝑀‖ ⋅ ‖𝑛̄ 𝑃 ‖ Далее, воспользовавшись тем, что в силу дифференцируемости функции 𝑧 = 𝑓(𝑥, 𝑦) в точке (𝑥0 ; 𝑦0 ), выражение под знаком модуля в числителе есть 𝑜̄ (𝜌), где 𝜌 = √(𝑥 − 𝑥0 )2 + (𝑦 − 𝑦0 )2, а ‖𝑀0 𝑀‖ = √(𝑥 − 𝑥0 )2 + (𝑦 − 𝑦0 )2 + (𝑧 − 𝑧0 )2 ≥ 𝜌, получаем: 2 |𝑜̄ (𝜌)| |𝑜̄ (𝜌)| | cos ∠( 𝑀0 𝑀, 𝑛̄ 𝑃 )| = ‖𝑀 𝑀‖⋅‖𝑛̄ ‖ ≤ 𝜌⋅‖𝑛̄ ‖ → 0 Лемма доказана. 𝑃 𝑃 𝑀→𝑀0 0. Выясним теперь, каким условиям должна удовлетворять функция для того, чтобы она была дифференцируемой. Оказывается, что наличие частных производных у функции в данной точке не является достаточным условием для её дифференцируемости. 𝑥𝑦 , 𝑥2 + 𝑦2 > 0 2 +𝑦 2 𝑥 Пример. Рассмотрим функцию 𝑓(𝑥, 𝑦) = { . Её обе частные производные в 0, 𝑥 = 𝑦 = 0 точке (0; 0) равны нулю, поскольку 𝑓(0, 𝑦) ≡ 𝑓(𝑥, 0) ≡ 0. При этом функция не дифференцируема в 𝑥𝑦 этой точке, поскольку Δ𝑓 = 𝑓(𝑥, 𝑦) − 𝑓(0; 0) = 𝑥 2+𝑦 2 - не имеет предела при 𝜌 = √𝑥 2 + 𝑦 2 → 0 (Убедитесь в этом самостоятельно!). Теорема 3. (Достаточное условие дифференцируемости функции). Если функция 𝑓(𝑥) = 𝑓(𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ) имеет все частные производные в некоторой окрестности точки𝑥 0 = (𝑥10 , 𝑥20 , . . . , 𝑥𝑛0 ), и все они непрерывны в самой точке 𝑥 0 , то 𝑓(𝑥) дифференцируема в точке 𝑥 0 . Доказательство. Рассмотрим приращение функции 𝑓(𝑥) в точке 𝑥 0 : ∆𝑓 = 𝑓(𝑥10 + ∆𝑥1 , … , 𝑥𝑛0 + ∆𝑥𝑛 ) − 𝑓(𝑥10 , … , 𝑥𝑛0 ) = 0 0 = [𝑓(𝑥10 + ∆𝑥1 , … , 𝑥𝑛−1 + ∆𝑥𝑛−1 , 𝑥𝑛0 + ∆𝑥𝑛 ) − 𝑓(𝑥10 + ∆𝑥1 , … , 𝑥𝑛−1 + ∆𝑥𝑛−1 , 𝑥𝑛0 )] + 0 0 0 0 +[𝑓(𝑥10 + ∆𝑥1 , … , 𝑥𝑛−2 + ∆𝑥𝑛−2 , 𝑥𝑛−1 + ∆𝑥𝑛−1 , 𝑥𝑛0 ) − 𝑓(𝑥10 + ∆𝑥1 , … , 𝑥𝑛−2 + ∆𝑥𝑛−2 , 𝑥𝑛−1 , 𝑥𝑛0 )] + + ⋯ + [𝑓(𝑥10 + ∆𝑥1 , 𝑥20 , … 𝑥𝑛0 ) − 𝑓(𝑥10 , 𝑥20 , … , 𝑥𝑛0 )] = (применяя теорему Лагранжа к разностям в квадратных скобках, получаем) 0 0 = 𝑓𝑥′𝑛 (𝑥10 + ∆𝑥1 , … , 𝑥𝑛−1 + ∆𝑥𝑛−1 , 𝑥𝑛0 + 𝜃𝑛 ∆𝑥𝑛 )∆𝑥𝑛 + 𝑓𝑥′𝑛−1 (𝑥10 + ∆𝑥1 , … , 𝑥𝑛−1 + 𝜃𝑛−1 ∆𝑥𝑛−1 , 𝑥𝑛0 )∆𝑥𝑛−1 + 0 + ⋯ + 𝑓𝑥′1 (𝑥10 + 𝜃1 ∆𝑥1 , 𝑥20 , … , 𝑥𝑛−1 , 𝑥𝑛0 )∆𝑥1= (в силу непрерывности частных производных в точке 𝑥 0 ) 0 0 = (𝑓𝑥′𝑛 (𝑥10 , … , 𝑥𝑛−1 , 𝑥𝑛0 ) + 𝛼𝑛 )∆𝑥𝑛 + (𝑓𝑥′𝑛−1 (𝑥10 , … , 𝑥𝑛−1 , 𝑥𝑛0 ) + 𝛼𝑛−1 )∆𝑥𝑛−1 + ⋯ 0 … + (𝑓𝑥′1 (𝑥10 , … , 𝑥𝑛−1 , 𝑥𝑛0 ) + 𝛼1 )∆𝑥1= = 𝑓𝑥′1 (𝑥 0 )∆𝑥1 + ⋯ + 𝑓𝑥′𝑛 (𝑥 0 )∆𝑥𝑛 + 𝛼1 ∆𝑥1 + ⋯ + 𝛼𝑛 ∆𝑥𝑛 , где 𝛼𝑘 → 0 при ∆𝑥1 → 0, … ∆𝑥𝑛 → 0, 𝑘 = 1, … , 𝑛. Это и означает дифференцируемость функции 𝑓(𝑥) в точке 𝑥 0 . Теорема доказана. 1 (𝑥 2 + 𝑦 2 ) sin 2 2 , 𝑥 2 + 𝑦 2 ≠ 0, 𝑥 +𝑦 Пример. Функция 𝑓(𝑥, 𝑦) = { дифференцируема в точке (0, 0): 0, 𝑥2 + 𝑦2 = 0 1 𝑓(𝑥, 0) = 𝑥 2 sin 𝑥 2, следовательно, 𝑓𝑥′ (0, 0) = 0; аналогично 𝑓𝑦′ (0, 0) = 0. Далее, 1 √𝑥 2 + 𝑦 2 → 0. ∆𝑓(0, 0) = (𝑥 2 + 𝑦 2 ) sin 2 = 0 ∙ (𝑥 − 0) + 0 ∙ (𝑦 − 0) + 𝑜̅ (√𝑥 2 + 𝑦 2 ) , 𝑥 + 𝑦2 При этом частные производные функции 𝑓(𝑥, 𝑦) разрывны в точке (0, 0) (проверьте!) Дифференцируемость сложной функции. Пусть 𝑔(𝑡) = 𝑓(𝜙(𝑡)) сложная функция, где 𝑓(𝑥) = 𝑓(𝑥1 , . . . , 𝑥𝑛 ), и 𝑥𝑖 (𝑡) = 𝜙𝑖 (𝑡1 , . . . , 𝑡𝑘 ), 𝑖 = 1, . . . , 𝑛. Теорема 4. Пусть функции 𝜙𝑖 (𝑡) = 𝜙𝑖 (𝑡1 , . . . , 𝑡𝑘 ), 𝑖 = 1, . . . , 𝑛, дифференцируемы в точке 𝑡 0 = (𝑡10 , . . . , 𝑡𝑘0 ), и функция 𝑓(𝑥) = 𝑓(𝑥1 , . . . , 𝑥𝑛 ) дифференцируема в точке 𝑥 0 = (𝑥10 , 𝑥20 , . . . , 𝑥𝑛0 ), где 𝑥𝑖0 = 𝜙𝑖 (𝑡 0 ), 𝑖 = 1, . . . , 𝑛. Тогда сложная функция 𝑔(𝑡) = 𝑓(𝜙(𝑡)) дифференцируема в точке 𝑡 0 = (𝑡10 , . . . , 𝑡𝑘0 ). Доказательство. Рассмотрим приращение: ∆𝑔 = 𝑔(𝑡) − 𝑔(𝑡 0 ) = 𝑓(𝑥(𝑡)) − 𝑓(𝑥(𝑡 0 )) = 𝑓𝑥′1 ⋅ ∆𝑥1 +. . . +𝑓𝑥′𝑛 ⋅ ∆𝑥𝑛 + 𝑜̄ (‖∆𝑥‖) В силу дифференцируемости функций 𝑥𝑖 = 𝜙𝑖 (𝑡) = 𝜙𝑖 (𝑡1 , . . . , 𝑡𝑘 ), 𝑖 = 1, . . . , 𝑛, приращения ∆𝑥𝑖 имеют вид: 3 ∆𝑥𝑖 = 𝜙𝑖 (𝑡) − 𝜙𝑖 (𝑡 0 ) = (𝜙𝑖 )′𝑡1 ⋅ ∆𝑡1 +. . . +(𝜙𝑖 )′𝑡𝑘 ⋅ ∆𝑡𝑘 + 𝑜̄ 𝑖 (‖∆𝑡‖), 𝑖 = 1, . . . , 𝑛. Подставляя эти выражения в представление для приращения ∆𝑔, получаем: ∆𝑔 = (∑𝑛𝑖=1 𝑓𝑥′𝑖 ⋅ (𝑥𝑖 )′𝑡1 ) ⋅ ∆𝑡1 +. . . +(∑𝑛𝑖=1 𝑓𝑥′𝑖 ⋅ (𝑥𝑖 )′𝑡𝑘 ) ⋅ ∆𝑡𝑘 + ∑𝑛𝑖=1 𝑓𝑥′𝑖 ⋅ 𝑜̄ 𝑖 (‖∆𝑡‖) + 𝑜̄ (‖∆𝑥‖). Далее, поскольку 𝑜̄ (‖∆𝑥‖) = ∑𝑛𝑖=1 𝛼𝑖 ∆𝑥𝑖 , то получаем: 𝑜̄ (‖∆𝑥‖) = 𝑜̄ (‖∆𝑡‖). Последнее равенство следует из того, что |Δ𝑡𝑗 | ≤ ‖Δ𝑡‖, 𝑗 = 1, . . . , 𝑘, и кроме того, 𝛼𝑖 → 0 при ‖Δ𝑡‖ → 0. (Действительно, из условия ‖Δ𝑡‖ → 0 в силу дифференцируемости, а значит, и непрерывности, функции 𝑥𝑖 = 𝜙𝑖 (𝑡) следует, что ‖Δ𝑥‖ → 0, а следовательно, и 𝛼𝑖 → 0.) Кроме того, ∑𝑛𝑖=1 𝑓𝑥′𝑖 ⋅ 𝑜̄ 𝑖 (‖∆𝑡‖) = 𝑜(‖∆𝑡‖). Итак, получаем: ∆𝑔 = (∑𝑛𝑖=1 𝑓𝑥′𝑖 ⋅ (𝑥𝑖 )′𝑡1 ) ⋅ ∆𝑡1 +. . . +(∑𝑛𝑖=1 𝑓𝑥′𝑖 ⋅ (𝑥𝑖 )′𝑡𝑘 ) ⋅ ∆𝑡𝑘 + 𝑜̄ (‖∆𝑡‖), что и означает дифференцируемость данной сложной функции 𝑔(𝑡) = 𝑓(𝜙(𝑡)) в точке 𝑡0 = (𝑡10 , . . . , 𝑡𝑘0 ). (Напомним здесь ещё раз, что все частные производные вычислены в заданных точках 𝑡 0 , 𝑥 0 соответственно). Теорема доказана. Замечание: Из доказательства теоремы 4 видно, что частные производные сложной функции вычисляются по формулам: 𝑛 ∂𝑔 ∂𝑓 ∂𝜙𝑖 =∑ ⋅ , 𝑗 = 1, . . . , 𝑘. ∂𝑡𝑗 ∂𝑥𝑖 ∂𝑡𝑗 𝑖=1 Инвариантность формы записи (первого) дифференциала. Из теоремы 4 вытекает также следующее важное Утверждение 1. Первый дифференциал функции многих переменных имеет инвариантную форму записи: ∂𝑓 ∂𝑓 𝑑𝑓 = ⋅ 𝑑𝑥1 +. . . + ⋅ 𝑑𝑥𝑛 ∂𝑥1 ∂𝑥𝑛 независимо от того, является ли эта функция простой (то есть 𝑥1 , . . . , 𝑥𝑛 - независимые переменные) или сложной (то есть 𝑥𝑖 (𝑡) = 𝜙𝑖 (𝑡1 , . . . , 𝑡𝑘 ), 𝑖 = 1, . . . , 𝑛.) При этом смысл выражений 𝑑𝑥𝑖 различен. В первом случае, когда 𝑥𝑖 - независимые переменные, 𝑑𝑥𝑖 = Δ𝑥𝑖 − фиксированные приращения переменных; во втором случае 𝑑𝑥𝑖 = 𝑑𝜙𝑖 (𝑡) – это дифференциалы функций 𝑥𝑖 (𝑡) = 𝜙𝑖 (𝑡1 , . . . , 𝑡𝑘 ), 𝑖 = 1, . . . , 𝑛.) Доказательство. Пусть сначала 𝑥𝑘 , 𝑘 = 1, . . . , 𝑛 − независимые переменные. Тогда 𝑑𝑥𝑘 = (𝑥𝑘 )′𝑥1 ∆𝑥1 + ⋯ + (𝑥𝑘 )′𝑥𝑘 ∆𝑥𝑘 + ⋯ + (𝑥𝑘 )′𝑥𝑛 ∆𝑥𝑛 = ∆𝑥𝑘 . Значит, дифференциал функции 𝑓(𝑥) = 𝑓(𝑥1 , . . . , 𝑥𝑛 ) от 𝑛 независимых переменных имеет вид: ∂𝑓 ∂𝑓 𝑑𝑓 = ⋅ 𝑑𝑥1 +. . . + ⋅ 𝑑𝑥𝑛 . ∂𝑥1 ∂𝑥𝑛 Если 𝑥𝑖 (𝑡) = 𝜙𝑖 (𝑡1 , . . . , 𝑡𝑘 ), 𝑖 = 1, . . . , 𝑛, то из теоремы 4 перегруппировкой слагаемых получаем: ∆𝑔 = 𝑓𝑥′1 ⋅ [∑𝑘𝑗=1(𝑥1 )′𝑡𝑗 ) ⋅ ∆𝑡𝑗 ]+. . . +𝑓𝑥′𝑛 ⋅ [∑𝑘𝑗=1(𝑥𝑛 )′𝑡𝑗 ) ⋅ ∆𝑡𝑗 ] + 𝑜̄ (‖∆𝑡‖), где выражения в квадратных скобках представляют собой дифференциалы функций 𝑥𝑖 (𝑡) = 𝜙𝑖 (𝑡1 , . . . , 𝑡𝑘 ), 𝑖 = 1, . . . , 𝑛. Отсюда сразу следует нужное равенство. Утверждение доказано. Инвариантная форма первого дифференциала позволяет установить правила его вычисления: 1) 𝑑(𝑐 ⋅ 𝑓) = 𝑐 ⋅ 𝑑𝑓, 𝑐 ∈ ℝ − константа; 2) 𝑑(𝑓 ± 𝑔) = 𝑑𝑓 ± 𝑑𝑔; 3)𝑑(𝑓 ⋅ 𝑔) = 𝑔 ⋅ 𝑑𝑓 + 𝑓 ⋅ 𝑑𝑔; 𝑓 𝑔⋅𝑑𝑓−𝑓⋅𝑑𝑔 4) 𝑑 (𝑔) = , 𝑔 ≠ 0. 𝑔2 Докажем, например, равенство 3). Обозначим ℎ = 𝑓 ∙ 𝑔, тогда (в силу инвариантности формы первого дифференциала) 𝑑ℎ = ℎ𝑓′ 𝑑𝑓 + ℎ𝑔′ 𝑑𝑔 = (𝑓𝑔)′𝑓 𝑑𝑓 + (𝑓𝑔)′𝑔 𝑑𝑔 = 𝑔𝑑𝑓 + 𝑓𝑑𝑔. Упражнение. Докажите равенства 1), 2) и 4). 4 Лекция 18. Производная по направлению. Градиент функции. Рассмотрим некоторое обобщение понятия частной производной функции многих переменных. Пусть 𝑀0 (𝑥0 , 𝑦0 , 𝑧0 ) ∈ ℝ3 - внутренняя точка области определения функции 𝑓(𝑥, 𝑦, 𝑧). Пусть задан вектор 𝑒 ∈ ℝ3 , ‖𝑒‖ = 1. Тогда 𝑒 = (cos 𝛼 , cos 𝛽 , cos 𝛾), где 𝛼, 𝛽, 𝛾 – углы между вектором 𝑒 и осями 𝑂𝑥, 𝑂𝑦 и 𝑂𝑧 соответственно. Рассмотрим функцию 𝑔(𝑡) = 𝑓(𝑥0 + 𝑡 cos 𝛼 , 𝑦0 + 𝑡 cos 𝛽 , 𝑧0 + 𝑡 cos 𝛾) , где t ℝ – вещественный параметр. Определение 1. Производной функции f (x) по направлению вектора 𝑒 = (cos 𝛼 , cos 𝛽 , cos 𝛾) в точке 𝑀0 (𝑥0 , 𝑦0 , 𝑧0 ) называется производная сложной функции g (t ) в точке t0 = 0 , то есть число f f ( M 0 + te) − f ( M 0 ) g (t ) − g (0) ( M 0 ) = lim = lim = g ' (0) . t → 0 t → 0 e t t Предположим, что функция 𝑓(𝑥) дифференцируема в точке 𝑀0 . Тогда функция g (t ) дифференцируема в нуле как сложная функция и справедлива формула: f ( M 0 ) = f x( M 0 ) cos + f y ( M 0 ) cos + f z( M 0 ) cos . e Для случая функции двух переменных формула принимает вид: f ( M 0 ) = f x( M 0 ) cos + f y( M 0 ) sin , e где 𝛼 - угол между вектором 𝑒 и осью 𝑂𝑥. Пусть теперь x0 = ( x10 ,..., xn0 ) - фиксированная точка, внутренняя для области определения функции f ( x) = f ( x1 ,..., xn ) , и пусть задан вектор e, e ℝ𝑛 e = 1. В этом случае координаты вектора e равны его направляющим косинусам: e = (cos1 ,...,cos n ) , где i - угол между осью Oxi и вектором e, i = 1,..., n. Рассмотрим функцию g (t ) = f ( x0 + te) = f ( x10 + t cos1 ,..., xn0 + t cos n ) , где t ℝ – вещественный параметр. Определение 2. Производной функции f (x) по направлению e = (cos1 ,...,cos n ) в точке x 0 называется производная сложной функции g (t ) в точке t0 = 0 , то есть число f 0 f ( x 0 + te) − f ( x 0 ) g (t ) − g (0) ( x ) = lim = lim = g ' (0) . (1) t →0 t →0 e t t Замечание. Из наличия у функции производной по любому направлению в некоторой точке не следует, вообще говоря, ее дифференцируемость в этой точке. Например, у 𝑥 4𝑦2 , 𝑥 2 + 𝑦 2 ≠ 0, функции 𝑓(𝑥) = {𝑥 8+𝑦 4 производная в точке (0, 0) по любому направлению 0, 𝑥2 + 𝑦2 = 0 равна нулю, но функция не является даже непрерывной в этой точке (проверьте!) Предположим, что функция f (x) дифференцируема в точке x 0 . Тогда функция g (t ) дифференцируема в точке t0 = 0 как сложная функция, и производная (1) легко вычисляется по правилу дифференцирования сложной функции. Получаем формулу: f 0 ( x ) = f x1 ( x 0 ) cos 1 + ... + f xn ( x 0 ) cos n . (2) e 1 Из формулы (2) видно, что производная по направлению есть скалярное произведение вектора и вектора частных производных функции Вектор e f (x) . 0 0 0 grad f ( x ) = ( f x1 ( x ),..., f xn ( x )) называется градиентом функции f (x) в точке x0 . Таким образом, получаем равенство: f 0 ( x ) = ( grad f ( x 0 ), e) . e Градиент часто представляют в виде: grad f = f (3) (читается: «набла f»), где - так называемый абстрактный вектор-оператор градиента. = ,..., xn x1 Отметим кстати, что формулу для дифференциала функции можно записать в следующем виде: df = ( gradf , x) = (f , x) . Что характеризует градиент функции? Какими свойствами обладает? Выясним это подробнее. Лемма 1. Градиент функции (в данной точке) – это вектор, направление которого есть направление наибольшей скорости роста функции, а норма градиента равна этой наибольшей скорости роста. Доказательство. Из формулы (3) получаем: f 0 ( x ) = ( grad f ( x 0 ), e) = grad f e cos( grad f , e) . e Поскольку cos(grad f , e) 1 , и достигает своего наибольшего значения 1, когда f 0 векторы сонаправлены, то легко видеть, что максимальное значение производной (x ) e grad f ( x 0 ) будет в том и только в том случае, когда e = , то есть когда вектор e совпадает grad f ( x 0 ) с ортом градиента f (в точке x 0 ). Какова же максимальная скорость роста функции f ? Из (3), при e = получаем: grad f ( x 0 ) , grad f ( x 0 ) f 0 grad f ( x 0 ) ( x ) = ( grad f ( x 0 ), ) = grad f ( x 0 ) . Лемма доказана. 0 e grad f ( x ) Замечание. Поскольку, в силу леммы 1, направление и норма градиента есть направление и величина максимальной скорости роста функции (в данной точке), то градиент grad f (x) не зависит от выбора системы координат. Рассмотрим теперь направление градиента функции по отношению к её поверхности уровня, то есть к геометрическому месту точек, определяемому уравнением: Pc : f ( x) = f ( x1 ,..., xn ) = c , где c - некоторая константа. Лемма 2. Градиент дифференцируемой в точке x 0 функции f (x) ортогонален её поверхности уровня Pc , проходящей через точку x 0 . Доказательство. Пусть в малой окрестности точки x 0 взята произвольная точка x, x Pc , x − x0 = x 0 . В силу дифференцируемости функции f (x) в точке x 0 , имеем: 0 = f = f ( x0 + x) − f ( x0 ) = ( grad f ( x0 ), x) + o ( x ) . Разделив это равенство на получим: x , 2 0= o ( x ) o ( x ) f x x x . = f x1 ( x 0 ) 1 + ... + f xn ( x 0 ) n + = ( grad f ( x 0 ), )+ x x x x x x При переходе к пределу при x → 0 в последнем соотношении вектор x x превращается в касательный вектор eкас. в точке x 0 к поверхности Pc , и получается равенство: ( grad f ( x0 ), eкас. ) = 0 . Таким образом, grad f ( x 0 ) ⊥ eкас. . В силу произвольности точки x Pc отсюда следует, что grad f ( x0 ) ⊥ Pc . Это завершает доказательство леммы. Частные производные высших порядков. f Если у функции f ( x) = f ( x1 ,..., xn ) частная производная определена в некоторой xk области 𝐷 ⊂ ℝ𝑛 , то она также является функцией n переменных. Может случиться, что эта функция имеет частную производную по переменной xi в некоторой внутренней точке f 2 f ( )( x 0 ) = ( x 0 ) называют xi xk xi xk второй частной производной функции f сначала по переменной xk , а затем по переменной x0 = ( x10 ,..., xn0 ) области 𝐷. Тогда эту производную xi , в точке x0 = ( x10 ,..., xn0 ) (то есть сначала производится дифференцирование по xk , а затем по xi ). Если xk xi , то частная производная второго порядка называется смешанной. Далее, применяя такое же рассуждение ко второй частной производной, можно определить понятие третьей частной производной, и так деле. Основываясь на этом описании понятия второй частной производной, мы можем ввести следующее общее индуктивное определение: Определение 3. Если у функции f ( x) = f ( x1 ,..., xn ) определена частная производная ( n − 1 )-го порядка n −1 f ( x) в некоторой области 𝐷 ⊂ ℝ𝑛 , и у неё существует частная xin−1 ...xi1 производная по переменной xin в точке x 0 = ( x10 ,..., xn0 ) D , то эта производная n −1 f ( )( x 0 ) называется частной производной n -го порядка функции f (x) по xin xin−1 ...xi1 переменным xi1 ,..., xin в точке x 0 и обозначается n f ( x0 ) . xin xin−1 ...xi1 Аналогично частным производным первого порядка, существуют другие обозначения n f 2 f ( x0 ) и для частных производных высших порядков. Производные ( x0 ) , xin xin−1 ...xi1 xi xk можно обозначать также f xk xi , f x(i1n...) xin соответственно. Если среди переменных xi1 ,..., xin не все совпадают, то такая частная производная n - го порядка называется смешанной. f y f x = ; = ; Пример 1. f ( x, y ) = arctg xy; 2 2 x 1 + x y y 1 + x 2 y 2 2 f x 1 − x2 y 2 2 f (Проверьте самостоятельно!) = ( ) = = xy x 1 + x 2 y 2 (1 + x2 y 2 )2 yx 3 x2 − y2 xy , x2 + y 2 0 Пример 2. Пусть g ( x, y ) = x 2 + y 2 . Тогда 0, x = y = 0 − 4x2 y2 + x4 − y4 4x2 y 2 + x4 − y 4 2 2 , x2 + y2 0 , x + y 0 x y 2 2 2 2 2 2 ; f y ( x; y ) = ; f x( x; y ) = x +y x +y 0, x = y = 0 0, x = y = 0 ( ) ( ) Следовательно, для смешанных частных производных второго порядка получаем: f ( x;0) − f y(0;0) f (0; y ) − f x(0;0) f yx (0;0) = lim y = 1. f xy (0;0) = lim x = −1; x →0 y →0 x y (Проверьте самостоятельно все вычисления!). Рассмотрим теперь понятие n раз дифференцируемой функции, которое также вводится индуктивно. Определение 4. Функция f ( x) = f ( x1 ,..., xn ) называется дважды дифференцируемой в точке x0 = ( x10 ,..., xn0 ) , если она дифференцируема в некоторой окрестности этой точки, и все её частные производные дифференцируемы в точке x 0 . Аналогично, если функция f (x) (n − 1) раз ( n 1 ) дифференцируема в некоторой окрестности точки x 0 , и все её частные производные (n − 1) -го порядка дифференцируемы в точке x 0 , то f (x) называется n раз дифференцируемой в точке x 0 . Из определения 4 вытекает следующее достаточное условие для того, чтобы функция была n раз дифференцируема в данной точке. Утверждение 1. Для того, чтобы функция f (x) была n раз дифференцируема в данной точке x0 = ( x10 ,..., xn0 ) , достаточно, чтобы она (n − 1) раз была дифференцируема в некоторой окрестности точки x 0 , и все ее частные производные n -го порядка были непрерывны в самой точке x 0 . Доказательство. При n = 1 получаем достаточное условие дифференцируемости функции в точке. Пусть n 1 . Рассмотрим любую из производных (n − 1) - го порядка функции f (x) . По условию все ее частные производные первого порядка непрерывны в точке x 0 (поскольку они являются производными n -го порядка самой функции f (x) ). Согласно достаточному условию дифференцируемости, получаем, что любая производная порядка (n − 1) функции f (x) дифференцируема в точке x 0 . Кроме того, сама функция по условию (n − 1) раз дифференцируема в окрестности точки x 0 . Следовательно, она n раз дифференцируема в точке x 0 , что и требовалось доказать. 4 Лекция 19. Теоремы о равенстве смешанных производных Сформулируем и докажем две теоремы о достаточных условиях равенства смешанных частных производных второго порядка. Теорема 1 (Юнг). Если функция f ( x, y) дважды дифференцируема в точке ( x0 , y0 ) , 2 f 2 f то ( x0 , y0 ) = ( x0 , y0 ) . xy yx Доказательство. Условие теоремы означает, что частные производные функции f ( x, y) определены в некоторой окрестности, и дифференцируемы в самой этой точке. Пусть приращение h достаточно мало, так что точка ( x0 + h, y0 + h) принадлежит указанной окрестности. Рассмотрим выражение = ( x0 , y0 ; h) = f ( x0 + h; y0 + h) − f ( x0 + h, y0 ) − f ( x0 , y0 + h) + f ( x0 , y0 ) , которое можно представить следующими двумя способами. Во-первых, так: = [ f ( x0 + h; y0 + h) − f ( x0 + h, y0 )] − [ f ( x0 , y0 + h) − f ( x0 , y0 )] = ( x0 + h) − ( x0 ) , (4) где ( x) = f ( x, y0 + h) − f ( x, y0 ) . И во-вторых, так: = [ f ( x0 + h; y0 + h) − f ( x0 , y0 + h)] − [ f ( x0 + h, y0 ) − f ( x0 , y0 )] = ( y0 + h) − ( y0 ) , (5) где ( y) = f ( x0 + h, y) − f ( x0 , y) . Применяя теорему Лагранжа к дифференцируемой функции (x) на интервале ( x0 ; x0 + h) , из (4) получаем: = x ( x0 + h) h = [ f x( x0 + h, y0 + h) − f x( x0 + h, y0 )] h = = [ f x( x0 + h, y0 + h) − f x( x0 , y0 )] h − [ f x( x0 + h, y0 ) − f x( x0 , y0 )] h , где (0;1) . Далее, в последнем выражении в квадратных скобках стоят приращения дифференцируемой в точке ( x0 , y0 ) функции f x , которые можно представить следующим образом: [ f x( x0 + h, y0 + h) − f x( x0 , y0 )] = f xx ( x0 , y0 )h + f xy ( x0 , y0 )h + 1h + 2h; [ f x( x0 + h, y0 ) − f x( x0 , y0 )] = f xx ( x0 , y0 )h + 3h , где 1 , 2 , 3 - бесконечно малые при h → 0 . Подставляя полученные выражения в формулу для Ф, получаем: = f xx ( x0 , y0 )h2 + f xy ( x0 , y0 )h2 + (1h + 2h)h − f xx ( x0 , y0 )h2 − 3h2 . Таким образом, = f xy ( x0 , y0 )h 2 + o(h 2 ), h → 0 . Совершенно аналогично, используя представление (5) , получаем: ~ ~ ~ = y ( y0 + h) h = [ f y ( x0 + h, y0 + h) − f y ( x0 , y0 + h)] h = ~ ~ = [ f y ( x0 + h, y0 + h) − f y ( x0 , y0 )] h − [ f y ( x0 , y0 + h) − f y ( x0 , y0 )] h = ~ ~ ~ f yx ( x0 , y0 )h 2 + f yy ( x0 , y0 ) h 2 + ( 1h + 2 h)h − f yy ( x0 , y0 ) h 2 − 3h 2 . Поэтому, уничтожая слагаемые с противоположными знаками, имеем: = f yx ( x0 , y0 )h 2 + o(h 2 ), h → 0 . Поделив на h 2 и приравнивая правые части данных соотношений, получим: f xy ( x0 , y0 ) + o(1) = f yx ( x0 , y0 ) + o(1) , 1 откуда и следует искомое равенство: f yx ( x0 , y0 ) = f xy ( x0 , y0 ) , так как разность f yx ( x0 , y0 ) − f xy ( x0 , y0 ) есть бесконечно малая величина. Теорема доказана. Теорема 2 (Шварц). Если у функции f ( x, y) в некоторой окрестности точки ( x0 , y0 ) существуют частные производные f x, f y, f yx , f xy , причём производные f yx , f xy непрерывны в точке ( x0 , y0 ) , то имеет место равенство: f yx ( x0 , y0 ) = f xy ( x0 , y0 ) . Доказательство. Используем выражение и некоторые выкладки из доказательства теоремы 1. Из условия теоремы о существовании частной производной f xy , применяя теорему Лагранжа, получаем: = [ f x( x0 + h, y0 + h) − f x( x0 + h, y0 )] h = f xy ( x0 + h, y0 + 1h) h2 , где 1 (0;1) . С другой стороны, поменяв ролями 𝑥 и 𝑦 и снова применяя теорему Лагранжа, имеем: ~ ~ ~ = [ f y ( x0 + h, y0 + h) − f y ( x0 , y0 + h)] h = f yx ( x0 + 2 h, y0 + h) h 2 , где 2 (0;1) . Поделив на h 2 и приравнивая правые части полученных выражений, приходим к равенству: ~ f yx ( x0 + 2 h, y0 + h) = f xy ( x0 + h, y0 + 1h) . При переходе к пределу при h → 0 , в силу условия непрерывности этих производных в точке ( x0 , y0 ) , получаем искомое равенство: f yx ( x0 , y0 ) = f xy ( x0 , y0 ) . Теорема полностью доказана. Из теоремы 1 выведем достаточное условие равенства смешанных производных высших порядков. Теорема 3. Пусть функция f (x) m раз ( m 2 ) дифференцируема в точке x 0 . Тогда её частные производные m - го порядка не зависят от порядка последовательного выполнения операций дифференцирования. m f ( x 0 ) не Доказательство. Достаточно показать, что производная xim ...xik +1 xik ...xi1 зависит от перестановки двух соседних операций дифференцирования, то есть доказать равенство: m f m f 0 (x ) = ( x0 ) . xim ...xik +1 xik ...xi1 xim ...xik xik +1 ...xi1 С этой целью рассмотрим функцию F ( x) = k −1 f ( x), 1 k m . xik −1 ...xi1 Из условия теоремы следует, что 1) при 1 k m − 1 функция F (x) дважды дифференцируема в некоторой окрестности точки x 0 ; 2) при k = m − 1 функция F (x) дважды дифференцируема в точке x 0 . Но тогда, по теореме 1, её смешанные частные производные 2F 2F , xik xik +1 xik +1 xik при 1 k m − 1 тождественно совпадают в некоторой окрестности точки x 0 , а при k = m − 1 они совпадают в точке x 0 . Это означает, что: 2 1) k +1 f k +1 f = при 1 k m − 1 в некоторой окрестности точки x 0 , xik +1 xik ...xi1 xik xik +1 ...xi1 откуда при дальнейшем дифференцировании по остальным переменным xik +2 ,..., xim получается нужное равенство; 2) при k +1 f k +1 f k = m − 1 равенство = в точке x 0 совпадает с xik +1 xik ...xi1 xik xik +1 ...xi1 искомым равенством. Теорема доказана. Из теоремы 3 вытекает следующее простое утверждение. Следствие. Если функция f (x) m раз ( m 2 ) дифференцируема в точке x 0 , то её частные производные m -го порядка можно записывать в следующей форме: m f , где 0 j m, 1 + ... + n = m. (xn ) n ...(x1 )1 Дифференциалы высших порядков. Ранее мы рассматривали инвариантную форму записи (первого) дифференциала функции f ( x) = f ( x1 ,..., xn ) . При этом сам оператор дифференцирования имеет, очевидно, вид: d = (, dx) = dx1 + ... + dxn . x1 xn Предположим, что после применения к функции f (x) оператора дифференцирования d получается снова дифференцируемая функция df (x) (в данной точке или на данном множестве). Для этого достаточно предположить, что функция f (x) дважды дифференцируема (в точке или на множестве), а переменные x1 ,..., xn либо независимы, либо тоже представляют собой дважды дифференцируемые функции (в соответствующей точке или на соответствующем множестве). Тогда к функции df (x) можно снова применить оператор дифференцирования, который (в аналогичной инвариантной форме записи) можно обозначить для удобства другой буквой, например, так: = (, x) = x1 + ... + xn . Композиция этих двух операторов имеет вид: x1 xn f f ( dx1 + ... + dxn ) xk . xn k =1 xk x1 n (df ) = (1) Определение 1. Вторым дифференциалом функции f (x) в точке x 0 называется величина d 2 f ( x 0 ) = (df )( x0 ) - значение композиции (1), взятое при равенстве: x = {x1,...xn } = {dx1,..., dxn } = dx , где все частные производные вычислены в точке x 0 , то есть выражение: n f f d2 f = ( dx1 + ... + dxn ) dxk . (2) xn k =1 xk x1 По индукции, если определён (и дифференцируем) дифференциал d n−1 f ( x) , то n -ым дифференциалом (дифференциалом n -го порядка) функции f (x) в точке x 0 называется величина d n f ( x0 ) = (d n −1 f )(x0 ) - значение композиции (d n−1 f ) , взятое при равенстве: x = {x1,...xn } = {dx1,..., dxn } = dx , где все частные производные вычислены в точке x 0 . 3 Замечание. Пусть переменные x1 ,..., xn независимы или являются линейными функциями. (Под линейной функцией n независимых переменных понимают функцию вида k xi (t1 ,...,tk ) = aijt j , где коэффициенты aij ℝ). Тогда все их дифференциалы, кроме j =1 первого, равны нулю, поскольку равны нулю все частные производные второго и более высоких порядков. В этих случаях форма записи для дифференциалов высших порядков существенно упрощается. Более конкретно, отметим по этому поводу следующее: n n 1) d 2 f ( x 0 ) = f xix j ( x 0 )dxi dx j - квадратичная форма от переменных dx1 ,..., dxn . Эта i =1 j =1 квадратичная форма симметрична, если участвующие в ней частные производные не зависят от порядка последовательного дифференцирования. Например, если 𝑓(𝑥, 𝑦) - функция двух переменных, дважды дифференцируемая в точке (𝑥0 , 𝑦0 ), то выражение для ее второго дифференциала имеет вид ′′ (𝑥 2 ′′ ′′ 2 𝑑2 𝑓(𝑥0 , 𝑦0 ) = 𝑓𝑥𝑥 0 , 𝑦0 )𝑑𝑥 + 2𝑓𝑥𝑦 (𝑥0 , 𝑦0 )𝑑𝑥𝑑𝑦 + 𝑓𝑦𝑦 (𝑥0 , 𝑦0 )𝑑𝑦 . Для функции трех переменных справедлива аналогичная формула: ′′ (𝑀 )𝑑𝑥 2 ′′ (𝑀 )𝑑𝑦 2 ′′ (𝑀 )𝑑𝑥𝑑𝑦 ′′ (𝑀 )𝑑𝑥𝑑𝑧 𝑑 2 𝑓|𝑀0 = 𝑓𝑥𝑥 + 𝑓𝑦𝑦 + 𝑓𝑧𝑧′′ (𝑀0 )𝑑𝑧 2 + 2(𝑓𝑥𝑦 + 𝑓𝑥𝑧 + 0 0 0 0 ′′ (𝑀 )𝑑𝑦𝑑𝑧), 𝑓𝑦𝑧 0 где 𝑀0 (𝑥0 , 𝑦0 , 𝑧0 ), функция 𝑓(𝑥, 𝑦, 𝑧) дважды дифференцируема в точке 𝑀0 . 2) Если переменные x1 ,..., xn независимы или являются линейными функциями, а функция f (x) 𝑚 раз дифференцируема в точке x 0 , то для дифференциалов высших порядков верно равенство: (3) d m f = ( dx1 + ... + dxn ) m f = (, dx) m f , m 1 . x1 xn 4 Лекция 20. Формула Тейлора для функции многих переменных. Для функций многих переменных, аналогично случаю одной переменной, имеет место формула Тейлора. В этом разделе мы будем рассматривать функции n независимых переменных. Теорема 1. (Формула Тейлора с остаточным членом в форме Лагранжа). Пусть функция ( m + 1 ) раз дифференцируема в некоторой окрестности B ( x 0 ) точки f ( x) = f ( x1 ,..., xn ) x 0 = ( x10 ,..., xn0 ) . Тогда для всякого x B ( x 0 ) , приращение функции f = f ( x) − f ( x0 ) представимо в виде: d 2 f ( x0 ) d m f ( x0 ) (1) f = f ( x) − f ( x 0 ) = df ( x 0 ) + + ... + + Rm , 2! m! где остаточный член имеет вид (называемый остаточным членом в форме Лагранжа): d m +1 f ( x 0 + x) (2) Rm = , (0;1), x = x − x 0 . (m + 1)! Доказательство. Рассмотрим сложную функцию F (t ) = f ( x0 + tx) = f ( x10 + tx1 , ..., xn0 + txn ) . Эта функция, в силу условий теоремы, удовлетворяет всем требованиям для представления её по формуле Маклорена при t0 = 0, t = 1, t = 1 . Таким образом, можно записать: F (0) F ( m ) (0) F ( m +1) ( ) . + ... + + 2! m! (m + 1)! Заметим, что поскольку внутренние функции xk (t ) = xk0 + txk являются линейными, то производные сложной функции F (t ) в точке t0 = 0 легко вычисляются и имеют вид: F (1) − F (0) = F (0) + f 0 ( x ) xi = df ( x 0 ), i =1 xi n F (0) = 2 f ( x 0 )xi x j = d 2 f ( x 0 ), j −1 i =1 xi x j … ( m) F (0) = d m f ( x 0 ), n n F (0) = F ( m +1) ( ) = d m +1 f ( x0 + x). Подставляя эти равенства в представление для функции 𝐹, получаем и искомую формулу (1), и формулу для остаточного члена (2), что и требовалось. Теорема доказана. Следствие. (Формула Тейлора с остаточным членом в интегральной форме). Пусть выполнены все условия теоремы 1, и пусть, сверх того, все частные производные (m + 1) -го порядка функции f ( x) = f ( x1 ,..., xn ) непрерывны в некоторой шаровой окрестности точки x 0 = ( x10 ,..., xn0 ) . Тогда остаточный член Rm в формуле (1) может быть представлен в виде: 1 1 Rm = (1 − t ) m d m +1 f ( x 0 + tx)dt . m! 0 Доказательство. Покажем сначала справедливость соотношения: 1 F ( m +1) ( ) 1 Rm = = F ( m +1) (t )(1 − t ) m dt . (m + 1)! m! 0 1 С этой целью применим к очевидному равенству: F (1) = F (0) + F (t )dt формулу интегрирования по 0 частям, учитывая, что dt = d (−(1 − t )) . Получим: 1 1 1 1 1 0 0 F = F (1) − F (0) = F (t )dt = F (t )[ −(1 − t )] | + F (t )(1 − t )dt = F (0) + F (t )(1 − t )dt . 0 0 1 К последнему интегралу F (t )(1 − t )dt снова применим формулу интегрирования по частям, имея в 0 1 виду равенство: (1 − t )dt = d (− (1 − t ) 2 ) . Тогда получим: 2 1 1 1 1 1 1 1 2 2 F = F (0) + F (t )[ − (1 − t ) ] | + F (t )(1 − t ) dt = F (0) + F (0) + F (t )(1 − t ) 2 dt . 2 20 2 20 0 И так далее, применяя снова и снова формулу интегрирования по частям к получающемуся интегралу, в итоге придём к формуле: 1 1 F ( m ) (0) 1 F = F (0) + F (0) + ... + + F ( m +1) (t )(1 − t ) m dt , 2 m! m! 0 Теперь, подставляя вместо производных функции 𝐹 соответствующие дифференциалы функции 𝑓, получаем искомую формулу с остаточным членом в интегральной форме. Следствие доказано. Теперь рассмотрим разложение функции по формуле Тейлора при более слабых условиях, и ещё одну форму остаточного члена - форму Пеано. Теорема 2. (Формула Тейлора с остаточным членом в форме Пеано). Пусть m - целое число, m 1 . Пусть функция f ( x) = f ( x1 ,..., xn ) m − 1 раз дифференцируема в некоторой окрестности B ( x 0 ) точки x 0 = ( x10 ,..., xn0 ) , и m раз дифференцируема в самой точке x 0 = ( x10 ,..., xn0 ) . Тогда для любой точки x, x B ( x 0 ) , верна формула: d 2 f ( x0 ) d m f ( x0 ) f = f ( x) − f ( x ) = df ( x ) + + ... + + Rm , 2! m! где остаточный член имеет вид (называемый остаточным членом в форме Пеано): Rm = o( m ), → 0, = x . 0 0 Замечание. Обозначим через g m (x) функцию: d 2 f ( x0 ) d m f ( x0 ) 0 . + ... + g m ( x) = f ( x) − f ( x ) − df ( x ) + 2 ! m ! Для доказательства теоремы 2 теперь достаточно установить, что при выполнении условий этой теоремы имеет место равенство: gm ( x) = o ( m ) . Сначала сформулируем и докажем две вспомогательные леммы. Лемма 1. Если функция f ( x) = f ( x1 ,..., xn ) m раз дифференцируема в точке 0 x 0 = ( x10 ,..., xn0 ) , то как сама функция g m (x) , так и все ее частные производные по любым переменным x1 ,..., xn до порядка m включительно обращаются в нуль в точке x 0 . Доказательство леммы 1. При m = 1 функция g m (x) принимает вид: g1 ( x) = f ( x) − f ( x 0 ) − ( x1 − x10 ) f 0 f 0 ( x ) − ... − ( xn − xn0 ) (x ) , x1 xn g1 0 ( x ) = 0 при всех i = 1, 2, ..., n проверяются элементарно. xi Для проведения индукции предположим, что лемма справедлива для некоторого номера m 1 , и докажем, что в таком случает она справедлива и для номера m + 1 . Пусть функция f ( x) = f ( x1 ,..., xn ) m + 1 раз дифференцируема в точке x 0 = ( x10 ,..., xn0 ) , и и равенства: g1 ( x 0 ) = 0, 2 d 2 f ( x0 ) d m +1 f ( x 0 ) . + ... + g m +1 ( x) = f ( x) − f ( x0 ) − df ( x 0 ) + 2! (m + 1)! Легко видеть, что g m +1 ( x) = 0 (достаточно учесть, что каждая круглая скобка ( xi − xi0 ) обращается в нуль в точке x 0 ). Выберем произвольное l = 1, 2, ..., n . Нам нужно показать, что функция g m+1 0 ( x ) и все её частные xl производные до порядка m включительно обращаются в нуль в точке x 0 . Проведем ряд преобразований: n g m +1 f m +1 1 n j 0 0 ( x) = ( x) − ... f ( x ) x − x ... x − x = 0 k1 k1 kj kj x= x xl xl xl j =1 j! k1 =1 k j =1 xk j ...xk1 )( ( = ) n f m +1 1 n j −1 f 0 0 0 ( x) − j ... ( x ) x − x ... x − x x − x = k1 k j −1 k j −1 l l x = x 0 k1 xl xl j =1 j! k1 =1 k j −1 =1 xk j −1 ...xk1 xl ( = )( )( ) n n m +1 1 f f j −1 f 0 0 = ( x) − ( x0 ) − ... ( x ) x − x ... x − x k1 k1 k j −1 k j −1 x= x0 xl xl j = 2 ( j − 1)! k1 =1 k j −1 =1 xk j −1 ...xk1 xl ( = Значит, функция )( ) m 1 f ( x 0 ) f f . ( x) − ( x0 ) − d j xl xl j ! x l j =1 g m+1 ( x) имеет вид: xl ~ ~ g m+1 ~ ~ 0 ~ 0 d 2 f ( x0 ) d m f ( x0 ) , + ... + ( x) = f ( x) − f ( x ) − df ( x ) + 2! m! xl ~ f ( x) где функция f ( x) = 𝑚 раз дифференцируема в точке x 0 . Значит, согласно предположению xl индукции, она сама и все ее частные производные до порядка 𝑚 включительно обращаются в ноль в данной точке. Поскольку число 𝑙 было выбрано произвольным от 1 до 𝑛, то тем самым мы доказали, что у функции gm+1 ( x) все частные производные до порядка 𝑚 + 1 включительно обращаются в ноль в точке x 0 . Индукция закончена. Лемма 1 доказана. Лемма 2. Пусть g ( x) = g ( x1,..., xn ) – произвольная функция, удовлетворяющая двум требованиям: 1) g (x) m раз дифференцируема в точке x 0 = ( x10 ,..., xn0 ) ; 2) сама функция g (x) и все ее частные производные по любым переменным x1 ,..., xn ; до порядка m включительно обращаются в нуль в указанной точке x 0 . Тогда для функции g (x) в достаточно малой окрестности точки x 0 справедлива оценка: g ( x) = o ( m ) , где = x − x0 . Доказательство леммы 2. При 𝑚 = 1 утверждение леммы вытекает из условия дифференцируемости функции g (x) в точке x 0 , которое имеет вид: n g 0 g ( x) − g ( x 0 ) = ( x )( xi − xi0 ) + o ( ). i =1 xi g 0 В самом деле, так как g ( x 0 ) = 0 , и ( x ) =0 для всех i = 1,..., n , то получается, что g ( x) = o ( ). xi Для проведения индукции предположим, что лемма 2 справедлива для некоторого номера m 1 , и докажем, что в таком случает она справедлива и для номера m + 1 . 3 g (x) удовлетворяет двум требованиям леммы 2 для номера m + 1 . Тогда, g очевидно, любая частная производная этой функции первого порядка (x) , i = 1,..., n , будет xi удовлетворять двум требованиям леммы 2 для номера m , а поэтому, по предположению индукции, будет справедлива оценка: g ( x) = o ( m ). xi Заметим теперь, что поскольку m 1 , то m + 1 2 , и функция g (x) , удовлетворяющая двум требованиям леммы для номера m + 1 , во всяком случае, хотя бы один раз дифференцируема в окрестности точки x 0 . Поэтому для g (x) выполнены условия теоремы 1 для номера m = 0 . По Пусть функция указанной теореме, для любой точки x из достаточно малой ε-окрестности точки x 0 найдется число (0, 1) такое, что справедлива формула: 1 n g 0 0 0 0 0 g ( x) = g ( x ) + dg ( x + ( x − x )) = g ( x ) + ( xi − xi0 ) ( x + ( x − x 0 )) 1! i =1 xi (формула Тейлора с остаточным членом в форме Лагранжа). Заметим, что поскольку точка = x0 + ( x − x0 ) лежит между точками x 0 и x , то m g − x 0 = x − x 0 , и поэтому ( ) = o ( − x 0 ) o ( m ). xi Подставляя последнюю оценку в правую часть тейлоровского разложения и учитывая, что n g ( x0 ) = 0 , мы получим g ( x) = o ( m ) xi − xi0 . А так как xi − xi0 i =1 n ( x − x ) = , то окончательно i =1 i 0 2 i получаем, что g ( x) = o ( ). Индукция завершена. Лемма 2 доказана. Доказательство теоремы 2. Утверждение теоремы легко следует из доказанных лемм 1 и 2. Как уже отмечалось выше, для доказательства теоремы 2 достаточно показать, что при выполнении условий теоремы справедлива оценка g m ( x) = o ( m ). В силу леммы 1 сама функция g m (x) и все ее частные производные по любым переменным m +1 x1 ,..., xn до порядка m включительно обращаются в нуль в точке x 0 . Но тогда в силу леммы 2, справедлива искомая оценка: g m ( x) = o ( m ). Теорема доказана. 4 Лекция 21. Локальный экстремум функции многих переменных. Определение 1. Точка x0 = ( x10 ,..., xn0 ) , внутренняя для области определения функции f ( x) = f ( x1 ,..., xn ) называется её точкой локального экстремума, если для любой точки некоторой её окрестности B ( x 0 ) (за исключением самой точки x 0 ) разность f = f ( x) − f ( x0 ) отлична от нуля и сохраняет знак. В частности, если f 0 , то это точка локального минимума, а если f 0 , то точка локального максимума. Теорема 1. (Необходимое условие существования локального экстремума). Если у функции f (x) в точке x 0 существуют все частные производные f xk , и эта точка является точкой локального экстремума, то все частные производные в ней равны нулю, то есть f xk ( x0 ) = 0, k = 1,..., n. Доказательство. Зафиксируем у функции f (x) все переменные, кроме xk ( 1 k n) , и рассмотрим функцию одной переменной (xk ) = f ( x10 ,.., xk0−1 , xk , xk0+1 ,..., xn0 ) . Очевидно, что для функции ( xk ) точка xk0 является также точкой локального экстремума. Как известно из материала первого семестра, производная функции одной переменной в точке локального экстремума равна нулю. Поэтому ( xk0 ) = f xk ( x0 ) = 0 , что и требовалось доказать. Определение 2. Точка x0 = ( x10 ,..., xn0 ) называется стационарной для функции f ( x) = f ( x1 ,..., xn ) , если она внутренняя для её области определения, и все частные производные в ней определены, и f xk ( x0 ) = 0 (k = 1,...,n) . Однако одно только условие равенства нулю всех частных производных не является достаточным условием для существования в данной точке локального экстремума. Пример. Рассмотрим функцию f ( x, y) = xy. Её частные производные в точке (0,0) , очевидно, равны нулю. Но разность f = f ( x, y ) − f (0,0) = xy − 0 больше нуля при одинаковых знаках x и y , и меньше нуля, если у них разные знаки. Таким образом, локального экстремума в точке (0,0) у этой функции нет. Определение 3. Квадратичной формой переменных (ℎ1 , ℎ2 , … , ℎ𝑛 ) называется функция 𝑛 𝐴(ℎ1 , ℎ2 , … , ℎ𝑛 ) = ∑ 𝑎𝑖𝑗 ℎ𝑖 ℎ𝑗 . 𝑖,𝑗=1 Здесь 𝑎𝑖𝑗 ∈ ℝ - коэффициенты квадратичной формы. Квадратичная форма называется симметричной, если 𝑎𝑖𝑗 = 𝑎𝑗𝑖 для всех индексов 1 ≤ 𝑖, 𝑗 ≤ 𝑛. Квадратичная форма 𝐴(ℎ1 , ℎ2 , … , ℎ𝑛 ) называется положительно определенной, если для любого набора переменных, кроме тождественно нулевого, выполнено неравенство: 𝐴(ℎ1 , ℎ2 , … , ℎ𝑛 ) > 0. Квадратичная форма 𝐴(ℎ1 , ℎ2 , … , ℎ𝑛 ) называется отрицательно определенной, если для любого набора переменных, кроме тождественно нулевого, выполнено неравенство: 𝐴(ℎ1 , ℎ2 , … , ℎ𝑛 ) < 0. Такие формы называются знакоопределенными. Квадратичная форма 𝐴(ℎ1 , ℎ2 , … , ℎ𝑛 ) называется знакопеременной, если существуют два набора переменных (ℎ1′ , ℎ2′ , … , ℎ𝑛′ ) и (ℎ1′′ , ℎ2′′ , … , ℎ𝑛′′ ), для которых выполнены неравенства: 𝐴(ℎ1′ , ℎ2′ , … , ℎ𝑛′ ) > 0, 𝐴(ℎ1′′ , ℎ2′′ , … , ℎ𝑛′′ ) < 0. Замечание. Квадратичная форма может не являться ни знакоопределенной, ни знакопеременной. Например, 𝐴(ℎ1 , ℎ2 ) = (ℎ1 − ℎ2 )2 ≥ 0 при всех значениях переменных ℎ1 , ℎ2 , однако она обращается в ноль на ненулевых наборах переменных: 𝐴(ℎ, ℎ) = 0. 1 Теорема 2. (Достаточные условия локального экстремума). Пусть функция f ( x) = f ( x1 ,..., xn ) n независимых переменных 1 раз дифференцируема в некоторой окрестности точки x0 = ( x10 ,..., xn0 ) , и дважды дифференцируема в самой точке x 0 . Пусть x 0 - стационарная точка, то есть df ( x 0 ) = 0 . Тогда, если второй дифференциал d 2 f ( x 0 ) представляет собой знакоопределённую квадратичную форму, то x 0 - точка локального экстремума. При этом, если форма d 2 f ( x 0 ) положительно определена, то x 0 - точка локального минимума, если d 2 f ( x 0 ) отрицательно определена, то x 0 - точка локального максимума. Если же квадратичная форма d 2 f ( x 0 ) знакопеременна, то локального экстремума в точке x 0 нет. Доказательство. Разложим разность f по формуле Тейлора при n = 2 с остаточным членом в форме Пеано: d 2 f ( x0 ) 1 n n 2 2 f = f ( x) − f ( x 0 ) = df ( x 0 ) + + o ( x ) = f xi x j ( x 0 )xi x j + o ( x ) . 2! 2! i =1 j =1 x Обозначим hi = i , x x → 0 . Тогда f = норму h = o ( x ) 2 f xi x j ( x ) = aij , = ( x ) = 0 x 2 - бесконечно малая при 1 2 x aij hi h j + . Заметим, что вектор h = {h1 ,..., hn } имеет 2 1 i , j n n h = 1 , то есть это элемент единичной сферы. i =1 2 i Рассмотрим случай, когда d 2 f ( x 0 ) - положительно определённая квадратичная форма. Тогда функция (h) = aij hi h j - также положительно определённая непрерывная 1 i , j n функция на единичной сфере S , которая является замкнутым ограниченным множеством. Следовательно, по второй теореме Вейерштрасса, функция (h) достигает на S своей точной нижней грани, то есть существует точка = (1 ,..., n ) S , где ( ) = inf { (h)} = hS Поскольку всюду на сфере (h) 0 , то и ( ) = 0 . Воспользовавшись этим, 1 1 2 2 получаем: f = x ((h) + ) x ( + ) . Так как → 0 при x → 0 , то найдётся 2 2 такое = ( ) 0 , что при x будет . При этих условиях 2 1 1 1 2 2 2 f x ( + ) x ( − ) = x 0. 2 2 2 2 2 Итак, для любого x такого, что x , всегда будет f 0 . Следовательно, точка x 0 . точка локального минимума. В случае отрицательно определённой квадратичной формы d 2 f ( x 0 ) совершенно аналогично доказывается, что точка x 0 - точка локального максимума. Пусть теперь d 2 f ( x 0 ) - знакопеременная квадратичная форма. Тогда, пользуясь 1 предыдущими обозначениями, f = 2 ( (h) + ) , где = x , а (h) - знакопеременная 2 квадратичная форма на единичной сфере S . 2 Следовательно, существуют такие точки h, h S , что (h) 0, (h) 0 . При этом (h) не зависит от . Поэтому, взяв 1 достаточно малым, можно добиться, чтобы (h) (h) 1 = ( 1 ) min{ , } (поскольку = ( ) → 0 при → 0 ). 2 2 При этих условиях будет одновременно: (h) + 1 0, (h) + 1 0 . Тогда для x1 = x0 + h, x2 = x0 + h будет выполнено 1 (f ) = f ( x1 ) − f ( x 0 ) = 2 ((h) + 1 ) 0, и 2 1 (f ) = f ( x2 ) − f ( x 0 ) = 2 ( (h) + 1 ) 0 . 2 Итак, приращение функции меняет знак, следовательно, точка x 0 не является в этом случае точкой экстремума функции f (x) . Теорема полностью доказана. Замечание. В случаях квази-знакоопределённости (или, другими словами, полуопределённости) квадратичной формы второго дифференциала d 2 f ( x 0 ) ответ о существовании локального экстремума в точке x 0 неясен. (Напомним, что квадратичная n n форма A(h) = aij hi h j называется квази-знакоопределённой (или полуопределённой), i =1 j =1 если A(h) 0 при любом h = (h1 ,..., hn ) (или A(h) 0 при любом h ), и кроме того, существует h0 0 такой, что A(h0 ) = 0 .) f ( x, y) = x3 + y 3 , g ( x, y) = x 4 + y 4 . В точке (0;0) Пример. Рассмотрим функции вторые дифференциалы обеих функций равны нулю. Однако несложно проверить, что у функции g ( x, y ) имеется экстремум в точке (0;0), а у функции f ( x, y) в этой точке экстремума нет. Случай функции двух переменных. Рассмотрим более подробно частный случай теоремы 2 для функции двух переменных. Теорема 3. Пусть функция f ( x1 , x2 ) дифференцируема в некоторой окрестности точки x 0 = ( x10 , x20 ) и дважды дифференцируема в самой точке x 0 . Пусть точка x 0 является стационарной, то есть df ( x 0 ) = 0 , а второй дифференциал в этой точке имеет вид: d 2 f ( x0 ) = a11 (dx1 )2 + 2a12 dx1dx2 + a22 (dx2 )2 , где aij = f xi x j ( x 0 ),1 i, j 2. Тогда, если определитель A2 = a11 a12 a12 a22 0 , то точка x 0 является точкой локального экстремума (локального минимума, если a11 0 , и локального максимума, если a11 0 ). Если же A2 = a11 a12 a12 a22 0 , то экстремума в точке x 0 нет. Доказательство. Из курса линейной алгебры известен критерий Сильвестра знакоопределённости квадратичной формы, заключающийся в следующем: если все главные миноры матрицы симметричной квадратичной формы положительны, то квадратичная форма положительно определена. Если же знаки главных миноров чередуются, начиная с минуса, то квадратичная форма отрицательно определена. В силу этого критерия, при условии A2 0 и a11 0 второй дифференциал d 2 f ( x 0 ; dx) является знакоопределённой (положительной или отрицательной, в зависимости от знака a11 ) квадратичной формой. Следовательно, по теореме 2, в этом случае в точке x 0 имеется локальный экстремум. 3 Можно заметить также, что A2 = − D / 4 , где 𝐷 - дискриминант квадратного уравнения y(h) = a11h 2 + 2a12 h + a22 = 0 . Если A2 0 , то 𝐷 < 0, и парабола 𝑦(ℎ) расположена либо полностью выше оси абсцисс (если a11 0 ), либо полностью ниже (если a11 0 ). Значит, в первом случае d 2 f ( x 0 ; dx) 0 , следовательно, x 0 - точка локального минимума. Во втором случае x 0 - точка локального максимума. Пусть теперь A2 0 . Покажем, что тогда экстремума нет. dx Предположим сначала, что a11 0 . Обозначим, как и в теореме 2, hi = i , i = 1,2 , где = dx = (dx1 ) 2 + (dx2 ) 2 . Тогда d 2 f ( x 0 ; dx) = a11 (dx1 ) 2 + 2a12 dx1dx2 + a22 (dx2 ) 2 = 2 (a11 (h1 ) 2 + 2a12 h1h2 + a22 (h2 ) 2 ) = = 2 a11 (a112 (h1 ) 2 + 2a12 a11h1h2 + a122 (h2 ) 2 + (a22 a11 − a122 )(h2 ) 2 ) = Следовательно, при h1 = 1, h2 = 0 имеем: d 2 f ( x 0 ; dx) = знак, как a11 . Однако при h1 = − a12 (a11 ) + (a12 ) 2 2 , h2 = 2 2 a11 [(a11h1 + a12 h2 ) 2 + A2 (h2 ) 2 ] . (a11 ) 2 = 2 a11 - имеет такой же a11 a11 (a11 ) + (a12 ) 2 2 второй дифференциал: 2 (a11 ) 2 2 a11 A2 d f ( x0 ; dx) = A2 = a11 (a11 ) 2 + (a12 ) 2 (a11 ) 2 + (a12 ) 2 имеет знак, противоположный знаку a11 . Таким образом, второй дифференциал является в этом случае знакопеременной квадратичной формой, поэтому, в силу теоремы 2, экстремума нет. Пусть теперь A2 0, a11 = 0 . Заметим, что в этом случае обязательно a12 0 . Тогда 2 d 2 f ( x 0 ; dx) = 2 h2 (2a12 h1 + a22 h2 ) . Зафиксируем h10 0 и возьмём | h20 | настолько малым, чтобы выражение в круглых скобках имело такой же знак, как произведение a12 h10 . Тогда d 2 f ( x 0 ;{h10 , h20 }) и d 2 f ( x 0 ;{h10 , (−h20 )}) имеют разные знаки, то есть при изменении знака малого h20 , знак d 2 f также меняется. Итак, второй дифференциал в данном случае есть знакопеременная квадратичная форма, и по теореме 2, экстремума нет. Теорема 3 полностью доказана. Пример. Исследуем на экстремум функцию: f ( x, y ) = x 2 + xy + y 2 + 1 1 + . x y Вычислим частные производные первого порядка функции f ( x, y) : 1 1 f x = 2 x + y − 2 , f y = 2 y + x − 2 . x y Тогда необходимыми условиями экстремума являются: 1 2 x 3 − 2 y 3 = xy 2 − yx 2 , 2 x + y − x 2 = 0, . 1 1 2 y + x − = 0 2 y + x − =0 y2 y2 4 Отсюда получаем, что либо x = y = 3 1 , либо 2 x 2 + 3xy + 2 y 2 = 0 . Так как последнее 3 уравнение не имеет решений, то единственной критической точкой является точка 1 1 M 3 , 3 . 3 3 Вычислим второй дифференциал в точке M . Так как 2 2 f xx = 2 + 3 ; f yy = 2 + 3 ; f xy = 1 , x y то d 2 f ( x, y ) M = 8dx 2 + 2dxdy + 8dy 2 0 при любых значениях приращений dx, dy . Поскольку второй дифференциал функции является в точке M положительно определенной квадратичной формой, то по достаточному условию экстремума заключаем, что M - точка локального минимума. 1 1 Ответ: M 3 , 3 - точка локального минимума. 3 3 5 Лекция 22. Неявная функция. Довольно часто при решении задач зависимость переменной y от n переменных ( x1 ,..., xn ) бывает задана в виде уравнения: (*) F ( x1 ,..., xn , y) = 0 , где F - некоторая функция (n + 1) переменной. Определение 1. Функция y = f ( x1 ,..., xn ) называется неявной функцией, определяемой уравнением (*) в области G , если при подстановке её в уравнение (*) оно обращается в области G в тождество: F ( x1 ,..., xn , y( x1 ,..., xn )) 0 . Пример. Рассмотрим уравнение F ( x, y) = x 2 + y 2 − 1 = 0 . непрерывные функции, задаваемые формулой: y1, 2 = 1 − x 2 , Легко видеть, что две являются неявными функциями, определяемыми этим уравнением на отрезке [−1, 1]. Однако, кроме них, есть бесконечное множество других неявных функций, не являющихся непрерывными, которые можно задавать так: + 1 − x 2 , x A, y A ( x) = − 1 − x 2 , x [0,1] \ A, где 𝐴 – произвольное собственное подмножество отрезке [−1, 1]. Рассмотрим вопрос, при каких условиях в окрестности данной точки гарантировано существование единственной непрерывной (и дифференцируемой) неявной функции, определяемой данным функциональным уравнением типа (*). Теорема 1. (О существовании и дифференцируемости неявной функции). Пусть функция F ( x, y) = F ( x1,..., xn , y) : 1) определена и дифференцируема в некоторой окрестности V точки 0 0 0 M 0 = ( x1 , ..., xn , y ) ; 2) F ( M 0 ) = 0 ; F 3) (M 0 ) 0 ; y F 4) непрерывна в точке M 0 . y Тогда для любого 0 найдётся такое = ( ) 0 , что для любого x из B ( x 0 ) , x0 = ( x10 ,..., xn0 ) , определена единственным образом функция f ( x) = f ( x1 ,..., xn ) , для которой F ( x, f ( x)) = 0 , и f ( x) − y 0 для любого x B ( x 0 ) . При этом функция f (x) непрерывна и дифференцируема в производные вычисляются по формулам: Fx f = − j , j = 1,..., n . x j Fy B ( x 0 ) , и её частные Доказательство. Сначала докажем существование требуемой функции и её F (M 0 ) 0 . единственность. Предположим для определённости, что В силу y F F непрерывности в точке M 0 существует окрестность U (M 0 ) , в которой также y y является положительной (можно считать, что U V , то есть всюду в U функция F дифференцируема). Следовательно, функция F , как функция одной переменной y , 1 монотонно возрастает на пересечении окрестности U с прямой x = x 0 . Тогда для произвольного числа 0 можно указать точки M1 ( x 0 , y 0 − h) , M 2 ( x 0 , y 0 + h) такие, что F ( M 1 ) 0 , а F (M 2 ) 0 , где ℎ = 𝜀/2. Далее, в плоскостях 𝑦 = 𝑦 0 − ℎ и 𝑦 = 𝑦 0 + ℎ можно выбрать окрестности точек M 1 и M 2 такие, что F 0 в окрестности точки M 1 и F 0 в окрестности точки M 2 . Можно считать, что эти окрестности одного и того же радиуса = ( ) 0 . y 0 − h y y 0 + h Таким образом мы получили цилиндр C : , удовлетворяющий 2 x − x0 следующим условиям: 1) функция F ( x, y) дифференцируема (а значит, и непрерывна) в 𝐶; 2) F ( x, y ) монотонно возрастает в цилиндре 𝐶 по переменной y ; 3) F ( x, y ) отрицательна на нижнем основании цилиндра 𝐶, и положительна на его верхнем основании. Из условий 1), 2), 3) следует, что для любой точки x = B ( x 0 ) на интервале (( x, y 0 − h); ( x, y 0 + h)) ) в цилиндре 𝐶 существует единственная точка M , в которой F ( M ) = 0 . Геометрическое место таких точек представляет собой график искомой неявной функции, которую мы обозначим y = f (x) . Единственность этой функции очевидна из её построения, неравенство f ( x) − y 0 - также. Покажем теперь, что построенная выше неявная функция непрерывна в B ( x 0 ) . При построении функции y = f (x) для произвольного 0 мы подобрали такое число = ( ) 0 , что как только выполнено неравенство немедленно выполняется неравенство: x − x 0 , для функции y = f (x) f ( x) − y 0 . Это означает непрерывность функции y = f (x) в точке x 0 . Непрерывность её в любой другой точке x1 B ( x0 ) доказывается совершенно аналогично: достаточно вместо взять число 1 0 такое, что B1 ( x1 ) B ( x0 ) . Докажем теперь дифференцируемость построенной неявной функции. Возьмем произвольную точку x1 B ( x0 ) . Поскольку функция y = f (x) является решением уравнения F ( x, f ( x)) = 0 всюду в окрестности, то для любой точки x B ( x 0 ) выполнено: ( ) F ( x, f ( x)) = F ( x1 , f ( x1 )) = 0 . Обозначим для краткости y = f (x ) , y1 = f x1 и выразим приращение функции F ( x, y) в точке x1 по определению дифференцируемости: 0 = F = F ( x, y) − F ( x1 , y1 ) = F ( x11 + x1 ,..., x1n + xn , y1 + y) − F ( x11 ,..., x1n , y1 ) = = Fx x1 + ... + Fx xn + Fyy + 1x1 + ... + n xn + y , 1 n где 1 ,..., n , - бесконечно малые функции при x1 → 0 ,…, xn → 0 , y → 0 , и все частные производные вычислены в точке ( x1 , y1 ) . Заметим, что из непрерывности функции y = f (x) следует, что y → 0 автоматически при x1 → 0 ,…, xn → 0 . Значит, функции 1 ,..., n , являются бесконечно малыми при x1 → 0 ,…, xn → 0 . Выразим из последнего соотношения приращение y : 2 0 = ( Fx1 + 1 )x1 + ... + ( Fxn + n )xn + ( Fy + )y . Следовательно, y = − ( Fxn + n ) ( Fx1 + 1 ) x1 − ... − xn , ( Fy + ) ( Fy + ) поскольку по условию теоремы Fy 0 , следовательно, при достаточно малом будет также ( Fy + ) 0 . Далее, для всех 𝑗 = 1, … , 𝑛 имеем: Fxj + j −1 Fx + j F + j ~ Fx 1 + = x j = j 1 + = j + ~ j , Fy + Fy Fy Fy Fy ~ где , ~ j - бесконечно малые при x1 → 0 ,…, xn → 0 . Окончательно получаем, что y = − ( ) Fx Fx1 x1 − ... − n xn + ~1x1 + ... + ~n xn , где ~ j → 0 при x1 → 0 ,…, xn → 0 . Fy Fy Это означает по определению, что функция y = f (x) дифференцируема в точке ( x1 , y1 ) , и ее частные производные в этой точке вычисляются по формулам: Fx f = − j , j = 1,..., n . x j Fy Теорема полностью доказана. В качестве следствия из теоремы о существовании неявной функции можно сформулировать следующее утверждение о существовании и дифференцируемости обратной функции. Следствие. Пусть функция y = f (x) дифференцируема в некоторой окрестности точки x0 , и производная f (x) отлична от нуля в точке x0 и непрерывна в этой точке. Тогда для любого 0 существует такая -окрестность точки y0 ( y0 = f ( x0 )) , в которой единственным образом определена дифференцируемая обратная функция x = ( y) = f −1 ( y) , удовлетворяющая условиям: 1) ( y0 ) = f −1 ( y0 ) = x0 , 2) | ( y ) − x0 | , 1 3) ( y ) = ( f −1 )( y ) = . f ( x) Доказательство. Рассмотрим функцию x = ( y ) как неявную функцию, определяемую функциональным уравнением: F ( x, y ) = f ( x) − y = 0 в окрестности точки M 0 ( x0 , y0 ) . Из условий cледствия ясно, что функция F ( x, y) дифференцируема в некоторой окрестности точки M 0 ( x0 , y0 ) , F ( M 0 ) = F ( x0 , y0 ) = 0 . Кроме того, её частная производная Fx( M 0 ) = f ( x0 ) 0 , и Fx( x, y) непрерывна в точке M 0 ( x0 , y0 ) . Таким образом, выполнены все условия теоремы 1. Из теоремы 1 следует, что для любого 0 существует такая -окрестность B ( y0 ) точки y0 , в которой единственным образом определена неявная функция x = ( y ) , обращающая равенство в тождество: f ( ( y )) y , и F ( x, y ) = f ( x ) − y = 0 удовлетворяющая условию: ( y) − x0 всюду в окрестности B ( y0 ) . Это означает, что x = ( y) = f −1 ( y) - обратная функция к f (x) в рассматриваемой окрестности. Кроме того, из теоремы 1 следует, что эта функция дифференцируема в той же окрестности, и её производная (в данном случае не частная, а полная, так как это функция одной переменной) вычисляется по формуле: 3 −1 F d d ( f −1 ) (−1) df = =− y =− = df dy dy Fx dx dx (Эта формула для производной обратной функции была получена в первом семестре другим способом). Следствие доказано. 4 Лекция 23 Неявные функции, определяемые системой функциональных уравнений Ранее мы рассматривали вопрос о существовании и дифференцировании неявной функции, определяемой одним функциональным уравнением. Теперь рассмотрим аналогичный вопрос для совокупности m (m – натуральное число, 𝑚 > 1) неявных функций, определяемых системой m функциональных уравнений. Пусть задана система функциональных уравнений: 𝐹1 (𝑥1 , … , 𝑥𝑛 , 𝑦1 , … , 𝑦𝑚 ) = 0, ………… { (1) (𝑥 ) 𝐹𝑚 1 , … , 𝑥𝑛 , 𝑦1 , … , 𝑦𝑚 = 0, и требуется найти её решение в виде набора функций 𝑦1 = 𝑓1 (𝑥1 , … , 𝑥𝑛 ), ………… { (2) 𝑦𝑚 = 𝑓𝑚 (𝑥1 , … , 𝑥𝑛 ), обращающих эту систему в систему тождеств в некоторой заданной области 𝐺 ⊆ ℝ𝑛 , где ℝ𝑛 - пространство переменных 𝑥1 , 𝑥2 , . . . , 𝑥𝑛 . Изучим вопрос о разрешимости системы функциональных уравнений (1) относительно 𝑦1 , 𝑦2 , . . . , 𝑦𝑚 . Решение (2) системы (1) мы будем называть непрерывным и дифференцируемым в некоторой области G изменения переменных 𝑥1 , 𝑥2 , . . . , 𝑥𝑛 , если каждая из функций (2) непрерывна и дифференцируема в области G. Рассмотрим m функций 𝐹1 , 𝐹2 , . . . , 𝐹𝑚 , стоящих в левых частях системы (1), и составим из частных производных этих функций определитель: 𝜕𝐹1 𝜕𝐹1 … 𝜕𝑦1 𝜕𝑦𝑚 … … …| ∆= | (3) 𝜕𝐹𝑚 𝜕𝐹𝑚 … 𝜕𝑦1 𝜕𝑦𝑚 Будем называть определитель вида (3) определителем Якоби (или кратко якобианом) функций 𝐹1 , 𝐹2 , . . . , 𝐹𝑚 по переменным 𝑦1 , 𝑦2 , . . . , 𝑦𝑚 и кратко обозначать его символом 𝐷(𝐹1 , 𝐹2 , . . . , 𝐹𝑚 ) . 𝐷(𝑦1 , 𝑦2 , . . . , 𝑦𝑚 ) Теперь мы можем сформулировать важное обобщение теоремы о неявной функции. Теорема 2. (о существовании системы неявных функций, определяемых системой функциональных уравнений). Пусть 1) m функций 𝐹1 (𝑥1 , … , 𝑥𝑛 , 𝑦1 , … , 𝑦𝑚 ), ………… { 𝐹𝑚 (𝑥1 , … , 𝑥𝑛 , 𝑦1 , … , 𝑦𝑚 ), определены и дифференцируемы в некоторой окрестности точки 0 0 0 0 0 0 𝑛+𝑚 𝑀0 (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 , 𝑦1 , 𝑦2 , . . . , 𝑦𝑚 ), 𝑀0 ∈ ℝ ; 2) все частные производные этих функций по переменным 𝑦1 , 𝑦2 , . . . , 𝑦𝑚 непрерывны в точке 𝑀0 ; 3) в точке 𝑀0 все функции 𝐹1 , 𝐹2 , . . . , 𝐹𝑚 обращаются в нуль, то есть выполнена система (1); 4) якобиан 𝐷(𝐹1 ,𝐹2 ,...,𝐹𝑚 ) 𝐷(𝑦1 ,𝑦2 ,...,𝑦𝑚 ) отличен от нуля в 𝑀0 . Тогда для любых положительных чисел 𝜀1 , 𝜀2 , . . . , 𝜀𝑚 найдется 𝛿 > 0 такое, что в 𝐵𝛿 (𝑥 0 ), 𝑥 0 = (𝑥10 , . . . , 𝑥𝑛0 ) существует единственный набор из 𝑚 функций (2), удовлетворяющий 0| условиям: |𝑓1 (𝑥) − 𝑦10 | < 𝜀1 , |𝑓2 (𝑥) − 𝑦20 | < 𝜀2 , . . . , |𝑓𝑚 (𝑥) − 𝑦𝑚 < 𝜀𝑚 , 𝑥 ∈ 𝐵𝛿 (𝑥 0 ), и являющийся решением системы уравнений (1), причем это решение непрерывно и дифференцируемо в указанной окрестности точки 𝑥 0 . 1 Замечание. При 𝑚 = 1 теорема 2 совпадает с доказанной ранее теоремой 1 о неявной функции, поскольку в этом случае якобиан (3) совпадает с частной производной 𝜕𝐹1 𝜕𝑦1 . Доказательство. Проведём рассуждения методом математической индукции. При 𝑚 = 1 теорема уже доказана. Поэтому для проведения индукции достаточно предположить, что теорема справедлива для системы, состоящей из 𝑚 − 1 функционального уравнения при некотором 𝑚 ≥ 2, и доказать её справедливость для системы, состоящей из 𝑚 функциональных уравнений. Итак, по условию теоремы, якобиан ∆(𝑀0 ) ≠ 0. Тогда хотя бы один из миноров (𝑚 − 1) −го порядка этого якобиана также отличен от нуля в точке M 0 . Не ограничивая общности, будем считать, что в точке M 0 отличен от нуля минор, стоящий в левом верхнем углу, то есть ∆𝑚 (𝑀0 ) ≠ 0, где 𝜕𝐹1 𝜕𝐹1 … 𝜕𝑦1 𝜕𝑦𝑚−1 … … … | ∆𝑚 = | 𝜕𝐹𝑚−1 𝜕𝐹𝑚−1 … 𝜕𝑦1 𝜕𝑦𝑚−1 Тогда, по предположению индукции, система, состоящая из первого 𝑚 − 1 уравнения системы (1), разрешима относительно переменных 𝑦1 , 𝑦2 , . . . , 𝑦𝑚−1. Точнее, для достаточно малых положительных чисел 1 , 2 ,..., m−1 найдется такая 0 окрестность точки 𝑥̃ 0 = (𝑥10 , . . . , 𝑥𝑛0 , 𝑦𝑚 ) пространства ℝ𝑛+1, в которой единственным образом определен набор из 𝑚 − 1 функции 𝑦1 = 𝑔1 (𝑥1 , … , 𝑥𝑛 , 𝑦𝑚 ), ………… { 𝑦𝑚−1 = 𝑔𝑚−1 (𝑥1 , … , 𝑥𝑛 , 𝑦𝑚 ), 0 |𝑔1 (𝑥̃ 0 ) − 𝑦10 | < 𝜀1 , . . . , |𝑔𝑚−1 (𝑥̃ 0 ) − 𝑦𝑚−1 | < 𝜀𝑚−1 удовлетворяющих условиям и являющихся единственным и дифференцируемым решением системы, состоящей из первого 𝑚 − 1 уравнения системы (1). Подставим найденные функции 𝑦1 , 𝑦2 , . . . , 𝑦𝑚−1 в левую часть последнего из уравнений (1). При этом последняя из функций превращается в некоторую функцию 𝜓, зависящую только от переменных 𝑥1 , . . . , 𝑥𝑛 , 𝑦𝑚 : 𝐹𝑚 (𝑥1 , . . . , 𝑥𝑛 , 𝑔1 (𝑥1 , … , 𝑥𝑛 , 𝑦𝑚 ), … , 𝑔𝑚−1 (𝑥1 , … , 𝑥𝑛 , 𝑦𝑚 ), 𝑦𝑚 ) = 𝜓(𝑥1 , . . . , 𝑥𝑛 , 𝑦𝑚 ). (4) Таким образом, последнее из уравнений системы (1) превращается в уравнение: 𝜓(𝑥1 , . . . , 𝑥𝑛 , 𝑦𝑚 ) = 0. (5) Заметим, что функция 𝜓(𝑥1 , . . . , 𝑥𝑛 , 𝑦𝑚 ) дифференцируема в некоторой окрестности точки 0 𝑥̃ 0 = (𝑥10 , . . . , 𝑥𝑛0 , 𝑦𝑚 ) как сложная функция. Из соотношения (4) следует, что 0) 𝜓(𝑥̃ 0 ) = 𝜓(𝑥10 , . . . , 𝑥𝑛0 , 𝑦𝑚 = 0. Покажем, что уравнение (5) разрешимо относительно переменной 𝑦𝑚 . Для этого достаточно показать, что частная производная 𝜕𝜓 𝜕𝑦𝑚 непрерывна и отлична от нуля в точке 𝑥̃ 0 . С этой целью вычислим указанную частную производную. Подставим в первые 𝑚 − 1 уравнений системы (1) функции 𝑔1 , 𝑔2 , . . . , 𝑔𝑚−1, являющиеся решением этих уравнений, и продифференцируем полученные при этом тождества по 𝑦𝑚 . Кроме этого, продифференцируем по 𝑦𝑚 соотношение (4). Получим систему: 𝜕𝐹1 𝜕𝑔1 𝜕𝐹1 𝜕𝑔𝑚−1 𝜕𝐹1 + ⋯+ + = 0, 𝜕𝑦1 𝜕𝑦𝑚 𝜕𝑦𝑚−1 𝜕𝑦𝑚 𝜕𝑦𝑚 … 𝜕𝐹𝑚−1 𝜕𝑔1 𝜕𝐹1 𝜕𝑔𝑚−1 𝜕𝐹𝑚−1 +⋯+ + = 0, 𝜕𝑦1 𝜕𝑦𝑚 𝜕𝑦𝑚−1 𝜕𝑦𝑚 𝜕𝑦𝑚 𝜕𝐹𝑚 𝜕𝑔1 𝜕𝐹𝑚 𝜕𝑔𝑚−1 𝜕𝐹𝑚 𝜕𝜓 +⋯+ + = . { 𝜕𝑦1 𝜕𝑦𝑚 𝜕𝑦𝑚−1 𝜕𝑦𝑚 𝜕𝑦𝑚 𝜕𝑦𝑚 2 Умножим теперь полученные равенства на алгебраические дополнения ∆1 , … , ∆𝑚−1 , ∆𝑚 элементов последнего столбца якобиана ∆ соответственно, а затем сложим эти равенства. Получим: 𝑚−1 ∑ 𝑘=1 𝜕𝑔𝑘 𝜕𝐹1 𝜕𝐹2 𝜕𝐹𝑚 𝜕𝐹1 𝜕𝐹2 𝜕𝐹𝑚 𝜕𝜓 [∆1 + ∆2 +. . . +∆𝑚 ] + (∆1 + ∆2 +. . . +∆𝑚 ) = ∆𝑚 . 𝜕𝑦𝑚 𝜕𝑦𝑘 𝜕𝑦𝑘 𝜕𝑦𝑘 𝜕𝑦𝑚 𝜕𝑦𝑚 𝜕𝑦𝑚 𝜕𝑦𝑚 Так как сумма произведений элементов данного столбца определителя на соответствующие алгебраические дополнения элементов этого столбца равна определителю, а сумма произведений элементов данного столбца определителя на соответствующие алгебраические дополнения элементов другого столбца равна нулю, то каждая квадратная скобка в последнем соотношении равна нулю, а круглая скобка равна якобиану ∆. Таким образом, мы получаем равенство (верное в некоторой окрестности точки 𝑀0 ): ∆= ∆𝑚 𝜕𝜓 𝜕𝑦𝑚 . По нашему предположению, ∆𝑚 (𝑀0 ) ≠ 0. Значит, 𝜕𝜓 ∆ = . 𝜕𝑦𝑚 ∆𝑚 Функции ∆ и 𝛥𝑚 состоят из частных производных функций 𝐹1 , 𝐹2 , . . . , 𝐹𝑚 по переменным 𝑦1 , 𝑦2 , . . . , 𝑦𝑚 , непрерывных в точке 𝑀0 . Кроме того, поскольку якобиан ∆ отличен от нуля в точке 𝑀0 , то и частная производная 𝜕𝜓 𝜕𝑦𝑚 в точке 𝑥̃ 0 отлична от нуля. Итак, доказано, что к уравнению (5) можно применить теорему о неявной функции. Согласно этой теореме, для любого положительного числа 𝜀𝑚 найдется такая 𝛿 −окрестность точки 𝑥 0 = (𝑥10 , . . . , 𝑥𝑛0 ), что всюду в пределах этой окрестности определена функция 𝑦𝑚 = 𝑓𝑚 (𝑥1 , 𝑥2 , . . . , 𝑥𝑛 ), 0| удовлетворяющая условию: |𝑓𝑚 (𝑥) − 𝑦𝑚 < 𝜀𝑚 , 𝑥 ∈ 𝐵𝛿 (𝑥 0 ), и являющаяся единственным, непрерывным и дифференцируемым решением уравнения (5). Подставляя это решение в функции 𝑔1 , 𝑔2 , . . . , 𝑔𝑚−1, мы получим функции 𝑓1 , . . . , 𝑓𝑚−1 , зависящие только от переменных 𝑥1 , . . . , 𝑥𝑛 : 𝑦𝑘 = 𝑔𝑘 [𝑥1 , . . . , 𝑥𝑛 , 𝑓𝑚 (𝑥1 , . . . , 𝑥𝑛 )] = 𝑓𝑘 (𝑥1 , . . . , 𝑥𝑛 ), 𝑘 = 1, … , 𝑚 − 1. По теореме о дифференцируемости сложной функции, каждая из функций 𝑓1 , . . . , 𝑓𝑚−1 дифференцируема в окрестности точки 𝑥 0 . Таким образом, мы доказали, что 𝑚 функций 𝑦1 = 𝑓1 (𝑥1 , … , 𝑥𝑛 ), … { 𝑦𝑚 = 𝑓𝑚 (𝑥1 , … , 𝑥𝑛 ) 0| удовлетворяют в окрестности точки 𝑥 0 условиям: |𝑓1 (𝑥) − 𝑦10 | < 𝜀1 , . . . , |𝑓𝑚 (𝑥) − 𝑦𝑚 < 𝜀𝑚 и являются непрерывным и дифференцируемым в этой окрестности решением системы (1). Единственность следует из построения. Теорема полностью доказана В качестве следствия из теоремы 2 сформулируем утверждение о существовании и дифференцируемости обратного отображения. Следствие. Пусть функции 𝑓1 (𝑥1 , … , 𝑥𝑛 ), … , 𝑓𝑛 (𝑥1 , … , 𝑥𝑛 ) определены и дифференцируемы в некоторой окрестности точки 𝑥 0 = (𝑥10 , … , 𝑥𝑛0 ), причем все частные производные 𝜕𝑓𝑘 𝜕𝑥𝑗 , 1 ≤ 𝑘, 𝑗 ≤ 𝑛, непрерывны в точке 𝑥 0 , а якобиан в этой точке отличен от нуля. 𝐷(𝑓1 , … , 𝑓𝑛 ) 𝐷(𝑥1 , … , 𝑥𝑛 ) 3 Тогда для любого 0 существует такая -окрестность точки 𝑦 0 = (𝑓1 (𝑥 0 ), … , 𝑓𝑛 (𝑥 0 )), в которой единственным образом определены и дифференцируемы функции 𝑥1 = 𝑔1 (𝑦1 , … , 𝑦𝑛 ), … , 𝑥𝑛 = 𝑔𝑛 (𝑦1 , … , 𝑦𝑛 ), удовлетворяющая соотношениям: 𝑓𝑘 (𝑔1 (𝑦1 , … , 𝑦𝑛 ), … , 𝑔𝑛 (𝑦1 , … , 𝑦𝑛 )) = 𝑦𝑘 , 𝑘 = 1, … , 𝑛, всюду в указанной окрестности. Доказательство. Нужно применить теорему 2 к системе функциональных уравнений 𝑓1 (𝑥1 , … , 𝑥𝑛 ) − 𝑦1 = 0, ………… { 𝑓𝑛 (𝑥1 , … , 𝑥𝑛 ) − 𝑦𝑛 = 0 в окрестности точки 𝑀0 (𝑥10 , 𝑥20 , . . . , 𝑥𝑛0 , 𝑦10 , 𝑦20 , . . . , 𝑦𝑛0 ), где 𝑦𝑘0 = 𝑓𝑘 (𝑥10 , … , 𝑥𝑛0 ). 4 Лекция 25. Условный локальный экстремум функции многих переменных Ранее мы рассматривали понятие локального экстремума функции. Теперь наша цель – рассмотреть более общее понятие условного локального экстремума и способы его отыскания. В точке локального экстремума функция принимает значение, которое больше (меньше) значений этой функции во всех точках некоторой окрестности. Однако довольно часто в практических задачах требуется отыскать точку, в которой данная функция принимает значение, большее (или меньшее) её значений не во всей окрестности этой точки, а лишь в некоторой её части, точки которой удовлетворяют специальным условиям (так называемым условиям связи). Эти условия связи обычно задают набором уравнений. Пример. Требуется найти экстремум функции 𝑓(𝑥, 𝑦) = 𝑥 2 − 𝑦 2 на прямой 𝐿: 𝑦 = 2𝑥. Таким образом, переменные 𝑥 и 𝑦 связаны между собой уравнением: 𝑦 − 2𝑥 = 0. Эта задача легко решается. Достаточно подставить равенство 𝑦 = 2𝑥 в выражение для функции. Получим: 𝑔(𝑥) = 𝑥 2 − 4𝑥 2 = −3𝑥 2 . Так как полученная функция всюду отрицательна, кроме точки 0, где она равна 0, то очевидно, что 𝑥0 = 0 – точка её максимума (даже не локального, а глобального). Однако исходная функция 𝑓(𝑥, 𝑦) = 𝑥 2 − 𝑦 2 в точке (0;0) не имеет локального экстремума, в чём нетрудно убедиться. Сформулируем теперь общее понятие условного экстремума. Пусть в некоторой области 𝐺 ⊆ ℝ𝑛+𝑚 задана функция 𝑛 + 𝑚 переменных 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) и система уравнений: 𝐹1 (𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) = 0 ……… { (1) 𝐹𝑚 (𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) = 0 Определение 1. Условным локальным экстремумом функции 𝑓 при условиях связи 0 (1) называется точка 𝑀0 (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 ) такая, что её координаты удовлетворяют условиям связи (1), и существует окрестность точки 𝑀0 , в пределах которой значение функции 𝑓(𝑀0 ) является наибольшим (наименьшим) среди её значений во всех точках этой окрестности, которые удовлетворяют условиям связи (1). Рассмотрим задачу об отыскании условного локального экстремума функции 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) при условиях связи (1). Необходимые условия существования условного локального экстремума Выясним, каковы необходимые условия существования условного локального экстремума в рассматриваемой точке 𝑀0 . Для решения этого вопроса будем предполагать, что все функции в левых частях системы (1) дифференцируемы в некоторой окрестности рассматриваемой точки 𝑀0 , их частные производные по переменным (𝑦1 , . . . , 𝑦𝑚 ) непрерывны в самой точке 𝑀0 , и якобиан 𝐷(𝐹1 ,...,𝐹𝑚 ) 𝐷(𝑦1 ,...,𝑦𝑚 ) ≠ 0 в точке 𝑀0 . Таким образом, выполнены все условия теоремы о существовании системы неявных функций, и следовательно, для любых положительных чисел 𝜀1 , 𝜀2 , . . . , 𝜀𝑚 найдётся окрестность точки 𝑥 0 = (𝑥10 , . . . , 𝑥𝑛0 ), в которой единственным образом определён набор 𝑚 дифференцируемых неявных функций: 𝑦1 = 𝜑1 (𝑥1 , . . , 𝑥𝑛 ) ……… { , (2) 𝑦𝑚 = 𝜑𝑚 (𝑥1 , . . . , 𝑥𝑛 ) определяемых системой функциональных уравнений (1) и удовлетворяющих неравенствам: 0| |𝑦1 − 𝑦10 | < 𝜀1 , |𝑦2 − 𝑦20 | < 𝜀2 , . . . , |𝑦𝑚 − 𝑦𝑚 < 𝜀𝑚 . 1 Подставив равенства (2) в функцию 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ), мы сведём нашу задачу к задаче об отыскании обычного локального экстремума функции 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝜑1 (𝑥1 , . . . , 𝑥𝑛 ), . . . , 𝜑𝑚 (𝑥1 , . . . , 𝑦𝑛 )) ≡ 𝛷(𝑥1 , . . . , 𝑥𝑛 ) (3) в точке 𝑥 0 = (𝑥10 , . . . , 𝑥𝑛0 ). Необходимые условия для этого нам известны. А именно, если в точке 𝑥 0 имеется локальный экстремум функции 𝛷(𝑥1 , . . . , 𝑥𝑛 ), то её дифференциал в этой точке равен нулю при любых достаточно малых приращениях переменных, то есть имеем равенство: 𝑑𝛷 = 𝛷𝑥′ 1 𝑑𝑥1 +. . . +𝛷𝑥′ 𝑛 𝑑𝑥𝑛 = 0 (все частные производные вычислены в точке 𝑁0 ). Далее, в силу тождества (3) и инвариантности формы записи первого дифференциала, имеем равенство: 𝑑𝛷 = 𝑑𝑓 = 𝑓𝑥′1 𝑑𝑥1 +. . . +𝑓𝑥′𝑛 𝑑𝑥𝑛 + 𝑓𝑦′1 𝑑𝑦1 +. . . +𝑓𝑦′𝑚 𝑑𝑦𝑚 = 0. (4) В равенстве (4) дифференциалы 𝑑𝑦𝑖 = 𝑑𝜑𝑖 (𝑖 = 1, . . . , 𝑚) – дифференциалы найденных неявных функций. Они могут быть выражены через дифференциалы 𝑑𝑥1 , . . . , 𝑑𝑥𝑛 в виде их линейных комбинаций следующим образом. При подстановке неявных функций 𝜑1 (𝑥), . . . , 𝜑𝑚 (𝑥) в систему уравнений связи (1) в некоторой окрестности точки 𝑥 0 возникает система тождеств: 𝐹1 (𝑥1 , . . . , 𝑥𝑛 , 𝜑1 (𝑥), . . . , 𝜑𝑚 (𝑥)) ≡ 0 ……… { (5) 𝐹𝑚 (𝑥1 , . . . , 𝑥𝑛 , 𝜑1 (𝑥), . . . , 𝜑𝑚 (𝑥)) ≡ 0 Дифференцируя эти тождества, получаем линейную систему: 𝜕𝐹1 𝜕𝐹1 𝜕𝐹1 𝜕𝐹1 𝑑𝑥 +. . . + 𝑑𝑥 + 𝑑𝑦 +. . . + 𝑑𝑦𝑚 = 0 1 𝑛 1 𝜕𝑥1 𝜕𝑥𝑛 𝜕𝑦1 𝜕𝑦𝑚 ……… { (6) 𝜕𝐹𝑚 𝜕𝐹𝑚 𝜕𝐹𝑚 𝜕𝐹𝑚 𝑑𝑥1 +. . . + 𝜕𝑥 𝑑𝑥𝑛 + 𝜕𝑦 𝑑𝑦1 +. . . + 𝜕𝑦 𝑑𝑦𝑚 = 0 𝜕𝑥 1 𝑛 1 𝑚 (Напомним, что все частные производные вычислены в точке 𝑥 0 ). В силу наложенного ранее условия 𝐷(𝐹1 ,...,𝐹𝑚 ) 𝐷(𝑦1 ,...,𝑦𝑚 ) ≠ 0 система (6) имеет единственное решение относительно дифференциалов 𝑑𝑦1 = 𝑑𝜑1 , . . . , 𝑑𝑦𝑚 = 𝑑𝜑𝑚 . То есть каждый из дифференциалов 𝑑𝑦1 , . . . , 𝑑𝑦𝑚 представляется в виде некоторой линейной комбинации дифференциалов 𝑑𝑥1 , . . . , 𝑑𝑥𝑛 . Подставляя эти линейные комбинации в равенство (4) и приводя подобные члены, получим уравнение вида: 𝐴1 𝑑𝑥1 +. . . +𝐴𝑛 𝑑𝑥𝑛 = 0. (Можно отметить, что полученные константы 𝐴1 , . . . , 𝐴𝑛 – это просто частные производные в точке 𝑥 0 вышеупомянутой функции 𝛷(𝑥1 , . . . , 𝑥𝑛 )). Отсюда получаем, что необходимыми условиями локального условного экстремума при описанных условиях является равенство нулю указанных констант, то есть равенства: 𝐴1 = 𝐴2 =. . . = 𝐴𝑛 = 0. (7) Итак, мы можем сформулировать следующее Утверждение (Необходимые условия условного локального экстремума). Если система (1) уравнений связи удовлетворяет (по отношению к переменным 𝑦1 , . . . , 𝑦𝑚 ) в 0 окрестности точки 𝑀0 (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 ) условиям теоремы о существовании системы дифференцируемых неявных функций, то необходимыми условиями для существования условного локального экстремума у функции 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) в точке 𝑀0 являются равенства (7), получаемые из уравнения (4) и системы (6). Поэтому в описанных условиях для отыскания 𝑛 + 𝑚 координат точки возможного экстремума следует решить систему из 𝑛 + 𝑚 уравнений: 𝐴1 = 𝐴2 =. . . = 𝐴𝑛 = 0 𝐹 (𝑥 , . . . 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) = 0 { 1 1 . ……… 𝐹𝑚 (𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) = 0 2 Метод неопределённых множителей Лагранжа Рассмотрим теперь метод, предложенный Лагранжем для отыскания локального условного экстремума. Этот метод, как мы увидим ниже, позволяет вывести и необходимые, и достаточные условия для существования условного локального экстремума рассматриваемой функции в данной точке 𝑀0 . В предыдущих рассмотрениях задачи о существовании условного экстремума мы опирались на то, что переменные 𝑦1 , . . . , 𝑦𝑚 являются неявными функциями от 𝑥1 , . . . , 𝑥𝑛 , задаваемыми уравнениями связи (1). В методе Лагранжа отсутствует (в явном виде) представление 𝑦1 , . . . , 𝑦𝑚 как функций от 𝑥1 , . . . , 𝑥𝑛 , то есть происходит симметризация переменных, они становятся равноправными. Пусть по-прежнему задана функция 𝑛 + 𝑚 переменных 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) и система уравнений (или условий) связи (1). Требуется найти необходимые и достаточные 0 условия для существования в данной точке 𝑀0 (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 ) условного локального экстремума функции 𝑢 = 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) при данных условиях связи. Для решения этой задачи предлагается рассмотреть специальную функцию. Определение 2. Функцией Лагранжа рассматриваемой задачи называется функция 𝑛 + 2𝑚 переменных 𝐿(𝑥, 𝑦; 𝜆) = 𝐿(𝑥, 𝑦; 𝜆1 , . . . , 𝜆𝑚 ) = 𝑓(𝑥, 𝑦) + 𝜆1 𝐹1 (𝑥, 𝑦)+. . . +𝜆𝑚 𝐹𝑚 (𝑥, 𝑦), где 𝑥 = (𝑥1 , . . . , 𝑥𝑛 ), 𝑦 = (𝑦1 , . . . , 𝑦𝑚 ), 𝜆 = (𝜆1 , . . . , 𝜆𝑚 ), 𝜆𝑗 ∈ ℝ, 𝑗 = 1, . . . , 𝑚. Необходимые условия условного экстремума Будем предполагать, как и выше, что функции 𝑓(𝑥, 𝑦), 𝐹1 (𝑥, 𝑦), . . . , 𝐹𝑚 (𝑥, 𝑦) 0 дифференцируемы в окрестности точки 𝑀0 (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 ). Заметим, что тогда функция Лагранжа также дифференцируема. Будем (как и выше) предполагать также, что частные производные функций 𝐹1 (𝑥, 𝑦), . . . , 𝐹𝑚 (𝑥, 𝑦) по переменным (𝑦1 , . . . , 𝑦𝑚 ) непрерывны в самой точке 𝑀0 , и якобиан 𝐷(𝐹1 ,...,𝐹𝑚 ) 𝐷(𝑦1 ,...,𝑦𝑚 ) ≠ 0 в точке 𝑀0 . Пусть в точке 𝑀0 у функции 𝑓(𝑥, 𝑦) имеется условный экстремум при условиях связи (1). Выясним, каким обязательным условиям должны удовлетворять в этом случае её координаты. В силу сделанных выше предположений мы по-прежнему располагаем равенствами (4) и (6). Умножим каждое из равенств (6) на произвольные (пока неопределённые) постоянные множители 𝜆1 , . . . , 𝜆𝑚 . Полученные после этого умножения равенства сложим почленно с равенством (4). В результате получим соотношение: 𝑛 𝑚 𝑚 𝑚 ∑(𝑓𝑥′𝑖 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑥𝑖 ) 𝑑𝑥𝑖 + ∑(𝑓𝑦′ 𝑗 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑦𝑗 ) 𝑑𝑦𝑗 = 𝑖=1 𝑘=1 𝑗=1 𝑘=1 = 𝐿′𝑥1 𝑑𝑥1 +. . . +𝐿′𝑥𝑛 𝑑𝑥𝑛 + 𝐿′𝑦1 𝑑𝑦1 +. . . +𝐿′𝑦𝑚 𝑑𝑦𝑚 = 0. Подберём 𝜆0 = (𝜆10, . . . , 𝜆0𝑚 ) так, чтобы все коэффициенты при 𝑑𝑦𝑗 в последнем соотношении равнялись нулю (𝑗 = 1, . . . , 𝑚). Это означает, что набор 𝜆0 = (𝜆10 , . . . , 𝜆0𝑚 ) должен быть решением системы: 3 𝑚 𝐿′𝑦1 = 𝑓𝑦′1 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑦1 = 0 , 𝑘=1 … …… 𝑚 { 𝐿′𝑦𝑚 = 𝑓𝑦′𝑚 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑦𝑚 = 0. 𝑘=1 В силу наложенного выше условия, что 𝐷(𝐹1 ,...,𝐹𝑚 ) 𝐷(𝑦1 ,...,𝑦𝑚 ) ≠ 0 в точке 𝑀0 , такой набор постоянных 𝜆0 = (𝜆01 , . . . , 𝜆0𝑚 ) определяется из системы единственным образом. После подстановки набора 𝜆0 = (𝜆10 , . . . , 𝜆0𝑚 ) в функцию Лагранжа получаем: 0 ′ 𝑑𝐿 = ∑𝑛𝑖=1(𝑓𝑥′𝑖 + ∑𝑚 𝑘=1 𝜆𝑘 (𝐹𝑘 )𝑥𝑖 ) 𝑑𝑥𝑖 = 0, Отсюда, в силу независимости переменных 𝑥1 , . . . , 𝑥𝑛 , следуют равенства: 0 ′ 𝑓𝑥′𝑖 + ∑𝑚 𝑘=1 𝜆𝑘 (𝐹𝑘 )𝑥𝑖 = 0, 𝑖 = 1, . . . , 𝑛. Объединяя все полученные условия и присоединяя к ним систему уравнений связи (1), получим итоговую систему из 𝑛 + 2𝑚 уравнений, которым при данных условиях обязаны удовлетворять координаты точки условного экстремума: 𝑚 𝑓𝑥′1 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑥1 = 0, 𝑘=1 𝑚 … 𝑓𝑥′𝑛 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑥𝑛 = 0, 𝑘=1 𝑚 𝑓𝑦′1 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑦1 = 0, 𝑘=1 𝑚 … 𝑓𝑦′𝑚 + ∑ 𝜆𝑘 (𝐹𝑘 )′𝑦𝑚 = 0, 𝑘=1 𝐹1 (𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) = 0, … {𝐹𝑚 (𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) = 0. 0 Таким образом, каждой точке 𝑀0 (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 ) условного экстремума при предположениях, перечисленных выше, соответствует единственное решение 0 0 (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 , 𝜆1 , . . . , 𝜆0𝑚 ) последней системы. Поэтому для поиска точек возможного условного экстремума следует решить эту систему и исключить из полученных решений 0 параметры 𝜆0 = (𝜆01 , . . . , 𝜆0𝑚 ). Тогда (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 ) есть координаты возможного условного экстремума. Таким образом, мы получили совокупность необходимых условий (по методу Лагранжа) существования условного локального экстремума Отметим, что полученная система представляет собой равенство нулю всех частных производных функции Лагранжа, если формально рассматривать эту функцию как функцию 𝑛 + 2𝑚 независимых переменных. В этом и состоит симметризация переменных в методе Лагранжа. 4 Пример. Найдем «подозрительные» на условный экстремум точки функции 𝑓(𝑥, 𝑦) = 𝑥 2 − 𝑦 2 при условии 𝑦 − 2𝑥 = 0. Составим функцию Лагранжа: 𝐿(𝑥, 𝑦, 𝜆) = 𝑥 2 − 𝑦 2 + 𝜆(𝑦 − 2𝑥). Запишем необходимые условия экстремума: 𝐿′𝑥 = 2𝑥 − 2𝜆 = 0, {𝐿′𝑦 = −2𝑦 + 𝜆 = 0, 𝐿′𝜆 = 𝑦 − 2𝑥 = 0. Отсюда 𝑥 = 𝜆, 𝑦 = 𝜆/2. Подставляем в последнее уравнение, получаем 𝜆 = 0, следовательно, единственная точка, «подозрительная» на условный экстремум, это точка 𝑀(0, 0). Достаточные условия существования условного экстремума Рассмотрим теперь вопрос о том, каковы достаточные условия для условного 0 локального экстремума. Пусть в точке 𝑀0 (𝑥10 , . . . , 𝑥𝑛0 , 𝑦10 , . . . , 𝑦𝑚 ) выполнены необходимые условия существования условного экстремума. Пусть, кроме того, функция 𝑓(𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ) и каждая из функций 𝐹𝑗 (𝑥1 , . . . , 𝑥𝑛 , 𝑦1 , . . . , 𝑦𝑚 ), (𝑗 = 1, . . . , 𝑚), дифференцируемы в некоторой окрестности точки 𝑀0 , и дважды дифференцируемы в самой точке 𝑀0 . Заметим, что в силу условий связи (1), приращения функций 𝛥𝑓 = 𝑓(𝑥, 𝑦) − 𝑓(𝑥 0 , 𝑦 0 ) и 𝛥𝐿 = 𝐿(𝑥, 𝑦, 𝜆0 ) − 𝐿(𝑥 0 , 𝑦 0 , 𝜆0 ) совпадают. Поэтому наличие условного локального экстремума при условиях связи в точке 𝑀0 у функции 𝑓(𝑥, 𝑦) равносильно наличию (при тех же условиях связи) локального экстремума в точке 𝑀0 у функции 𝐿(𝑥, 𝑦, 𝜆0 ). Кроме того, в силу системы (10), все первые частные производные функции 𝐿 по переменным 𝑦1 , . . . , 𝑦𝑚 равны нулю при 𝜆 = 𝜆0 , поэтому второй дифференциал сложной функции 𝐿(𝑥, 𝑦, 𝜆0 ) в точке 𝑀0 имеет такой же вид квадратичной формы, как второй дифференциал функции независимых переменных. А именно: 𝜕 𝜕 𝜕 𝜕 2 𝑑 2 𝐿 = (𝜕𝑥 𝑑𝑥1 +. . . + 𝜕𝑥 𝑑𝑥𝑛 + 𝜕𝑦 𝑑𝑦1 +. . . + 𝜕𝑦 𝑑𝑦𝑚 ) 𝐿. 1 𝑛 1 𝑚 𝑛 1 𝑚 Теперь ещё раз напомним, что мы ищем условный экстремум, поэтому на множестве, где осуществляется этот поиск, тождественно выполняются уравнения (1). Поэтому мы можем продифференцировать их и получить систему, аналогичную системе (6): 𝜕𝐹1 𝜕𝐹1 𝜕𝐹1 𝜕𝐹1 𝑑𝑥 +. . . + 𝑑𝑥 + 𝑑𝑦 +. . . + 𝑑𝑦𝑚 = 0, 1 𝑛 1 𝜕𝑥1 𝜕𝑥𝑛 𝜕𝑦1 𝜕𝑦𝑚 ……… { 𝜕𝐹𝑚 𝜕𝐹𝑚 𝜕𝐹 𝜕𝐹 𝑑𝑥1 +. . . + 𝜕𝑥 𝑑𝑥𝑛 + 𝜕𝑦𝑚 𝑑𝑦1 +. . . + 𝜕𝑦𝑚 𝑑𝑦𝑚 = 0. 𝜕𝑥 1 Поскольку якобиан 𝐷(𝐹1 ,...,𝐹𝑚 ) 𝐷(𝑦1 ,...,𝑦𝑚 ) ≠ 0 точке 𝑀0 , то дифференциалы 𝑑𝑦1 , . . . , 𝑑𝑦𝑚 однозначно выражаются из системы через дифференциалы независимых переменных 𝑑𝑥1 , . . . , 𝑑𝑥𝑛 в виде их линейных комбинаций. Подставляя эти выражения во второй дифференциал функции Лагранжа, получим квадратичную форму: 𝑑 2 𝐿 = 𝐾(𝑑𝑥1 , . . . , 𝑑𝑥𝑛 ), зависящую уже только от дифференциалов 𝑑𝑥1 , . . . , 𝑑𝑥𝑛 . Отсюда следует, что если квадратичная форма 𝑑2 𝐿 = 𝐾(𝑑𝑥1 , . . . , 𝑑𝑥𝑛 ) является положительно (отрицательно) определённой, то в рассматриваемой точке 𝑀0 имеется условный локальный минимум (максимум). Если же форма 𝑑 2 𝐿 = 𝐾(𝑑𝑥1 , . . . , 𝑑𝑥𝑛 ) знакопеременна, то условного экстремума в точке 𝑀0 нет. 5 Примеры. 1) Для функции 𝑓(𝑥, 𝑦) = 𝑥 2 − 𝑦 2 при условии 𝑦 − 2𝑥 = 0 имеем: 𝑑 2 𝐿 = 2𝑑𝑥 2 − 2𝑑𝑦 2 . Заметим, что при произвольных значениях 𝑑𝑥 и 𝑑𝑦 эта квадратичная форма является знакопеременной. Используем условие связи: 𝑦 − 2𝑥 = 0, следовательно, 𝑑𝑦 − 2𝑑𝑥 = 0. Подставим 𝑑𝑦 = 2𝑑𝑥 в выражение для 𝑑 2 𝐿, получим 𝑑2 𝐿|𝑑𝑦=2𝑑𝑥 = 2𝑑𝑥 2 − 8𝑑𝑥 2 = −6𝑑𝑥 2 < 0 при всех значениях 𝑑𝑥 ≠ 0. Значит, найденная точка 𝑀(0, 0) является точкой условного максимума. 2) Пусть задана функция 𝑓(𝑥, 𝑦, 𝑧) = 2𝑥 + 2𝑦 − 𝑧. Требуется найти её условный локальный экстремум при наличии условия связи: 𝑥 2 + 𝑦 2 + 𝑧 2 = 1. Функция Лагранжа: 𝐿(𝑥, 𝑦, 𝑧, 𝜆) = 2𝑥 + 2𝑦 − 𝑧 + 𝜆(𝑥 2 + 𝑦 2 + 𝑧 2 − 1). Приравнивая частные производные функции Лагранжа к нулю, получаем систему: 2 + 2𝜆𝑥 = 0, 2 + 2𝜆𝑦 = 0, { −1 + 2𝜆𝑧 = 0, 𝑥 2 + 𝑦 2 + 𝑧 2 − 1 = 0. 1 1 1 Из первых трех уравнений находим: 𝑥 = − 𝜆, 𝑦 = − 𝜆, 𝑧 = 2𝜆. Подставляем в последнее 9 3 уравнение, получаем: 4𝜆2 = 1, то есть 𝜆 = ± 2. Получаем две точки, «подозрительные» на экстремум: 2 2 1 3 2 2 1 3 𝑀1 (3 ; 3 ; − 3) при 𝜆0 = − 2 и 𝑀2 (− 3 ; − 3 ; 3) при 𝜆0 = 2. Второй дифференциал функции Лагранжа имеет вид: 𝑑2 𝐿(𝑀0 ) = 2𝜆(𝑑𝑥 2 + 𝑑𝑦 2 + 𝑑𝑧 2 ). 2 2 1 Очевидно, что 𝑑2 𝐿(𝑀1 ) < 0, 𝑑 2 𝐿(𝑀2 ) > 0. Значит, 𝑀1 (3 ; 3 ; − 3) – точка условного 2 2 1 локального максимума; 𝑀2 (− 3 ; − 3 ; 3) − точка условного локального минимума. 6