7. Экстремумы функций нескольких переменных

advertisement
7. Экстремумы функций нескольких
переменных
7.1. Локальные экстремумы
Пусть функция f (x1 , . . . , xn ) определена на некотором открытом множестве D ⊆ Rn . Точка M ∈ D называется точкой локального максимума
(локального минимума) функции f, если значение f (M ) является наибольшим (наименьшим) среди всех значений этой функции в некоторой
окрестности точки M (т.е. существует δ > 0 такое, что для всех точек
(x1 , . . . , xn ) ∈ Oδ (M ) выполняется f (x1 , . . . , xn ) ≤ f (M ) (f (x1 , . . . , xn ) ≥
f (M ))). Точки локального максимума и локального минимума называются точками локального экстремума.
Для локального экстремума дифференцируемой функции нескольких переменных можно обобщить необходимое и достаточные условия
существования со случая одной переменной.
Лемма 7.1. Если функция f (x1 , . . . , xn ) определена в некоторой окрестности точки M, являющейся точкой локального экстремума, и существует в точке M конечная частная производная функции f по какой-то переменной xi , то эта частная производная равна 0.
Доказательство. Обозначим координаты точки M (x01 , . . . , x0n ) и рассмотрим
функцию
одной
переменной
xi
:
g(xi ) = f (x01 , . . . , x0i−1 , xi , x0i+1 , . . . , x0n ). Существование конечной частной
производной функции f (x1 , . . . , xn ) по переменной xi в точке M эквивалентно дифференцируемости функции g(xi ) в точке x0i . Очевидно, что
функция g(xi ) имеет в точке x0i локальный экстремум. А тогда g 0 (x0i ) = 0.
Это означает, что fx0 i (M ) = 0. Лемма доказана.
¤
Теорема 7.1. (Необходимое условие локального экстремума). Пусть функция f (x1 , . . . , xn ) определена на некотором открытом
множестве D и дифференцируема в точке M ∈ D, являющейся точкой
локального экстремума функции f. Тогда df (M ) = 0.
Доказательство непосредственно вытекает из леммы, если ее применить ко всем переменным xi (i ∈ {1, . . . , n}).
Точки множества D, в которых у функции f существует и равен
нулю дифференциал, будем называть стационарными. Из теоремы 7.1
следует, что точками локального экстремума могут быть только стационарные точки и точки, в которых функция не дифференцируема.
Оказывается, не любая стационарная точка является точкой локального экстремума у дифференцируемой функции. Например, для функции
f (x, y) = x2 + y 2 , D = R2 (см. рис. 7.1) точка (0; 0) является и стационарной, и точкой локального минимума (т.к. f (x, y) = x2 + y 2 ≥ 0 = f (0, 0)),
а для функции f (x, y) = x2 − y 2 , D = R2 (см. рис. 7.2) точка (0; 0) является стационарной, но не является точкой локального экстремума (т.к.
в любой окрестности точки (0; 0) функция принимает и положительные
(f (ε, 0) = ε2 ), и отрицательные (f (0, ε) = −ε2 ) значения). Следовательно, для исследования локального экстремума нужны некоторые достаточные условия.
Предварительно вспомним известное из алгебры понятие квадратичной формы.
Квадратичной формой относительно переменных t1 , . . . , tn называется функция
n
X
Φ(t1 , . . . , tn ) =
aij ti tj ,
i,j=1
где при всех i, j ∈ {1, . . . , n} aij ∈ R, aij = aji .
Квадратичная форма называется положительно определенной (отрицательно определенной), если при всех значениях t1 , . . . , tn ∈ R, одновременно не обращающихся в 0, функция Φ(t1 , . . . , tn ) принимает только
строго положительные (строго отрицательные) значения.
Квадратичная форма называется знакопеременной, если она принимает как строго положительные, так и строго отрицательные значения.
Теорема 7.2. (Достаточные условия локального экстремума).
Пусть функция f (x1 , . . . , xn ) определена и дважды дифференцируема в
некоторой окрестности точки M (x01 , . . . , x0n ), причем в самой точке M все
частные производные второго порядка непрерывны. Пусть, кроме того,
M – стационарная точка. Тогда, если d2 f (M ) представляет собой знакоопределенную квадратичную форму относительно dx1 , . . . , dxn , то точка
M является точкой локального экстремума (локального максимума, если
отрицательно определенная, и локального минимума, если положительно определенная форма). Если d2 f (M ) представляет собой знакопеременную квадратичную форму, то в точке M локального экстремума нет.
Доказательство. Распишем приращение функции f в точке M по
формуле Тейлора с остаточным членом в форме Лагранжа
1
f (M1 ) − f (M ) = df (M ) + d2 f (M + θ(M1 − M )),
2
1
1
1
0
где
r nM1 имеет координаты (x1 , . . . , xn ), dxi = ∆xi = xi −xi (i ∈ {1, . . . , n}), ρ =
P 1
(xi − x0i )2 . По условию df (M ) = 0, значит, формулу можно перепиi=1
сать следующим образом:
f (M1 ) − f (M ) =
n
1 X 00
f (M + θ(M1 − M ))∆xi ∆xj .
2 i,j=1 xi xj
Поскольку все fx00i xj непрерывны в точке M , то при всех i, j ∈ {1, . . . , n}
выполняется
fx00i xj (M + θ(M1 − M )) −→ fx00i xj (M ).
ρ→0
Поэтому
fx00i xj (M + θ(M1 − M )) = fx00i xj (M ) + αij (∆x1 , . . . , ∆xn ),
где αij −→ 0. Таким образом,
ρ→0
n
1 X 00
f (M1 ) − f (M ) =
fxi xj (M )∆xi ∆xj + α(ρ)ρ2 ,
2 i,j=1
где
n
1X
∆xi ∆xj
α(ρ) =
αij (∆x1 , . . . , ∆xn )
·
−→ 0.
2 i,j=1
ρ
ρ ρ→0
Обозначим hi =
∆x
, (i ∈ {1, . . . , n}). Тогда для M1 6= M
ρ
n
1 2 X 00
f (M1 ) − f (M ) =
ρ
fxi xj (M )hi hj + α(ρ)ρ2 =
2 i,j=1
= ρ2 (Φ(h1 , . . . , hn ) + α(ρ)),
где
n
1X
Φ(h1 , . . . , hn ) =
aij hi hj ,
2 i,j=1
aij = fx00i xj (M ).
Очевидно, что
n
X
h2i = 1, т.е. функция Φ(h1 , . . . , hn ) определена в точках
i=1
n-мерной сферы единичного радиуса.
I. Рассмотрим сначала случай положительно определенной квадратичной формы d2 f (M ). В этом случае функция Φ(h1 , . . . , hn ), определенная на единичной сфере, принимает только положительные значения.
Кроме того, очевидно, что Φ(h1 , . . . , hn ) непрерывна, а область ее определения – ограниченное замкнутое множество. Следовательно, по второй теореме Вейерштрасса Φ(h1 , . . . , hn ) достигает своего инфимума, т.е.
inf Φ(h1 , . . . , hn ) = Φ(h01 , . . . , h0n ) = µ > 0. Так как функция α(ρ) является
бесконечно малой, то для достаточно малых ρ выполняется |α(ρ)| < µ.
Поэтому для таких ρ
f (M1 ) − f (M ) = ρ2 (Φ(h1 , . . . , hn ) + α(ρ)) ≥ ρ2 (µ + α(ρ)) ≥ 0,
т.е. точка M является точкой локального минимума.
II. В случае отрицательно определенной квадратичной формы d2 f (M )
аналогично доказывается, что точка M – точка локального максимума.
III. Пусть d2 f (M ) – знакопеременная квадратичная форма, т.е. существуют два набора (t01 , . . . , t0n ) и (t001 , . . . , t00n ) значений для dx1 , . . . , dxn
таких, что в точках первого набора d2 f (M ) принимает положительное
значение, а в точках второго набора – отрицательное значение. Это эквивалентно тому, что Φ(h01 , . . . , h0n ) > 0 и Φ(h001 , . . . , h00n ) < 0, где
h0i = s
t0i
,
n
X
(t0i )2
h00i = s
i=1
t00i
n
X
(t00i )2
(i ∈ {1, . . . , n}).
i=1
Рассмотрим переменные точки M 0 с координатами x0i = x0i + ρh0i и M 00 с
координатами x00i = x0i + ρh00i , где ρ > 0 и i ∈ {1, . . . , n}. Легко посчитать,
что ρ(M 0 , M ) = ρ(M 00 , M ) = ρ. Кроме того, для приращения функции
f (x1 , . . . , xn ) в точке M справедливы формулы
f (M 0 ) − f (M ) = ρ2 (Φ(h01 , . . . , h0n ) + α0 (ρ)),
f (M 00 ) − f (M ) = ρ2 (Φ(h001 , . . . , h00n ) + α00 (ρ)),
где α0 (ρ)) и α00 (ρ)) – бесконечно малые при ρ → 0. Поэтому для достаточно маленьких ρ выполняется
|α0 (ρ)| < Φ(h01 , . . . , h0n ),
|α00 (ρ)| < Φ(h001 , . . . , h00n ).
Итак, для сколь угодно малого ρ найдутся такие точки M 0 и M 00 , что
ρ(M 0 , M ) = ρ(M 00 , M ) = ρ, f (M 0 ) > f (M ), f (M 00 ) < f (M ), т.е. точка M
не является точкой локального экстремума. Теорема доказана.
¤
Для функций двух переменных f (x, y) достаточные условия экстремума могут быть сформулированы более удобно для проверки.
Теорема 7.3. Пусть функция f (x, y) дважды дифференцируема в
некоторой окрестности точки M и дважды непрерывно дифференцируема в самой точке M, которая является стационарной. Тогда, если
00
00
(M ), C = fy002 (M ), то
AC − B 2 > 0, где A = fx002 (M ), B = fxy
(M ) = fyx
M является точкой локального экстремума (локального максимума при
A < 0 и локального минимума при A > 0. Если AC − B 2 < 0, то M не
является точкой локального экстремума.
Замечание 7.1. В случае AC − B 2 = 0 для исследования на экстремум нужно привлекать дифференциалы более высокого порядка.
Доказательство теоремы. Для функции двух переменных f (x, y)
ее приращение в точке M можно записать более конкретно, чем в теореме
7.2:
1
f (M1 ) − f (M ) = (A(∆x)2 + 2B∆x∆y + C(∆y)2 ) + α(ρ)ρ2 ,
2
p
где точка M1 имеет координаты (x0 + ∆x, y0 + ∆y), ρ = (∆x)2 + (∆y)2 .
∆x
∆y
Обозначим h1 =
, h2 =
,
ρ
ρ
1
Φ(h1 , h2 ) = (Ah21 + 2Bh1 h2 + Ch22 ).
2
Тогда для M1 6= M
f (M1 ) − f (M ) = ρ2 (Φ(h1 , h2 ) + α(ρ)),
где α(ρ) → 0 при ρ → 0.
I. Рассмотрим случай AC − B 2 > 0, A > 0. В этом случае
1
(A2 h21 + 2ABh1 h2 + ACh22 ) =
2A
1
=
((Ah1 + Bh2 )2 + ACh22 − B 2 h22 ) =
2A
1
=
((Ah1 + Bh2 )2 + (AC − B 2 )h22 ).
2A
Φ(h1 , h2 ) =
(7.1)
(0.1)
Поскольку h1 и h2 не могут одновременно обратиться в ноль, то Φ(h1 , h2 )
принимает только положительные значения. Дальше рассуждения такие
же, как в доказательстве теоремы 7.2.
II. В случае AC − B 2 > 0, A < 0 формула 7.1) показывает, что функция Φ(h1 , h2 ) принимает только отрицательные значения, и мы приходим
к случаю II доказательства теоремы 7.2.
III. Пусть AC − B 2 < 0.
а) Если A 6= 0, то, полагая в ( 7.1) h01 = 1, h02 = 0, получим Φ(h01 , h02 ) =
A
B
A
, а полагая h001 = √
, h002 = − √
, получим Φ(h001 , h002 ) =
2
A2 + B 2
A2 + B 2
1
(AC − B 2 )(h002 )2 . Так как AC − B 2 < 0, то Φ(h01 , h02 ) и Φ(h001 , h002 ) имеют
2A
противоположные знаки, т.е. Φ(h1 , h2 ) является знакопеременной квадратичной формой. Доказательство завершает ссылка на соответствующий случай теоремы 7.2.
б) Если A = 0, а C 6= 0, то можно повторить рассуждения случая а),
поменяв ролями переменные x и y.
в) Если A = C = 0, то B 6= 0, поскольку AC − B 2 < 0. В этом случае
Φ(h1 , h2 ) = Bh1 h2 – тоже знакопеременная квадратичная форма.
Пример 7.1. f (x, y) = x2 + y 2 . Единственная точка возможного экстремума – стационарная точка (0, 0). В ней A = 2 > 0, AC − B 2 = 4 > 0.
Следовательно, точка (0, 0) – точка локального минимума.
Пример 7.2. f (x, y) = x2 − y 2 . Точка (0, 0) тоже является единственной точкой возможного экстремума. Но AC − B 2 = −4 < 0, поэтому у
функции нет локальных экстремумов.
Пример 7.3. f (x, y) = x3 + 3xy 2 − 39x − 36y + 26. Найдем частные
производные первого порядка
fx0 = 3x2 + 3y 2 − 39,
fy0 = 6xy − 36.
Составляем систему уравнений для нахождения стационарных точек
½ 2
x + y 2 = 13
xy = 6.
Выражая y из второго уравнения и подставляя в первое, получим биквадратное уравнение
x4 − 13x2 + 36 = 0 или (x2 − 4)(x2 − 9) = 0.
Таким образом, стационарными являются четыре точки (3, 2), (−3, −2), (2, 3), (−2, −3).
Вычисляем частные производные второго порядка
fx002 = 6x,
00
00
= 6y,
= fyx
fxy
fy002 = 6x.
Для точки (3, 2) A = 18 > 0, AC − B 2 = 182 − 122 > 0. Следовательно,
в этой точке функция имеет локальный минимум f (3, 2) = −100. Для
точки (−3, −2) A = −18 < 0, AC − B 2 = 182 − 122 > 0. Следовательно,
в этой точке функция имеет локальный максимум f (−3, −2) = 152. Для
точек (2, 3), (−2, −3) AC − B 2 = 122 − 182 < 0. Следовательно, в этих
точках локального экстремума нет.
7.2. Условные экстремумы
Часто на практике приходится искать экстремумы функции нескольких переменных при условии, что переменные как-то связаны между собой. А именно, помимо функции f (x1 , . . . , xn ), определенной на открытом
множестве D, рассмотрим еще функции F1 (x1 , . . . , xn ), . . . , Fm (x1 , . . . , xn ) (m <
n) с той же областью определения D. Обозначим E – множество решений
системы

 F1 = 0
.......
(7.2)
(0.2)

Fm = 0.
Будем говорить, что функция f имеет условный экстремум (условный максимум или условный минимум) в точке M ∈ D относительно уравнений связи (7.2), если значение f (M ) является экстремальным
(наибольшим или наименьшим) среди всех значений, принимаемых функцией f на пересечении множества E с некоторой окрестностью точки M.
Для нахождения точек условного экстремума иногда возможен следующий достаточно простой способ: решаем систему (7.2) относительно
x1 , . . . , x m
x1 = g1 (xm+1 , . . . , xn ),
.......................
xm = gm (xm+1 , . . . , xn ),
затем подставляем найденные значения в функцию f и исследуем полученную
функцию
n
−
m
переменных
f (g1 (xm+1 , . . . , xn ), . . . , gm (xm+1 , . . . , xn ), xm+1 , . . . , xn ) на обычный локальный экстремум. Если точка (x0m+1 , . . . , x0n ) является точкой локального экстремума такой сложной функции, то точка (x01 , . . . , x0n ), где x01 =
g1 (x0m+1 , . . . , x0n ), . . . , x0m = gm (x0m+1 , . . . , x0n ), является точкой условного
экстремума функции f относительно уравнений связи (7.2).
Пример 7.4. f (x, y) = x2 +y 2 , F (x, y) = x+y−1 (т.е. уравнение связи
x+y−1 = 0). Выражаем y через x из уравнения связи и подставляем в f :
1
f (x, y(x)) = 2x2 −2x+1. Для этой функции точка x0 = является точкой
2µ
¶
1 1
локального минимума. Следовательно, точка (x0 , y0 ) =
,
является
2 2
точкой условного минимума функции f (x, y) = x2 + y 2 относительно
уравнения связи x + y = 1.
Однако такой простой способ не всегда возможен, поскольку систему
(7.2) не всегда удается разрешить. В этом случае можно воспользоваться
методом неопределенных множителей (методом Лагранжа), который
применяется для дважды дифференцируемых функций f, F1 , . . . , Fm и
состоит в следующем (теоретическое обоснование метода из-за сложности опустим).
Рассмотрим новую функцию n + m переменных
Φ(x1 , . . . , xn , λ1 , . . . , λm ) = f (x1 , . . . , xn ) +
+λ1 F1 (x1 , . . . , xn ) + . . . + λm Fm (x1 , . . . , xn ),
которую называют функцией Лагранжа.
I. На первом этапе находим точки возможного условного экстремума.
Для этого нужно найти стационарные точки функции Φ, т.е. решить
систему
 0
 0
fx1 + λ1 (F1 )0x1 + . . . + λm (Fm )0x1 = 0
Φx1 = 0








....................................
........




 0
 0
fxn + λ1 (F1 )0xn + . . . + λm (Fm )0xn = 0
Φxn = 0
или
Φ0λ1 = 0
F1 = 0








........
....................................





 0
Φ λm = 0
Fm = 0.
Если (x01 , . . . , x0n , λ01 , . . . , λ0m ) – стационарная точка функции Φ, то (x01 , . . . , x0n )
– точка возможного условного экстремума функции f.
II. На втором этапе для каждой точки (x01 , . . . , x0n ), найденной на первом этапе, рассматриваем свою функцию g(x1 , . . . , xn ) = Φ(x1 , . . . , xn , λ01 , . . . , λ0m ).
Вычисляем d2 g(x01 , . . . , x0n ). Кроме того, дифференцируя уравнения связи
в точке (x01 , . . . , x0n ), получаем систему верных равенств

 (F1 )0x1 dx1 + . . . + (F1 )0xn dxn = 0
.................................

(Fm )0x1 dx1 + . . . + (Fm )0xn dxn = 0.
Если ранг матрицы Якоби для функций F1 , . . . , Fm в точке (x01 , . . . , x0n )
равен m, то из этой системы можно выразить некоторые m дифференциалов переменных x1 , . . . , xn через остальные дифференциалы. Подставим
найденные значения в d2 g(x01 , . . . , x0n ). Получится некоторая квадратичная форма относительно (n − m) переменных. Если эта квадратичная
форма положительно определенная, то в точке (x01 , . . . , x0n ) условный минимум, отрицательно определенная – условный максимум, знакопеременная – нет условного экстремума.
Пример 7.5. f (x, y) = x2 − y 2 , F (x, y) = x + y − 1. Составляем
функцию Φ(x, y, λ) = x2 − y 2 + λ(x + y − 1). Система для нахождения
точек возможного условного экстремума

 2x + λ = 0
−2y + λ = 0

x + y = 1.
Вычитая из первого уравнения второе, получаем x + y = 0, что противоречит третьему уравнению. Следовательно, система несовместна, и
функция не имеет условных экстремумов.
Пример 7.6. f (x, y) = xy, F (x, y) = x + y − 1. Составляем функцию
Φ(x, y, λ) = xy + λ(x + y − 1). Система для нахождения точек возможного
условного экстремума

 y+λ=0
x+λ=0

x + y = 1.
1
Решением этой системы является единственный набор x0 = , y0 =
2
1
1
1
, λ0 = − . Рассматриваем функцию g(x, y) = Φ(x, y, λ0 ) = xy− (x+y−
2
2
¶
¶
¶
µ
µ
µ
µ 2¶
1
1
1
1
1
1
1 1
00
00
1). Для нее gx002
,
= 0, gxy
,
= gyx
,
= 1, gy002
,
= 0.
2 2µ
2 2
2 2
2 2
¶
1 1
Следовательно, d2 g
,
= 2dxdy. Из уравнения связи находим зави2 2
симость
между
dx и dy : dx + dy = 0. Подставляя значение dy = −dx в
µ
¶
1
1
d2 g
,
, получаем отрицательно определенную квадратичную форму
2 2
µ
¶
1 1
2
−2(dx) . Следовательно, точка
,
– это точка условного максимума
2 2
функции f (x, y) = xy относительно уравнения связи x + y = 1.
Пример 7.7. На двух предприятиях отрасли необходимо изготовить
180 экземпляров некоторой продукции. Затраты, связанные с производством x изделий на I предприятии, равны 4x + x2 тысяч руб., а затраты,
обусловленные изготовлением y изделий на II предприятии, составляют
8y + y 2 тысяч руб. Требуется определить, сколько изделий на каждом из
предприятий следует произвести, чтобы общие затраты были минимальными.
Решение. Математическая постановка задачи состоит в определении
минимального значения функции
f (x, y) = 4x + x2 + 8y + y 2
при условии x + y = 180 (и, конечно, x ≥ 0, y ≥ 0). Составим функцию
Лагранжа
Φ(x, y, λ) = 4x + x2 + 8y + y 2 + λ(x + y − 180).
Приравняем нулю частные производные функции Φ

 4 + 2x + λ = 0
8 + 2y + λ = 0

x + y = 180.
Решением этой системы является набор x0 = 91, y0 = 89, λ0 = −186.
Этот набор удовлетворяет условию x0 ≥ 0, y0 ≥ 0. Для функции g(x, y) =
4x+x2 +8y +y 2 −186(x+y −180) дифференциал второго порядка в точке
(x0 , y0 ) равен
d2 g(x0 , y0 ) = 2dx2 + 2dy 2 .
Квадратичная форма положительно определенная, поэтому нет необходимости находить зависимость между dx и dy из уравнения связи. Итак,
точка (91, 89) – точка условного минимума.
Ответ. Оптимальный способ размещения заказа – 91 изделие на I
предприятии и 89 – на II предприятии. При этом затраты будут минимальными и составят 17 278 000 руб.
7.3. Наибольшие и наименьшие значения функции
До сих пор мы предполагали, что область определения рассматриваемой функции является открытым множеством. Для случая замкнутого ограниченного множества D и непрерывной функции f (x1 , . . . , xn )
благодаря теореме Вейерштрасса можно поставить вопрос о нахождении
наибольшего и наименьшего значений функции. Если точка, в которой
принимается одно из этих значений, является внутренней, то, очевидно,
в этой точке функция имеет локальный экстремум. Но своего наибольшего (наименьшего) значения функция может достигать и на границе
множества D. Таким образом, чтобы найти наибольшее (наименьшее)
значение функции f (x1 , . . . , xn ) на множестве D, можно найти все внутренние стационарные точки, точки недифференцируемости функции f,
вычислить значения функции в них и сравнить их между собой и со
значениями функции f в граничных точках множества D : наибольшее
(наименьшее) из всех этих значений и будет наибольшим (наименьшим)
значением функции f на всем множестве D.
Пример 7.8. Требуется найти наибольшее и наименьшее значения
функции f (x, y) = x2 y на множестве точек (x, y), удовлетворяющих неравенству x2 + y 2 ≤ 1.
Найдем сначала стационарные точки в открытом круге x2 + y 2 < 1
½ 0
fx = 2xy = 0
fy0 = x2 = 0.
Решением системы являются все точки открытого круга, у которых x =
0. Значения функции f в этих точках равны 0. Для нахождения экстремальных точек на границе круга можно исследовать функцию f на
условный экстремум относительно уравнения связи x2 +y 2 = 1. Выразим
из этого уравнения x2 = 1 − y 2 и подставим в f (x, y), получим функцию
r
1
3
h(y) = y − y . Функция h(y) имеет две экстремальные точки y1 = −
3
r
1
и y2 =
. Из уравнения x2 = 1 − y 2 найдем соответствующие значения
3
x. Вычислим значения функции f (x, y) в полученных четырех точках и
сравним их со значениями функции f в точках ее возможного экстремума внутри круга x2 + y 2 = 1. Так как в нашем примере эти значения
равны 0, то наибольшее значение функции f (x, y) на указанном множе2
2
стве равно √ , наименьшее равно − √ .
3 3
3 3
Download