Загрузил Sasha Ovcharuk

Пар 2-08 Опуклі функції

реклама
1
Глава 2
Похідна
8. Опуклі функції, класичні нерівності
Нехай P1 x1 , y1  , P2  x 2 , y 2  - дві точки на декартовій площині, відрізком P1 , P2
називається множина точок Px, y  x  tx1  1  t x 2  y  ty1  1  t  y 2 , t  0,1.
Множина M  R 2 називається опуклою, якщо P1 , P2  M  P1 P2  M .
Нехай    x, f  x  x  D f  - графік функції f : R  R , надграфіком
(підграфіком)
цієї
функції
x, y  x  D f  y  f x 
називається
множина
x, y  x  D f
 y  f  x 
При цьому будемо казати, що точка  x, y  лежить вище
(нижче) графіка, якщо вона належить надграфіку (підграфіку) цієї функції.
Функція f : R  R називається опуклою (угнутою), якщо її над графік (під
графік) є опуклою множиною.
Легко з означення опуклої множини зрозуміти, що мова про опуклу (угнуту)
функцію має сенс, якщо вона визначена на зв’язній множині, тобто в якості області
визначення в цьому розділі опуклих функцій ми будемо розглядати лише сегменти,
інтервали та півінтервали, або будь-які промені.
Нагадаємо, що число k M 1 , M 2  
y 2  y1
визначає кутовий коефіцієнтом
x 2  x1
прямої, що проходить через точки M 1  x1 , y1  та M 2  x 2 , y 2  .
(Про три точки)
Нехай на декартовій площині задано три точки M 1  x1 , y1  , M 2  x 2 , y 2  ,
M 3  x3 , y 3  , причому x1  x 2  x3 . Тоді наступні умови еквівалентні:
1) M 2 лежить нижче прямої M 1 M 3 ;
2) k M 1 , M 2   k M 1 , M 3  ;
3) k M 1 , M 2   k M 2 , M 3  ;
4) k M 1 , M 3   k M 2 , M 3  .
Доведення леми.
y
M 2
Розглянемо як на малюнку точки M 1  x1 , y1  ,
M3





M 2  x 2 , y 2  , M 3  x3 , y 3  , тоді  y 2  y 2  
M1
M2
 y 2  y1 y 2  y1 
M 3

  k M 1 , M 2   k M 1 , M 3  і

 x 2  x1 x 2  x1 
x1
O
т.д., аналогічно для інших пар точок.
x
M 1
x2
x3
Лему доведено.
Лема 1.
Рис. 1
2
(Односторонні похідні опуклої функції)
Теорема 1.
f
Нехай функція a, b   R - опукла. Тоді в кожній точці x  a, b  існують
односторонні похідні f   x  та f   x  . Крім того f   x  і f   x  є
неспадними.
Доведення теореми. Нехай x1 , x 2 , x3 - довільні значення, що задовольняють
умові: a  x1  x 2  x3  b . Розглянемо три точки M 1 x1 , f x1  , M 2  x 2 , f  x 2  ,
M 3  x3 , f  x3  . Згідно з означенням опуклої функції M 2 лежить нижче прямої M 1 M 3 .

 x1 , x 2 , x3   a  x1  x 2  x3  b 
За
лемою
1
ми
маємо:
f x3   f x 
f  x 2   f  x1  f  x3   f  x1  f  x3   f  x 2 
 функції x 


, x  a, x3  і
x 2  x1
x3  x1
x3  x 2
x3  x
f x3   f x 
f  x   f  x1 
x
, x   x1 , b  - неспадні. Тому існують f   x3   lim
,
x x 0
x  x1
x3  x
f  x   f  x1 
f   x1   lim
. Внаслідок довільності x1 , x3 ліва та права похідні існують
x x 0
x  x1
f  x 2   f  x1  f  x 3   f  x 2 

в кожній точці a, b . Розглянемо нерівність:
. Зробимо
x 2  x1
x3  x 2
f  x3   f  x1  f  x3   f  x 2 

граничний перехід при x 2  x1  0 f   x1  
. Далі
x3  x1
x3  x 2
робимо граничний перехід при x3  x 2  0 , тоді одержимо f   x1   f   x 2   f  неспадна, аналогічно для f  .
Теорему доведено.
3
1
Наслідок 1. (Неперервність опуклої функції)
f
Кожна опукла функція a, b   R неперервна.
Доведення. З того, що існує ліва похідна в кожній точці слідує, що функція
неперервна зліва, аналогічно – вона неперервна справа. А це і означає неперервність
функції в кожній точці.
Наслідок доведено.
Наслідок 2. Похідна опуклої функції)
f
Якщо a, b   R опукла, то існує не більше як злічена множина E :
df
dx
x  a, b  \ E f  диференційована, а функція a, b  \ E  R неперервна.
Доведення. Розглянемо множини точок E1 , E 2 , в якій розривні ліва та права
похідні. З властивостей монотонних функцій ці множини не більш ніж злічені.
Розглянемо множину E  E1  E 2 , вона також не більш ніж злічена. В усіх інших
точках права та ліва похідні неперервні. Покажемо таким чином, що в цих точках
права та ліва похідні співпадають.
3
Від супротивного. Припустимо, що вони в точці x 0 неперервні та мають різні
значення. Припустимо, що f  ( x0 )      f  ( x0 ) . Без обмежень загальності можемо
f  ( x0 )  0  f  ( x0 ) , а інакше можна розглянути функцію
вважати, що

g ( x)  f ( x) 
x , для якої це має місце, а зайвий доданок не впливає на
2
диференційованість функції f . Тобто, нехай f  ( x0 )  0  f  ( x0 ) . Але внаслідок
стійкості нерівності для неперервної функції знак кожної похідної зберігається в
деякому околі точки x 0 . Виберемо найменший з цих околів J , в якому функції
f  ( x0 ), f  ( x0 ) зберігають знак. Виберемо точки p, q , для яких [ p, q]  J та
x0  ( p, q ) . Але тоді з узагальненої теореми Лагранжа f ( p)  f (q) (для правої
похідної), та f ( p)  f (q) (для лівої похідної). Одержана суперечність доводить
потрібне. Тепер ми бачимо, що вони співпадають в точках неперервності, а тому й
сама похідна співпадає з цими значеннями, а тому також є неперервною в точці x 0 , а
тому й на усій множині (a, b) \ E .
Наслідок доведено.
Теорема 2.
(Критерій опуклості функції)
f
Для того, щоб функція a, b   R була опуклою, необхідно і достатньо,
щоб  x  a, b  існувала похідна f  і щоб ця похідна була неспадною на
a, b функцією.
Доведення теореми. Необхідність безпосередньо слідує з теореми 2.
Для достатності доведемо два допоміжні твердження.
Лема 2.
(Теорема Ферма для лівої похідної)
f
Якщо функція a, b   R набуває найбільшого (найменшого) значення в
точці x 0  a, b  і f   x 0 , то f   x 0   0  f   x 0   0  .
Доведення леми. З того, що x0 - точка найбільшого значення  x  a, x0 
f x   f x0 
f x   f x0 
 0  f   x 0   lim
 0.
x x 0
x  x0
x  x0
Аналогічно для найменшого значення.
Лему доведено.
0
Лема 3.
(Теорема Лагранжа для лівої похідної)
f
a, b R неперервна, має ліву похідну x  a, b. Тоді
f b   f a 
1 ,  2  a, b: f  1  
 f   2  .
ba
f b   f a 

Доведення леми. Покладемо
і розглянемо функцію
Якщо функція
ba
  x   f  x   x , x  a, b.   C a, b  набуває найбільшого та найменшого значення
в деяких точках  1 та  2 . Оскільки  a    b   1 ,  2  a, b (їх можна вибрати на
цьому півінтервалі). Тоді за попередньою лемою   1   0 ,    2   0
f  1     f   2  .
Лему доведено.

4
Нехай M 1  x1 , y1  , M 2  x 2 , y 2  лежать вище графіка функції f , а
M  x, y   M 1 , M 2 . Покажемо, що y  f  x  (що буде означати опуклість функції f ).
f ( x2 )  f x 
За теоремою Лагранжа для лівої похідної: 1   x, x 2  : f  1  
,
x2  x
f  x   f  x1 
 f   2  . Оскільки  2  1 і f  неспадна, то
аналогічно  2   x1 , x  :
x  x1
f  x   f  x1  f  x 2   f  x 

 за лемою про три точки y  f  x  .
x  x1
x2  x
Лему доведено.
Наслідок 1. (Критерій опуклості функції через праву похідну)
f
Для того, щоб функція a, b   R була опуклою, необхідно і достатньо,
f
щоб x  a, b існувала f  x  a, b і щоб ця функція a, b   R була
неспадною.
Наслідок 2. (Критерій опуклості диференційованої функції)
f
Якщо функція a, b   R диференційована на a, b , то вона опукла тоді і
тільки тоді, коли f  є неспадною функцією.
Наслідок 3. (Критерій опуклості двічі диференційованої функції)
f
Якщо функція a, b   R має другу похідну x  a, b , то для опуклой f
необхідно і достатньо, щоб x  a, b f  x   0 .
Теорема 3.
(Ієнсена)
f


Нехай функція a, b   R опукла. Тоді  n  1, x k  a, b ,  k  0, k  1, n
виконується нерівність Ієнсена:
 n
 n
   k x k    k f x k 
  k 1
f  k 1n
(1)
n


 k
  k 
k 1
 k 1

1
2
1  
Доведення теореми. Для n  2 маємо: покладемо  
.
1   2
1   2
Розглянемо точки M 1 x1 , f x1  , M 2  x 2 , f  x 2  . Тоді точка M  x, y  , де
 f  x1    2 f  x 2 
 x   2 x2
x  x1  1   x 2  1 1
y  f  x1   1    f  x 2   1
,
1   2
1   2
належить відрізку
5
M 1 , M 2 ,
тому з означення опуклої функції y  f  x  , тобто
  x   2 x2 
1 f  x1    2 f  x2 
 - доведено для n  2 .
 f  1 1
1   2





1
2
Нехай (1) має місце для n  1 , доведемо з цього його істинність для n .
n 1
Позначимо x 
  k xk
k 1
n 1
 k
. Очевидно, що x  a, b . Використаємо нерівність (1)
k 1
для n  2 ( вона вже доведена).
  n1 
  n1 
 n


   k  x   n xn     k  f x    n f xn 
   k xk 
   k 1 
  f   k 1 
f  k 1n

n

1
n




  k  n 
 k
  xk 
k

1
 k 1

k
1


n 1
 n 1


x



k
k
  k f xk 
n 1
 n 1   k 1



k
  n f  x n     k  1
   k  f n 1
  n f xn 
n 1


 k 1 
k

1


  k 
 k
 k 1

k 1

=

n
n
 k
 k
k 1
k 1
n
  k f xk 
k 1
n
 k
.
k 1
Теорему доведено.
Наслідок.
(Нерівність між середніми)
1 n
 n

Якщо x k  0 , k  1, n , то  x k    x k 
n k 1
 k 1 
1
n
.
1
1
Доведення. Розглянемо на 0,  функцію y   ln x . y    , y   2  0 
x
x
n 1
1
1 n 
  ln   xk     ln xk .
опукла  поклавши в нерівності (1)  k 
n
k 1 n
 n k 1 
1
1 n
 n

 n
 n
1 n 
ln   xk   ln    xk    x k    x k 
n k 1
 n k 1 
 k 1

 k 1 
Наслідок доведено.
Теорема 4.
1
n
.
(Еквівалентний критерій опуклості функції))
f
Функція a, b   R опукла тоді і тільки тоді, коли   0,1
x1 , x 2  a, b  виконується нерівність:
f x1  1   x 2   f  x1   1    f  x 2 
(2)
Необхідність слідує з нерівності Ієнсена, якщо покласти n  2 , 1   ,
2 1  .
6
a  x1  x 2  x3  b .
Тоді
  0,1
x  x2
x  x1
f x1  1   x3   f  x1   1    f x3  . Покладемо   3
, тоді 1    2
,
x3  x1
x3  x1
x  x1
x  x2
x 2  x1  1   x3  f  x2   3
f  x3  
, f  x1   2
x3  x1
x3  x1
f x2   f x1  f x3   f x1 
 f - опукла.

x2  x1
x3  x1
Теорему доведено.
Достатність.
Нехай
З останньої теореми можна дати еквівалентне означення опуклій функції.
f
Функція a, b   R
називається опуклою
 x1 , x 2  a, b  ,   0,1 виконується нерівність

f x1  1   x 2  f x1   1    f  x 2 .

опуклою),
(строго
якщо
f
Функція a, b   R називається угнутою (строго угнутою), якщо функція  f 
опукла (строго опукла).
Теорема 5.
(Лінійність опуклості)
fi
Нехай функції a, b   R , i  1, n опуклі (угнуті), а Ci - довільні додатні
n
числа. Тоді функція f   Ci f i опукла (угнута).
i 1
Якщо при цьому хоч одна з функцій f i строго опукла (угнута), то і f
строго опукла (угнута).
Доведення очевидно проводиться методом математичної індукції.
Теорема 6.
(Нерівність Юнга)
Нехай n  N , y k  0 , p k  0 k  1, n . Якщо
n
 yk
k 1
n
1
p
n 1
 1, то
k
n y pk
k

k 1
(3)
pk
Доведення. f  x   e x , f  x   e x  0  опукла. Покладемо в нерівності Ієнсена:
1
, xk  p k ln y k  e
k 
pk
Теорему доведено.
Теорема 7.
 n
  k k
 k 1
 n
  k
 k 1






n
e
(Нерівність Гельдера)
 ln yk
k 1
n
n
1
  yk   e p
k 1 p k
k 1
k
ln yk
y kp

.
k 1 p k
n
k
1 1
  1. Тоді
p q
p  1,
Нехай
n N ,
a , b
k

k  1, n
k
7
виконується
нерівність:
1
1
p
q
 n
 n
p
q
a
b

a

b
(4)
 k k  k   k 
k 1
 k 1

 k 1

Доведення теореми. Розглянемо нерівність Ієнсена (1) для опуклої функції
ak

q


x  x p  x p  p p  1x p 2  0  , покладаючи  k  bk , x k 
, k  1, n маємо:
q


bk p
n
 
n
  k xk

k 1
n
 a k bk
k 1
n

 k

n
 bk
k 1
n

q
n
  k x k
k 1
n

 k

k 1
n
 bk
k 1
k 1
 ak

q
k 1
1
 n
  
a
 k 
n
 n
  k 1
  b
  a k bk   n
k
k 1
 k 1
  b q
 k 
 k 1

Теорему доведено.




1
 n
  bk
 k 1

 n
p
  ak  bk 
 k 1

Доведення.
1
p
p
n
 ak  bk
k 1
n
  a k  bk
p 1
k 1
p
 n
   ak
 k 1
q



1 1

 n
   ak
 k 1




1
 n
  bk
 k 1
q



1
q
(Нерівність Мінковського)
Нехай p  1 , n  N , тоді  ak , bk k  1, n виконується нерівність:
Наслідок.
 n
   ak
 k 1
q



n
a k   a k  bk
 n
p
   ak 
 k 1

p
  a k  bk
 n
p
   bk 
 k 1

p
1
p
(5)
p 1
a k  bk 
k 1
p 1
 n
 p 1q 
  a k  bk

 k 1

1 1
p 
   1  q 

p
q
p

1


1
n
bk  (до кожної частини – нерівність Гельдера):
k 1
1

1
q
 n
    ak
  k 1

 n
   bk
 k 1
p



1
p
p



1
p

   bk
 k 1
n
 n
 p 1q 
  a k  bk

 k 1

p



1
p
 n
 a  b
k
k
 k
1

1
q

1
p



1
p
 (5)
Наслідок доведено.
f
Якщо функція a, b   R диференційована в точці x 0  a, b  і при переході через
точку M 0  x 0 , f  x 0  змінює характер опуклості, то M 0 називається точкою перегину
графіка функції.
8
Теорема 8.
(Необхідна умова перегину)
f
Нехай функція a, b   R диференційована на a, b , і в точці x 0  a, b 
існує f  x 0  . Якщо M 0  x 0 , f  x 0  - точка перегину графіка  f  , то
f  x 0   0 .
Доведення теореми. З критерію опуклості диференційованої функції   0 : на
x0   , x0  та x0 , x0    f  - монотонна з різним характером монотонності  f 
має в цій точці екстремум, а тому f  x 0   0 .
Теорема доведена.
Теорема 9.
(Достатня умова перегину)
f
Нехай функція a, b   R має n похідних в точці x 0  a, b  і f k   x 0   0 ,
k  2, n  1 , f n   x0   0 . Якщо n - непарне, то M 0  x 0 , f  x 0  - точка
перегину  f  , якщо n - парне, то M 0 не є точкою перегину.
f n   x 0     x 
x  x0 n2 ,  x  0 при x  x0 
n  2!
знак виразу співпадає зі знаком f n   x 0  , а далі зрозуміло, він змінюється, чи ні.
Теорему доведено.
Доведення теореми. f x  
І взагалі, дослідження f на точки перегину рівносильне дослідженню f  на
екстремуми, тому до можливих точок перегину слід віднести і критичні точки f .
Приклад 1.
f x   x 3  x ;
перегин.
Приклад 2.
1 2
f x   x 3 в точці x  0 не існує, але там перегин,
3
 0 при x  0
2 5
оскільки f x    x 3  
.

0
при
x

0
9

f x   3 x ;
f  x   3 x 2  1;
f  x   6 x  f o   0 ,
f o   6  0 -
Скачать