15. Символы o и O, теорема о среднем, формула Тейлора

advertisement
15. Символы
o и O, теорема о среднем, формула
Тейлора
Начнем эту лекцию с того, что введем два часто используемых в анализе
f и g
x → a,
обозначения. Именно: пусть
стремящиеся к нулю при
| две функции переменной
x,
обе
Обозначение 15.1. Если limx→a (f (x)=g (x)) = 0, будем писать: что
f (x) = o(g (x)); если существуют такие C > 0, > 0, что |f (x)| 6
C · |g (x)|, если 0 < |x − a| < , то будем писать, что f (x) = O(g (x)).
g (x) 6= 0 при всех x, достаточ-
(Здесь подразумевается, конечно, что
но близких к
a).
o(g (x)) означает, что
g (говорят еще:
f | бесконечно малая более высокого порядка, чем g )); соотношение
f (x) = O(g (x)) означает: что f стремится к нулю не быстрее, чем g .
Неформально говоря, соотношение
функция
f
f (x)
=
стремится к нулю быстрее, чем функция
У определения 15.1 имеются различные вариации. Например, вместо
x → a
можно предполагать, что
x → ∞.
Можно также считать, что
переменная не непрерывна, а дискретна, заменив функции
последовательности
функции
f
и
g
{fn }
и
{g n }.
{fn }
(или последовательности
бесконечности, а не к нулю.
Пусть, например, 0
при
x → ∞.
f
и
g
на
Можно, наконец, предполагать, что
< m < n. Тогда xn
=
{gn })
и
o(xm ) при x → 0 и xm → xn
f (x)
В силу самого определения ясно, что слова «
смысл только вместе с уточнением «при
обе стремятся к
x → a».
=
o(g (x))»
имеют
Тем не менее на прак-
тике это уточнение всегда опускают, полагая, что из контекста ясно,
что куда стремится.
Для начинающих символы
o
и
O
могут представлять известную
трудность, поскольку их использование представляют собой довольно
серьезную вольность речи (например, одним и тем же символом
o(x)
могут обозначаться совершенно разные функции). Тем не менее такая
символика и удобна, и общепринята, так что давайте к ней привыкать.
Приведем примеры использования символа
o.
Начнем с очень про-
стой, но важной переформулировки.
Предложение 15.2.
Пусть
f : (p; q ) → C | функция и a ∈ (p; q ). Тогда
следующие два условия эквивалентны:
(1)
(2)
f 0 ( a ) = c;
f (x) = f (a) + c(x − a) + o(x − a).
1
(В условии (2), конечно, подразумевается уточнение «при
Доказательство.
(1)
⇒ (2).
x → a».)
Нам надо доказать, что
f (x) − f (a) − c(x − a)
x→a
x−a
lim
:
= 0
Это действительно так, поскольку
f (x) − f (a) − c(x − a)
x→a
x−a
lim
f (x) − f (a)
− c;
x→a
x−a
= lim
(15.1)
и правая часть равна нулю ввиду определения производной.
(2)
⇒ (1).
На сей раз нам дано, что
f (x) − f (a) − c(x − a)
x→a
x−a
lim
= 0;
формула (15.1) показывает, что это соотношение равносильно тому, что
lim
x→a
f (x)−f (a) − c.
x− a
А теперь покажем, как
o-символика
может работать.
f : (p; q ) → R | дифференцируемая функция, и пусть для точки a ∈ (p; q ) имеем f 0 (a) > 0. Тогда существует
такое " > 0, что f (x) > f (a) при a < x < a + " и f (x) < f (a) при
a − " < x < a.
Предложение 15.3.
Пусть
Можно сказать, что это предложение | локальный аналог достаточного признака возрастания функции. Ясно, что аналогичное утверждение верно и для случая
Доказательство.
f 0 (a) < 0.
Положим
f 0 (a) = c > 0. Идея доказательства состоит
в следующем. Ввиду предложения 15.2 имеем
f (x) = f (a) + c(x − a) + o(x − a);
x > a, то f (x) − f (a) = c(x − a) + o(x − a), где первое
слагаемое положительно, так как c > 0, а второе слагаемое, коль скоро
оно стремится к нулю быстрее, чем x − a, будет (при достаточно малом
x − a) много меньше по модулю, чем c(x − a), так что после прибавления этого слагаемого к c(x − a) результат останется положительным.
если теперь, скажем,
Аккуратно эта идея проводится следующим образом. Обозначим «остаточный член»
f (x) − f (a) − c(x − a) через r(x). Поскольку r(x) = o(x − a),
2
< |x − a| < " имеем |r(x)| < 2c |x − a|,
и тем самым знак выражения c(x − a) + r (x) = f (x) − f (a) совпадает
со знаком выражения c(x − a) (если |v | < |u|, то знаки чисел u и u + v
совпадают). Стало быть, если a < x < a + ", то знак f (x) − f (a) совпадает со знаком c(x − a) и тем самым положителен: а если a − " < x < a,
то знак f (x) − f (a) опять же совпадает со знаком c(x − a) и тем самым
существует такое
" > 0,
что при 0
отрицателен.
Из доказанного предложения немедленно вытекает«теорема Ферма»
(необходимое условие экстремума). Более того, из этого же предложения нетрудно получить доказательство достаточного условия возрастания (предложение 13.14), не опирающееся на теорему Лагранжа: если
f0 > 0
f (v ) > f (u), если v > u и v
близко к u, а переход к случаю, когда v далеко от u, делается с помощью
всюду, то из предложения видно, что
той же техники, что в нашем доказательств теоремы о промежуточном
значении.
Наша следующая тема | теорема о среднем, являющаяся естественным обобщением теорем Ролля и Лагранжа из предыдущей лекции.
Естественнее всего формулировать и понимать ее геометрически.
Напомним (см. предыдущую лекцию), что
вой
параметризованной кри-
(мы будем иногда говорить просто «кривой») на плоскости называ-
ется непрерывное отображение
: [a; b] → R2 ;
(непрерывность
функции
1
и
2
означает,
что
t 7→ (1 (t); 2 (t))
функции
1
и
2
непрерывны).
Если
a b),
к тому же дифференцируемы на интервале ( ;
бу-
| гладкая параметризованная кривая. Если в этой
c ∈ (a; b), то вектор 0 (c) = (10 (c); 20 (c)) будем называть
вектором скорости в точке c (или «в момент c»: параметр c полезно
представлять себе как время, а отображение | как описание движе-
дем говорить, что
ситуации
ния материальной точки по плоскости). Стоит иметь в виду, что если
: [a; b] → R2
| гладкая кривая, то образ
([a; b])
может не во всех
точках выглядеть как гладкая кривая: на нем могут быть «точки самопересечения», «точки заострения», «изломы» и прочее | см. рис. 1.
Пусть [a; b] ⊂ R | отрезок и
; 2 ) : [a; b] → R | отображение, непрерывное на [a; b] и дифференцируемое на (a; b). Предположим также, что (a) 6= (b). Тогда существует такая точка c ∈ (a; b), что вектор скорости 0 (c) =
0
0
(1 (c); 2 (c)) коллинеарен вектору (a); (b).
Теорема 15.4 (Теорема о среднем).
= ( 1
3
B
A
Рис. 1. Кривая и касательный вектор
(Напомним, что нулевой вектор коллинеарен любому.)
Доказательство.
Для всякого
' ∈ R
обозначим через
':
x
cos '
− sin '
x
R' :
7→
:
y
sin' cos '
y
R' : R2 → R2
поворот плоскости на угол
Поскольку
R'
| линейное отображение, оно коммутирует с взятием
R' ◦ в момент t получается
момент t поворотом на угол '. Вот
производной: вектор скорости кривой
из вектора скорости кривой
в
формальная выкладка:
'1 (t) − sin '2 (t))0 ; (sin '1 (t) + cos '2 (t))0 ) =
0 cos '
− sin '
1 (t)
0
0
0
0
= (cos '1 (t)−sin '2 (t); sin '1 (t)+cos '2 (t)) =
:
sin '
cos '
20 (t)
((cos
R' (a); R' (b) также получается из вектора (a); (b) поворотом на угол ', а коллинеарность векто-
Поскольку при этом, разумеется, вектор
ров при повороте сохраняется, утверждение теоремы верно для кривой
R' ◦ . Выберем
R' ( (a); R' ( (b)))] будет горизонтаR' ◦ = (1 ; 2 ), то 2 (a) = 2 (b), то есть
тогда и только тогда, когда оно верно для кривой
теперь
',
для которого отрезок [
лен. Это означает, что если
2 : [a; b] → R удовлетворяет условиям теоремы Ролля. Значит,
c ∈ (a; b) имеем 20 (c) = 0; это означает, что касательвектор к кривой R' ◦ в момент c также горизонтален, то есть
функция
для некоторого
ный
коллинеарен вектору, соединяющего концы кривой. Ввиду сказанного
4
выше из этого следует, что и касательный вектор к исходной кривой в
момент
c
будет коллинеарен вектору
Пусть функции
Следствие 15.5 (теорема Коши).
прерывны на
0 (t)
a b]
[ ;
(a); (b).
и дифференцируемы на
a b),
( ;
';
6= 0 для всех t ∈ (a; b). Тогда существует такое
'0 (c)
0 ( c)
Доказательство.
=
a b] → R не(a) 6=
(b) и
c ∈ (a; b), что
: [ ;
причем
'(b) − '(a)
:
(b) −
(a)
Примените теорему 15.4 к кривой
t 7→
(
t ; '(t)).
( )
Наша следующая тема | формула Тейлора; для формулировки и
доказательства основных результатов нам понадобится терминология
и обозначения, относящиеся к высшим производным. С этого и начнем.
Пусть
f : (p; q ) → R
(или в
C
| это все равно) | дифференцируе-
мая функция; тогда можно рассмотреть функцию
эта функция также дифференцируема, то говорят,
жды дифференцируема
p q );
на интервале ( ;
f 00 (c)
f 0 : (p; q ) → R;
что функция f
производная функции
если
два-
f0
в
c ∈ (a; b) обозначается
и называется второй производной
функции f в точке c. Если f дважды дифференцируема, то можно рас00
смотреть ее вторую производную как функцию f : (p; q ) → R на (a; b);
00 также дифференцируема, то говорят, что f трижды
если функция f
точке
дифференцируема, и т.д. При этом если вторую и третью производную
обычно обозначают с помощью двух и трех штрихов, то в общем случае
k -ю
производную функции
f
обозначают
Определение 15.6. Если функция
a b)
ференцируемой на интервале ( ;
f (k) .
f : (a; b) → C
является
и при этом функция
непрерывна, то говорят, что функция
f
fk
( )
k
раз диф-
a b) → C
C k на ин-
: ( ;
принадлежит классу
a b). Множество всех функций класса C k на (a; b) обозначается
k при всех k ∈ N, то гоЕсли функция принадлежит классу C
∞
ворят, что функция f принадлежит классу C
; это равносильно тому,
тервале ( ;
C k (a; b).
что она бесконечно дифференцируема.
Понятие «функция класса
C k » является более ограничительным, чем
«бесконечно дифференцируемая функция», но оно является более «правильным» | в первую очередь потому, что с ним удобнее работать.
Теперь, переходя непосредственно к формуле Тейлора, рассмотрим
такую задачу. Пусть
f
| функция (скажем, бесконечно дифференци-
5
руемая); предположим, что мы хотим представить ее в виде суммы степенного ряда
f (x) = c0 + c1 (x − a) + c2 (x − a)2 + : : : + cn (x − a)n + : : : ;
сходящегося в некоторой окрестности точки
кими при этом должны быть коэффициенты
c0 :
Проще всего с коэффициентом
ства (15.2) значение
x = a,
a.
ci .
(15.2)
Давайте прикинем, ка-
подставим в обе части равен-
тогда все слагаемые в правой части, кроме
первого, обратятся в нуль, и получим, что
c0
=
f (a).
Чтобы найти
c1 ,
продифференцируем обе части (15.2):
f 0 (x) = c1 + 2c2 (x − a) + 3c3 (x − a)2 + : : : + ncn (x − a)n + : : :
(вообще-то степенной ряд | это не конечная сумма, и законность такого дифференцирования надо обосновывать; поскольку наше рассуждение не строгое, а прикидочное, мы эту трудность проигнорируем). Если
теперь подставить в обе части
x
=
a,
то в правой части обратятся в
f 0 (a).
произвольного k .
нуль все слагаемые кроме первого, откуда
Теперь ясно, как найти
k
ck
для
c1
=
Именно, давайте
раз продифференцируем обе части равенства (15.2) (правую часть
опять будем дифференцировать почленно, не задумываясь о законности
этой операции). Легко видеть, что
k -я
производная от (
x − a)n
равна
n(n − 1) : : : (n − k + 1)(x − a)n−k
n < k ). Поэтому в
k -кратного дифференцирования равенства (15.2) получится
(в частности, она тождественно равна нулю при
результате
вот что:
f (k) (x) = k !ck +(k +1)k : : : 2ck+1 (x−a)+: : :+n(n−1) : : : (n−k +1)(x−a)n−k +: : :
Подставляя теперь
x = a,
получаем, что
ck
=
f (k) (a) = k !ck ,
f (k) (a)=k !;
откуда
(15.3)
k = 0, если считать, что нулевая производная от функции f | это сама f , а 0! = 1.
P∞
n
Ряд
n=0 cn (x − a) ,где коэффициенты ck задаются формулой (15.2),
называется рядом Тейлора функции f (в точке a).
эта формула годится и при
Теперь обсудим, как все эти неформальные прикидки связаны с реальностью. Оказывается, что почленное дифференцирование степенного ряда (правой части равенства (15.2)) действительно законно внутри
6
его круга сходимости (мы это докажем в дальнейшем); беда в том, что
f
даже для бесконечно дифференцируемой функции
ее ряд Тейлора не
обязан к ней сходиться нигде (кроме, конечно, самой точки
a).
Макси-
мум, чего можно гарантировать для произвольной бесконечно дифференцируемой функции | не разложение (15.2), а некоторый его суррогат, называемый формулой Тейлора. Подчеркнем, что этот «суррогат»
на самом деле чрезвычайно важен.
Теорема 15.7.
a ∈ (p; q ).
Пусть
f : (p; q ) → R
и пусть
Тогда
f (x) = f (a) + f 0 (a)(x − a) +
Доказательство.
f 00 (a)
2!
(
r
f (n) (a)
n
n
(x − a) + o((x − a) ):
n!
x − a)2 + : : : +
Положим
r(x) = f (x) − f (a) − f 0 (a)(x − a) −
Ясно, что
C n,
| функция класса
f 00 (a)
2!
| также функция класса
что
(
x − a)2 − : : : −
Ck
f (n) (a)
n
(x − a) :
n!
p q ),
на интервале ( ;
а также
r(a) = r0 (a) = : : : = r(n) (a) = 0:
Пусть
теперь
x ∈
p q );
( ;
применим
теперь
a
ствие 15.5) к отрезку, соединяющему
и
x,
«теорему
положив
(
Коши»
x)
= (
(след-
x − a)r
и
'(x) = r(x); согласно этой теореме, для некоторого 1 , лежащего между
a и x, имеем
r 0 (1 )
n(1 − a)n−1
=
(
r(x) − r(a)
x − a)n − (a − a)n
=
(
r(x)
:
x − a)n
a и 1 и функциям
x 7→ n(x − a)n−1 и x 7→ r0 (x), получаем, что для некоторого 2 , лежащего
между a и 1 , имеем
Применяя теорему Коши к отрезку, соединяющему
r00 (2 )
n(n − 1)(2 − a)n−2
=
r 0 ( 1 )
n(1 − a)n−1
=
r(x)
n:
(x − a)
n ,
n
= r
(n )=n!. Мы доказали следующую
Продолжая в том же духе, получим, что существует такое число
лежащее между
x и a, что
r(x)
(x−a)n
( )
лемму.
Лемма 15.8.
число
,
В условиях теоремы, если
лежащее между
a
и
x,
x ∈ (p; q ),
для которого
r(x)
n
(x − a)
=
7
r(n) ( )
:
n!
то существует
Теперь можно завершить доказательство следующим образом. Нам
n
x→a r(x)=(x − a) = 0. Пусть {xk } |
последовательность (отличных от a) чисел, сходящаяся к a; достаточно
n = 0. Ввиду леммы для всякого
установить, что limn→∞ r (xk )=(xk − a)
n существует n , лежащее между a и xn , для которого r(xk )=(xk − a)n =
r(n) (k )n!. По теореме о двух милиционерах имеем lim k = a; поскольку
(k )
k
функция r
непрерывна (так как r ∈ C (p; q )), имеем
необходимо установить, что lim
lim
n→∞
r(n) (k ) = r(n) (a) = 0:
Все доказано.
8
Download