Лекции по физике 3 семестр

реклама
Министерство образования и науки Российской Федерации
Южно-Российский государственный технический университет
(Новочеркасский политехнический институт)
Волгодонский институт ЮРГТУ
Л.С.Лунин, А.В. Благин,
А.А. Баранник, П.И. Разумовский
ЛЕКЦИИ ПО ФИЗИКЕ
Часть III
Оптика и строение вещества
Новочеркасск 2007
УДК 530.1 (075.8)
ББК 22.3
Л
Рецензенты:
д-р физ.-мат.наук, проф. В.Н. Лозовский,
к.ф.-м.н., доц. Т.А. Аскарян
Лунин Л.С., Благин А.В., Баранник А.А., Разумовский П.И.
Л
Лекции по физике. Ч.3. Оптика и строение вещества/Волгодонский
институт ЮРГТУ(НПИ). Новочеркасск: ЮРГТУ, 2007. 272 с.
Физика является теоретической основой всех технических дисциплин и,
наряду с математикой, базой инженерного образования. Лекции составлены с
учетом требований государственных образовательных стандартов для
технических специальностей высших учебных заведений, изучающих общую
физику в течение четырех семестров.
Материал рассчитан на студентов, приступающих к изучению курса
общей физики (34 часа лекций в семестр).
© Волгодонский институт ЮРГТУ, 2007
© Лунин Л.С., Благин А.В., Баранник А.А.,
Разумовский П.И. 2007
2
ОГЛАВЛЕНИЕ
стр.
ПРЕДИСЛОВИЕ……………………………………………….................. 6
Лекция 1.
Волны………………………………………………............
7
1. Общая характеристика волновых процессов. Продольные и
поперечные волны. Фазовая скорость. Уравнение волны.
2. Принцип суперпозиции волн. Групповая скорость.
3. Интерференция волн. Стоячая волна.
4. Эффект Доплера в акустике.
Лекция 2.
Электромагнитные волны (ЭМВ) ……………………
16
1. Свойства ЭМВ (по шкале). Энергия ЭМВ.
2. Отражение и преломление ЭМВ на границе двух
диэлектрических сред. Формулы Френеля.
3. Эффект Доплера для ЭМВ.
Лекция 3.
Геометрическая оптика…………………………………
24
1. Геометрическая оптика и ее законы.
2. Линзы и зеркала.
3. Система линз как основа оптических приборов.
Лекция 4.
Интерференция как волновое свойство света………
38
1. Монохроматичность. Временная и пространственная
когерентность. Интерференция света.
2. Опыт Т.Юнга. Кольца И.Ньютона.
3. Интерференция света в тонких пленках. Интерференция
многих волн.
Лекция 5.
Дифракция света…………………………………………
45
1. Понятие дифракции. Принцип Гюйгенса-Френеля.
2. Дифракция Френеля на круглом отверстии. Метод зон Френеля.
3. Дифракция Фраунгофера на щелях. Дифракция рентгеновских
лучей на пространственной (кристаллической) решетке. Формула
Вульфа-Брэггов. Понятие о рентгеноструктурном анализе.
4. Понятие о голографии.
Лекция 6.
Взаимодействие света с веществом……………………
51
1. Взаимодействие света с веществом (поглощение, рассеяние,
дисперсия, поляризация).
2. Дисперсия света. Классическая теория дисперсии света.
3. Поляризация света. Оптическая анизотропия. Закон Брюстера.
Двойное лучепреломление. Закон Малюса. Вращение плоскости
поляризации.
4. Излучение Черенкова (Вавилова-Черенкова).
Лекция 7.
Тепловое излучение………………………………………
57
1. Тепловое излучение и его характеристики. Отличие от
люминесцентного излучения. Люминесценция, ее виды.
2. Законы Кирхгофа, Стефана-Больцмана и Вина. “Ультрафиолетовая катастрофа”. Квантовая гипотеза и формула Планка.
3. Оптическая пирометрия.
Лекция 8.
Основы квантовой оптики………………………………
1. Внешний фотоэффект и его законы. Фотоумножители. Понятие
внутреннего фотоэффекта. Фотоэлементы, их применение.
2. Корпускулярно-волновая двойственность свойств света. Масса
и импульс фотона. Давление света. Давление света в опытах
3
62
П.Н.Лебедева.
3. Эффект А.Комптона.
Лекция 9.
Элементы квантовой механики – I……………………
70
1. Волновые свойства вещества. Гипотеза де-Бройля.
2. Экспериментальное подтверждение гипотезы де-Бройля
(опыты
Дэвиссона–Джермера,
Тартаковского,
Томсона,
Фабриканта).
3. Волновые свойства микрочастиц. Принцип неопределенности
Гейзенберга.
4. Уравнение Шредингера. Волновая функция и физический
смысл квадрата ее модуля.
5. Вычислительный аппарат квантовой механики. Операторы.
6. Парадоксы квантовой механики. Многомировая интерпретация
квантовой механики Х.Эверетта.
Лекция 10.
Элементы квантовой механики – II (простейшие
задачи квантовой механики)……………………………
93
1. Решение уравнения Шредингера для свободной частицы.
2. Виды потенциальных ям. Частица в бесконечно глубокой
одномерной потенциальной яме.
3. Потенциальный барьер. Туннельный эффект.
4. Линейный гармонический осциллятор.
Лекция 11.
Квантово-размерные структуры. Физические
основы нанотехнологии в электронике………………
116
1. Основные направления развития, проблемы и перспективы
нанотехнологии.
2. Инструменты нанотехнологии.
3. Квантово-размерные структуры: квантовые ямы, нити, точки.
4. Наногетероструктуры в России.
Лекция 12.
Атома
водорода
в
квантовой
механике.
Периодическая таблица атомов Д.И.Менделеева…… 146
1. Модель атома Томпсона. Спектр атома водорода. Опыты по
рассеянию α-частиц. Планетарная модель атома Резерфорда.
Постулаты Бора и его полуклассическая теория. Опыты Франка и
Герца.
2. Атом водорода в квантовой механике.
3. Квантовые числа как результат решения уравнения
Э.Шредингера и уравнения П.Дирака. Правила отбора.
4. Принцип Паули. Периодическая система элементов
Д.И.Менделеева
Лекция 13.
Строение вещества……………………………………….
160
1. Химические связи, строение молекул.
2. Энергетические уровни в молекулах. Молекулярные спектры.
Комбинационное рассеяние света.
3. Рентгеновское излучение. Тормозной и характеристический
рентгеновские спектры. Закон Мозли.
Лекция 14.
Элементы физики твердого тела – I…………………… 165
1. Вырожденные и невырожденные коллективы частиц. Фазовое
пространство и его квантование. Химический потенциал.
Понятие о квантовых статистиках. Функции распределения
Максвелла-Больцмана, Бозе-Эйнштейна и Ферми-Дирака.
4
2. Применение квантовых статистик к описанию системы частиц.
Химпотенциал. Бозе-конденсация. Энергия Ферми.
3. Применение методов статистической физики к равновесному
(тепловому) излучению.
Лекция 15.
Элементы физики твердого тела – II…………………..
178
1. Теплоемкость твердых тел. Электронный газ в металлах.
Понятие о квантовой теории электро- и теплопроводности
металлов. Явление сверхпроводимости.
2. Решение уравнения Э.Шредингера для твердого тела. Понятие
о зонной теории твердых тел. Металлы, полупроводники и
диэлектрики. Их электрические свойства.
Лекция 16.
Полупроводники, их свойства и применение………… 191
1. Собственная и примесная проводимость полупроводников.
Эффект Ганна.
2. Контактные явления в металлах и полупроводниках. ВАХ p–nперехода. Барьерная и диффузионная емкость p-n-перехода.
Диффузионные, частотные и импульсные свойства p–n-перехода
и его пробой. Полупроводниковые диоды, диоды Шоттки.
Лекция 17.
3. Люминесценция твердых тел. Оптические и
фотоэлектрические явления в полупроводниках.
4. Эффект Зеебека, эффект Пельтье.
Оптические свойства вещества………………………… 205
1. Отрицательное поглощение света и оптические квантовые
генераторы или лазеры (LASER – Light Amplification by
Stimulated Emission of Radiation). Виды лазеров: газовые,
жидкостные, твердотельные (рубиновые, полупроводниковые,
т.д.).
2. Жидкие кристаллы и их свойства.
Лекция 18.
Элементы физики ядра…………………………………..
215
1. Модели строения и основные свойства ядер. Энергия связи,
дефект массы. Ядерные силы. Масс-спектрометры и определение
масс ядер.
2. Явление радиоактивности. Альфа- и бета-распад. Гаммаизлучение. Эффект Мёссбауэра.
3. Детекторы излучений, биологическое действие излучений и
защита от излучений.
4. Ядерные реакции деления и термоядерные реакции (реакции
синтеза).
Лекция 19.
Элементы физики элементарных частиц....................... 235
1. Классификация элементарных частиц. Кварковая гипотеза.
Типы взаимодействия элементарных частиц. Космическое
излучение.
2. Виды ускорителей частиц.
Лекция 20.
Физическая картина мира. Физика – фундамент
инженерной практики…………………………………… 242
1. Представления современной физики об эволюции Вселенной.
2. Наш трехмерный мир. Многомерное пространство.
Суперструны.
3. Уроки физики.
ЗАКЛЮЧЕНИЕ……………………………………………….................... 270
5
ПРЕДИСЛОВИЕ
Настоящее пособие предназначено, в первую очередь, для студентов
инженерно-технических специальностей; может быть полезным для всех
категорий студентов, изучающих в том или ином объеме физику. Оно
представляет собой курс лекций в 3 частях, соответствующих трем
семестрам курса физики, предусмотренных унифицированным учебным
планом, по которому студенты специальностей "Микроэлектроника и
твердотельная электроника", "Автоматизация технологических процессов",
“Инженерная защита окружающей среды”, "Электрические станции",
"Информационные системы и технологии", "Технология сварочного
производства" обучаются с 2002/03 учебного года. Пособие может быть
использовано студентами также для самостоятельного изучения
соответствующего материала, является базой для подготовки к семестровым
экзаменам по физике. Кроме того, книга должна помочь студенту и в тех
случаях, когда он что-то не успел записать на лекции, какие-то лекции были
пропущены, в чем-то трудно разобраться по другим учебникам.
Третья часть содержит изложение основ оптики и строения
вещества – квантовой физики атомов, молекул, а также элементы
ядерной физики и физики элементарных частиц и адресована
второкурсникам. Набор освещаемых вопросов хорошо виден из оглавления.
Особое внимание в книге уделено изложению традиционно
сложных для усвоения физических понятий, идей и теорий – таких, как
волновая оптика, основы квантовой механики, элементы физики
твердого тела. Лекция № 11 посвящена
физическим основам
нанотехнологий.
Впервые в учебной литературе подробно излагается многомировая
интерпретация квантовой механики Х.Эверетта и – в рамках вузовского
курса общей физики - фундаментальные идеи теоретической физики,
хотя и на полукачественном уровне.
Достаточно
подробно
освещаются
вопросы,
помогающие
осмысленному выполнению заданий лабораторного практикума по оптике и
строению вещества.
Авторы выражают надежду, что данное пособие
будет способствовать более глубокому изучению студентами курса физики и
решит проблему основательного методического обеспечения студентов
младших курсов.
6
Лекция 1. Волны
1. Общая характеристика волновых процессов. Продольные и
поперечные волны. Фазовая скорость. Уравнение волны.
2. Принцип суперпозиции волн. Групповая скорость.
3. Интерференция волн. Стоячая волна.
4. Эффект Доплера в акустике.
1.1. Общая характеристика волновых процессов. Продольные и
поперечные волны. Фазовая скорость. Уравнение волны
При рассмотрении причин затухания колебаний в колебательных
системах ранее мы считали, что это происходит в результате действия сил
сопротивления. Однако, строго говоря, взаимодействие системы со средой не
сводится лишь к потерям энергии под действием сил трения (сопротивления),
так как это вызывало бы лишь нагревание среды. В действительности среда
не только нагревается, но и приходит в движение, совершая вынужденные
колебания. Например, при разговоре мы слышим речь, звуковые колебания,
передаваемые воздушной газовой средой.
Среда (тело) называется упругой, а ее деформации упругими, если при
снятии внешнего воздействия среда возвращается в исходное состояние
(остаточных деформаций нет, см. закон Гука, часть I настоящего пособия). В
первом приближении все среды за исключением разреженных газов можно
считать упругими. Распространение упругих деформаций в среде
называется волной. Волна, в отличие от колебаний, характеризуется
периодичностью не только во времени, но и в пространстве.
Волны называются продольными, если колебания (возмущения) в них
совершаются в направлении распространения колебаний (вдоль направления
распространения волны). Такие волны характерны для газов, но могут
возникать и в более плотных средах, например, жидкостях, причем, чем
выше плотность среды, тем больше скорость распространения колебаний в
ней – больше скорость волны.
Волны называются поперечными, если колебания в них совершаются в
плоскости, перпендикулярной направлению распространения волны. Такие
волны наблюдаются в колеблющихся струнах музыкальных инструментов.
В твердых телах (ТТ) могут наблюдаться и те, и другие волны. Особый
случай – волны на поверхности жидкости: в этом случае имеет место
сложение взаимноперпендикулярных колебаний, в результате точки среды
колеблются по сложной, например, эллиптической траектории (см. Фигуры
Лиссажу, часть II настоящего пособия).
Дадим ряд определений понятий, которыми будем широко пользоваться
в дальнейшем.
Уравнением волны называют закон, по которому определяются
значения какой-либо физической характеристики колебаний в любой момент
времени на любом расстоянии от источников возбуждения колебаний.
7
Волна называется гармонической, если колебания в ней происходят по
гармоническому закону.
Распространение волны в однородной изотропной непоглощающей
среде описывается дифференциальным уравнением в частных производных –
волновым уравнением
2
∇ s−
1 ∂2s
2
v ∂t
2
= 0,
(1.1)
2
где v – фазовая скорость волны (см. ниже), ∇ s = ∆s =
∂2s
∂x 2
+
∂2s
∂y 2
+
∂2s
∂z 2
–
оператор Лапласа (оператор Гамильтона в квадрате).
Если волна распространяется в среде со скоростью v и колебания в ней
осуществляются по какому-либо закону, то любая частица среды,
находящаяся на расстоянии х от источника, будет совершать колебания
согласно такому же закону спустя время τ = x / v , называемое временем
запаздывания. Считая волну одномерной, можно подстановкой показать,
что решением уравнения (1.1) является функция, сходная по виду с
выражением, описывающим рассмотренные ранее гармонические колебания
(см. Колебания, часть II настоящего пособия)
s ( x, t ) = A sin(ωt − ω
или
s ( x, t ) = A cos(ωt − ω
Отличие
заключается
в
Φ (t ) = ωt − ωx / v + ϕ 0 = ωt − ωτ
x
+ ϕ0 )
v
(1.2)
x
+ ϕ0 ) .
v
(1.2/)
появлении
в
выражении
фазы
+ ϕ0
слагаемого
с
временем
запаздывания τ .
Если волновой процесс сопровождается переносом энергии, то волна
называется бегущей, в противном случае – стоячей.
Лучом волны называют прямую, в каждой точке пространства
совпадающую с направлением распространения волны.
y
x
Рис. 1.1
8
Волновой поверхностью называется геометрическое место точек, в
которых колебания совпадают по фазе. Переднюю из волновых поверхностей
называют волновым фронтом. Волна называется плоской, если в любой
момент времени волновые поверхности перпендикулярны лучам волны и,
следовательно, параллельны друг другу (рис. 1.1).
Длиной волны λ называют путь, который проходит возмущение
(волна) за период колебаний Т: λ = vT .
→
Волновым вектором называется вектор k , совпадающий по
направлению с лучом волны и по модулю равный волновому числу
k = 2π / λ . Волновое число показывает, сколько длин волн λ укладывается
на отрезке 2π ; размерность [k]=м-1. С учетом сказанного формулу (1.2)
можно переписать в виде
s ( x, t ) = A sin(ωt − kx + ϕ 0 ) .
(1.3)
Иногда решение уравнения волны (1.2) или (1.2/) записывают в виде,
удобном для дифференцирования, при этом физический смысл имеет лишь
~
действительная часть выражения (Re s )
~
s = Ae i (ωt −kx +ϕ1 ) ,
(1.4)
где ϕ1 = ϕ 0 − π / 2 . Формула (1.4) получается с использованием известной в
математике формулы Эйлера
e iΦ = cos Φ + i sin Φ .
Фазовой скоростью волны v называют скорость перемещения точек
пространства, в которых фаза постоянна Φ (t ) = ωt − kx + ϕ 0 = const ,
отсюда kx = ωt + ϕ 0 и
v = dx / dt = ω / k .
(1.5)
Фазовая скорость – это скорость «перемещения фазы», а не материальных
частиц, в общем случае она может быть больше скорости света с. Согласно
другому определению, фазовая скорость – скорость распространения
синусоидальной волны, так как она равна скорости перемещения в
пространстве точек поверхности, соответствующей любому фиксированному
значению фазы синусоидальной волны.
Понятие энергии волны трактуется неоднозначно. Под энергией волны
будем понимать сумму кинетической энергии колеблющихся частиц и
потенциальной энергии деформации среды. Если vч – скорость колебаний
частиц среды плотностью ρ , v – фазовая скорость волны, а ε –
9
относительная деформация среды, то объемная плотность энергии упругих
волн в данной (упругой) среде
w = wкинет + wпотенц =
(
)
dWкинет dWпотенц 1
+
= ρ v ч2 + v 2ε 2 . (1.6)
dV
2
dV
Если в среде распространяется плоская продольная волна и s – смещение
частиц, то v ч = ∂s / ∂t , v = ∂x / ∂t , ε = −∂s / ∂x = − v ч / v .
Скоростью переноса волной энергии называется скорость перемещения в
пространстве поверхности, соответствующей максимальному значению
объемной плотности энергии. Для синусоидальных волн эта скорость равна
их фазовой скорости.
Вектор плотности потока энергии называется вектором Умова (Умова–
Пойнтинга)
→
U=
→
w v1,
(1.7)
где v1 – скорость переноса энергии волной. Вектор Умова направлен в
сторону переноса энергии волной, а по модулю равен отношению потока
энергии dΦ w сквозь малую площадку dS к площади проекции этой
площадки dS ⊥ на плоскость, перпендикулярную направлению переноса
энергии (рис. 1.2)
U=
dΦ w
.
dS ⊥
(1.8)
→ →
dW = wdV = wv1dtdS cos α = w v1 dS dt
и
Так
как


 → →  → → 
dΦ w = w v1 dS  = U dS  , то поток энергии через поверхность S равен

 

потоку вектора Умова через эту поверхность
→ →
Φ w = ∫ U dS .
S
dS=dSn dS
dS
v1dt
Рис. 1.2
10
n
α
v1
(1.9)
Скалярная величина, равная модулю среднего значения вектора Умова,
называется интенсивностью волны I = < U > . Интенсивность и
амплитуда плоской волны не изменяются, если не происходит поглощения в
среде.
1.2. Принцип суперпозиции волн. Групповая скорость
Принцип суперпозиции (наложения) волн применяется только для
линейных сред, т.е. сред, в которых скорость волны не зависит от ее
интенсивности: при распространении в линейной среде одновременно
нескольких волн каждая из них распространяется так, как будто другие
волны отсутствуют, а результирующее смещение частицы в среде равно
геометрической (векторной) сумме смещений, которые получает частица,
участвуя в каждом из слагающих волновых процессов.
Исходя из принципа суперпозиции любая волна может быть
представлена в виде суммы волн. Например, при разложении в ряд Фурье
любая, даже несинусоидальная, волна может быть представлена в виде
суммы гармонических волн с различными амплитудами и частотами или
гармоник, т.е. в виде волнового пакета или группы волн. Совокупность
частот волнового пакета называется спектром частот или просто спектром.
Требование линейности среды обусловлено тем, что сигнал при
перемещении в ней не изменяет своей формы, так как все синусоидальные
или косинусоидальные (гармонические) волны, образующие данный
волновой пакет, имеют одинаковые фазовые скорости, равные скорости
сигнала.
Простейший пример применения принципа наложения волн – получение
группы волн при наложении двух плоских косинусоидальных волн,
распространяющихся вдоль оси Ох и имеющих близкие частоты и волновые
числа (рис. 1.3, вспомним биения, см. Колебания, часть II настоящего
пособия)
s = s1 + s 2 = A0 cos(ωt − kx ) + A0 cos([ω − dω ]t − [k − dk ]x ) =
 dωt − xdk 
= 2 A0 cos
 cos(ωt − kx ) = A cos(ωt − kx ).
2


(1.10)
s
x
Рис. 1.3
11
За скорость распространения этой квазикосинусоидальной волны
принимают скорость перемещения точки, в которой амплитуда А имеет
какое-либо фиксированное значение, например, А=0 или А=2А0, т.е. эта точка
движется по закону tdω − xdk = const , откуда
u=
dx dω
=
dt dk
(1.11)
– групповая скорость, равная скорости переноса энергии (энергия ~ A2)
волновым пакетом или группой волн.
Связь между групповой и фазовой скоростью можно определить,
подставляя в формулу (1.11) из формулы (1.5) dω = vk с учетом равенств
k = 2π / λ и dk = −2πdλ / λ2 :
u=
dv
dv
dω d ( vk )
2π dv
.
=
= v+k
= v+
= v−λ
λ − 2πdλ
dk
dλ
dk
dk
2
(1.12)
λ
Т.е. фазовая и групповая скорость совпадают для недиспергирующих сред,
где скорость v не зависит от длины волны λ (и, следовательно, частоты v):
v ≠ f (λ , v ) .
1.3. Интерференция волн. Стоячая волна
Когерентными называются волны, которые согласованно протекают во
времени и пространстве, у которых разность фаз не изменяется с течением
времени. Это возможно только в случае одинаковых частот и волновых чисел
волн: (ω2t − k 2 x + ϕ 2 ) − (ω1t − k1 x + ϕ1 ) = const , ω2 = ω1 , k 2 = k1 .
При наложении в пространстве двух или более когерентных волн в
разных точках среды наблюдается усиление или ослабление возмущения в
зависимости от разности фаз накладывающихся волн – интерференция
волн. Если рассмотреть случай наложения двух сферических волн вида
s1 = A1 sin(ωt − kr1 + ϕ1 ) = A1 sin Φ1 ,
s2 = A2 sin(ωt − kr2 + ϕ 2 ) = A2 sin Φ 2 ,
(ri – расстояние от i-го источника возмущения до рассматриваемой точки
среды) то, вспомнив метод вращающихся векторов или векторных диаграмм
при сложении сонаправленных колебаний (см. Колебания, часть II
настоящего пособия, формулы (14.20), (14.21)), можно получить
s = s1 + s2 = A sin Φ ,
12
где
A2 = A12 + A22 + 2 A1 A2 cos(Φ 2 − Φ1 ) ,
A sin Φ1 + A2 sin Φ 2
.
tgΦ = 1
A1 cos Φ1 + A2 cos Φ 2
(1.13)
(1.14)
В зависимости от значения разности фаз под знаком косинуса формула
(1.13) принимает вид либо квадрата суммы, либо квадрата разности, что для
амплитуды результирующего возмущения в данной точке среды означает
либо A = A2 + A1 (max), либо A = A2 − A1 (min):
Φ 2 − Φ1 = −k (r2 − r1 ) + (ϕ 2 − ϕ1 ) .
123
(1.15)
=∆
С учетом выражения (1.15) формула (1.13) примет вид
A2 = A12 + A22 + 2 A1 A2 cos[k∆ − (ϕ 2 − ϕ1 )].
Если k∆ − (ϕ 2 − ϕ1 ) = ±2πm , m ∈ z ( A = A2 + A1 – max), то с учетом
k = 2π / λ можно записать условие интерференционного максимума в
виде
∆ = ± mλ +
ϕ 2 − ϕ1
λ.
2π
(1.16)
Часто условие (1.16) при равенстве начальных фаз ϕ 2 = ϕ1 записывают как
∆ = ± mλ .
(1.17)
По аналогии условие интерференционного минимума ( A = A2 − A1 )
∆ = ±(2m + 1)
λ ϕ 2 − ϕ1
+
λ
2
2π
(1.18)
или при равенстве начальных фаз ϕ 2 = ϕ1
∆ = ±(2m + 1)
λ
2
.
(1.19)
Стоячая волна образуется при наложении двух бегущих
синусоидальных волн, распространяющихся навстречу друг другу и
имеющих одинаковые частоты и амплитуды. Например, поперечная стоячая
волна образуется на натянутой упругой нити, один конец которой закреплен,
а другой приводится в движение, продольная стоячая волна – при отражении
звуковой волны от перегородки в воздушной трубе. При этом
s = s1 + s2 = A0 sin (ωt − kx ) + A0 sin (ωt + kx + ϕ 0 ) =
= 2 A0 cos(kx + ϕ0 / 2 ) sin (ωt + ϕ0 / 2) = Aст sin (ωt + ϕ0 / 2 ) . (1.20)
13
Точки, в которых функция координаты Аст=0, называются узлами, если
Аст=2А0 – пучностями стоячей волны (рис. 1.4).
A
2A0 0
x
Рис. 1.4
Расстояние между двумя соседними узлами (пучностями) одинаково,
есть длина стоячей волны, которая равна λст = λ / 2 .
Стоячая волна, в отличие от бегущей, энергию не переносит, вернее
две встречные бегущие волны, образующие при наложении стоячую,
переносят равную энергию в прямо противоположных направлениях.
В
упругой
стоячей
волне
скорость
колебания
частиц
vч = ∂s / ∂t = 2 A0ω cos(kx + ϕ0 / 2 ) cos(ωt + ϕ 0 / 2 ) ,
а
относительная
деформация
среды
ε = ∂s / ∂x = 2 A0 k sin (kx + ϕ0 / 2) cos(ωt + ϕ0 / 2 + π / 2 ) . Относительная
деформация ε опережает vч по фазе на π / 2 . Когда ε достигает максимума,
vч=0, и наоборот, т.е. кинетическая энергия колеблющихся частиц среды
превращается в потенциальную энергию деформации среды, и наоборот.
Поэтому энергия периодически мигрирует от узлов стоячей волны к ее
пучностям и обратно. Однако в самих узлах и пучностях плотность потока
энергии равна нулю. Среднее за период значение плотности потока энергии
равно нулю в любой точке стоячей волны, так как две встречные бегущие
волны, образующие при наложении стоячую, переносят равную энергию в
прямо противоположных направлениях.
1.4. Эффект Доплера в акустике
Упругие волны с низкими частотами называются звуковыми или
акустическими, слышимыми называются волны с частотой 16 Гц <v<20000
Гц.
Эффектом Доплера называют изменение частоты v (длины λ ) волны,
воспринимаемой приемником сигнала при движении источника сигнала и
приемника друг относительно друга. Например, понижение тона (частоты)
воспринимаемого человеком гудка тепловоза, удаляющегося от перрона.
Рассмотрим два случая.
1. Пусть источник сигнала движется со скоростью vист к неподвижному
приемнику вдоль прямой, их соединяющей (рис. 1.5, а), пусть скорость
сигнала (волны) в среде v. Тогда за период колебаний в волне Т источник
завершает излучение одной длины волны, приблизившись на расстояние vистТ
14
к приемнику, т.е. длина волны воспринятая приемником (наблюдателем)
будет λ = λ0 m v истT . Знак «–» соответствует рассматриваемому случаю
приближения источника к приемнику, а «+» – удаления. Так как λ = v / v и
T = 1 /ν , то частота, воспринятая приемником
v=
ист
v
λ
=
v0λ0
v0
=
.
λ0 m v истT 1 m v ист
v
vист
пр ист
vистT
(1.21)
v
vпр
пр
λ0
λ
а)
б)
Рис. 1.5
2. Пусть источник неподвижен, а приемник (наблюдатель) движется со
скоростью vпр вдоль прямой, их соединяющей (рис. 1.5, б). Тогда
наблюдатель будет воспринимать одну длину волны за время
T = λ0 / v ± v пр . Знак «+» соответствует случаю приближения приемника к
(
)
источнику, а «–» – удаления. С учетом T = 1 / v и λ0 = v / v0 можно записать
 v пр 
 .
v = v0 1 ±
v 

(1.22)
В случае одновременного движения источника и приемника друг
относительно друга, объединяя формулы (1.21) и (1.22), можно получить
v = v0
1±
v пр
v .
v
1 m ист
v
(1.23)
Так как движение объектов может быть сложным, то в формуле (1.23)
можно использовать проекции скоростей источника и приемника сигнала на
выбранное интересующее нас направление, в результате чего выражение
усложняется, появляются тригонометрические функции
v = v0
1±
v пр cos α пр
v
.
v ист cos α ист
1m
v
15
(1.23/)
Лекция 2. Электромагнитные волны
1. Свойства электромагнитных волн. Энергия электромагнитных волн.
2. Отражение и преломление электромагнитных волн на границе двух
диэлектрических сред. Формулы Френеля.
3. Эффект Доплера для электромагнитных волн.
2.1. Свойства электромагнитных волн. Энергия электромагнитных волн.
Электромагнитными волнами (ЭМВ) называются поперечные
возмущения электромагнитного поля (ЭМП), т.е. переменное ЭМП,
→
→
распространяющееся в пространстве. В ЭМВ векторы H ⊥ E (рис. 2.1),
образуя с вектором скорости волны правую тройку. Свет также является
ЭМВ. Гипотеза об этом была высказана Дж.Максвеллом еще до
экспериментального обнаружения ЭМВ. Так как на человеческий глаз
→
воздействуют в основном колебания вектора E , то он называется световым
вектором. Оставаясь взаимноперпендикулярными с течением времени,
→
→
векторы E и H изменяются так, что в зависимости от разности фаз и
соотношения амплитуд их концы могут описывать эллипс, круг, прямую, т.п.
В зависимости от этой преобладающей в колебаниях векторов траектории,
колебания называют поляризованными эллиптически, циркулярно,
линейно, т.п. Плоскость, простирающаяся по лучу волны, в которой
происходят такие колебания, называется плоскостью поляризации.
→
→
Плоскость, в которой колеблется вектор H ( В ), называется плоскостью
колебаний. Плоскость поляризации и плоскость колебаний всегда взаимно
перпендикулярны.
Естественный
(неполяризованный)
свет
характеризуется
всевозможной
ориентацией
колебания
вектора
→
напряженности E . Различают также частично поляризованный свет, когда
колебания в каком-либо направлении ослаблены.
Рис. 2.1
Колебания векторов в ЭМВ описываются уравнениями
16
→
→
∇ 2 E − εε 0 µµ0
→
∇ 2 H − εε 0 µµ0
∂2 E
∂t 2
2
(2.1)
= 0.
(2.2)
→
∂ H
∂t
= 0,
2
Связь между модулями векторов в ЭМВ задается выражением
H = εε 0 /( µµ0 ) E .
(2.3)
Сравнивая формулы (2.1), (2.2) и (1.1), можно увидеть, что фазовая
скорость ЭМВ
v = 1 / εε 0 µµ0 = c / εµ = c / n ,
(2.4)
где
n
–
абсолютный
показатель
преломления
среды,
c = 1 / ε 0 µ0 =(299792,462 ± 0,018) м/с ≈ 3⋅108 м/с – скорость света в вакууме
µ =1).
световой (оптический)
радиоволн
( ε =1,
Таблица 2.1
Диапазоны электромагнитного излучения (электромагнитных волн)
Диапазон
Длина волны λ , м
сверхдлинных
более 3⋅104
длинных
104–103
средних
103–102
коротких
102–10
метровых
10–1
инфракрасный
(ИК)
видимый глазом
(цвета по
принципу:
«каждый
охотник желает
знать, где сидит
фазан»)
дециметровых
сантиметровых
миллиметровых
субмиллиметровых
дальний
средний
ближний
красный цвет
оранжевый цвет
1–0,1
0,1–0,01
10-2–10-3
10-3–5⋅10-5
10-3–2000⋅10-9
(2000–1500)⋅10-9
(1500–780)⋅10-9
(780–620)⋅10-9
(620–585)⋅10-9
желтый цвет
(585–550)⋅10-9
зеленый цвет*
(550–510)⋅10-9
голубой цвет
(510–480)⋅10-9
синий цвет
(480–450)⋅10-9
фиолетовый цвет
(450–380)⋅10-9
ультрафиолетоближний
(380–315)⋅10-9
вый (УФ)
средний
(315–280)⋅10-9
дальний
(280–1)⋅10-9
рентгеновский
10-9–6⋅10-12
гамма-излучения ( γ -излучения)
менее 6⋅10-12
* зеленый цвет соответствует максимуму чувствительности человеческого глаза.
17
Действие электромагнитного излучения или электромагнитных волн
(ЭМВ) определяется его энергией, которая, в свою очередь, определяется
частотой (длиной) волны v ( λ ). Границы в приведенной классификации
следует рассматривать как условные, так как на стыке диапазонов
проявляемые свойства позволяют отнести излучение к обоим
соседствующим диапазонам (табл. 2.1).
Источниками инфракрасного (ИК) излучения являются нагретые тела,
которыми можно считать практически все тела вплоть до температур,
близких к абсолютному нулю (0 К).
Рентгеновское излучение или рентгеновские лучи возникают при
взаимодействии заряженных частиц и фотонов с атомами вещества.
Гамма-излучение ( γ -излучение) испускается возбужденными атомами
при радиоактивном распаде и ядерных реакциях, распаде частиц и их
аннигиляции, т.п. γ -излучение сопровождает перечисленные процессы, но
не является единственным видом излучения, ими порождаемым.
Для ЭМП в линейной изотропной несегнетоэлектрической и
неферромагнитной среде объемная плотность энергии ЭМП (см. формулы
(4.15), (11.11), часть II данного пособия)
w = wэл + wмагн =
εε 0 E 2
2
+
µµ0 H 2 ( 2.3), ( 2.4)
=
2
εε 0 µµ0 EH =
EH
. (2.5)
v
Вектор плотности потока энергии – вектором Умова (Умова–
Пойнтинга) для ЭМВ с учетом формулы (1.7) определяется выражением
→
→
→ → 
U = w v = E H 


(2.6)
и зависит от типа поляризации ЭМВ.
2.2. Отражение и преломление электромагнитных волн на границе двух
диэлектрических сред. Формулы Френеля
Относительным показателем преломления второй среды относительно
первой называется величина
n21 = n2 / n1 ,
(2.7)
где n1, n2 – абсолютные показатели преломления, определяемые формулой
(2.4). Для неферромагнитных сред ( µ ≈ 1)
n21 = ε 2 / ε1 .
(2.8)
При падении на границу раздела двух диэлектриков ЭМВ частично
отражается от поверхности раздела и частично преломляется, переходя во
18
вторую среду. При этом в первой среде на поле падающей волны (далее
величины с индексом «0») накладывается поле отраженной волны (далее
индекс «отр»), а во второй среде распространяется только прошедшие волны
(далее индекс «пр»). В предположении неферромагнитных сред ( µ1 = µ 2 =1)
граничные условия для нормальных и тангенциальных проекций векторных
характеристик поля на нормаль и касательную плоскость к границе раздела
сред имеют вид
E0τ + Eотрτ = Eпрτ ,
(2.9)
H 0τ + H отрτ = H прτ ,
(2.10)
ε1 (E0 n + Eотрn ) = ε 2 Eпрn ,
(2.11)
H 0n + H отрn = H прn .
(2.12)
Отсюда следует, что независимо от типа поляризации при падении ЭМВ
на гладкую поверхность раздела
1) отраженные и преломленные волны являются монохроматическими с
той же частотой, что и падающая;
2) выполняются законы отражения и преломления (закон Снеллиуса)
геометрической оптики (см. лекцию далее).
С помощью граничных условий (2.9)–(2.12) можно найти связь между
интенсивностями, фазами и амплитудами падающей, отраженной и
преломленной волн. Для этого требуется записать уравнения (2.9)–(2.12) для
двух предельных случаев:
→
1) s-волн, для которых вектор E перпендикулярен поверхности раздела,
→
а вектор H параллелен ей;
2) р-волн, для которых имеет место обратная s-волнам ситуация: вектор
→
→
E параллелен поверхности раздела, а вектор H перпендикулярен ей.
→
Связь между амплитудами колебаний вектора E в падающей,
отраженной и преломленной волнах для s- и р-волн выражается формулами
Френеля:
sin (i − r )
,
sin (i + r )
tg(i − r )
Aотрp = − A0 p
,
tg(i + r )
2 cos i sin r
Aпрs = A0 s
,
sin (i + r )
2 cos i sin r
Aпрp = A0 p
,
sin (i + r ) cos(i − r )
Aотрs = − A0 s
19
(2.13)
(2.14)
(2.15)
(2.16)
где i – угол между перпендикуляром к границе раздела сред и падающим
лучом, r – угол между перпендикуляром к границе раздела сред и
преломленным лучом. В частности, при нормальном падении (i=r=0):
n −1
n21 − 1
, Aотрp = − A0 p 21
,
n21 + 1
n21 + 1
2
2
, Aпрp = A0 p
.
= A0 s
n21 + 1
n21 + 1
Aотрs = − A0 s
Aпрs
В формулах Френеля (2.13)–(2.16) амплитуды А0 и Апр положительны
при всевозможных значениях углов i и r, что свидетельствует о совпадении
фаз преломленной и падающей волн. Величины Аотр могут быть как
→
положительны, так и отрицательны: в первом случае фаза колебаний E не
→
изменяется, а фаза H изменяется на
π , во втором случае – наоборот.
→
Значения сдвига фаз колебаний вектора E при отражении ЭМВ s- и ртипа в зависимости от угла падения i и относительного показателя
преломления n21 приведем в таблице 2.2.
Тип волн
s-волна
р-волна
Таблица 2.2
(i+r)> π /2 при i>iБ
n21>1 при i>r
n21<1 при i<r
π
0
π
0
(i+r)< π /2 при i<iБ
n21>1 при i>r
n21<1 при i<r
π
0
π
0
Угол падения iБ, при котором отраженные и преломленные лучи
взаимноперпендикулярны, называется углом Брюстера. При i=iБ сумма углов
i+r= π /2 и по закону преломления Снеллиуса
tgiБ = n21 .
(2.17)
Из формул Френеля (2.13)–(2.16) видно, что если i=iБ, то Аотрр=0, т.е. рволна не отражается, а полностью проходит во вторую среду.
Коэффициент отражения ЭМВ от поверхности раздела
(
)
R = I отр / I 0 = Aотр / A0 2 ,
(2.18)
где Ik – интенсивности волн.
Из формул Френеля (2.13)–(2.16)
Rs =
sin 2 (i − r )
sin (i + r )
Rp =
2
tg 2 (i − r )
tg (i + r )
2
,
(2.19)
.
(2.20)
При нормальном падении волн на поверхность раздела (i=r=0)
20
2
 n −1
Rs = R p =  21  .
 n21 + 1 
(2.21)
Если волна поляризована произвольно, то надо выделять составляющие,
тогда коэффициент отражения
R=
I отрs + I отрp
I0
=
Rs I 0 s + R p I 0 p
I 0s + I 0 p
,
(2.22)
где Ik – интенсивности s- и р-составляющих падающей волны.
Коэффициент пропускания ЭМВ
2
2
A 
ε  Aпр 
 = n21  пр  .
T=
= 2 
ε1  A0 
I0
 A0 
I пр
(2.23)
Для s- и р-волн согласно формулам Френеля (2.13)–(2.16)
Ts =
Tp =
4 cos 2 i sin i sin r
sin (i + r )
2
,
(2.24)
4 cos 2 i sin i sin r
sin 2 (i + r ) cos 2 (i − r )
.
(2.25)
При нормальном падении волн на поверхность раздела (i=r=0)
Ts = T p =
4n21
(n21 + 1)
2
.
(2.26)
Если n21 = n2 / n1 < 1, то угол преломления больше угла падения:
sin r = sin i / n21 и r > i . Угол падения, при котором угол преломления равен
π /2, называется предельным или критическим углом iкр = arcsin n21 .
Если i ≥ iкр , то интенсивности падающей и отраженной волны одинаковы,
т.е. волна полностью отражается от поверхности раздела сред (R=1). Это
явление называется полным внутренним отражением.
2.3. Эффект Доплера для электромагнитных волн
(эффект Доплера в акустике – см. п. 1.4 данного пособия)
Эффект Доплера наблюдается и в акустике, и в оптике (свет – ЭМВ). В
акустике регистрируемая приемником частота определяется выражением
21
(1.23). Для ЭМВ выражение для эффекта Доплера следует из преобразований
Лоренца и определяется только относительной скоростью u источника и
приемника в отличие от акустики, где еще прибавляются скорости источника
и приемника относительно сред.
Рассмотрим условно неподвижную систему отсчета (СО) S и S/, оси
которой параллельны осям СО S и которая движется со скоростью u вдоль
оси х системы S. Пусть источник волн И связан с системой S/ и находится в
точке с координатой х/, а наблюдатель находится в системе S (рис. 2.2, а).
Пусть в момент времени t/ источник начал излучение одноволнового
импульса вдоль оси х (рис. 2.2, б), а в СО S этому событию соответствовали
координата х1 и момент времени t1. В момент времени t2/= t1/+Т/ (Т/ – период
колебаний в волне в СО S/) излучение одноволнового импульса будет
завершено. Пусть в СО S этому завершению соответствуют координата х2 и
момент времени t2.
z S
y
0
y/
z/ u
0
/
S/
И
λ
x1,t1 x2,t2
c
c(t1 - t2 )
x/ 0
x
а)
x
u(t1 - t2 )
б)
Рис. 2.2
Согласно постулату теории относительности Эйнштейна скорость света
в любой СО одинакова и равна с. Тогда согласно рис. 2.2, б
c(t1 − t2 ) + u (t1 − t2 ) = λ ,
(2.27)
где λ – длина волны в неподвижной СО S. Очевидно, что x2–x1=u(t2– t1),
тогда формулу (2.27) можно переписать в виде
(c + u )(t2 − t1 ) = λ .
(2.28)
Для того, чтобы выразить t2 и t1, воспользуемся обратным
преобразованием Лоренца для времени (см. лекция 6, ч. I данного пособия,
формула (6.6)):
/
t +
ux /
t=
1−
Тогда искомая разность примет вид
22
c2 .
u2
c2
t2 − t1 =
(t
/
2
/
− t1
(
)+
u x /2 − x1/
1−
u
c2
2
)
.
(2.29)
c2
Формулу (2.29) можно упростить с учетом того, что в СО S/ источник И
неподвижен, т.е. х2/= х1/ и t2/–t1/=Т/. Тогда
T/
t2 − t1 =
1−
u
2
.
(2.30)
c2
Подставляя выражение (2.30) в формулу (2.28) с учетом соотношений
λ =с/v и T/=1/v/, можно получить выражение, связывающее частоту v,
регистрируемую наблюдателем при взаимном удалении наблюдателя и
источника с относительной скоростью u, с частотой v/, генерируемой
источником:
v=
v/ 1 −
u
1+
c
u
c.
(2.31)
При удалении источника и наблюдателя (приемника) как и в случае
/
эффекта Доплера в акустике для ЭМВ v<v/ или λ > λ , т.е. регистрируемое
наблюдателем излучение имеет большую длину волны – в этом случае
говорят о «красном смещении» в спектре. «Красное смещение»
обнаружено в спектре излучения далеких галактик, из чего следует вывод об
их удалении от Земли. Обнаружение этого «красного смещения» в 1929 году
американским астрономом Э.Хабблом (1889–1953) послужило одним из
аргументов в пользу теории Большого взрыва (Big Bang Theory). Согласно
этой теории наша Вселенная появилась в результате резкого расширения
(взрыва), продолжающегося до сих пор. Есть основания считать, что
расширение не будет длиться бесконечно, а периодически может сменяться
сжатием.
Выражение (2.31) для случая взаимного сближения источника и
наблюдателя (приемника) при замене скорости u на –u примет вид
v=
v/ 1 +
u
1−
c
23
u
c.
(2.31)
Лекция 3. Геометрическая оптика
1. Геометрическая оптика и ее законы.
2. Линзы и зеркала.
3. Система линз как основа оптических приборов.
3.1. Геометрическая оптика и ее законы
Раздел
физики,
занимающийся
изучением
природы
света,
закономерностей его испускания, распространения и взаимодействия с
веществом, называется оптикой.
Геометрическая оптика рассматривает распространение света в
вакууме, прозрачных средах и на границах сред, а также принцип действия
оптических приборов и формирование изображения на основе представления
о свете как о совокупности световых лучей. При этом не затрагиваются
представления о природе света, не вдаются в корпускулярно-волновой
дуализм его свойств (см. далее). Под световым (геометрическим) лучом
обычно понимается направление распространения ЭМВ. Геометрическая
оптика основывается на ряде законов. Условия применимости законов
геометрической оптики: размеры препятствий (отверстий) должны быть
много больше длины волны падающего света; расстояние от препятствий
(отверстий) до рассматриваемых точек за препятствиями (отверстиями)
должно быть значительным.
Закон прямолинейного распространения света: в оптически
однородной прозрачной среде свет распространяется прямолинейно. Тень с
резкими границами от предмета, освещенного точечным источником света,
размеры которой можно вычислить по законам классической геометрии,
доказывает прямолинейность распространения света. Точечный источник
света – источник света, размеры которого малы по сравнению с расстоянием
от него до места наблюдения.
Закон независимости распространения световых лучей: отдельные
световые пучки (лучи света), пересекаясь, не взаимодействуют.
Закон отражения света: луч падающий и луч отраженный лежат в одной
плоскости с перпендикуляром MN, восстановленным к границе раздела сред
в точке падения; угол отражения β равен углу падения α (рис. 3.1).
1
2
M
αβ
NРис.γ3.1
24
Закон преломления света: луч падающий, луч преломленный и
перпендикуляр N, восстановленный к границе раздела сред в точке падения,
лежат в одной плоскости; отношение синуса угла падения α к синусу угла
преломления γ есть величина постоянная для данных сред, называемая
относительным показателем среды второй среды относительно первой n21
(рис. 3.1):
sin α / sin γ = n21 .
(3.1)
Относительный показатель преломления двух сред равен отношению их
абсолютных показателей преломления:
n21=n2/n1.
(3.2)
Абсолютным показателем преломления среды называется величина n,
равная отношению скорости ЭМВ в вакууме с к их фазовой скорости в среде
v (см. формулу (2.4)):
n=c/v.
(3.3)
Если n21>1, то говорят, что свет распространяется из оптически более
плотной среды (n2>n1) и α < γ , если n21<1 – наоборот. При переходе света
из оптически более плотной среды в оптически менее плотную при
некотором предельном угле падения α пр = arcsin n21 угол преломления
оказывается равным
π / 2 . Таким образом, при α пр < α < π / 2 наблюдается
непрохождение луча во вторую среду, а его полное отражение в первую
среду. Данное явление используется, например, в световодах, в оптических
приборах для поворота лучей и изображения.
На основании законов геометрической оптики можно рассчитать сдвиг
δ треугольной стеклянной призмой изображения точечного источника света
S для наблюдателя (рис. 3.2):
δ = α1 + γ 2 − ϕ .
ϕ
/
S
S
α1
δ
γ1 α2
γ2
Рис. 3.2
В связи с зависимостью показателя преломления n или фазовой скорости
v от частоты света v или длины волны λ (дисперсия) свет различной частоты
(цвета) отклоняется призмой на различные углы: наиболее отклоняется
фиолетовый свет, наименее – красный. Так белый свет (как совокупность
всех цветов – частот) разлагается призмой в спектр (лат. spectrum – видение)
– плавно переходящие друг в друга разноцветные полосы.
25
3.2. Линзы и зеркала
Линза (лат. lens – чечевица) – прозрачное тело, ограниченное двумя
сферическими поверхностями (одна поверхность может быть плоской) и
преобразующее форму светового пучка. Линзы подразделяются на
двояковыпуклые (рис. 3.3, 1), двояковогнутые (4), плосковыпуклые (2),
плосковогнутые (5), выпукло-вогнутые (3) и вогнуто-выпуклые (6).
1
2
3
4
5
6
Рис. 3.3
Собирающие линзы – линзы, превращающие входящие параллельные
пучки в пучок сходящихся лучей (на рис. 3.3, линзы 1, 2, 3).
Рассеивающие линзы – линзы, превращающие входящие параллельные
пучки в пучки расходящихся лучей (на рис. 3.3, линзы 4, 5, 6).
Тонкая линза – линза, у которой радиусы кривизны ограничивающих
поверхностей намного больше толщины линзы.
Рассмотрим замечательные линии и точки собирающей тонкой
линзы (рис. 3.4).
P
M
O1
F
0
F
O2
N
Рис. 3.4
Главная оптическая ось – прямая, проходящая через центры О1, О2
ограничивающих сферических поверхностей линзы.
Оптический центр – точка 0, расположенная на главной оптической оси
O1О2, проходя через которую луч света не изменяет своего направления.
26
Побочная оптическая ось – произвольная прямая MN, проходящая
через оптический центр линзы 0 под углом к главной оптической оси.
Множество прямых, проходящих через цёнтр линзы 0, составляет множество
побочных оптических осей.
Главный фокус – точка F на главной оптической оси, в которой
пересекаются преломленные линзой сходящиеся лучи, падающие на линзу
параллельно главной оптической оси. Линза имеет два главных фокуса F.
Фокальная плоскость – плоскость РN, проходящая через главный
фокус линзы перпендикулярно главной оптической оси. Фокальная
плоскость состоит из бесконечного множества побочных фокусов линзы.
Побочный фокус – точка N фокальной плоскости, в которой
пересекаются преломленные линзой сходящиеся лучи, падающие на линзу
параллельно побочной оптической оси. Множество точек фокальной
плоскости составляет множество побочных фокусов линзы.
Фокусное расстояние линзы F – расстояние от центра линзы 0 до
главного фокуса F – отрезок 0F.
Рассмотрим замечательные линии и точки рассеивающей тонкой
линзы (рис. 3.5).
P
M
O1
F
0
F
O2
N
Рис. 3.5
Главная оптическая ось – прямая, проходящая через центры О1, О2
ограничивающих сферических поверхностей линзы.
Оптический центр – точка 0, расположенная на главной оптической оси
O1О2, проходя через которую луч света не изменяет своего направления.
Побочная оптическая ось – произвольная прямая MN, проходящая
через оптический центр линзы 0 под углом к главной оптической оси.
Множество прямых, проходящих через цёнтр линзы 0, составляет множество
побочных оптических осей.
Главный мнимый фокус – точка F на главной оптической оси, в
которой пересекаются мнимые продолжения преломленных линзой
расходящихся лучей, падающие на линзу параллельно главной оптической
оси. Линза имеет два главных мнимых фокуса F.
27
Мнимая фокальная плоскость – плоскость РN, проходящая через
главный мнимый фокус линзы перпендикулярно главной оптической оси.
Фокальная плоскость состоит из бесконечного множества побочных мнимых
фокусов линзы.
Мнимый побочный фокус – точка N мнимой фокальной плоскости, в
которой пересекаются мнимые продолжения преломленных линзой
расходящихся лучей, падающих на линзу параллельно побочной оптической
оси. Множество точек мнимой фокальной плоскости составляет множество
мнимых побочных фокусов линзы.
Фокусное расстояние линзы F – расстояние от центра линзы 0 до главного
фокуса F – отрезок 0F. Фокусное расстояние линзы в вакууме определяется
радиусом кривизны сферических поверхностей, ограничивающих линзу, и
абсолютным показателем преломления материала линзы:
 1
1
1 
 ,
= (n − 1) ±
±
F
R
R

1
2
(3.4)
где n – абсолютный показатель преломления материала линзы; Ri – радиусы
кривизны сферических поверхностей линзы, для выпуклой поверхности
радиус кривизны больше нуля, для вогнутой меньше нуля, для плоской
стремится к бесконечности.
Формула тонкой линзы связывает между собой фокусное расстояние F
линзы, расстояние d от предмета до линзы, и расстояние f от изображения до
линзы (рис. 3.6):
m
1 1 1
= ± ,
F d f
(3.5)
где F – фокусное расстояние линзы, положительное для собирающей и
отрицательное для рассеивающей линзы;
d – расстояние от предмета до линзы, всегда положительное;
f – расстояние от линзы до изображения, положительное, если
изображение Н и предмет h находятся по разные стороны от линзы,
отрицательное, если изображение Н и предмет h находятся с одной стороны
линзы.
d
h
2F F
F
0
f
Рис. 3.6
28
H
h – высота (линейный размер) предмета, положительная, если предмет
расположен над главной оптической осью линзы;
Н – высота (линейный размер) изображения, положительная, если
предмет расположен над главной оптической осью линзы.
Изображение H прямое, если h и Н одного знака, т. е., расположены по
одну сторону главной оптической оси линзы.
Изображение Н перевернутое (обратное), если h и Н разных знаков,
т.е. расположены по разные стороны главной оптической оси линзы.
Изображение Н действительное, если оно получено сходящимися
лучами и его можно спроецировать на экран.
Изображение Н мнимое, если оно получено не сходящимися лучами, а
построено на продолжениях лучей, его нельзя спроецировать на экран, а
можно только наблюдать (лупа).
Линейное увеличение Г линзы – отношение линейного размера
изображения Н к линейному размеру предмета h:
Γ = H / h.
(3.6)
Если Γ > 1 => Н – увеличенное, Γ < 1=> Н – уменьшенное, Г>0 => Н –
прямое, Г<0 => Н – обратное (перевернутое).
Оптическая сила линзы D – величина, обратная фокусному
расстоянию:
D = 1/ F .
(3.7)
[D]=1/м=дптр. Единица D оптической силы линзы – диоптрия, дптр.
Оптической силой D=1дптр обладает линза с фокусным расстоянием F=1 м.
Для собирающих линз согласно формуле (3.4) оптическая сила положительна
D>0.
Построение изображений в линзах основано на трех правилах:
1. Луч 1, параллельный главной оптической оси, после преломления в
линзе проходит через фокус;
2. Луч 2, прошедший через оптический центр линзы, не изменяет своего
направления.
3. Луч 3, прошедший через фокус, после преломления в линзе идет
параллельно главной оптической оси.
Рассмотрим несколько характерных случаев для собирающей линзы
(рис. 3.7):
а) 2F>d>F, Н: увеличенное (Г>1), действительное, перевернутое;
б) d>2F, Н: уменьшенное (Г<1), действительное, перевернутое;
в) F>d>0, Н: увеличенное (Г>1), мнимое, прямое.
Рассмотрим несколько характерных случаев для рассеивающей линзы
(рис. 3.8):
а) d>2F, Н: уменьшенное (Г<1), мнимое, прямое;
б) 2F>d>F, Н: уменьшенное (Г<1), мнимое, прямое;
в) F>d>0 – изображение не создается.
29
3
2
1
а)
3
2
1
б)
d
h
2F F 0
F
H
f
23
1
d
h
F
2F F 0
H
f
2
1
3
в)
f
1 2
3
3
H
h
0 F
2F F d
Рис. 3.7
1
2
Принцип обратимости световых лучей справедлив для любой
оптической системы, преломляющей и (или) отражающей световые лучи, и
заключается в следующем: если при выходе светового луча из любой
системы преломляющих и (или) отражающих сред заставить световой луч
отразиться под углом 180°, то он пройдет всю оптическую систему в обратном направлении.
Рассмотрим построение изображения светящейся точки (А) в
плоском зеркале (рис. 3.9).
1. Через предметную точку А проведем две произвольные прямые,
Вдоль них направлены два луча 1 и 2.
30
2. По закону отражения строим отраженные лучи 1' и 2'.
Для этого в точке падения каждого восстанавливаем перпендикуляр и
проводим отраженный луч таким образом, чтобы он составил с
перпендикуляром угол, равный углу падения.
3
2
d
1
h
а)
1
2
13
б)
3
H
2F F f 0 2 F
1
d
3
1
3
hH
2F F f 0 2 F 3
1
Рис. 3.8
A
2A
/
1
/
1
2
1
/
2
/
/
Рис. 3.9
3. Отраженные лучи 1' и 2' – расходящиеся, то есть после отражения от
зеркала они не пересекутся. Из этого следует, что действительного
изображения с помощью плоского зеркала получить нельзя.
4. Проводим продолжения отраженных лучей. Они пересекаются в точке
А' за зеркалом. Полученное изображение точки является мнимым.
31
Действительное изображение точки образуется при пересечении
лучей после прохождения оптической системы (зеркала, линзы, призмы, и
т.п.). Мнимое изображение точки образуется при пересечении не лучей,
прошедших оптическую систему, а их продолжений.
/
2 1
A
1
B
/
2
2
1/
A/
B/
Рис. 3.10
Рассмотрим построение изображения отрезка в плоском зеркале (рис.
3.10).
Поскольку отрезок является совокупностью предметных точек, то
изображение этого отрезка является совокупностью изображений каждой
точки в плоском зеркале. Для построения изображения достаточно получить
изображение крайних точек и соединить.
При построении удобнее один из лучей провести перпендикулярно
плоскости зеркала: в этом случае отраженный луч расположен на одной
прямой с падающим.
Свойства изображения в плоском зеркале:
- мнимое;
- симметрично предмету (относительно зеркальной плоскости);
- увеличение Г=1.
В системе, состоящей из 2-х зеркал, расположенных под углом друг к
другу изображение светящейся точки S можно получить, используя свойство
симметричности изображений в плоском зеркале (рис. 3.11). Изображение в
первом зеркале S1 - дает вторичное изображение S1/ во втором зеркале и
затем еще одно S1// в первом. Аналогично рассуждения по созданию изображений точки S2. В итоге и S1//, и S2/ оказываются не над отражающей
поверхностью и процесс создания изображений прекращается.
Сферическое зеркало может быть выпуклым (отражающей является
внешняя поверхность сферы) и вогнутым (отражающей является
внутренняя поверхность сферы). Сферическое зеркало позволяет получить
четкое изображение лишь в случае, когда размеры отражающей поверхности
малы по сравнению с радиусом ее кривизны.
Главная оптическая ось – линия, соединяющая центр кривизны С и
центр зеркала О (рис. 3.12, а). Лучи, падающие на зеркало параллельно
32
главной оси, после отражения от зеркала проходят через точку F на главной
оптической оси – фокус. Фокусное расстояние (FO) – расстояние от фокуса
до центра зеркала. 1 – луч падающий, 2 – луч отраженный.
S1
S2/
S
S1//
/
1
S
S2
Рис. 3.11
Фокус выпуклого зеркала – мнимый и расположен за зеркалом. В этом
фокусе собираются не сами отраженные лучи, а их продолжения. Построение
отраженного луча также основано на законе отражения. Перпендикуляр в
точке падения проводится вдоль радиуса сферической поверхности (рис.
3.12, б).
1
C
α
α
α
α
O
2
1
O
F
F
2
а)
C
б)
Рис. 3.12
Рассмотрим построение изображения точки А в вогнутом сферическом
зеркале (рис. 3.13) и выпуклом сферическом зеркале (рис. 3.14).
Через предметную точку А проводим два луча (рис. 3.13, а): 1 –
параллельно главной оптической оси, отразившись от зеркала, луч 1/
проходит через фокус; 2 – через фокус, отразившись от зеркала, он проходит
параллельно главной оптической оси. А/ – изображение.
33
При построении изображения А/В/ предмета АВ (рис. 3.13, б)
используют те же приемы.
1
A
2 1/
C
O
F
2
A
1
A
C 2
/
B/ 1
O
F
2/
A/
а)
б)
Рис. 3.13
Для построения можно воспользоваться лучом, направленным в центр
зеркала. Отраженный луч в этом случае симметричен падающему.
Формула сферического зеркала:
1 1
1 2
+ / = = ,
d d
f R
(3.8)
где R – радиус кривизны; f=OF– фокусное расстояние; OB = d – расстояние
от объекта до зеркала; OB/ = d/ – расстояние от изображения до зеркала.
Увеличение равно отношению размера изображения к размеру предмета:
Γ = A / B / / AB .
Из
подобия
треугольников:
АВО
/
и
/
АВО
следует,
(3.9)
что
AB / A / B / = d / d / = Γ .
Свойства изображения (для данного положения предмета):
- действительное;
- перевернутое;
- уменьшенное (Г < 1).
A
α
α
1
2
1/
A/
O
F
C
2/
Рис. 3.14
В формуле сферического зеркала значения величин могут быть как
положительными, так и отрицательными. Значения d и d/ – положительны
для действительных предмета и изображения и отрицательны для мнимых. f
– положительно для вогнутого зеркала и отрицательно для выпуклого.
34
Для выпуклого сферического зеркала через предметную точку А
проводим два луча (рис. 3.14): 1 – параллельно главной оптической оси –
продолжение отраженного луча 1/ проходит через фокус; 2 – через центр
зеркала. Отраженный луч симметричен относительно главной оптической
оси. Продолжения лучей, пересекаясь за зеркалом, дают мнимое изображение
А/.
1
2
3
α
n1 n2
γ
4
γ
3 γα
γ
α α
δ
α
б)
а)
Рис. 3.15
Очень часто предметы, на которые падает свет, можно представить как
сферические (шарообразные), например, капли росы. Лучи, падающие на
капельку под разными углами, ведут себя различно. На рисунке 3.15, а
изображены четыре варианта прохождения лучей (перпендикуляр в любой
точке сферы направлен вдоль радиуса кривизны): 1 – при выходе из капли
луч имеет угол падения, равный предельному для границы вода–воздух и
скользит по касательной, создавая блеск капли; 2 – при нормальном падении
луч проходит сквозь каплю, не преломляясь; 3 – луч проходит сквозь каплю,
преломляясь; 4 – луч испытывает полное внутреннее отражение, также
создает блеск капли как и луч 1. Углы, образованные падающим и
вышедшим лучами с соответствующими перпендикулярами, равны (см. луч
3). Построение хода лучей 3 на рис. 3.15, б позволяет увидеть, что
2(α − γ ) = 180 o − δ ,
γ = α − 90 o + δ / 2 ; по
n2 = sin α / sin γ = sin α / sin(α − 90 o + δ / 2) .
закону
преломления
3.3. Система линз как основа оптических приборов
Пусть дана система из двух собирающих линз (рис. 3.15). Сначала
рассматриваем, что происходит при наличии одной линзы. Предмет – отрезок
АВ – дает изображение А/В/ (рис. 3.16, а). Поместим за первой собирающей
линзой еще одну с фокусным расстоянием F2. В этом случае отрезок А/В/,
являющийся действительным изображением в первой линзе, становится
предметом для получения изображения во второй. Поскольку по отношению
к второй линзе он оказался в плоскости изображения, то является мнимым
(рис. 3.16, б). Построим дальнейший ход лучей 1 и 2, падающих на вторую
35
линзу. Для этого требуется провести две побочные оси (штриховые линии) 1/
и 2/, параллельные падающим на вторую линзу лучам (рис. 3.16, в); эти
побочные оси представляют собой лучи, попарно параллельные падающим
на вторую линзу лучам 1 и 2 и проходящие без отклонения через ее
оптический центр. По свойству параллельных лучей они пересекутся на
фокальной плоскости второй линзы. Пересечение лучей 1 и 2 и определит
изображение А//В//, даваемое второй линзой.
1
2
A
а) B
A
б) B
A
F1
F1
1
2
/
/
B
F2
F1
F2
F1
A
/
/
B
в)
2/ 1 1/
2 F2
F1
//
A
F2
B//
Рис. 3.16
Пусть дана система из рассеивающей и собирающей линзы. Фокусное
расстояние и оптическую силу системы из рассеивающей и собирающей линз
с фокусными расстояниями F1 (F1<0) и F2 (F2>0), которые имеют общую
главную оптическую ось О1О2, можно найти построением хода лучей, как и в
предыдущем случае. Мы воспользуемся другим способом – рассчитаем
величину фокусного расстояния, используя формулу тонкой линзы. Для
этого построим, как и в предыдущем случае, ход пучка лучей, параллельных
главной оптической оси (рис.3.17).
Луч 1, параллельный главной оптической оси О1О2, после преломления в
точке В первой линзы направляется в фокус F1,отклоняясь от главной
оптической оси на некоторый угол. Однако наличие второй линзы приводит
к его повторному преломлению в точке К. Луч, проходящий через
оптический центр О2 второй линзы параллельно лучу ВК пересекает
36
фокальную плоскость MN второй линзы в точке F2. По свойству
параллельных лучей через эту же точку проходит луч 1, преломленный в точке К. При этом он отклоняется от направления ВК еще на какой-то угол,
пересекая главную оптическую ось в точке F, являющейся главным фокусом
данной оптической системы.
1
F1
2
F1
M
K
1
B
F2/
F 2
2 L
F2
O1 O2 F F2 F1
1
2
l
N
F1
F
Рис. 3.17
Мнимое изображение, создаваемое лучами 1 и 2 в рассеивающей линзе,
находится в ее главном мнимом фокусе F1. Это изображение находится на
расстоянии d2= F1 +l от собирающей линзы (l – расстояние между линзами) и
является как бы предметом. Изображение этого предмета будет находиться в
фокусе оптической системы: f2=F. Используем формулу (3.5) для тонкой
собирающей линзы:
для
рассеивающей
1
1
1
.
=
+
F F1 − l F2
1
1
1
1
1
1
или
=
+ . Учитывая, что
=
+
F2 F1 + l F
F2 d 2 f 2
линзы
F1<0,
окончательно
получаем
формулу:
Для близко расположенных линз (l=0, или l << F1 ) оптическая сила
равна сумме оптических сил линз системы: D=–|D1|+D2. Для рассеивающей
линзы оптическая сила отрицательна, т. е. D1=–|D1|. Оптическая сила такой
системы меньше, чем оптическая сила собирающей линзы, а фокусное расстояние больше F>F2.
Оптические системы с переменным фокусным расстоянием широко
используются в фото- и видеосъемочной аппаратуре. Они позволяют плавно
приближать и удалять изображения предметов на пленке и на экране.
Оптическую силу системы линз, состоящую из линз с различными
оптическими силами, можно рассчитать как алгебраическую сумму
оптических сил составляющих линз:
D=D1+D2+...+Dn.
(3.10)
Фокусное расстояние системы линз определяют как величину,
обратную эквивалентной оптической силе системы линз F=1/D. Оптическая
сила системы линз, сдвинутых вплотную, равна сумме оптических сил линз,
составляющих эту систему. Например, линзу вида 1 на рис. 3.3 можно
считать состоящей из двух линз вида 2 и т.п.
37
Лекция 4. Интерференция как волновое свойство света
1. Монохроматичность. Временная и пространственная когерентность.
Интерференция света.
2. Опыт Т.Юнга. Кольца И.Ньютона.
3. Интерференция света в тонких пленках. Интерференция многих волн.
4.1. Монохроматичность. Временная и пространственная когерентность.
Интерференция света
Раздел
физики,
занимающийся
изучением
природы
света,
закономерностей его испускания, распространения и взаимодействия с
веществом, называется оптикой. Волновая природа света и обусловленные
ей явления (интерференция, дифракция, поляризация, дисперсия) изучаются
в волновой оптике. Классическая волновая оптика рассматривает среды
линейные, в которых диэлектрическая проницаемость не зависит от
интенсивности света. Именно для линейных сред справедлив принцип
суперпозиции (наложения) волн. Нелинейная оптика изучает явления
распространения света в нелинейных средах, например, при интенсивном
лазерном излучении.
Воздействие
света
на
вещество
обусловлено
воздействием
электромагнитного поля световой волны на заряженные частицы (электроны,
ионы). В основном, данное воздействие определяется вектором
→
напряженности Е , называемом по этой причине световым вектором.
С явлением интерференции волн мы уже познакомились на одной из
прошлых лекций, а так как свет – электромагнитная волна (ЭМВ), то все
остается верным и для световых явлений. Однако для ЭМВ необходимо
кроме вышеперечисленных условий, чтобы в интерферирующих
монохроматических волнах колебания светового вектора интерферирующих
ЭМВ совершались вдоль одного и того же общего направления (траектории).
Экспериментально установлено, что от двух совершенно одинаковых ламп
накаливания наблюдать явление интерференции нельзя. Это связано со
спонтанным излучением большим числом атомов тел не согласованных по
фазе и плоскости поляризации порций излучения – волновых цугов.
Свет называется естественным или неполяризованным, если он
представляет собой набор волн со всевозможными направлениями светового
вектора, удовлетворяющими только условию их перпендикулярности лучу
ЭМВ.
Реальные волны (даже лазерное излучение) не является, как правило,
строго монохроматическим. Спектр их циклических частот обычно имеет
конечную ширину ∆ω , т.е. присутствуют колебания в интервале ω ± ∆ω / 2 .
Временем когерентности немонохроматической волны называется
промежуток времени, в течение которого разность фаз колебаний с
частотами ω ± ∆ω / 2 изменяется на 2π :
38
τ ког = 2π / ∆ω .
(4.1)
В течение времени t << τ ког немонохроматическую волну можно считать
монохроматической с частотой ω . Расстояние, которое проходит волна за
время когерентности τ ког , называется длиной когерентности
l ког = v ⋅ τ ког = 2π ⋅ v / ∆ω ,
(4.2)
где v – фазовая скорость ЭМВ в данной среде. Для солнечного света
оценочно τ ког ~10-14 c, lког~10-6 м, а для непрерывного лазерного излучения
τ ког ~10-5 c, lког~103 м.
Когерентность колебаний, которые совершаются в один и тот же момент
времени в разных точках плоскости, перпендикулярной направлению
распространения волны, называется пространственной когерентностью.
Расстояние между точками на этой плоскости, в которых случайные
изменения фазы колебаний достигают значения π , называется длиной
пространственной когерентности.
Интерференцию света можно наблюдать и от обычных, нелазерных
источников света при разделении и сведении лучей от одного и того же
источника, например, с помощью соответствующего бизеркала Френеля (см.
рис. 3.11), бипризмы, непрозрачного экрана с двумя щелями (см. ниже опыт
Юнга), т.п. Даже при наложении двух лучей от одного источника
интерференция происходит лишь при условии разности хода волн δ < l ког
или δ < v ⋅ τ ког . Кроме того расстояние между двумя когерентными
источниками света, например, щелями в опыте Юнга, не должно быть
больше длины пространственной когерентности, иначе интерференционной
картины не возникает. Таким образом, видимость интерференционной
картины зависит как от временной, так и от пространственной
когерентности.
Соответственно, если разность хода от когерентных источников до
рассматриваемой точки экрана
λ
δ = ± (2m − 1), m ∈ z
2
(4.3)
– наблюдается интерференционный минимум, если
δ = ± λm, m ∈ z
(4.4)
– наблюдается интерференционный максимум.
Шириной интерференционной полосы называется расстояние между
двумя соседними интерференционными максимумами (минимумами).
Возможность различения интерференционных полос зависит от их
контрастности
степени различия освещенности экрана в областях
минимумов и максимумов. Количественной характеристикой контрастности
интерференционной картины служит безразмерная величина – видимость
полос
39
V =
I max − I min
,
I max + I min
(4.5)
где Imax и Imin – интенсивности света в областях максимумов и минимумов.
Глаз уверенно различает полосы при V>0,1, т.е. при Imin<0,82Imax.
4.2. 2. Опыт Т.Юнга. Кольца И.Ньютона
Рассмотрим два монохроматических (с одной частотой) когерентных
источника света, полученных в результате падения света от одного
источника на непрозрачный экран с двумя щелями (рис. 4.1, опыт Юнга).
δ
S2/
l
O1
O
O2
x-d/2
x
x+d/2
S
S1
S2
S1/
M
Рис. 4.1
Выберем расстояние l>>d (d – расстояние между щелями). В точке О
всегда наблюдается усиление света, так как разность хода интерферирующих
волн равна нулю (см. условие (4.4)). Для произвольной точки М на экране
можно записать:
S12 = l 2 + ( x − d / 2)2 , S 22 = l 2 + ( x + d / 2 )2 ⇒
⇒ S 22 − S12 = (S 2 + S1 )(S 2 − S1 ) = 2 xd .
Так как d<< l, то S 2 + S1 ≅ 2l , а S 2 − S1 ≅ δ , откуда
δ = xd / l .
(4.6)
Если в точке М выполняется условие интерференционного минимума (4.3),
гашение света, то
xm = ±
λ
2
(2m − 1) l , m ∈ z .
d
(4.7)
Если в точке М выполняется условие интерференционного максимума
(4.3), усиление света то
x m = ± mλ
l
, m∈ z.
d
По определению ширина интерференционной полосы
40
(4.8)
∆x = x m − x m−1 =
l
λ.
d
(4.9)
Из равенства (4.9) видно, что ширина интерференционной полосы
увеличивается с уменьшением расстояния d между источниками (щелями),
поэтому для получения четкой, различимой интерференционной картины
необходимо выполнение условия l>>d. Если источник монохроматический,
то на экране будет наблюдаться ряд чередующихся темных и светлых полос.
Если источник немонохроматический, например, белого света, то полосы на
экране будут цветными за исключением центрального белого максимума, где
для любой длины волны разность хода будет равна нулю. Все остальные
полосы будут радужно окрашенными, так как для каждой длины волны будет
своя разность хода δ . При этом красные полосы будут удалены от
центральной больше, чем фиолетовые, так как при всех прочих равных
условиях λ кр > λфиол .
Интерференционные полосы можно наблюдать и в воздушном клине,
если положить одну плоскопараллельную пластинку на другую, а под один
из концов верхней пластинки подложить небольшой предмет для
образования воздушного клина (рис. 4.2).
Рис. 4.2
Принимая толщину воздушного клина d → 0 , для разности хода
получаем
δ = 2d + λ / 2 ,
(4.10)
где появление второго слагаемого λ / 2 обусловлено отражением
световой волны от оптически более плотной среды (показатель преломления
стекла больше показателя преломления воздуха nвозд ≈ 1 ), при этом
отражающиеся световые волны меняют фазу на π , что эквивалентно
прохождению ими дополнительного пути (дополнительной разности хода)
λ / 2.
На границе, где стеклянные пластинки соприкасаются d=0 и δ = λ / 2 ,
поэтому наблюдается темная полоса (минимум). Первая светлая полоса
(максимум при m=1) наблюдается согласно условию (4.4) при δ = λ . С
учетом равенства (4.10) получим толщину воздушного клина в данном месте
d = λ / 4 . По аналогии вторая светлая полоса (максимум) придется на
d = 3λ / 4 и т.д. Эти полосы, каждой из которых соответствует своя вполне
определенная толщина клина или параллельной пластинки, называют
полосами равной толщины. Они могут быть параллельными линиями,
41
концентрическими окружностями и иметь любую форму в зависимости от
расположения точек, соответствующих d = const . Угол клина должен быть
очень мал, иначе полосы равной толщины ложатся друг на друга и их нельзя
различить.
Полосы равной толщины в виде концентрических колец (колец
Ньютона – классический пример) можно получить, если положить
плосковыпуклую линзу с большим радиусом кривизны (R=10–100 м) на
плоскопараллельную пластинку (рис. 4.3).
C
//
1
1
R
R-b
Линза, n>1 D
b
Пластинка O
1/
r
A
B
Рис. 4.3
Они получаются в результате отражения лучей от стеклянного клина
ОАВ. Лучи, отраженные от верхней и нижней поверхностей линзы, а также от
стеклянной пластинки, не интерферируют, так как из-за большой толщины
нарушается условие временной когерентности. В результате наложения
лучей 1/ и 1//, отраженных в точках А и В, возникают кольца Ньютона.
Для радиуса r кольца Ньютона из треугольника АDC при R>>b получаем
r 2 = R 2 − ( R − b) 2 = 2 Rb − b 2 ≈ 2 Rb . Отсюда 2b ≈ r 2 / R и разность
2
хода δ = 2b + λ / 2 = r / R + λ / 2 . Для радиусов светлых (максимумы) и
темных (минимумы) колец с учетом условий (4.3) и (4.4) для m ≥ 0
r светл = (m − 1 / 2) Rλ , m=0, 1, 2, …
(4.11)
r темн = mRλ , m=0, 1, 2, …
(4.12)
m
m
Измеряя радиусы колец Ньютона при известном радиусе кривизны
линзы, можно рассчитать длину световой волны λ , и наоборот.
4.3. Интерференция света в тонких пленках. Интерференция многих
волн
Часто интерференция света наблюдается в естественных условиях,
например, окраска мыльных пузырей, тонких пленок различного
происхождения на поверхности воды.
42
При падении воды, на, в общем случае, неоднородную по толщине
пленку падающая волна частично отражается и частично преломляется во
вторую среду как на верхней, так и на нижней границе пленки (рис. 4.4).
n1
1α α A
n2 O
1/
//
1
n1< n2
B
γ
d
D
2/ /
2/
Рис. 4.4
Для лучей 1/ и 1// разность фаз, а, следовательно, и результат
интерференции определяется разностью хода волн:
∆Φ =
2π
λ2
( OD + DB ) − 2π  OA + λ1  ,
λ1 
2
(4.13)
λi – длина волны в i-среде. Формула (4.13) получена для рис. 4.4 на
основе формулы (1.15) в случае равенства нулю начальных фаз ϕ1 = ϕ 2 .
Добавочная величина λ1 / 2 в формуле (4.13) обусловлена тем, что при
где
отражении от оптически более плотной среды ( n 2 > n1 ) в отраженной волне
фаза изменяется на π , что эквивалентно дополнительному пути в первой
среде λ1 / 2 .
Выражая длины волн в формуле (4.13) через длину волны λ света с
такой же частотой v, распространяющегося в вакууме со скоростью с:
λ1 =v1/v=c/(vn1), λ 2 =v2/v=c/(vn2),
получим
∆Φ =
2π
λ
λ  2π

n1  OA + 1  =
(n2 l 2 − n1l1 ) =
λ 
2 λ
2π
(s 2 − s1 ) = 2π δ ,
=
(4.14)
n2 ( OD + DB ) −
2π
λ
λ
где li – геометрическая длина пути, пройденного интерферирующими
волнами в i-среде, si=nili – оптическая длина пути световой волны в i-среде,
δ – оптическая разность хода волн.
43
Условия интерференционного минимума и максимума выражаются
формулами (4.3) и (4.4) соответственно.
Для плоскопараллельной пластинки OD = DB , поэтому величина δ
может
быть
выражена
через
величины
α,
γ,
d
(рис.
4.4):
OD = DB = d / cos γ ,
OA = OB sin α ,
OB = 2dtgγ ,
⇒
OA = 2dtgγ sin α . Тогда, подставляя все в формулу (4.14), с учетом n1=1
(для воздуха), n2=n получим
2dn
2dn 2d sin γ sin α
− 2dtgγ sin α =
−
.
cos γ
cos γ
cos γ
Так как по закону преломления sin α = n sin γ , то
δ=
(
)
2dn 1 − sin 2 γ
δ=
= 2dn cos γ = 2d n 2 − n 2 sin 2 γ =
cos γ
= 2d n 2 − sin 2 α .
(4.15)
Интерференция может наблюдаться не только в отраженном, но и в
проходящем сквозь пленку свете (лучи 2/ и 2//). При этом разность хода для
проходящего света меньше, чем для отраженного на величину λ1 / 2 .
Следовательно, минимумам в отраженном свете соответствуют
максимумы в проходящем свете, и наоборот.
Рассмотренная модель справедлива при условии, что коэффициент
отражения R<<1, поэтому рассматривалось только взаимодействие волн
первого отражения от верхней и нижней границ пленки. Если R велик, то
есть прохождение света во вторую среду достаточно малое, необходимо
рассматривать интерференцию многих волн, т.е. волн не только первого
отражения, но и второго, третьего и т.д.
Явление ослабления (гашения) отраженного света вследствие
интерференции используется для так называемого просветления оптики.
Для этого на поверхность оптики наносится пленка такой толщины, чтобы
осуществлялся минимум отражения для зеленого света с λ ≈ 550 нм,
соответствующего максимуму чувствительности человеческого глаза.
Поэтому просветленная оптика (линзы, призмы, т.п.) кажутся
окрашенными в фиолетовый цвет, так как максимум отражения
приходится на красную и фиолетовую видимую область спектра.
Наиболее полное гашение световых волн, отраженных от верхней и нижней
поверхностей пленки, происходит при равенстве интенсивностей этих волн
I1=I2 или R1=R2. С учетом сказанного для абсолютного показателя
преломления просветляющего покрытия (пленки) для воздушной атмосферы
справедливо выражение
nпленки = nопт ,
(4.16)
где nопт – абсолютный показатель преломления оптики (линзы, призмы, т.п.).
44
Лекция 5. Дифракция света
1. Понятие дифракции. Принцип Гюйгенса-Френеля.
2. Дифракция Френеля на круглом отверстии. Метод зон Френеля.
3. Дифракция Фраунгофера на щелях. Дифракция рентгеновских лучей
на пространственной (кристаллической) решетке. Формула ВульфаБрэггов. Понятие о рентгеноструктурном анализе.
4. Понятие о голографии.
5.1. Понятие дифракции. Принцип Гюйгенса-Френеля
Явление дифракции (от лат. difractus – разложенный) заключается в
огибании волнами препятствий или, точнее, в отклонении их от
прямолинейного распространения. Дифракция наблюдается в тех случаях,
когда линейные размеры препятствий сравнимы или немного больше длины
волны, падающего на препятствие света. В оптике различают дифракцию
Френеля (в сходящихся лучах) и дифракцию Фраунгофера (в
параллельных лучах). Первую разновидность наблюдается в случаях, когда
свет от точечного источника направлен на круглое отверстие или
непрозрачный диск. Вторую разновидность наблюдают при падении
параллельных лучей на щель или систему щелей (дифракционную решетку),
например, от точечного источника, удаленного на бесконечность или
помещенного в фокус собирающей линзы.
Рис. 5.1
Качественно явление дифракции объясняется на основании
принципа Гюйгенса, согласно которому каждая точка волнового фронта
является самостоятельным источником сферических волн, а огибающая этих
волн представляет собой волновой фронт в следующий момент времени. На
рис. 5.1 видно, что волны, проходя через отверстие, попадают в область
геометрической тени. Однако принцип Гюйгенса не позволяет выполнить
количественный
расчет
дифракционной
картины,
т.е.
расчет
пространственного распределения амплитуды, а, следовательно, и
интенсивности дифрагирующих волн.
45
Френель дополнил принцип Гюйгенса интерференционной идеей,
согласно которой вид дифракционной картины определяется результатом
интерференции вторичных сферических волн.
Амплитуда вторичных волн, согласно Френелю, пропорциональна
элементарной площадке волнового фронта, рассматриваемой как вторичный
источник. В общем случае расчет интерференции вторичных волн сложен, но
во многих практически важных случаях удается приблизительно рассчитать
дифракционную картину с помощью метода зон Френеля.
5.2. Дифракция Френеля на круглом отверстии. Метод зон Френеля
Рассмотрим случай распространения света с длиной волны λ от
точечного источника S в направлении непрозрачного экрана с малым
отверстием (дифракция Френеля).
Определим амплитуду А (а, следовательно, и интенсивность I~A2) в
точке М экрана на расстоянии b от препятствия. Для этого сферическую
поверхность необходимо разделить на кольцевые зоны такого размера, чтобы
расстояние от краев зон до точки М отличается на λ / 2 (рис. 5.2).
S
b+ 2⋅λ/2
b+ λ/2
S
M
b
b
M
Рис. 5.2
Так как колебания от соседних зон приходят в точку М с разностью пути в
λ / 2 , то они противофазны и при наложении будут ослаблять друг друга.
Тогда результирующая амплитуда
А=А1–А2+А3–А4+…+Аm
(5.1)
Амплитуда Аm определяется площадью m-ой зоны, равной разности
площадей соседних сферических сегментов ∆S m = S m − S m−1 . Площадь
сферического сегмента S m = 2πahm . Согласно рис. 5.3
rm = a − (a − hm )
2
2
2
2
λ 
λ

= b + m  − b − m  .
2 
2

Возводя обе части в квадрат и раскрывая скобки, имеем:
a 2 − a 2 + 2ahm − hm2 = b 2 + bmλ + m 2 λ2 / 4 − b 2 − 2bhm − hm2 .
46
Приводя подобные и пренебрегая членом второго порядка малости
bmλ
. Т.к. S m = 2πahm , то
2(a + b)
πabλ
= S m − S m−1 =
≠ f ( m) .
a+b
m 2 λ2 / 4 , получаем, что hm =
∆S m
S
(5.2)
b+ m⋅λ/2
b
M
a r
am
hm
Рис. 5.3
Результат (5.2) означает, что площади всех зон Френеля равны.
Однако при росте m амплитуда Аm колебаний, пришедших от
соответствующей зоны уменьшается, так как растет расстояние до точки М и
увеличивается угол между нормалью к поверхности зоны и направлением на
точку М: А1>А2>А3>… С достаточно хорошей точностью можно записать
Am+1 − Am−1
, тогда равенство (5.1) примет вид
2
A  A
A 
A ± Am
A A
A = 1 +  1 − A2 + 3  +  3 − A4 + 5  + ... = 1
,
2  2
2   2
2 
2
Am =
(5.3)
где знак «+» берется для четных m, а «–» – для нечетных m. Соответственно в
точке М будет максимум или минимум. Из выражения (5.3) следует, что
действие полностью открытого волнового фронта равно половине действия
только одной центральной зоны Френеля, радиус которой r1 может быть
весьма мал.
Расчет в других точках экрана более сложен, так как соответствующие
зоны закрыты непрозрачным экраном. Из закона сохранения энергии и
симметрии системы следует, что интерференционная картина вблизи точки
М будет иметь вид концентрических чередующихся темных и светлых колец
с центром в точке М. Если свет немонохроматический, то кольца будут
многоцветными, так как для одной длины волны будет наблюдаться
максимум, а для другой (других) – минимум.
Теория Френеля не учитывает изменение амплитуды и фазы
колебаний материалом экрана на границах щели и на малых расстояниях
( < λ ) от ее края (краевые эффекты), но хорошо описывает результат
дифракции на достаточно больших препятствиях с размерами значительно
больше λ . Теория Френеля также дает неправильные значения фазы
47
результирующей волны,
действительности.
меньшие
на
π / 2 , чем имеет место в
5.3. Дифракция Фраунгофера на щелях. Дифракция рентгеновских
лучей на пространственной (кристаллической) решетке. Формула
Вульфа-Брэггов. Понятие о рентгеноструктурном анализе
Дифракция Фраунгофера наблюдают при падении параллельных лучей
на щель или систему щелей (дифракционную решетку), например, от
точечного источника, удаленного на бесконечность или помещенного в
фокус собирающей линзы (щель сама по себе является точечным
источником, рис. 5.4).
I
и т.д.
аϕ δ
P
Рис. 5.4
Пусть ширина бесконечно длинной щели а. Тогда разность хода волн от
краев щели δ = a sin ϕ . Если разбить поверхность волнового фронта на зоны
Френеля, то вид дифракционной картины будет определяться числом зон
Френеля m:
λ
δ = a sin ϕ = ± m .
2
(5.4)
Если m – четное, то наблюдается дифракционный минимум, если нечетное,
то максимум. В центральной точке экрана Р щель действует как одна
центральная зона Френеля, здесь интенсивность I прошедшего через щель
света максимальна – так называемый главный центральный максимум.
Одномерная дифракционная решетка представляет собой систему
параллельных щелей равной ширины а, расположенных на равных
расстояниях b друг от друга. Величина d=a+b называется периодом
дифракционной решетки. Дифракционная картина в данном случае кроме
главных минимумов и максимумов будет включать и дополнительные
минимумы и максимумы, обусловленные интерференцией света от разных
щелей. Например, разность хода от краев двух соседних щелей по аналогии с
формулой (5.4)
48
λ
δ = d sin ϕ = ± m .
(5.5)
2
Если m – четное, то наблюдаются дополнительные минимумы, а если
нечетное – главные максимумы. Главные минимумы наблюдаются согласно
условию (5.4) при четных m.
Согласно формуле (5.5) число главных максимумов m ≤ d / λ , все они
(как и минимумы) кроме центрального будут иметь различную окраску,
зависящую от длины волны λ , поэтому дифракционную решетку
используют в качестве спектрального прибора.
Примером пространственной дифракционной решетки являются
естественные симметричные образования – монокристаллы, на которых
дифрагируют рентгеновские лучи. Данное явление положено в основу
рентгеноспектрального и рентгеноструктурного анализа материалов, т.е.
определения состава и структуры кристаллических веществ в силу
индивидуальности строения их кристаллических решеток и, следовательно,
индивидуальности получаемой в результате дифракции на них (электронов)
дифракционной картины.
ϕ
d
ϕ
1
ϕ 2
δ/2 δ/2
Рис. 5.5
Пусть расстояние между атомными плоскостями в кристалле равно d
(рис. 5.5), тогда результат интерференции лучей 1 и 2 будет определяться
разностью их хода по формуле Вульфа–Брэггов
δ = 2d sin ϕ = kλ ,
(5.5)
где k=1, 2, 3, … – порядок дифракционного максимума.
Условие дифракционного максимума для данной длины волны λ
излучения (света) и для данного межплоскостного расстояния d
анализируемого вещества выполняется только при угле ϕ , удовлетворяющем
выражению (5.5), то есть образец (монокристалл) необходимо облучать
только под определенным углом. По методу Дебая–Шерера анализируемое
вещество предварительно размельчают в порошок, при этом среди
множества хаотично ориентированных в порошке маленьких кристалликов
обязательно найдутся ориентированные под нужным углом к рентгеновскому
лучу. По виду дифракционной картины, известному углу облучения ϕ , длине
волны λ по формуле Вульфа–Брэггов (5.5) можно определить
межплоскостное расстояние d и предположить качественно химический
состав вещества.
49
5.4. Понятие о голографии
Идея голографии (holos – греч. весь, grapho – пишу) была впервые
высказана англ. физиком Д.Габором в 1948 г. (Нобелевская премия по физике
1971 г.).
Голография позволяет получить объемное изображение объекта в
отсутствие самого объекта лишь по дифракционной картине от волнового
поля объекта. При получении голограммы объекта (О) сигнальная волна или
предметный пучок 1 (рис. 5.7, а) и опорное излучение 2 (от зеркала З)
испускает один и тот же источник света (лазер Л). Изображение на
фотопленке (Ф) – дифракционную картину, получающуюся в результате
наложения предметной 1 и опорной волн 2, и называют голограммой
объекта.
Для получения изображения (обратный процесс, рис. 5.7, б) голограмма
освещается лазерным излучением с теми же характеристиками, что и при
создании
голограммы
(необходима
высокая
когерентность
и
монохроматичность). В отсутствие объекта с закрытием предметной части
лазерного излучения 1, попадавшего ранее на объект непрозрачным экраном
Э, получим мнимое изображение объекта И на старом месте только с
помощью опорного пучка 2.
2
З
Л
З
1
О
И
Ф
а)
2
Л
1
Э
Ф
б)
Рис. 5.7
Для получения цветного изображения предмета необходимо как при
создании голограммы, так и при ее «проигрывании» одновременно
использовать как минимум три цветных лазера: Red – англ. красный, Green –
зеленый и Blue – голубой по аналогии с компьютерной RGB-палитрой.
В обычной плоской дифракционной картине, например, фотокарточке,
фиксируется распределение амплитуд (интенсивностей) только предметного
пучка от объекта. Объемное изображение в голографии формируется
благодаря тому, что в голограмме фиксируются не только распределение
амплитуд (интенсивностей), но и распределение разностей фаз между
опорным и предметным излучением.
Голография как способ записи информации отличается огромной
плотностью записи по сравнению со всеми известными в настоящее время
способами, так как по любому даже очень маленькому кусочку от исходной
голограммы можно все равно получить исходное объемное изображение
предмета.
50
Лекция 6. Взаимодействие света с веществом
1. Взаимодействие света с веществом (поглощение, рассеяние, дисперсия,
поляризация).
2. Дисперсия света. Классическая теория дисперсии света.
3. Поляризация света. Закон Брюстера. Оптическая анизотропия.
Двойное лучепреломление. Закон Малюса. Вращение плоскости
поляризации.
4. Излучение Черенкова (Вавилова-Черенкова).
6.1. Взаимодействие света с веществом
(поглощение, рассеяние, дисперсия, поляризация)
Оптические
свойства
веществ
или
физические
процессы,
протекающие в веществе при взаимодействии с электромагнитными
волнами (ЭМВ) достаточно разнообразны: пропускание, отражение,
рассеяние
света,
вращение
плоскости
поляризации,
дисперсия,
фотолюминесценция (см. в лекциях далее), нагревание, генерация экситонов,
генерация свободных электронов в веществе или эмиссия их из вещества,
генерация пары носителей электрон–дырка.
В данной лекции речь пойдет о поглощении, рассеянии, дисперсии и
поляризации. Об остальных процессах взаимодействия ЭМВ с веществом
речь пойдет далее в соответствующих по тематике лекциях.
Явление уменьшения энергии световой волны при ее распространении в
веществе, происходящее в результате преобразования энергии ЭМВ во
внутреннюю
энергию
вещества
или
энергию
вторичного
(фотолюминесцентного) излучения, имеющего иной спектральный состав и
иные направления распространения, называется поглощением света.
Согласно закону Бугера–Ламберта интенсивность света, прошедшего
через вещество
I = I 0 e −αx ,
(6.1)
где I0 – интенсивность света на входе в вещество, х – толщина слоя вещества,
α – коэффициент поглощения, обычно α > 0 кроме случаев генерации
лазерного излучения в веществе ( α < 0 , см. далее), для ряда веществ α не
константа, а функция интенсивности излучения, в этом случае говорят о
нелинейном эффекте в оптике.
Разные вещества имеют различный спектр поглощения (т.е.
совокупность частот излучения, избирательно поглощаемого данным
веществом) в зависимости от агрегатного состояния, состава и строения
молекул.
Для газов характерен линейчатый спектр поглощения,
т.к.
поглощение велико в области частот, близких к собственным частотам
колебаний электронов в атомах и атомов в молекулах. Кроме того, наличие
51
узких спектральных полос поглощения объясняется необходимостью
сообщения электронам в атомах газов строго определенных (дискретных)
порций энергии для перехода их с какой-то орбитали на более высокие по
энергиям.
Жидкости и твердые тела (конденсированные среды) имеют, как
правило, сплошной спектр поглощения, состоящий из сравнительно (с
газами) широких полос поглощения. Для конденсированных сред такая
зависимость показателя поглощения от длины волны (частоты) A( λ ) (от
англ. Absorption – поглощение) объясняется сильным взаимодействием
между частицами вещества, что приводит к возникновению множества
дополнительных резонансных частот.
Рассеянием света называется преобразование света веществом,
сопровождаемое изменением направления распространения света и
проявляющееся как несобственное (т.е. только под воздействием падающего
излучения) свечение вещества. В однородных средах в результате
практически постоянного регулярного распределения частиц среды,
являющихся источниками вторичных волн, приводит к тому, что вторичные
волны гасятся в интерференции во всех направлениях. Для неоднородных же
сред неравномерно распределенные в объеме частицы ведут себя как
некогерентные источники света (расстояние между ними различно и может
быть больше длины волны в веществе λ ), в результате среда рассеивает свет
по всем направлениям (туман – капельки влаги).
Явление рассеяния света на частицах, размеры которых малы по
сравнению с длиной волны λ (в мутных средах), называется явлением
Тиндаля. При этом в прошедшем свете будет наблюдаться длинноволновая
его составляющая. Для интенсивности рассеянного света справедлив закон
Рэлея:
I ~ λ−4 ,
где
(6.2)
λ – длина волны падающего на вещество света.
6.2. Дисперсия света. Классическая теория дисперсии света
В связи с зависимостью абсолютного показателя преломления n или
фазовой скорости света v в среде от частоты света v или длины волны λ
(дисперсия) свет различной частоты (цвета) отклоняется призмой на
различные углы: наиболее отклоняется фиолетовый свет, наименее –
красный. Так белый свет (как совокупность всех цветов – частот) разлагается
призмой в спектр (лат. spectrum – видение) – плавно переходящие друг в
друга разноцветные полосы (см. рис. 3.2 и комментарии к нему).
Зависимость абсолютного показателя преломления n от частоты света v в
общем случае нелинейна. Если с ростом частоты v растет показатель n, то
52
дисперсию называют нормальной, если с ростом частоты v показатель n
уменьшается, то дисперсию называют аномальной.
В классической теории дисперсии вынужденные колебания электронов в
атоме считаются происходящими под воздействием квазиупругих сил, сил
сопротивления среды и возмущающей электрической силы (переменного
электрического поля ЭМВ). В приближении равенства нулю коэффициента
затухания (поглощения) света в среде графическая зависимость n(v) имеет
вид (рис. 6.1)
n
A
1
v0
B
v
Рис. 6.1
Для идеальных систем нелинейного участка АВ на графике нет, но для
реальных систем он имеет место быть. Это означает, что бесконечного роста
показателя преломления n не происходит, так как реальные среды поглощают
свет, гасят колебания ЭМВ (происходят потери).
В классической теории дисперсии считается, что каждая среда
характеризуется одной резонансной (собственной) частотой поглощения v0,
хотя в действительности зависимость n(v) более сложна и характеризуется
набором резонансных частот поглощения v0i, вблизи каждой из которых
наблюдается аномальная дисперсия. Наличие данного набора объясняется,
как уже говорилось выше, взаимодействием частиц среды между собой.
6.3. Поляризация света. Закон Брюстера. Оптическая анизотропия.
Двойное лучепреломление. Закон Малюса. Вращение плоскости
поляризации
Свет представляет собой ЭМВ (см. рис. 2.1 и комментарии к нему).
Прибор, превращающий естественный свет в поляризованный, называется
поляризатором, а прибор, определяющий направление колебаний –
анализатором.
Степенью поляризации называют величину
P=
I max − I min
,
I max + I min
53
(6.3)
где Imax и Imin – соответственно максимальная и минимальная интенсивности
частично поляризованного света, пропускаемого анализатором. Для
естественного света Imax=Imin и Р=1, для плоскополяризованного Imin=0 и Р=1.
Поляризованный свет можно получить при падении естественного света
на границу раздела двух изотропных (свойства сред одинаковы по всем
направлениям) диэлектриков. Отраженная и преломленная световые ЭМВ
оказываются частично поляризованными, при этом в отраженном луче
преобладают колебания перпендикулярные плоскости падения, а в
преломленном луче – параллельные плоскости падения (рис. 6.2). Степень
поляризации определяется углом падения α , при некотором его значении,
удовлетворяющем условию
tgα Б = n21 = n2 / n1 ,
αα
γ
π/2
(6.4)
n1
n2
Рис. 6.2
отраженный луч полностью поляризован, а преломленный поляризован
только частично. Данный угол α Б называется углом Брюстера или углом
полной поляризации, а соотношение (6.4) – законом Брюстера. При этом
из закона преломления sin α / sin γ = n21 и закона Брюстера следует, что
отраженный и преломленный лучи взаимно перпендикулярны (рис. 6.2).
Поляризованный свет можно получить и при падении естественного
света на границу раздела двух анизотропных (свойства сред неодинаковы по
всем направлениям) диэлектриков. При этом явление преломления ЭМВ
будет происходить сложнее описанного выше, так может происходить,
например, двойное лучепреломление в анизотропных кристаллах
исландского шпата. Т.е. при преломлении в кристалле может образоваться не
один луч.
В кристаллах можно выделить определенное направление – так
называемую оптическую ось, свойства кристалла одинаковы во всех
направлениях, которые составляют с оптической осью равные углы
(оптическая ось в кристалле может быть не одна). Луч света не
раздваивается, только если идет вдоль оптической оси кристалла. В общем
54
случае скорость луча (а, следовательно, и показатель преломления) зависит
от угла между направлением распространения луча и оптической осью. Если
луч идет в кристалле исландского шпата под углом к оптической оси, то он
раздваивается: один луч является продолжением первоначального луча
(называется обыкновенным, 1 на рис. 6.3), а второй отклоняется от
первоначального (называется необыкновенным, 2 на рис. 6.3).
Необыкновенный луч не подчиняется закону преломления. Плоскость,
проходящая через направление луча света и оптическую ось называется
главной плоскостью или главным сечением кристалла. Колебания
→
светового вектора (вектор E ) в обыкновенном луче происходят в
перпендикулярно главной плоскости, а в необыкновенном – в главной
плоскости (рис. 6.3).
2
1
Рис. 6.3
Так как у обыкновенного и необыкновенного луча показатели преломления
различны, то в пластинке кристалла толщиной d между ними возникает
оптическая разность хода ∆ = (nобыкн − nнеобыкн )d или разность фаз
∆Φ =
2π
λ0
Если
(nобыкн − nнеобыкн )d ( λ0 – длина волны света в вакууме).
пластинка
вырезана параллельно оптической оси и
∆ = (nобыкн − nнеобыкн )d = ±uλ0 , то при u=1/4 пластинка называется
пластинкой в четверть длины волны ( ∆Φ = ±π / 2 ), а при u=1/2 –
пластинкой в полволны ( ∆Φ = ±π ). Плоскополяризованный свет, пройдя
пластинку в четверть длины волны, становится эллиптически или
циркулярно поляризованным, и наоборот. Пройдя же пластинку в полволны,
плоскополяризованный свет гасится либо проходит без изменений. Таким
способом можно определить поляризован ли падающий свет, так как одной
пластинкой (поляризатора) в любую толщину не удастся добиться полного
гашения естественного света.
Если на анализатор падает поляризованный свет интенсивностью I0, то
интенсивность света I на выходе из поляризатора в общем случае
определяется по закону Малюса
I = I 0 cos 2 α ,
55
(6.5)
где α – угол между оптическими осями поляризатора (где получили
поляризованный свет) и анализатора.
Некоторые кристаллы и жидкости (растворы, например, сахара) при
прохождении через них поляризованного луча поворачивают плоскость
поляризации – их называют оптически активными веществами.
Угол поворота плоскости поляризации ϕ
- для твердых тел пропорционален пути d луча света в теле
ϕ = [α ]d ,
(6.6)
где [α ] – удельное вращение или вращательная способность, определяемая
веществом, температурой и длиной волны света;
- для раствора пропорционален пути d луча света в нем и его концентрации С
ϕ = [α ]Сd .
(6.7)
В случае раствора величина [α ] зависит от природы растворяемого и
растворенного веществ, температуры и длины волны света.
6.4. Излучение Черенкова (Вавилова-Черенкова)
Данное излучение было обнаружено П.А.Черенковым (в научной группе
С.И.Вавилова) в 1934 году и теоретически объяснено русскими физиками
И.Е.Таммом и И.М.Франком (все трое в 1958 г. удостоены Нобелевской
премии по физике). Излучением Вавилова–Черенкова называется
голубоватое свечение веществ (газов, жидкостей, твердых тел) под действием
γ -излучения, не зависящее от состава вещества и температуры и не
являющееся люминесцентным. Данное явление наблюдается при движении в
среде частиц со скоростью больше фазовой скорости света в данной среде.
При этом электрон обгоняет свое собственное электромагнитное поле и им
же тормозится, что и вызывает излучение. Данная ситуация возможна и для
любой другой заряженной частицы. Излучение Вавилова–Черенкова
обладает строгой (избирательной) направленностью: только в направлениях,
составляющих острый угол с траекторией движения частицы.
56
Лекция 7. Тепловое излучение
1. Тепловое излучение и его характеристики. Отличие от
люминесцентного излучения. Люминесценция, ее виды.
2. Законы Кирхгофа, Стефана-Больцмана и Вина. “Ультрафиолетовая
катастрофа”. Квантовая гипотеза и формула Планка.
3. Оптическая пирометрия.
7.1. Тепловое излучение и его характеристики. Отличие от
люминесцентного излучения. Люминесценция, ее виды
Наиболее часто из всех видов излучения, обусловленных различными
видами энергии (см. ниже о люминесценции), встречается тепловое
излучение (ТИ) – испускание ЭМВ телами за счет их внутренней энергии.
Люминесценцией называется оптическое излучение (ИК, видимое,
УФ), возникающее в результате электронного возбуждения материала, в
отличие от ТИ, обусловленного только тепловым нагревом материала.
Люминесценция – это всегда избыточное над ТИ излучение, обусловленное
возбуждением материала (среды) за счет внешнего источника энергии. ТИ же
существует практически всегда, даже при стремлении температуры объекта к
абсолютному нулю (0 К). В зависимости от источника энергии возбуждения
люминесценцию можно разделить на:
1)
фотолюминесценцию (возбуждение оптическим излучением);
2)
катодолюминесценцию (возбуждение под действием пучка
электронов или катодных лучей);
3)
радиационную
люминесценцию
(возбуждение
другими
быстрыми частицами или излучением высокой энергии);
4)
электролюминесценцию (возбуждение электрическим полем
или током);
5)
хемолюминесценцию (при химических превращениях);
6)
триболюминесценцию (при растяжении и раскалывании
некоторых кристаллов, например сахара) и так далее.
ТИ свойственно всем телам при любых температурах (даже при
стремлении температуры объекта к абсолютному нулю (0 К)), но при низких
температурах преобладает излучение длинных (ИК и видимых) волн, а при
высоких – коротких (УФ).
Отличительной особенностью ТИ является его равновесность, т.е.
количество излученной в единицу времени с единицы площади тела энергии
может быть равно количеству энергии, поглощенной в единицу времени
единицей поверхности тела.
Количественной характеристикой ТИ является спектральная
плотность энергетической светимости (излучательности тела) –
мощность энергии с единицы площади тела в единицу времени
[Дж/(м2с)]=[Вт/м2]
57
Rv,T =
dWv,v + dv
dv
,
(7.1)
где dWv ,v + dv – энергия, излучаемая с единицы площади в интервале частот
от v до v+dv.
Проинтегрировав по всем частотам, можно получить интегральную
светимость (излучательность) тела
∞
RT = ∫ Rv,T dv .
(7.2)
0
Способность тел поглощать падающее на них излучение характеризуется
(спектральной) поглощательной способностью
Av,T =
dW поглощ
dv
dWdvпадающ
,
(7.3)
где соответственно стоят энергия, поглощенная единицей поверхности тела в
данном интервале частот при данной температуре, и энергия, падающая на
единицу поверхности тела в данном интервале частот при данной
температуре.
Тело, способное поглощать все падающее на него излучение в любом
спектральном диапазоне при любой температуре, называется абсолютно
АЧТ
черным телом (АЧТ). Соответственно для АЧТ Av ,T
= 1. В природе АЧТ
нет, но в некоторых интервалах частот реальные тела близки к ним по
характеристикам. Примером АЧТ может служить непрозрачная сфера
диаметром D с отверстием диаметром d ≤ 0,1D; при этом интенсивность
вышедшего из отверстия света приблизительно равна нулю в результате
многократного отражения и поглощения луча внутри сферы. Этим
объясняется зияющая чернота окон домов и узких горных лазов, шахт.
Многие реальные тела можно с достаточной точностью описать с
помощью модели серого тела (СТ), для которого в данном интервале для
всех частот поглощательная способность A
CT
T
= const < 1 зависит только
от температуры Т.
7.2. Законы Кирхгофа, Стефана-Больцмана и Вина. “Ультрафиолетовая
катастрофа”. Квантовая гипотеза и формула Планка
Рассмотрим законы ТИ, установленные на основе начал термодинамики.
Количественную связь между Rv ,T и Av ,T установил немецкий физик
Г.Р.Кирхгоф (1824–1887) в 1859 году. Согласно закону Кирхгофа
отношение этих величин не зависит от природы тел, являясь для всех тел
универсальной функцией частоты v и температуры Т:
58
Rv,T
Av,T
= rv,T ,
(7.4)
АЧТ
где rv ,T – универсальная функция Кирхгофа. Для АЧТ rv,T = R v ,T , т.е.
значение функции Кирхгофа всегда равно значению спектральной
излучательности АЧТ при данной температуре.
Из закона (7.4) следует:
АЧТ
1) всегда Rv ,T < R v ,T
;
2) если тело не поглощает в данном спектральном диапазоне ( Av ,T = 0 ),
то оно в нем и не излучает ( Rv ,T = 0 ).
Анализируя опытные зависимости австрийские физики Й.Стефан (1835–
1893) экспериментально в 1879 году, а Л.Больцман (1844–1906) теоретически
в 1884 году установили зависимость от температуры для интегральной
светимости (излучательности) АЧТ
АЧТ
RT
−8
∞
= f (T ) = ∫ rv,T dv = σT 4 ,
(7.5)
0
−8
где σ = 5,67 ⋅ 10 Дж/(м сК )= 5,67 ⋅ 10 Вт/(м2К4) – постоянная Стефана–
Больцмана. Закон Стефана–Больцмана (7.5) однако не давал зависимости
светимости (излучательности) от частоты (длины) волны излучения. Данная
зависимость была теоретически установлена в 1893 году немецким физиком
В.Вином (1864–1928) в его двух законах – законе излучения Вина и законе
смещения Вина. Закон излучения Вина – закон распределения энергии в
спектре равновесного излучения АЧТ в зависимости от температуры, этот
закон справедлив только при больших частотах (малых длинах волн),
представляет собой предельный случай общего закона М.Планка. Так как
ниже мы рассмотрим закон Планка, то закон излучения Вина, представляя
теперь лишь исторический интерес, здесь рассматриваться не будет. Закон
смещения Вина утверждает, что длина волны λ max , на которую приходится
максимум энергии в спектре равновесного излучения АЧТ, обратно
пропорциональна абсолютной температуре Т излучающего тела (см. рис. 7.1):
λmax = b / T ,
(7.6)
2
4
−3
где b = 2,9 ⋅ 10 м ⋅ К – постоянная Вина.
Закон (7.6) хорошо согласуется с опытом в области больших частот
(малых длинах волн).
Законы (7.5) и (7.6) являются частными, поэтому были предприняты
попытки получить выражение универсальной функции Кирхгофа как
функции и частоты, и температуры, т.е. в виде rv ,T = f (v, T ) или
rλ ,T = f (λ , T ) .
59
rλ ,T
T1>T2>T3
T1
T
T2
T3
λmax
Рис. 7.1
λ
Английские физики Р.Дж.У.Рэлей (1842–1919) и Дж.Х.Джинс (1877–
1946) независимо друг от друга в 1900 году была получили формулу
(Рэлея–Джинса):
rv,T =
2πv 2
c
2
⋅ < ε >=
2πv 2
2
⋅ kT ,
(7.7)
c
где с – скорость света в вакууме, < ε >= kT – средняя энергия
гармонического осциллятора с собственной частотой v (см. Часть II
настоящего пособия, Колебания). Опыт показывает, что формула (7.7)
справедлива в области малых частот v и высоких температур Т. Попытка
получить из формулы (7.7) закон Стефана–Больцмана (7.5) получила
название «ультрафиолетовой катастрофы»:
АЧТ
RT
∞
= ∫ rv,T dv =
2πkT
c
0
хотя согласно формуле (7.5) R
АЧТ
T
2
∞
∫v
2
dv = ∞ ,
(7.8)
0
~ T 4 . Подобная неудача объясняется
неверным выражением для средней энергии гармонического осциллятора –
колеблющихся в узлах кристаллической решетки атомов АЧТ.
Верное выражение для средней энергии гармонического осциллятора с
собственной частотой v и, следовательно, для rv ,T было получено в 1900 году
немецким физиком–теоретиком М.К.Э.Л.Планком (1858–1947) на базе его
квантовой гипотезы. Согласно квантовой гипотезе Планка свет излучается
порциями – квантами с энергией каждого кванта ε = hv , где
h = 6,63 ⋅ 10 −34 Дж ⋅ с – постоянная Планка. Таким образом, ТИ можно
рассматривать как поток квантов – фотонов. С учетом статистических
закономерностей (см. в последующих лекциях) при рассмотрении такого
квантового коллектива частиц (фотонов) М.Планк 14 декабря 1900 года на
заседании Берлинского физического общества продемонстрировал вывод
формулы
60
rv,T =
2πv 2
c
2
⋅ < ε >=
2πv 2
c
2
⋅
hv
.
 hv 
exp  − 1
 kT 
(7.9)
14 декабря 1900 года считается днем рождения новой – квантовой
физики, а формула (7.9), согласующаяся с опытом, получила название
«закон излучения Планка». Из формулы (7.9) могут быть получены все
выше рассмотренные частные случаи (законы) (7.5)– (7.7).
7.3. Оптическая пирометрия
Законы ТИ используются для измерения температуры раскаленных
светящихся тел. Измерение температуры по зависимости Rv ,T или RT от
температуры называется оптической пирометрией. В зависимости от
применяемого закона ТИ различают радиационную, цветовую и яркостную
температуры:
1) радиационную температуру определяют исходя из закона
Стефана–Больцмана (7.5)
T p = 4 RTАЧТ / σ ;
(7.10)
так как свойства реальных тел более соответствуют модели серого тела
(далее индекс «с»), то с учетом равенства выражений R
АЧТ
T
= σT р4 и
R с = АТс σT 4 можно получить T p = 4 АTс Т ; так как для реальных тел
T
Av,T < 1, то, следовательно, радиационная температура меньше истинной
Tp < T ;
2) цветовую температуру определяют исходя из закона смещения
Вина (7.6) по измеряемой длине волны, соответствующей максимуму
энергии в спектре равновесного излучения АЧТ
Т ц = b / λmax ;
(7.11)
подобная методика также работает только для серых тел (цветовая и
истинная температуры равны), для тел с избирательным поглощением не
работает (если в спектре тела есть множество полос поглощения, то нельзя
определить необходимую единственную длину волны для максимума, так
как их много);
3) яркостную температуру Тя определяют на основе модели АЧТ и
закона Кирхгофа (7.4): на фоне исследуемого тела помещают модель АЧТ и
подбирают ее температуру Тя так, чтобы тела стали неразличимы на фоне
АЧТ
друг друга, при этом выполняется равенство rλ ,T = R λ ,T ; яркостная
температура меньше истинной T я < T , так как для реальных тел Av,T < 1.
61
Лекция 8. Основы квантовой оптики
1. Внешний фотоэффект и его законы. Фотоумножители. Понятие
внутреннего фотоэффекта. Фотоэлементы, их применение.
2. Корпускулярно-волновая двойственность свойств света. Масса и
импульс фотона. Давление света в опытах П.Н.Лебедева.
3. Эффект А.Комптона.
8.1. Внешний фотоэффект и его законы. Фотоумножители, их
применение. Понятие внутреннего фотоэффекта. Фотоэлементы, их
применение
Вырывание электронов из твердых и жидких веществ под действием
света называется внешним фотоэлектрическим эффектом или внешним
фотоэффектом (ВФ) или фотоэлектронной эмиссией. Ионизация атомов
(молекул) газов называется фотоионизацией.
ВФ был впервые обнаружен и описан одним из основоположников
электродинамики – немецким физиком Г.Р.Герцем (1857–1894) в 1886–87
годах, а в 1897–98 годах Дж.Дж.Томпсон (1856–1940) (лорд Кельвин) по
отклонению в электрических и магнитных полях установил, что испускаются
именно электроны.
Систематическое изучение ВФ при облучении катода светом различной
интенсивности, проводимое с 1888 года русским физиком А.Г.Столетовым
(1839–1896) позволило ему установить первые экспериментальные
закономерности:
1) наиболее эффективно ультрафиолетовое излучение;
2) испускаются отрицательные заряды;
3) сила фототока (а мы знаем, что это число вырываемых из катода в
единицу времени электронов) пропорциональна интенсивности света.
Позднее были сформулированы три закона ВФ, первый из которых
почетно называется законом Столетова:
1) сила фототока (число фотоэлектронов) пропорциональна
интенсивности света;
2) максимальная скорость фотоэлектронов определяется частотой света
и не зависит от его интенсивности;
3) для каждого вещества существует «красная граница» ВФ vкр, т.е. для
света с частотой менее vкр ВФ не наблюдается.
Третий закон вполне объясним, если вспомнить о многообразии веществ,
видах химических связей, различном состоянии поверхности объектов и т.п.
Экспериментально
была
установлена
практически
полная
безынерционность ВФ, т.е. при прекращении облучения светом катода ВФ
практически мгновенно прекращался. Трудности в теоретическом описании
ВФ заставили усомниться в универсальности волновой теории света.
Например, зависимость начальной скорости фотоэлектронов от частоты, а не
от амплитуды вектора напряженности световой волны и безынерционность
62
ВФ заставили отказаться от гипотезы о раскачивании электронов в веществе
электрическим полем световой волны.
В 1905 году А.Эйнштейн на основании квантовой гипотезы М.Планка
(14 декабря 1900 года – день рождения новой, неклассической – квантовой
физики) предложил свое уравнение для однофотонного (одна порция света –
квант–фотон поглощается одним электроном) ВФ:
mv 2max
ε = hv = Aвых +
,
2
(8.1)
где ε = hv – энергия одного фотона, передаваемая одному электрону, откуда
часть энергии идет на разрыв связей в решетке и вырывание фотоэлектрона
из вещества (на работу выхода Авых, обычно для металлов порядка эВ) и на
сообщение ему кинетической энергии. При этом ни Авых, ни частота v не
зависят от интенсивности.
При большой интенсивности света, например, при лазерном облучении
возможно наблюдение нелинейного многофотонного (N квантов–фотонов
поглощаются одним электроном) ВФ:
mv 2max
Nε = Nhv = Aвых +
.
2
(8.2)
Соответственно уравнения (8.1) и (8.2) называются уравнениями
Эйнштейна для одно- и многофотонного ВФ.
При некоторой энергии фотона, меньшей hvкр, его энергии не хватает на
выход электрона из вещества, что объясняет третий закон ВФ –
существование «красной границы»
vкр = Aвых / h
(8.3)
и более эффективное действие ультрафиолетового излучения.
При приложении некоторого отрицательного напряжения U0 ни один
фотоэлектрон не достигает анода, т.е.
где е – заряд электрона.
mv 2max
= eU 0 ,
2
IА
(8.4)
IН2
IН1
интенсивность
растет
U0
0
Рис. 8.1
63
UКА
Уравнение (8.1) с учетом равенств (8.3) и (8.4) дает нам еще одну форму
уравнения Эйнштейна для ВФ
eU 0 = h(v − vкр ) ,
(8.5)
удобную при анализе вольт-амперной характеристики (рис. 8.1).
Существование тока насыщения Iнi объясняется тем, что при большом
положительном напряжении все фотоэлектроны при данной интенсивности
облучения достигают анода.
Количественной характеристикой ВФ является квантовый выход Г
– число вылетевших электронов, приходящихся на один фотон, падающий на
поверхность тела.
Фотоэлектронным умножителем (ФЭУ) называется прибор для
усиления слабых световых сигналов в электрические, основанный на ВФ с
использованием вторичной электронной эмиссии. ФЭУ состоит из
фотокатода и нескольких электродов (динодов), напряжение на каждом из
которых на 50–100 В выше, чем у предыдущего. Свет, падающий на
фотокатод вырывает фотоэлектроны, которые на каждом из динодов на
своем пути вырывают дополнительные электроны (вторичная электронная
эмиссия). В результате число электронов растет лавинообразно. ФЭУ
n
характеризуются коэффициентом усиления электронного тока K = σ (n –
число динодов), достигающим значений 109– 1011, так что даже отдельные
фотоэлектроны создают на выходе ФЭУ импульсы тока большой амплитуды.
ФЭУ применяются в различной оптоэлектронной аппаратуре.
Внутренний фотоэффект – перераспределение электронов по
энергетическим состояниям в конденсированной среде (это любые твердые
тела и жидкости, включая растворы расплавы веществ), происходящее при
поглощении электромагнитного излучения (в том числе и светового). В
полупроводниках и диэлектриках проявляется в виде изменения
электропроводности
среды
(фотопроводимость
при
появлении
дополнительных носителей тока в полупроводниках), диэлектрической
проницаемости ε (фотодиэлектрический эффект) или в возникновении
фотоэдс. В металлах (проводники I рода) внутренний фотоэффект
практически незаметен из-за их и без того высокой электропроводности.
Фотоэлемент – прибор, обычно монополупроводниковый или с
применением нескольких полупроводников, работа которого основана на
изменении проводимости (сопротивления, а, следовательно, и силы тока) в
результате
фотопроводимости
(появление
или
рекомбинация
дополнительных носителей тока – дырок и электронов при изменении
интенсивности освещения). Иногда речь может идти фотоэлементах как о
фоторезисторах. Фотоэлементы обладают, как правило, существенно
нелинейной вольт-амперной характеристикой (ВАХ). Для такой ВАХ закон
Ома может выполняться только на небольших локальных ее участках или не
64
выполняться вообще. Фотоэлементы применяют, например, в турникетах на
входе в метро: человек, проходя через турникет, закрывает собой
фотоэлемент от освещения лампочкой (светодиодом) напротив, в результате
чего изменяется сопротивление фотоэлемента (его ток) – турникет при
неоплате срабатывает на запирание.
Фотоэлементы с запирающим для носителей тока слоем называются
вентильными фотоэлементами (на вентильном эффекте). Они могут
состоять из пары и более слоев полупроводников одного (гомопереходы или
электронно-дырочные переходы) или разного вида или одной или более пары
слоев металл–полупроводник одного или разного вида (гетеропереходы).
Контакт такой пары слоев может при определенных условиях препятствовать
прохождению носителей тока. Вентильные элементы часто называют
диодами (подробнее см. в одной из последующих лекций). Используемые в
диодах материалы могут существенно различаться по виду и легированию
(введению в их кристаллическую решетку дополнительных атомов других
элементов), что существенно влияет на характеристики диодов. Основное
достоинство таких диодов – компактность, а недостаток – их разрушение или
деградация их характеристик из-за слабой устойчивости к агрессивным
внешним условиям (перепады температура, высокая температура, влажность,
излучения и т.п.), что требует дополнительных мер защиты (обычно
спецкорпуса, экраны и т.п.). В связи с этим в космических исследовательских
аппаратах в зоне действия высоких температур и резких перепадов
температур (например, Венера) применяют вакуумные диоды и триоды (см.
Часть II данного пособия), много более устойчивые к данным явлениям.
Внутренний фотоэффект ответственен за возникновение фотоэдс при
освещении особого – вентильного контакта (см. в лекциях далее) металл–
полупроводник светом: в металле возникает избыток электронов, а в
полупроводнике – избыток отсутствия электронов (дырок). Если к данной
структуре подключена замкнутая цепь, то в ней потечет фототок под
действием фотоэдс.
Вообще же вентильный эффект в той или иной степени лежит в основе
действия практически всей современной полупроводниковой электроники
либо напрямую (диоды, транзисторы), либо косвенно, например, для
ограничения (локализации и накопления) носителей тока в определенных
областях приборов (лазеры, солнечные элементы).
8.2. Корпускулярно-волновая двойственность свойств света. Масса и
импульс фотона. Давление света в опытах П.Н.Лебедева
Фотон – порция света, виртуальная частица, корпускула – квант света с
энергией ε 0 = hv , который всегда (в любой среде) находится в движении, в
связи с чем его масса покоя принята равной нулю. Масса фотона находится
из известного соотношения Эйнштейна для массы и энергии
65
mγ = ε 0 / c 2 = hv / c 2 ,
(8.6)
где с – скорость света в вакууме.
Так как энергия фотона через его импульс
ε 0 = hv = pγ c , c = λv и
волновое число k = 2π / λ , а постоянные Планка h /( 2π ) = h , то
pγ =
ε0
c
=
hv h
= = hk .
c λ
(8.7)
Выражения (8.6) и (8.7) связывают волновую характеристику света
частоту v (длину волны λ ) с корпускулярными (корпускула – лат. частица)
mγ , pγ , ε 0 . Таким образом, свет (электромагнитное излучение вообще)
можно рассматривать либо как волну, либо как поток частиц, корпускул,
квантов – фотонов. Практически все известные физики в свое время
обсуждали вопрос: так что же такое свет – волна или поток частиц? В
настоящее время ответ: и то, и другое одновременно, а при описании
отдельных явлений удобно пользоваться либо только волновой, либо только
корпускулярной стороной его свойств. Дело в том, что в различных явлениях
свет проявляет либо волновые свойства (распространение, интерференция,
дифракция, поляризация), либо корпускулярные (практически все процессы
взаимодействия света с веществом кроме поляризации, причем тем ярче, чем
меньше длина волны λ и, следовательно, больше частота v и энергия
фотонов ε 0 , так как c = λv и ε 0 = hv , например, см. выше внешний
фотоэффект).
Наличие у фотонов импульса означает существование светового
давления на поверхности освещаемых тел, так как давление – это импульс,
передаваемый единице поверхности в единицу времени всеми падающими
частицами.
Существование давления света подтвердилось в опытах нашего
соотечественника, создателя первой физической школы в России
П.Н.Лебедева (1866–1912) в 1901 году с твердыми телами, а в 1909 году с
газами (более трудная задача), что явилось одним из подтверждений
волновой теории Дж.Максвелла. Данное давление на предметы на Земле на
десять порядков меньше атмосферного и составляет около 5 ⋅ 10
3,7 ⋅ 10
−8
−6
Па или
мм.рт.ст. (760 мм.рт.ст эквивалентно 1 атм. или 101325 Па).
Установка Лебедева представляла собой легкий каркас с укрепленными на
нем симметрично по обе стороны в виде крылышек светлыми и темными
дисками толщиной 0,01–0,1 мм. Каркас мог свободно вращаться на тонкой
стеклянной нити, по углу закручивания которой измеряли вращающий
момент и давление света на набор светлых и темных дисков (а определенную
66
сторону подвеса). Темные диски меньше отражают фотоны, а светлые –
больше.
Пусть коэффициент отражения от поверхности данного тела R
(отношение числа отраженных фотонов к числу падающих N в единицу
времени на единице поверхности), тогда RN фотонов отразится, а R(1–N) –
поглотится. При столкновении тела много меньшей массы (фотона) с
неподвижным телом много большей массы (поверхностью, см. Часть I
данного пособия, Теория удара) импульс передаваемый телу большой массы
равен удвоенному импульсу ударяющего легкого тела. Тогда давление Р –
суммарный импульс р, передаваемый единице поверхности ∆S в единицу
времени ∆t равен
P=
ε
p
hv
hv
hv
= 2 RN + (1 − N ) R = N (1 + R) = N 0 (1 + R) . (8.9)
c
c
∆S∆t
c
c
Формула (8.9) совпадает по форме с получаемой в рамках (волновой) теории
электромагнитных волн Дж.Максвелла.
8.3. Эффект А.Комптона
Наиболее наглядно квантовые (корпускулярные) свойства света
проявляются в эффекте, обнаруженном американским
физиком
А.Х.Комптоном (1892–1962) в 1922–23 годах (Нобелевская премия по физике
1927 года, позднее принимал участие в создании первых атомных бомб,
сброшенной на японские города Хиросиму и Нагасаки).
ϕ
λ СП
λ0
Рис. 8.2
Его
опыты
по
рассеянию
рентгеновского
излучения
(примерно
6 ⋅ 10−12 < λ < 2 ⋅ 10 − 9 м) легкими веществами (парафин, графит, т.п.)
показали, что регистрируемая длина волны рассеянного (прошедшего через
вещество) излучения λ меньше длины волны падающего рентгеновского
излучения λ0 . Оказалось, что разность ∆λ = λ0 − λ зависит от только от
угла рассеяния ϕ (между направлением первоначального пучка и активной
областью регистрирующего прибора – спектрографа СП, рис. 8.2)
∆λ = λ0 − λ = 2λk sin 2 (ϕ / 2 ) ,
67
(8.10)
−12
где λk = h /( me c) = 2,43 ⋅ 10
м – постоянная Комптона – комптоновская
длина волны электрона отдачи, здесь me – масса покоя электрона.
Согласно классической, волновой теории в веществе должны возникать
вторичные волны той же частоты, что реально не происходит. Комптон дал
объяснение наблюдаемому эффекту на основании квантовых представлений
на базе квантовой гипотезы М.Планка (1900 г.). Согласно Комптону при
рассеянии излучения на электронах вещества происходит передача части
энергии и импульса от фотона электрону (отдачи) в веществе, т.е. по законам
сохранения импульса и энергии можно записать соответственно:
We0 + Wф0 = We + Wф ,
→
→
(8.11)
→
p ф0 = p e + p ф ,
(8.12)
2
где We 0 = me c – энергия покоя электрона отдачи, Wф0 = hv0 = hω
( h /( 2π ) = h , ω = 2πv ) – начальная энергия фотона, Wф = cpф – конечная
энергия фотона после рассеяния; здесь и далее индекс «0» – первоначальное
(падающее) излучение или первоначальное состояние электрона в веществе,
без индекса «0» – рассеянное (прошедшее вещество) излучение или электрон
отдачи, «е» – электрон отдачи, «ф» – фотон излучения.
2
2 2
С учетом выражения We = c pe + m c
формула (8.11) примет вид
тe с 2 + cpф0 = c pe2 + m 2c 2 + сpф или
pe2 + m 2c 2 + pф .
тe с + pф0 =
pe
pф
ϕ
(8.13)
pф0
Рис. 8.3
Далее из векторного построения для импульсов (рис. 8.3) по теореме
косинусов имеем
68
pe2 = pф2 0 + pф2 − 2 pф0 pф cos ϕ .
(8.14)
С учетом формулы (8.14) можно записать выражение (8.13) в виде
тe с + pф0 − pф =
pф2 0 + pф2 − 2 pф0 pф cos ϕ + m 2c 2 .
Возведем
обе
части в квадрат и приведем подобные:
2тe сpф0 − 2тe сpф − 2 pф0 pф = −2 pф0 pф cos ϕ ,
pф тe с + pф0 (1 − cos ϕ ) = pф0 me c . Окончательно получаем
[
]
me c
.
(8.15)
тe с + pф0 (1 − cos ϕ )
= hω0 / c можно переписать формулу (8.15) в
pф = pф0
С учетом pф = hω / c и pф 0
виде
ω = ω0
me c 2
2
тe с + hω0 (1 − cos ϕ )
.
(8.16)
Из формулы (8.16), полученной на основе элементарного рассмотрения
комптоновского рассеяния видно, что ω = ω0 только при ϕ = 0 (т.е. когда
2
рассеяния не происходит) при hω << me c , что и наблюдается в
действительности.
Если ω выразить через λ ( ω = 2πc / λ ) и записать выражение вида (8.10), то
мы получим выражение комптоновской длины волны электрона отдачи в
виде
λk = h /(me c) = const ,
(8.17)
заявляемом без вывода в формуле (8.10).
Из приведенного рассмотрения видно, что изменение длины волны
рассеянного излучения ∆λ = λ0 − λ действительно не зависит от длины
волны падающего излучения λ0 , вида вещества, а определяется только углом
рассеяния ϕ .
69
Лекция 9. Элементы квантовой механики - I
1. Волновые свойства вещества. Гипотеза де-Бройля.
2. Экспериментальное подтверждение гипотезы де-Бройля (опыты
Дэвиссона –Джермера, Тартаковского, Томсона, Фабриканта).
3. Волновые свойства микрочастиц. Принцип неопределенности
Гейзенберга.
4. Уравнение Шредингера. Волновая функция и физический смысл
квадрата ее модуля.
5. Вычислительный аппарат квантовой механики. Операторы.
6. Парадоксы квантовой механики. Многомировая интерпретация
квантовой механики Х.Эверетта.
9.1. Волновые свойства вещества. Гипотеза де-Бройля
В физике начала XX века возник целый ряд задач, при решении которых
пришлось рассматривать излучение как поток частиц энергии - особенности
излучения абсолютно черного тела, фотоэффект, эффект Комптона,
боровская полуклассическая-полуквантовая теория атома.
Установлены энергия и импульс каждой такой частицы — фотона:
 E = hω ,
 p = 2πh .

λ
(9.1)
Физика в своем развитии часто встречалась с границами применимости
существующих теорий. При этом разрабатывались новые, более общие
решения. «Более общие» в том смысле, что старая теория входила в новую
как частный, ограниченный случай. Совсем по-другому сложились
взаимоотношения волновой и квантовой оптики. Ни одна из них не стала
частью другой. Остались задачи (дифракция, интерференция, поляризация
электромагнитных волн) которые решаются в рамках только волновой
теории излучения. С другой стороны, были обнаружены явления
(фотоэффект, эффект Комптона, “ультрафиолетовая катастрофа” в теории
Рэлея-Джинса теплового излучения), которые объясняются только
корпускулярной природой света. Как пошутил Уильям Брэгг, «сложилась
ситуация, когда каждый физик вынужден по понедельникам, средам и
пятницам считать свет состоящим из частиц, а в остальные дни - из
волны».
Лишь при объяснении немногих явлений (прямолинейного
распространения света, эффекта Доплера, давления света и ряда других)
можно с равным успехом следовать как одной, так и другой теории.
Такая двойственность теории излучения – корпускулярно-волновой
дуализм света привела молодого французского физика Луи Виктора деБройля, потомка великой королевской династии Бурбонов, к мысли о
глобальном характере этой двойственности.
70
Если волна – частица, то и материальная частица – волна.
Волна-частица обладает энергией и импульсом (9.1). Де Бройль назвал
ее “фазовой волной”. Вслед за Пьером-Луи де Мопертюи, капитаном драгун
и одновременно оригинальным мыслителем, сформулировавшим принцип
наименьшего действия (“если в природе происходит само по себе какое
либо изменение, то необходимое для этого количество действия есть
наименьшее из возможных”), и Гамильтоном, блестяще применившим этот
принцип в механике, а также Ферма, провозгласившим принцип
наименьшего времени для путей световых лучей, де Бройль ищет
объяснение на основе и объединении указанных экстремальных принципов.
По де-Бройлю (1924) любая материальная частица обладает волновыми
свойствами и может характеризоваться соответствующей частотой и длиной
волны
2πh 2πh

λ
=
=
,

p
mv

E

ω= .

h
(9.2)
Главный постулат де-Бройля означает, что каждая частица материи
является местом и источником связанного с ней колебания. Если эта частица
движется, то ее колебание представляется неподвижному наблюдателю в
виде волны. Используя этот подход, де-Бройль решил задачу о движении
электрона в атоме и пришел к боровским квантовым орбитам (т.е. объяснил
происхождение спектров). Эта новая концепция привела де-Бройля к закону
Планка для излучения черного тела. В последующих работах де-Бройль
показал, что новые принципы позволяют количественно объяснить эффект
Доплера, отражение от движущегося зеркала, давление излучения, приводя к
тем формулам, которые дает волновая теория.
В научном мире гипотеза де-Бройля о волновых свойствах материи была
воспринята неоднозначно. В 1925 году Эйнштейн, рекомендуя Максу Борну
познакомиться с диссертацией Луи де-Бройля, сказал буквально следующее:
«Прочтите ее! Хотя и кажется, что ее написал сумасшедший, но написана она
солидно!»
В 1926 году эта необычная гипотеза получила свое первое
экспериментальное подтверждение. А в 1929 году де Бройль стал лауреатом
Нобелевской премии по физике.
9.2.
Экспериментальное подтверждение гипотезы де-Бройля
(опыты Дэвиссона –Джермера, Тартаковского, Томсона, Фабриканта)
В 1923 году в одном из своих докладов Парижской Академии наук деБройль говорил о возможных путях экспериментальной проверки своей
теории:
71
«Поток электронов, проходя через узкую щель, должен был бы дать
явление дифракции».
Однако первое подтверждение справедливости волновой механики было
получено в опытах по интерференции электронов. Первый эксперимент
осуществили в 1927 г. американские физики Клинтон Джозеф Дэвиссон
(1881–1958) и Лерстер Джермер (1896–1971).
Пучок ускоренных электронов направлялся на монокристалл никеля.
Одна из вершин этого кристалла сошлифована перпендикулярно к большой
диагонали кристаллической ячейки. Отраженные электроны улавливались
«цилиндром Фарадея», соединенным с гальванометром. Этот измерительный
цилиндр мог перемещаться по дуге вокруг кристалла. Сам кристалл тоже мог
поворачиваться относительно оси, совпадающей с направлением падающего
пучка электронов. Были воспроизведены с дополнениями условия опыта,
поставленного Дэвиссоном еще в 1921 г, работавшим тогда в фирме ”Белл
телефон” – он еще тогда обнаружил закономерность в углах отклонений
электронов, отраженных от никелевой пластинки, но не смог найти
подходящего объяснения.
Расстояние между атомными плоскостями монокристалла никеля – d
было известно из рентгенографических исследований. Сила тока рассеянных
электронов оказалась максимальной при определенном значении угла
рассеяния θ. Длина волны, соответствующая этому интерференционному
максимуму, оказалась равной d cosθ = m λ ⇒ λ = 1.65 Å. В то же время легко
рассчитать
длину
волны
де-Бройля
падающих
электронов
o
λ = 2πh / p = 2πh /(mv) = 1.65 A , где v = 2eU m — скорость электронов
при ускоряющем напряжении U = 54 В.
Совпадение этих длин волн и явилось первым подтверждением
волновых свойств частиц – в данном случае электронов. Вскоре удалось
наблюдать экспериментально и дифракцию электронов. Это явление
исследовалось в лабораториях П.С.Тартаковского, Джорджа Паджета
Томсона (1892–1975)(сына “Джи–Джи”), Валентина Александровича
Фабриканта (1907–1991) и др. ученых. Схемы их опытов очень близки.
I
S
и т.д.
e
P
Рис. 9.1
Тонкий пучок ускоренных электронов пронизывал золотую фольгу (в
опытах П.С. Тартаковского) и падал на фотопластинку. Результат дифракции
электронов на кристаллической решетке приведен на рис. 9.1.
72
9.3. Волновые свойства микрочастиц. Принцип неопределенности
Гейзенберга
На рис. 9.2 приведена схема мысленного эксперимента, поясняющего
необычные свойства микрочастиц.
I
I
S
eA
e
B
2
1
интенсивности
P
Рис. 9.2
Здесь пучок ускоренных электронов падает на экран с двумя узкими
щелями. Если закрыть одну щель, то электроны, прошедшие через другую,
дадут определенное распределение интенсивности. Подобное же
распределение, но несколько смещенное будет получено, если закрыть
вторую щель и открыть первую. Теперь оставим открытыми обе щели.
Здравый смысл подсказывает, что новое распределение частиц должно
равняться сумме первых двух (рис.9.2, распределение 1). Однако опыт
свидетельствует совсем о другом (рис. 9.2, распределение 2). Распределение
электронов отвечает интерференции двух когерентных волн! Таким образом,
на движение каждого отдельного электрона оказывают влияние обе щели!
Этот мысленный эксперимент подтверждает тот факт, что микрочастицаволна не просто «маленькое» материальное тело. Это объект, наделенный
особыми свойствами, присущими элементам микромира. Так, например,
нельзя указать траекторию микрочастицы, измерить одновременно ее
скорость и координату…
Рассмотрим еще один пример: дифракцию микрочастиц на щели.
Поток микрочастиц подлетает к экрану со щелью (рис. 9.3). Пусть экран
перпендикулярен потоку.
х
0
ϕ
р
∆x
y
ϕ
Э1
Э2
Рис. 9.3
ϕ
∆х
ϕ
Рис. 9.4
73
Э1
Э2
Достоверно известно, что перед щелью х-компонента импульса
микрочастицы рx = 0. Здесь скорость частиц перпендикулярна экрану, т.е. оси x.
Погрешность этого сведения ∆рx = 0. Однако при этом совершенно не
определена х-координата частицы.
Теперь рассмотрим движение частицы-волны за щелью ∆х. За щелью
дифрагировавшие частицы будут отклонены в пределах угла ±φ. Это
максимальный угол, соответствующий дифракционному минимуму
∆x sin ϕ = λ . Отклонение на угол φ означает, что у микрочастицы появилась хкомпонента импульса ∆p x = p sin ϕ =
h
λ
sin ϕ . Кроме того, теперь в щели мы
можем указать х-координату с погрешностью ∆x . Тогда ∆p x = 2πh / ∆x или
∆p ⋅ ∆x = 2πh = h .
Последний результат обобщен Гейзенбергом и сформулирован как один
из
основных
принципов
квантовой
механики:
произведение
неопределенностей значений двух сопряженных переменных не может
быть меньше постоянной Планка h
∆A ⋅ ∆B ≥ h
(9.3)
Сопряженными величинами являются координаты и соответствующие
проекции импульса, энергия и время. Произведение неопределенностей этих
величин не может быть меньше по порядку величины постоянной Планка ħ
т.е.
∆x ⋅ ∆p x ≥ h, 
∆y ⋅ ∆p y ≥ h,

∆z ⋅ ∆p z ≥ h, 
∆E ⋅ ∆t ≥ h. 
(9.4)
Последнее соотношение означает, что чем точнее мы хотели бы
измерить энергию частицы, тем большее время займет это измерение.
9.4. Уравнение Шредингера. Волновая функция и ее физический
смысл
В 1926 году швейцарский физик Эрвин Шредингер записал в явном виде
уравнение для волн волновой механики. Шредингер знал о волнах де Бройля,
и искал теорию для таких экстравагантных волн – волн вещества. Трудно
сейчас воспроизвести работу его мысли. Но те, кто был современником
Шредингера, говорят, что то было озарение – подобно яблоку Ньютона и
ванне Архимеда. По одной из версий, Эрвин с супругой отдыхал на
Цюрихском озере – “барашки” на поверхности напомнили ему уже известные
в физике “волновые пакеты”. В те годы он однажды написал:
“…Движущаяся частица есть не что иное, как пена на волновой
радиации, образующей материю мира”.
74
Формально уравнение Шредингера (УШ) можно “вывести” следующим
образом.
Согласно гипотезе де-Бройля, каждой движущейся микрочастице
должна быть сопоставлена волна. Пусть свободной микрочастице, летящей
вдоль оси x, соответствует плоская волна
Ψ = ae − i (ωt − kx ) .
(9.5)
Свяжем параметры волны с энергией и импульсом микрочастицы
E = hω ⇒ ω =
E
P
, P = hk ⇒ k = .
h
h
Теперь уравнение (9.5) можно записать иначе:
Ψ
i
( px− Et )
h
= ae
.
(9.6)
Продифференцируем это выражение один раз по времени и дважды – по
координате:
∂Ψ
i
1 ∂Ψ
= − EΨ ⇒ E = ih
,
∂t
h
Ψ ∂t
2
1 2 ∂ 2Ψ
∂ 2Ψ  i  2
2
.
=  p Ψ ⇒ p =− h
2
2
Ψ
h
 
∂x
∂x
(9.7)
(9.8)
В случае свободного движения нерелятивистской частицы, ее энергия и
импульс связаны простым соотношением E=p2/2m. Теперь, принимая во
внимание это соотношение, легко связать уравнения (9.7) и (9.8)
h 2 ∂ 2Ψ
∂Ψ
−
⋅ 2 = ih
.
2m ∂x
∂t
(9.9)
Это и есть волновое УШ для одномерного движения свободной
частицы.
В случае движения микрочастицы в силовом поле, потенциальная
энергия U, полная энергия E и импульс р частицы связаны соотношением
p2/2m=E–U. Объединяя в этом выражении уравнения (9.7) и (9.8), получим:
1 h 2 ∂ 2 Ψ 1 ∂Ψ
= ih
−U .
− ⋅
⋅
Ψ 2m ∂x 2 Ψ ∂t
Чаще “временную производную” функции выделяют:
∂Ψ
h 2 ∂ 2Ψ
−
⋅ 2 + UΨ = ih
.
(9.10)
2m ∂x
∂t
Это УШ для одномерного движения микрочастицы в силовом поле.
Для частицы, движущейся в произвольном направлении, запишем волновое
уравнение в таком виде:
75
h2
∂Ψ
−
⋅ ∇ 2 Ψ + UΨ = ih
.
2m
∂t
(9.11)
Это уравнение получило название нестационарного волнового УШ. Здесь
2
∇ =
∂2
∂x
2
+
∂2
∂y
2
+
∂2
∂z
2
= ∆ − оператор Лапласа.
При движении микрочастицы в стационарном (неизменном во времени)
силовом поле, решение УШ может быть представлено произведением двух
множителей, один из которых является функцией только координат, а другой
– только времени
Ψ ( x, y , z , t ) = ψ ( x, y , z ) ⋅ e
E
−i   t
h
.
Используем это решение в дифференциальном уравнении (9.10)
E
E
E
−i   t
h 2 −i  h t 2
 E  −i  h t
h

−
⋅e
∇ ψ + Uψ e
= ih − i ψe
.
2m
 h
Сократив на общий множитель
(9.12)
exp[− i (E / h )t ] ,
(9.13)
получим УШ для
h2 2
стационарных состояний −
⋅ ∇ ψ + Uψ = Eψ или
2m
∇ 2ψ +
2m
h
2
(E − U )ψ
= 0.
(9.14)
Из указанных вариантов нестационарное уравнение (9.11) является
универсальным, хотя оно не дает в явном виде силовой функции U(r,t) (эта
функция приобретает смысл потенциальной энергии только в стационарных
– консервативных с точки зрения классической механики полях). Важное
отличие этого волнового уравнения от классических уравнений
распространения различных волн состоит в присутствии мнимых
коэффициентов в УШ. Эти мнимые коэффициенты принципиально
неустранимы и в волновой Ψ-функции. Тем самым математически
подтверждается тот факт, что волнам де Бройля, сопряженным с частицами,
нельзя приписать «физического существования». Поэтому сам де Бройль
называл эту волну «фиктивной», а Эйнштейн окрестил её «волнойпризраком». Но вскоре за этими волнами закрепилось другое название:
«волны вероятности».
76
В 1927 годы Гейзенберг и Борн пришли к выводу, что квадрат модуля
волновой функции в любой точке пространства и в любой момент времени
есть мера того, что соответствующая частица находится в этой точке и в этот
момент. Иными словами Борн и Гейзенберг предполагают существование
частицы и связанной с ней непрерывной волны Ψ, но частица не имеет ни
определённой скорости, ни определённой траектории. Речь может идти лишь
о вероятности нахождения частицы в той или иной области пространства.
Эту вероятность и определяет волна Ψ-функции – решение УШ.
Таким образом, вероятность dP обнаружить частицу в объёме dV можно
записать в следующем виде
2
dP = A Ψ dV = AΨ ∗ ⋅ ΨdV ,
(9.15)
где A – коэффициент пропорциональности.
Так как вероятность обнаружить частицу в пространстве равна единице
∫
∫
∗
(«достоверное событие»), то dP = A Ψ ⋅ Ψ dV = 1 . Обычно выбирают ψфункцию так, чтобы A = 1, т.е.
∗
∫ dP = ∫ Ψ ⋅ ΨdV = 1.
(9. 16)
Этот интеграл представляет собой так называемое условие
нормировки.
Волновая функция (Ψ), удовлетворяющая условию нормировки,
называется нормированной функцией. Для нормированной Ψ-функции
dP = Ψ ∗ ⋅ Ψ dV = Ψ 2 dV .
В случае стационарного силового поля
E
E
−i  t
− i  t
dP / dV = Ψ ∗ ⋅ Ψ = e  h  ψ ∗ ⋅ e  h  ψ
= ψ ∗ ⋅ψ .
Это означает, что плотность вероятности обнаружить частицу в заданной
точке стационарного поля, не меняется со временем:
dP / dV = ψ ∗ ⋅ψ = ψ 2 ≠ f (t ) .
(9.17)
Ситуация необычная – впервые в нашем изложении возникла величина,
сама по себе не имеющая физического смысла даже в рамках модели (вроде
материальной точки, идеального газа, идеального теплового двигателя и
т.п.): Ψ-функция есть математическая абстракция (“волна-призрак”!), и
только квадрат ее модуля, определяемый (9.17), есть плотность вероятности
нахождения частицы.
Необходимо подчеркнуть, что в волновой механике нет таких понятий
классической механики как траектория, “точное положение” или “точная
скорость” микрочастицы, Ψ-функция позволяет предсказать лишь
вероятность обнаружения частицы в различных точках пространства.
77
Исходя из описанного выше смысла равенства (9.17), волновая функция
(ВФ) обладает следующими свойствами:
а) ВФ должна быть конечной, так как вероятность не может быть
бесконечной;
б) ВФ должна быть однозначной, так как вероятность не может быть
многозначной;
в) ВФ и её производные должны быть непрерывными функциями, т.к.
вероятность не может изменяться скачками (а)–в) – так называемые условия
регулярности ВФ);
г) т.к. вероятность нахождения частицы где-то в пространстве равна 1
(событие достоверное), то должно выполняться условие нормировки (9.16).
Отсюда также автоматически следует, что ВФ должна быть квадратично
интегрируема.
Если же ВФ не нормирована на 1, то есть интеграл не равен 1, а равен N,
то её нормируют, снабжая множителем 1 N . В общем случае интеграл
должен быть конечен.
2πx
1 − cos
πx
a )dx = С 2 ( x − a sin 2πx ) =
Например, ∫ С 2 sin 2
dx = ∫ С 2 (
2
2 2π
a
a
0
0
а
a
2
a
С 2a
2
, а ВФ имеет вид
= С ( − 0) − С (0 − 0) =
=1 ⇒ С =
a
2
2
πx
2
ψ ( x) =
sin( ) .
a
a
2
В следующей лекции мы увидим, что подобной функцией описывается
состояние частицы в потенциальной яме, например, состояние электрона в
тонкой металлической пленке.
мы встречались с принципом суперпозиции
r В электродинамике
r r
r
Е р = ∑ Еi , F = ∑ Fi ,ϕ = ∑ ϕ i и т.п. В квантовой механике (КМ)
i
i
i
принцип суперпозиции (наложения) состоит в следующем: если
возможны состояния частицы (или системы частиц), описываемые ВФ Ψ1,
Ψ2,… Ψn, то возможно и состояние, описываемое их линейной комбинацией:
ψ = ∑ Сiψ i ,
(9.18)
i
где Сi – комплексные, в общем случае, числа;
2
∑ Сi = 1.
Функции
ϕi при
i
этом называются базисными.
Например, если обратиться к опыту по дифракции электронов на двух
щелях (рис. 9.2), то при закрытой щели А (В) плотность вероятности будет
W A = W1 = ψ 1ψ 1 * , (WB = W2 = ψ 2ψ 2 *) , при открытых обеих щелях
ψ = ψ 1 + ψ 2 и этому состоянию соответствует новое распределение
78
вероятностей:
W = ψψ * = ψ 1ψ 1 * +ψ 2ψ 2 * +
ψ 1 *ψ 2 + ψ 2 *ψ 1
⇒
W ≠ W1 + W2 (т.е. картина не является простым сложением “элементарных”
картин, как следует из классической теории). Складываются именно ВФ, а
не вероятности – это важная особенность суперпозиции состояний в
микромире.
9.5. Вычислительный аппарат квантовой механики
КМ является разделом теоретической физики и для освоения ее на
уровне применения к различным нестандартным задачам требуется изучение
соответствующего отдельного курса. Студенты-физики изучают курс КМ в
течении двух семестров. В нашем же изложении необходимо познакомиться
с основными принципами этой удивительно изящной теории и ее
математическим аппаратом. В КМ физические величины не могут вводиться
непосредственно (если они, конечно, не заданы условием), для их
вычисления вводят понятие оператора.
Под оператором понимается совокупность операций (умножение на
число, на функцию, дифференцирование и т.д.), которые в определенной
последовательности следует проделать с функцией f(x). В результате
получится другая функция – g(x):
Lˆ ( f ( x )) = g ( x ).
(Под x здесь понимается совокупность переменных, от которых зависит
функция, для ВФ в общем случае это – координаты и время; в стационарном
случае от времени ВФ не зависит).
Если в результате действия оператора на функцию получается сама же
эта функция, но с некоторым числовым множителем a, т.е. задано уравнение
вида
Aˆ f ( x) = аf ( x)
и определён оператор Â (требуется найти а и f(x)), то удовлетворяющая всем
требованием для ВФ а) – г) функция f(x) называется собственной функцией
оператора Â , принадлежащей его собственному значению а. Совокупность
всех собственных значений называется спектром оператора, который может
быть дискретным, непрерывным или смешанным.
Если частица находится в состоянии, описываемом функцией Ψ, и эта
функция является собственной функцией некоторого оператора, то
соответствующая этому оператору физическая величина имеет точное
значение, а именно – собственное значение. Например, если
ÊΨ = Е ⋅ Ψ ,
то энергия Е имеет вполне определенное значение, неопределенность
энергии ∆Ε=0. Из соотношения неопределенностей следует, что время жизни
в этом состоянии бесконечно велико.
В простейшем – одномерном – случае ВФ (9.6) можно записать в виде:
79
Ψ = ae
E p 
−i  t − x 
h h 
= ae −i (ωt − kx) ,
(Д1)
где ω=2πν=E/ћ=2πE/h – циклическая частота “волны вероятности”, а
k=p/ћ=2πp/h=2π/λ – соответствующее волновое число. Продифференцируем
формулу (Д1) по х; производная будет частной, так как Ψ зависит не только
от x, но и от t :
E
p 
1 −i  h t − h x 
p
∂Ψ
= −a pe
= − Ψ или
ih
∂x
ih
− ih
∂Ψ
= pΨ
∂x
(здесь p – это px, т.к. волна распространяется только вдоль оси x).
Рассмотрим последнее выражение: чтобы получить функцию Ψ,
умноженную на величину импульса p (собственное значение оператора
импульса, который мы пока не знаем!), необходимо саму функцию Ψ
продифференцировать по х и умножить на (-iћ), именно в таком порядке.
Таким образом, мы получили выражение для оператора импульса по оси х :
pˆ x = −ih
d
,
dx
аналогично, для операторов импульса по осям y и z получим:
d
d
, и pˆ z = −ih .
dy
dz
v
r
rˆ r
ˆ
ˆ
p
=
i
p
+
j
p
+
k
pˆ z ,
Введя векторный оператор импульса
x
y
pˆ y = −ih
записать:
можно
r
p̂ = −ih∇ ,
rd r d vd
+ j +k
– оператор “набла” (см часть 1, Механика,
dx
dy
dz
где ∇ = i
Лекция
5).
2
Используя
2
соотношения
классической
механики
2
p 2 = p x + p y + p z = p x p x + p y p y + p z p z , можно получить оператор
квадрата импульса
2
2
2
d
d
d
pˆ = ( pˆ x ) + ( pˆ y ) + ( pˆ z ) = −h (
+ 2 + 2 ) = −h 2 ∆ ,
2
dx
dy
dz
d2
d2
d2
где ∆ =
+
+
– оператор Лапласа.
dx 2 dy 2 dz 2
2
2
2
2
2
Тогда оператор кинетической энергии:
2
ˆ
p
h
Eˆ k = Tˆ =
=−
∆.
2m
2m
Оператор координаты представляет собой просто умножение на эту
переменную (проверьте!):
80
xˆ = x .
Оператор радиус-вектора
r
v
rˆ r
r
r = i xˆ + j yˆ + k zˆ = r .
Поскольку полная механическая энергия частица состоит из энергии
движения (кинетической) и энергии взаимодействия с другими частицами и
полями (потенциальной, которая является функцией координат), то оператор
полной энергии в общем случае будет иметь вид:
2
2
ˆ
p
h
Нˆ = Eˆ k + Uˆ =
+ Uˆ = −
∆ + U ( x, y , z ) ,
2m
2m
а
конкретный
вид
оператора
потенциальной
энергии
r
Uˆ = U ( r , t ) = U ( x, y, z , t ) зависит от условий конкретной задачи. Ĥ
называют также оператором Гамильтона или гамильтонианом системы.
Что можно заключить из изложенного?
Пусть частица находится в некотором состоянии. Из УШ при задании
определенных начальных и конечных условий можно получить ВФ Ψ,
описывающую это состояние. Для некоторого оператора Ф̂ она может
оказаться собственной. Это и будет наблюдаемое на опыте значение
величины f, (координаты, проекции импульса на какую-либо ось, энергии и
т.д.). Собственных функций и собственных значений может оказаться
несколько: Ψ1, Ψ2,… Ψn, и f1, f2, …, fn. Это будет означать, что в этом
состоянии частица (или система) может иметь разные значения величины L.
Однако найденная ВФ Ψ может оказаться и несобственной. В таком
квантовом состоянии физическая величина f не имеет определенного
значения. Это означает, что, согласно третьему постулату КМ, в этом случае
результатом измерения физической величины f в системах квантового
ансамбля будут только значения из спектра собственных значений оператора
Ф̂ . Причём в различных системах квантового ансамбля измерения будут
давать разные значения f1, f2, …, fn и т.д. При этом каждое из fn в квантовом
ансамбле будет обнаруживаться с определённой вероятностью Wn .
В процессе измерения квантовая система взаимодействует с
измерительным прибором. В результате такого взаимодействия квантовая
система, находящаяся в состоянии, описываемом ВФ ψ , переходит с
вероятностью Wn в состояние с ВФ ψ n . Такой переход называется
редукцией или коллапсом ВФ.
В квантовых системах, в которых величина f не имеет определённого
значения, имеет смысл находить среднее значение, т.е. математическое
ожидание результатов измерений в серии из большого числа измерений
(теорема о среднем из теории вероятности):
< f >= ∑ Wn f n .
n
81
Ψ = ∑ C n Ψn , где коэффициенты C n
Обратимся к выражению (9.18),
n
находятся по формуле C n =
∫NΨn ΨdV .
Среднее значение величины f
R
может быть определено как
2
< f >= ∑ Wn f n = ∑ Cn f n .
n
(Д2)
n
С учётом выражений для коэффициентов преобразуем формулу (Д2):
< f >= ∑ CnCn * f n = ∑ Cn f n
n
По
n
свойству
< f >= ∑ Cn
n
n
R
собственных
∫ Ψ * (Ψn )dV
RN
=
∫ Ψ Ψ * dV = ∑ C ∫ Ψ * f Ψ dV .
∫
RN
n
n
N
функций
n
R
n
N
f n Ψ n = Фˆ n Ψ n ,
тогда
Ψ * (∑ CnФΨn )dV . С учётом свойств
n
Ф̂ получаем:
∑ CnФˆ Ψ n = Фˆ (∑ Cn Ψ n ) = Фˆ Ψ .
линейности оператора
n
n
Окончательно для расчёта среднего значения физической величины f в
квантовом состоянии системы, описываемом ВФ Ψ, получим формулу
< f >=
∫ Ψ *(Фˆ Ψ )dV
(Д3)
RN
(расчёты средних значений х, рх, Е для частицы в потенциальной яме см. в лекциях далее).
Это и подобные по структуре выражения можно записывать коротко, используя
придуманный П.Дираком способ сокращенной записи: <m| Ф̂ |m>. Такие острые скобки
называют скобками Дирака, или брэкет-скобками (от англ. слова bracket), причем |m>
назвают бра-вектором, а <m| - кет- вектором.
Таким образом, КМ позволяет дать численную оценку потенциальных
возможностей того или иного поведения квантового объекта. И хотя
вероятность того или иного результата измерения в КМ относится к
отдельному объекту, для экспериментального определения численного
значения этой вероятности необходимо многократное повторение измерений
в квантовом ансамбле одинаковых систем.
А. Эйнштейн писал: « Некоторые физики, в том числе и я сам, не могут
поверить, что мы раз и навсегда должны отказаться от идеи прямого
изображения физической реальности в пространстве и времени или что мы
должны согласиться с мнением, будто явление в природе подобны игре
случая…» Однако внедрение случайности в жизнь Вселенной не
порождает хаоса, а наоборот самоорганизацию.
Важным в КМ является вопрос о возможности точного измерения в
некоторой квантовой системе двух разных физических величин (например,
импульса и координаты, энергии и интервалов времени, кинетической и
потенциальной энергии и т.д.). Некоторая физическая величина считается
82
измеренной точно в данной квантовой системе, если каждое её измерение в
квантовом ансамбле одинаковых систем приводит к одному и тому же
результату измерения. При этом предполагается, что эксперимент проведён
идеально и приборные погрешности исключены.
Выше показано, что физическая величина f может быть точно измерена
только в такой системе, квантовые состояния которой описываются ВФ,
являющейся одной из собственных функций соответствующего этой
величине оператора Ф̂ . При этом вовсе не обязательно, чтобы в этом
квантовом состоянии была возможность так же точно измерить другую
физическую величину b. Величины f и b могут быть одновременно точно
измерены только в том случае, если соответствующие им операторы
имеют общую систему собственных функций.
Ф̂ и В̂
Покажем, что если два оператора А̂ и В̂ имеют систему собственных
функций, то между ними существуют некоторые коммутационные
соотношения и результаты последовательности действия операторов на ВФ
не зависят от порядка их применения. Действительно, пусть Ψn ( n = 1, 2,... )
являются собственными функциями оператора как
А̂ , так и В̂ . Тогда
Aˆ ( Bˆ Ψ n ) = Aˆ (bn Ψ n ) = bn ( Aˆ Ψ n ) = bn an Ψ n ,
Bˆ ( Aˆ Ψ ) = Bˆ (a Ψ ) = a ( Bˆ Ψ ) = a b Ψ ,
n
n
n
n
n
n n
n
an , bn – собственные значения операторов А̂ и В̂ , соответствующие их
общей собственной функции Ψn . Тогда
Aˆ ( Bˆ Ψ n ) = Bˆ ( Aˆ Ψ n ) .
(Д4)
Так как любая ВФ Ψ может быть представлена в виде линейной комбинации
собственных функций Ψ = ∑ C n Ψn , то в силу линейности квантовоn
механических операторов для любой ВФ должно выполнятся
коммутационное соотношение (Д4), которое в операторной форме имеет вид:
А̂ В̂ = В̂ А̂
или
ˆ ˆ  = AB
ˆ ˆ − AB
ˆ ˆ =0
Сˆ =  AB

(Д5)
(коммутатор операторов равен нулю).
Таким образом, если две разные физические величины могут быть
одновременно точно измерены, то соответствующие им операторы А̂ и В̂
должны быть коммутирующими (см. формулу (Д5)). Справедливо и обратное
утверждение. К примеру, для операторов
ˆ ˆ x ] Ψ = xˆ ( pˆ x Ψ ) − pˆ x ( xˆ Ψ ) = x(−ih
[ xp
x̂
и pˆ x имеем:
∂Ψ
∂
) + ih ( xΨ ) = ihΨ ≠ 0 ,
∂x
∂x
83
(Д6)
т.е. одновременно точно измерить координату x и проекцию импульса p x
частицы нельзя. Так математический аппарат КМ описывает факты,
отраженные в соотношении неопределенностей Гейзенберга.
В заключение вопроса о соотношении неопределённостей (9.4) сделаем
важное замечание: величины ∆x и ∆p x ( ∆y и ∆p y , ∆z и ∆p z ) в формуле
(9.4) имеют смысл интервалов, в которые попадают значения координаты и
проекции импульса при повторных многократных измерениях, проводимых
над множеством независимых тождественных частиц, находящихся в одном
и том же квантовом состоянии. Строго установить границы интервалов
нельзя, они всегда условны.
В КМ математическим объектам и операциям над ними всегда
соответствуют физические объекты и управляющие их движением законы.
Советский физик А.В.Фок в своей книге «Начала квантовой механики»
отмечал, что можно составить целый словарь для перевода КМ с
математического языка на физический. В качестве примера приведём одну из
страничек такого словаря (табл. 9.1).
Таблица 9.1
Математика
Волновая функция
Ψ
2
Квадрат модуля Ψ = ΨΨ *
Условия нормировки
∫ Ψ * ΨdV = 1
RN
)
Линейный эрмитов оператор Φ
Собственная функция Ψn оператора
Φ̂ , соответствующая собственному
значению fn
Квадрат модуля коэффициента в
разложении ВФ Ψ в ряд по собственным
функциям
Физика
Состояние квантовой частицы
Плотность вероятности
обнаружения частицы
Достоверность наличия
частицы в пространстве
Физическая величина f
Состояние квантовой
частицы, в котором значение
физической величины f равно fn
Вероятность при измерении f
получить значение fn
Ψn оператора Φ̂
Интеграл
ˆ dV
∫ Ψ * ΦΨ
RN
Коммутативность операторов А̂ и
B̂ :
А̂ B̂ = B̂ А̂
Среднее значение
(математическое ожидание)
физической величины f в заданном
квантовом состоянии
Принципиальная возможность
одновременно наблюдать и точно
измерять физические величины a и
b, являющиеся собственными
значениями операторов А̂ и B̂
соответственно,
соответствующие их общей
функции Ψn
84
9.6. Парадоксы квантовой механики. Многомировая интерпретация
квантовой механики Х.Эверетта
Проблема измерения в квантовой механике приводит к ряду парадоксов
– противоречий, с которыми наш “здравый смысл”, опирающийся на
привычные рассуждения, не справляется!
Достаточно широко известен парадокс шредингеровского кота. В
закрытом ящике находится кот, а рядом с ним в том же ящике – атом
радиоактивного изотопа, счетчик продуктов распада и устройство, которое
при срабатывании счетчика разбивает ампулу с ядом. Пока атом не распался,
с котом все в порядке, но когда атом распадается, под действием продуктов
распада срабатывает счетчик, по его сигналу специальное устройство
разбивает ампулу, и кот умирает от яда. Далее вступает в силу
вероятностный характер квантовой механики. Неизвестно, когда атом
распадется, в каждый данный момент имеется лишь определенная
вероятность распада. А точнее – в каждый данный момент атом находится в
суперпозиции двух состояний: состояния, когда он еще не распался, и
состояния, когда он распался.
И в результате возникает парадокс. Подходя к закрытому ящику, мы
должны, согласно законам квантовой механики, считать, что система
(атом+кот) находится в суперпозиции двух состояний: (нераспавшийся
атом+живой кот) и (распавшийся атом+мертвый кот). Но, открыв ящик, мы,
разумеется, никогда никакой суперпозиции не обнаружим, а увидим либо
живого кота (и еще не распавшийся атом), либо мертвого кота (и уже
распавшийся атом). Описание системы зависит, следовательно, от того,
открыли мы ящик или еще не открыли. В этом и состоит парадокс. В более
общих терминах, описание системы после измерения зависит от того,
осознал ли наблюдатель результат измерения или нет. В случае
шредингеровского кота измерением можно считать всю описанную
процедуру, а результатом измерения – то, что наблюдатель видит, открыв
ящик. При этом драматическая ситуация со смертью кота призвана лишь
усилить психологическое воздействие на того, кто рассматривает эту
ситуацию.
На самом деле парадоксальность возникает в любом квантовом
измерении: пока результат измерения не осознан наблюдателем, этот
наблюдатель описывает состояние системы как сосуществование
(суперпозицию) двух или более альтернатив. Если же результат
измерения уже осознан, наблюдатель описывает состояние как одну из
альтернатив. Заметим, что происходящее нельзя объяснить лишь
отсутствием у наблюдателя информации о результате измерения. Такое
незнание результата измерения, которое сменяется знанием, если этот
результат осознан, ничего удивительного собой не представляет и сплошь и
рядом встречается и в классической физике, и в обыденной жизни. В
квантовой механике все гораздо серьезнее, так как можно строго доказать, в
том числе экспериментально, что перед измерением на самом деле
85
сосуществуют все альтернативы, и пока наблюдатель не осознал, какой
результат дало измерение, он обязан, следуя законам квантовой механики,
описывать состояние системы как сосуществование (суперпозицию) всех
альтернатив.
Парадоксальность
происходящего
при
квантовом
измерении
“беспредела” еще более подчеркивается в “парадоксе друга Вигнера”.
Юджин Поль Вигнер (1902–1979), выдающийся американский физиктеоретик в своей работе 1961 года рассмотрел ситуацию, в которой не он сам,
а его друг проводит измерение некоторой квантовой системы, а потом
сообщает ему результат измерения. Результат, в конечном счете, сводится к
тому, что система находится в одном из двух состояний, Ψ1 или Ψ2.
Экспериментатор узнает о состоянии системы по вспышке света в
измерительном устройстве. И в этом случае, как и в случае кота Шредингера,
перед измерением система находится в состоянии, являющемся суперпозицией состояний Ψ1 и Ψ2. А как описать состояние, в котором система
находится после измерения? Оказывается, это опять зависит от сознания
наблюдателя. Если экспериментатор еще не посмотрел на прибор, то он
описывает состояние как суперпозицию Ψ1 и Ψ2. Если уже посмотрел, то
либо как Ψ1 , либо как Ψ2, (в зависимости от того, что именно он увидел).
Описание состояния системы зависит от того, осознал ли экспериментатор
состояние системы или нет.
Это мы видели уже в парадоксе шредингеровского кота. Однако Вигнер
вносит новый элемент за счет того, что его друг-экспериментатор передает
информацию об измерении ему, Вигнеру. Пока Вигнер не получил этой
информации, он описывает состояние системы как суперпозицию Ψ1 и Ψ2.
Получив информацию, описывает уже по-другому, либо как Ψ1 , либо как Ψ2
(в зависимости от того, каково содержание переданной информации). Значит,
описание состояния системы Вигнером зависит от того, вошла ли в его
сознание информация о результате измерения, переданная ему его другом
экспериментатором. Парадоксальность ситуации подчеркивается следующим
рассуждением. Вигнер говорит: “Если после окончания эксперимента я
спрошу моего друга: Что ты чувствовал по поводу вспышки света перед тем,
как я тебя спросил? — он ответит: Я уже сказал тебе, я видел (не видел)
вспышку. Другими слонами, вопрос о том, видел или не видел он вспышку,
был уже решен в его уме прежде, чем я спросил его”. Чтобы ясно увидеть,
что здесь странного (парадоксального), переведем это на язык формул.
В статье Вигнера делался вывод, что живой наблюдатель играет
особую роль в квантовой механике, нарушая каким-то образом
линейный характер эволюции. Если в сознание наблюдателя входит
информация о результате намерения, то описание состояния становится
таким, которое не может получиться при эволюции, описываемой
линейным оператором. Статья Вигнера была написана давно, еще в 1961
году, и ее аргументы кажутся на первый взгляд наивными. На самом деле,
однако, они вскрывают глубокие и действительно весьма своеобразные
86
черты квантовых измерений, которые хорошо понятны с чисто формальной,
математической стороны, но плохо уживаются с нашей интуицией.
В лекции было показано, как описывается измерение в квантовой
механике. Если быть кратким, то основой этого описания является, вопервых, вероятностное распределение по альтернативным результатам
измерения и, во-вторых, постулат редукции, то есть переход от суперпозиции
альтернатив к одной из этих альтернатив. Такое описание позволяет дать
ответы на все вопросы, обычно задаваемые в физике, и предсказать
(вероятностным образом) поведение любых реальных физических систем.
Никакие парадоксы или концептуальные проблемы не мешают этим
предсказаниям. Квантовая теория измерений хорошо работает.
Почему же возникают парадоксы, и с чем связано их возникновение?
Нетрудно заметить, что парадоксы возникают каждый раз в том случае, когда
упоминаются не только объективные аспекты измерения (состояние системы,
состояние прибора), но и субъективный его аспект — что видит, или сознает,
наблюдатель. Это чрезвычайно важно. Хорошо работающая часть квантовой
теории измерений – это та ее часть, которая остается после устранения
субъективного элемента, сознания наблюдателя. Заметим, что после
устранения наблюдателя нет никакой причины выделять один результат
измерения (один член суперпозиции), а следует работать со всем множеством
альтернативных результатов измерения, сопоставляя каждому из них его
вероятность.
Проблема в том, что сознание наблюдателя в контексте к квантовой
теории измерений – это то, что остается за пределами прибора. Более
того, описание измерения существенно не изменится, если какие-то части
прибора, отражающие результат измерения, описывать как части измеряемой
системы. Это относится и к тем структурам в мозгу, которые отражают
результаты измерения. Еще Гейзенберг заметил, что нельзя однозначно
определить границу между измеряемой системой и прибором (точнее —
между измеряемой системой и измеряющей средой, и которую следует
включить и наблюдателя как материальную систему). Действительно,
описание измерения принципиально не изменится, если включить в
измеряемую систему и некоторые части прибора, состояние которых зависит
от результата измерения. Можно, например, отнести к измеряемой системе
чувствительный элемент прибора, непосредственно взаимодействующий с
измеряемой системой, затем и регистрирующую часть прибора, его стрелку,
потом фотоны, летящие от стрелки к глазу наблюдателя и несущие информацию о результате измерения, затем отнести к измеряемой системе глаз
наблюдателя, затем также нерп, несущий информацию от глаза к мозгу,
затем зрительную часть коры головного мозга и т. д. Таким образом, граница
между измеряемой системой и тем, что мы называем прибором, по существу
произвольна.
Концепция Эверетта была предложена еще в 1957 году, сам Эверетт
называл ее интерпретацией квантовой механики, основанной на понятии
относительного состояния, однако позднее, после работ Уилера и Де-Витта,
87
она стала называться многомировой интерпретацией (это название связано
с тем, что интерпретация Эверетта допускает существование многих
(фактически бесконечного числа) классических реальностей, которые можно
наглядно представлять себе как множество классических миров).
В концепции Эверетта (а точнее, в эквивалентной ей многомировой
интерпретации) предполагается, что различные компоненты суперпозиции
соответствуют
различным
классическим
реальностям,
или
классическим мирам. Принимается, что эти реальности, или миры,
совершенно равноправны, то есть ни один из них не более реален, чем
остальные. В результате мы получаем картину многих миров в смысле
Эверетта-Уилера-ДеВитта. А как же быть с сознанием? Ведь каждый
наблюдатель видит один результат измерения, в его сознании, казалось бы,
неизбежно происходит редукция, выбор одной комноненты суперпозиции из
двух (или из многих). Не противоречит ли это концепции многих миров?
Кажущееся противоречие разрешается очень просто: сознание наблюдателя
как бы расщепляется (разделяется), так что в каждом из классических
миров этот наблюдатель видит то, что в этом мире происходит. Покажем это.
Обозначим вектором χ0 начальное состояние наблюдателя, когда он еще
не осознал результаты измерения (быть может, оно еще не закончилось, а
быть может, он еще не посмотрел на приборы). Тогда состояние тройной
системы (измеряемая система + прибор + наблюдатель) перед измерением
описывается как (С1Ψ1+С2Ψ2Ψ1)Ф0χ0. Обозначим через χ1 (соответственно
χ2) состояние наблюдателя в момент, когда он уже видит (осознает), что
измерение дало результат 1 (соответственно 2). В этих обозначениях полная
система (измеряемая система + прибор + наблюдатель) после измерения, но
до
осознания
результата
измерения
находится
в
состоянии
(С1Ψ1Ф1+С2Ψ2Ф2)χ0, а после осознания – в состоянии С1Ψ1 Ф1χ1+С2Ψ2Ф2χ2.
В «эвереттовской» интерпретации этого выражения каждое слагаемое
(компонента суперпозиции) соответствует своей классической реальности,
или своему миру. В каждом из этих миров наблюдатель видит (осознает) то,
что произошло именно в этом мире. В мире, обозначенном номером 1,
наблюдатель находится в состоянии χ1. Это значит, что он осознал, что
измерение дало результат 1, то есть что измеряемая система и прибор
находятся в состоянии Ψ1Ф1. Аналогично в мире с номером 2 тот же
наблюдатель находится в состоянии χ2, то есть в его сознании картина
происходящего соответствует состоянию Ψ2Ф2 измеряемой системы и
прибора.
Таким образом, сознание наблюдателя расслаивается, разделяется, в
соответствии с тем, как квантовый мир расслаивается на множество
альтернативных классических миров. В нашем примере альтернатив всего
две, в общем случае альтернативных классических миров после измерения
оказывается столько, сколько альтернативных результатов может дать измерение. Заметим, впрочем, что классических миров на самом деле может
быть сколько угодно, даже бесконечное количество, и после измерения они
88
лишь распадаются на классы (и этом случае тоже бесконечные),
соответствующие альтернативным результатам измерения.
В обычной (копенгагенской) картине измерения происходит редукция
состояния или, что то же, выбор одного альтернативного результата
измерения из всех возможных. Это можно назвать выбором альтернативы.
Все альтернативы, кроме выбранной, после редукции исчезают. Переходя к
эвереттовской интерпретации, мы видим, что редукции или выбора одной
альтернативы (с отбрасыванием остальных) не происходит. Вместо этого
происходит расслоение, или разделение, состояния квантового мира на
альтернативные классические «реальности», или миры. Сознание
наблюдателя воспринимает различные классические миры независимо друг
от друга. Условно можно сказать, что сознание разделяется на компоненты,
каждая из которых воспринимает лишь один классический мир. Субъективно
наблюдатель воспринимает происходящее так, будто существует лишь один
классический мир, именно тот, который он видит вокруг себя. Однако,
согласно концепции Эверетта, на самом деле во всех альтернативных мирах
имеются как бы «двойники» этого наблюдателя, ощущения которых дают
каждому из них картину того мира, в котором «живет» именно он.
В интерпретации Эверетта возникает некоторая двойственность,
довольно трудная для осмысления. Все альтернативы реализуются, и
сознание наблюдателя разделяется между всеми альтернативами. В то же
время индивидуальное сознание наблюдателя субъективно воспринимает
происходящее гак, будто существует лишь одна альтернатива, в которой он
живет. Другими словами, сознание в целом разделяется между
альтернативами, но индивидуальное сознание субъективно воспринимает
лишь одну альтернативу. Каждая “компонента” сознания не знает, что
существуют другие компоненты, и интерпретирует воспринимаемую ею
картину как единственную реальность. На самом же деле существует
множество “реальностей”, и ни одна из них не более (и не менее) реальна,
чем остальные. Очень важно понимать, что в любом эвереттовском мире все
наблюдатели видят одно и то же, их наблюдения идеально согласованы друг
с другом (если, конечно, не говорить о возможных чисто человеческих
ошибках, а иметь в виду идеальных наблюдателей). Чтобы показать это,
обобщим предыдущие формулы так, чтобы в них фигурировали состояния
двух наблюдателей. Пусть первоначальное состояние измеряемой системы,
прибора и двух наблюдателей имеет вид (С1Ψ1+С2Ψ2)Ф0χ0(1)χ0(2). Тогда в
силу линейности квантово-механической эволюции после измерения это
состояние
перейдет
в
состояние
С1Ψ1Ф1χ1(1)χ1(2)+С2Ψ2Ф2χ2(1))χ2(2).
Корреляция, описываемая этим вектором, такова, что либо оба наблюдателя
находятся в состоянии, обозначенном номером 1 (то есть видят первый
результат измерения), либо оба находятся в состоянии с номером 2 (то есть
видят второй результат). Вектор состояния после измерения не может включать факторы χ1(1)χ2(2) или χ2(1)χ1(2), которые означали бы, что один
наблюдатель видит результат наблюдения 1, а второй видит результат 2.
89
Таким образом, несогласованность наблюдений различных наблюдателей в
одном и том же эвереттовском мире появиться никак не может.
Такова вкратце концепция Эверетта. На первый взгляд она кажется и
фантастической, и слишком сложной. Это, однако, не совсем так. Во-первых,
концепция Эверетта логически вытекает из единственного и, казалось бы,
вполне естественного предположения – что линейность квантовой
механики не нарушается в процессе взаимодействия измеряемой системы с
прибором и последующего воздействия прибора на наблюдателя. Во-вторых,
вся картина кажется более фантастической, чем она есть на самом деле,
когда, стремясь выражаться наглядно, говорят о многих классических мирах.
На самом деле картина многих миров может вводить в заблуждение тех, кто
знакомится с ней, не имея достаточного опыта в этом вопросе.
Стоит напомнить, что никаких “многих классических миров” на самом
деле нет. Есть только один мир, этот мир квантовый, и он находится в
состоянии суперпозиции. Лишь каждая из компонент суперпозиции по
отдельности соответствует тому, что наше сознание воспринимает как
картину классического мира, и разным компонентам суперпозиции
соответствуют разные картины. Каждый классический мир представляет
собой лишь одну “классическую проекцию” квантового мира. Эти
различные проекции возникают в сознании наблюдателя, которое
“разделяет” квантовый мир. Сам квантовый мир существует как единое целое
независимо от какого бы то ни было наблюдателя.
Если говорить «различные компоненты суперпозиции» и «различные
классические миры», то исчезают многие недоразумения, бытующие в
популярной литературе и в дискуссиях по данному вопросу. Например,
картина многих миров создает иллюзию, что в момент измерения один
классический мир превращается в несколько (или даже в бесконечное
количество) миров. При этом иногда говорят и о чудовищном несохранении
энергии при таком “размножении миров”. На самом деле, разумеется,
никакого размножения миров в интерпретации Эверетта нет. И до измерения,
и после него существует один-единственный вектор состояния, описывающий состояние квантового мира.
Что же происходит в момент измерения, а точнее, в период, когда
происходит взаимодействие измеряемой системы с прибором? В этот период
происходят специфические изменения в состоянии взаимодействующих
физических систем, что отражается в изменении вектора состояния полной
системы. Возникает квантовая корреляция, или запутывание, между
измеряемой системой и измеряющей средой, включая наблюдателя. Для
формального описания этого изменения, чтобы наглядно представить
возникающие корреляции, мы уже первоначальный вектор состояния
представляем в виде суперпозиции нескольких компонент, а потом
показываем, как меняется при измерении (под влиянием взаимодействия)
каждая из этих компонент. После перехода остаются те же самые системы,
что существовали перед измерением (измеряемая система, прибор,
наблюдатель, …). Меняются лишь состояния этих систем. Изменения
90
состояний участвующих во взаимодействии систем происходят
согласованно, так что после взаимодействия имеет место квантовая
корреляция этих систем, которой до взаимодействия не было.
Излишне упрощенным является не только представление о «ветвлении»
мира, но и о том, что измерение происходит и определенный момент времени
сразу во всех точках конечной области (в которой отлична от нуля волновая
функция измеряемой системы). Такое представление несовместимо, например, со специальной теорией относительности, в которой
одновременность событий в различных точках вообще нельзя определить.
Все эти трудности возникают из-за идеализации, содержащейся в понятии
мгновенного измерения. Они исчезают, если учесть, что реально
взаимодействия, которые мы называем измерениями, происходят
непрерывно. Проблема понимания лежит в том, что мы пока весьма туманно
представляем себе, что такое наше сознание; как оно функционирует и т.д.
Концепция Эверетта не дает новых предсказаний в квантовой физике.
Если мы принимаем гипотезу об отождествлении разделения альтернатив с
сознанием, этот вывод не меняется. Дело в том, что для тех простых
объектов, которыми занимается квантовая физика (электронов, атомов и пр.)
действует универсальное вероятностное распределение по альтернативным
результатам измерения, которое не зависит от сознания и ведет к обычным
квантово-механическим предсказаниям. Таким образом, в физике мы
ничего, кроме логической полноты теории, не выигрываем. Однако в
психологии открываются новые возможности.
Действительно, в рамках данной концепции сознание (психика) может
обладать некоторыми чертами, которые в «классической» психологии
ему не приписываются (такими, как возможность выходить из
классической реальности в квантовый мир (т. е. заглядывать в другие
реальности) или даже влиять на выбор «своей» реальности. Эти
гипотетические возможности требуют, разумеется, проверки. Однако вполне
естественно попытаться отождествить эти «новые» возможности с
необычными явлениями в области психологии, теории сознания и
психологической практики, которые уже давно замечены, изучаются
различными способами и даже эксплуатируются. С этой точки зрения
обсуждаемые «новые» черты сознания, возможно, давно известны. Если так,
то некоторые подтверждения рассматриваемой нами концепции могут уже
существовать без всяких дополнительных проверок. Но и в этом случае
требуется тщательная и осторожная работа для анализа известных фактов и
сопоставления их с тем, чего можно ожидать в рамках концепции Эверетта.
Из современных концепций естествознания следует, что необычные
способности сознания должны проявляться “на краю сознания”, то есть тогда, когда сознание “почти выключено”. Исходя из гипотезы отождествления
сознания с разделением альтернатив, выключение сознания означает, что
квантовый мир перестает разделяться на (изолированные друг от друга)
классические альтернативы, а вместо этого начинает восприниматься как целое. Возникает особое состояние сознания (возможно, это то же самое, что
91
психологи называют «измененным состоянием сознания»), которое похоже
на сон или “транс”.
Изложенная здесь концепция Эверетта приведена по данным книги
известного физика, ведущего научного сотрудника Физического института
РАН им. Лебедева Михаила Борисовича Менского “Человек и квантовый
мир” (Фрязино, ВЕК-2, 2005).
Остается добавить несколько замечаний по поводу интерпретаций.
Вопрос о том, что же именно наблюдает человек – объективную реальность,
или же некий ее усеченный образ, доступный нашему сознанию – вопрос
этот стар, как мир. Весьма оригинальные и глубокие ответы на него веками
разрабатывались в религиозных доктринах и философских учениях.
Особенно в этом преуспела мысль Востока. В индийской философии есть
понятие «майи» – дословно, иллюзии. “Все что, есть – майя”, – говорится в
ряде текстов. В учении древних латиноамериканских индейцев, которое
пришло к нам в блестящих работах Карлоса Кастанеды, говорится о тонале –
образе мира, доступном всем, и нагвале – истинной реальности, которую
можно постичь, став на путь магии. В китайских и японских учениях –
даосизме, дзэн-буддизме содержится призыв отказа от интерпретаций, целью
же жизни провозглашается достижение так называемого просветления
(сатори) – образ жизни, при котором все происходящее воспринимается
непосредственно, без шаблонов (и формул !), навязываемых человеку
обществом с первых осмысленных дней жизни. Конечно, речь идет о
довольно сложных метафизических понятиях. Ближе всего по сути будет
сказать так: необходимо воспринимать мир так, как его воспринимает
ребенок – мы уже к 7 годам “успешно” разучиваемся его так воспринимать.
Но вернемся к физике. Когда-нибудь, возможно, мысль о параллельных
мирах из области фантастики перейдет в научное русло, и представляется,
что квантовая механика и ее эвереттовская интепретация сыграют здесь не
последнюю роль. Заключить же настоящее Дополнение можно словами из
“Краткого руководства к физике, для употребления в народных училищах
Российской Империи, изданного по Высочашему Повелению Царствующей
Императрицы Екатерины Второй в Санкт-Петербурге, лета 1787 -го”:
“Большая часть видимого нами строения мира кажется очам нашим
совсем иначе, как она в самом деле находится. Несмотря на сие,
рассматривание видимого разнообразия мира также имеет свою пользу и
ведет нас к истине”.
92
Лекция 10. Элементы квантовой механики – II
(простейшие задачи квантовой механики)
1. Решение уравнения Шредингера для свободной частицы.
2. Виды потенциальных ям. Частица в бесконечно глубокой одномерной
потенциальной яме.
3. Потенциальный барьер. Туннельный эффект.
4. Линейный гармонический осциллятор.
10.1. Решение уравнения Шредингера (УШ) для свободной частицы
Для свободной частицы, т.е. частицы вне силовых полей (связей),
потенциальная энергия (взаимодействия) U ( x, y, z ) = 0 , тогда УШ (9.14)
примет вид
∆Ψ +
Для одномерного случая
2m
h
2
EΨ = 0 .
∂ 2 Ψ 2m
+ 2 EΨ = 0 .
h
∂x 2
(10.1)
Общее решение имеет вид линейной комбинации частных решений:
Ψ = y = e − px , y ′ = − pe − px , y ′′ = p 2 e − px . Из (10.1) p 2 e − px + k 2 e − px = 0 ,
2m
⇒ p 2 = − k 2 , p = −ik , где k 2 = 2 E . Общее решение имеет вид:
h
Ψ ( x) = A1e − i (ωt − kx ) + A2 e i (ωt − kx ) = A1e ikx + A2 e − ikx .
Так как
E = h 2 k 2 /( 2m) = p x2 /( 2m) ,
(10.2)
то в силу совпадения вида (10.2) с формулой классической механики для
кинетической энергии можно сделать вывод о том, что энергия свободной
частицы имеет сплошной спектр значений, так как волновое число k
принимает любые значения.
10.2. Виды потенциальных ям. Решение уравнения Шредингера для
частицы в прямоугольной потенциальной яме с бесконечно высокими
стенками. Силовое поле. Центральное силовое поле
Рассмотрим решение УШ для наиболее простой для анализа задачи о
движении частицы в потенциальной яме (ПЯ) с бесконечно высокими
(непроницаемыми) стенками. Такие ПЯ называют также потенциальными
ящиками. Наиболее часто так называют трёхмерные ПЯ, где частица
движется в ограниченном пространстве, т.е. её движение финитно.
93
Для простоты рассмотрим одномерный случай, а затем обобщим
решение для трёхмерного случая. В данном случае (рис. 10.1) потенциальная
энергия U ( x) имеет вид
∞, x ≤ 0;

U ( x) = 0, 0 < x < a;
∞, x ≥ a.

1
U
2
U=∞
1
U=0
2
0
Рис. 10.1
3
U=∞
3
a x
Решаем УШ в виде (10.1) с условием Ψ1 = Ψ3 = 0 (частица не может
быть в областях 1 и 3). Тогда имеем УШ (10.1) с общим решением в виде
линейной
комбинации
линейно
независимых
функций
Ψ ( x) = A sin kx + B cos kx , где k = (2mE ) h 2 . Налагая граничное условие
получаем B = 0 . Для
воспользуемся условием нормировки:
Ψ ( x = 0) = 0 ,
определения
константы
A
a
A2
A2 sin 2kx
2
2
2
2 1 − cos( 2kx)
dx = (
x−
) =
∫ Ψ dx = ∫ A sin (kx)dx = A ∫
2
2
4
k
0
0
0
a
a
a
0
2
2
A
A sin 2ka
) = 1.
a−
2
4k
Так как Ψ ( x = a ) = 0 , то A sin kx = 0 . Считая A ≠ 0 для получения
=(
нетривиального решения, имеем
sin ka = 0 , ⇒ ka = ±πn , n = 1,2,3...
πn
⇒k = .
a
(10.3)
(10.4)
Тогда, возвращаясь к выполнению условия нормировки, можно записать
A2
2
a =1⇒ A =
. Искомая ВФ примет вид
2
a
πn
2
2
Ψ ( x) =
sin kx =
sin x .
a
a
a
94
(10.5)
2
С учётом k =
2m
h
2
2mE
E и выражения (10.4) получим
En =
π 2h 2
2ma
2
h2
=
π 2n2
a2
, откуда
n2 .
(10.6)
Т.е. энергия частицы в ПЯ квантуется, En называется уровнем энергии,
а n – главным квантовым числом, E1 – энергией основного
(невозбуждённого) состояния частицы.
Записывая определение волнового числа k =
λБ =
2π
λБ
=
πn
a
, получаем
2a
,
n
т.е. на длине (ширине) ПЯ должно укладываться целое число полуволн де
Бройля
Еn
Е3
λБ
2
.
Ψ(x)
Еn
Е3
Е2
E1
Ψ
2
Е2
0
a/3 a/2 2a/3 a x
E1
a/3 a/2 2a/3 a x
0
Рис. 10.2
Рис. 10.3
Для ВФ в виде (10.5) имеем с условием n ≠ 0 (из физического смысла
n = 0 ⇒ Ψ = 0 , т.е. частица в ПЯ отсутствует, это ограничение учитывается
в (10.3)): частица не может находиться при n=2 (первое возбуждённое
состояние) в точке а/2, а при n=3 – в точках а/3 и 2а/3, и т. д. (вспомним, что
квадрат модуля ВФ равен плотности вероятности нахождения частицы в
заданной области или точке, см. рис. 10.2 и 10.3).
Записывая разность энергий
∆E n = E n +1 − E n =
оценим значение
∆E n E n =
95
π 2h 2
2ma
2
2n + 1
n2
(2n + 1) ,
.
Видно, что с ростом n lim (
n →∞
2n + 1
2 1
)
=
(
+ 2 ) = 0 и ∆En En → 0 . В
lim
n →∞ n n
n2
этом заключается проявление принципа соответствия Н.Бора (1923 г.): при
больших квантовых числах, т.е. при n → ∞ , КМ переходит в классическую.
Рассмотрим частицу в двумерной и трёхмерной ПЯ с бесконечно
высокими стенками. В этом случае потенциальная энергия имеет вид
0, ( x, y ) ∈ σ
(10.7а)
U ( x, y ) = 
,
(
x
,
y
)
σ
,
∞
∉

0, ( x, y, z ) ∈ G,
(10.7б)
U ( x, y , z ) = 
∞, ( x, y, z ) ∉ G,
σ = {( x, y ) : 0 < x > a1 ,0 < y < a2 } – прямоугольная область на
где
плоскости xОy (рис. 10.4, а),
а G = {( x, y, z ) : 0 < x < a1 ,0 < y < a2 ,0 < z < a3} (рис. 10.4, б) – внутренняя
область прямоугольного параллелепипеда.
y
a2
y
a2
0
G
a1 x
0
a1 x
a3
z
а)
б)
Рис. 3.5
Поскольку движение частицы в ПЯ вдоль оси Оx, Оy, Оz происходит
независимо, то ВФ Ψ можно представить в виде произведения:
Ψ ( x, y ) = Ψ1 ( x)Ψ2 ( y ) ,
(10.8а)
Ψ ( x, y, z ) = Ψ1 ( x)Ψ2 ( y )Ψ3 ( z ) .
(10.8б)
Подставляя равенства (10.8) в УШ (10.1), с учётом (10.7), имеем
∆Ψ ( x, y ) +
⇒ Ψ2 ( y )
d 2 Ψ1 ( x)
dx
2
2m
h
+ Ψ1 ( x)
2
EΨ ( x, y ) = 0 ⇒
d 2 Ψ2 ( y )
dy
2
=−
Разделив обе части на Ψ1 ( x) Ψ2 ( y ) , получим
2m
h
2
EΨ1 ( x)Ψ2 ( y )
1 d 2 Ψ1 ( x)
1 d 2Ψ2 ( y )
2m
+
=
−
E,
2
2
2
Ψ1 ( x) dx
Ψ2 ( y ) dy
h
96
1 d 2 Ψ1 ( x)
1 d 2 Ψ2 ( y )
1 d 2 Ψ3 ( z )
2m
=
−
E.
+
+
Ψ1 ( x) dx 2
Ψ2 ( y ) dy 2
Ψ3 ( z ) dz 2
h2
Каждое из слагаемых в левой части зависит только от одной переменной
х, у, либо z. Так как их сумма равна константе, то каждое из слагаемых есть
величина постоянная:
1 d 2 Ψ1 ( x)
2m
=
−
E,
2 1
Ψ1 ( x) dx 2
h
1 d 2 Ψ2 ( y )
2m
=
−
E ,
2 2
Ψ2 ( y ) dy 2
h
2m
1 d 2 Ψ3 ( z )
=
−
E3 ,
Ψ3 ( z ) dz 2
h2
где E1 , E2 , E3 – константы, имеющие размерность энергии E:
E = E1 + E2 ,
E = E1 + E2 + E3 .
Решая полученные одномерные уравнения аналогично рассмотренному
перед ними одномерному случаю, с учётом выражений (10.5), (10.6) получим
Ψ1, n1 ( x) =
πn x
2
sin 1 ,
a1
a1
Ψ2, n 2 ( y ) =
πn x
2
sin 2 ,
a2
a2
Ψ3, n3 ( z ) =
πn x
2
sin 3 .
a3
a3
С учётом формул (10.8а) и (10.8б)
Ψn1 , n2 ( x, y ) =
Ψn1 , n2 , n3 ( x, y, z ) =
πn x
8
πn x
πn x
sin( 1 ) sin( 2 ) sin( 3 ) ,
а1а2 a3
a1
a2
a3
π 2h 2  n1
n2 2 
2
+
(
)
(
) ,
2m  a1
a2 
π 2h 2  n1 2 n2 2 n3 2 
=
( ) +( ) +( ) .
2m  a1
a2
a3 
En1 , n2 =
En1 , n2 , n3
4
πn x
πn x
sin( 1 ) sin( 2 ),
а1а2
a1
a2
(10.9а)
(10.9б)
Рассмотрим движение частиц в квадратной ПЯ и кубической ПЯ. То
есть a = a1 = a2 ( = a3 ) . Тогда уравнения (10.9) примут вид
97
En1 , n2 =
π 2h 2
2
2
(
n
+
n
), n1 , n2 = 1,2,3... ,
1
2
2
2ma
π h
=
(n 2 + n22 + n32 ), n1 , n2 , n3 = 1,2,3... .
2 1
2ma
2 2
En1 , n 2 , n3
Отсюда следует, что одному и тому же энергетическому уровню
En1 , n 2 ( En1 , n 2 , n3 ) , определённому квантовыми числами n1 , n2 (n3 ) при
n1 ≠ n2 (≠ n3 ) , соответствуют два (три) для основного (невозбуждённого
ni = 1 ) уровня энергии различных состояний частицы, описываемых ВФ
Ψn1 , n 2 и Ψn 2 , n1 ( Ψn1 , n 2 , n3 , Ψn 2 , n1 , n3 , Ψn3 , n 2 , n1 ). Энергетический уровень,
которому соответствует не одно, а несколько состояний частицы, называется
вырожденным энергетическим уровнем, а число соответствующих ему
состояний – кратностью или степенью вырождения энергетического
уровня. Энергетический уровень, которому соответствует одно состояние,
называется невырожденным.
Для двумерной квадратной ПЯ кратность вырождения уровня при
n1 ≠ n2 равна 2, невырожденные уровни с n1 = n2 . В случае трёхмерной
кубической ПЯ кратность вырождения уровня с n1 ≠ n2 ≠ n 3 определяется
числом перестановок ( n1 , n2 , n3 ), ( n2 , n1 , n3 ), ( n3 , n1 , n2 ), ( n3 , n2 , n1 ), и т.д.
(табл. 10.1).
Таблица 10.1
3
№ уровня
Квантовые числа ( n1 , n2 , n3 )
2
∑ ni
i =1
1
2
3
4
5
6
(1,1,1)
(1,1,2), (1,2,1),(2,1,1)
(1,2,2), (2,1,2), (2,2,1)
(1,1,3), (1,3,1), (3,1,1)
(2,2,2)
(1,2,3), (1,3,2), (2,1,3), (2,3,1), (3,1,2), (3,2,1)
3
6
9
11
12
14
Число перестановок из трёх чисел определяет кратность вырождения:
k 6 = 6 , k 2 = k3 = k 4 = 3 , k5 = 1 – невырожденный уровень ( n1 = n2 = n3 ).
Рассмотрим трёхмерный случай симметрии. Потенциальная энергия
частицы в сферической ПЯ в первом приближении имеет вид
0, r < a,
U (r ) = 
∞, r > a,
где r – расстояние от центра ядра. Тогда уравнение (10.1) примет вид
98
∆Ψ +
2mE
h
2
Ψ = 0, 0 ≤ r < a .
(10.10)
Поле – особая форма материи, связывающая частицы вещества или
тела в единые системы и передающая с конечной скоростью воздействие
тел друг на друга (т.н. “гипотеза близкодействия”). Полю присваивается
роль передатчика взаимодействия (одно тело изменяет свойства
окружающего его пространства, а другое тело это «чувствует»). Показанная
А.Эйнштейном в его теории относительности взаимосвязь массы и энергии,
E = mc 2 , позволяет утверждать вышесказанное. Попытки создать единую
теорию поля, объясняющую все известные явления с единой точки зрения,
пока не увенчались успехом.
Поле называется силовым, vесли в каждой точке рассматриваемого
пространства определён вектор F силы любой природы происхождения.
Силовое поле называется центральным (гравитационное, электрическое,
ядерных сил), если на тело (нуклон в ядре), помещённое в поле, действует
сила, всегда направленная вдоль луча, соединяющего тело (точку) и центр
силового поля (полюс), а величина силы зависит только от расстояния от тела
до центра поля.
Так как силовое поле имеет сферическую симметрию, является
центральным, то следует перейти в сферическую систему координат (ССК) и
рассматривать ВФ Ψ как функцию от r , ϕ , Θ . Если учесть, что основное
состояние частицы в яме является сферически симметричным, то есть не
зависит от углов Θ и ϕ , будем считать, что ВФ частицы зависит только от
радиальной координаты r .
Тогда оператор Лапласа, действующий на функцию Ψ, записывается
1 d 2 dΨ (r ) d 2 Ψ (r ) 2 dΨ (r )
(r
)=
+
как ∆Ψ (r ) =
, а уравнение (10.10)
2
2 dr
r
dr
dr
dr
r
примет вид
d 2Ψ
dr 2
+
2 dΨ 2mE
+ 2 Ψ = 0.
r dr
h
(10.11)
Искомое решение должно удовлетворять двум условиям Ψ (0) < ∞ и
Ψ (a) = 0
(ограниченность ВФ и непрерывность
непроницаемости стенок ПЯ). Будем искать ВФ в виде
Ψ (r ) =
U (r )
.
r
ВФ
Подставляя выражение (10.12) в уравнение (10.11), получим
d 2U
2
+
2mE
2
U = 0, 0 ≤ r ≤ a ,
dr
h
с граничными условиями U (0) = 0 и U ( a ) = 0 .
99
с
учётом
(10.12)
По аналогии с ВФ для частицы в одномерной бесконечно глубокой ПЯ
получаем
πnr
U n (r ) = A sin
Ненормированная ВФ
a
, n = 1,2,3...
A
πnr
(sin
), n = 1,2,3,... ,
a
r
π 2h 2 2
En =
n , n = 1,2,3,...
2
2ma
Ψn (r ) =
Например, для нуклона в ядре при n=1, m=1,67⋅10-27 кг, а=10-14 м
Emin=E1=3,3⋅10-13 Дж=2,1⋅106 эВ=2,1 МэВ. Это значение энергии существенно
превышает значение энергии электрона в атоме, что указывает на
возможность выделения в ядерных процессах энергии, в миллион раз
превышающей энергию химических реакций.
Вернёмся теперь к вопросу о расчёте средних значений параметров на
примере частицы в одномерной прямоугольной ПЯ с бесконечно высокими
стенками. Ранее было получено выражение ((предыдущая лекция, формула
Д3)):
€ Ψ )dV .
< f >= ∫ Ψ * (Φ
(10.13)
RN
Вычислим на основании выражения (10.13) средние значения
координаты x , импульса p и энергии E (для одномерного случая):
a
1)
2
2a
πnx 2
πnx
x =< x >= ∫ (
sin
) xdx = ∫ x sin 2
dx =
a
a
a
a
0
0
2πnx
)
a x (1 − cos
2
1a
1a
2πnx
a
= ∫
dx = ∫ xdx − ∫ x cos
dx =
a0
a0
a0
a
2
U = x, dU = dx
2πnx
2πnx =
a
=
sin
dV = cos
dx, V =
2πn
a
a


a
a a
1 a 2 1  xa
2πnx
2πnx 
sin
=
− 
−
∫ sin a dx  =
a 2 a  2πn
a 0
2πn 0

144244
3

= 0 (sin 2πn = 0 и sin 0 = 0)


a
2πnx
a
a
a
a
a
= − 2 2 cos
= − 2 2 (1 − 1) = ;
2 4π n
2
a 0 2 4π n
100
2
πnx h 2 d 2 2 πnx
E =< E >= ∫
sin
(−
(
sin
))dx =
2
a
a
2
m
a
a
dx
0
2πnx
2 2 2 a
2 2 2 a 1 − cos
2π n h
π n h
2 πnx
a )dx =
sin
(
=
=
dx
∫
∫
2
3
2
a
a a 2m 0
a m 0
a
2)
a
2 2 2
a
2πnx
π 2 n 2h 2
(x −
sin
) =
=
;
3
2
π
2
n
a
2a m
2a m
0
π n h
a
3)
p =< p >= ∫
0
(3.43)
2
d
2
πnx
πnx
sin
(−ih (
sin
))dx =
a
a
dx a
a
a
2 πn
πnx
πnx
ihπn a 2πnx
cos
= − ih ∫ sin
dx = − 2 ∫ sin
dx =
a a 0 14a4
a
a
a 0
42444
3
1
sin 2α
2
a
ihπn a
2πnx
= 2
cos
= 0.
a 0
a 2πn
10.3. Потенциальный барьер. Туннельный эффект
В предыдущем параграфе было рассмотрено движение частиц в
ограниченной области пространства – финитное движение. Рассмотрим
теперь случаи, в которых частица, находящаяся в силовых полях, способна
уходить на бесконечность (инфинитное движение).
Если потенциальная энергия частицы в силовом поле имеет вид
0, x < 0,
U ( x) = 
U 0 , x ≥ 0,
то такое поле называют потенциальным порогом (потенциальной
стенкой) – поля с резкой границей. УШ (10.1) для областей 1 и 2 (рис. 10.5)
соответственно примут вид:
d 2 Ψ1
dx
d Ψ2
2
[
dx 2
2
+
]
+
h
2m
h2
212
Введём замену k = 2mE / h
высокого потенциального порога).
2m
2
EΨ1 = 0,
( E − U 0 )Ψ2 = 0.
[
, q = 2m( − E + U 0 ) / h
101
(10.14)
(10.15)
]
212
(q – случай
U
1 U0 2
E
0
x
Рис. 10.5
Тогда уравнения (10.14), (10.15) можно записать в виде:
d 2 Ψ1
2
dx
d 2 Ψ2
dx
2
+
−
2m
2
k 2 Ψ1 = 0 ,
(10.16)
2
q 2 Ψ2 = 0 .
(10.17)
h
2m
h
Общее решение уравнения (10.16) в случае высокого ( E < U 0 ) порога
запишем в виде линейной комбинации линейно независимых функций –
суперпозиции плоских волн де Бройля без множителя e
рассматривается стационарная задача:
− iωt
, так как
Ψ1 ( x) = A1eikx + B1e − ikx ,
где A1 – падающая на порог волна, B1 – отражённая от порога волна. Для
уравнения (10.17)
U0
Ψ2 ( x) = A2 e qx + B1e − qx .
В силу конечности ВФ Ψ2 коэффициент A2 = 0 . В силу того, что порог
имеет конечную высоту, ВФ Ψ на границе раздела областей 1 и 2
должна быть непрерывной и гладкой, т.е. иметь непрерывную производную.
Условия сшивки решений для областей 1 и 2:
A1 + B1 = B2 ,
Ψ1 (0) = Ψ2 (0),
или
Ψ1′ (0) = Ψ2′ (0),
ikA1 − ikB1 = − qB2 .
Напомним, что коэффициенты Ai
вероятности событий. Например, B1
2
2
2
и Bi
2
(10.18)
связаны с плотностью
связан с вероятностью отражения
2
частицы от порога, A1 – с вероятностью падения частицы на порог, а B2
– с вероятностью того, что частица может быть обнаружена в области 2
потенциального порога, являющейся с точки зрения КФ для неё
запрещённой.
Плотность потока вероятности для частиц:
1) падающих на порог
102
jпад =
2) отражённых от порога
hk
2
A1 ;
m
jотр =
3) прошедших в область порога 2:
(10.19)
hk
2
В1 ;
m
(10.20)
hq
2
В2 .
m
(10.21)
jпрош =
Тогда коэффициент отражения от порога (R от лат. reflection)
R=
jотр
=
jпад
В1
2
A1
2
;
(10.22)
прохождения через порог (прозрачность порога D или P )
D=
jпрош
jпад
=
В2
2
A1
2
,
причём по закону сохранения числа частиц:
R + D = 1,
= jотр + jпрош ).
(10.23)
( jпад
Для качественного анализа без потери общности решения положив
A1 = 1, из системы (10.18) получим:
B1 =
2k
k − iq
, B2 =
.
k + iq
k + iq
(10.24)
Система уравнений (10.18) имеет решение при любых значениях k
и q ; это означает, что частица обладает непрерывным энергетическим
спектром. С учётом A1 = 1 и (10.24) из (10.22) имеем:
2
k − iq
R=
→ 1.
k + iq
С учётом A2 = 0 и равенств (10.24)
2k − qx
e .
(10.25)
k + iq
Из выражения (10.25) видно, что Ψ2 ( x) отлична от нуля и уменьшается
с возрастанием x по экспоненциальному закону, а это означает, что
Ψ2 ( x) =
существует отличная от нуля вероятность пребывания частицы под порогом
при E < U 0 :
103
2
dD
2k
2
w2 ( x) =
= Ψ ( x) =
exp(−2qx) =
dx
k + iq
=
4k 2
2
−
exp(
2m(U 0 − E ) x) .
h
k 2 + q2
144
42444
3
(10.26)
α
Проводя расчёт согласно (10.26) для U0–E=1 эВ=1,6⋅10-19 Дж, для двух
−8
значений х=10-10 м и х=10-9 м, получим exp α ≈ 0,29 и expα ≈ 4,58 ⋅10
соответственно. Это означает, что проникновение электрона в область
высокого потенциального порога с заметной вероятностью возможно лишь
на расстояния, сравнимые с размером атома.
Таким образом, хотя R → 1 ( ≈ 1) , т.е. отражение является полным, оно
не обязательно произойдёт на самом пороге (на границе раздела). С
некоторой вероятностью частица может проникнуть в область 2, а затем
выйти из неё.
В случае низкого ( E > U 0 ) потенциального порога аналогично
рассмотренному выше имеем:
для области 1
для области 2
d 2 Ψ1
dx 2
d 2 Ψ2
dx
2
+ k 2 Ψ1 = 0 , k 2 =
+ q 2 Ψ2 = 0 , q 2 =
2m
Решениями уравнений являются функции:
h
2
2m
h2
E,
( E − U 0 ).
Ψ1 ( x) = A1e ikx + B1e − ikx ,
Ψ2 ( x) = A2 e iqx + B2 e − iqx .
Поскольку отражённая от порога справа волна отсутствует (частицы
падают на порог слева), то
B2 = 0 . Условие непрерывности
Ψ1 (0) = Ψ2 (0), Ψ1′(0) = Ψ2′ (0) можно записать как
A1 + B2 = A2 ,
Полагая A1 = 1, получаем
kA1 − qB1 = qA2 .
B1
k −q
2k
, A2 =
.
k+q
k +q
Откуда
R=
B1
2
A1
2
2
1− 1−U0 / E
k −q
=
=
.
k+q
1+ 1−U0 / E
104
(10.27)
Отсюда следует, что при E > U 0 существует отличная от нуля
вероятность того, что частица отразится от низкого потенциального порога,
т.е. произойдет надбарьерное отражение – чисто квантовый эффект.
Вместе с тем с учётом формул (10.21) и (10.27)
D=
и R + D = 1.
A2
2
A1
2
4kq
=
(k + q) 2
=
1−U0 / E
(1 + 1 − U 0 / E ) 2
Рассмотрим ПБ простейшей формы для одномерного движения частицы
(вдоль оси ОХ). Потенциальная кривая описывается системой
0, x ≤ 0,

U ( x) = U 0 , 0 < x < l ,
0, x ≥ l.

Запишем УШ для областей 1, 2, 3, (рис. 10.6) соответственно:
U
U0
E
1
2
0
Ψ1(х)
3
x
l
Ψ2(х)
Ψ3(х)
x
Рис. 10.6
 ∂ 2 Ψ1
2mE
2
2
(1) 2 + k Ψ1 = 0, k = 2 ,
h
 ∂x
 ∂ 2 Ψ
2 + q 2 Ψ = 0, k 2 = 2m ( E − U ),
(2)
0
2
h2
∂x 2

 ∂ 2Ψ
2mE
2
2
3
k
k
0
,
.
+
Ψ
=
=
(3)
3

h2
∂x 2
Функции Ψ1 , Ψ2 , Ψ3 представляют собой одно и то же решение в
соответствующих интервалах изменения переменной х . Чтобы это решение
было непрерывно вместе с первой производной необходимо выполнение
граничных условий
105
Ψ1 (0) = Ψ2 (0), Ψ2 (l ) = Ψ3 (l ),
и
Ψ1′ (0) = Ψ2′ (0), Ψ2′ (l ) = Ψ3′ (l ).
(10.28)
Запишем общее решение уравнений системы:
(1)Ψ1 ( x) = A1e ikx + B1e − ikx ,

iqx
− iqx
,
(2)Ψ2 ( x) = A2 e + B2 e

ikx
− ikx
(3)Ψ3 ( x) = A3e + B3e .
(10.29)
В областях 1 и 3 частица движется как свободная. Поэтому физический
смысл выражений (слагаемых) A1e
ikx
и A3e
ikx
– волна, распространяющаяся
− ikx
– волна,
вдоль оси Ох соответственно в 1 и 3-й области, а B1e
отражённая от ПБ, движущаяся против оси Ох. Так как в 3-й области
отражённых волн нет, то В3 = 0 .
Найдём коэффициенты A1 , B1 , B2 , A2 , A3 . Для этого решим совместно
системы (10.33) и (10.29):
Ψ1 (0) = A1 + B1 , Ψ2 (0) = A2 + B2 , так как Ψ1 (0) = Ψ2 (0) , то
A1 + B1 = A2 + B2 ;
(10.30)
Ψ2 (l ) = A2 e iql + B2 e − iql , Ψ3 (l ) = A3e ikl , т.к. Ψ2 (l ) = Ψ3 (l ) , то
A2 e iql + B2 e − iql = A3e ikl .
(10.31)
Найдём производные:
Ψ1′ (0) = ( A1e ikx ik + B1e − ikx (−ik )) x = 0 = ikA1 − ikB1 = ik ( A1 − B1 ),
аналогично Ψ2′ (0) = iq ( A2 − B2 ) . Так как Ψ1′ (0) = Ψ2′ (0) , то
k ( A1 + B1 ) = q ( A2 − B2 ) ;
(10.32)
Ψ2′ (l ) = ( A2 e iqx iq + B2 e − iqx (−iq )), Ψ3′ (l ) = A3e ikl ik , т.к. Ψ2′ (l ) = Ψ3′ (l ) , то
iq ( A2 e iql − B2 e − iql ) = ikA3e ikl .
(10.33)
Окончательно получаем систему из (10.30)–(10.33):
 A1 + B1 = A2 + B2 ,

iql
− iql
= A3e ikl ,
 A2 e + B2 e

q
 A1 − B1 = ( A2 − B2 ),
k


k
iql
ikl
− iql
( A2 e − B2 e ) = A3e .
q

Сложим почленно первое и третье уравнения системы (10.34):
106
(10.34)
2 A1 = A2 + B2 +
q
k
q
q
A2 − B2 ⇒ 2 A1 = (1 + ) A2 + (1 − ) B2 . (10.35)
k
q
k
k
Сложим теперь почленно второе и четвёртое уравнения системы (10.34):
1
k
k
2 A2eiql = (1 + ) A3eikl ⇒ A2 = A3eikl e − iql (1 + ).
2
q
q
(10.36)
Вычтем из второго четвёртое уравнение в системе (3.39):
k
1
k
2 Вe − iql = (1 − ) A3e ikl ⇒ B2 = (1 − ) A3e ikl e iql .
q
2
q
(10.37)
Подставим выражения (10.36) и (10.37) в (10.35):
q 1
k 1
q
k
2 A1 = (1 + ) A3eikl e − iql (1 + ) + (1 − )(1 − ) A3eikl eiql =
k 2
q 2
k
q


1
q
k
q
k
= A3e ikl (1 + )(1 + )e − iql + (1 − )(1 − )e iql  =
2
k
q
k
q


 k + q  k + q  − iql  k − q  q − k  iql 
1
+
= A3eikl 
e  ⇒
e


k
q
k
q
2



 


[
]
⇒ 4kqA1 = A3e ikl (k + q )2 e − iql − (k − q )2 e iql ;
A3
4kqe − ikl
.
=
A1 (k + q )2 e − iql − (k − q )2 e iql
(10.38)
Преобразуем знаменатель формулы (10.38) согласно формулам Эйлера
e iϕ = cos ϕ + i sin ϕ ,
sin ϕ =
e − iϕ = cos ϕ − i sin ϕ
или
1 iϕ
( e − e − iϕ )
2i
1
cos ϕ = (eiϕ + e − iϕ ) ,
2
(10.39)
После преобразований на основе (10.39) формула (10.38) примет вид:
A3
2kqeikl
=
A1 2kq cos ql − i(k + q )2 sin ql
(10.40)
С учётом физического смысла формул (10.19), (10.20) и изменённого для
данного
случая
равенства
(10.21):
jпрош =
hk
2
A3
m
формулы
коэффициентов отражения и прозрачности ПБ примут следующий вид:
R=
jотр
jпад
=
В1
2
A1
2
; D=
с выполнением равенства (10.23).
Проведём анализ формулы (10.40):
107
jпрош
jпад
=
А3
2
A1
2
для
2m
1. Пусть E > U 0 , тогда q =
отсюда A3
2
h
= A3 A3 * = e ikl e − ikl и
D=
A3
2
A1
2
=
2
( E − U 0 ) – число действительное,
4k 2 q 2
2 2
2
2
2 2
2
4k q cos ql + (k + q ) sin ql
.
Из равенства (10.23)
R = 1− D =
(k 2 − q 2 ) 2
2
2 2
2 2
2
(k + q ) + 4k q ctg ql
.
Получаем неожиданный с точки зрения классической механики
результат: частица имеет не равную нулю вероятность отразиться от барьера,
несмотря на то, что её энергия превышает высоту ПБ.
2. Пусть теперь E < U 0 , тогда q =
2m
2
( E − U 0 ) – число мнимое.
h
1
2m(U 0 − E ) ,
Обозначим в формуле (10.36) q = if , где f =
h
A3
4kife − ikl
=
.
A1 (k + if ) 2 e fl − (k − if ) 2 e fl
(10.41)
Введём гиперболические функции (гиперболические синус и косинус):
1
shfl = (e fl − e − fl ),
2
1
chfl = (e fl + e − fl ).
2
Формулу (10.41) можно переписать в виде
A3
2ikfe − ikl
,
=
A1 (k 2 − f 2 ) shfl + 2ikfchfl
тогда
D=
A3
2
A1
2
=
4k 2 f 2
2
2
2
2
2
2
(k − f ) sh fl + 4k f ch fl
.
(10.42)
Замечателен вывод из этой формулы: даже если E < U 0 , то есть энергия
частицы ниже пика барьера U 0 , то частица всё же может пройти через него.
На практике вместо громоздкой формулы (10.42) для приближённых
оценок используют приближение при условии
108
e 2 fl >> 1 . Если это
неравенство справедливо, то shfl = chfl =
вид
D=
16k 2 f 2
2
2 2
(k + f )
e
− 2 fl
= D0
1 fl
e и формула (10.42) примет
2
2
− l 2 m (U 0 − E )
e h
,
E < U 0 . (10.43)
Из формулы (10.43) видно, что вероятность прохождения частицы через
барьер тем меньше, чем шире и выше барьер. Характерно, что частица
выходит за пределы ПБ с той же энергией, с которой входит в него. Поэтому
явление прохождения частицы через барьер называется туннельным
эффектом (частица не взбирается на вершину барьера, она как бы проходит
под ним через туннель). Туннельный эффект – чисто квантовое явление,
которое можно объяснить только с учётом волновых свойств частиц. Он
лежит в основе многих физических явлений, например, автоэлектронной или
холодной эмиссии электронов из металла. Обобщим полученный для
прямоугольного ПБ результат на случай ПБ произвольной формы (рис. 10.7).
Для этого представим ПБ в виде последовательности большого числа узких
прямоугольных ПБ, расположенных один за другим. Будем считать, что
барьер имеет достаточно плавную форму, то есть полагать, что его высота на
расстоянии, сравнимом с длинной волны де Бройля, изменяется
незначительно. Будем пренебрегать также надбарьерным отражением
частицы.
U
E
x1
Рис. 10.7
x2
x
Волна де Бройля, прошедшая через i-й прямоугольный барьер,
представляет собой волну, падающую на (i+1)-й ПБ и так далее.
Верность наступления цепочки взаимообусловленных событий
(прохождения частицы через цепочку ПБ) равна произведению вероятностей
(прохождения через каждый из барьеров):
 2∆xi

D = ∏ Di ≈ ∏ exp −
2m(U ( xi ) − E )  =
 h

i


2∆xi
2m(U ( xi ) − E )  ,
= exp − ∑
h


109
где ∆xi – ширина i-го барьера, U ( xi ) – его высота.
Переходя в пределе ∆xi → 0 от суммирования к интегрированию,
 2 x2

D = exp − ∫ 2m(U ( x) − E )dx  .
 h x1

получаем
10.4. Квантовый гармонический осциллятор
В разделе ”Колебания” нашего курса давалось определение линейного
гармонического осциллятора (ЛГО) – так называется модель системы, в
которой происходят гармонические колебания, причем, с малыми по
сравнению с размерами системы, амплитудами. То есть, возмущения,
приводящие к таким колебаниям, также должны быть малы.
Маятник – простейший пример ЛГО. Сила, возникающая в системе с
маятником при его возмущении и возвращающая его в положение
равновесия, называется квазиупругой.
Второй закон Ньютона для колеблющегося тела можно записать в виде
d 2x
⋅⋅
⋅⋅
k
ma = m 2 = −kx , отсюда следует x + x = 0 или x + ω 2 x = 0 .
m
dt
Это
дифференциальное
уравнение
свободных
незатухающих
гармонических колебаний. Общее его решение имеет вид:
x(t ) = A cos(ωt + ϕ 0 ) .
(10.44)
Осциллятор при условии (10.44) называется ЛГО. Потенциальная
энергия для гармонических колебаний, например для пружинного маятника,


d 2x
Wп = U = − ∫ Fx dx =  F = ma = m 2 = − Aω 2 sin(ωt + ϕ 0 ) = ω 2 x  =
dt


0
mω 2 x 2
=
.
(10.45)
2
x
U(x)
U
n=3
E3
n=1 E2
E1
n=0
E0
x
0
n=2
-xmax 0 xmax x
Рис. 10.8
Рис. 10.9
110
Очевидно, что график функции (10.45) имеет вид параболы или, как
часто говорят, мы имеем дело с ПЯ в форме параболы (параболической ПЯ,
рис. 10.8). Амплитуда колебаний ЛГО зависит от его полной энергии.
Согласно КФ в точках ± xmax полная энергия E = U и ЛГО не может
характеризоваться координатами x < − xmax и x > + xmax .
В КМ вводится понятие квантового гармонического осциллятора
(КГО), для которого возможно попадание в область потенциального барьера
и даже туннелирование, то есть существует отличная от нуля вероятность
обнаружить частицу за пределами области − xmax < x < + xmax . Примером
КГО может служить частица, совершающая гармонические колебания в узле
кристаллической решётки.
Рассмотрим одномерный случай КГО.
УШ будет иметь вид
d 2Ψ
mω 2 x 2
+
(E −
)Ψ = 0 .
2
dx 2 h 2
1
424
3
2m
(10.46)
U ( x)
Упростим уравнение (10.46), введя замены
mω
x,
h
2E
λ=
,
hω
ξ=
d 2Ψ
dξ 2
+ (λ − ξ 2 ) Ψ = 0 .
(10.47)
(10.48)
В курсах математической физике показывают, что уравнение (10.48) имеет
решения, если λ можно представить как целочисленный получим полином
λ = λn = 2n + 1,
(10.49)
отсюда следует с учётом замены (10.47):
En =
где n = 0,1,2,3,...
Даже при n = 0 E0 =
1
hω
hω
λn =
(2n + 1) = hω (n + ),
2
2
2
hω
≠ 0, т.е. минимальная энергия КГО не равна нулю.
2
Это подтверждается экспериментами по исследованию рассеяния света
кристаллами с ростом температуры Т. При T → 0 K колебания (всякое
движение, вспомним определение абсолютного нуля и термодинамической
температуры из курса общей физики) должны исчезать и, следовательно,
должно прекращаться рассеяние света колеблющимися в узлах
кристаллической решётки атомами (ионами). В действительности же
111
T → 0 K рассеяние не исчезает, а лишь стремится к некоторому пределу,
hω
≠ 0 у КГО.
обусловленному наличием Emin =
2
Отметим, что уровни энергии КГО являются эквидистантными (рис.
10.9, расположены на равном расстоянии друг от друга), в отличие от случая
прямоугольной ПЯ ∆E = hω 0 .
Полиномы (10.50) обозначаются символами H n (ξ ) . Распоряжаясь в них
по своему усмотрению коэффициентами при низшей степени ξ , получаем
либо а0 (при n – чётном в полиноме содержатся только члены с чётными
степенями, либо a1 при n – нечётном). Обычно для удобства выбирают
n
коэффициент при высшей степени равным 2 , тогда полиномы совпадают с
известными в математике полиномами Чебышева–Эрмита (иногда их
называют просто полиномами Эрмита):
H n (ξ ) = (−1) n eξ
2
n
d (e
−ξ 2
dξ
n
)
.
Тогда функция состояния (ВФ) КГО
Ψn = Cn e −ξ / 2 H n (ξ ), ξ = x
mω
.
h
Из условия нормировки с использованием табличного интеграла
+∞
2
е −ξ dξ = π ,
∫
−∞
n
d H nи (ξ )
dξ
n
= 2 n n!,
получаем
+∞
∫
−∞
+∞
∫
−∞
e
−ξ 2
Ψn2 dx
H n2 (ξ )dξ
= Cn2
= (−1)
h /( mω )
n
+∞
∫
−∞
+∞
∫
−∞
e
−ξ 2
H n2 (ξ )dξ = 1,
2
H n (ξ )
d n (e −ξ )
dξ n
dξ = (
mω 1 / 4 n
) (2 n! π ) −1 / 2 ,
h
x2
1
exp[−
],
Ψ0 ( x) =
2
2 x0
x0 π
1
2
mω
) Cn− 2 ,
h
Cn = (
112
(10.51)
где x0 = [h mω ]
1/ 2
, Ψ1 ( x) =
1
2 x0
x2
2x
( ) exp[−
],
2
x
2 x0
π 0
а)
(10.52)
г)
б)
д)
в)
е)
Рис. 10.10
Ψ2 ( x) =
1
8 x0
x2
4x2
− 2) exp[−
(
].
2
x
2 x0
π
0
113
(10.53)
Графики ВФ для значений квантового числа n от 0 до 5 приведены на
рис. 10.10. Отрезок [ − xmax ;+ xmax ] определяет область, в которой совершал
бы колебания классический осциллятор. Ширина же отрезка для КГО зависит
от значения главного квантового числа n , так как E=f(n), а, следовательно, и
амплитуда колебаний КГО A=f(n). Из рис. 10.10 и формул (10.51)–(10.53)
следует, что ВФ КГО обладают определённой чётностью. Они являются
чётными функциями координат x при чётных n и нечётными – при
нечётных n . Значение n также определяет ещё и число точек пересечения n
ВФ с осью Ох. Таким образом, при увеличении главного квантового числа n
на 1 ВФ КГО меняет чётность и приобретает добавочную точку пересечения.
Вне классической области [− xmax ;+ xmax ] ВФ Ψn отличны от нуля, т.е.
существует отличная от нуля вероятность обнаружения частицы вне
классической области.
2
При достаточно больших n → ∞ , например n=10, функция Ψn (x)
приближается к классической (для классического осциллятора), что
удовлетворяет принципу соответствия Н.Бора (1923 г.). При n = 10 ВФ
достигает максимумов вблизи т.н. точек поворота и резко спадает вне
классической области движения (см. рис. 10.11).
2
|Ψ10(х)|
2
|Ψ0 |
-2xmax -xmax
0
-xmax
+xmax +2xmaxx
0
+xmax x
Рис. 10.11
Следует еще раз подчеркнуть, что модель гармонического осциллятора,
и классического и квантового, справедлива только при малых отклонениях
колеблющейся системы (частица, маятника) от положения равновесия. В
действительности потенциальная энергия U(x) имеет более сложный по
сравнению с выражением (10.45) вид. При возрастании амплитуды колебаний
движение частицы становится все больше отличается от гармонических
колебаний, т.е. всё более ангармонично. Соответствующий осциллятор
называется ангармоническим.
Однако в первом приближении ряд реальных физических систем
можно описывать моделью линейного
КГО. Очевидно, уравнение
квантования энергии трехмерного осциллятора несложно представить в виде
суммы трех одномерных КГО:
114
3
En = hω (n1 + n 2 + n3) = hω (n + ),
2
Если рассмотреть звуковые колебания твердого тела как набор КГО, то
получим, что при Т = 0 К будут, как отмечалось выше, иметь место нулевые
колебания. При представлении электромагнитных волн набором КГО можно
“предсказать”, что в пустоте, даже в отсутствие частиц и квантов, также
должны быть нулевые колебания. Эти колебания также были обнаружены.
Возможно, физика будущего сможет объяснить самое грандиозное и
таинственное явление – Рождение Вселенной, используя представления о
квантовых нулевых колебаниях для Изначального Вакуума – сейчас
предполагают, что ранее 10-43 с известной истории Вселенной этот Вакуум
пребывал в неком экзотическом состоянии, называемом “точкой
сингулярности”. Этому состоянию приписывается отрицательные энергия,
масса, давление – и положительная гравитация, то есть, гравитационное
отталкивание.
Традиционно после рассмотрения стационарных задач КМ
делается ряд обобщений и выводов:
1. Энергетический спектр частицы, находящейся в яме в связанном
состоянии, является дискретным, т.е. энергия связанной частицы квантуется
(дискретна), а свободной – меняется непрерывно.
2. Частица, находящаяся в основном состоянии, т.е. на самом низшем
энергетическом уровне, обладает не равной нулю энергией даже при
температуре стремящейся к абсолютному нулю, что иллюстрирует
невозможность абсолютного покоя и локализации частицы в точке
пространства.
2
3. Плотность вероятности обнаружения частицы Ψ имеет максимумы в
области между классическими точками поворота и экспоненциально убывает
вне классической области. Это означает, что с определённой вероятностью
частица может находиться вне ямы (за исключением ям с непроницаемыми
стенками), т.е. квантовые частицы могут проникать в области пространства,
недоступные для классических частиц.
4. Координата и импульс (энергия и время) в связанных состояниях не
определены. Это означает, что разделение полной энергии Е на
кинетическую и потенциальную невозможно.
115
Лекция 11. Квантово-размерные структуры.
Физические основы нанотехнологии в электронике
1. Основные направления развития, проблемы и перспективы
нанотехнологии.
2. Инструменты нанотехнологии.
3. Квантово-размерные структуры: квантовые ямы, нити, точки.
4. Наногетероструктуры в России.
11.1. Основные направления развития, проблемы и перспективы
нанотехнологии
О возможностях нанотехнологии (создании наноструктур, нано – 10-9, от
греч. “нанос” – карлик, т.е., характерные масштабы наноструктур –
порядка10-9 м) известно уже давно. Классикой считается лекция
Нобелевского лауреата по физике Ричарда Фейнмана в 1959 г. с
аллегорическим названием «Внизу полным-полно места» («There`s plenty of
room at the bottom»). С появлением сканирующих туннельных микроскопов
(1982 г.) и атомно-силовых микроскопов (1980-е гг.) исследователи обрели
«глаза» и «пальцы», необходимые для создания наноструктур.
Очевидны перспективы применения нанотехнологий: наноразмерные
переключатели, позволяющие увеличить память компьютеров в миллионы
раз, минизонды, не повреждающие ткани организма, новая схема введения
лекарств и даже генов в живые организмы, расшифровка генетических кодов,
«операции внутри» – без вскрытия, создание полимерных, кристаллических и
других материалов с наноструктурой, что позволяет значительно повысить
их механические характеристики и снизить вес изделий, повышение качества
печати с использованием наночастиц, т.д., в свою очередь, это вызовет
переворот практически во всех областях жизни человека и в самом человеке.
Поскольку многие (большая часть) наноструктуры получаются в
настоящее
время
методами
самосборки
(природные
явления
самоорганизации в сложных неравновесных системах), то актуальным
является вопрос: до какой степени может быть развита техника самосборки
для регулирования относительного расположения элементов наноразмерных
устройств, учитывая, что при достаточно сложной последовательности
операций количество «ошибок» может стать непреодолимо большим?
Очевидны поистине фантастические преимущества нанотехнологий, но
вместе с тем, возникает и ряд вопросов о безопасности проводимых
исследований (особенно в области нанобиотехнологий с генами животных и
человека, вирусами и т.д.). Однозначный ответ на этот вопрос ученые пока не
дали в силу отсутствия единого мнения в мировом ученом сообществе.
Многократное увеличение быстродействия, уровня интеграции и
расширение функциональных возможностей в электронике, оптике,
робототехнике, материаловедении, биологии, информатике и других
областях науки и техники – это основные, уже обозримые преимущества,
116
которые сулит использование нанотехнологий. Практически не останется ни
одного раздела науки и техники, который не претерпит кардинальных
изменений с развитием нанотехнологии. Поэтому развитие нанотехнологии
за рубежом называют нанотехнологической революцией. Осознание
стратегической важности работ привело к тому, что в разных странах на
уровне правительств и крупнейших фирм созданы и успешно выполняются
программы работ по нанотехнологиям. Изделия на основе нанотехнологии,
созданные на основе оптимальной сборки атомов и молекул, позволят
реализовать предельно возможные характеристики, по сравнению с
которыми остальные изделия будут неконкурентноспособными.
В Японии программа работ по нанотехнологии получила высший
государственный приоритет "Огато". Данный проект спонсирует не только
государство, но и дополнительно около 60 частных фирм. Кроме данного
проекта, в Японии финансировалось около дюжины проектов, посвящённых
различным аспектам нанотехнологии - квантовым волнам, флуктуациям в
квантовых системах, направленных на исследование и разработки квантовых
функциональных схем. Крупнейшими проектами являлись "Atom Craft
project" и "Aono project". Внимание, уделяемое государством, было не
случайным, ещё 10 лет назад в стране присуждались золотые медали за
лучшие достижения в области нанотехнологии. Основные разработки
проводились в центре перспективных технологий "Цукуба". В Европе более
чем в 40 лабораториях проводятся нанотехнологические исследования и
разработки, финансируемые как по государственным, так и по
международным программам (программа НАТО по нанотехнологии).
В США отставание от Японии по объёму финансирования работ в области
нанотехнологии стало предметом государственного обсуждения, в результате
которого объём финансирования только фундаментальных исследований
каждый год стал удваиваться. С целью форсирования работ именно на
данном направлении в 2000 году по решению правительства США работы по
нанотехнологии получили высший приоритет (top priority). В результате
была создана программа Американской нанотехнологической инициативы, а
при президенте организован специальный комитет координирующий работы
по нанотехнологии в 12 крупнейших отраслях промышленности и военных
силах. Одной из целей программы является создание на основе
нанотехнологии вычислительных устройств с произ водительностью в
миллион раз выше существующих процессоров Pentium. Кроме того, в
отличие от финансирования работ в области фундаментальных
исследований, объём финансирования работ по нанотехнологии в фирмах
многократно выше. Например, только в фирме INTEL в прошлом году на
разработки в области нанотехнологий было потрачено более 1 млрд. долл.
В нашей стране фундаментальные научно-исследовательские работы по
нанотехнологии проводятся по нескольким программам. К наиболее
крупным из них относятся: программа "Физика наноструктур", руководимая
академиком Ж.И. Алферовым, и "Перспективные технологии и устройства в
микро и наноэлектронике", руководимая академиком К.А. Валиевым.
117
Достижение
уровня
характеристических
размеров
элементов,
соответствующих нанометровому диапазону, закономерно вытекает из хода
исторического
развития,
определённого
в
различных
научноисследовательских работах (в частности из закона Мура). Считается, что с
2000 года началась эра гибридной наноэлектроники.
В настоящее время ежегодно проводится около десятка конференций,
посвящённых различным аспектам нанотехнологии. Опубликовано
несколько тысяч статей и даже несколько монографий, созданы специальные
сайты в Интернете, происходит интенсивная подготовка к созданию
наноэлектронных элементов и различных функциональных устройств от
простейших до нанокомпьютеров.
В 2006 году Правительством Российской Федерации принята
Федеральная целевая программа по Индустрии наносистем и материалов с
необычно большим для постперестроечных лет бюджетом.
11.2. Инструменты нанотехнологии
В настоящее время быстро развивающаяся наноэлектроника использует
широкий спектр методов получения наноструктур. Их обзор начнем с
процессов, используемых в нанотехнологиях.
Нанотехнологические процессы.
Основой нанотехнологических процессов является проведение
локальных атомно-молекулярных взаимодействий. В настоящее время
наиболее распространены групповые технологии создания объектов
нанометровых размеров с помощью осаждения и литографии.
Групповые технологии осаждения характеризуются особенностями,
существенно
ограничивающими
возможности
создания
структур
нанометровых размеров. Из-за одновременного осаждения на различные
участки подложки возникают зёрна, дислокации, поры и другие дефекты.
Применение методов эпитаксии (послойного наращивания кристаллических
структур из жидкой или газовой фазы на подложке – кристаллической
пластине, структурные характеристики которой, как правило, определяют и
структуру наращиваемого материала) позволяет преодолеть данные
недостатки, однако из-за высокой температуры эпитаксиальных процессов
(необходимой для повышения поверхностной миграции) ликвидируется
возможность локального осаждения. Локализация осаждаемого материала
возможна в методе графоэпитаксии, однако его развитие сдерживается
возможностями методов литографии.
Традиционно, основным направлением развития методов литографии,
обеспечивающим повышение разрешающей способности, считалось
применение свободно распространяющихся в пространстве частиц с меньшей
длиной волны. Поэтому проводились разработки в направлении укорочения
длины волны используемого излучения, базирующиеся на применении
ультрафиолетового
или
синхротронного
излучения,
а
также
высокоэнергетичной электронной или даже ионной литографии.
118
Методы оптической литографии пока ограничены техническими
возможностями фокусирования света - традиционными линзовыми
системами, осуществляющими передачу излучения через открытое
пространство в размеры, соизмеримые с длиной волны излучения.
Методы электронной и ионной литографии позволяют осуществить
фокусировку воздействующего электронного потока в малые размеры.
Однако высокая энергия фокусируемых электронов приводит к
значительному разрушению используемых материалов, что ограничивает
пространственную разрешающую способность метода. В тоже время,
известен физический эффект, позволяющий получить пространственное
ограничение потока излучения в размерах, меньших длины волны
используемых частиц. Главная особенность эффекта заключается в наличии
условий, запрещающих свободное распространение частиц через
определённую область пространства. Этот эффект в ядерной физике
первоначально получил название эффекта туннелирования. В оптике его
называют эффектом нарушенного полного внутреннего отражения, а в СВЧ
технике – эффектом запредельного волновода.
Применение данных эффектов на вершинах зондов специальных
конструкций позволило достичь высокой пространственной разрешающей
способности без применения высокоэнергичных частиц и создать новые
методы техники сканирующей зондовой микроскопии на их основе.
Например, эффективная ширина потока туннелирующих электронов при
энергии в доли эВ (электрон-вольт) не превышает 0,1-0,2 нм, а оптическое
излучение металооптическими волноводами можно локализовать в области в
десятки раз меньшей длины волны используемого излучения.
На основе техники сканирующей зондовой микроскопии стали
создаваться методы нанотехнологии, использующие частицы с величинами
энергий, определяемыми не энергией необходимой для их фокусировки, а
оптимальной энергией стимуляции нанотехнологических процессов. Именно
данное сочетание позволило достичь высокой разрешающей способности при
формировании элементов нанометровых размеров.
Рассмотрим основные фазы нанотехнологических процессов. При этом
целью повышения эффективности разработки нанотехнологий целесообразно
выделить и проанализировать две важнейшие фазы атомно-молекулярных
процессов, заключающиеся в фиксации и активации атомов. Наиболее
распространенным типом фиксации является локализация нанообъектов
(атомов, молекул, наночастиц) в неоднородном электрическом поле,
создаваемом между вершиной зонда и поверхностью образца. За счёт
дипольного момента и градиента электрического поля нанообъектам
энергетически наиболее выгодно расположиться в области максимальной
напряжённости электрического поля, то есть в промежутке зонд-подложка.
Для повышения эффективности удержания целесообразно увеличивать
величину градиента электрического поля, что достигается применением
более острых зондов и увеличением напряжения между зондом и образцом.
Для этого же целесообразно увеличивать величину градиента магнитного
119
поля, что достигается применением более острых зондов с вершинами,
изготавливаемых из материалов с максимально технически допустимой (по
условиям применения в эксперименте) магнитной проницаемостью и
увеличением напряжённости магнитного поля. При протекании
электрического тока через нанообъект и одновременном действии
магнитного поля (в том же направлении) возникает сила Лоренца,
дополнительно локализующая движение нанообъекта.
Возможно, также локализовать атомы и молекулы с помощью стоящих
оптических волн. Для повышения величины барьера и степени локализации
целесообразно увеличивать мощность и частоту применяемого излучения.
Одним из возможных вариантов использования данного эффекта является
использование зонда в качестве элемента метало - оптического волновода.
Следует отметить, что при расположении нанообъектов между вершиной
зонда и подложкой на них начинают влиять силы межатомного
взаимодействия.
С
целью
увеличения
величины
межатомных
взаимодействий, кроме подбора соответствующего материала, целесообразно
использовать зонды специальных конструкций, включая зонды из
нанотрубок, увеличивающих размеры области взаимодействия.
Сравнение различных методов локализации показывает, что наиболее
эффективным способом локализации является использование трёхмерного
потенциального барьера, создаваемого на конце нанотрубки. Поэтому
сочетание возможности инжекции частиц по нанотрубке и их локализация на
конце является одним из наиболее перспективных направлений дальнейших
разработок нанотехнологии.
Основной фазой нанотехнологических процессов, позволяющей
изменить структуру объектов, является фаза активации. Возможности
активационных процессов зависят, прежде всего, от величины энергии
активации. Величины энергий активационных процессов находятся в
диапазоне от долей до десятков эВ. Рассмотрим диапазон энергий активации,
соизмеримых с величиной энергии тепловых колебаний (~ 0,25 эВ). При
таких энергиях активация может привести к увеличению эффекта
поверхностной миграции, что позволяет преодолеть барьеры, локализующие
атомы при физической сорбции на поверхности. Кроме того, в ряде ситуаций
данная величина энергии достаточна для начала процессов диссоциации
молекул. При проведении нанотехнологических процессов необходимо даже
создавать дополнительные условия диссоциации молекул, размещая их в
областях с повышенной плотностью электронов или повышенной
напряжённостью сил межатомного взаимодействия. Создание энергии
активации в несколько эВ осуществляется приложением внешнего
электрического поля, межатомного взаимодействия, теплового нагрева,
рассеяния электронного потока и воздействия коллективных процессов.
Диапазон энергий в десятые доли эВ соответствует дальнему инфракрасному
диапазону. Основными процессами в данном диапазоне являются
перемещение частиц и их тепловая активация. Перемещение частиц
позволяет осуществить планарную сборку вещества. Однако создаваемые
120
структуры, вследствие невысоких энергий связи характеризуются невысокой
стабильностью. В диапазоне энергий активации от нескольких эВ до десятка
эВ (данный диапазон фактически является основным для большинства
нанотехнологических процессов) имеют место разрыв и синтез органических
молекул, ионизация и так далее. По величине энергии используемых квантов
данный диапазон энергий соответствует оптическому. В данном диапазоне
энергий возможна трёхмерная сборка ряда материалов с невысокой энергией
связи. Создаваемые вещества характеризуются большей стабильностью (по
сравнению с предыдущим методом). В диапазоне энергий более десятка эВ
основными процессами являются ионизация практически всех материалов и
испарение ионов. В данном диапазоне возможна трёхмерная сборка
высокотемпературных
материалов,
характеризующихся
наивысшей
стабильностью. Важным вопросом является соотношение энергий
воздействия и энергии, необходимой для проведения данного процесса.
Для проведения нанотехнологического процесса необходимо, чтобы
энергия
воздействия
превышала
пороговую
энергию
начала
соответствующего процесса. Однако при проведении процесса с
существенным превышением данных энергий разница энергий будет
преобразовываться в движения, мешающие стабилизации результатов
процесса. К ним относятся: разлёт частиц, стимуляция многокаскадных
процессов, включая коллективные, ухудшающие локальность воздействия.
Процессы, происходящие в результате данных методов активации, можно
классифицировать по следующим основным типам.
Полевые процессы.
Поляризация атомов и молекул, приводящая к направленной
ориентации, повышающая структурную упорядоченность вещества и тем
самым повышающая вероятность соответствующих атомно-молекулярных
процессов. В результате поляризации может образовываться состояние
технологической
среды,
похожее
на
жидкокристаллическое.
Стимулированная миграция атомов, молекул и наноструктур под действием
градиента электрического поля. В результате стимулированной миграции
возможно перемещение адсорбированных частиц на поверхности с целью
формирования заданных структур. Диссоциация молекул и образование
новых связей в сильных электрических полях и в областях с повышенной
концентрацией электронов. В сильных электрических полях и в присутствии
электродов, повышающих пространственную плотность электронов,
возможна стимуляция процессов диссоциации молекул и образования новых
связей. Данный метод позволяет образовывать химические связи из
адсорбированного вещества с подложкой, отличающиеся большей
устойчивостью создаваемых наноструктур, по сравнению со структурами,
удерживаемыми за счёт физической сорбции. Десорбция молекул и атомов с
вершины зонда или соответствующего места подложки. Метод позволяет не
только производить предварительную очистку вершины зонда и
соответствующего места подложки, но и осаждать материалы с вершины
121
зонда на подложку и наоборот. Ионизация атомов и молекул. Процесс
значительно повышает скорость прохождения реакций.
Полевая деформация поверхности зонда и подложки. Процесс
является следствием ряда процессов: создания кулоновского взаимодействия,
рассеяния электронов и повышения скорости миграции.
Полевая эмиссия электронов и ионов. В сильных электрических полях
на первом этапе возникает полевая эмиссия электронов, а при дальнейшем
увеличении напряжённости поля до нескольких вольт на ангстрем
начинается полевое испарение материала.
Кинетические процессы.
Рассеяние электронов. Процесс порождает возбуждение различных
колебаний в молекуле, приводит к локальному разогреву, стимулирует
поверхностную миграцию. Не всегда эффективность процесса достаточна
для стимуляции нанотехнологических процессов, потому что масса
электрона в тысячи раз меньше массы молекулы, на которой он рассеивается,
и поэтому процесс передачи энергии происходит недостаточно эффективно.
Рассеяние нейтральных частиц в большинстве процессов, стимулируемых
вышеописанными методами, не используется или является вторичным
эффектом. Однако в будущем, при специальном конструировании
инжекторов нейтральных частиц, процесс мог бы быть более эффективным,
чем процесс рассеяния электронов. Рассеяние заряженных частиц более
эффективно по сравнению с рассеянием электронов, однако реализации
данного режима противодействует обычно присутствующий поток
электронов и достаточно малое время перезарядки.
Тепловое воздействие является наиболее эффективным способом
стимулировать физико-химические процессы. Однако, несмотря на высокую
скорость
диссипации
энергии,
для
обеспечения
нанометровой
пространственной разрешающей способности требуется осуществлять
воздействия с пикосекундными длительностями.
Электромагнитные процессы.
Нерезонансные. При вводе излучения с частотой, не соответствующей
пику поглощения, возможно использование процессов локализации, нагрева
или охлаждения объектов, располагаемых в зазоре зонд-поверхность образца.
Резонансные в одном спектральном диапазоне. Применение
излучения, соответствующего пику поглощения, позволяет повысить
эффективность поглощения и соответствующего разделения молекул, а
также запретить образование химических связей с энергией, равной энергии
кванта вводимого излучения.
Резонансные в нескольких спектральных диапазонах. Введение
излучения на нескольких частотах позволяет повысить эффективность
управления технологическим процессом, сужая диапазон возможных
разрешённых результатов путём увеличения числа запрещённых.
Спектрально
синхронизованные.
Прохождение
во
времени
нанотехнологических процессов сопровождается сложным изменением во
времени энергетических связей. При синхронизированной во времени
122
накачке, амплитудной, частотной и фазовой модуляции возможно более
эффективное управление ходом атомно-молекулярных процессов.
Пространственно-когерентные. Прохождение нанотехнологического
процесса сопровождается изменением пространственного положения атомов
и молекул. Введение излучения не только по времени, но и в пространстве
когерентного с пространственным преобразованием положения атомов и
молекул позволит о6еспечить самое оптимальное управление ходом
нанотехнологических процессов.
Межатомные
взаимодействия.
Потенциально
данный
вид
взаимодействий является наиболее эффективным по величине энергий, по
соотношению масс и так далее. Однако использование его требует создания
специальных конструкций, изготовление которых в свою очередь также
требует использования нанотехнологий. В дальнейшем возможно создание
специализированных конструкций типа нанотрубок - транспортёров атомов в
которых будут происходить несколько процессов - транспортировка,
активация
и
так
далее.
Перечень классифицированных физических эффектов, используемых в
нанотехнологических процессах, приведён на рис. 4. Соотношения между
различными типами нанотехнологических процессов и их характеристиками
приведены
на
рис.
5.
Методы активации нанотехнологических процессов определяются в
основном техническими возможностями нанотехнологических установок. К
основным из них относятся создание между вершиной зонда и образцом:
- разности электрических потенциалов;
- механического воздействия;
- теплового воздействия (создание градиента температуры);
- оптического воздействия;
- ультразвукового воздействия;
- электромагнитного воздействия.
Предтечей зондовых технологий явился сканируюший туннельный
микроскоп, действие которого основано на рассмотренном в предыдущей
лекции туннельном эффекте.
Для вырывания электрона из металла требуется совершить работу
(выхода). Холодная (автоэлектронная) эмиссия электронов из металла
возникает при приложении сильного электрического поля у границы металл
– среда. Потенциальная энергия электрона вблизи поверхности металла
может быть представлена в виде
U ( x) = U 0 − eEx ,
где U 0 – глубина потенциальной ямы. Это равенство задаёт барьер
треугольной формы.
Сканирующий туннельный микроскоп (СТМ) был создан в 1982 г.
сотрудниками исследовательского отдела фирмы IBM Г.Биннингом и
Х.Рёрером. Поскольку СТМ явился первым техническим устройством, с
помощью которого была осуществлена наглядная визуализация атомов и
123
молекул, Бинниг и Рёрер были удостоены Нобелевской премии по физике
1986 г.
z
игла
y
∆z
x
Рис. 11.1
∆z~10 м, ∆x~10-3 м, ∆y~10-3 м
-3
Если к поверхности проводящего образца на характерное (доли нм)
расстояние подвести очень тонкую металлическую иглу (рис. 11.1), а затем
приложить между образцом и иглой разность потенциалов U~0,1–1 В, то в
цепи потечёт туннельный ток, обусловленный туннелированием электронов
через зазор: IT~1–10 нм (IT=Ne).
Отсюда IT уменьшается примерно на порядок при увеличении зазора (по
экспоненте см. последнюю формулу для коэффициента прозрачности D
прошлой темы с учётом того, что ширина зазора определяет ширину
потенциального барьера).
Существуют два варианта режима работы СТМ: режим постоянной
высоты и постоянного тока.
В первом случае информацию о рельефе поверхности с атомным
пространственным разрешением получают через анализ изменения
туннельного тока, а во втором случае – через анализ перемещений иглы в
вертикальном направлении.
С помощью системы глубокого подвода и позиционирования иглу СТМ
подводят на расстояние ~ 0,1 мкм. Дальнейшее перемещение иглы
осуществляется с использованием специального сканирующего устройства
на основе пьезоэлектрика – вещества, способного деформироваться
(изменять свои размеры и форму) при приложении к нему электрического
поля.
В качестве материала иглы обычно используют вольфрам, ванадий.
Кончик иглы подвергают электрохимическому травлению для достижения
радиуса иглы менее или равном 0,2 мкм. Все операции СТМ управляются
ЭВМ.
Например, в электронной микроскопии высокого разрешения энергия
электронов достигает сотен кэВ, что приводит к образованию
радиационных дефектов. Т.к. СТМ не содержит линз, т.е. нет аберраций, и
не разрушает образец (энергия электронов при туннелировании меньше
энергии химической связи (порядка нескольких эВ), то СТМ применяется для
изготовления и исследования нанообъектов, вирусов, микромолекул.
С помощью СТМ из 35 атомов инертного ксенона (Хе) была собрана
аббревиатура фирмы IBM. Сейчас существуют различные модификации
124
СТМ, в частности атомно-силовой микроскоп, позволяющий изучать
непроводящие образцы (вещества).
В зависимости от технологического режима, возможна также
комбинация воздействий (в различных амплитудных и временных
пропорциях). При проведении конкретных процессов не всегда удаётся
использовать только один из физических эффектов. Реально используется их
совокупность. В настоящее время нанотехнология находится в начале
развития и поэтому ещё рано утверждать, что найдены самые оптимальные
сочетания физических эффектов, используемые для проведения
нанотехнологических процессов. Однако некоторые из сочетаний уже сейчас
можно анализировать и использовать.
Нанотехнологические воздействия В зависимости от уровня
сложности
и
соответствующих
технических
возможностей
нанотехнологических установок, в настоящее время применяются, а также
могут быть использованы следующие нанотехнологические воздействия.
Полевое воздействие. Полевое воздействие является самым простым и
поэтому самым распространённым. В результате полевого воздействия
получены экспериментальные результаты по перемещению атомов и
молекул, локальному электрохимическому травлению и осаждению из
газовой и жидкой фаз. Основным недостатком метода являются технические
проблемы активации нанотехнологических процессов при использовании
изолирующих подложек.
Следует отметить, что для создания наноэлектронных элементов можно
воспользоваться тем обстоятельством, что все элементы имеют
электрическое подключение, в конечном счете, к внешним электродам.
Поэтому формируя проводящие элементы от данных электродов,
располагаемых
на
изолирующей
подложке,
возможно
создание
наноэлектронных функциональных элементов.
Другой способ преодоления существующего недостатка заключается в
использовании нескольких зондов. При этом возможно пространственное
разделение областей активации и области осаждения продуктов реакции.
Данный способ проведения нанотехнологических процессов открывает
возможность осуществлять их на подложках с любым типом проводимости.
Дальнейшее
развитие
многозондового
метода
проведения
нанотехнологических процессов заключается в реализации мажоритарного
способа активации, то есть заключающегося в инжекции носителей зарядов
из нескольких зондов в один. При этом у данного зонда локально возрастает
температура и тем самым повышается вероятность проведения локальной
физико-химической реакции. Направленность процесса обеспечивается
приложением напряжения между зондами соответствующей полярности.
Термополевое воздействие. Термополевое воздействие является сочетанием
создания разницы температур между вершиной зонда и подложкой.
Модификацией данного метода является приложение дополнительного
напряжения между вершиной зонда и подложкой (если подложка
проводящая). Достоинством метода термополевой десорбции является
125
возможность осаждения материалов любых типов с атомарной разрешающей
способностью. Отличие метода заключается в необходимости достижения
достаточно высоких температур и создания соответствующих градиентов.
Оптическое воздействие. Достоинствами метода являются:
- возможность резонансного поглощения излучения, приводящего к
диссоциации молекулы;
- высокая степень локализации атомов и молекул в узле напряжённости
электромагнитного поля;
- возможность работы с материалами подложки любых типов, включая
диэлектрические.
Необходимо также познакомиться с наиболее распространенными в
настоящее время методами получения так называемых квантово-размерных
структур, о которых пойдет речь в заключительной части лекции – методах
молекулярно-пучковой эпитаксии (МПЭ) и газофазной эпитаксии с
использованием металлоорганических соединений (МОС ГФЭ).
Процесс МПЭ – это процесс испарения и конденсации вещества в
сверхвысоком вакууме (Р<10-9 мм.рт.ст.). Проводят его в специальной
камере, схематическое изображение которой показано на рис. 11.2. Наличие
вакуумного шлюза позволяет менять подложки, сохраняя высокий вакуум.
Для уменьшения давления остаточных газов вся свободная площадь камеры
ограждается экранами, охлаждаемыми жидким азотом. Эффузионные
(эффузия – медленное истечение газа через малое отверстие) испарительные
ячейки выполняются из тугоплавкого материала, например, нитрида бора.
После того как камера МПЭ откачана, экран охлажден жидким азотом, а
испарители выведены на требуемую температуру, нагревается подложка. Для
арсенида галлия ее температура должна составлять около 600°С, для кремния
не ниже 850°С. Процесс роста слоев начинается при открытии основной
заслонки и заслонок соответствующих испарителей. Сверхвысокий вакуум и
малая скорость поступления атомов на растущую поверхность (примерно
1014–1015 атомов в секунду) приводят к эпитаксиальному росту пленок
посредством практически монослойного заполнения растущей поверхности,
обеспечивая исключительно точное управление профилями химического
состава и легирования. В процессе МПЭ возможен непосредственный
контроль как состава газовой фазы (масс-спектрометрия), так и параметров
слоев: кристаллической структуры (методами дифракции быстрых или
медленных электронов), химического состава (оже-спектроскопия), толщины
(эллипсометрия).
Измерительные датчики могут быть помещены непосредственно в
высоковакуумную камеру установки.
Использование масок в ходе роста и “рисование” молекулярными
пучками позволяют создать на поверхности подложки трехмерные,
монолитно
интегрированные
структуры.
Обладая
неоспоримыми
преимуществами, метод МПЭ имеет единственный, но весьма существенный
недостаток – высокую стоимость, что вызывает поиск альтернативных
методов.
126
Рис. 11.2. Схематическое изображение ростовой камеры установки МПЭ:
1 – флуоресцентный экран дифрактометра, 2 – заслонки эффузионных
испарительных ячеек, 3 – эффузионные испарители с веществом, 4 – экран с
азотным охлаждением, 5 – электронная пушка дифрактометра, 6 – основная
заслонка, 7 – вращающийся держатель подложки, 8 – ионизационный
индикатор, 9 – шлюзовой клапан с вакуумным шлюзом для смены образцов,
10 – смотровое окно, 11 – ось двигателя для вращения подложки и питания
нагревателя подложки. Пунктиром показан ход электронного луча
дифрактометра
Одним из таких методов явился метод газофазной эпитаксии из
металлоорганических соединений (ГФЭ МОС) или так называемая МОСгидридная технология (особенно ее модификация при пониженных
давлениях).
В этом случае исходные газообразные реагенты пиролитически (под
действием высокой температуры) разлагаются у поверхности подложки,
выделяя пленкообразующие компоненты, причем подложка является более
нагретым телом, чем окружающая среда. При выращивании тонких слоев
методом ГФЭ МОС контроль параметров пленок непосредственно в процессе
синтеза неприменим, так как обычно используют достаточно агрессивные
газовые среды. Процесс проводят в проточном вакуумном реакторе при
давлении паров компонентов 0,1–10 мм.рт.ст. Снижение давления и
увеличение скорости газового потока позволяют получать более однородные
слои с контролем толщины до нескольких ангстрем. Исходными
компонентами обычно служат метильные, этильные и изобутильные
соединения металлов, а также гидриды некоторых элементов. В качестве
примера можно привести химические реакции, протекающие у поверхности
при получении тонких слоев полупроводников А3В5:
Ga ( CH3 )3 + AsH3 → GaAs + 3CH4 ,
In ( C2H5 )3 + PH3 → In P + 3C2H6 .
127
Смешивая исходные компоненты в газовой фазе в определенных
пропорциях, синтезируют эпитаксиальные пленки твердых растворов:
(1–x)Ga ( CH3 )3 + x Al ( CH3 )3 +AsH3 → Ga1-xAlxAs + 3CH4.
Добавляя в газовую фазу небольшие количества легколетучей примеси,
получают легированные эпитаксиальные слои.
МОС-гидридная технология, успешно конкурируя с МПЭ своей
простотой и производительностью, обладает несколько худшей
воспроизводимостью и дает более расплывчатые профили изменения состава
и легирования. Это обусловлено использованием как сравнительно высоких
температур подложки, так и длительным временем синтеза.
11.3. Квантово-размерные полупроводниковые структуры:
квантовые ямы, нити, точки
Часто при рассмотрении оптических явлений в полупроводниках
предполагается, что объект объёмный и изотропный (кристалл,
эпитаксиальный слой, и т. п.). Объёмные, трёхмерные или 3D объекты –
объекты, фундаментальные физические свойства которых не зависят от их
размеров в трёх направлениях. Изотропный объект – объект, свойства
которого по всем направлениям одинаковы. Реальные объекты, например,
кристаллы практически все анизотропны.
Объектами низкой размерности, низкоразмерными объектами или
квантово-размерными объектами (системами, структурами) называют
объекты, где движение носителей (частиц) ограничено по одной ( 2 D ), двум
(1D ) и трём ( 0 D ) (объекты – квантовые точки) координатам.
Под квантово-размерными эффектами (КРЭ) понимают зависимость
физических свойств объекта или вещества от его геометрических размеров.
Возможность появления таких эффектов определяется характерным
физическим размером объекта. Для классических размерных эффектов роль
характерного физического размера определяется длиной свободного пробега
или диффузионной длиной, для КРЭ – де-бройлевская длина волны
электрона.
Удобным модельным объектом, позволяющим понять свойства
квантово-размерных систем, является прямоугольная ПЯ. Мы уже
рассматривали решения УШ для случая бесконечно глубокой ПЯ и ПЯ
конечной глубины (часто в первом случае бывает удобно выбрать начало
отсчёта не на границе ямы, а в её центре).
Практический интерес представляют не только одиночные структуры
типа квантовых ям (КЯ), но и их набор. Если ПЯ отделены друг от друга
достаточно широким потенциальным барьером (ПБ), так, что ВФ электронов
не проникают из одной ямы в другую, то их взаимодействием можно
пренебречь. Свойства структуры, состоящей из набора N одинаковых
невзаимодействующих ПЯ будут просто аддитивно складываться. Такие
структуры удобно использовать, например, для увеличения поглощательной
способности или числа активных центров (рекомбинации и т.д.) в N раз.
128
Если же ширина ПБ и его высота позволяют электронам туннелировать
из одной ПЯ в другую с достаточной эффективностью (расчёт исходя из
вероятности и вида Ψ–функции), то такая структура будет вести себя как
единое целое и её необходимо рассматривать как систему
взаимодействующих ПЯ. Простейшая структура состоит из двух одинаковых
прямоугольных ПЯ конечной глубины U1 = U 2 = U , разделенных ПБ
шириной b и высотой V0 . При сближении ПЯ и уменьшении толщины
разделяющего их ПБ экспоненциальные хвосты ВФ проникают из одной ПЯ
в другую – происходит их перемешивание. Это взаимодействие в рамках
теории возмущений рассматривается как малое возмущение. В случае
одинаковых ПЯ ( Ψ1 = Ψ2 ) это взаимодействие приводит к расщеплению
энергетического уровня, например Е1 , на два состояния
Е1( S , a ) = E1(0) ± V12 .
Нижнему состоянию (знак «–») соответствует симметричная
(относительно центра структуры) ВФ (рис. 11.3, а) и это состояние
называется симметричным, а верхнему (знак «+») – соответствует
антисимметричная ВФ и это состояние называется антисимметричным.
Е, мэВ
U(x)
0
-20
b
d
d
0
Е4
2а
Е3
2s
Е2
Е1
1а
1s
b
d2
δ
-20 Е3
-40
-40
-60
d1
-60
δ
Е2
δЕ→0
Е1
δ
-80
-80
0
2
4
6
8
х, нм
а)
0 2 4 6
х, нм
б)
Рис. 11.3
Таким образом, в двойной КЯ, состоящей из двух одинаковых ПЯ,
разделённых барьером b , происходит снятие вырождения по энергии путём
расщепления уровней n=1, 2, 3, … на симметричные (1s, 2s, 3s, …) и
антисимметричные (1а, 2а, 3а, …) состояния. Величина расщепления тем
129
сильнее, чем уже барьер и чем ближе уровень к континууму (к однородной,
без включений протяженной среде).
Это связано с увеличением перекрытия ВФ как при уменьшении b , так и
при увеличении n . Для двух связанных ПЯ с разными параметрами также
будет наблюдаться взаимодействие между разными состояниями и их
перекрытие из одной ПЯ в другую (рис. 11.3, б). Наиболее сильно это
взаимодействие будет проявляться для резонансных состояний, близких по
энергиям. Состояния, разделённые большим энергетическим интервалом,
можно условно приписать одной или другой ПЯ, хотя при малой ширине
барьера взаимодействие может быть настолько сильным, что применение
теории возмущений становится недопустимым и всю систему необходимо
рассматривать как единое целое.
При увеличении числа N взаимодействующих ям каждый из уровней
будет расщепляться на N состояний. При небольших значениях N каждое
из этих состояний возможно различить, но при N > 7 они будут
перекрываться, образуя полосы разрешенных значений энергии. При
больших N это перекрытие и перемешивание состояний будет настолько
сильным, что отдельные дискретные уровни неразличимы и можно говорить
об образовании разрешённых минизон энергии E1 , E2 ,... , разделённых
областями запрещённых значений энергии (запрещенными значениями,
вспомним решение УШ для ТТ).
U(x)
0
Е(k)
0
x -2π/А -π/А
0
π/А
2π/А
Рис. 11.4
Такая структура ведёт себя как единое целое и называется
сверхрешёткой с периодом A = a + b (рис. 11.4)
Свойствами такой одномерной сверхрешётки можно управлять, меняя
параметры ямы ( a и U ) и барьера ( b и V0 ). Электрон в такой структуре
будет вести себя как в одномерном кристалле с периодомr А .
При наложении внешнего электрического поля Е э перпендикулярно
стенкам ямы изменяется её форма, электронный спектр и ВФ.
130
h2 d 2
Решение УШ ( −
+ U ( x) − qE э x )Ψ ( E , x ) = EΨ ( E , x ) зависит
2m dx 2
от формы ПЯ U (x) и налагаемых граничных условий.
Решение для прямоугольной ПЯ приводит к следующим выводам:
1. Энергетический спектр КЯ становится непрерывным во всей области
определения, то есть вместо дискретных состояний с квантовым числом n и
имеющих вид δ -функций с бесконечно узкой шириной (рис. 5.7, б),
становятся формально разрешёнными состояния с любой энергией. В
электронном спектре наблюдается резонансные пики, называемые
резонансами Брейта–Вигнера. При Е э → 0 они переходят в дискретные
урони энергии En с δE → 0 . Размытие электронного спектра и уширение
уровней квантования под действием электрического поля вызваны
возможностью туннелирования электрона через треугольный потенциальный
барьер (рис. 5.9). Чем глубже расположен уровень в яме и чем меньше
r
электрическое поле Е э , тем шире барьер и тем меньше уширение δE .
Положения резонансов E n зависят от приложенного электрического поля
r
Е э и при Е э → 0 они совпадают с уровнями размерного квантования в яме
соответствующей формы.
Отметим, что время жизни τ связано с уширением δE простым
соотношением ∆ωτ ≈ 1, ∆ω – полуширина спектральной линии.
2. Под действием электрического поля происходит смещение ВФ и
смещение центра тяжести электронного облака как по энергиям (сдвиг
уровня – штарковский сдвиг), так и по координате. В симметричной яме
электрическое поле снимает вырождение относительно направления
движения, что может быть применено в электронных приборах.
В двойной КЯ поле нарушает симметрию структуры. ВФ перекрываются
между ямами так, что центры тяжести симметричных и антисимметричных
состояний оказываются смещёнными в разные стороны.
r
3. При некоторых величинах Е э энергетические уровни соседних ям
будут иметь одинаковую энергию. Их значение соответствует процессу
“резонансного туннелирования” (используется для селективного заселения
рабочих уровней в полупроводниковых лазерах).
4. В континууме состояний над КЯ ( E > (U −
qE э a
) ) появляется
2
дополнительная серия резонансов, положение которых близко к положению
уровней в треугольной потенциальной яме с бесконечной стенкой
a  3π
1 qE h 
En = −qEэ +  (2n − ) э 
2 4
2 2m 
2/3
.
131
5. В структурах с резонансным туннелированием зависимость
наблюдается вольт-амперная характеристика I = f (U ) , содержащая участок
с отрицательным дифференциальным сопротивлением ВС (рост тока при
уменьшении напряжения) (рис. 11.5), например, у резонансного диода.
Данная ВАХ похожа на ВАХ туннельного диода, но из-за меньшей емкости
резонансный диод имеет большую скорость переключения. КЯ может быть
настолько узкой (5–10 нм), что в ней может быть только один, так
называемый резонансный энергетический уровень. Положение точек A , B ,
С и крутизна характеристик может регулироваться выбором параметров в
квантовой структуре. Точка В соответствует напряжению в структуре, при
котором энергия электронов совпадает с резонансной и при котором
происходит резонансное туннелирование и рост тока.
Примером простейшей двумерной структуры, казалось бы, может быть
тонкая металлическая плёнка. Сам факт, что электроны не выходят из
металла без внешнего энергетического воздействия, говорит, что они
находятся в потенциальном ящике, высота барьеров которого соответствует
работе выхода электронов и имеет порядок величины 2–5 эВ, то есть весьма
велика.
Однако в металлах электронный газ сильно вырожден
и де бройлевская
r
длина волны определяется волновым вектором k F на поверхности Ферми:
λF =
2π
(в одномерном кристалле уровень Ферми – самый верхний из
kF
заполненных энергетических уровней при температуре, стремящейся к нулю.
Другое его толкование – статистическое: уровень, вероятность заполнения
которого при любой температуре равна 1/2; в трёхмерном случае говорят о
поверхности Ферми, эти вопросы далее будут рассмотрены далее).
.
I
B
U(x)
A:
E
B:
A
0
C
C:
U
Рис. 11.5
В вырожденном газе де-бройлевская длина волны электронов зависит от
концентрации свободных носителей заряда n
λF = (
8π 1 / 3
)
3n
132
(для 3D -систем),
2π 1 / 2
)
(для 2 D -систем),
3n
4
(для 1D -систем).
λF = ( )
n
Подставив типичные значения n , легко убедится, что в металлах де
λF = (
бройлевская длина волны свободных электронов имеет порядок величины
межатомных расстояний, энергетические уровни размыты и эффекта
размерного квантования на основе металлических плёнок не проявляется.
Реализовать квантовую яму, близкую к прямоугольной, наиболее просто
с помощью так называемой ДГ-структуры (двойной гетероструктуры).
Действительно, если к одиночному гетеропереходу добавить со стороны
узкозонного материала ещё один барьер, образованный на контакте с
широкозонным материалом, то носители оказываются запертыми в
потенциальном ящике, стенки которого образованы двумя гетерограницами.
В случае резких гетеропереходов эти стенки близки к вертикальным, а сам
тонкий
узкозонный
полупроводниковый
слой
(между
двумя
широкозонными) представляет собой прямоугольную квантовую яму, в
которой движение носителей заряда в плоскости слоя (x, y) происходит без
ограничений, а в направлении, перпендикулярном гетерограницам, это
движение ограничено и происходит квантование энергетического спектра.
Тот факт, что электроны движутся не в свободном пространстве (вакууме), а
в материальной среде (например, эпитаксиальном монокристаллическом
слое), учитывается введением диэлектрической проницаемости среды с
заменой в уравнениях массы свободного электрона m0 на эффективную
*
*
массу mn или m p аналогично тому, как это делается в обычных кристаллах.
В структуре с двумерным электронным газом полная энергия электрона
имеет смешанный дискретно-непрерывный спектр, представляя собой сумму
дискретных энергий, связанных с движением в направлении квантования z, и
непрерывной компоненты, описывающей (как и в 3D-кристалле) движение
носителей в плоскости слоя (x, y) как свободных носителей с эффективной
*
массой m :
E = En +
p x2
2m
*
+
p 2y
2m
*
= En +
h 2 (k x2 + k y2 )
2m
*
,
(11.1)
где p x , p y , k x , k y – соответствующие компоненты квазиимпульса и
волнового вектора. За счёт непрерывной компоненты электроны,
принадлежащие одному и тому же уровню En , могут иметь любую энергию
в интервале от En до бесконечности. Такую совокупность состояний для
данного квантового числа n называют подзоной размерного квантования
(рис. 11.6).
133
В общем случае зависимость типа (11.1) может отличаться от
квадратичной в плоскости (x, y) вследствие анизотропности свойств
материалов (различие параметров в долинах прямозонных и непрямозонных
ПП по различным кристаллографическим направлениям).
Если же ограничить движение электрона не по одной, а по двум
координатам, то получим двумерную ПЯ, квантование энергии в которой
будет подчиняться закономерностям, аналогичным рассмотренным выше.
Собственные значения энергии электрона в двумерной КЯ будут зависеть от
её параметров, в том числе от ширины, не только в направлении z, но и во
втором направлении, например y, и будут определяться не одним, а двумя
квантовыми числами n1 и n2 : E = E n1, n 2 . По третьей координате х в такой
структуре, называемой квантовой проволокой или квантовой нитью (КН),
возможно свободное движение так, что энергия электронов в такой 1Dструктуре будет равна:
E = En1, n 2 +
h 2 k x2
2m
*
.
Е
U(z) Е
n=3
Е1
n=2
Е2
n=1
ky
(py)
Е3
Ес
0
z
0
k
(pxх)
Рис. 11.6
Аналогично при ограничении движения электрона по трём координатам
свободное движение будет невозможно, и такая структура называется
квантовой точкой (КТ) и обладает размерностью 0 (0D). Квантование
энергии происходит по всем трём координатам:
E = En1, n 2, n3 .
КТ обычно формируются за счёт эффектов самоорганизации при
эпитаксиальном выращивании структур на основе материалов с существенно
различными параметрами решётки (для возникновения напряжения на
гетерогранице). Например, при многослойном эпитаксиальном наращивании
InAs и твёрдого раствора In1− x Ga x As на подложке GaAs при
определённых технологических условиях возможно образование как
отдельных КТ в виде нанокристаллов, разбросанных по поверхности слоя,
так и определённое их упорядочивание, включая наслоение друг на друга,
так называемое «складирование» КТ.
134
ПЯ различной размерности и изменение энергии в них мы уже
рассматривали ранее. Следует отметить лишь, что рассмотренные КРЭ для
одномерной ПЯ (уширение уровней δE ) остаются справедливы и для
двумерной и для трёхмерной ПЯ в соответствующих направлениях. Это
позволяет формировать энергетический спектр носителей в структуре по
своему усмотрению, управлять временем жизни τ в нестационарных
состояниях, а также пространственно ограничивать и направлять движение
носителей заряда. Кроме того, слои, образующие КЯ могут быть легированы
донорными или акцепторными примесями, что также может существенно
влиять на энергетический спектр носителей. В квантово-размерных
структурах оптические и фотоэлектрические явления определяются теми же
фундаментальными процессами взаимодействия света (фотонов) с веществом
(атомными системами), которые были рассмотрены нами ранее. Поскольку в
квантово-размерных структурах (КЯ, КН, КТ) ВФ как электрона, так и дырки
локализованы (ограничены в определенной области, высокое отношение
поверхности к объёму у наноразмерных объектов), то вероятность
излучательной рекомбинации существенно возрастает по сравнению с 3Dструктурами.
Внутренний
квантовый
выход
(отношение
числа
излучательных переходов к числу всех переходов в единицу времени)
люминесценции может быть близок к единице при условии, что на
гетерограницах
и
в
самих
структурах
концентрация
центров
безызлучательной рекомбинации мала. Так как различного рода структурные
дефекты, дислокации, глубокие центры являются исключительно
эффективными центрами безызлучательной рекомбинации, то к качеству
квантово-размерных структур и прежде всего к качеству гетерограниц
предъявляются довольно жёсткие требования.
11.4. Наногетероструктуры в России
Прогресс в направлении исследований и получения наногетероструктур
в нашей стране неразрывно связан с именем Нобелевского лауреата по
физике (2000 г) Жореса Ивановича Алферова и его учеников- сотрудников
Физико-технического института им. А.Ф.Иоффе (г. Санкт-Петербург). Речь
идет о передних рубежах новой физики и электроники – нанофизике и
наноэлектронике. В настоящее время сведения об этих исследованиях только
начинают входить в учебники для высшей школы, в основном, информацию
можно получать только из специальных журналов. Ярко и интересно, по сути
вопроса, рассказал об отечественной нанотехнологии один из учеников
Ж.И.Алферова – ведущий научный сотрудник Физтеха, доктор физикоматематических наук Николай Николаевич Леденцов. В настоящем
изложении приводятся тезисы этой лекции.
Гомо- и гетеролазеры
Гетероструктура по сути дела представляет собой монокристалл, в
который вставлен слой, отличающийся химическим составом от состава
матрицы. Именно это и считалось невозможным – вставить в полупроводник
135
слой из другого материала так, чтобы граница между разными материалами
была бездефектной. Тогда возникал вопрос, не будет ли сама эта граница
оказывать нежелательные воздействия на свойства прибора? Считалось
также, что материалы с различными свойствами, например, цветом
излучаемого света, обязательно отличаются и характерным размером своей
кристаллической решётки, и если их попытаться состыковать, то неизбежно
возникнут трещины или другие дефекты. Предполагалось также, что границу
между материалами будет трудно сделать достаточно резкой, и все
ожидаемые преимущества замоются. Кроме того, полагали, что на границе
могут формироваться микрочастицы паразитных соединений. Но Алфёров и
его коллеги показали, что всех этих проблем можно избежать и
преимущества, ожидаемые для "идеальных" гетероструктур могут быть
реализованы на практике. Эти свойства, например возможность, зажать
носители заряда в слое узкозонного материала, возможность организовать
волноводный эффект, возможность получать сверхвысокие плотности
носителей заряда в тонком слое без того, чтобы сильно легировать всю
структуру и многое другое.
Чтобы понять, как работает полупроводниковая гетероструктура и лазер
на ей основе мы обратимся сначала к устройству самого кристалла, из
которых гетероструктура собирается. Начнём мы с самого важного – с
квантовой природы, лежащей в его основе. Что это такое?
Если вы смотрите на плёнку бензина на поверхности лужи, то вы
увидите, что она разноцветная. Это в тонкой пленке образуются стоячие
волны для определённой длины волны. Толщина чуть отличается, и стоячая
волна соответствует другому цвету в разных местах плёнки. Если набрать
много таких плёнок, можно, например, получить очень хороший
коэффициент отражения для определённой длины волны или диапазона длин
волн. На этой основе делаются, например, интерференционные зеркала,
просветляющая оптика для фотоаппаратов. Этот эффект связан с волновой
природой света.
Так вот, электрон, в том числе и свободный электрон в электрон в
кристалле тоже обладает свойствами волны, как это следует из основных
законов квантовой механики.
Например, свободный электрон в потенциальной яме, сформированной
притягивающим потенциалом ядра атома формирует набор дискретных
уровней, а не непрерывный спектр состояний, как раз из за формирования
стоячих волн. В твёрдом теле за счёт высокой плотности атомов,
электронные уровни взаимодействуют друг с другом, и уширяются в зоны.
Последняя заполненная электронами зона называется валентная зона, первая
свободная – валентная зона, они разделены зоной запрещенных состояний.
Представим, что мы имеем это одиночный уровень в свободном атоме.
Если мы “ударим” электроном или фотоном по атому, то электрон с
заполненной оболочки может перейти на верхний свободный уровень, или,
как говорят, в возбужденное состояние. Спускаясь обратно, электрон
испускает квант света. Поэтому, например, газы атомов в электрическом
136
разряде светятся строго определёнными цветами. В твёрдом теле у нас
вместо дискретных уровней появляются широкие энергетические зоны, но в
принципе идея перехода в возбуждённое состояние та же самая. При помощи
легирования инородными атомами можно создавать электроны, слабо
связанные с кристаллическим остовом. В этом случае при конечной
температуре в кристалле появляются свободные электроны, которые могут
двигаться в электрическом поле. Можно, наоборот, создавать легированием
ловушки для электронов валентной зоны, которые будут приводить к
появлению в валентной зоне незаполненных электронами состояний
имеющих положительный заряд, так как кристалл в целом электронейтрален.
Эти положительно заряженные "дырки" будут притягиваться к ловушке,
заряженной захваченным электроном, но при подогреве кристалла, они также
окажутся свободными, из за столкновений с вибрациями кристаллической
решётки (фононами). Легирование позволяет получить, таким образом,
электронный или дырочный тип проводимости. И теперь при приложении
электрического поля к кристаллу можно заставить электроны бежать туда,
где находятся дырки, а дырки бежать туда, где есть электроны, они будут
встречаться, и свободные электроны будут заполнять имеющиеся дырки,
испуская при этом кванты света. И каково энергетическое расстояние между
зонами, по которым бегут электроны и дырки, а бегут они по зоне
проводимости и по валентной зоне, соответственно, таков и будет цвет
излучаемого кванта. Получается, что можно сделать красный, синий, зелёный
или ультрафиолетовый, инфракрасный светодиод. Но электроны и дырки
движутся в разные стороны и с разными скоростями, свет тоже летит в
разные стороны. Для лазера же нужно получить область с очень высокой
объёмной концентрацией электронов и дырок, и добиться того, чтобы свет не
убегал из этой области. В общем, без гетероструктур прогресса с точки
зрения повышения эффективности лазера достичь на идее гомо-р-n
перехода не удалось, и ситуация изменилась, только когда появилась
гетероструктура.
Что такое гетероструктура? Имеется два материала с разными ширинами
запрещённой зоны. Теперь электроны и дырки собираются в потенциальном
ящике; если ящик толстый, они бегают там как квазичастицы. Теперь всё
носители заряда собраны в узком слое материала с заданными свойствами,
который, кроме того позволяет получить и оптическое ограничение, т.е.
локализовать свет, за счёт большего коэффициента преломления узкозонного
слоя. На основе этих обоих эффектов можно кардинально улучшить свойства
прибора.
В современном мире используются лазеры 2-х типов:
137
Полосковые (горизонтальные) лазеры
Вертикальные лазеры
Рис. 11.7
В полосковых лазерах свет распространяется по волноводному слою
вдоль поверхности (зеркала резонатора – сколы кристалла). Их
преимущества: Большая мощность (12 Вт, 100 мкм апертура) Большая
плотность мощности (40 МВт/см2). Коммерчески доступны для всех
подложек. Доминируют на рынке (телекоммуникации, и пр.)
В вертикальных лазерах свет выходит наверх (зеркала – многослойные
интерференционные отражатели). Выгоды – хорошая диаграмма
направленности, одномодовость (узкая спектральная ширина линии
излучения); высокая температурная стабильность; главное – сверхнизкие
пороговые токи. Интеграция, дешевизна. Быстрый рост рынка (140% в год).
Коммерчески доступны только на GaAs.
Преимущества лазера перед светодиодом огромны: это большая
мощность (до 12 Вт с узкого полоска шириной 0.1 мм), большая плотность
мощности (40 МВт/см2); лазеры доступны для получения на различных
подложках, излучают с хорошей диаграммой направленностью и так далее.
Вертикальные лазеры могут быть очень маленькие (до микронных
размеров), обладают низким пороговым током, хорошей диаграммой
направленностью. Их легко сделать одномодовыми, когда только одно
квантовое состояние света принимает участие в лазерной генерации. У
вертикальных лазеров хорошая температурная стабильность порогового тока
и длины волны излучения, более того, на их основе возможно создание
сложных оптоэлектронных интегральных схем на одном кристалле. Малый
размер обуславливает дешевизну. Рынок таких лазеров растёт со скоростью
до 200% в год. И только один есть недостаток – коммерчески они доступны
только на подложке GaAs, где есть идеальная гетеропара для
интерференционных зеркал – AlAs с сильно отличающимся от GaAs
коэффициентом преломления. При этом для телекоммуникационных
приложений нужны длины волн около 1,3 мкм и 1,5 мкм, а активную среду,
излучающую в этом диапазоне научились получать только на подложках InP.
Пороговая плотность тока характеризует, при той же площади прибора,
ток, который надо закачать в прибор, чтобы он перестал работать “как утюг”
и начал работать как эффективный светоизлучатель. До того, как начинается
лазерная генерация, 99% всей мощности идёт на тепло. А когда начинается
лазерная генерация, всё, что сверх пороговой плотности тока, начинает с
высокой эффективностью превращаться в свет. Если вы заинтересованы в
138
том, чтобы ваш прибор работал не как утюг, а как светоизлучатель, вы
бьётесь за снижение пороговой плотности тока до минимально возможного
значения.
Основные этапы большого пути: 62–63 год – появление лазеров на p-n–
переходе, они имели гигантские пороговые плотности токов и на их основе
можно было делать замечательные утюги. Конечно, как говорит Жорес
Иванович, повторяя Маяковского, "не важно на чём продемонстрировать, что
2×2=4, на окурках или паровозах", лазерная генерация есть лазерная
генерация, но в конкретной ситуации конкретного человека всё-таки важно,
паровоз или окурок. Так вот, по-настоящему, лазеры-паровозы, а не лазерыокурки, появились именно тогда, когда сперва была изобретена концепция
двойной гетероструктуры (приоритет патента март 63 года, авторы Алфёров
и Казаринов). Буквально несколькими неделями позже была послана статья
Гербета Крёмера, второго Нобелевского лауреата за полупроводниковые
гетероструктуры. Как я уже говорил, никто сперва в гетероструктуры не
верил, а Жорес Иванович и его группа очень активно работали в этом
направлении и в 66 году появляется первый лазер на ДГС, который работал
при низкой температуре. Это была гетероструктура GaAs/GaAsP, у которой
не совпадали параметры решётки, возникали трещины, и, поэтому, были
проблемы с тем, чтобы реализовать генерацию с низким пороговым током
при комнатной температуре. Однако, уже в 67 году была открыта система
GaAs/GaAlAs и в 68 году Алфёровым и другими уже был реализован первый
низкопороговый лазер 4кА/см2. Жорес Иванович в 70 году приезжает в
Америку, и там крупнейшие учёные в этой области, которые работали на
крупнейшей тогда электронной фирме мира, где был создан транзистор, на
фирме "Белл", были шокированы. Ключевой сотрудник лазерного проекта на
Белл Хайяши в своих воспоминаниях, опубликованных в IEEE Transaction
on Electron Devices в 1994 году написал, что он был поражён результатами
Алфёрова, не ожидал, что такой результат был получен, и они на Белл
удвоили свои усилия после визита Алфёрова. Меня в Америке многократно
пытались уверить, что, мол, на Белл всё было сделано раньше, что просто
публикация была похищена, и что-то в таком же роде, но я сразу ссылался на
эту статью Хайаши и необходимость доказывать, что мы не верблюды, по счастью, сразу отпадала.
В 1970-м году, опять-таки с приоритетом Алфёрова и его коллег был
продемонстрирован режим непрерывной лазерной генерации при комнатной
температуре и ещё большее снижение пороговой плотности тока до 1кА/см2.
Похожий результат был получен чуть позже на фирме Белл. Но дальше
прогресс в снижении порогового тока в лазере на двойной гетероструктуре
фактически остановился.
Следующий этап развития лазеров связан с кванторазмерными
эффектами в тонких плёнках. До сих пор мы предполагали, что область
ограничения носителей заряда в узкозонном слое достаточно толстая.
Если же потенциальный ящик тонкий, то тогда электрон в этом слоё
будет испытывать интерференцию, как свет на тонкой бензиновой плёнке, и
139
появятся, так называемые, подзоны размерного квантования. Но условие
заметного квантования - это уже толщины на уровне 10 нм, а не долей
микрона – нескольких микрон, как это в случае интерференции света. В 1970
году уже Жорес Иванович синтезирует первые гетероструктуры со
сверхтонкими слоями, где наблюдается уже квантовый эффект. Однако, к
сожалению, в Советском Союзе не развиваются технологии, которые
позволяют осуществлять рост сверхтонких слоёв со сверхвысокой
точностью. Гетероструктуры в ФТИ были получены жидкостной или
хлоридной газовой эпитаксией, а для сверхтонких слоёв нужны молекулярнопучковая эпитаксия или газофазная эпитаксия из металлоорганических
соединений. Жорес Иванович очень активно работал в это время над тем,
чтобы эти технологии появились в Советском Союзе, и они, вскоре,
появляются. Сейчас, конечно, производство остановлено, но то что, было,
сделано работает по всей стране. Эти установки уже есть в нашей
лаборатории, они активно используются. Кроме того, Жоресу Ивановичу
удалось убедить "ответственных работников" закупить несколько импортных
установок, на которых мы тоже очень активно работали и работаем. Тем не
менее, пока у нас это отставание ликвидировалось, на фирме "Белл" активно
начинают использовать сверхтонкие слои с квантово-размерными эффектами
в лазерах, получая эти слои с высокой степенью воспроизводимости.
Появляется первый лазер на сверхтонких квантово-размерных слоях. Сперва
у авторов получались очень высокие пороговые плотности тока, учёные и
инженеры, занимавшиеся лазерами на обычных гетероструктурах смеялись,
зачем городить огород, если "всем ясно", что идея не будет работать?
Я помню семинар, 1980-й год, я ещё студент, делается доклад по
результатам группы Ника Голоньяка по квантово-размерным
гетероструктурам. Комментарии в зале: в такой структуре не получить
большой мощности, электроны не будут залезать в такой узкий слой,
слишком велика будет роль состояний на гетерограницах и т.п. В конце
семинара Жорес Иванович делает заключение: "Через несколько лет
наша
лаборатория
будет
заниматься
квантово-размерными
структурами". Может вы не помните, а я это очень хорошо запомнил, в
зале возник гул, все стали переглядываться, шутливо комментировать:
"Ну, батька наш что-то совсем, того…". Интересно, что большинство
очень квалифицированных сотрудников лаборатории не принимало
новой идеи. Действительно, зачем что-то менять, всё же хорошо,
двойные гетероструктуры мы знаем, зачём лезть куда-то туда, где вот
такие высокие значения порогового тока?
Но прогресс не остановить. Постепенно, пороговые плотности в
квантоворазмерных лазерах снижаются. Сперва они выше, чем в ДГС, но
зато прогресс снижения очень быстрый, и в 1982-м году на "Бэлл"
демонстрируется первый лазер, который кардинально лучше, чем лазер на
ДГС, и за несколько лет промышленность переключается на гетеролазеры с
квантоворазмерной активной областью. К этому времени технологии МПЭ и
ГФЭМО у нас подтягиваются и в Физтехе и лаборатории Алфёрова нам
140
удаётся побить рекорд пороговой плотности тока гетеролазера, и получить
результаты на уровне около 45 А/см2. Снижение по сравнению с лазером на
ДГС где-то в 10–20 раз.
А вот дальше опять наблюдается некоторая стагнация. Фактически с 80–
89-го года большого прогресса нет. Что делать дальше? А дальше в ФизикоТехническом институте начинаются работы, надо сказать, может быть,
впервые в мире, работы по наногетероструктурам, получаемым на основе
эффектов самоорганизации. По получению упорядочению массивов
нанофасеток, наноостровков из субмонослойных покрытий, наноостровков и
упорядоченных массивов наноостровков, или квантовых точек (что это такое
я сейчас скажу), в системах с большим рассогласованием параметров
решётки. В результате, такие структуры были, наконец, созданы, причём
созданы без дефектов.
Мы оказались первые в лазерах на квантовых точках. В 1993-м году нам
удаётся получить лазеры на квантовых точках с умеренной плотностью
порогового тока в несколько килоампер на сантиметр квадратный. Конечно,
этот результат был хуже, чем рекорды для гетеролазера на квантовых ямах. И
вот нас опять спрашивают: "Ну зачем это всё надо. Всё равно ничего лучше,
чем лазер на квантовых ямах нет и быть не может. У вас не будет ни
мощности, ни быстродействия, ни стабильности к деградации". Тем не менее
мы все эти проблемы быстро решили и снизили пороговую плотность тока до
значений, соответствующих лучшим лазерам на сверхтонких слоях, а сейчас
рекордная пороговая плотность тока лазера на квантовых точках всего 13
А/см2, в 3–4 раза лучше, чем лучшие значения для лазера на квантовых ямах.
Квантовая точка – искусственный атом: температурная стабильность;
гигантское усиление!
Теперь вернёмся к сути того, что представляет собой нановключение
узкозонного материала в монокристаллическую матрицу, или квантовая
точка. Как я уже упоминал, электрон в атоме находится в потенциальной яме,
создаваемой положительно заряженным ядром. Так как электрон обладает
волновыми свойствами, возникают дискретные энергетический уровни,
которые в кристалле расщепляются в широкие зоны. По сути, у электрона в
кристалле очень мало остаётся памяти о дискретности атомного
электронного спектра. Электрон в зоне проводимости может свободно
двигаться по кристаллу как квазичастица, которой можно приписать
некоторую "эффективную массу", которая, обычно, меньше, чем у электрона
в вакууме. Ширина спектра линий поглощения делается порядка одного или
нескольких электрон-Вольт вместо долей мкэВ в случае одиночного атома. А
что же будет, если мы возьмём и ограничим очень маленький объём
кристалла идеальными стенками. Тогда интерференция электрона будет
происходить на стенках потенциального ящика и, как и в случае квантования
свободного электрона в потенциале ядра мы вернёмся к полностью
дискретному спектру, характерному для одиночного атома.
141
Рис. 11.8
Очень часто приходилось слушать рассуждения о том, что подобный
спектр может ожидаться только для идеального случая, что дискретный
атомоподобный спектр в нановключении или квантовой точке не реализуем
из-за неидеальности границ, наличия примесей, и т.д. Утверждалось, что все
потенциальные преимущества лазера на квантовых точках это только
спекуляции. На самом деле все базовые свойства квантовых точек (КТ) и
лазеров на их основе были экспериментально подтверждены. Нами,
например, было показано, что спектр КТ монохромный, никакого
континуума состояний, характерного, например, для сверхтонких слоёв не
существует, времена излучательной рекомбинации следуют теоретическипредсказанным для идеальных объектов и так далее. Сейчас
фундаментальные свойства квантовых точек активно исследуются по всему
миру.
Почему лазеры на квантовых точках появились только в 90-е
годы? Почему не было сделано раньше таких лазеров? Ведь идея
высказывалась давно. Когда Дингл и Хенри на Бэлл Телефон предложили в
1975 году использовать квантово-размерные эффекты в лазерах, их патент не
ограничивался только сверхтонкими слоями. И в 80-е годы и в Америке, и в
Японии, некоторые учёные понимали, что, в принципе, было бы здорово
сделать лазер на КТ. Однако получить на практике такой лазер не удавалось,
потому что традиционная идеология роста того времени подразумевала
послойное осаждение материала. В изготовлении наноструктур в плоскости
поверхности люди шли тем же самым путём, каким они шли в традиционной
идеологии получения транзисторных структур - используя литографию.
Вообще, и в росте и в процессировании доминировал подход: "Человек
делает структуру". Человек выращивает структуру, делает слой, закрывает
другим слоем, как вот он послойно делает напыление. Это как процесс
покраски корпуса МЕРСЕДЕС, где используется до 20 слоёв краски. Один
слой - один цвет, другой слой-другой, у одного одна функция, у другого
другая. Слой за слоем краска наносится. А как сделать квантовую точку? Как
142
сделать нанообъект, который ограничен со всех сторон? Ну, понятно, нужно
дальше взять и процарапать что-нибудь на этой поверхности. Если тоненько
процарапаете, то у вас получится нанообъект, если вас, как говорится,
вовремя не остановят. По сему случаю вот таким путём люди шли и травили
ионными пучками многослойные структуры, пытаясь получить малые
размеры в плоскости слоя и создать квантовую точку, но, потратили
миллиарды долларов на это дело, но для лазеров этот подход оказался
неприменим. В принципе, на этом подходе отрабатывалась предельная
литография, исследователи набирали опыт. Это очень полезно, но, тем не
менее, никаких практических приборов на квантовых точках при таком
подходе получить не удалось.
Прогресс в области КТ в настоящее время и связан как раз с тем, что
такая концепция сменилась на новую. Стало ясно, что не нужно пытаться
бороться с природой, а надо эту природу изучать, радоваться ей и просто
следовать тому, что она сама хочет сделать. А сама она как раз очень хочет
сделать наноструктуры, правда, размеры, плотности, относительное
расположение нанообъектов она хочет определять сама. Есть, например,
такое
явление
на
поверхности
кристаллов
как
спонтанное
нанофасетирование. Вы берёте плоскую поверхность кристалла с
определённой кристаллографической ориентацией, отжигаете её, и она ни с
того ни с сего вдруг спонтанно трансформируется вот в такую гармошку с
наноофасетками с характерным периодом и высотой и высокой степенью
упорядоченности. Или вы берёте твёрдый раствор и отжигаете его, или
выращиваете в определённых условиях. А когда вы сверху смотрите в
электронный микроскоп, то видите, что образовалась упорядоченная картина
доменов разного состава, тоже с характерными наноразмерами. Или
субмонослой одного материала осаждаете на поверхности другого, и у вас
также образуются островки, очень упорядоченные по форме и размеру. И,
наконец, если вы осаждаете на поверхности кристалла решётки материал с
другим параметром решётки, то у вас тоже при определённых условиях на
поверхности образуются нанохолмики. Эти холмики и используются в
настоящее время наиболее активно в лазерах на КТ.
В принципе, эффект спонтанного образования наноостровков был
известен давно, но исследователи, в большинстве, не верили, что такие
структуры могут быть получены без образования дефектов и использованы в
приборах. Возвращаясь к нашему Мерседесу. Люди смотрели на этот процесс
так: вот вы красите Мерседес краской и вдруг эта краска начинает
выпучиваться, а местами и отшелушиваться. Это плохо, конечно.
Требования, предъявляемые к квантовым точкам, таковы: они должны
быть бездефектными структурами с характерными размерами порядка 10 нм
и малым разбросом по размерам, с высокой плотностью размещения на
матрице (100 и более на 1 мкм2).
Таким образом, важен не просто эффект спонтанного образования
островков, а эффект образования наноупорядоченных островков, не
содержащих дефектов.
143
Frank van der Merwe
Volmer-Weber
Stranski-Krastanow
Рис. 11.9
Наше достижение, что мы пытались понять процессы образования
наноструктур научно, проводили исследования проясняющие физику этого
явления, проводили огромное количество ростовых экспериментов,
нагревали или охлаждали наноостровки перед заращиванием и так далее. В
результате нам удалось выполнить те самые требования к этим
наноструктурам, получить их бездефектными, обеспечить очень маленькие
характерные размеры, которые требуются для приборных применений,
реализовать высокую плотность, и всё это в результате комплекса
исследований. Выращивание, исследование оптических свойств, структурные
исследования, пост-ростовая технология взаимно дополняют друг друга, и
позволяют создавать наноструктуры требуемого качества.
Возможные механизмы роста при гетероэпитаксии:
1) в случае большой поверхностной энергии подложки – формирование
“смачивающего слоя“;
2) если велика, напротив поверхностная энергия осаждаемого материала
– наиболее вероятен двумерный рост;
3) в случае большой упругой энергии пленки имеет место переход к
образованию трехмерных островков.
Существуют следующие возможные механизмы эпитаксии – слоевой рост,
который используется для выращивания большинства традиционных
слоистых гетероструктур (механизм Франка Ван Ден Мерве). Такой рост
осуществляется в том случае, кода сумма поверхностной энергии
осаждаемой плёнки и энергии гетерограницы меньше, чем поверхностная
энергия подложки. Говорят, что происходит смачивание поверхности слоем
осаждаемого материала. Есть рост по Фольмеру-Веберу, когда осаждаемый
материал собирается трёхмерные кристаллиты на поверхности, то есть не
смачивает поверхность подложки. Это так, как если вы красите Мерседес, а
поверхность перед этим не обезжирили, и поэтому у вас краска пошла
собираться в какие-то капли и шарики. Плохо, да? Ну, люди так и считали,
что плохо. Наконец, есть рост по механизму Странского-Крастанова.
Кстати, Фольмер был профессором Технического Университета Берлина,
тогда называвшегося Технической Высшей Школой, а болгарский учёный
Иван Странский, стал его преемником. В случае роста по механизму
Странского-Крастанова у вас изначально образуется однородная тонкая
плёнка из осаждаемого материала, и уже на ней формируются трёхмерные
островки. То есть осаждаемый материал изначально смачивает поверхность.
144
Почему же тогда образование островков может происходить и в этом случае? Дело
здесь в различных параметрах кристаллической решётки. Представьте, у вас есть
два матраса. У одного из них ячейка большая, а у другого – маленькая. Вот вы
берёте матрас с большим размером ячейки и пытаетесь натянуть его и привязать
ниточками к тому матрасу, у которого размер ячейки маленький. Если пружины
сильные, а нитки слабые, то у вас ячейки будут рваться и всё время верхний матрац
будет стремиться отсоединиться, оторваться. Рост по механизму Фольмера–Вебера,
мы бы сказали. Если нитки сильные, мы бы сказали, смачивание, – то ячейки будут
держаться, но система может начать выгибаться, образовывать пучности. Вот это
вот происходит и с кристаллом, когда на кристаллическую решётку подложки вы
пытаетесь натянуть отличающуюся решётку осаждаемого соединения. Тонкий
слой, может, ещё и сформируется, а дальше материал будет собираться в островки,
которые будут выгибаться в вакуум. Если островки-пучности разного размера,
содержат дефекты, то такая система неприменима для совершенных
полупроводниковых структур.
Формирование упорядоченных массивов наноостровков
Рис. 11.10. Получение массивов КТ упорядоченных по форме, размеру и
относительному положению
По счастью в природе есть такие эффекты, которые позволяют реализовать
такое выпучивание "матраса", которое является строго упорядоченным и имеет
наноразмеры. Вот GaAs с меньшим размером ячейки матраса, вот InAs - с большим
размером ячейки матраса. Сперва InAs садится на арсенид галлия, вам это удаётся,
так как нитки держат плоскость из атомов InAs, но когда вы добавляете всё больше
и больше слоёв InAs, полная упругая энергия растёт, растёт, и нити начинают
местами рваться. Атомы частично освобождаются и при конечной температуре
происходит перераспределение материала и образуются трёхмерные островки.
Когда островок образовался, то, естественно, решётка InAs может
распрямиться, релаксировать и вы на этом выигрываете энергию. Дальше вы эти
островки опять закрываете арсенидом галлия или другим широкозонным
материалом, и вот появились у вас те самые изюминки, инидий-мышьяка в
арсенид-галлиевой матрице, те самые квантовые точки. И теперь все ваши приборы
уже не на слоях, а на таких изюминках, на плотных массивах таких изюминок.
Можно получить как раз те размеры и те плотности, что и нужны для практических
применений. Это если всё правильно подобрано: температуры, скорости
осаждения, отношения потоков атомов и т.д. Благодаря этим результатам нами и
были получены первые лазеры на квантовых точках.
145
Лекция 12. Атома водорода в квантовой механике.
Периодическая таблица атомов Д.И.Менделева
1. Модель атома Томпсона. Спектр атома водорода. Опыты по
рассеянию α-частиц. Планетарная модель атома Резерфорда. Постулаты
Бора и его полуклассическая теория. Опыты Франка и Герца.
2. Атом водорода в квантовой механике. Квантовые числа как результат
решения уравнения Э.Шредингера и уравнения П.Дирака. Правила
отбора. Принцип
Паули. Периодическая
система
элементов
Д.И.Менделеева.
12.1. Модель атома Томпсона. Спектр атома водорода. Опыты по
рассеянию α-частиц. Планетарная модель атома Резерфорда.
Постулаты Бора и его полуклассическая теория. Опыты Франка и
Герца
К началу XX века было окончательно установлено, что атом – не неделимая
частица вещества. Это сложная конструкция, в состав которой входят и
заряженные частицы.
В 1900 году, изучая природу катодных лучей, английский ученый
Джозеф Джон Томпсон (известный в своей среде как “Джи-Джи”) измерил
удельный заряд электрона. Из этих опытов следовало, что электроны
обладают массой, которая оказывалась много меньшей массы самого легкого
атома – атома водорода. Было ясно, что электроны являются составными
частями всех атомов. Но атомы, как известно, электронейтральны. Это
означало, что в атоме наряду с отрицательными электронами присутствуют и
положительно заряженные частицы.
Первая электромагнитная неквантовая модель атома была создана
Дж.Дж.Томпсоном. В этой работе он руководствовался выводом Кельвина о
том, что притяжение атомом внешнего электрона обратно пропорционально
квадрату расстояния между их центрами, а притяжение электрона,
находящегося внутри самого атома, пропорционально расстоянию между их
центрами. Такая закономерность характерна для гравитационной силы
притяжения тела Землей в предположении, что масса Земли равномерно
распределена по объему земного шара. Эта аналогия наводила на мысль о
том, что положительный заряд атома равномерно распределен по всему его
объему, а электроны атома плавают в этом положительном облаке. В таком
случае несложноr вычислить
силу, действующую на электрон, например, в
r
атоме водорода F = eE
Для отыскания напряженности поля Е в той точке атома, где находится
электрон, воспользуемся теоремой Остроградского–Гаусса (2.39):
r r 1
∫ Eds =
S
здесь
ε 0 V∫
ρdV ,
ρ = e / VR – объемная плотность положительного заряда атома.
146
e
er 3
E ⋅ 4πr = ⋅
⋅V =
ε 0 VR R ε 0 R 3
2
1
F = (− e )E = −
⇒
e2
4πε 0 R
3
E=
e
4πε 0 R
3
⋅r,
⋅ r = −kr
Таким образом, сила, действующая на электрон в подобном атоме,
является квазиупругой и непременно приведет к колебаниям электрона
относительно центра атома:
k
r = 0,
m
r = A cos ω 0 t .
m&r& = − kr или &r& +
Частота колебаний электрона:
k e
1
=
.
r R 4πε 0 Rm
ω0 =
Это выражение позволяет вычислить радиус атома R считая, что атом
излучает электромагнитную волну «реальной» частоты ω0 ≈ 1015 с-1. Такой
расчет дает значение радиуса R≈10-10 м. Этот результат (1903 г.) практически
совпал с известным к тому времени газокинетическим размером атома. Но
это совпадение стало единственным достижением данной модели.
Несостоятельность модели Томпсона проявилась в том, что она не могла
объяснить известные к тому времени свойства атомов. Например –
закономерности атомных спектров. Невзаимодействующие атомы
излучают электромагнитные волны определенных, характерных для данного
вещества частот. Спектр такого излучения состоит из отдельных линий,
которые принято объединять в «серии».
В 1885 году швейцарский физик И.Бальмер показал, что, несмотря на
кажущийся беспорядок, в распределении этих спектральных линий
существуют определенные закономерности. Он нашел, что частоты линий
видимой части спектра атомарного водорода могут быть связаны простой
формулой
 1
ω = R
2
2
−
1 
,
2
n 
(n = 3, 4, 5,K) .
Открытие Бальмера усилило интерес к исследованию спектра
атомарного водорода. В 1906 г. Т.Лайман обнаружил еще одну серию в
ультрафиолетовой области. Позже Ф.Пашен, Ф.Брэкет, А.Пфунд и другие
нашли серии в инфракрасном диапазоне. Так возникли
серия Лаймана:
1
ω = R
 12
−
1 
,
n2 
147
(n = 2, 3, 4,K)
1 
, (n = 4, 5, 6, K)
2
2
3
n 
1 
 1
−
серия Брэккета: ω = R
, (n = 5, 6, 7, K)
2
2
4
n 
серия Пашена:
 1
ω = R
−
Шведский физик Й.Ридберг записал их все одним выражением:
1 
 1
−
,
2
2
n 
m
ω = R
(12.1)
где
m=1, 2, 3,...; n=(m + 1), (m + 2), …
Поскольку основоположником серий был И.Бальмер, формула (12.1)
получила название обобщенной формулой Бальмера. Коэффициент же
пропорциональности здесь R=2.07·1016 с-1 был назван постоянной Ридберга.
Числа T=R/n2 называются спектральными термами атома водорода.
Частота любой линии атома водорода может быть представлена в виде
разности соответствующих термов:
ω = T1(m) – T2(n)
Из всех этих эмпирических формул Ритц вывел комбинационный
принцип, согласно которому для каждого элемента можно найти
совокупность таких чисел – спектральных термов, что частота любой
спектральной линии данного элемента равна разности спектральных термов
этого элемента.
Вплоть до 1913 года было неясно, каким образом можно было бы
теоретически истолковать эти серии, а тем более – комбинационный принцип
Ритца. Классическая электромагнитная теория объясняла спектральные
линии, но их частоты не имели ничего общего с тем, что давал опыт.
Эмпирические закономерности спектра атома водорода впервые удалось
объяснить после создания планетарной модели атома Бора–Резерфорда.
Планетарная модель атома родилась в ходе исследования рассеяния α-частиц.
В опыте (1911г.) Эрнеста Резерфорда (1871–1937 гг. жизни, Англия)
пучок α-частиц ( 42 Не – 2 протона и 2 нейтрона) с энергией 5 МэВ
испускались из радиоактивного препарата. Пролетев сквозь щель, попадали
на экран из сернистого цинка. Регистрировались α -частицы, рассеянные
фольгой, по вспышкам света, возникающим при ударе их об экран, покрытый
сернистым цинком (т.е. по сцинтилляции). На экране возникало четкое
изображение щели в виде узкой полоски. Затем между щелью и экраном
помещалась тонкая металлическая пластина, вернее, тонкая золотая фольга.
При этом изображение щели на экране размывалось, что и указывало на
рассеяние α-частиц веществом пластинки. Именно в этом эксперименте был
установлен поразительный факт: очень небольшая часть α-частиц (примерно
1 из 10000!, ≈ 0,01 %) рассеивалась на значительный угол, отбрасывалась
практически назад – к источнику, т.е. рассеивается на углы, большие 90 o .
Т.к. золото достаточно легко расплющить и получить толщину ~ сотен
148
атомных, то подобное рассеянье возможно лишь при столкновении с
объектами гораздо большей массы.
Из воспоминаний Э.Резерфорда: « … Это было самым невероятным
событием в моей жизни. Оно было столь же невероятным, как если бы
15-дюймовый снаряд, выпущенный в кусок папиросной бумаги,
отскочил бы и ударил в стреляющего…».
Оценка размера ядра: т.к. кинетическая энергия α -частиц 5
МэВ=5⋅1,6⋅10-19 Дж=8⋅10-13 Дж, то перед рассеянием α -частиц ядром они,
находясь на расстоянии r0, взаимодействуют между собой с потенциальной
энергией отталкивания (рис. 12.1)
r0
Рис. 12.1
2e ⋅
Ze
4πε 0 r0
−14
= 8 ⋅ 10 −13 Дж Z Au = 79 ⇒ r0 ≈ 5 ⋅10 м; в то же время размер
o
атома был оценен порядка 10 м или 1 А (ангстрем).
Итак, из опыта Резерфорда выяснилось, что весь положительный заряд
и почти вся масса атома сосредоточены в ядре, находящемся в центре; вокруг
ядра движутся электроны, занимая огромную по сравнению с ядром область.
При этом сразу же возник вопрос: почему атомы стабильны, т.е. почему
электроны не падают на ядро (из-за кулоновской силы)? Если же электрон
ускоренно движется, вращаясь вокруг ядра, то он должен терять энергию на
излучение во всех частотах, падая опять же на ядро. Резерфорд
постулировал движение электронов по круговым орбитам, так как
статическая модель атома с неподвижными зарядами оказывалась
неустойчивой системой. Реально наблюдается иная картина (вспомним о
линейном спектре атома водорода). Выход в этой, казалось бы, безвыходной
ситуации удалось найти в 1913 году датскому физику Нильсу Бору.
Для того чтобы обеспечить устойчивость планетарного атома и
объяснить особенности атомных спектров, Бору пришлось дополнить
классическую электродинамику элементами квантовой теории, которая
априори исключает всякую возможность непрерывного излучения. Свои
основные гипотезы Бор сформулировал в виде постулатов (1913 г.):
1. Из бесконечного множества электронных орбит, допускаемых
классической механикой, осуществляются только те из них, для
которых момент импульса электрона относительно центра его орбиты
равен целому кратному постоянной Планка
me vr = nh .
(12.2)
-10
149
Число n называется главным квантовым числом. Указанные орбиты
соответствуют так называемым стационарным состояниям атома,
находясь в которых атом не излучает электромагнитных волн.
2. Испускание (или поглощение) энергии происходит не непрерывно,
как это принимается в обычной электродинамике, а только при переходе
системы из одного «стационарного» состояния в другое. Такое излучение
(или поглощение) при переходе системы из одного стационарного
состояния в другое, монохроматично. Соотношение между его частотой
ω и общим количеством излученной энергии ∆Е дается равенством
∆E = En − Em = hω .
Здесь Еm и Еn – энергии атома в двух стационарных состояниях.
Динамическое равновесие системы в стационарном состоянии
определяется обычными законами механики, тогда как для перехода системы
между различными стационарными состояниями эти законы не
действительны. Поэтому разработанные Бором представления в истории
физики получили название полуклассической теории.
Модель простейшего атома – атома водорода состоит из двух точечных
зарядов – положительно заряженного ядра (+е) и одного электрона (–е),
обращающегося вокруг него с постоянной частотой. Пусть электрон
движется со скоростью v по одной из доступных ему траекторий (rn).
Запишем классическое уравнение движения электрона (II закон Ньютона) и
квантовое условие Бора:
2
 2
ke
v
 2 = me ,
 rn
rn
 m vr = nh.
 e n
(12.3)
Решая совместно, можно получить условие квантования орбит – электрону в
атоме водорода доступны круговые орбиты следующих радиусов:
rn =
h2
2
ke me
(n = 1, 2, 3,K).
n2
(12.4)
Радиус первой орбиты (n=1) называется боровским радиусом атома r0. Он
равен
rn =
h2
2
ke me
≈ 0.5 ⋅ 10 −10 м,
что неплохо согласуется с газокинетическим размером атома.
Вычислим внутреннюю энергию атома, которая складывается из
кинетической энергии электрона и потенциальной энергии его
взаимодействия с ядром. Запишем при этом и уравнение движения
электрона:
150

me v 2 ke 2
−
,
 E =
2
r

2
2
 me v = ke .

r
r2
Отсюда следует, что энергия атома
ke 2 ke 2
ke 2
−
=−
E=
.
2r
r
r
Воспользовавшись
доступных атому:
результатом
(12.4),
получим
(12.5)
спектр
k 2e 4 me 1
⋅ .
E=−
2h 2 n 2
энергий,
(12.6)
При переходе электрона с n-й орбиты на m-ю, атом излучает фотон. Его
энергия
1 
k 2e 4 me  1
−
hω = En − Em = −

.
2h 2  n 2 m 2 
(12.7)
k 2e 4 me  1
1 
1 
 1
ω=
R
=
−
−
.



2h 3  m 2 n 2 
 m2 n2 
(12.8)
Частота этого излучения определяет одну из линий в спектре атома водорода.
Сравнивая этот результат с обобщенной формулой Бальмера, приходим к
выводу, что R =
k 2 e 4 me
2h 3
≈ 1016 c −1 – постоянная Ридберга. Поразительно
численное совпадение этой константы, рассчитанное по Бору, с тем значением,
которое было получено в результате анализа спектра излучения атома
водорода!
Таким образом, уравнение (12.8) дает все частоты, присутствующие в
излучении атома водорода. Это был грандиозный успех планетарной модели
атома Резерфорда и боровской теории этой модели. Стало ясно, как возникают
спектральные линии и серии в атомарном излучении. На рисунке 12.2
представлен масштабный чертеж пяти низших боровских орбит водорода.
При движении электрона по одной из этих доступных ему орбит, атом
находится в стационарном состоянии и не излучает и не поглощает энергию.
При переходе электрона, например, со второй орбиты (N = 2) на первую
(N = 1) излучается фотон соответствующей частоты. В спектре излучения
этот переход отмечен одной из линий в серии Лаймана.
Эта серия включает частоты фотонов, излучаемых при переходе с любой
орбиты на первую.
1 
1
−

 12 n 2 
ω = R
151
Все переходы с орбит n > 2 на вторую рождают различные линии серии
Бальмера:
1 
 1
−
 , и так далее.
 22 n2 
ω = R
ри
е
С
Протон
на
а
м
ай
Л
я
Се
аль
р ия Б
мера
Серия Пашена
n=1
n=2
n=3
n=4
0
n=5
5
10 A
Рис. 12.2
Боровская теория наглядно объясняет и комбинационный принцип
Ритца. Обратный переход электрона с одной из нижних орбит на более
высокую возможен лишь при поглощении атомом энергии извне. Объяснить
же особенности спектра уже следующего элемента – гелия полуклассическая
теория Бора не могла – не была еще разработана квантовая механика.
Во время последнего посещения Нильсом Бором Москвы (1961 г.)
выдающийся российский физик П.Л.Капица сказал: “Атом Бора – это не атом
бора, а атом водорода” (игра слов: бор – пятый элемент таблицы
Д.И.Меделеева).
Прямым
экспериментальным
подтверждением
квантованности
электронных орбит в атоме и его энергии явился эксперимент Франка и
Герца (рис. 12.3) по облучению электронами паров ртути при давлении р ~ 1
мм.рт.ст. (1913 г.).
U
0,5 В
К
•
••
Hg
С
А
Рис. 12.3
Напряжение Ukc между подогреваемым катодом К и сеткой С ускоряет
электроны, а напряжение 0,5 В между сеткой С и анодом А – тормозит.
152
Согласно классической физике с монотонным ростом Ukc должен
монотонно расти анодный ток IA. Реально же наблюдается вольт-амперная
характеристика (ВАХ), приведенная на рис. 12.4. На участке ОМ ток
монотонно возрастает, энергия электронов растёт, они сталкиваются с
атомами ртути упруго (практически не теряя энергии). На участке МN
электроны сталкиваются с атомами ртути неупруго, теряют энергию и не
могут преодолеть запирающего напряжения в 0,5 В. Последующие
максимумы Mi вызваны многократными неупругими столкновениями
электронов с атомами ртути.
M3
M2
M1
N
Рис. 12.4
U
Так как при столкновениях электроны взаимодействуют в основном с
электронной оболочкой атомов ртути, то, очевидно, что в атомах электроны
поглощают энергию только строго определёнными порциями ∆E1 = E2 – E1,
∆E2 = E3 – E1 и так далее.. При этом, переходя из возбуждённого состояния с
большей энергией в состояние с меньшей энергией, атомы ртути должны
излучать с частотой ν = ∆E1 / h ≈ 235 нм. Линия была обнаружена, что
явилось доказательством верности полуклассической теории Н.Бора.
Кроме двух вышеупомянутых опытов, поставивших много вопросов,
следует упомянуть о трудностях в отношении дискретного (избирательного)
излучения и поглощения света веществом (линейчатые спектры атомов и
молекул), о расхождении экспериментальной и теоретической зависимостей
теплоёмкости от температуры (т.н. «катастрофе с теплоёмкостью»),
расхождении теоретической и экспериментальной зависимостей от длины
волны λ (частоты ν ) и температуры спектральной плотности
энергетической светимости (т. н. «ультрафиолетовой катастрофе»), и т.д.
153
12.2. Атом водорода в квантовой механике. Квантовые числа как
результат решения уравнения Э.Шредингера и уравнения П.Дирака.
Правила отбора. Принцип Паули. Периодическая система элементов
Д.И.Менделеева
Так как длина волны де Бройля движущегося в атоме электрона
сравнима с размерами атома, то пренебрегать волновыми свойствами
электрона и описывать его движение классическими законами нельзя.
Рассмотрим движение электрона в электрическом поле неподвижного ядра с
зарядом + Z e ( Z = 1 (для водорода), 2, 3,…).
Потенциальная энергия электрона в электрическом поле ядра
Ze 2
U (r ) = −
.
4πε 0 r
Необходимо найти регулярные решения стационарного УШ
h2
ˆ
H Ψ = (−
∆ + Uˆ )Ψ = E Ψ .
2m
(12.9)
Так как при решении используется в силу симметрии ССК, то УШ примет
вид
h2
1 ˆ2
Ze 2
−
∆r Ψ +
L
Ψ
−
Ψ = EΨ .
(12.10)
2m
2mr 2
4πε 0 r
где в ССК ∆ = ∆ r +
1
r
1 ∂ 2 ∂
(r
) –
2 ∂r
∂
r
r
1 ∂
∂
1
∂2
=
(sin Θ ) + 2
–
sin Θ ∂Θ
∂Θ sin Θ ∂ϕ 2
∆
оператор Лапласа, а ∆ r =
2 Θ ,ϕ
радиальная часть оператора, ∆ Θ,ϕ
угловая часть оператора; в ССК оператор квадрата момента импульса
)
L2 = −h 2 ∆ Θ,ϕ .
С учётом замен после решения УШ (12.10) для атома водорода можно
получить условие квантования полной энергии электрона в атоме:
En = −
Z 2 me 4
1
32π 2ε 02h 2 n 2
, n = 1, 2,... ,
(12.11)
что совпадает с полученным в теории Н.Бора (см. формулу (12.6)).
Таблица 12.1
Состояние
n
m
l
Ψn lm
1
0
0
2
0
0
Z
( )3 / 2 exp(− ρ )
π a
1
ρ
Z
( ) 3 / 2 (2 − ρ ) exp(− )
2
4 2π a
1
154
1s
2s
2p
1
ρ
Z
( ) 3 / 2 ρ exp(− ) cos Θ
2
4 2π a
2p
2
1
+1
ρ
1 Z 3/ 2
( ) ρ exp(− ) sin Θ exp(iϕ )
2
8 π a
2p
2
1
-1
ρ
1 Z 3/ 2
( ) ρ exp(− ) sin Θ exp(−iϕ )
2
8 π a
ВФ Ψnlm ( ρ , Θ, ϕ ) = xn, l ( ρ )Yl , m (Θ, ϕ ) зависит от трёх квантовых
2
1
0
чисел: n, l, m.
Рассмотрим ряд значений квантовых чисел n, l, m и вид
соответствующих ВФ (табл. 12.1).
Главное квантовое число n=1, 2, … (см. формулу (12.11)) определяет
не только полную энергию электрона в атоме (являются собственными
значениями гамильтониана, в связанном состоянии энергетический спектр
атома водорода дискретен, лежит в области отрицательных значений и имеет
точку сгущения Е = 0 ), но и размеры электронного облака. Для того, чтобы
увеличить размеры электронного облака (вспомним смысл квадрата модуля
2
Ψ -функции Ψ ), надо удалить электрон на большее расстояние от ядра.
Для преодоления кулоновского притяжения при этом нужны затраты
энергии. Так как электроны с одинаковым значением главного квантового
числа n образуют приблизительно одинакового размера электронные облака,
то есть смысл говорить об электронных облаках или слоях с определённым
значением n. Принято обозначать уровни с n следующим образом (табл.
12.2):
Таблица 12.2
(n=)
1
2
3
4
5
6
7
уровни
K
L
M
N
O
P
Q
Орбитальное, побочное или азимутальное квантовое число l l может
иметь значения l=0, 1, 2, …, (n–1). Говорят, что уровень энергии En будет
вырожден с кратностью n2.
Стационарные ВФ Ψnlm ( ρ , Θ, ϕ ) , описывающие различные квантовые
состояния атома, являются собственными функциями не только оператора
2
полной энергии Ĥ , но и оператора квадрата момента импульса L̂ (6.13), то
есть
Lˆ2 Ψ nlm = l (l + 1)h 2 Ψ nlm .
В любом квантовом состоянии модуль орбитального момента импульса
движущегося в атоме электрона однозначно определяется орбитальным
квантовым числом l:
L = h l (l + 1) ,
(12.12)
что не совпадает с постулируемым в теории Н.Бора равенством (12.2), так
как, согласно (12.1), невозможно состояние с L=0. Квантовое число l
155
определяет форму электронного облака. В одноэлектронных атомах значение
энергии электрона определяется главным квантовым числом n, в
многоэлектронных оно ещё зависит и от l, поэтому состояния электрона с
различными значениями l принято называть энергетическими подуровнями
(табл. 12.3)
Таблица 12.3
0
s
l
1
p
2
d
3
f
4
g
Состояние электрона записывается, например, в виде 1s1 или 2p5 и так
далее. Форма электронного облака определяется граничной поверхностью,
2
заключающей в себе с наибольшей вероятностью (а, следовательно, и Ψ )
приблизительно 90 % заряда и массы электрона.
Анализ свойств ВФ показывает, что все s – состояния (состояния с l=0 и
m=0) являются сферически симметричными состояниями, ВФ в этих
состояниях не зависит от угловых переменных Θ и ϕ .
|Ψ|2
z
1s
(m=0)
Ψ
1s
r
|Ψ|2
r
Вид поверхности - сфера
|Ψ|2
2s
(m=0)
r
156
3s
(m=0)
r
Ψ
2p
(m=0)
|Ψ|2
r
z
2p
(m=0)
r
2p (m=0)
2
|Ψ|
z
Ψ
3p r
(m=±1)
3p
(m=±1) r
3d (m=±1)
Рис. 12.5
Образ атома в квантовой теории можно представить в виде облака
2
плотности вероятности Ψ (рис. 12.5).
Гантелеобразная форма 3d-орбитами может быть различным образом
ориентирована в пространстве, данная ориентация определяется магнитным
квантовым числом. Всего 2l+1 значений m=0, ± 1, ± 2, … квантового числа
m. Проекция момента импульса электрона на выдаваемое в пространстве
направление z может иметь только определённые значения
Lz = mh .
(12.13)
Направление z в пространстве обычно выделяется внешним магнитным
или электрическим полем (рис. 12.6). Формулу (12.13) называют формулой
пространственного квантования, а (12.12) – формулой квантования
момента импульса. Сравнивая формулы (12.12) и (12.13), можно заметить,
что максимальное значение проекции момента импульса hl не равно по
модулю h l (l + 1) , а меньше его.
Это связано с тем, что проекции на две
различные координатные оси не могут быть
определены одновременно точно. Поэтому
невозможно точное совпадение направления
вектора орбитального момента импульса с
направлением оси z .
Любая система в природе стремится прийти в
состояние с минимальной энергией. Электроны же
в действительности образуют при переходе из
состояния в состояние иерархические структуры с
определённой закономерностью – периодическим
законом. Он основывается на двух принципах:
Рис. 12.6
157
1) принцип Паули (или исключения): каждый электрон в атоме
характеризуется своим набором квантовых чисел;
2) принцип минимума энергии: при заданном общем числе
электронов в атоме осуществляется состояние с минимумом потенциальной
энергии (условие устойчивости системы).
Заполнение оболочек по идеальной и реальной схемам представлено в
табл. 12.4.
Таблица 12.4
1
2
3
4
5
l
0
1
2
3
4
n
s
2
2
2
2
2
p
–
6
6
6
6
d
–
–
10
10
10
f
–
–
–
14
14
g
–
–
–
–
18
K
L
M
N
O
идеал.
схема
реал.
схема
2
8
18
32
50
2
8
18
18
18
Реальные отличия обусловлены тем, что поле не является чисто
кулоновским и между электронами существуют силы взаимодействия.
Последовательность заполнения атомных электронных оболочек
была исследована (в советское время) В.М.Клечковским и происходит в
соответствии с двумя сформулированными им правилами:
1. При увеличении заряда ядра атома последовательное заполнение
электронных оболочек происходит от орбиталей с меньшим значением
суммы главного квантового числа n и орбитального квантового числа l к
орбиталям с большим значением (n+l), например: 3d (n=3, l=2, n+l=5) и 4s
(n=4, l=0, n+l=4), то есть 4s состояние заполняется раньше, чем 3d.
2. При одинаковых суммах (n+l) обитали заполняются в направлении
роста главного квантового числа n, например, сначала 3d (n+l=5, n=3, l=2),
затем 4р (n+l=5, n=4, l=1), потом 5s (n+l=5, n=5, l=0).
Появление в шредингеровской теории атома водорода, в отличие от
теории Бора, квантования момента импульса L и его проекции Lz объясняет
некоторые особенности спектров излучения и поглощения атома водорода,
которые не могли быть объяснены теорией Бора. Для пояснения этих
особенностей изобразим схему уровней атома водорода, на которой учтено
вырождение уровней по азимутальному квантовому числу l, (см. рис. 12.7).
158
0
-0,37
-0,54 -0,84
-1,51
-3,4
s
l=0
5
4
3
2
p
1
d
2
f
3
g
4
h
5
Серия Бальмера m=3
Серия Пашена m=2 (ns 2p, nd 2p, n=3, 4, ...)
метастабильное
состояние 2s
hω=En- E1
Серия Лаймана m=1 (np
-13,5 1
1s, n=2, 3, ...)
E1
основное
состояние1s
Рис. 12.7
На приведенной схеме по вертикали отложена полная энергия En
электрона в атоме водорода, выраженная в электрон-вольтах (эВ) и значения
главного квантового числа n. По горизонтали отложены дискретные значения
азимутального квантового числа l вместе с их спектроскопическими
обозначениями. Линии, соединяющие энергетические уровни, обозначают
разрешенные правилом отбора переходы электрона с одного
энергетического уровня на другой. При этом или испускаются или
поглощаются фотоны соответствующих энергий ε=En–Em. Правило отбора
связано с тем, что фотон обладает собственным моментом импульса. При
излучении света фотон уносит момент импульса из атома, а при поглощении
– приносит. Поэтому, вследствие закона сохранения момента импульса,
момент импульса атома в процессах излучения и поглощения фотонов
изменяется. Оказывается, с наибольшей интенсивностью идут такие
переходы, в которых выполняется следующее правило отбора:
∆l = ±1.
(12.14)
Это правило отбора справедливо для так называемых дипольных переходов.
Оно запрещает, например, дипольный переход электрона из состояния 2s в
состояние 1s, разрешенный законом сохранения энергии. Поэтому электрон
может сравнительно долго находиться в состоянии 1s, если он туда попадает.
Такое состояние называется метастабильным.
Так как стационарные значения энергии атома водорода в теории Бора и
в теории Шредингера совпадают, то в первом приближении из теории
Шредингера следуют такие же спектры излучения и поглощения, как и в
теории Бора. Однако теория атома водорода Шредингера позволяет учесть
влияние на энергетические уровни взаимодействия орбитального и
спинового моментов импульса электрона (тонкая структура спектра).
Кроме того теория Шредингера (или более общая релятивистская теория
159
П.Дирака) позволяет учесть влияние на спектры магнитного поля (эффект
Зеемана) и электрического поля (эффект Штарка). Расщепление
спектральных линий в магнитном поле получило название эффекта Зеемана,
в электрическом – Штарка, а в электромагнитном – Зеемана–Штарка. Оно
происходит из-за наличия особой квантовой характеристики электронов –
спина. Как уже упоминалось выше, спектральные линии атома водорода
обнаруживают тонкую структуру. Тонкая структура присуща спектрам всех
атомов. Для объяснения причин возникновения тонкой структуры
американские физики С.Гаудсмит и Дж.Уленбек выдвинули в 1925 году
гипотезу о том, что электрон обладает собственным моментом импульса –
спином Ls, не связанным с движением электрона в пространстве (англ. spin –
кружение).
Только в научно-популярной литературе спин объясняется как момент
импульса электрона при вращении электрона вокруг своей оси. На самом
деле классического аналога спина нет, спин – чисто квантовая неотъемлемая
характеристика частицы, такая же, как заряд, масса и т.д.
Модуль собственного момента импульса определяется спиновым
квантовым числом s:
Ls = h s ( s + 1) ,
(12.15)
Для электрона s=1/2, согласно принципу Паули (или исключения) в одном
и том же энергетическом состоянии могут находиться только два электрона,
с разными спиновыми числами s=+1/2 и s=–1/2 (при одинаковых n, l, m).
Проекция спина на ось z Lsz квантуется
Lsz = ms h .
(12.16)
здесь ms – магнитное спиновое квантовое число. Для электрона
ms = ± s = ±1 / 2 .
(12.17)
Таким образом, квантовое состояние электрона в любом атоме задается
четырьмя квантовыми числами:
главным n (n=1, 2, 3...);
азимутальным l (l = 0, 1, 2, ...n–1);
магнитным m (m = –l,... –1, 0, 1 ... +l);
спиновым ms (ms = +1/2, –1/2).
Учет взаимодействия спиновых магнитных моментов ядра и электрона
приводит к сверхтонкому расщеплению уровня 1s атома водорода на два
подуровня. Переход электрона между этими подуровнями приводит к
излучению (или поглощению) радиоволн с длиной волны λ=21 см. Такое
излучение испускается межзвездным водородом в галактиках. Изучая это
излучение с помощью радиотелескопов, астрономы получают много
полезной информации.
160
Лекция 13. Строение вещества
1. Химические связи, строение молекул.
2. Энергетические уровни в молекулах. Молекулярные спектры.
Комбинационное рассеяние света.
3. Рентгеновское излучение. Тормозной и характеристический
рентгеновские спектры. Закон Мозли
13.1. Химические связи и энергетические уровни в молекулах, строение
молекул
Наименьшей частицей вещества, носителем его физических и
химических свойств, является атом или молекула как структура из атомов.
Химическая связь (ХС) – связь между атомами в молекуле или
молекулярном соединении, возникающая в результате либо переноса
электрона с одного атома на другой, либо обобществления электронов парой
(или группой) атомов. Описать взаимодействие электронов только как
кулоновское отталкивание одноименных зарядов нельзя, здесь следует
учитывать обменное взаимодействие частиц, являющееся чисто квантовым
явлением. Расчеты показывают, что обменное взаимодействие выгодно, так
как с образованием общей структуры (молекулы, многоатомной группы,
кристалла) энергия системы уменьшается, а ее устойчивость повышается.
Следует вспомнить о выделении теплоты (энергии) фазового перехода I рода
при кристаллизации расплава, т.е. при энергетически выгодном образовании
кристалла. При образовании молекулы также выделяется энергия, равная
работе ее образования, что говорит об уменьшении энергии системы.
Например, при сближении двух водородоподобных (простейших) атомов
расчетная зависимость потенциальной энергии U (энергии взаимодействия)
имеет вид кривой, приведенной на рис. 13.1. Межатомное расстояние r0,
соответствующее равновесному положению атомов при минимуме энергии
системы, называют длиной связи.
U
r0
r
Рис. 13.1
Основные виды ХС ковалентная (гомеополярная или обменная) и
ионная (электровалентная).
В 1916 году американским ученым Дж.Льюисом была высказана
гипотеза о том, что взаимодействие между атомами в молекуле существует, в
основном, между внешними – валентными – электронами. Данная идея лежит
161
в основе современной теории ковалентной связи. В том же году немецкий
ученый В.Коссель предположил, что один из взаимодействующих атомов
перетягивает одеяло (чужой электрон) на себя. Кратность ковалентной ХС
равна числу пар обобществленных электронов (двойная, тройная ХС и т.д.).
Электроны в паре должны иметь противоположные спины. При резком
разделении электронов образуются положительный и отрицательный ионы,
поэтому ионная ХС часто рассматривается как предельный случай
ковалентной ХС. Потому же нельзя говорить о чисто ковалентной или чисто
ионной ХС, а лишь о преимущественно ионном или ковалентном характере
ХС. Частично ионную и частично ковалентную ХС называют семиполярной.
Выделяют также металлическую и водородную ХС.
Металлическая ХС характерна для веществ – металлов, в которых
образующийся в результате большой концентрации электронов электронный
газ удерживает на определенном расстоянии положительные ионы
(обозначаются узлы кристаллической решетки металла).
Водородная связь – промежуточный вид ХС между ковалентной ХС и
невалентным межатомным взаимодействием при участии атома водорода.
Электрон атома водорода относительно слабо связан с ядром и легко
смещается к соседнему электроотрицательному атому, например, в органике
обычно кислород (О), азот (N), фосфор (Р) и т.п. В результате оголяющееся
ядро атома водорода (протон) создает условия для сближения атомов О–О,
N–О и т.п.
13.2. Энергетические уровни в молекулах. Молекулярные спектры.
Комбинационное рассеяние света
При образовании молекул оптические спектры веществ изменяются по
сравнению с атомными спектрами излучения и поглощения, рассмотренными
ранее, например, для атома водорода. Молекулярные спектры значительно
сложнее, так как кроме движения электронов относительно двух и более ядер
в молекуле происходит колебательное движение ядер вместе с окружающими
их внутренними электронами около положения равновесия и вращательное
движение молекулы как целого. Соответственно рассматривают
электронные, колебательные и вращательные уровни энергии Еэл, Екол, Евр и
три типа молекулярных спектров. По порядку величины
Еэл : Екол : Евр = 1 : m / M : m / M или Еэл >> Екол >> Евр ,
где m – масса электрона, а М – масса ядра в молекуле.
Система уровней энергии молекулы характеризуется совокупностями
далеко отстоящих друг от друга электронных уровней энергии Еэл (при
заданных значениях Екол и Евр), расположенных значительно ближе друг к
другу колебательных уровней энергии Екол (при заданных значениях Еэл и Евр)
162
и еще более близких друг к другу вращательных уровней энергии Евр (при
заданных значениях Еэл и Екол).
В результате переходов электронов между различными уровнями Еэл,
Екол и Евр образуются полосатые молекулярные спектры. Вспомним, что
каждому энергетическому уровню соответствует испускание (поглощение)
излучения не с определенной частотой (длиной) волны, а с частотой (длиной)
волны в определенном интервале vср − dv < v < vср + dv вследствие
рассмотренного ранее (лекция 9, ч. III настоящего пособия) известного
соотношения неопределенностей для энергии и времени ∆E∆t ≥ h .
Если на вещество падает монохроматический свет, то кроме основной
частоты этого света v в спектре будут наблюдаться симметричные
относительно нее линии с частотами v–vi – стоксовы или красные
спутники и v+vi – антистоксовы или фиолетовые спутники. Здесь vi –
одна из собственных частот колебаний молекулы. Таким образом, частоты
новых линий в спектре рассеяния являются комбинациями частоты
падающего света и частот колебательного и вращательного переходов
рассеивающих молекул. Отсюда и название этого явления –
комбинационное рассеяние света.
По молекулярным спектрам проводят анализ строения и свойств
вещества, определяют наличие в нем примесей.
13.3. Рентгеновское излучение. Тормозной и характеристический
рентгеновские спектры. Закон Мозли
Рентгеновским (РИ) называется излучение с длиной волны примерно
10 –6⋅10-12 м. Иногда указывают более широкий интервал: 10-7–10-14 м (от 103
до 10-4 ∆). Напомним, что с уменьшением длины волны растет частота и,
следовательно, энергия и проникающая способность излучения. РИ с длиной
волны менее 2 ∆ условно называют жестким, а с длиной волны более 2 ∆
условно называют мягким.
Источниками РИ являются рентгеновские трубки, радиоактивные
изотопы (отсюда постоянно везде существующее – фоновое РИ), ускорители
частиц.
В рентгеновской трубке ускоренные электрическим полем электроны
(возможно использовать и высокоэнергетичные ионы, например, α -частицы)
бомбардируют металлический анод (мишень). При столкновении ускоренных
электронов с атомами мишени электроны теряют свою энергию на излучение
и ионизацию атомов анода. Так как разброс энергии бомбардирующих
электронов велик, то при торможении на аноде они излучают с любой
возможной длиной волны в рентгеновском диапазоне. Такое излучение
называется тормозным РИ, а соответствующий рентгеновский спектр –
тормозным спектром РИ. Тормозное РИ имеет сплошной спектр, по
-9
163
которому ничего конкретного о мишени сказать нельзя. При торможении
бомбардирующих электронов атомами мишени происходит ионизация
атомов мишени, в результате которой электроны с одной из внутренних
оболочек выбрасываются из атома (первичное РИ) либо происходит
поглощение кванта присутствующего электромагнитного излучения
(флуоресцентное РИ). Ионизированный атом через малое время 10-16–10-15 с
переходит из возбужденного состояния с большей энергией в состояние с
меньшей энергией с излучением кванта определенной частоты. Так как
энергетические уровни в атоме имеют строго определенные дискретные
значения энергии, то в результате такого процесса образуются
специфические линейчатые спектры РИ, характерные для каждого элемента
мишени (анода). Линейчатый спектр РИ и называют характеристическим
спектром РИ. По характеристическому спектру уже можно кое-что сказать о
составе мишени. Исследуя характеристические спектры английский физик
Г.Мозли (1887–1915) в 1913 году сформулировал закон (Мозли):
1
 1
v = R( Z − σ ) 2  2 − 2  ,
n 
m
(13.1)
где v – частота линии характеристического РИ;
R=
me e 4
32π 2ε 02 h 3
= 2,07 ⋅ 1016 с-1 – постоянная Ридберга; Z – атомный
номер элемента мишени; σ – постоянная экранирования, m=1, 2, 3, … –
определяет рентгеновскую серию, соответственно K, L, M, …; n=m+1, m+2,
m+3, … – определяет конкретную отдельную линию в соответствующей
серии. Закон Мозли подобен обобщенной формуле Бальмера (12.?????).
Постоянная экранирования вводится потому, что на электрон,
совершающий переход, соответствующий некоторой линии, действует не
весь заряд ядра Ze, а меньший. Меньший потому, что внутренние электроны
закрывают собой ядро, поэтому для К-серии принимают σ =1, n=1, m=2, 3, …
При взаимодействии РИ с веществом может наблюдаться внешний
фотоэффект с поглощением РИ. При этом из атома вырывается внутренний
электрон, после чего возможны излучательный переход с испусканием
характеристического РИ, либо выброс второго, так называемого ожеэлектрона при безызлучательном переходе. В случае неметаллической
кристаллической решетки возможно возникновение дефектов решетки.
Воздействие на живые организмы РИ разрушительно вследствие ионизации
атомов и молекул тканей и органов.
164
Лекция 14. Элементы физики твердого тела – I
1. Вырожденные и невырожденные коллективы частиц. Фазовое
пространство и его квантование. Химический потенциал. Понятие о
квантовых
статистиках.
Функции
распределения
МаксвеллаБольцмана, Бозе-Эйнштейна и Ферми-Дирака.
2. Применение квантовых статистик к описанию системы частиц.
Химпотенциал. Бозе-конденсация. Энергия Ферми.
3. Применение методов статистической физики к равновесному
(тепловому) излучению.
14.1. Вырожденные и невырожденные коллективы частиц. Фазовое
пространство и его квантование. Химический потенциал. Понятие о
квантовых статистиках. Функции распределения МаксвеллаБольцмана, Бозе-Эйнштейна и Ферми-Дирака
(перед изучением данного материала следует ознакомиться с
распределением Максвелла, лекция 9, часть I данного пособия)
При рассмотрении ансамблей (систем), состоящих из большого числа
частиц, событий и т.п., начинают проявляться особые – статистические –
закономерности. Например, при бросании монеты три раза подряд может
выпасть «орел», хотя вероятность выпадения и «орла», и «решки» одинакова
и равна 0,5, т.е. это события равновероятные. Почему события
равновероятные, а три раза выпал «орел»? Дело в том, что данные события
равновероятны с точки зрения статистики и теории вероятности: при
большом числе испытаний (бросаний монеты), например, 10000, число
выпадений «орла» и «решки» будет примерно одинаковым, что и указывает
на их равновероятность. Это и называется статистической закономерностью,
которые начинают проявляться при рассмотрении большого числа
однотипных событий (испытаний), движения частиц в коллективах,
состоящих из множества тождественных (одинаковых) частиц, и т.п.
Квантовая статистика – раздел статистической физики, исследующий
системы, состоящие из огромного количества квантовых частиц, поведение
которых описывается уже неклассическими, квантовыми закономерностями
(неклассической, квантовой механикой). В макромире все величины
изменяются непрерывно (имеют сплошной спектр значений), даже при
совпадении всех характеристик частиц одного вида, можно различить их,
следя за их траекторией. В классической статистической физике частицы
считаются различимыми, т.е. при локализации двух одинаковых частиц в
небольшой области пространства мы в любой момент времени можем
сказать, где находится первая и вторая частицы. В квантовой механике
вследствие корпускулярно-волнового дуализма свойств вещества и
соотношения неопределенностей Гейзенберга–Бора тождественные (с
одинаковой массой, зарядом, спином, энергией, т.д.) частицы считаются
неразличимыми, при этом перестановка частиц местами не изменяет в целом
165
физическое состояние системы. Для волновых функций, описывающих
движение двух тождественных квантовых частиц, их неразличимость
(перестановка местами) означает умножение на несущественный фазовый
множитель exp(iα ) : Ψ (..., x j ,..., xk ,...) = Ψ (..., xk ,..., x j ,...) ⋅ exp(iα ) . Если
же записать Ψ (..., x j ,..., xk ,...) = Ψ (..., x j ,..., xk ,...) ⋅ exp(2iα ) , то с учетом
exp(2iα ) = 1 , exp(iα ) = ± 1 = ±1 делается вывод о том, что волновая
функция при перестановке частиц местами либо меняет свой знак, либо не
изменяется вообще. При перемене знака говорят об антисимметричных
волновых функциях, без смены знака – о симметричных волновых функциях.
В научно-популярной литературе спин описывается как собственный
механический момент при вращении частицы вокруг собственной оси. На
самом деле это не так. Спин является квантовой, не имеющей классического
аналога характеристикой, такой же, как заряд частицы, ее масса и т.п.
Системы частиц с целым или нулевым спином (бозоны) описываются
симметричными, с полуцелым спином (фермионы) – антисимметричными
волновыми функциями. Бозонами являются фотоны, фононы, куперовские
электронные пары, т.д. Фермионами являются электроны, позитроны,
протоны, нейтроны, т.д. Для фермионов выполняется принцип запрета
Паули: в системе, состоящей из одинаковых фермионов, не может быть даже
двух частиц, находящихся в одинаковом квантовом состоянии с одинаковым
набором всех четырех квантовых чисел. Если мы при абсолютном нуле
температуры будем кидать бозоны в одну энергетическую яму, а фермионы в
другую, то картины будут различными: фермионы будут занимать различные
энергетические уровни, а бозоны – первый, причем, чем больше бозонов
будет находиться в данном энергетическом состоянии, тем легче
последующим бозонам в него входить и тем труднее из него выходить (бозеконденсация).
Это проявляется при явлениях сверхпроводимости (сверхтекучести). При
температурах сверхпроводимости (около 0 К) образуются электронные пары
– куперовские пары, причем, чем их больше, тем все больше их образуется.
При учете неразличимости частиц теряет смысл утверждение о том, что
первая частица находится в состоянии 1, а вторая – 2. В этом случае говорят о
непрерывной смене состояний 1 и 2, не конкретизируя, какое состояние
соответствует данной частице. Это не следует понимать как физическое
непрерывное перемещение частиц, а лишь как условный, виртуальный образ.
В простейшем случае для одноатомного газа (пренебрегая внутренней
структурой молекул, считаем их материальными точками) состояние
молекулы описывается тремя координатами (x, y, z) и тремя составляющими
импульса (px, py, pz). Если в системе N частиц, то их состояние описывается N
точками в шестимерном пространстве – так называемом фазовом
пространстве или µ -пространстве. По аналогии с обычным пространством
вводится понятие фазового объема в µ -пространстве
166
dΓ = dxdydz dp x dp y dp z = dV ⋅ dV p ,
123 14243
dV
(14.1)
dV p
где dV – элемент пространства конфигураций, dVp – элемент пространства
импульсов, исходя из соотношения неопределенностей (9.????) элемент
объема
фазового
пространства
имеет
величину
dΓ = dxdp x ⋅ dydp y ⋅ dzdp z ≥ 2πh ⋅ 2πh ⋅ 2πh , т.е. минимальный элемент
объема фазового пространства,
состоянию частицы
соответствующего
dΓ = (2πh )3 ,
одному,
данному
(14.2)
где h – постоянная Планка.
В зависимости от симметрии задачи может быть удобным как в
пространстве конфигураций, так и в пространстве импульсов в качестве
элементов объема выбирать не декартовы прямоугольные параллелепипеды,
а, например, шаровые слои.
dр
р
x
dx
Рис. 14.1
Пусть дан одномерный (координата х) одноатомный газ в поле тяготения
с массой молекулы m. Классически имеем: кинетическая энергия молекулы
p2/(2m) (p – импульс молекулы), потенциальная энергия молекулы mgx.
Полная энергия молекулы Е= p2/(2m)+ mgx. Тогда линии постоянства полной
энергии – параболы относительно оси Ох (рис. 14.1), а в качестве элементов
фазового пространства удобно выбрать элементы с площадью dpdx. При
абсолютно упругом столкновении двух молекул (без потерь энергии)
изображающие их точки перейдут с одной параболы на другую с
сохранением полной энергии. Аналогию можно провести на любое N-мерное
пространство.
В отличие от классической в квантовой статистике одному состоянию
системы соответствует не точка, а некоторый малый объем фазового
пространства (иногда называемого µ -пространством). Это становится
понятным, если вспомнить, что в классической физике все величины имеют
167
сплошной, а в квантовой физике могут иметь и дискретный спектр значений с
учетом соотношений неопределенностей Гейзенберга–Бора.
В физических системах в зависимости от условий могут проявляться не
все особенности квантовых коллективов (частиц). В одних случаях может
проявляться дискретность некоторых параметров, в других добавляется еще
неразличимость частиц и принцип Паули, обусловленный взаимодействием
частиц. Кроме того, коллективы могут быть вырожденными или
невырожденными. Невырожденными называются коллективы, в которых
число частиц много меньше, чем число возможных энергетических
состояний. Вырожденными называются коллективы, в которых число частиц
сравнимо по величине или больше, чем число возможных энергетических
состояний. Это накладывает определенное ограничение на квантовые
коллективы: бозоны могут находиться в одинаковом состоянии, причем, чем
их больше, тем легче они в него заходят (как люди охотно заходят в веселую
компанию), а даже два фермиона не могут ужиться, как скандальные соседи.
В связи с этим для определения степени вырождения в квантовых
коллективах необходимо знать число частиц в коллективе N и функцию g(E) –
число возможных состояний частицы с энергией E, кратность вырождения.
Вырожденность можно определить и по-другому. Газ частиц считается
вырожденным, если его свойства отличаются от свойств классического
идеального газа. Основным признаком вырождения газа является
независимость энергии его частиц от температуры. Например, (фермионный)
газ электронов в металле остается вырожденным до тех пор, пока любой из
электронов не сможет обмениваться энергией с кристаллической решеткой.
Это возможно лишь в том случае, если средняя энергия тепловых колебаний
(или виртуальных частиц – фононов – квантов колебаний кристаллической
решетки) не меньше энергии Ферми kБT ≥ EF (kБ – постоянная Больцмана).
Тогда температура Ферми – температура перехода газа из невырожденного
состояния в вырожденное TF ≥ EF/kБ.
В силу вышесказанного в зависимости от обстоятельств системы
описываются одной из трех статистик:
1)
классическая
Максвелла–Больцмана:
частицы
считаются
различимыми, энергия может иметь как сплошной, так и непрерывный
спектр; статистика основана на принципе Больцмана, согласно которому
равновесному состоянию системы соответствует максимальная энтропия;
2) квантовая Бозе–Эйнштейна: для бозонов – частиц с целым и нулевым
спином, частицы считаются неразличимыми, энергия имеет дискретный
спектр значений;
3) квантовая Ферми–Дирака: для фермионов – частиц с полуцелым
спином, частицы считаются неразличимыми, энергия имеет дискретный
спектр значений.
Еще раз напомним, что в отличие от классической в квантовой
статистике одному состоянию системы соответствует не точка, а некоторый
малый объем фазового пространства – ячейки.
168
При решении многих практически важных задач необходимо знать
функцию распределения, которая характеризует плотность вероятности
распределения частиц статистической системы по пространству или
вероятность распределения по квантово-механическим состояниям с
определенными энергиями. Так как функция распределения связана с
вероятностью, то она должна быть всегда однозначна (вероятность не может
иметь несколько значений для данного значения какого-то параметра),
конечна (вероятность конечное число). Кроме того, вероятность того, что
частица имеет какую-то энергию или другой параметр a в интервале
значений ( − ∞ ; + ∞ ), равна единице (событие достоверное), поэтому
+∞
∫ f (a)da = 1 – так называемое условие нормировки.
−∞
Без вывода приведем выражения функций распределения (функций
заполнения ячеек фазового пространства) или средней заполненности
частицами состояний с определенной энергией Еi при температуре T
1
f ( Ei ) =
e
Ei − µ
kБT
,
(14.3)
+δ
где µ – химический потенциал (уровень Ферми) – это изменение энергии
системы в изохорно-изоэнтропийном процессе при изменении числа частиц
системы на одну частицу; δ – постоянная: при δ = 0 формула (14.3) дает
нам функцию распределения Максвелла–Больцмана, при δ = −1 –
функцию распределения Бозе–Эйнштейна для бозонов, при δ = +1 –
функцию распределения Ферми–Дирака для фермионов.
14.2. Применение квантовых статистик к описанию системы частиц.
Химпотенциал. Бозе-конденсация. Энергия Ферми
Сразу следует оговориться, что рассмотрение вопроса будет упрощенное,
нестрогое. Например, в формулах отсутствуют множители, обусловленные
наличием спина у частиц, и т.п., что, в принципе, не делает приведенный
материал ошибочным, а лишь ограничивает его применение частными
случаями. Материал призван лишь ознакомить с основными принципами
квантовой статистики. Для более глубокого изучения квантвой и
статистической физики авторы рекомендуют обратиться к известным
классическим учебникам таких авторов, как Л.Д.Ландау, И.Е.Лифшиц или
Ю.Б.Румер, М.Ш.Рывкин.
Рассмотрим применение квантовой статистики Бозе–Эйнштейна к
невырожденной системе частиц с целым или нулевым спином. Такими
частицами являются бозоны: фотоны, фононы, π -мезоны, а также атомы, в
169
которых число электронов и нуклонов является четным. Такую систему
можно рассматривать как бозе-газ, описываемый функцией распределения
вида (14.3)
1
f (E) =
e
E −µ
kБT
.
(14.4)
−1
В общем случае число всех частиц с энергией E в единице объема газа
(концентрация) определяется условием
n = ∫ f ( E )dN ( E ) ,
(14.5)
где dN(E) – число возможных состояний частицы с энергией в интервале [E;
E+dE] в единице объема конфигураций, f(E) – плотность вероятности
нахождения частицы в состоянии с энергией Е.
Элемент
объема
пространства
импульсов
(шаровый
слой),
2
соответствующий модулю импульса в интервале [р; р+dр] равен 4πp dp .
Обозначив через V=1 м3 элемент объема пространства конфигураций,
2
получим элемент объема фазового пространства 4πp Vdp . Знаем, что
минимальный объем ячейки фазового пространства, соответствующего
одному, данному состоянию частицы с импульсом р определяется формулой
(14.2). Тогда, разделив элемент объема фазового пространства
4πp 2Vdp = 4πp 2 dp на (2πh )3 , можно получить число возможных состояний
частицы с импульсом в интервале [р; р+dр] в единице объема конфигураций
4πp 2 dp
dN ( p ) =
(2πh )3
(14.6)
или число состояний частицы с энергией в интервале [E; E+dE] в единице
объема конфигураций с учетом p =
2mE и dp =
4π 2 ⋅ 2mEVm
1/ 2
dN ( E ) =
(2πh )3
1 2m
dE
2 E
E −1 / 2
dE
m 3 / 2 E 1 / 2 dE
2
=
.
π 2 2h 3
Подставляя выражения (14.4) и (14.7) в формулу (14.5), получаем
170
(14.7)
m3 / 2 ∞
n=
∫
2π 2 h 3 0
E dE
e
E−µ
kБT
.
(14.8)
−1
Из формулы (14.8) можно найти значение химпотенциала µ . Условие
(14.8) может выполняться только при отрицательных значениях µ . Если
предположить µ > 0 , то подынтегральное выражение будет отрицательным,
что невозможно, так как функция распределения по смыслу связана с
вероятностью и должна быть неотрицательной. Таким образом, µ ≤ 0 . В
связи с этим производные всегда отрицательны ∂µ / ∂T < 0 , т.е. можно
сказать, что химпотенциал µ растет с уменьшением температуры Т, все
время оставаясь отрицательной величиной. Химпотенциал µ обращается в
нуль при некоторой температуре Т0 ≠ 0 К. Обратившись в нуль при Т0
величина µ = 0 и при более низких температурах.
Чтобы выполнялось равенство (14.8), необходимо также предположить,
что число частиц в системе уменьшается с уменьшением температуры, что, в
свою очередь, невозможно, так как уйти из системы частицы не могут.
Поэтому для выполнения равенства (14.8) частицы должны перейти на
уровень с нулевой энергией, то есть при Т ≤ Т0 часть частиц должна
находиться на уровне с нулевой энергией, а остальные будут распределены
по другим уровням. Описанное явление называется бозе-конденсацией, при
абсолютном нуле температуры все частицы бозе-газа будут находиться на
нулевом уровне. В этом проявляется одно из свойств бозе-газа.
Оценка температуры конденсации показывает, что при этой температуре
все вещества находятся либо в твердом, либо в жидком состояниях, то есть не
являются газами, что подтверждается экспериментами. Например, для гелия
He при Т ≤ 2,19 К наблюдается своеобразное изменение состояния этого бозегаза. Жидкий гелий состоит при этом из двух компонент:
несконденсированной и сконденсированной (сверхтекучей) частей бозе-газа.
Обнаружение явления сверхтекучести рассматривается в качестве
экспериментального подтверждения теории конденсации бозе-газа. По
аналогии рассматривается и явление сверхпроводимости, когда при
температурах, близких к абсолютному нулю, образуются бозоны – пары
взаимосвязанных электронов – куперовские пары. К данному газу также
применима теория бозе-конденсации.
Рассмотрим другие свойства бозе-газа. С учетом формулы (14.8) имеем
m3 / 2 ∞ E 3 / 2 dE
E = ∫ Ef ( E )dN ( E ) =
.
∫
2π 2 h 3 0 Ek −Tµ
0
e Б −1
∞
171
(14.9)
Из курса общей физики (формула (9.18), лекция 9, часть I настоящего
пособия) известно, что давление и энергия в единице объема связаны
соотношением P = 2 E /(3V ) (у нас объем единичный V=1 м3), тогда
P=
2m3 / 2 ∞ E 3 / 2 dE
∫
E −µ
0 k T
Б
2 3
3π h
e
.
(14.10)
−1
Покажем, что при выполнении условий
 µ
 kБT
<< 1,
e
 E >> µ

(14.11)
Уравнение (14.10) переходит в уравнение Менделеева–Клапейрона,
описывающего состояние идеального газа. Для этого воспользуемся
малостью величины exp[µ /( k Б T )] << 1 . Обозначим E/(kБT)=х с учетом
∞
табличного интеграла
∫x
3 / 2 −αx
e
dx =
0
3
π α −3 / 2 , получим
4
µ
P=
2m3 / 2 (k Б T )5 / 2 ∞ x 3 / 2e k Б T e − x dx
∫
3π 2h 3
0
µ
=
kБT − x
1 − e1
42e4
3
≈0
=
2m
3/ 2
(k Б T )
3π 2 h 3
5/ 2
µ
∞
3/ 2
5/ 2
µ
m (k Б T )
kБT
e k Б T ∫ x 3 / 2 e − x dx =
e
. (14.12)
3/ 2 3
2 2π h
0 4243
1
=3 π / 4
С учетом формулы (14.8) уравнение (14.12) должно принять вид
уравнения Менделеева–Клапейрона. Для этого необходимо выполнить ряд
преобразований. Во-первых, привести формулу (14.8) с учетом замены
∞
E/(kБT)=х и табличного интеграла
∫
xe −αx dx =
0
172
π
2
α − 3 / 2 к виду
m3 / 2 ∞
n=
∫
2π 2 h 3 0
E dE
e
E−µ
kБT
−1
m3 / 2 (k Б T )3 / 2 ∞
=
∫
2π 2 h 3 0
x1 / 2 dx
=
µ
kБT − x
e1
2e3 − 1
≈0
µ
=
m
3/ 2
(k Б T )
2π 2 h 3
3/ 2 ∞
∫
0
1/ 2 kБT
x
e
e − x dx
µ
kБT − x
1 − e1
2e3
µ
m3 / 2 (k Б T )3 / 2 k Б T ∞ 1 / 2 − x
=
e ∫ x e dx =
2π 2 h 3
0 424
1
3
= π /2
≈0
µ
m3 / 2 (k Б T )3 / 2 k Б T
=
e .
3/ 2 3
2 2π h
(14.13)
Сравнивая формулы (14.13) и (14.12), можно записать уравнение
Менделеева–Клапейрона в виде
P = nk Б T
(14.14)
или для произвольного числа молей в более привычном виде
PV =
m
RT .
M
(14.15)
Таким образом, при выполнении условий (14.11) (энергия частицы много
больше химпотенциала) квантовая статистика Бозе–Эйнштейна переходит в
классическую статистику Максвелла–Больцмана. При этом возможно
получение уравнений классической физики из более общих – квантовых –
уравнений.
По аналогии с проведенным выше рассмотрением для бозе-газа
рассмотрим применение квантовой статистики Ферми–Дирака к системе
частиц с полуцелым спином с учетом принципа запрета Паули. Такими
частицами являются фермионы: электроны, µ -мезоны, нуклоны, а также
атомы, в которых число электронов и нуклонов является нечетным. Такую
систему можно рассматривать как ферми-газ, описываемый функцией
распределения вида (14.3)
1
f (E) =
e
E−µ
kБT
173
.
+1
(14.16)
Рассматривая невзаимодействующие частицы в пространстве импульсов,
для числа состояний с энергией в интервале [E; E+dE] в единице объема
конфигураций (у нас объем единичный V=1 м3) можно по аналогии с выводом
формулы (14.7) получить
2m 3 / 2 E 1 / 2 dE
.
dN ( E ) =
2π 2 h 3
(14.18)
Множитель «2» перед формулой записан с учетом того, что в состоянии с
одинаковой энергией могут находиться только два фермиона с
противоположными спинами (g(E)=2 согласно принципу запрета Паули).
При рассмотрении свойств ферми-газа интерес представляет график
зависимости функции распределения Ферми–Дирака от термодинамической
температуры и энергии (рис. 14.2).
f(E)
1
1/2
~kБT
T>0K
T=0K
E0=µ
E
Рис. 14.2
Отметим несколько ключевых моментов:
1) при
µ /(k Б T ) >> 1 (тогда exp[− µ /(k Б T )] ≈ 0 )
и
Е=0
1
≈ 1; это означает, что пока энергия Е много
E − µ 
exp 
 +1
k
T
 Б 
меньше химпотенциала µ (E<< µ ), функция распределения f(E) ≈ 1;
⇒ f (E) =
2) при E = µ имеем f ( E ) =
1
1
= .
exp[0] + 1 2
В данном случае следует рассказать о таком понятии, как энергия Ферми.
При Т=0 К электроны в металле заполняют энергетические уровни, верхний
из них и обладает энергией Ферми. Энергия Ферми – это максимально
174
большая энергия, которой обладает электрон в кристалле при температуре 0
К. С точки зрения статистической физики f(E)=1/2 означает, что вероятность
заполнения энергетического уровня с энергией Ферми E0= µ при любой
температуре равна 1/2.
3) с дальнейшим ростом энергии Е функция распределения f(E) убывает
и при E>> µ >>kБT убывание это становится близким к обычному
экспоненциальному
f (E) =
µ − E 
1
≈ exp 
k Б T 
E − µ 

exp 
 +1
k
T
 Б 
(получаем
функцию распределения Максвелла–Больцмана).
Функция распределения Ферми–Дирака для Т=0 К и Т>0 К заметно
отличается лишь в небольшой области энергий порядка kБT.
14.3. Применение методов статистической физики к равновесному
(тепловому) излучению
(перед изучением данного материала необходимо ознакомиться с
лекцией 7, ч. III данного пособия)
Рассматривается равновесное – тепловое – излучение: сколько энергии в
единичном интервале частот в единицу времени излучается, столько же и
поглощается. Данное излучение можно представить с использованием
модели стоячей волны. По аналогии с выбором фазовой ячейки и вычислении
числа состояний с импульсом р в данной ячейке (формула (14.6)) удобно
выбрать за основу число стоячих волн, имеющих частоту того или иного
бесконечно малого участка спектра
4πv 2 dv 8πv 2 dv
dN (v) = 2
=
,
c3
c3
(14.19)
при этом использовалось известное соотношение p = h / λ = hv / c , где с –
скорость света в вакууме, а множитель «2» перед формулой связан с
возможностью поляризации волны в двух взаимноперпендикулярных
направлениях.
Задача в данном случае сводится к нахождению распределения энергии
по частотам в спектре излучения АЧТ по известному распределению числа
ЭМВ (14.19).
Так как стоячая волна может рассматриваться как одна колебательная
степень свободы, то ее средняя энергия < ε >= 2 ⋅ 1 / 2 ⋅ k Б T = k Б T . С учетом
этого английские физики Р.Дж.У.Рэлей (1842–1919) и Дж.Х.Джинс (1877–
1946) независимо друг от друга в 1900 году была получили формулу Рэлея–
175
Джинса (7.7). Опыт показывает, что формула (7.7) справедлива в области
малых частот v (больших длин волн λ ) и высоких температур Т. Попытка
получить из формулы (7.7) закон Стефана–Больцмана (7.5) получила
название «ультрафиолетовой катастрофы» (7.8), хотя согласно формуле
(7.5) R
АЧТ
T
~ T 4 . Сильное расхождение наблюдалось в коротковолновом
спектре (см. рис. 7.1). Подобная неудача объясняется неверным выражением
для средней энергии гармонического осциллятора – колеблющихся в узлах
кристаллической решетки атомов АЧТ.
В области больших частот v хорошее согласие с опытом давал закон
излучения Вина
rv ,T = C ⋅ v 3 ⋅ A ⋅ exp[− Av / T ],
(14.20)
где С и А – некоторые константы.
Верное выражение для средней энергии гармонического осциллятора с
собственной частотой v и, следовательно, для rv ,T было получено в 1900 году
немецким физиком–теоретиком М.К.Э.Л.Планком (1858–1947) на базе его
квантовой гипотезы. Согласно квантовой гипотезе Планка свет излучается
порциями – квантами с энергией каждого кванта E = hv , где
h = 6,63 ⋅ 10 −34 Дж ⋅ с – постоянная Планка. Таким образом, ТИ можно
рассматривать как поток квантов – фотонов. С учетом статистических
закономерностей при рассмотрении такого квантового коллектива частиц
(фотонов) М.Планк 14 декабря 1900 года на заседании Берлинского
физического общества продемонстрировал вывод формулы (7.9). 14 декабря
1900 года считается днем рождения новой – квантовой физики, а
формула (7.9), хорошо согласующаяся с опытом, получила название
«закон излучения Планка». Из формулы (7.9) могут быть получены все
выше рассмотренные частные случаи (законы) (7.5)– (7.7).
Представим равновесное излучение как газ невзаимодействующих
частиц с целым спином – фотонов с энергией E=hv. Число частиц в таком
газе есть переменная величина, зависящая от объема и температуры
1
< n( E ) >=
e
E
kБT
1
=
−1
e
hv
kБT
.
(14.21)
−1
Данное выражение справедливо для равновесного излучения при µ = 0
(см. формулу (14.4)). Число фотонов различной поляризации в фазовой
ячейке в единичном объеме пространства конфигураций V=1 м3 определяется
выражением (14.19). Тогда энергия равновесного излучения, приходящаяся
на интервал спектра частот [v; v+dv]
176
8πhv 3dv
dE (v) = hv ⋅ dN (v) < n( E ) >=
 hv

c 3  e k Б T − 1




(14.22)
(можно сравнить формулу (14.22) с формулой М.Планка (7.9)).
Считая распределение по частоте непрерывным, можно вычислить
полную энергию фотонного газа для единицы объема с учетом табличного
x3
π4
интеграла ∫ x
dx =
15
0 e −1
∞
 hv

x
,
=


∞
k
T
8πh ∞ v 3dv
=
U = ∫ dE (v) = 3 ∫ hv
= Б

c 0 kT
k БT 
0
Б
dv
dx 
=

e
−1
h


8πh  k Б T ∞ x 3dx 8π 5 k Б4 4
= 3 
=
⋅ T = σT 4 ,
∫ x
3 3
c  h 1
0 e2−
31 15c h
(14.23)
= π 4 / 15
8π 5 k Б4
– постоянная Стефана–Больцмана (см. закон Стефана–
где σ =
15c 3h 3
Больцмана (7.5)).
177
Лекция 15. Элементы физики твердого тела – II
1. Теплоемкость твердых тел. Электронный газ в металлах. Понятие о
квантовой теории электро- и теплопроводности металлов. Явление
сверхпроводимости.
2. Решение уравнения Э.Шредингера для твердого тела. Понятие о
зонной теории твердых тел. Металлы, полупроводники и диэлектрики.
Их электрические свойства.
15.1. Теплоемкость твердых тел. Электронный газ в металлах. Понятие о
квантовой теории электро- и теплопроводности металлов. Явление
сверхпроводимости
(перед изучением данного материала следует ознакомиться с вопросом 11.2,
лекция 11, ч. I и вопросом 7.2, лекция 7, ч. II настоящего пособия)
В 1819 году французские физики П.Л.Дюлонг (1785–1838) и А.Т.Пти
(1791–1820) экспериментально установили закон, согласно которому
молярная теплоемкость (в отличие от удельной) химически простого
одноатомного вещества при больших температурах (комнатная и выше)
равна 3R, где R=8,31 Дж/(моль⋅К) – универсальная газовая постоянная
CV=3R≈25 Дж/(моль⋅К).
(15.1)
Формула (15.1) называется законом Дюлонга–Пти.
Для молярной теплоемкости органических соединений справедлив закон
Неймана–Коппа (1864 г.), согласно которому
CV=3nR,
(15.2)
где n – число атомов в соединении.
Закон Дюлонга–Пти достаточно легко объясним с помощью
классической физики. Например, в 1 моле вещества содержится NA частиц,
данному твердому телу (ТТ) можно поставить в соответствие 3NA
гармонических осцилляторов (три взаимноперпендикулярных направления
колебаний – три степени свободы). Тогда энергия теплового движения
E=3NA< ε >, где < ε > – средняя энергия одного осциллятора. В классической
физике энергия считается равномерно распределенной по степеням свободы,
каждой степени свободы соответствует энергия kБT/2. Энергия
гармонического осциллятора складывается из примерно равных
потенциальной и кинетической энергий, т.е. < ε >=kБT. Тогда E=3NAkБT=RT, а
по определению теплоемкости
CV = (dE / dT )V
(15.3)
легко получаем формулу (15.1).
Закон (15.2) справедлив в отсутствие свободных электронов в ТТ, т.е.
когда ТТ является диэлектриком. В металлах в тепловом движении участвуют
не только атомы (колебательное движение), но и электроны (поступательное
движение). Свободные электроны имеют 3 степени свободы, т.е. средняя
энергия электрона 3kБT/2. Если валентность атома Z, то полная энергия
теплового движения для 1 моля металла складывается из двух слагаемых:
178
первое выражает энергию осцилляторов–атомов в узлах кристаллической
решетки, а второе выражает энергию электронного газа в металле
E=3NA kБT+ 3ZNAkБT/2=3RNA(1+Z/2).
(15.4)
По определению теплоемкости (15.3) даже для одновалентного металла (Z=1)
молярная теплоемкость CV=4,5R, что в 1,5 раза больше опытной, выражаемой
формулой (15.2). Данная ситуация получила название «катастрофа с
теплоемкостью». Вклад электронов в теплоемкость классическая теория
объяснить не смогла, ее выводы ограниченно применимы. Делалась
попытка объяснить участие электронов в формирование теплоемкости в
теории А.Эйнштейна (1907 г.), а затем П.Дебая (1912 г.). Теория Эйнштейна
не дала согласия с опытом в области низких температур (рис. 15.1, данные
теории Эйнштейна – пунктир, опыт – сплошная линия).
CV
3R
Рис. 15.1
T, K
Теория Дебая, также являясь из-за ряда допущений приближенной, при
расчете на ЭВМ дает достаточно хорошее согласие с опытом практически для
всех температур. Дальнейшее рассмотрение для спорного случая – для
низких температур будем проводить согласно теории П.Дебая.
Фононом называется элементарная порция (квант) звуковой энергии с
частотой ω и энергией ε = hω , подобно тому, как фотон – квант
электромагнитного излучения. И фонон, и фотон являются бозонами. Это
означает, что все соотношения, полученные в предыдущей лекции для
фотонов, останутся верными и для фононов. Звуковые фононы полностью
аналогичны фотонам, ибо и те, и другие описываются одним и тем же
законом дисперсии: для фотонов ω = ck , а для звуковых фононов ω = sk ,
где k – волновое число, с – скорость света в вакууме, s – скорость звука.
Степень
вырождения
(состояния)
у
фотонов
2
(два
взаимноперпендикулярных направления поляризации), а у фонона 3 (в
твердом теле (ТТ) звуковые волны могут быть продольными и поперечными,
причем имеются две независимые поперечные поляризации). Фотоны могут
иметь любую частоту от 0 до ∞ , а фононы имеют верхнее ограничение.
Используя формулу (14.22) с заменой h = h /( 2π ) , скорости света с на
среднюю скорость звука s, v на ω = 2πv , для энергии единицы объема
кристалла при заданной температуре Т получим
179
E
3h
=
V 2π 2 s 3
ω max
ω 3 dω
∫ 
0
e


hω
kБT

− 1


.
(15.5)
Вычисляя интеграл (15.5) аналогично интегралу (14.22), см. переход к
формуле (14.23), для энергии единичного объема имеем
E=
π 2 k 4Б
10h 3 s
4
.
T
3
(15.6)
По определению теплоемкости (15.3)
CV = dE / dT =
2π 2 k 4Б
3 3
5h s
T3.
(15.7)
Формула (15.3) называется законом Дебая для низкотемпературной
теплоемкости, согласно ей CV~T3, что для низких температур согласуется с
опытом (рис. 15.1).
В теории Дебая вводится понятие характеристической температуры
Дебая, соответствующей максимальной частоте колебаний атомов в узлах
кристаллической решетки и, следовательно, максимальной энергии фононов:
1/ 3
ΘД
Интеграл
 6π 2 N A s 3 h 3 

= (hω max ) / k Б = 
3

Vk Б


.
(15.8)
энергии
(15.5) в теории Дебая с помощью замен
= k Б Tx / h , dω = k Б Tdx / h , x max = hω max /(k Б T ) ,
hω /( k Б T ) = x ⇒ ω
Θ Д = (hω max ) / k Б приводится к виду
E=
3Vh
2π 2 s 3
ωmax
∫
0
ω 3 dω
 hω
 e k БT


 kБT 
=
⋅


 2π 2 s 3  h 
− 1


3Vh
3
xmax 3
 T
N A k Б 9k Б
x dx
4

=
=
T
9
RT
∫
2 3 3
x
Θ
N A 6π s h
0 e −1
 Д
= 3RT ⋅ D(T / Θ Д ) .




4 xmax
∫
0
3Θ
x 3 dx
ex −1
Д /T
=
x 3 dx
∫ ex −1 =
0
(15.9)
Именно в формуле (15.9) и задается характеристическая температура
Дебая, выражаемая формулой (15.8), а функция
 T
D(T / Θ Д ) = 3
Θ
 Д
180




3Θ
Д /T
x 3 dx
∫ ex −1 = ,
0
(15.10)
которую нельзя вычислить аналитически (ее значения вычисляются
численными методами и приводятся обычно в таблицах), называется
функцией Дебая.
При высоких температурах, когда hω << ( k Б T ) или T >> Θ Д , с
x
учетом hω /(k Б T ) = x << 1 ⇒ e − 1 ≈ (1 + x) − 1 = x для функции Дебая
получаем
 T
D(T / Θ Д ) = 3
Θ
 Д




3Θ
Д /T
3
3
 T  1ΘД 
x dx

 
 = 1,
=
3
∫ x
Θ  3 T 

0
 Д 
т.е. согласно определению (15.3) и формуле (15.9) CV = (dE / dT )V = 3R ,
3
что согласуется с опытом.
В случае низких температур по теории Дебая, когда hω >> ( k Б T ) или
π4
x3
T << Θ Д , с учетом табличного интеграла ∫ x
dx =
молярная
15
1
e
−
0
∞
теплоемкость согласно формуле (15.7) ~T3, что также согласуется с опытом.
Результаты теории плохо согласуются с опытом при T = Θ Д из-за
взятой П.Дебаем упрощенной – линейной – зависимости ω от волнового
числа (вектора). Однако при подстановке в формулы Дебая данной реальной
– нелинейной – зависимости расчет с помощью ЭВМ также приводит к
верным результатам, согласующимся с опытом.
Неудача описания явления теплопроводности металлов также
обусловлена либо неучетом электронного газа в металлах в классической –
газокинетической – физике, либо неверное рассмотрение поведения этого
газа. Например, в классической электро- и теплопроводности металлов
теории П.Друде предполагается одновременность столкновений свободных
электронов с ионами решетки. В более поздней теории Лоренца последовал
отказ от одновременности столкновений, но не было учета поведения
электронов как фермионов, т.е. того, что сейчас мы знаем как принцип
запрета В.Паули. Учет этого принципа вкупе с применением функции
распределения электронов по энергиям (правда, равновесной функции
распределения) в теории (1927г.) немецкого физика и математика
А.Зоммерфельда (1868–1951) привел к результатам, согласующимся с
опытом.
В классической теории Лоренца соответственно для удельных
теплопроводности и проводимости получаются выражения
2
3 k Б τn
1
χ=
⋅ T = СV v 2τ ,
2 me
3
(15.11)
ne 2τ
γ =
,
me
(15.12)
181
где kБ – постоянная Больцмана, τ – среднее время пробега между двумя
последовательными столкновениями, n – концентрация электронов, me –
масса электронов, Т – температура, CV – теплоемкость, v – средняя скорость
электронов, е – модуль заряда электрона.
В квантовой теории А.Зоммерфельда при учете поведения (вклада)
электронного газа получаются следующие соответствующие выражения
χ=
2
π 2 k Б τn
3 me
⋅T ,
(15.13)
ne 2τ
γ =
.
2 me
(15.14)
Видно, что формулы (15.12) и (15.14) совпадают по виду, но получены
при кардинально различающихся подходах.
Согласно классической теории электро- и теплопроводности металлов
носителями тока и теплоты (высокая теплопроводность металлов) являются
свободные электроны. Г.Видеманом (1826–1899) и Францем в 1853 г.
экспериментально установлено, что отношение теплопроводности χ к
удельной проводимости γ при данной температуре T есть величина
постоянная – закон Видемана–Франца (формула (7.11), ч. II данного
пособия):
χ /γ = L ⋅T .
(15.15)
−8
2
L=const – число Лоренца, по теории Лоренца L = 3( k Б / e) = 2.23 ⋅ 10
а
по
теории
Зоммерфельда
Дж2/К2⋅Кл2=(Вт⋅Ом)/К2,
L = π 2 (k Б / e) 2 / 3 = 2.44 ⋅ 10 −8
Дж2/К2⋅Кл2=(Вт⋅Ом)/К2,
что
лучше
(полностью) согласуется с опытом.
15.2. Решение уравнения Э.Шредингера для твердого тела. Понятие о
зонной теории твердых тел. Металлы, полупроводники и диэлектрики.
Их электрические свойства
Известно, что твердое тело (ТТ) состоит из атомов, т.е. из ядер атомов и
электронов. Ядра занимают положение, совпадающее с положением узлов
кристаллической решётки, и совершают малые колебания у данного
положения равновесия. Силы взаимодействия между ядрами велики, поэтому
внешние силы для деформации кристалла должны быть значительны. Слабее
всего с ядрами связаны внешние – валентные электроны, поэтому под
действием внешнего поля (по большей части) они могут двигаться
поступательно и участвовать в формировании электрического тока.
Для количественной характеристики данного процесса необходимо
решать уравнение Шредингера (УШ) для системы очень большого числа
частиц (вспомним NA=6,022≅1023 моль–1), что в настоящее время напрямую
182
невозможно (даже для системы трёх взаимодействующих частей решение
УШ сложно).
Поэтому для решения УШ для ТТ используют различные приближения:
H€Ψ = EΨ ≡ ≡ [
1
e2
h2
h2
∆ i ) + ∑ (−
∆k ) + ∑ ∑
+
∑ (−
2
m
2
m
2
4
πε
r
i 4
k 4
i j
e4
я 4
ij
1
424
3
1
424
3 14
42404
3
Кинетическая
энергия электронов
Кинетическая
энергия ядер
Энергия
взаимодействия
электронов (i ≠ j )
r
r
r
r
r r r
r r r
+ Vz ( R1,..., RN ) + U (r1,...rn , R1,..., RN )]Ψ (r1,...rn , R1 ,..., RN ) =
14
4244
3 14442444
3
Энергия
взаимодействия
ядер
Энергия
взаимодействия
ядер
с
электронами
r
r r r
= ЕΨ (r1 ,...rn , R1 ,..., R N ) .
(15.16)
А. Так как масса ядер т я >> те и ядра в основном колеблются около
положения равновесия, а электроны движутся в основном поступательно, то
скорость V я << Vэл , что при малых смещениях ядер приводит к быстрому
перераспределению электронов. Отсюда можно утверждать, что изменение
энергий и волновых функций электронов происходит практически без
энергообмена с ядрами. Данное приближение называется адиабатическим
(приближение Борна–Оппенгеймера): электроны движутся в поле
практически фиксированных ядер, при этом координаты ядер входят как
параметры в выражения для Е и Ψ электронов (а не как переменные).
Самое грубое адиабатическое приближение – когда ядра неподвижны,
их кинетическая энергия равна нулю, т.е. электроны движутся в постоянном
периодическом поле ядер, при этом энергия взаимодействия ядер между
собой будет константой (V0 ). Соответствующим подбором нулевого уровня
можно добиться того, что V0 = 0 , тогда в уравнении (15.16) останутся только
первое, третье, и пятое слагаемые.
Б. Ещё одним приближением, упрощающим решение УШ для ТТ,
является приближение самосогласованного поля (Хартри–Фока): поле
всех электронов, определяющее движение каждого электрона, в свою
очередь, определяется и им. В данном приближении третье слагаемое в
уравнении (15.16) будет иметь вид суммы функций
r
(15.17)
∑Wi (r i ) .
i
Пятое слагаемое в уравнении (15.16) также можно упростить, представив
в виде суммы энергий взаимодействия каждого электрона с полем всех ядер,
являющимся для электронов определяющим (электроны же практически не
влияют на ядра):
183
r
∑U i ( r i ) .
(15.18)
i
Таким образом, УШ с учётом (15.17) и (15.18) можно переписать в виде:

h2
r
r 
(
−
∆
+
W
(
r
)
+
U
(
r
∑
i
i i
i i )  Ψ = EΨ
2
m
e
i

или в операторной форме
H€Ψ = ∑ H€i Ψ = EΨ
i
В квантовой механике (КМ) показывается, что если H€ = ∑ H i , то
i
Ψ = ∏ Ψi , а E = ∑ Ei , тогда, вводя обозначение для произведения
i
∏ Ψi ( j )
i
i
(все, кроме Ψ j ), можем записать
∏ Ψi (1) H€1Ψ1 + ... + ∏ Ψi (n) H€n Ψn = ( E1 + E2 + ... + En )∏ Ψi
i
i
При делении обеих частей на
i
∏ Ψi , получим
.
i
H€n Ψn
H€1Ψ1
+ ... +
= E1 + ... + En .
Ψ1
Ψn
Уравнение (15.19) представляет собой систему уравнений
(15.19)
H€1Ψ1
= Ei
Ψ1
или H€i Ψi = Eiϕ i для каждого электрона, H€i , Ψi , Ei зависят только от
состояния данного электрона и не зависят от состояния других электронов,
т.е. можно записать без индексов
2
h
r
H€Ψ = (−
∆ + V (r ))Ψ = EΨ .
2me
(15.20)
Трудности решения уравнения (15.20) заключается в определении вида
r
r
функции V (r ) . Используются различные приближения, т.к. вид V (r ) строго
не определяется ни теоретически, ни практически.
Данные приближения: метод псевдопотенциалов, метод плоских волн,
метод функции Грина и так далее, однако качественные результаты (без
r
ЭВМ) можно получить уже в приближении для функции V (r ) в уравнении
r
(15.20), называемом моделью Кронига – Пенни: функция V ( r )
представляет собой набор чередующихся потенциальных ям шириной а и
потенциальных барьеров шириной b и высотой V0 :
184
V
V0
Тогда в одномерном случае
движения электронов (вдоль оси Ох)
УШ будет иметь вид
0
h 2 d 2Ψ
−
+ V ( x)Ψ = EΨ . (15.21)
2m dx 2
a a+b
Рис. 15.2
x
0, n(a + b) < x < a + n(a + b),
V ( x) = 
V0 , a + n(a + b) < x < (n + 1)(a + b).
(15.22)
Ранее уже указывались требования, налагаемые на ВФ частиц. Однако
для электрона в кристалле необходимо учитывать ещё и пространственную
периодичность, т.е. учитывать особенности строения кристалла.
В каждом кристалле можно выделить малую область, содержащую все
особенности строения (симметрии) данного кристаллического вещества. При
перемещении на некоторое расстояние (индивидуальное для каждого
вещества) – трансляции – этой элементарной ячейки можно получить весь
кристалл целиком
(в идеале без дефектов).
r
Если RT – вектор трансляции, то свойства электрона должны быть
r
r
r
одинаковыми при его координате r и r + RT , т.е.
r 2
r r 2
Ψ (r ) = Ψ (r + RT ) .
Это возможно (так как потенциальная
энергия электрона в кристалле в
r
r r
силу периодичности U ( r ) = U ( r + RT ) ), если эти две функции отличаются
r
r
r
на постоянный множитель С, СΨ ( r ) = Ψ ( r + RT ) , причём C
условия нормировки).
Данным условиям удовлетворяют функции
вида
rr
r r
r
Ψ (r + RT ) = e ik RT Ψ (r )
r
r ikrrr
или Ψk ( r ) = ϕ k ( r )e .
2
= 1 (из
(15.23)
Функции (15.23) – функции Ф.Блоха (волны Блоха). Теорема Блоха:
ВФ электрона в кристалле представляет собой плоскую бегущую волну,
r
модулированную по амплитуде периодической функцией ϕ k (r ) , имеющей
период решётки.
Таким образом, решение (15.22) будем искать в виде функций Блоха
(15.23). Тогда
Ψ ( х) = ϕ ( х)e ikx ,
Ψ ′′( x) = (ϕ ′( x)e ikx + ϕ ( x)ike ikx ) / =
= ϕ ′′( x)eikx + ϕ ′( x)ikeik x + ϕ ′( x)ikeikx − k 2ϕ ( x)eikx .
Подставляя все это в (15.22) и деля обе части на e
185
ikx
, получаем
h2
−
(ϕ ′′ + 2ikxϕ ′ − k 2ϕ ) + V ( x)ϕ = Eϕ .
2m
При нахождении электрона в ПЯ (см. систему (15.21)):
ϕ ′′ + 2ikϕ ′ − (k 2 −
2mE
h
2
)ϕ = 0,
(15.24)
ϕ ′′ + 2ikϕ ′ − (k 2 − α 2 ) = 0,
α=
2mE
h
2
.
Если электрон находится в области барьеров (см. систему (15.21)):
ϕ ′′ + 2ikϕ ′ − (k 2 −
2mE
h2
+
2mV0
ϕ ′′ + 2ikϕ ′ − (k 2 + β 2 ) = 0,
β=
2mE
h2
h2
)ϕ = 0,
(15.25)
(V0 − E ) .
Для схожести с формулой (15.24) запишем (15.26) в виде
ϕ ′′ + 2ikϕ ′ − (k 2 − (iβ ) 2 )ϕ = 0 .
(15.26)
Решения для уравнений (15.24) и (15.26) соответственно будем искать в
виде
ϕ1 = Ae − i ( k +α ) x + Be − i ( k −α ) x ,
ϕ 2 = Сe − i ( k + iβ ) x + De − i ( k − iβ ) x .
(15.27)
(15.28)
Для определения констант А, В, С, D используем налагаемые на ВФ
условия её непрерывности и непрерывности её производных на границе
смежных областей (яма–барьер):
ϕ1 = ϕ 2

ϕ1′ = ϕ 2′
x = n(a + b),
при
x = a + n(a + b).
(15.29)
Подставив соотношения (15.27), (15.28) в (15.29), получаем систему из
четырёх линейных однородных уравнений относительно коэффициентов А,
В, С, D. Условием существования нетривиального решения системы является
равенство нулю детерминанта (определителя), составленного из
коэффициентов при искомых величинах А, В, С, D.
После преобразований получаем уравнение
β 2 −α 2
cos k (a + b) −
sh( βb) sin(αa) − ch( βb) cos(αa ) = 0 (15.30)
2αβ
186
e x − e− x
e x + e− x
( shx =
, chx =
).
2
2
Решая уравнение (15.30) с учётом α = f ( E ) , β = f ( E ) и
k = f (α , β ) = f ( E ) , можно получить представление об энергетическом
спектре электрона в кристалле. Прямое решение уравнения (15.30) вызывает
очень большие трудности, поэтому сделаем ряд упрощений, следуя Кронигу
и Пенни. Рассмотрим очень тонкие ( b → 0 ) и высокие (V0 → ∞ ) барьеры,
но при этом так, чтобы величина bV0 была конечной. Это означает, что
β 2 >> α 2 , (так как β 2 ~ V0 , а α 2 ~ E ) β ⋅ b 2 конечно, а β b → 0 .
При b → 0 chβb → 1, shβb → βb .
В математике при малых х известно, что
e x − e − x (1 + x) − (1 − x)
shx =
≈
= x,
2
2
chx =
x
e +e
2
−x
≈
(1 + x) + (1 − x)
= 1.
2
(15.31)
С учётом равенств (15.31) уравнение (15.30) примет вид
β 2 −α 2
βb sin(αa ) + cos(αa) = cos ka (при b → 0 )
2αβ
β
или
βb sin(αa) + cos(αa) = cos ka ,
2α
β 2 ab sin(αa)
или
(15.32)
+ cos(αa ) = cos(ka) .
2
α
a
123
Q
Далее обозначим
Q = lim
b→0
β →0
β 2 ab
2
.
Данный параметр определяет эффективную площадь каждого барьера, а
также степень его прозрачности для электрона, степень связанности
электрона в потенциальной яме.
1. При Q → 0 получаем приближение слабой связи, т.е. практически
cosαa = cos ka ,
свободный
электрон
и
из
формулы
(15.32)
ka = αa ⇒ k = α =
2mE
свободного электрона.
h2
h 2k 2
⇒ E (k ) =
, т.е. то же, что и для
2m
187
2. При Q → ∞ получаем приближение сильной связи или бесконечно
глубокой потенциальной ямы, для которой, как мы знаем,
E=
h 2π 2 n 2
2ma
2
.
(15.33)
Равенство (15.33) можно получить из (15.32) при условии sin αa = 0 ,
αa ≠ 0 , αa = πn , n = 1,2,... ,
2mE
h2
π 2n2
=
a2
,... (т.е. имеем дискретный спектр
значений энергии).
Приближение 2 соответствует электрону, находящемуся на глубоких
энергетических уровнях и поэтому слабо взаимодействующему с соседними
атомами.
Данное приближение не соответствует валентным, наиболее слабо
связанным с ядром электронам, которые будут взаимодействовать с
соседними атомами. Нужна более строгая (зонная) теория. Поэтому для
проведения качественного анализа необходимо наложить условие Q>>1
(должно быть большим, но конечным), но при этом αa должно слабо
отличаться от πn (см. равенство (15.29)), т.е. должно быть
αa = πn + ϕ , ϕ << πn .
(15.34)
Подставим приближение (15.34) в формулу (15.32) с учётом разложения
sin αa
в ряд Тэйлора, ограничиваясь первым линейным членом
αa
f ( x) = f ( x0 ) + f ′( x0 )( x − x0 ) :
x0 = πn, x = πn + ϕ ⇒ ∆x = ϕ ,
cos αa и
cosαa = cos(πn + ϕ ) = cos πn − sin πnϕ = (−1) n ,
(15.35)
= 04
6
47
8
sin αa sin(πn) sin πn cos(πn)πn − sin(πn)1
(−1) n ϕ
ϕ=
. (15.36)
=
=
+
2
αa
πn + ϕ 1π2n3
π
n
(πn)
=0
Подставляя разложения (15.35) и (15.36) в формулу (15.32), получим
Q(−1) n
Q
ϕ + (−1) n = cos ka x (−1) n , ⇒ ϕ + 1 = (−1) n cos ka
πn
πn
ϕ=
[(−1)
Q
πn
n
]
cos ka − 1 .
(15.37)
Ставим выражение (15.37) в приближение (15.34):
1 (−1) n cos ka
αa = πn + [(−1) cos ka − 1] = πn[1 − +
],
Q
Q
Q
πn
n
части в квадрат, имеем
188
возводя
обе
2 2
2 2
α a = π n [1 +
1
Q2
{
+
cos 2 ka
Q2
≈0
2 2(−1) n cos ka 2(−1) n cos ka
− +
−
]=
Q
Q
Q2
14
4244
3
≈0
2 2(−1) n cos ka
].
= π n [1 − +
Q
Q
2 2
(15.38)
С учётом α = 2mE / h из уравнения (15.38) получаем приближенное
выражение для энергии электрона в кристалле:
2
2
E=
h 2π 2 n 2
2 2(−1) n cos ka
[1 − +
]=
Q
Q
2ma 2
h 2π 2 n 2 h 2π 2 n 2 (−1) n h 2π 2 n 2 cos ka
=
−
+
=
ma 2Q
ma 2Q
2ma 2
= E(0n ) −
Cn
{
= 2 E n0 / Q
+ (−1) n Cn cos ka .
144244
3
=
(15.39)
( −1) n E n0 2 cos ka
Q
E0n – энергия электронов на n-м уровне изолированного атома; с
образованием кристалла энергия электронов понижается (см. формулу
(15.39)), что говорит о том, что образование кристалла энергетически
выгодно. Последнее слагаемое определяет пределы изменения энергии
электронов на n-ом уровне, т.е. определяет зонный характер энергетического
спектра электрона в кристалле, E=f(k).
Согласно более строгому рассмотрению в зонной теории, при
сближении атомов для образования кристаллической решётки происходит
расщепление дискретных уровней энергии электронов свободных атомов в
зоны разрешенных значений энергии, которые разделены зонами
запрещённых значений энергии. В пределах зон уровни разрешённых
значений энергии располагаются очень близко (разность энергий <0,1 эВ),
поэтому в пределах зоны энергетический спектр можно считать
квазинепрерывным.
Верхнюю (последнюю) из заполненных разрешённых зон называют
валентной зоной (ВЗ), а следующую за ней зону запрещённых значений
энергии – запрещенной зоной (ЗЗ), а следующую свободную разрешённую –
зоной проводимости (ЗП).
Наиболее сильно расщепляются в зоны энергетические уровни
валентных электронов свободных атомов (внешние электроны). Именно
валентные (внешние) электроны в ВЗ определяют электропроводность,
например, металлов, для которых не полностью заполненная ВЗ является и
зоной проводимости. При наложении даже слабого электрического поля на
кристалл электроны ВЗ могут ускоряться электрическим полем, приобретать
189
дополнительную скорость, т.е. кинетическую энергию, и переходят на более
высокие уровни энергии в ВЗ, которые в данном случае свободны.
Электроны ВЗ могут участвовать в электропроводности даже при
абсолютном нуле. К металлам (проводникам I рода) относятся вещества, у
которых ВЗ либо не полностью заполнена электронами (и является ЗП), либо
полностью заполнена, но перекрывается с ЗП, т.е. ширина ЗЗ Eg=0 (gap –
англ. скачок, разрыв).
Полупроводниками являются кристаллы, у которых при абсолютном
нуле температуры Т=0 К ВЗ полностью заполнена электронами, ЗП пуста, а
ширина ЗЗ Е g ≤ 3 эВ . Название «полупроводники» связано с тем
обстоятельством, что их удельная электропроводность при комнатных
температурах
имеет
промежуточные
значения
между
удельной
6
8
-1
электропроводностью металлов γ ~10 –10 Ом⋅м и диэлектриков γ ~10-10–
10-8 Ом⋅м-1. Характерной особенностью полупроводников является
экспоненциальное возрастание γ =f(T) от температуры:
−
Eg
γ = γ 0 e kT ,
в отличие от металлов, для которых γ уменьшается (удельное сопротивление
ρ = ρ 0 (1 + αt ) растёт линейно с ростом температуры, α = 1 273,15 град-1).
Полупроводники делят на прямозонные (центральные максимумы ЗП и
ВЗ друг против друга) и непрямозонные (максимумы смещены друг
относительно друга) в силу нелинейной зависимости изменения Ec (дно ЗП)
(рис. 15.3, а) и Ev (потолок ВЗ) (рис. 15.3, б).
Еc
Еv
ЗП
ЗЗ
ВЗ
ЗП
ЗЗ
Еd
Еv
а)
GaAs, GaSb, InP,
InSb, PbS, PbTe, др.
ВЗ
б)
Si, Ge, GaP, AlAs,
AlSb, AlP, SiC, др.
Рис. 15.3
Диэлектриками называются кристаллы, для которых выполняются
условия для полупроводников, но Е g ≤ 2 − 3 эВ . Электропроводность
диэлектриков возможна только при температурах, больших температуры их
плавления; в обычных условиях диэлектрики электрический ток не проводят.
Таким образом, различие между металлами и диэлектриками
качественное, а между полупроводниками и диэлектриками
количественное.
190
Лекция 16. Полупроводники, их свойства и применение
1. Собственная и примесная проводимость полупроводников. Эффект
Ганна.
2. Контактные явления в металлах и полупроводниках. ВАХ p–nперехода. Барьерная и диффузионная емкость p-n-перехода.
Диффузионные, частотные и импульсные свойства p–n-перехода и его
пробой. Полупроводниковые диоды, диоды Шоттки.
3. Люминесценция твердых тел. Оптические и фотоэлектрические
явления в полупроводниках. Фотоэлектрические и оптоэлектронные
приборы.
4. Эффект Зеебека, эффект Пельтье.
16.1. Собственная и примесная проводимость полупроводников. Эффект
Ганна
Собственные полупроводники (СПП) – полупроводники (ПП)
практически без примесей, содержащие примесей много меньше 1 %. В СПП
при температуре, стремящейся к абсолютному нулю, отсутствуют свободные
носители заряда. При повышении температуры электроны из ВЗ
приобретают достаточную для перехода через запрещенную зону (ЗЗ) в зону
проводимости (ЗП) энергию – в СПП появляются свободные носители
заряда: электроны в ЗП и дырки (положительные заряды при отсутствии
электрона) в валентной зоне (ВЗ). В СПП их обозначают соответственно ni и
pi. Например, в роли СПП могут выступать чистые кремний Si, германий Ge.
Данные элементарные ПП являются элементами четвёртой группы
периодической таблицы Д.И.Менделеева, т.е. имеют на внешнем уровне 4
электрона, образующие в кристаллической решётке заполненные
ковалентные связи.
При введении в СПП примесных атомов с большей на единицу (и
более) валентностью (мышьяк As (V), фосфор P (V)) четыре электрона этого
атома образуют ковалентные связи с четырьмя атомами кремния Si. Энергия
связи пятого электрона оказывается сравнительно с ними малой и уже при
температуре около 100 К такие электроны покидают примесные атомы –
примесь полностью ионизирована – и становятся электронами
проводимости. Так как концентрация электронов в данном случае больше,
чем дырок, то ток создаётся в основном электронами, проводимость
называется электронной, донорной или n-типа. Примесный атом – донор
– становится положительным ионом и перемещаться по решётке не может.
Концентрация электронов определяется концентрацией примесей, причём
зависимость эта существенно нелинейная.
С точки зрения зонной теории введение такой примеси искажает
поле решётки, что приводит к возникновению в ЗЗ донорного
энергетического уровня Ed вблизи дна ЗП Ec. Ed~0,01 эВ, что меньше, чем
тепловая энергия kT~0,025 эВ уже при комнатной температуре Tk=300 К (рис.
16.1). Электроны, образующиеся в результате переходов, называются
191
основными носителями и обозначаются nn, а дырки в ВЗ – неосновными –
pn; для ПП n-типа nn>pn (электронный ПП).
nn
Ес
Еd
Еv
Еg
pn
Рис. 16.1
Если в решётку кремния введём примесный атом с меньшей на
единицу (и более) валентностью (бор B (III)), то для образования четырёх
связей с соседними атомами привлекаются три собственных валентных
электрона и один, заимствованный у соседнего атома основного вещества,
где, собственно, образуется положительно заряженная вакансия – дырка.
Последовательность заполнения образующихся дырок электронами
эквивалентна движению дырок в ПП, т.е. дырки перемещаются в
кристаллической решётке как свободные положительные заряды.
Избыточный отрицательный заряд, возникающий вблизи атома примеси,
связан с атомом примеси и перемещаться не может.
Eс
Ea
Ev ⊕
nр
Eg
⊕
⊕
⊕ ⊕
pp
Рис. 16.2
Согласно зонной теории, введение в ПП такой примеси приводит к
возникновению в ЗЗ примесного акцепторного уровня Ea, вблизи потолка ВЗ
Ev, незанятого электронами (рис. 16.2). Близость акцепторного уровня
(уровней) к ВЗ (Ea~0,01 эВ) приводит к тому, что уже при низких
температурах электроны переходят на примесный уровень (уровни),
связываются с атомами примесей и перестают перемещаться по решётке.
Основными носителями являются дырки pp, их концентрация pp>np
неосновных носителей (электронов) в ПП p-типа (дырочном или
акцепторном ПП).
192
Эффект Дж.Ганна наблюдался в 1963 году для ПП с электронной
проводимостью GaAs и InP. Возникновение эффекта Дж.Ганна возможно
лишь в ПП, имеющих два минимума в зоне проводимости (ЗП) (см. рис.
16.3), эффективная масса m*1 и m*2 в которых существенно отличаются,
m*1<m*2, следовательно, подвижности носителей тока (электронов) µ1 > µ 2 .
Отметим, что в дальнейшем изложении под массой частиц в ТТ
*
(например, полупроводнике) следует понимать эффективную массу m . Так
как электрон в кристалле квазисвободен (лишь считается свободным), то
(
)
−1
m* = d 2 E / dp 2
(вспомним из
2
2
//
классической физики E = mv / 2 = p /( 2m) , E p = (2 p /(2m) ) p = 1 / m )
коэффициент
пропорциональности
хотя и имеет размерность массы, но отличается по значению от массы покоя
m0 действительно свободной частицы. Поэтому говорят об эффективной
массе электронов у дна ЗП и дырок у потолка ВЗ.
Ес µ
1
*
m1
Еg
µ2
m*2
∆Ес
Еv
m*1 < m*2 ⇒ µ1> µ2
Рис. 16.3
Электроны в центральном минимуме называются легкими, так как у них
эффективная масса меньше массы покоя m*1<m0, а в боковом минимуме –
тяжелыми, так как m*2>m0. Легкие электроны по сравнению с тяжелыми
имеют высокую подвижность µ1 > µ 2 .
При малой напряженности электрического поля (ЭП) Eэ=U/l, где U –
напряжение на ПП, l – длина данного ПП (важный параметр!), все электроны
находятся в центральном минимуме и плотность тока через ПП определяется
по известной формуле j1 = ne < v >= e ⋅ µ1 ⋅ n ⋅ Eэ (рис. 16.4). С ростом
напряженности ЭП при достижении ей порогового значения Епор у
электронов появляется энергия Е>∆Ес и они могут перейти в боковой
минимум с малой подвижностью. При значении напряженности ЭП Е0 все
электроны перейдут в боковой минимум и плотность тока уменьшится до
j2 = e ⋅ µ 2 ⋅ n ⋅ E0 .
На рис. 16.4 видно, что данная вольт-амперная характеристика (ВАХ)
напоминает латинскую букву N и потому называется ВАХ N-типа (есть еще
193
приборы с ВАХ S-типа). Все приборы с ВАХ N- и S-типа обладают участком
с отрицательным дифференциальным сопротивлением Rдиф = ∆U / ∆I < 0 ,
где с уменьшением напряжения наблюдается рост тока. Такие приборы могут
быть использованы в качестве усилителей переменного сигнала, например,
генератор Ганна, действие которого основано на эффекте Ганна.
j
µ1
j1
j2
µ2
Епор Е0
Еэ
Рис. 16.4
16.2. Контактные явления в металлах и полупроводниках. ВАХ p–nперехода. Пробой. Барьерная и диффузионная емкость p-n-перехода.
Частотные свойства p–n-перехода. Полупроводниковые диоды, диоды
Шоттки
При идеальном контакте двух ПП с различными типами проводимости
из-за градиента концентрации носителей заряда возникает их диффузия в
области с противоположным типом проводимости через плоскость
металлургического контакта (рисунок 16.5, а). В результате диффузии в nобласти образуются некомпенсированные ионизированные доноры, а в pобласти – некомпенсированные ионизированные акцепторы. Образуется об-
p
n
n
+
+
+
+
+
+
Е
δ
а)
-
p
б)
Рис. 16.5
ласть пространственного неподвижного заряда (рис. 16.5, б) с электрическим
полем, препятствующим дальнейшей диффузии носителей из области, где
они являются основными, в область, где они являются неосновными.
Возникает контактная разность потенциалов. В процессе диффузии зарядов в
приконтактной области идёт интенсивная рекомбинация носителей зарядов, в
194
результате чего эта область обедняется неподвижными носителями зарядов.
Обедненный слой толщиной δ является запирающим слоем. В условиях
термодинамического равновесия ток через p–n-переход не течёт, так как
существует потенциальный барьер для основных носителей заряда,
создаваемый полем области пространственного заряда вблизи
металлургической границы. При приложении внешнего напряжения в случае
прямого включения (рис. 16.6, а) электроны в n-области и дырки в p-области
движутся к металлургической границе, ширина области пространственного
заряда δ 0 уменьшается ( δ ) и через p–n-переход начинает течь
электрический ток в результате инжекции (носители тока nn в p-область,
становятся np, а pp – в n-область, становятся pn). Возможный обратный
процесс называется экстракцией, имеет место для неосновных носителей в
области пространственного заряда, для которых её поле является
ускоряющим. Чем больше приложено прямое напряжение Uпр, тем меньше
энергетический барьер для носителей заряда. Величина Uпр ограничена
возможностью разрушения перехода (разогрев и различного вида пробои
перехода).
При приложении обратного напряжения (рис. 16.6, б) создаётся обратная
ситуация: δ растёт, высота потенциального барьера растёт с ростом
обратного напряжения (ограничение – возможность пробоя и разрушение
перехода). P-n-переход при обратном смещении ток не проводит, но, тем не
менее, как вы уже знаете, возможен малый туннельный ток. В электронике
кроме изоляции оксидными пленками применяют и изоляцию с помощью
обратносмещенных p-n-переходов.
δ0
-
n
+
+
+
+
+
+
-
δ0
p
+ +
δ
n
-
+
+
+
+
+
+
p
-
δ
а)
б)
Рис. 16.6
P–n-переходы подразделяются на гомопереходы (один и тот же
материал, но различных типов n- и p-) и гетеропереходы (разные
полупроводники). Переходы делятся на анизотипные (p- и n-типа) и
изотипные (n1-тип и n2-тип или p1-тип и p2-тип). По характеру сопряжения
двух частей перехода на металлургической границе различают резкий
(вплавление) и плавный (диффузия) переходы, упругонапряжённый или
сопряжённый (согласованный) по периоду решётки (при жидкофазной
эпитаксии). Обычно в обозначении электронно-дырочного перехода большой
буквой обозначают полупроводник с большей шириной запрещённой зоны в
195
данной паре, например, N–p, P–n, N–AlxGa1-xAs–p–GaAs (х – мольная доля
соединения AlAs в твёрдом полупроводниковом растворе AlxGa1-xAs).
Вольт-амперная характеристика (ВАХ) гомо р–n-перехода представлена
на рис. 16.7. Сплошной линией нарисована ВАХ идеального перехода, на
которой соответствующие участки для реального перехода должны быть
заменены на пуктирные. При прямом включении это обусловлено
рекомбинацией электронов и дырок в области перехода при инжекции, а при
обратном включении обусловлено генерацией носителей в областях,
примыкающих к области пространственного заряда (вблизи перехода).
Генерация носителей происходит под действием запирающего ЭП при
обратном включении, это ЭП является ускоряющим для неосновных
носителей. Вертикальный участок при больших обратных напряжениях –
участок пробоя. Пробой может возникать при больших значениях обратного
напряжения, вызывающего большое ускорение носителей тока и генерацию
ими новых носителей при столкновениях с решеткой вплоть до образования
лавины. При обратном включении возможен также и туннельный пробой.
Лавинный и туннельный пробои обратимы, не вызывают разрушения
перехода, но вследствие возникающего разогрева может возникнуть
тепловой пробой. Тепловой пробой является необратимым и вызывает
разрушение перехода, поломку приборов. Ряд ПП приборов работают в
режиме пробоя, например, стабилитроны обеспечивают рост тока при
практически постоянном напряжении. Следует отметить особо, что токи в
прямом и обратном направлении по величине могут отличаться в тысячу раз
и более (мА и мкмА), прямые напряжения обычно ~ В, а обратные ~ В или
десятков В.
I пр
Uобр
Iобр
I пр Т2 Т1
0 Uпр Uобр
Т1
Рис. 16.7
0 Uпр
Т2 Iобр
Рис. 16.8
Т2 >Т1
I пр Eg1 Eg2
Uобр
Eg2
Eg1 I
обр
0 Uпр
Eg2 >Eg1
Рис. 16.9
На рис. 16.8 представлена зависимость ВАХ гомо р–n-перехода от
температуры Т. С ростом температуры увеличивается энергия носителей
заряда и, следовательно, значение напряжения для достижения того же
значения тока будет меньше при большей температуре.
На рис. 16.9 представлена зависимость ВАХ гомо р–n-перехода от
ширины запрещенной зоны (ЗЗ) ПП Еg. Чем больше ширина ЗЗ, тем большее
напряжение необходимо прикладывать к переходу, чтобы сообщить
необходимую энергию носителям тока (электронам и дыркам) для их участия
в процессах электропроводности.
196
Если внимательно посмотреть на рис. 16.5, б, то можно по-другому
взглянуть на область пространственного заряда, а именно как на конденсатор
с двумя противоположно заряженными пластинами. Любой конденсатор, как
мы уже знаем, характеризуется определенной емкостью. Емкость области
пространственного заряда называется барьерной емкостью. Известно, что
для плоского конденсатора С = εε 0 S / δ . При прямом включении (рис. 16.6,
а) ширина запирающего слоя δ уменьшается при диффузии основных
носителей тока к металлургической границе, емкость перехода растет, при
этом говорят о диффузионной емкости. Наличие у перехода емкости
существенно влияет на его частотные свойства, т.е. на быстроту и качество
переключения из прямого состояния (проводящего) в обратное состояние
(запирающее, практически не проводящее). При небольшой частоте смены
полярности напряжений (прямое–обратное, рис. 16.10, а) все носители тока
успевают выйти из области перехода, примыкающей к металлургической
границе и сопротивление перехода восстанавливается до запирающего, т.е. в
состоянии обратного включения переход ток не проводит (рис. 16.10, б).
Uген
Uдиод
Uген
Uген
Uнагр0
0
t, c Uнагр
R Uнагр
0
а)
б)
t, c
t, c
0
в)
t, c
Рис. 16.10
При увеличении же частоты до некоторого критического значения
носители не успевают выйти из области перехода, сопротивление из-за
большой концентрации носителей в области перехода мало и практически не
меняется (при смене полярности напряжения носители тока дергаются на
одном месте туда–сюда). При высоких близких к критической частотах
переход теряет свои запирающие свойства (свойство односторонней
проводимости) и проводит ток в обе стороны практически без изменения его
величины (рис. 16.10, в). Это связано с затратами времени на перезарядку
существующей емкости р–n-перехода, барьерной и диффузионной. При этом
имеет значение величина концентрации неосновных носителей заряда,
влияющая и на величину обратного тока. По сравнению с контактом двух
полупроводников с различным типом проводимости концентрацию
неосновных носителей (дырок, например) можно значительно уменьшить,
используя контакт металл–полупроводник n-типа (электронный). Такой
контакт будет характеризоваться сравнительно небольшим значением
концентрации неосновных носителей и значительно меньшим временем
переключения из прямого смещения в обратное (и, наоборот) с сохранением
запирающих свойств. Можно говорить о значительном улучшении частотных
свойств, возможности работы (сохранения выпрямления, односторонней
197
проводимости) при гораздо больших по сравнению с р–n-переходом
частотах, но и больших значениях обратного тока. Полупроводниковые р–nпереходы – основа полупроводниковых диодов, переходы металл–
полупроводник – основа диодов Шоттки. Не всякий контакт металл–ПП
является выпрямляющим, одностронне проводящим, только лишь те, для
которых выполняется определенное соотношение работ выхода. Работой
выхода называется энергия, которую необходимо затратить для выхода
электрона из вещества в вакуум. Для ПП n-типа и металла соотношение
должно быть Ам>Аn, а для ПП р-типа и металла соотношение должно быть
Ам<Ар. При обратных соотношениях контакты не будут выпрямляющими.
Рассмотрим зонные диаграммы (энергетическую зонную структуру) p-nперехода. На рис. 16.11, а изображены зонные диаграммы для n- и p-ПП,
(сравните с рис. 16.1 и 16.2). На рис. 16.11, б изображено совмещение зонных
структур с рис. 16.11, а с выравниванием уровней Ферми. Напомним, что при
контакте двух ПП с различным типом проводимости переход носителей
будет происходить до наступления равновесия – до выравнивания энергии
носителей в общей системе n-ПП–p-ПП или, как говорят, до выравнивания
уровней Ферми в обоих ПП. Рис. 16.11 отражает энергетическую зонную
структуру для рис. 16.5, б. Наличие запирающего ЭП на рис. 16.5, б на рис.
16.11, б обозначается через существующий для носителей потенциальный
барьер (ПБ) qϕ k . Величина этого ПБ уменьшается для основных носителей
при прямом включении (рис. 16.12, а) и растет при обратном включении
(рис.16.12, б).
Eс
Ес
Еd
n-тип
Еv
ЕF
Еg
ЕF
а)
p-тип
p-тип
qϕk
Ес
Eс ЕF
Еd n-тип
Ea
Ev
Еv
ЕF
Ес
Еd
Еv
qϕk
n-тип
б)
qϕk
Еd
n-тип
Еv
а)
Eс
Ес
ЕF ЕF
Ev
ЕF
Ev
Рис. 16.11
Eс
p-тип Ea
Ea
p-тип Ea
ЕF
Ev
б)
Рис. 16.12
Рис. 16.12, а – энергетическая зонная диаграмма для случая на рис. 16.6,
а, а рис. 16.12, б – для случая на рис. 16.6, б.
198
уровень вакуума
0
An
Ес
ЕF
Еd
Еg
n-тип
Еv
а)
0
уровень вакуума
Aм
металл
Еv = ЕFм
уровень вакуума
0
Еg
б)
Ес
ЕF
Еd
An qϕk
qϕб
металл
0
Aм
Еv = ЕFм
n-тип
Еv
Рис. 16.13
Рассмотрим контакт металл–ПП n-типа (электронный) при Ам>Аn. Так
как концентрация электронов в металле порядка 10–25 м3 против 10–18–10–19 м3
в ПП n-типа, то электроны будут переходить из ПП в металл с образованием
в ПП слоя положительного заряда, а в металле – отрицательного, причем
толщина контактного слоя в металле из-за большей концентрации электронов
будет примерно в 104 раз больше, чем в ПП. Переход носителей будет
происходить до наступления равновесия – до выравнивания энергии
носителей в общей системе металл–ПП или, как говорят, до выравнивания
уровней Ферми в металле и ПП. На рис. 16.13, а изображены зонные
диаграммы для n-ПП и металла при необходимом для создания
выпрямляющего перехода соотношении работ выхода Ам>Аn. На рис. 16.13, б
изображено совмещение данных зонных структур с выравниванием уровней
Ферми. На зонной диаграмме видно наличие двух различных ПБ: для
электронов при переходе из ПП в металл qϕ k , а для носителей при переходе
из металла в ПП – qϕ б . Величины этих ПБ изменяются при приложении
прямого («+» – к металлу, «–» – к ПП) и обратного напряжения аналогично
случаям на рис. 16.12, а и б.
По аналогии может быть построена энергетическая зонная диаграмма
для контакта металл–р-ПП при соответствующем соотношении работ выхода
Ам<Ар.
Следует особо отметить, что, говоря о зонах и зонных диаграммах, мы
имеем в виду не какие-то реально существующие в кристаллах (или
переходах) зоны энергии. Данное рассмотрение – математическая модель
расчета и представления энергетического спектра носителей в кристаллах
(ПП и металлах), т.е. энергии носителей. Например, при значениях энергии
электронов ~Ec (даже ~EF) они могут активно участвовать в процессах
электропроводности.
199
При увеличении числа полупроводниковых p-n-переходов до трех и
добавлении третьего электрода получается полупроводниковый триод или
транзистор. Первый транзистор на германии был получен в США в 1948 году
группой ученых (У.Шокли, У.Браттейн, Дж.Бардин), за свои работы в данной
области они были удостоены Нобелевской премии в 1956 году. С
изобретением полупроводниковых диода и триода (транзистора),
заменяющих рассмотренные ранее (лекция 6, ч. II данного пособия)
громоздкие вакуумные (ламповые) приборы, началось бурное развитие
микроэлектроники, что в настоящее время продолжается в виде развития
наноэлектроники. Одним из серьезных недостатков p-n-переходов в
полупроводниковых кристаллах является низкая температурная и
влагоустойчивость, требующая специальной защиты в аппаратуре. В
последние годы в связи с необходимостью разработки электронной
аппаратуры, способной работать при высоких температурах и резких ее
перепадах, например, в условиях Венеры, получила вторую жизнь вакуумная
микроэлектроника, в которой эмиссия электронов с поверхности тел и
электрические токи в вакууме играют решающую роль.
16.3. Люминесценция твердых тел. Оптические и фотоэлектрические
явления в полупроводниках
Оптоэлектроника – область науки и техники, исследующая и
применяющая процессы взаимодействия оптического излучения с веществом
для передачи, приёма, переработки, хранения и отображения информации.
Оптическое излучение – электромагнитное излучение оптического
диапазона. Условно выделяемый диапазон от 1 мм до 1 нм. Внутри
оптического диапазона выделяют видимое (0,38–0,78 мкм), инфракрасное
(0,78–1000 мкм) и ультрафиолетовое (0,001–0,38 мкм) излучения. В видимом
оптическом диапазоне по принципу «Каждый охотник желает знать, где
сидит фазан» выделяют излучение: красное (620–780 нм), оранжевое (585–
620 нм), жёлтое (550–585 нм), зелёное (510–550 нм), голубое (480–510 нм),
синее (450–480 нм), фиолетовое (380–450 нм). Зелёный свет соответствует
максимуму чувствительности человеческого глаза. В ультрафиолетовом
диапазоне выделяют УФ-ближнее излучение (315–380 нм), УФ-среднее
(280–315 нм) и УФ-дальнее (1–280 нм), в инфракрасном (ИК) диапазоне:
ИК-ближнее (780 нм–1,5 мкм), ИК-среднее (1,5–20 мкм) и ИК-дальнее (20
мкм–1 мм).
Оптоэлектронные приборы можно подразделить на 3 группы:
1)
приборы, преобразующие электрическую энергию в оптическое
излучение (светодиоды, полупроводниковые лазеры – так называемая
электролюминесценция);
2)
приборы, детектирующие оптические сигналы за счёт
протекающих под действием света электронных процессов (фотодетекторы);
200
3)
приборы,
осуществляющие
преобразование
оптического
излучения в электрическую энергию (фотовольтаические приборы,
солнечные батареи).
Люминесценцией называется оптическое излучение (ИК, видимое,
УФ), возникающее в результате электронного возбуждения материала, в
отличие от теплового излучения, обусловленного только тепловым нагревом
материала. В зависимости от источника энергии возбуждения
люминесценцию можно разделить на:
7)
фотолюминесценцию (возбуждение оптическим излучением);
8)
катодолюминесценцию (возбуждение под действием пучка
электронов или катодных лучей);
9)
радиационную
люминесценцию
(возбуждение
другими
быстрыми частицами или излучением высокой энергии);
10)
электролюминесценцию (возбуждение электрическим полем
или током);
11)
хемолюминесценцию (при химических превращениях);
12)
триболюминесценцию (при растяжении и раскалывании
некоторых кристаллов, например сахара) и так далее.
В случае оптоэлектронных приборов первой группы рассматривают
электролюминесценцию
и,
прежде
всего,
инжекционную
электролюминесценцию, которая представляет собой оптическое
излучение, возникающее при инжекции основных носителей в область
полупроводникового p–n-перехода, где имеются излучательные переходы
(при рекомбинации пары электрон–дырка).
На рис. 16.14 схематично представлены основные переходы в
полупроводнике, из которых не все могут быть излучательными.
Группа 1 – междузонные переходы: а) собственное излучение с
энергией, очень близкой к ширине ЗЗ E g , которое может сопровождаться
возбуждением фотонов и экситонов; б) излучение с более высокой энергией с
участием так называемых энергичных или «горячих» носителей, которое
иногда может быть связано с лавинным пробоем. Эти же переходы могут
идти в обратном порядке с поглощением фотона, тогда группа 1 –
фундаментальное поглощение.
Группа 2 – переходы с участием химических примесей и физических
дефектов: в) между ЗП и акцепторным уровнем Ea; г) между донорным Ed и
акцепторным Ea уровнями (междузонное излучение); д) между донорным
уровнем Ed и ВЗ; е) через глубокие уровни, которые образуют ряд
химических примесей, акцепторных или донорных (как правило, с
валентностью, отличающейся от валентности основного полупроводника
больше, чем на единицу), либо физические дефекты кристаллической
решётки.
201
ж)
Зона проводимости
Ес
Е1
Еd
а) б) б) в) г) д)
Еg
е)
Еа
Еv
Валентная зона ж)
1
2
3
Рис. 16.14
Группа 3 – внутренние переходы (ж), которые вызывают излучение,
называемое иногда тормозным, которые протекают с участием «горячих»
носителей.
Не все переходы могут возникать в одном и том же материале или
при одних и тех же условиях и не все из них могут являться
излучательными. Эффективным сточки зрения люминесценции является
такой материал, в котором излучательные переходы преобладают над
безизлучательными в прямозонных и непрямозонных полупроводниках.
В силу зонной структуры люминесцентное излучение характеризуется
сравнительно узким спектром (иногда линией), в отличие от теплового
излучения, которое характеризуется сплошным спектром излучения.
Существуют три типа взаимодействия между фотонами и электронами в
ТТ:
1) фотон может поглощаться в результате перехода электрона из
заполненного состояния ВЗ или донорного уровня в свободное
состояние ЗП (участвует в фототоке);
Ес
hν
hν
hν
⇒
⇒...
Еv
Рис. 16.15
2) фотон может стимулировать излучение абсолютно идентичного себе
фотона (одинаковые частота, поляризация, фаза), вызывая переход электрона
202
из заполненного состояния в ЗП или донорного уровня на свободные
состояния в ВЗ (рис. 16.15). Данный тип взаимодействия лежит в основе
принципа действия всех, в том числе полупроводниковых, лазеров;
3) спонтанные обратные переходы электронов из ЗП на свободные
состояния в ВЗ, вызывающие испускание фотонов.
Для получения лавины идентичных фотонов (усиления излучения)
необходимо, чтобы большая часть носителей одновременно пребывала в
возбуждённом состоянии (на высоких энергетических уровнях) – так
называемая инверсная населённость среды. Создаётся инверсная
населённость либо вспышкой (газоразрядной лампы), либо уровнем
плотности тока j = I S ( S – площадь поперечного сечения в многослойной
лазерной гетероструктуре (на основе гетеропереходов), что определяет
уровень инжекции и далее – рекомбинации носителей в заданных активных
областях.
В любом случае для создания инверсной населённости требуется
система накачки, т.к. любая система всегда стремится к минимуму энергии.
Расчёты показывают, что самопроизвольно высокая плотность занятых
состояний с большей энергией достигалась бы при термодинамической
температуре меньше нуля К, чего реально быть не может. Так в физику
вошло понятие «отрицательной термодинамической температуры».
16.4. Эффект Зеебека, эффект Пельтье
При наличии разности температур Т1>Т2 вследствие диффузии носителей
от горячего спая к холодному в цепи с термоэлементом (рис. 16.16) создается
термоЭДС (эффект (1821 г.) Зеебека (1770–1831))
(16.1)
Т = α∆T ,
где α – коэффициент пропорциональности, коэффициент термоЭДС,
зависящий от химической природы материала и температуры.
ε
T1
T1
n
p
T2
εT
T1 >T2
Рис. 16.16
203
T2
Рассмотрим принцип работы термоэлектрического холодильника (рис.
16.17) на основе эффекта (1834 г.) Ж.Ш.Пельтье (1785–1845).
T1
Q1
n
Q2
T1
p
I
T2
T2
Q2
T1 >Tокр > T2
Рис. 16.17
Вследствие рекомбинации носителей на верхнем спае выделяется
теплота Пельтье Q1, при этом температура спая Т1 больше температуры
окружающей среды Токр. И наоборот, для генерации носителей на нижнем
спае от решетки забирается энергия, в результате поглощается теплота
Пельтье Q2 и Т2<Токр. Теплота Пельтье
Q = ± ПIt ,
(16.2)
где П = αТ – коэффициент Пельтье, α – коэффициент термоЭДС, I – ток, t
– время.
Естественно, что для обеспечения охлаждения даже небольшого объема
необходимо множество термоэлементов (рис. 16.17). Достоинствами
холодильников на ПП являются малая энергоемкость (выделяется больше
тепла, чем затрачено энергии), бесшумность, а недостатками – малые объемы
охлаждения, невозможность создания очень низких температур.
204
Лекция 17. Оптические свойства вещества
1. Отрицательное поглощение света и оптические квантовые
генераторы или лазеры (LASER – Light Amplification by Stimulated
Emission of Radiation). Виды лазеров: газовые, жидкостные,
твердотельные (рубиновые, полупроводниковые, т.д.).
2. Жидкие кристаллы и их свойства.
17.1. Отрицательное поглощение света и оптические квантовые
генераторы или лазеры (LASER – Light Amplification by Stimulated
Emission of Radiation). Виды лазеров: газовые, жидкостные,
твердотельные (рубиновые, полупроводниковые, т.д.)
(перед изучением данного материала необходимо ознакомиться с
материалом предыдущей лекции)
При прохождении света через любую среду обычно наблюдается
ослабление его интенсивности согласно закону Бугера–Ламберта (6.1).
Однако возможен и обратный процесс – усиление света при отрицательном
коэффициенте поглощения в законе (6.1), тогда говорят об отрицательном
поглощении света веществом. Почему это возможно?
Вспомним, что усиление и ослабление света при наложении от двух
источников возможно только, если эти источники когерентны, т.е. если их
излучение
характеризуется
одинаковыми
частотой,
поляризацией,
направлением распространения и постоянной во времени и пространстве
разностью фаз. Обычные источники света в привычных нам средах
(устройствах) излучают некогерентно (несогласованно). Например,
газоразрядная лампа дневного света, в которой атомы излучают свет по
принципу «кто и когда захочет». При этом даже переходы электронов в
атомах могут происходить между различными уровнями, тогда согласно
постулату Бора будут различаться еще энергия и частота. Напрашивается
вывод: усиление света будет происходить, если заставить возбужденные
электроны в атомах одновременно переходить между одними и теми же
энергетическими уровнями (индуцировать одновременные переходы) – такое
излучение будет индуцированным и когерентным. Отсюда и пошло
название устройства, в котором осуществляется такой процесс: LASER –
Light Amplification by Stimulated Emission of Radiation – усиление света
посредством индуцированного излучения. Отечественным аналогом
данного иностранного названия является оптический квантовый генератор
(ОКГ).
Идея использования индуцированного излучения для усиления
излучения была впервые высказана советским физиком В.А.Фабрикантом
(1907 г.р.) в его докторской диссертации. Впоследствии в 1951 году на эту
идею было выдано авторское свидетельство.
Эйнштейн предположил, что кроме двух типов взаимодействия фотона с
электроном (излучение фотона при переходе возбужденного электрона на
более низкий энергетический уровень и поглощение при возбуждении
205
электрона, при его переходе на более высокий энергетический уровень)
возможен и третий тип (рис. 16.15). В этом случае при взаимодействии
(столкновении) фотона с возбужденным электроном электрон переходит на
более низкий энергетический уровень с испусканием фотона полностью
идентичного падающему (одинаковые частота, фаза, поляризация). В
результате далее следуют уже два идентичных фотона. Для получения
лавины идентичных фотонов (усиления излучения) необходимо, чтобы
большая часть носителей одновременно пребывала в возбуждённом
состоянии (на высоких энергетических уровнях) – так называемая инверсная
населённость среды. Среда, в которой возможно создание инверсной
населенности, называется активной средой. У атомов такой среды должны
существовать несколько энергетических уровней, при этом в идеале
излучательные переходы электронов должны осуществляться с подавляющей
вероятностью только между двумя из них, все остальные переходы должны
быть безызлучательными. Учитывается также, что время жизни
(нахождения) электрона в каждом из возбужденных состояний различно, что
предоставляет возможность накопления электронов в одном из
метастабильных состояний (т.е. в состоянии с достаточно большим
временем жизни, в идеале в состоянии именно перед излучательным
переходом). Создаётся инверсная населённость внешним источником
энергии – системой накачки. В зависимости от количества используемых
(рабочих) уровней в атомах вещества среды накачка может быть
моногуровневой (трех-, четырехуровневой – см. далее). Конкретный вид
активной среды и системы накачки зависит от типа лазера. В любом случае
для создания инверсной населённости требуется накачка энергии, т.к. любая
система всегда стремится к минимуму энергии. Расчёты показывают, что
самопроизвольно высокая плотность занятых состояний с большей энергией
достигалась бы при термодинамической температуре Т<0 К, что не имеет
смысла (по определению термодинамической шкалы Т=0 К – температура,
при которой прекращается всякое движение). Так в физику вошло понятие
«отрицательной термодинамической температуры».
В зависимости от типа используемой активной среды лазеры
подразделяются на
- твердотельные: рубиновые А12О3–Сг3+ (1960г.), на неодимовом стекле
(силикатное стекло с примесью ионов Nd3+, концентрация Nd3+ в стёклах
может доходить до 6% по массе), на флюорите кальция CaF2 с примесью
редкоземельных элементов, таких как диспрозий Dy, самарий Sm и др.,
полупроводниковые (на GaAs (1962г.), GaSb, например);
- газовые: гелий–неоновый (1960г.);
- жидкостные: растворы неодима в неорганических жидкости SeOCl2 и
растворы органических красителей (1966г.).
К 1973 году было известно примерно 200 различных лазерных
материалов, охватывающих вещества во всех агрегатных состояниях:
твёрдом, жидком, газообразном и в состоянии плазмы. В настоящее время
206
всевозможные лазерные материалы перекрывают диапазон длин волн от
менее 1 см до 3,3 мкм.
Впервые ОКГ с частотой 24 ГГц были созданы в 1954 году русскими
физиками А.М.Прохоровым (1916 г.р.) и Н.Г.Басовым (1922 г.р.) на активной
среде из аммиака (практически одновременно с американским физиком
Ч.Таундсеном). Данный аппарат правильнее называть мазером из-за рабочей
длины волны не из оптического, а из радиодиапазона: Microwave
Amplification by Stimulated Emission of Radiaton (MASER), что означает:
усиление микроволн с помощью индуцированного излучения. Первый лазер
именно в оптическом диапазоне был создан на рубине в 1961 году
американским физиком Мейманом (1927 г.р.). В конце 1960 года
американские физики Джаван (1926г.р.), Беннет (1903г.р.) и Эрриот
сообщили о создании инверсной населенности и получении лазерного
излучения на газовой смеси гелий–неон. Лазеры по продолжительности
излучения подразделяются либо на импульсные, либо на лазеры
непрерывной генерации. При генерации лазерного излучения среда сильно
разогревалась, поэтому все лазеры поначалу имели мощную систему
охлаждения, они не могли работать продолжительное время, т.е. в режиме
продолжительной непрерывной генерации. Например, неохлаждаемый
рубиновый лазер перестает генерировать излучение при нагреве до
температуры Т>1000 К. Долгое время создать твердотельные лазеры с
непрерывным режимом генерации излучения без принудительного
охлаждения при комнатной температуре не удавалось. Непрерывный
режим лазерной генерации у полупроводникового лазера на GaAs при
комнатной температуре был впервые получен группой русских физиков
под руководством Ж.И.Алферова в 1962 году. За разработку в области
получения и исследования полупроводниковых многокомпонентных твердых
растворов и структур на их основе (гетероструктур – сопряженных на уровне
кристаллической решетки слоев из различных твердых растворов) наш
соотечественник Ж.И.Алферов (1930 г.р.) был удостоен Нобелевской премии
2000 г. Данная премия явилась признанием значимости работы ученого за
почти сорок лет.
Рассмотрим виды лазеров и особенности их активных сред и систем
накачки на ряде примеров.
В первом импульсном рубиновом лазере активной средой служил
кристалл розового рубина (корунд) Al2O3 с примесью 0,05% оксида хрома
Cr2O3. Для достижения инверсной населенности использовались
энергетические уровни ионов хрома Cr3+, по некоторым оценкам,
концентрация ионов в первом лазере составляла 1,62⋅1019 см–3. Корунд
представляет собой диэлектрик с большой шириной запрещенной зоны, в
которой и создает дополнительные уровни примесь хрома. Для ионов хрома
характерна
так
называемая
трехуровневая
схема
расположения
энергетических состояний (рис. 17.1).
207
3
2
1
hv
λ=694,3 нм
hv
hv
Рис. 17.1
Непрозрачное
зеркало
Полупрозрачное
зеркало (на выходе)
Питание
лампы
Рубин
Рис. 17.2
Система накачки представляла собой мощную импульсную
газоразрядную ксеноновую лампу, обвитую вокруг рубинового кристалла
(рис. 17.2). Под действием УФ-излучения лампы ионы хрома возбуждаются с
определенной вероятностью и переходят на систему близкорасположенных
уровней 3 и 2 (рис. 17.1). Далее с определенной вероятностью для каждого
перехода ионы могут перейти на уровень 1 или безызлучательно с уровней 3
на уровни 2 (энергия при этом выделяется все равно, но идет не на
излучение, а на нагрев кристалла). Состояние 2 является метастабильным,
так как время жизни в этом состоянии много больше времени жизни в
состоянии 3 (~2≅10–3 с против ~10–8 с). При переходе с узких уровней 2 на
уровень 1 излучается красный свет (потому ионы хрома ответственны за
розовую или красную окраску корунда в зависимости от их концентрации) с
длинами волн λ1 =694,3 нм и λ2 =692,9 нм. Для работы используют более
интенсивную линию λ1 =694,3 нм.
Вообще рассматривая спектр лазерного излучения, можно выявить
много линий (или частот, мод лазера). В идеале стараются добиться
излучения лазера с единственной линией в спектре (одной частотой) или
одномодового режима генерации. Практически это почти нереализуемо, так
как в силу соотношения неопределенностей Гейзенберга–Бора любой
энергетический уровень в атоме характеризуется некоторой конечной
шириной (или малым интервалом частот).
Обратная связь в лазере осуществляется резонатором и представляет
собой в простейшем случае следующее воздействие с «выхода» на «вход»:
208
часть лавины фотонов, испускаемых при одновременном переходе в
инверсной среде, возвращаясь в среду, вызывает образование новой лавины
фотонов для последующего импульса излучения лазера. Для обеспечения
обратной связи в первом рубиновом лазере применялся оптический
резонатор Фабри–Перо (рис. 17.2). Он состоял из двух зеркал, наносимых на
торцы кристалла рубина, одно из зеркал непрозрачное, другое (на выходе)
полупрозрачное. Часть хаотично направленных фотонов выходит через
полупрозрачное зеркало (полезное излучение), часть – через боковые грани
кристалла рубина (потери), а часть, отражаясь от непрозрачного зеркала, при
последующей вспышке ксеноновой лампы идет обратно, вызывая новую
лавину фотонов при одновременных излучательных переходах. Следует
особо напомнить, что длина резонатора (и самого рубинового кристалла)
должна отвечать для данной излучаемой длины волны света условию
пространственной и временной когерентности.
В поздних конструкциях лазеров использовались более сложные и
совершенные системы накачки и резонаторы.
При наиболее распространенном для рубинового лазера импульсном
режиме генерации лазерный импульс имеет сложную структуру: при
длительности ~10–3 с он состоит из коротких импульсов ~10–6 с,
происходящих через промежутки времени ~3≅10–6–10–5 с.
Спектры излучения и поглощения газов – линейчатые, линии излучения
более узки по сравнению с линиями примесей в твердых телах, поэтому в
газовом лазере можно получить большую монохроматичность, чем в
твердотельном. При этом из-за малой плотности газов в них нельзя получить
большие концентрации возбужденных атомов, поэтому мощность газовых
лазеров меньше рубиновых.
Газовый гелий–неоновый лазер с импульсным и непрерывным
режимом генерации (рис. 17.3) имеет в смеси гелий с парциальным
давлением 130 Па (1 мм.рт.ст) и неон с парциальным давлением 13 Па (0,1
мм.рт.ст). Лазер состоит из стеклянной газоразрядной трубки со смесью
газов, концы (торцы) которой закрыты плоскопараллельными пластинами Пл
из кварца или стекла, установленными под углом Брюстера к ее оси. Это
создает линейную поляризацию излучения с электрическим вектором,
параллельным плоскости падения и позволяет исключить отражение
поляризованного излучения лазера на торцах трубки. Зеркала З1 и З2
резонатора обычно сферические с многослойными диэлектрическими
покрытиями для увеличения коэффициента отражения. Одно из зеркал имеет
большую пропускную способность, чем второе (около 2% против 1%).
Между катодом К и анодом А прикладывается постоянное напряжение ~1–2
кВ. Лазер может генерировать видимый красный свет с длиной волны 632,8
нм и инфракрасное (ИК) излучение с длинами волн 1150 и 3390 нм. В
последнем случае торцы и зеркала лазера должны иметь большие
коэффициенты отражения в ИК-области.
На рис. 17.4 приведена упрощенная схема уровней гелия He и неона Ne.
209
Возбуждение газов происходит в результате столкновений их атомов с
электронами газоразрядной плазмы. При некотором режиме разряда
возникает инверсная заселенность уровней 1 и 2 неона. Заселенность уровней
1 и 3, 3 и 4 неона остается неинверсной, так как этому препятствует
долгоживущий метастабильный уровень 5 неона, лежащий много ниже
короткоживущего уровня 1 неона. В результате заселенность уровня 5 неона
велика, за счет чего происходит пополнение быстро опустошающегося
уровня 1 неона и инверсии заселенности уровней 1 и 3 неона не возникает.
Для атомов гелия спонтанный излучательный переход с уровней 2 и 3 на
уровень 1 запрещен (характеризуется малой вероятностью). Атомы гелия,
сталкиваясь с атомами неона, которые на уровне возбуждения 3 и 2 имеют
почти такую же энергию, что и атомы гелия на уровне 3 и 2, передают им
свою энергию. Благодаря такому процессу происходят безызлучательные
переходы атомов гелия в невозбужденное состояние с резонансной отдачей
энергии атомам неона. Именно в результате этого процесса возникает
инверсная заселенность уровней 1 и 3 неона, а уже существующая для
уровней 1 и 2 неона еще увеличивается.
Пл
А
Пл
К
З2
З1
Стеклянная газоразрядная трубка
Рис. 17.3
3
He
3
Ne
hv
4
2
2
hv
He
hv λ=632,8 нм
λ=1150 нм
1
5
0
λ=3390 нм
Ne
Рис. 17.4
Столкновения атомов на уровнях 1, 2, 3 неона со стенками трубки
практически не влияют на заселенность этих уровней, так как они все
короткоживущие. Атомы неона уровня 5 претерпевают многочисленные
210
столкновения со стенками трубки из-за долгоживучести уровня 5.
Столкновения разгружают уровень 5, инициируя переходы атомов неона с
уровня 1 на уровень 5. При этом опустошение уровня 1 неона при
незаселенном уровне 5 происходит еще быстрее, чем при заселенном уровне
5. Разница заселенностей уровней 1 и 3 неона возрастает в результате такого
процесса и повышает эффективность работы газового лазера в видимом
оптическом диапазоне с длиной волны 632,8 нм. Столкновения атомов неона
со стенками трубки наиболее эффективно опустошают уровень 1 неона
(максимум мощности лазерного излучения) при диаметре трубки около 7 мм.
Полупроводниковый лазер (ППЛ) состоит из нескольких слоев разных
ПП или одного и того же ПП с различным типом проводимости. Между
слоями образуются электронно-дырочные переходы. Материалы слоев
подбираются так, что инжектируемые носители тока (электроны и дырки)
преимущественно локализуется (запираются переходами) в одном из слоев,
называемом активным слоем. В этом слое происходит рекомбинация
электронов и дырок с излучением избытка энергии в виде излучения (далеко
необязательно в виде видимого света, это зависит от материалов ППЛ).
Уровень инжекции через переходы зависит от величины прикладываемого
напряжения и, следовательно, плотности тока в структуре (гетероструктуре)
j=I/S, где S – площадь поперечного сечения слоев. Лазерная генерация
начинается лишь при достижении некоторого критического – порогового
значения плотности тока jпор, обеспечивающего достаточный уровень
(супер, сверх)инжекции носителей в активный слой. При плотности тока
меньшей jпор ППЛ не генерирует лазерное излучение.
Фотоны, образующиеся в результате рекомбинации в активном слое,
имеют различное направление. Для формирования избирательной (полезной)
направленности лазерного излучения в структуру вводятся дополнительные
ПП слои, обеспечивающие своими значениями показателей преломления (по
отношению к рабочим слоям) появление полного отражения (волноводный
эффект). В такой структуре рекомбинирующие носители заперты
(локализованы) в активном слое, а образующееся при их рекомбинации
излучение локализовано в плоскости активного слоя и нескольких (двух,
четырех) соседних с ним слоев. Это уменьшает потери излучения и
повышает мощность ППЛ. Так как величины прикладываемых к электроннодырочным переходам напряжений ограничены возможностью пробоя
переходов, то значения пороговой плотности тока сравнительно невелики,
поэтому по мощности ППЛ существенно уступает газовому и рубиновому
лазерам.
В настоящее время ПП твердые растворы получили широкое
практическое применение в электронной технике, начиная от базы
транзисторов, (свето)диодов (принцип тот же, что и у ППЛ, различия по
мощности и деталям структуры) и т.п. и заканчивая СD–ROM’ми, сотовыми
телефонами, компьютерами, т.д. Изобретение ППЛ на ПП твердых растворах
привело к бурному развитию медицины, систем записи, хранения, передачи
211
информации, что, в свою очередь, вызвало бурное развитие почти всех
отраслей экономики.
Лазерная технология используется для резки материала, нанесения
рисунка на его поверхность, образование нужного микрорельефа на ней.
Лазерная сварка позволяет соединить металлы и сплавы, не свариваемые
обычным способом. В хирургии лазерный луч используется в качестве
хирургического скальпеля. В офтальмологии лазерным лучом прикрепляют
отслоившуюся сетчатку глаза. В связи с очень малой расходимостью
лазерного луча, возможно с большой точностью производить юстировочные
и нивелировочные работы, разметку территорий.
17.2. Жидкие кристаллы и их свойства
(перед изучением данного материала необходимо ознакомиться с
материалом лекций 13, 14 ч.I данного пособия)
Жидкокристаллическим (ЖК) (мезаморфным, мезофаза – греч. mesos
– промежуточный) состоянием вещества называется термодинамически
устойчивое состояние. При котором вещество сохраняет анизотропию
физических свойств, присущую ТТ, и текучесть, характерную для жидкостей.
ЖК состояние вещества существует только в определенном
диапазоне температур. Нижняя граница – температура кристаллизации Ткр,
ниже которой вещество существует только в виде ТТ, верхняя граница –
температура Тж, выше которой вещество превращается в однородную
жидкость. Для большинства веществ это небольшой диапазон от –15 до
+55°С. ЖК кристаллы (ЖКК) – диэлектрики с удельным сопротивлением
около 108 – 1013 Ом⋅м.
Впервые свойства ЖКК наблюдал австрийский ботаник Ф.Рейнитцер в
1888 году, но широкое практическое их использование началось только после
публикации результатов исследований Г.Х.Гейлмером в 1968 году.
Характерной особенностью ЖКК является удлиненная ните- или
палочкообразная (или же уплощенная дискообразная) форма их молекул,
длиной порядка нм, а толщиной десятые доли нм. Такая форма способствует
параллельной упаковке молекул в объеме ЖК вещества. Наличие
преимущественной ориентации молекул объясняет анизотропию физических
свойств ЖКК, например, его диэлектрической проницаемости и показателя
преломления. Так как ориентация молекул задается внешним электрическим
полем (ЭП), то ЖКК можно использовать для управления световыми
потоками, проходящими через ЖК матрицу.
Направление, в котором ориентируются молекулы ЖКК при наложении
внешнего ЭП, зависит от знака разности
εa = ε p − εn ,
212
(17.1)
где
ε p и ε n – диэлектрические проницаемости ЖКК в направлениях,
параллельном и перпендикулярном преимущественной ориентации больших
осей молекул. ε a называется диэлектрической анизотропией ЖКК. При
ε a >0 большие оси молекул ориентируются вдоль прикладываемого к ЖКК
ЭП, а при ε a <0 – перпендикулярно ЭП.
ЖКК подразделяются на 3 вида: смектические (рис. 17.5, а),
нематические (рис. 17.5, б) и холестерические (рис. 17.5, в).
В смектических ЖКК молекулы располагаются параллельно своим
большим осям, а их центры масс находятся в одной плоскости.
В нематических (nema – лат. нить) ЖКК большие оси молекул
ориентированы параллельно друг другу, но центры масс молекул
распределены в пространстве хаотично, не образуя четко выраженных слоев.
а)
б)
в)
Рис. 17.5
В холестерических ЖКК молекулы располагаются слоями, как и в
смектических, но направление преимущественной ориентации их осей
(называемое директором) монотонно изменяется от слоя к слою,
поворачиваясь на некоторый угол.
На ЖКК наблюдается ряд эффектов, применяемых преимущественно
в оптоэлектронике: эффект динамического рассеяния, твист-эффект, эффект
«гость–хозяин», термооптический эффект, эффект деформации вертикально
ориентированной фазы (или эффект двойного лучепреломления,
управляемого полем), эффект фазового перехода, эффект избирательного
отражения света. Известно также, что обработка и состояние поверхностей
пластин в ЖК ячейке оказывает влияние на ориентацию молекул ЖКК.
Эффект динамического рассеяния заключается в помутнении
прозрачного слоя нематического ЖКК при ε a <0 с ионной примесью при
наложении внешнего ЭП. При ε a <0 большие оси молекул ориентируются
перпендикулярно прикладываемому к ЖКК ЭП. При наложении внешнего
ЭП ионы, двигаясь вдоль силовых линий ЭП, нарушают упорядоченную
прозрачную структуру ЖКК. При росте прикладываемого напряжения до
некоторого напряжения гидродинамической неустойчивости процесс
протекает настолько бурно и турбулентно, что ЖКК мутнеет и начинает
сильно рассеивать падающее на него излучение.
Твист-эффект (twist – англ. закручивать) заключается в изменении угла
вращения плоскости поляризации света в нематических ЖКК с ε a >0 (рис.
17.6, а) под влиянием внешнего ЭП (17.6, б). При
213
ε a >0 большие оси молекул
ориентируются вдоль прикладываемого к ЖКК ЭП (рис. 17.6, б), слой
скрученного нематического ЖКК является оптически активным, т.е. вращает
плоскость поляризации падающего света на угол π /2.
U
а)
б)
Рис. 17.6
Эффект «гость–хозяин» наблюдается в ЖКК–хозяине при введении
молекул красителя–гостя, имеющих похожую на ЖК вытянутую форму.
Молекулы обоих видов располагаются параллельно поверхностям пластин
аналогично рис. 17.5, б. При наложении внешнего ЭП все молекулы
поворачиваются перпендикулярно пластинам. В этом состоянии ЖК ячейка
перестает интенсивно поглощать падающее на нее излучение, становясь
прозрачно.
Термооптический эффект заключается в управлении интенсивности
прошедшего через ЖК ячейку света при ее нагреве–охлаждении и действии
высокочастотного ЭП: при однократном нагреве до превращения ЖКК в
изотропную жидкость и последующем охлаждении ЖК ячейка становится
непрозрачной; непрозрачность снимается при помещении ячейки во внешнее
высокочастотное ЭП.
Все вышеописанные эффекты и ряд других эффектов и свойств
обуславливают широкое применение ЖКК в оптоэлектронике, особенно в
качестве основы устройств отображения информации (индикаторы, экраны
дисплеев).
214
Лекция 18. Элементы физики ядра
1. Модели строения и основные свойства ядер. Энергия связи, дефект
массы. Ядерные силы. Масс-спектрометры и определение масс ядер.
2. Явление радиоактивности. Альфа- и бета-распад. Гамма-излучение.
Эффект Мёссбауэра.
3. Детекторы излучений, биологическое действие излучений и защита от
излучений.
4. Ядерные реакции деления и термоядерные реакции (реакции синтеза).
18.1. Модели строения и основные свойства ядер. Энергия связи,
дефект массы. Ядерные силы. Масс-спектрометры и определение масс
ядер
Ядерной физикой называется раздел физики, посвященный изучению
строения атомного ядра, а также процессов радиоактивного распада и
механизма ядерных реакций.
Из опыта Резерфорда (1911г., см. лекция 12) выяснилось, что весь
положительный заряд и почти вся масса атома сосредоточены в ядре,
находящемся в центре; вокруг ядра по орбитам движутся электроны
(согласно классической физике), занимая огромную по сравнению с ядром
область. Размеры и форма электронных орбиталей соответствуют
максимумам плотности вероятности (волновой функции) нахождения
электрона (электронного облака) вокруг ядра (согласно квантовой физике).
В более поздних исследованиях, установлено, что ядро – центральная
массивная часть атома – состоит из протонов и нейтронов. В ядре
сосредоточена почти вся масса атома (более 99,95%). Размеры ядер порядка
10–15÷10–14 м. Ядра имеют положительный заряд, кратный
элементарному заряду электрона е=1,6021892⋅10–19 Кл: Q=Ze. Целое число
Z называется зарядовым числом. Оно совпадает с порядковым номером
элемента в периодической системе элементов Д.И.Менделеева.
Термин «протон» (от греч. protos – первый) был введен Резерфордом в
начале 20–х годов XX века. Протон обозначают символом «р». Протон – одна
из двух квазистабильных элементарных частиц (другой стабильной частицей
является электрон), его время жизни по сравнению с другими частицами
велико τ → ∞ (как и для электрона). Масса протона mp=1,672614⋅10–27
кг=938,28 МэВ≈1836me≈1 а.е.м., где а.е.м. – внесистемная единица измерения
– атомная единица массы =1,67⋅10–27 кг, mе= 9,11⋅10–31 кг – масса электрона.
Спиновое число протона s=1/2 (следовательно, является фермионом и
подчиняется принципу запрета Паули). Заряд протона равен положительному
элементарному заряду е. Магнитный момент протона примерно в 660 раз
меньше магнитного момента электрона.
В ядерной физике и в физике элементарных частиц массы часто
выражают в единицах энергии, умножая их значение кг (в системе SI), на
квадрат скорости света с2, в соответствии с релятивистской формулой,
215
связывающей массу частицы с ее энергией покоя W0 = m·с2. Так масса
частицы, равная 1 МэВ (точнее – 1 МэВ/с2) в системе СИ будет равна 1
МэВ/с2=106Дж/(3⋅108 м/с)2≈1,78⋅10–30 кг. Выраженная в МэВ масса электрона
mе= 9,11⋅10–31 кг=0,511 МэВ.
Нейтрон был открыт в 1932 году (Нобелевская премия 1935 года) при
облучении бериллиевой мишени потоком альфа-частиц английским физиком
Д.Чедвиком (1891–1974) – учеником Резерфорда, обозначается символом
«n». Электрический заряд нейтрона равен нулю.
Д.Чедвик обнаружил, что иногда в камере Вильсона (см. описание далее)
виден след быстрой частицы, начинающийся и заканчивающийся внутри
камеры. Резерфорд и Чедвик объяснили это как результат соударения
быстрой нейтральной (без заряда) частицы, проникшей в камеру, с ядром
атома газа, заполняющего камеру. По характеру следа физики оценили
импульс ядра, а по закону сохранения импульса вычислили массу
нейтральной частицы – нейтрона.
В 1943–45 Д.Чедвик возглавлял группу учёных, работавших в ЛосАламосской лаборатории (США) над проектом атомной бомбы.
Протонно-нейтронная модель атомного ядра была предложена в 1932
г. советским физиком Д.Иваненко (1904г.р.) после открытия нейтрона.
Протоны и нейтроны получили общее название нуклонов (nucleus – лат.
ядро), т.е. ядерных частиц. Затем эта модель была развита немецким физиком
В.Гейзенбергом (1901г.р.) в его работах по обменному взаимодействию
нуклонов в ядре. В ядре нейтрон является стабильной частицей.
Масса нейтрона mn=1,6749543⋅10–27 кг=939,57 МэВ≈1838,6me≈1 а.е.м.
Масса нейтрона больше массы протона, он нестабилен (время жизни ~103 с, в
ядре стабилен), распадается в свободном состоянии соответственно на
протон, электрон и антинейтрино n → p + e + ν~e .
−
Виртуальная частица – электронное нейтрино
ν e (античастица –
антинейтрино ν~e ) электронейтральна, имеет близкую к нулю массу, не
имеет массы покоя (всегда в движении со скоростью света с), спин ее равен
спину электрона. Ее существование было предсказано впервые швейцарским
физиком В.Паули (1900–1958) в 1930 г. из соображения выполнения законов
сохранения (энергии и суммарного спина ядра) при β-распаде: в объяснение
непрерывного энергетического спектра электронов при β-распаде и
сохранения спина при сохранении числа нуклонов в ядре при β-распаде.
Время, за которое распадается половина первоначального количества
нейтронов (период полураспада) Т1/2≈12 минут. Нейтрон, как и протон, имеет
спин s=1/2 (фермион, подчиняется принципу запрета Паули). Несмотря на
свою электрическую нейтральность, нейтрон также обладает собственным
магнитным моментом, что говорит о наличии внутренней структуры у
нейтрона.
Объяснение внутренней структуры было дано на основе представления о
кварковой структуре протона и нейтрона (см. далее). По современным
216
представлениям протоны и нейтроны состоят из кварков и глюонов, а
атомное ядро – сложная система, состоящая из множества кварков,
глюонных и мезонных полей, взаимодействующих друг с другом.
Теоретическе описание атомного ядра – задача квантовой хромодинамики.
В силу своей сложности эта задача пока не решена.
Общее число нуклонов (протонов и нейтронов в ядре) в ядре означается
буквой А и называется массовым числом ядра. Число нейтронов в ядре
обозначают буквой N. Если учесть, что число протонов в ядре (зарядовое
число) Z, то для числа нейтронов имеем
N=A–Z.
(18.1)
При описании атомного ядра и ядерных реакций, происходящих при
небольших энергиях (≤ 1 ГэВ на нуклон) можно с хорошей точностью
считать, что ядро состоит из вполне определенного числа нуклонов,
движущихся с нерелятивистскими скоростями (v2/c2~0,1). Тогда размер ядра
довольно точно определяется числом нуклонов в нем по формуле
R = R0 A1 / 3 , R0 ≅ (1,3 − 1,7) ⋅ 10 −15 м.
(18.2)
A
Ядро элемента обозначают в виде Z X , где Х – химический символ
данного элемента в периодической таблице Д.И.Менделеева, А – массовое
число, Z – зарядовое число.
Ядра с одинаковыми Z, но разными А называются изотопами.
Химические свойства элементов определяются валентными электронами. У
изотопов число электронов одинаково, значит по своим химическим
свойствам изотопы одинаковы. Большинство химических элементов имеет
по нескольку стабильных протонов. Например, у водорода три изотопа:
1
2
2
3
3
обычный водород или протий 1 H ; дейтерий 1 H =1 D ; тритий 1 H = 1T .
Обычный водород и дейтерий стабильны, тритий – нестабилен,
радиоактивен, его период полураспада Т1/2=12,35 года.
Ядра с одинаковыми А, но разными Z называются изобарами, например,
50
24 Cr . Ядра с одинаковым
5
6
например, 2 He и 3 Cr .
50
23V
и
числом нейтронов называются изотонами,
Опыт показывает, что масса ядра mя меньше, чем суммарная масса
образующих ядро нуклонов. Разница между суммарной массой свободных
нуклонов ядра и массой самого ядра называется дефектом массы ядра ∆m .
Объяснение этому дает релятивистская механика на основе формулы
2
Эйнштейна, связывающей массу тела с его энергией покоя W1 = m я c . С
другой стороны, рассматривая ядро как систему нуклонов, по этой же
(
)2
формуле имеем W2 = Zm p + ( A − Z ) mn c , где даны массы нуклонов в
2
свободном (вне ядра, несвязанном) состоянии. W2 − W1 = ∆Wсв = ∆mc > 0 ,
217
это часть энергии, которая выделяется при образовании связей в ядре или
которую необходимо затратить на разделение ядра на составляющие и
удаление нуклонов друг от друга на расстояние, где они не взаимодействуют
друг с другом. Дефект массы ядра
∆m = Zm p + ( A − Z )mn − m я .
(18.3)
Массу ядер очень точно можно определить с помощью измерительных
приборов – масс-спектрометров, разделяющих с электрическим и
магнитным полями пучки заряженных частиц с разными отношениями
заряд/масса Q/m. Ранее описывалось поведение заряженной частицы в
магнитном поле в случае, если ее скорость направлена по нормали к вектору
магнитной индукции: под действием силы Лоренца траекторией движения
2
является окружность Fл = QvB = v / R . Измеряя отклонение и особенности
траектории можно вычислить массу частицы.
Отношение энергии связи к числу нуклонов в ядре ∆Wcв/А называется
удельной энергией связи. Этой величиной удобно характеризовать
устойчивость ядер: чем больше удельная энергия связи, тем устойчивей
ядро. Для большинства ядер удельная энергия связи почти одинакова.
Объясняется это тем, что нуклон в ядре взаимодействуют не со всеми
нуклонами ядра, а только с ограниченным их числом. Это свойство
называется насыщением ядерных сил.
Для легких ядер удельная энергия связи резко возрастает с ростом А.
например, для дейтерия она равна 1,1 МэВ/нуклон, а уже для гелия
составляет 7,1 МэВ/нуклон. Для ядер с массовыми числами А=50–60
удельная энергия связи максимальна и составляет 8,7 МэВ/нуклон. С
дальнейшим ростом А удельная энергия связи немного уменьшается. Это
объясняется возрастающей ролью кулоновского отталкивания для ядер с
большим числом протонов. Для урана (А=235 или А=238) удельная энергия
связи составляет 7,5 МэВ/нуклон. Отсюда следует энергетическая
выгодность слияния (синтеза) легких ядер в одно более тяжелое ядро и
деления тяжелых ядер на несколько более легких ядер. Так, например, в
реакции слияния двух ядер дейтерия в ядро гелия выделяется энергия, равная
24 МэВ. Деление ядра с массовым числом А=240 (∆Wcв/А=7,5 МэВ/нуклон) на
два ядра с А=120 (∆Wcв/А=8,5 МэВ/нуклон) привело бы к высвобождению
энергии ∆Wcв=(8,5–7,5)·240 МэВ=240 МэВ. Для сравнения, при сжигании
угля в химической реакции C+O2 → CO2+5 эВ выделяется всего 5 эВ энергии,
что на 6–7 порядков меньше, чем в ядерных реакциях.
Какие же силы удерживают нуклоны вместе, сдерживая кулоновское
отталкивание протонов в ядре? Ядерное взаимодействие между нуклонами
получило название сильного взаимодействия. Термин «сильное» означает,
что это взаимодействие сильней кулоновского. Ядерные силы
короткодействующие ~10–15 м. На расстояниях ≈0,5·10–15 м притяжение
сменяется быстро растущим отталкиванием. Ядерные силы не зависят от
218
заряда нуклона, т.е. взаимодействие протона с протоном, нейтрона с
нейтроном и протона с нейтроном одинаковы. Ядерные силы зависят от
взаимной ориентации спинов. Так в ядре дейтерия – дейтроне – нейтрон и
протон имеют спины, направленные в одну сторону. При противоположных
спинах нейтрон с протоном отталкиваются. Ядерные силы не являются
центральными. В частности, это следует из их зависимости от ориентации
спинов. Ядерные силы обладают свойством насыщения, т.е. каждый
нуклон в ядре может взаимодействовать с ограниченным числом соседей (об
этом упоминалось выше). Из-за насыщения ядерных сил объемы ядер
пропорциональны А – числу нуклонов в ядре (см. формулу (18.2)).
Современная
теория
сильного
взаимодействия
–
квантовая
хромодинамика – далека от завершения. Согласно гипотезе (1935 г.)
японского физика Х.Юкавы (1907–1981, Нобелевская премия 1949 г.) в ядрах
протоны и нейтроны с огромной быстротой обмениваются виртуальными
частицами с массой 200–300me, называемых π -мезонами: в центре нуклонов
находится ядро–керн радиусом ≈0,3·10–15 м, окруженный облаком из мезонов
π + (mπ+=273me,время жизни ~10–8c), π − ( mπ-=273me, время жизни ~10–8c),
π 0 ( mπ0=264me, время жизни ~10–16c), при этом очень быстро протекают
→ n + π + , n ←→ p + π − , p ←→ p + π 0 , n ←→ n + π 0 .
реакции p ←
Время обмена нуклонов π -мезонами можно определить из соотношения
неопределенностей
Гейзенберга–Бора
для
энергии
и
времени
∆E∆t ≥ h /(2π ) , где ∆E = mπ c 2 – энергия покоя π -мезона.
Существуют множество моделей ядра, рассмотрим кратко лишь самые
известные феноменологические (описательные), каждая из которых, тем не
менее, является приближенной, описывающей не все, а лишь некоторые
свойства ядер.
Гидродинамическая или капельная модель ядра была предложена
впервые Я.Френкелем (1894–1952) и развита Н.Бором в 1939 г. Основное
предположение модели: благодаря большой плотности нуклонов и сильному
их взаимодействию ядро представляет собой каплю заряженной жидкости
плотностью ~1017 кг/м3. При большой амплитуде колебаний поверхности
капли происходит процесс деления ядра. В рамках модели получена формула
зависимости энергии связи нуклонов в ядре, пояснены механизмы ряда
ядерных реакций. Модель не объясняет особую устойчивость «магических»
ядер и большинство спектров возбуждения ядер.
Оболочечная модель ядра разработана в 1940–50 гг. американским
физиком М.Гёпперт–Майером (1906–1972) и немецким физиком Х.Йенсеном
(1907–1973). Основное предположение модели: каждый нуклон движется
независимо от других в некотором среднем потенциальном поле (яме),
создаваемом
остальными
нуклонами
(похоже
на
приближение
самосогласованного поля электронов в ТТ). В силу сложности задачи
функция потенциальной энергии подгоняется под экспериментальные
данные. Подобно атомам ядра имеют дискретный спектр энергии.
219
Возбуждение ядра достигается переводом нуклона из занятого нижнего
состояния с наименьшей энергией на свободное с большей энергией с учетом
принципа запрета Паули для фермионов (протонов и нейтронов).
Оболочечная модель противоречит гидродинамической и потому они
объясняют и не объясняют «диаметрально» противоположные свойства.
Обобщенная модель ядра разработана в 1950–53 гг. и соединяет в себе
основные положения гидродинамической (капельной) и оболочечной
моделей: внутренняя устойчивая часть ядра (остов) из внутренних нуклонов
описывается капельной моделью, а движение внешние нуклонов –
оболочечной. Ядро при взаимодействии внутренних и внешних нуклонов
может вращаться, колебаться и деформироваться, что позволило объяснить
особенности вращательных и колебательных спектров ядер.
18.2. Явление радиоактивности. Альфа- и бета-распад. Гамма-излучение.
Эффект Мёссбауэра
Радиоактивностью называют свойства атомных ядер самопроизвольно
превращаться в другие ядра (изменяя Z и А) путем испускания элементарных
частиц и различных видов излучения. При одних и тех же закономерностях
процессов различают радиоактивность естественную (природный фон
природных неустойчивых изотопов) и искусственную (при инициируемых
ядерных реакциях).
Явление радиоактивности было открыто в 1896 году французским
физиком А.Беккерелем (1852–1908), который обнаружил спонтанное
испускание солями урана неизвестного излучения (Нобелевская премия по
физике 1903г.). Это излучение действовало на фотопластинку, ионизовало
воздух, вызывало люминесценцию ряда веществ. В 1899 году Э.Резерфорд
(1871–1937) электрическим методом показал, что излучение урана состоит,
по крайней мере, из двух компонент. Одну, сильно поглощаемую,
Э.Резерфорд назвал α-излучением, другую, слабо поглощаемую, он назвал βизлучением.
В
1900
г.
Викар
открыл
сильно
проникающее радиоактивное излучение, которое стали называть γизлучением.
Дальнейшие исследования А.Беккереля, Э.Резерфорда и супругов Пьера
Кюри (1859–1906) и Марии Склодовской–Кюри (1867–1934) позволили
установить физическую природу радиоактивных излучений: α-излучение
представляет из себя ядра атомов гелия, β-излучение является потоком
электронов, а γ-лучи есть не что иное, как очень коротковолновое
электромагнитное излучение (Нобелевская премия по физике 1903г.).
В 1934 году Фредерик Жолио (1900–1958) и Ирен Жолио–Кюри (1897–
1956) (дочь П. и М.Кюри) открыли радиоактивный распад с излучением
позитронов. Позитрон является античастицей электрона, в отличие от
электрона он имеет положительный заряд. В 1932 году эта частица была
220
теоретически предсказана П. Дираком и в 1932 году открыта К.Д.
Андерсеном в космических лучах.
В 1940 году советскими физиками Г.Н. Флеровым и К.А. Петержаком
был открыт новый тип радиоактивности – спонтанное деление ядер:
делящееся ядро распадается на два осколка сравнимой массы с испусканием
нейтронов и γ-квантов. В 1982 году немецким физиком С.Хофманом
наблюдалась протонная радиоактивность при распаде короткоживущего
изотопа лютеция
151
71 Lu .
Затем, в 1984 году Х.Роуз и Г.Джонс открывают
14
спонтанное испускание ядер 6 C ядрами радия. В дальнейшем был
обнаружен спонтанный распад других ядер.
Закон
радиоактивного
распада
дает
зависимость
числа
радиоактивных ядер от времени N(t). Так как отдельные радиоактивные ядра
распадаются независимо друг от друга, можно считать, что число ядер dN,
распадавшихся в среднем за интервал времени от t до t+dt, пропорционально
числу ядер N(t), имеющихся в момент времени t и промежутку времени dt:
dN = −λN (t )dt , где λ – постоянная радиоактивного распада данного вида,
знак «–» указывает на то, что число ядер уменьшается. Разделим переменные
N
и проинтегрируем
∫
N0
t
dN
= λ ∫ dt , тогда получим закон радиоактивного
N (t )
0
распада, справедливый для всех видов распада
N (t ) = N 0 e − λt ,
(18.4)
где N0 – число радиоактивных ядер при t=0.
Для того, чтобы узнать количество распадавшихся за время t ядер Nрасп,
надо из начального числа ядер N0 вычесть число ядер, оставшихся спустя
время t (см. формулу (18.4)):
(
)
N расп = N 0 − N (t ) = N 0 1 − e − λt .
(18.5)
Периодом полураспада Т1/2 называется время, за которое распадается
половина первоначального количества ядер (изменяется в широких пределах
от 3·10–7 с до 5·1015 лет). Согласно закону (18.4) N(t)=N0/2 при t=Т1/2,
следовательно e
− λT1 / 2
= 1 / 2 , откуда
T1 / 2 = ln 2 / λ ≈ 0,693 / λ .
(18.6)
Для грубых оценок постоянной распада λ используется ее связь с
пробегом α-частиц в воздухе, устанавливаемую законом Гейгера–Нэттола:
221
чем больше постоянная распада λ радиоактивного элемента, тем больше
пробег Rα в воздухе испускаемых им α-частиц
ln λ = A + B ln Rα ,
(18.6/)
где А и В – опытные постоянные, причем В – одинаково для всех
радиоактивных семейств.
Активностью радиоактивного вещества а называется число распадов
в единицу времени, измеряется в беккерелях: 1 Бк=1 распаду/с, внесистемная
единица – кюри, 1 Ки=3,7·1010 Бк. С учетом закона (18.4) имеем:
a = dN / dt = λN 0 e − λt = λN .
(18.7)
Используя связь (18.6) постоянной распада λ и периода полураспада Т1/2,
выражение для ) радиоактивного вещества активности (18.7) примет вид:
a = λN = N ln 2 / T1 / 2 .
(18.8)
Возникающие в результате радиоактивного распада ядра часто тоже
оказываются радиоактивными. В результате возникает целый ряд
радиоактивных превращений, заканчивающихся стабильным элементом. В
настоящее время обнаружено четыре радиоактивных ряда, начинающихся с
тория
232
90Th ,
двух изотопов урана
235
92 U
и
238
92 U
заканчиваются соответственно стабильными изотопами
тория и
207
82 Pb
и
208
92 Pb
237
93 Np . Эти ряды
208
свинца 82 Pb для
и нептуния
для изотопов урана, стабильным ядром висмута
209
83 Pb
для нептуния.
Типичным примером α-радиоактивного распада является реакция
238
234
4
92 U → 90Th + 2 He + Q
(Q – энергия).
Обобщенная формула α-радиоактивного распада материнского Xядра в дочернее Y-ядро при испускании α-частиц (ядер гелия):
A
A− 4
4
Z X → Z − 2Y + 2 He + ( hv ) .
(18.9)
Энергия и масса материнского ядра больше суммарной массы
дочернего+α-частица, соответствующая разница энергий выделяется в виде
кинетической энергии дочернего ядра и α-частицы и изучения γ-квантов при
переходе дочернего ядра из возбужденного состояния в нормальное. Иногда
γ-квант может не покидать ядро, передать энергию электрону одной из
внутренних электронных оболочек, в результате чего электрон покидает атом
222
(внутренняя конверсия). На освободившееся место переходит другой
электрон с испусканием кванта рентгеновского излучения, являющегося
характеристическим.
Процесс альфа-распада делится на две стадии: образование в ядре
виртуальной устойчивой из-за насыщения ядерных сил (2 протона и 2
нейтрона) α-частицы и испускания ее ядром. Для того, чтобы покинуть ядро
α-частица должна преодолеть потенциальный барьер, величина которого, как
показывает опыт, много больше максимальной энергии покидающих ядро αчастиц. В результате говорят о туннелировании α-частиц через
потенциальный барьер, по оценкам лишь одна из ≈1036 попыток α-частицы
вырваться (туннелировать) является успешной.
Теория бета-распада, созданная Э.Ферми (1901–1954) в 1934 г.
предполагает
существование
четвертого
вида
фундаментального
взаимодействия – слабого. Согласно Э.Ферми бета-распад есть результат
слабого взаимодействия нуклона с электронно-нейтринным полем, при этом
нуклон переходит в другое состояние. Бета-распадом (β-распадом, βизлучением) называется спонтанное внутриядерное превращение нейтрона в
протон или наоборот, что сопровождается испусканием электрона или
позитрона и электронных антинейтрино или нейтрино соответственно:
A
A
Z X → Z +1Y
+ e − + v~e – электронный или β–-распад, (18.10)
A
A
Z X → Z −1Y
+ e + + ve – позитронный или β+-распад, (18.11)
при этом материнское и дочернее ядра являются изобарами.
У многих тяжелых ядер возможен третий вид бета-распада –
электронный или К-захват: возбужденное ядро захватывает электрон Коболочки атома, при этом один из протонов ядра превращается в нейтрон и
нейтрино:
p + −10e → n + ve – электронный или К-захват. (18.12)
На освободившееся место переходит другой электрон с испусканием
кванта рентгеновского излучения, являющегося характеристическим.
Типичными примерами β-радиоактивного распада являются реакции
n → p + e − + v~e ,
14
14
6 C→ 7 N
+ e − + v~e ,
11
11
+
6 C→ 5 B + e
Виртуальная частица – электронное нейтрино
+ ve .
ν e (античастица –
антинейтрино ν~e ) электронейтральна, имеет близкую к нулю массу, не
имеет массы покоя (всегда в движении со скоростью света с), спин ее равен
спину электрона. Ее существование было предсказано впервые швейцарским
физиком В.Паули (1900–1958) в 1930 г. из соображения выполнения законов
223
сохранения (энергии и суммарного спина ядра) при β-распаде: в объяснение
непрерывного энергетического спектра электронов при β-распаде и
сохранения спина при сохранении числа нуклонов в ядре при β-распаде.
Известные периоды полураспада для β-распада лежат в пределах 10–2–
1018 лет.
Гамма-излучение (γ-изучение) является наиболее проникающим видом
ионизирующего излучения и наблюдается в тех случаях, когда атомное ядро
по каким-либо причинам переходит из состояния с большей энергией в
состояние с меньшей энергией, в том числе в основное. Диапазон энергий γквантов составляет от 10 кэВ до 5 МэВ. γ-изучение сопровождает α- и βраспады радиоактивных ядер, причем при распаде одного и того же изотопа
могут испускаться гамма-кванты различных характерных энергий (частот).
Рассмотрим
процессы,
объясняющие
эффект
(1958
г.)
Р.Л.Мёссбауэра (1929г.р., Нобелевская премия по физике 1961 г.).
При испускании свободным возбужденным ядром в состоянии 2 γкванта и переходе ядра из состояния 2 в нижнее состояние 1 по закону
сохранения импульса ядро получает импульс отдачи, равный импульсу
кванта, но противоположно направленный (т.е. ядру сообщается
кинетическая энергия). Если ядро изначально покоилось, то энергия кванта
уменьшится на кинетическую энергию ядра и его частота не будет
соответствовать переходу ядра между его уровнями энергии 2 и 1,
регистрируемая частота v (энергия hv) гамма-кванта на выходе из ядра будет
меньше энергии требуемой для перехода ядра обратно в возбужденное
состояние 2. При поглощения свободным ядром падающего на него
гамма-кванта, т.е. при попытке возбуждения ядра из состояния 1 до
прежнего состояния 2, часть энергии кванта идет на сообщение ядру
импульса и кинетической энергии и только оставшаяся часть идет
собственно на возбуждение ядра на тот же уровень 2, что был у него до
испускания кванта. При этом падающий гамма-квант должен обладать
энергией большей, чем испущенный ядром при переходе из состояния 2 в
состояние 1. В силу этого спектральные линии поглощения и испускания
изначально покоящихся свободных ядер разделены между собой некоторым
интервалом, обусловленным описанными выше процессами.
Энергия ядра может принимать только определенные, дискретные
значения, подобно энергии электронов в атомах. Явление поглощения ядром
гамма-кванта, частота (энергия) которого соответствует переходу ядра из
основного в ближайшее возбужденное состояние, называется резонансным
поглощением.
Если ядро, испускающее гамма-квант находится в узле кристаллической
решетки, оно закреплено, связано, энергию и импульс отдачи получает весь
кристалл в целом, для которого это несущественно. В этом случае
спектральный сдвиг линий излучения и поглощения для свободных ядер
исчезает для связанных в решетке ядер, так как отдача исчезает (ею можно
пренебречь). Эффектом Мёссбауэра называется резонансное поглощение
224
(испускание) γ-квантов без отдачи (т.е. при совпадении спектральных линий
поглощения и испускания) у твердых тел.
18.3. Детекторы излучений, биологическое действие излучений и защита
от излучений
Быстрые заряженные частицы в веществе взаимодействуют с
электронными оболочками и ядрами атомов. Электрон атома вещества в
результате взаимодействия с быстрой заряженной частицей получает
дополнительную энергию. В результате атом либо переходит в возбужденное
состояние, либо ионизуется. При прохождении вблизи атомного ядра,
быстрая заряженная частица движется с ускорением, вызванным
кулоновским взаимодействием с ядром, в результате чего испускаются
кванты рентгеновского тормозного излучения. Возможно и неупругое
соударение заряженных частиц с атомными ядрами.
Взаимодействие частицы с веществом количественно оценивается
линейной плотностью ионизации, линейной тормозной способностью
вещества и средним пробегом частицы.
Под линейной плотностью ионизации понимают отношение числа
ионов одного знака, образованных частицей на своем пути, к длине этого
пути
i=dn/dl.
(18.13)
Линейной тормозной способностью вещества называют отношение
энергии, теряемой заряженной ионизирующей частицей при прохождении
элементарного пути в веществе к длине этого пути
S=dW/dl.
(18.14)
Средним линейным пробегом R называют расстояние между началом и
концом пробега частицы в веществе.
Обладающие большой массой (по сравнению с β-частицами –
электронами) α-частицы (ядра гелия) при столкновениях с электронами
атомов вещества почти не испытывают отклонения и в веществе движутся
почти прямолинейно. Их пробеги в веществе малы. Так, α-частицы с
энергией 4 МэВ в воздухе могут пролететь около 2,5 см, а в воде – сотые
доли миллиметра.
Проникающая способность β-частиц больше. Так при энергии 2 МэВ от
потока β-частиц защищает слой алюминия толщиной 3,5 мм. Плотная одежда
может поглотить значительную часть β-частиц и совсем не пропустит αчастицы. Однако, при попадании радиоактивных веществ внутрь
человеческого тела с пищей, водой, воздухом α- и β-излучение могут
причинить человеку серьезный вред. Для бета-излучения согласно
определению (18.13) линейная плотность ионизации воздуха может быть
оценена приблизительно по скорости частицы i=4600 пар ионов/м⋅(с/v)2, где с
– скорость света в вакууме.
Нейтроны не имеют электрического заряда и поэтому не
взаимодействуют с электронными оболочками атомов. При столкновениях с
225
ядрами они могут выбивать из них заряженные частицы, которые
ионизируют и возбуждают атомы среды. При радиационном захвате
тепловых нейтронов ядрами водорода
1
1H
человеческого организма они
2
превращаются в ядра дейтерия 1 H с испусканием γ-квантов, с энергией 2,23
МэВ, которые дают существенный вклад в облучение организма.
Проходя через слой вещества толщиной х, интенсивность гаммаизлучения изменяется по закону, подобному закону поглощения Бугера–
Ламберта для света в веществе:
I = I 0e − µx ,
где
µ – линейный коэффициент поглощения гамма-излучения.
(18.15)
Установлено, что γ-кванты взаимодействуют, в основном, с
электронными оболочками атомов, вызывая либо фотоэффект, либо,
передавая часть своей энергии и импульса электронам, претерпевают так
называемое комптоновское рассеяние. При энергии γ-квантов большей, чем
удвоенная энергия покоя электрона может проходить рождение электрон0
0
позитронных пар: γ → −1 e+ +1e . Исходя из описанных возможных процессов
линейный коэффициент поглощения гамма-излучения в законе (18.15) равен
сумме линейных коэффициентов поглощения отдельных процессов
фотоэффекта,
комптоновского
рассеяния,
образования
электронпозитронных пар: µ = µ фот + µ комп + µ обр.пар . Пути пробега нейтронов и γквантов в воздухе измеряются сотнями метров, в веществе – десятками
сантиметров и даже метрами, в зависимости от плотности вещества и
энергии γ-квантов и нейтронов. По этой причине потоки γ-квантов и
нейтронов представляют для человека наибольшую опасность, вызывая
наиболее сильную ионизацию и распад тканей организма.
Для расчета воздействия ионизирующих излучений на живые
организмы применяют следующие величины.
Поглощенная доза ионизирующего излучения D является
универсальной мерой воздействия любого вида излучения на вещество. Она
равна отношению энергии W, переданной веществу, к массе вещества m:
D = W / m.
(18.16)
В системе SI (СИ) единицей поглощенной дозы является грей: 1 Гр=1 Дж/кг.
Мощностью дозы Р называется отношение дозы излучения ко времени
облучения t:
P = D/t.
(18.17)
Единицей мощности дозы в системе SI (СИ) является Гр/с=Вт/кг.
Относительная биологическая эффективность К характеризует
различие биологического действия различных видов излучений при
одинаковой дозе. Для рентгеновского и γ-излучения относительная
биологическая эффективность К=1, для тепловых нейтронов К=3, для
нейтронов с энергией 0,5 МэВ К=10, для α-частиц К=20.
226
Эквивалентная доза Н определяется как произведение поглощенной
дозы D на относительную биологическую эффективность К:
H = D⋅K.
(18.18)
Единицей эквивалентной дозы в системе SI (СИ) является зиверт. 1 Зв=1
Гр≅1 (К=1).
Экспозиционная доза De характеризует ионизирующее действие
излучения на воздух. Она определяется как отношение суммарного заряда Q
всех ионов одного знака, созданных в воздухе вторичными частицами
(электронами и позитронами) к массе воздуха mвозд:
De = Q / mвозд .
(18.19)
Экспозиционная доза в системе SI (СИ) измеряется в Кл/кг.
Распространенной внесистемной единицей экспозиционной дозы
является рентген: 1 Р=2,58⋅10–4 Кл/кг. При экспозиционной дозе 1 Р в 1 см3
сухого воздуха образуется 2 ·109 пар ионов.
Смертельная доза γ-излучения для человека равна 6 Гр. При массе
человека m=70 кг согласно формуле (18.16) энергия выделяющаяся в
организме человека W=D≅m=70 кг≅6 Гр=420 Дж. Это очень маленькая
энергия. Например, вода массой 10 г, нагретая до температуры 46oС (на
∆t=10o выше температуры человеческого тела) передает организму человека
при ее потреблении точно такую же энергию. Отсюда становится ясно, что не
тепловое воздействие ионизирующего излучения является причиной гибели
человека, а разрушение тканей и органов вследствие их ионизации,
нарушающее их функции (лучевая болезнь). Начинаются химические
превращения, получившие название радиолиза. При эквивалентной дозе 0,5–
1 Зв начинаются нарушения в кроветворной системе человека. При
однократном облучении 0,1 Зв наблюдается временная стерильность у
мужчин, а при дозе свыше 2 Зв может наступить полная стерильность. При
эквивалентных дозах облучения всего тела 3–5 Зв около половины
облученных умирает в течение 1–2 месяцев. При дозах 10–50 Зв смерть
наступает через 1–2 недели.
Предельно допустимой дозой облучения для лиц, профессионально
связанных с использованием источников радиации, является 50 мЗв за год. В
качестве предельно допустимой дозы систематического облучения населения
установлена эквивалентная доза 5 мЗв за год. За счет естественного
радиационного фона доза облучения составляет около 2 мЗв за год.
Человек с помощью своих пяти органов чувств не способен обнаружить
опасное для него радиоактивное излучение. Поэтому важной задачей
является разработка приборов, способных регистрировать такие излучения.
Быстрые заряженные частицы, проходя через вещество, оставляют за
собой след ионизированных и возбужденных атомов. Нейтроны и γ-кванты,
взаимодействуя с ядрами и атомами, создают вторичные быстрые
заряженные частицы. По ионизационным следам вторичных частиц могут
быть обнаружены первичные частицы – нейтроны и γ-кванты.
227
Приборы, регистрирующие ионизирующее излучение, делятся на
три группы: следовые (трековые), счетчики и интегральные приборы.
Приборы первой группы – следовые или трековые – регистрируют факт
пролета частицы и позволяют наблюдать траектории частицы – треки. Ко
второй группе относятся приборы, регистрирующие факт пролета частицы и
позволяющие в некоторых случаях позволяют судить о ее энергии. К третьей
группе относятся комбинированные интегральные приборы.
Примерами регистрирующих приборов являются: камера Вильсона и ее
разновидность – диффузионная камера, пузырьковая камера, искровая
камера, эмульсионная камера, сцинтиляционные счетчики, черенковские
счетчики,
ионизационные
камеры
и
газоразрядные
счетчики,
полупроводниковые счетчики.
Сцинтиляционный счетчик регистрирует частицу по световым
вспышкам, которые возникают при ее пролете. Вспышки света возникают,
когда возбужденные быстрой частицей атомы возвращаются в нормальное
состояние. Эти вспышки преобразуются фотоэлектронным умножителем в
электрический сигнал, который регистрируется электронной аппаратурой.
Так как интенсивность световой вспышки пропорциональна энергии
первичной частицы, то с помощью сцинтиляционного счетчика можно
измерять энергию регистрируемой частицы.
Черенковский счетчик регистрирует частицу по излучению ВавиловаЧеренкова, которое она создает, проходя через вещество. Это излучение
возникает, если скорость частицы больше фазовой скорости света в среде.
Одной из особенностей этого излучения является то, что оно
распространяется лишь вдоль образующих конуса, ось которого совпадает с
направлением скорости частицы. Угол ϕ между направлением
распространения излучения и вектором скорости частицы определяется
соотношением cos ϕ = c /( nv) , где с – скорость света в вакууме, n –
показатель преломления рабочего вещества счетчика, v – скорость частицы.
Измерив угол ϕ, мы можем определить скорость частицы v.
Ионизационная
камера
используется
для
измерения
доз
ионизирующих излучений. Она представляет собой цилиндрический
конденсатор, между электродами которого находится воздух или другой газ.
Регистрируемая частица ионизирует этот газ. Напряжение на электродах
подбирают так, чтобы на них попадали все образовавшиеся ионы. Сила
ионизационного тока пропорциональна мощности дозы излучения (18.17).
Газоразрядный счетчик конструктивно похож на ионизационную
камеру, но в нем напряжение на электродах достаточно высокое для
вторичной ионизации газа, вызываемой столкновениями первичных ионов с
атомами
или
молекулами
газа.
Разновидностью
является
пропорциональный счетчик.
Наиболее известным газоразрядным счетчиком является счетчик
немецких физиков Гейгера–Мюллера (Х.Гейгер (1882–1945)), изобретенный
Х.Гейгером совместно с Э.Резерфордом, а затем усовершенствованный в
228
1928 г. Он состоит из коаксиально расположенных цилиндрических
электродов в стеклянной трубке: анод – натянутая по центру нить, а катод –
напыленное на стекло металлическое покрытие. Давление газа внутри трубки
100–200 мм.рт.ст. К электродам прикладывают напряжение ~100 В. При
попадании в счетчик ионизирующей частицы в газе образуются электроны,
движущиеся к аноду. Так как анод – тонкая нить (диаметром окло 0,5 мм), то
вблизи нити электрическое поле сильно и неоднородно, что вызывает
сильное ускорение электронов и ионизацию ими газа в трубке. В результате
начинается газовый разряд и в цепи протекает электрический ток.
Самостоятельный разряд в трубке счетчика Гейгера–Мюллера
необходимо погасить, иначе счетчик не прореагирует на следующую
частицу. Для гашения разряда в трубку «самогасящихся» счетчиков
добавляют многоатомные газы. В несамогасящихся счетчиках разряд гасят
другими методами, например, замыканием трубки на большое
сопротивление, где будет падать все напряжение, и разряд в трубке
прекратится.
Кристаллический счетчик представляет собой монокристалл
диэлектрика (обычно алмаз или сульфид кадмия объемом ~мм3). На
противоположные грани наносятся электроды, к которым прикладывается
напряжение. Частица, пролетая сквозь кристалл, вызывает появление
свободных зарядов (дырки и электроны), которые создают импульс тока во
внешней цепи. Этот импульс для отдельной частицы пропорционален ее
энергии. Поток частиц создает непрерывный ток, сила которого
пропорциональна интенсивности потока.
Полупроводниковый счетчик – это детектор частиц, основным
элементом которого является полупроводниковый диод. На него подается
запирающее напряжение, при отсутствии излучения ток через диод не течет.
Быстрая заряженная частица, проходя через область p-n–перехода, порождает
электроны и дырки. В результате возникает импульс тока,
пропорциональный количеству порожденных носителей тока.
Камера Вильсона является самым первым трековым прибором. Она
была создана в 1912 г. английским физиком Ч.Вильсоном (1869–1959,
Нобелевская премия 1927г.). След ионов, оставляемых заряженной частицей,
становится видимым, благодаря конденсации пересыщенных паров какойлибо жидкости. По характеру и форме этих треков из тумана можно судить о
типах частиц, прошедших через камеру. В 1927 г. советский ученый
Д.В.Скобельцин поместил камеру Вильсона в магнитное поле. Это
значительно расширило возможности прибора: по искривлению траектории
можно определить знак заряда. Если известны заряд и масса частицы, то по
радиусу кривизны трека можно определить энергию частицы.
Пузырьковая камера была изобретена в 1952 г. американцем Глезером.
Она похожа на камеру Вильсона, но рабочим веществом в ней является
перегретая жидкость. При прохождении быстрой заряженной частицы вдоль
ее траектории образуются пузырьки пара. Преимуществом пузырьковой
камеры перед камерой Вильсона является значительно большая плотность
229
рабочего вещества, в результате чего эффективность взаимодействия с ним
регистрируемых частиц значительно возрастает.
Искровая камера была сконструирована в 1957 г. Т.Краншоу и де
Биром. Она состоит из системы плоских параллельных друг другу
электродов, которые через один электрически соединяются друг с другом.
Между этими группами электродов в момент пролета частицы подается
высокое напряжение. В результате траектория частицы будет отмечена
цепочкой искр. Запуск камеры производится автоматически, по сигналу
дополнительных сцинтиляционных счетчиков.
Эмульсионная камера была предложена в 1927 г. советскими
физиками Л.В.Мысовским и А.П.Ждановым. Как известно из истории,
действие быстрых заряженных частиц на фотопластинку позволило
А.Беккерелю открыть радиоактивность. Недостаток фотопластинки –
маленькая толщина эмульсионного слоя. В эмульсионных камерах
облучению подвергаются толстые пачки, составленные из отдельных слоев
фотоэмульсии. Преимущество этого метода перед камерой Вильсона и даже
пузырьковой камерой – в большей плотности эмульсии. Поэтому
фотоэмульсии применяют для изучения частиц очень высоких энергий.
18.4. Ядерные реакции деления и термоядерные реакции (реакции
синтеза)
После открытия нейтрона физики получили в свое распоряжение
частицу, способную, ввиду отсутствия заряда, проникать в любые, в том
числе и тяжелые, ядра. Исследования воздействия нейтронов на ядра,
главным образом тяжелых элементов, велись в широких масштабах.
Итальянский физик Э.Ферми (Нобелевская премия по физике 1938 г.) с
сотрудниками в 1934–38 гг. году начинает опыты по бомбардировке
различных ядер нейтронами и получает радиоактивные изотопы. В ходе этих
исследований он делает важное открытие: эффективность воздействия
нейтронов значительно увеличивается, если между источником нейтронов и
облучаемым веществом поместить замедлитель нейтронов.
В декабре 1942 г. Э.Ферми впервые удалось осуществить ядерную
цепную реакцию в построенном им первом в мире ядерном реакторе, где в
качестве замедлителя нейтронов использовался графит, в качестве горючего
– уран. Первая в мире атомная электростанция была введена в действие в
Советском союзе в 1954 году под руководством И.В.Курчатова (1903–1960).
Облучая нейтронами уран, Ферми получает трансурановые элементы:
нептуний и плутоний. В общем виде это хорошо известная сейчас реакция
235
1
92 U + 0 n
→ X 1 + X 2 + (2 ÷ 3) 01n + (Q ≤ 200 MeV )
Типичным примером является реакция
235
1
139
95
92 U + 0 n→ 54 Xe + 38 Sr
-
-
+ 201n + Q , где
-
β
β
β
139
139
139
139



57 La ,
56 Ba →
55 Cs →
54 Xe →
230
или
(18.20)
235
1
139
94
92 U + 0 n→ 56 Ba + 36 Kr
+301n + Q .
Вскоре после сообщения Э.Ферми о трансурановых элементах, немецкая
исследовательница И.Ноддак опубликовала в Химическом журнале статью, в
которой выдвинула смелую гипотезу о том, что под действием нейтрона ядро
урана может разделиться на несколько больших осколков X1 и X2 (сейчас их
насчитывается около 200 видов), которые не являются соседями урана в
таблице Менделеева. Однако, эта идея показалась неправдоподобной,
Э.Ферми счел предположение И.Ноддак абсурдным. В 1938 г. И.Кюри вместе
с югославом Павлом Савичем заметила, что в уране, облученном
нейтронами, присутствует лантан, элемент с массовым числом А=139. В том
же году эти опыты были повторены немецким учены О.Ганом и
Ф.Штрассманом. Статья О.Гана и Ф.Штрассмана была опубликована в
январе 1939 г. под заглавием «О доказательстве возникновения
щелочноземельных металлов при облучении урана нейтронами и их
свойствах». Еще до опубликования статьи О.Ган прислал своей бывшей
сотруднице Л.Мейтнер письмо с изложением своих результатов. Л.Мейтнер,
будучи еврейкой немецкого происхождения, эмигрировала после захвата
Австрии А.Гитлером в Стокгольм. В это время к ней на рождественские
каникулы приехал ее племянник О.Фриш, работавший раньше в институте
кайзера Вильгельма и эмигрировавший в Данию. О.Фриш и Л.Мейтнер
объяснили результаты О.Гана и Ф.Штрассмана: при попадании нейтрона
ядро урана делится на два осколка, приобретающие под действием
электростатического отталкивания энергию около 200 МэВ, что как раз
составляло энергию, связанную с дефектом массы. 16 января 1939 года они
опубликовали статью, в которой впервые был употреблен термин «деление».
Чрезвычайную важность этого нового тип ядерной реакции сразу понял
Ф.Жолио–Кюри. 8 марта 1939 г. он опубликовал заметку, в которой сообщил
о испускании нейтронов при делении ядра урана. Теперь дело было за
осуществлением цепной реакции деления и получением оружия по тем
временам фантастически огромной разрушительной силы, но 1 сентября 1939
г. нападением нацистской Германии на Польшу началась Вторая мировая
война.
После открытия деления ядер урана У.Зинн и Л.Сциллард, а также
Г.Н.Флеров показали, что при делении ядра урана вылетает больше одного
нейтрона. Дальнейшие исследования показали, что при этом образуется два
осколка деления с массовыми числами А=90–150, всего образуется около 80
различных видов осколков. Чаще всего образуются осколки, массы которых
относятся как 2:3. Большинство нейтронов испускается за время меньше, чем
10–14 с, но часть (около 0,75%) нейтронов испускается с запаздыванием от
0,05 с до 1 мин. В среднем при каждом делении ядра урана выделяется 2,5
нейтрона.
Природный уран содержит практически два изотопа
235
92 U
(0,71%). Ядро урана
238
92 U
238
92 U
(99,29%) и
делится под действием только быстрых
231
235
нейтронов с энергией больше 1 ГэВ. Ядро 92 U делится под действием
нейтронов любых энергий, особенно эффективно деление идет под
действием медленных, тепловых нейтронов. Вероятность деления ядра
235
92 U
238
92 U
тепловым нейтроном в 200 раз выше, чем вероятность деления
быстрым нейтроном. Энергии вылетающих нейтронов лежат в интервале от
0,1 МэВ до 14 МэВ. Казалось бы возможной цепная реакция в природном
238
уране за счет деления 92 U быстрыми нейтронами. Однако за счет потерь
энергии нейтронами при неупругих столкновениях с ядрами и за счет
238
239
поглощения нейтрона ядром 92 U с образованием 92 U цепная реакция на
природном уране развиваться не может. Цепная реакция деления урана
235
может быть осуществлена двумя способами: либо в чистом 92 U взрывным
образом, либо в ядерном реакторе.
Химически оба изотопа урана совершенно неразличимы, поэтому задача
235
выделения изотопа 92 U из природного урана очень сложна. Тем не менее,
эта задача была решена.
Для осуществления ядерного взрыва в результате ядерной цепной
235
реакции необходимо, чтобы масса делящегося вещества ( 92 U либо
239
94 P ) превысила критическую массу mкр.
235
Для 92 U при сферической форме ядерного заряда mкр= 50 кг, при этом
239
радиус сферы Rкр= 8,5 см, для 94 P – mкр=11 кг. До взрыва система должна
плутония
быть подкритична, т.е. массы частей заряда должны быть меньше
критической.
Чтобы вызвать взрыв надо очень быстро соединить части заряда в
единое целое и таким образом перевести систему в надкритическое
состояние. Обычно для сближения частей ядерного заряда используют
химическое взрывчатое вещество, вызывающее перемешивание, соединение
235
239
частей заряда, состоящего либо из изотопа 92 U , либо 94 P . Цепная реакция
в ядерной бомбе идет на быстрых нейтронах. Обычно успевает
прореагировать небольшая часть ядерного заряда, но даже если прореагирует
235
1 кг 92 U , то выделяется энергия 2⋅104 т в тротиловом эквиваленте.
Примерно такой энергии взрывы произвели американцы над японскими
городами Хиросима (6 августа 1945 года) и Нагасаки (9 августа 1945 года).
При этом было убито и ранено более 200000 жителей этих городов.
Ядерный реактор – это содержащая ядерное горючее установка, в
которой осуществляется управляемая ядерная реакция. В качестве
делящегося вещества в реакторах используют природный либо слегка
обогащенный изотопом
235
92 U
уран. Для возбуждения цепной реакции в
232
природном уране используется замедление нейтронов при их столкновениях
2
с легкими ядрами ( 1 H – в тяжелой воде или
деления ядра
235
92 U
12
6C
– графит). Вероятность
тепловыми нейтронами примерно в 200 раз больше, чем
вероятность поглощения нейтрона ядром
238
92 U
. Однако, при делении ядер
235
92 U
тепловыми нейтронами рождаются нейтроны быстрые, которые,
прежде чем замедлиться, могут поглотиться. Вероятность захвата нейтрона
238
ядром 92 U достигает очень больших значений в определенных узких
интервалах энергий (около 7 эВ). В однородной смеси ядерного горючего с
поглотителем вероятность поглощения нейтронов слишком велика и цепная
реакция не может осуществиться. Эту трудность обходят, располагая уран в
замедлителе дискретно, в виде блоков – топливных стержней, образующих
правильную решетку. В такой среде поглощение нейтронов резко
уменьшается, т.к. нейтроны с опасной для поглощения энергией могут не
попасть в уран, а, замедляясь, могут выйти из опасного интервала энергий.
Режим работы реактора выбирают таким образом, чтобы цепная реакция
развивалась только при участии запаздывающих нейтронов. Так как
запаздывание составляет время около минуты, то реакция может быть
хорошо регулируемой. Регулирующие стержни содержат элементы хорошо
поглощающие нейтроны (кадмий Cd или бор B). Введение стержней в
реактор уменьшает коэффициент размножения нейтронов К, выведение –
увеличивает, здесь K=Ni/Ni-1 – отношение числа нейтронов двух ближайших
поколений, при K<1 реакция затухает, при K=1 – состояние с критической
интенсивностью, при K>1 – надкритическая интенсивность, лавинообразный
рост числа нейтронов, характерный для ядерного взрыва. Регулирование
реакции в реакторе производится автоматически. Выделяющаяся в реакторе
тепловая энергия может использоваться для выработки паровой или газовой
турбиной электрической энергии.
Выше при обсуждении изменения удельной энергией связи для
различных ядер указывалось, что при (термоядерных) реакциях синтеза
(слияния) легких атомных ядер выделяется очень большое количество
энергии, много большее, чем при реакции деления тяжелых ядер.
Для того чтобы произошло слияние атомных ядер, их необходимо
сблизить на расстояние порядка 10–13 м, после чего процесс слияния
характеризуется значительной вероятностью, хотя это расстояние все еще
значительно больше расстояния, на котором начинают действовать ядерные
силы притяжения. Ядрам для сближения и начала реакции необходимо
преодолеть потенциальный барьер. Оценим энергию ядер W, необходимую
для их сближения на 10–13 м. Из электростатики для потенциальной энергии
взаимодействия двух точечных зарядов имеем W = bQ1Q2 / r . Для двух ядер
легких ядер, например, дейтерия, c учетом Q1=Q2=e=1,6·10–19Кл, r=10–13м,
b=9⋅109 Н≅м2/Кл2 энергия W=2,3·10–15Дж=1,4 кэВ. Реально сообщить ядрам
такую энергию можно только разогрев вещество до очень высокой
233
температуры. Температуру оценим, приравнивая эту энергию средней
энергии теплового движения, равную (3/2)kT, где k=1,38·10–23 Дж/К:
T=2W/(3k)≈108 К, что по расчетам является температурой плазмы в звездах.
В земных условиях реакции синтеза легких ядер впервые были
реализованы в виде термоядерного взрыва (в так называемой водородной
бомбе, изобретенной русским физиком И.В.Курчатовым (1903–1960) в 1953
г., ядерная бомба была создана в Советском союзе в 1949 г. также под его
руководством). Высокая температура, необходимая для протекания реакции
синтеза в водородной бомбе, создается за счет взрыва ядерной бомбы (на
реакции деления), служащей в водородной бомбе детонатором
термоядерного взрыва. В водородной бомбе используются реакции синтеза:
2
2
3
1
1 D + 1 D → 1T + 0 p + 4 MeV ,
(18.21)
2
3
4
1
1 D + 1T →1 He + 0 n + 17,6 MeV ,
(18.22)
6
1
4
3
3 Li + 0 n→1 He+ 1T
+ 4,8 MeV ,
(18.21)
Образующиеся в реакции (18.22) нейтроны имеют энергию около 14 МэВ,
238
поэтому могут вызывать деление ядер 92 U , который составляет более 99%
природного урана. Для усиления энергии взрыва, бомбу окружают оболочкой
из природного урана. Энергия взрыва термоядерных (водородной) бомб на 2–
3 порядка выше, чем ядерных, и составляет от 105–106 т в тротиловом
эквиваленте.
Управляемый термоядерный синтез, проходящий в регулируемых
условиях, пока еще не реализован. Наиболее перспективной реакцией для
управляемого термоядерного синтеза является реакция (18.22), так как она
протекает с наибольшей скоростью. При температурах Т~108 К,
необходимых для протекания реакции синтеза, основная проблема
заключается полностью ионизированной плазмы в зоне реакции. Одно из
решений проблемы – удержание плазмы магнитным полем (1950 г.,
идея советских физиков И.Е.Тамма (1895–1971) и А.Д.Сахарова (1921г.р.)) в
устройстве «ТОКОМАК», по которому продолжаются вестись работы. Это
сокращение от названия: «тороидальная камера с магнитными катушками».
Мировая значимость решения проблемы управляемой термоядерной
реакции в том, что запасы традиционных, невозобновляемых источников
энергии (нефть, газ, уголь) стремительно истощаются и человечеству
необходимы новые источники энергии, и, возможно, будущее за
управляемыми термоядерными реакциями.
234
Лекция 19. Элементы физики элементарных частиц
1. Классификация элементарных частиц. Кварковая гипотеза. Типы
взаимодействия элементарных частиц. Космическое излучение.
2. Виды ускорителей частиц.
19.1. Классификация элементарных частиц. Кварковая гипотеза.
Типы взаимодействия элементарных частиц. Космическое излучение
В настоящее время дать строгое определение элементарной частице
оказывается невозможным в силу постоянных открытий все новых и новых
частиц и их свойств. Под элементарными подразумевают такие частицы,
которым нельзя приписать внутренней структуры. Например, α-частица не
является элементарной, так как она состоит из двух протонов и двух
нейтронов, которые раньше считались элементарными, но на современном
уровне познания уже считаются состоящими из кварков, т.е. уже не
считаются элементарными. Кварки, правда, в свободном состоянии не
встречаются.
При постоянном открытии все новых и новых «элементарных» частиц
физики, тем не менее, верят, что, в конце концов, смогут найти истинно
элементарные частицы и понять структуру материи.
Основными характеристиками физических свойств элементарных частиц
являются их масса, спин, электрический заряд, магнитный момент частицы,
время жизни частицы. Большинство элементарных частиц нестабильно
(имеют малое среднее время жизни), в свободном состоянии стабильны
только протон, электрон и частицы, не имеющие массы покоя (всегда в
движении) – фотон, нейтрино. Собственную массу (массу покоя) частицы
определяют как константу, входящую в релятивистское соотношение для
2
2 2
энергии и импульса E = c p + m0 c :
m0 =
(E
2
)
− c2 p2 / c2 .
(19.1)
Используя соотношение Е0=m0c2 (см. предыдущую лекцию), массу
частицы можно выразить в энергетических единицах, например в электронвольтах (эВ).
Считается, что для каждой частицы существует античастица. Примеры
µ+
−
+
−
и µ , пионы π и π , каоны К– и К+, электронное ve и мезонное v µ
~ и v~ и т.д. Массы покоя, спины и времена
нейтрино и антинейтрино v
e
µ
0
частиц и античастиц: электрон 1 е и позитрон
0
+1 е ,
мюоны (мю-мезоны)
жизни у частиц и античастиц одинаковы. Электрические заряды у частиц и
античастиц равны по абсолютному значению, но противоположны по знаку.
Частицы, свойства которых полностью тождественны свойствам их
античастиц, называют истинно нейтральными частицами. К ним относятся
фотон, нейтральные мезоны
π 0 (пион) и К0 (каон).
235
При соединении частицы с античастицей происходит выделение
энергии, не меньшей удвоенной энергии покоя каждой из них. Образование
пары частица – античастица требует затраты энергии, большей, удвоенной
энергии покоя, так как рождающаяся пара должна иметь импульс и
кинетическую энергию.
Примером рождения (образования) пары частица–античастица
может служить образование электронно-позитронной пары при столкновении
жесткого γ- кванта (квант с большой энергией) с какой-либо заряженной
частицей, например с атомным ядром:
γ → −10 е+ +01 е .
Процесс соединения электрона и позитрона называется аннигиляцией
пары:
0
0
−1 е + +1 е
→ 2γ
Особенностью античастиц является их способность к быстрому
воссоединению со своими частицами, например позитронов с электронами,
антипротонов с протонами, антинейтронов с нейтронами. Это связано с тем,
что вещества, из которых построена окружающая нас природа, состоят из
электронов, протонов и нейтронов. Античастицы, искусственно созданные,
встречаясь в веществе со своими имеющимися в избытке частицами,
соединяются с ними и перестают существовать, вызывая рождение новых
частиц. Отличия нейтральных частиц от их античастиц устанавливаются по
различному характеру взаимодействия частиц и античастиц с веществом.
~ с
Примером могут служить реакции взаимодействия антинейтрино v
e
1
протонами 1 p и нейтрино ve с нейтроном 01 n (см. предыдущую лекцию):
v~e +11p → 01n + +10e , ve + 01n→11p + −10e .
Такие превращения зависят от типа фундаментального взаимодействия,
существующего между частицами.
В настоящее время все известные элементарные частицы делятся на
два больших класса и особую группу (таблица 19.1): два класса – сильно
взаимодействующих частиц (адроны) и слабо взаимодействующих частиц
(лептоны); особая группа – фотоны (гамма-кванты) с характерным для них
электромагнитным взаимодействием.
Адроны подразделяются на барионы и промежуточные частицы (см.
предыдущую лекцию) – мезоны с буквенными обозначениями и индексамизарядами (по модулю как у электрона) К (К–, К0, К+ – каоны),
π (π + , π 0 ,
π − – пионы), η 0. Все адроны, в конечном итоге, считаются состоящими из
кварков. Барионы делятся на нуклоны (протоны и нейтроны), гипероны с
греческими буквенными обозначениями и индексами-зарядами (по модулю
как у электрона) Λ 0, Ω –, Ξ 0, Ξ –, Σ –, Σ 0, Σ +, и барионные резонансы
(короткоживущие частицы). Название «гипероны» происходит от греческого
«гипер» – выше, а «барионы» – от греческого «барис» – тяжелый.
236
обозначение
частица
античастица
пион
заряженный
пион
нейтральный
каон
заряженный
каон
нейтральный
эта-мезон
π+
π−
273,1/139,57
0
≈ 10–8
π0
π0
264,1/134,97
0
≈ 10–16
K+
966,2/493,68
0
≈ 10–8
K0
K−
~
K0
974/497,67
0
≈ 10–10/ ≈ 10–8
η0
η0
1074/547,3
0
≈ 10–18
протон
p
1/2
стабилен
нейтрон
n
1836,2/
938,27
1838,7/
939,57
2183/1115,68
1/2
886,7
1/2
2328/1189,37
1/2
≈ 10–10
≈ 10–10
2343/1197,45
1/2
≈ 10–10
2334/1192,64
1/2
≈ 10–20
3273/1672,45
3/2
2573/1314,90
1/2
≈ 10–10
≈ 10–10
2586/1321,32
1/2
≈ 10–10
1/0,51
1/2
стабилен
1/2
стабильно
Лептоны
гипероны
Барион
лямбда
Фотоны
масса,
в массах
электрона/
МэВ
название
Адроны
Мезоны
класс/
группа
Таблица 19.1*
среднее время
жизни, с
сигма заряженный
сигма заряженный
сигма нейтральный
омега
кси нейтральный
кси заряженный
электрон/
позитрон
нейтрино
электронное
мю-лептон
(мюон)
нейтрино
мюонное
тау-лептон
(таон)
таонное
нейтрино
фотоны
~
p
n~
~
Λ0
~
Σ+
~
Σ–
~
Σ0
~
Ω–
~
Ξ0
~
Ξ–
Λ0
Σ+
Σ–
Σ0
Ω–
Ξ0
Ξ–
е−
е+
v~
ve
e
µ+
vµ
µ−
v~
206,8/105,66
1/2
≈ 10–6
0/<0,17
1/2
стабильно
τ−
v~
3487/1777,05
1/2
≈ 10–13
0/<18,2
1/2
???
0/0
1
стабилен
µ
τ+
vτ
–6
0/<35⋅10
спин
τ
γ
* приведенная классификация на данный момент не полна
Все барионы при реакциях могут превращаться в протоны или,
наоборот, из них получаться, например, при столкновении двух барионов
237
(протонов) высокой энергии образуются протон, нейтрон и пи-плюс-мезон
(плюс-пион):
P + P → p + n +π +
или два бариона (протона) могут породить пион, если их кинетическая
энергия при столкновении превышает соответствующую массу покоя пиона:
P + P → p +π 0.
Разность между числом барионов и антибарионов в системе называется
барионным числом. Для него верен закон сохранения: барионное число в
любом процессе остается постоянным (не изменяется с течением времени).
Барионы имеют полуцелый спин и являются фермионами, мезоны имеют
нулевой спин (целый) и являются бозонами.
Выделяемые в особую группу фотоны имеют спин s=1, нулевой
электрический заряд и нулевую массу покоя. Фотоны стабильны.
К лептонам относятся электроны, мюоны и электронное, мюон, таон,
мюонное и таонное нейтрино и их античастицы. Все частицы этой группы
обладают полуцелым спином s=1/2, имеют отличную от нуля массу покоя
(собственную массу), могут быть как электрически нейтральны, так и
~ , v , e− , e+ .
заряжены, например, ve , v
e
µ
В 1964 г. М.Гелл-Манн и Дж.Цвейг предложили гипотезу, согласно
которой все мезоны и барионы построены из простейших частиц,
получивших название кварки.
Слово «кварк» взято американским физиком М.Гелл-Маном
(Нобелевская премия по физике 1969г.) из фантастического романа
ирландского писателя Дж.Джойса «Поминки по Финнегану»: герою снился
сон, в котором чайки кричали тогда еще бессмысленные слова: «Три кварка
для мистера Марка».
Согласно этой гипотезе, барионы состоят из трех кварков: u (up –
вверх), d (down – вниз), s (strange – странный), антибарионы – из трех
антикварков (например, протон имеет кварковую структуру uud, а нейтрон
– udd). Эти кварки должны иметь полуцелый спин, их электрический заряд
должен быть равным 1/3 или 2/3 заряда электрона (дробный заряд!). В
дальнейшем было предположено существование еще трех кварков: с
(charmed – очарованный), b (beauty – красивый), t (truth – истинный) с
соответствующими антикварками. Комбинации кварков и антикварков дали
все известные мезоны. По современным представлениям, кварки лишены
внутренней структуры, в этом смысле их можно считать истинно
элементарными частицами. Хотя гипотеза кварков оказалась удачной, ибо
позволяла с единых позиций объяснить свойства большинства элементарных
частиц, но кварки в свободном состоянии не были обнаружены, несмотря на
многочисленные их поиски на ускорителях высоких энергий, в космических
лучах и окружающей среде. Сейчас трудно судить о том, сохранится ли эта
гипотеза или ей на смену придет другая. Важно то, что положено начало
созданию единой теории, объединяющей четыре фундаментальных
238
взаимодействия:
слабое,
сильное
(ядерное),
электромагнитное,
гравитационное (см. лекция 1, ч.II данного пособия).
Особенностью
элементарных
частиц
является
их
взаимопревращаемость
друг
в
друга.
Взаимопревращению
элементарных частиц, по современным данным, соответствуют четыре
типа физических взаимодействий: слабое, сильное (ядерное),
электромагнитное, гравитационное. Каждому типу взаимодействий
соответствуют свое поле и кванты этого поля, т.е. взаимодействия являются
обменными. Говоря иначе, частицы в процессе взаимодействия
обмениваются между собой квантами соответствующих полей. Это качество
легло в основу возможности объяснения различных видов взаимодействия
элементарных частиц как различные проявления единого взаимодействия. В
настоящее время создана единая теория слабых и электромагнитных
взаимодействий (электрослабое взаимодействие). Предпринимается попытка
создать единую теорию трех видов взаимодействий в микромире: слабое,
сильное, электромагнитное («Великое объединение»). Более смелые мечты
ученых связаны с поисками возможного суперобъединения, которое
включало бы и гравитационное. В этом случае в единую теорию структуры
материи наряду с кварками, лептонами и другими элементарными частицами
вошли бы и гравитоны.
Космические лучи были открыты при изучении причин возникновения
тока утечки ионизационных камер. Основным источником ионизирующего
излучения у поверхности Земли являются α-, β- лучи, γ-излучение
естественных радиоактивных изотопов. Если бы радиоактивные излучения
были единственным источником ионизации атмосферного воздуха, то по
мере подъема над поверхностью Земли интенсивность ионизации должна бы
уменьшаться. Но было установлено, что, например, на высоте 9 км
интенсивность ионизации в 10 раз больше, чем на уровне моря. На основании
этого было сделано предположение, что ионизирующее излучение приходит
на Землю из мирового пространства; это излучение было названо
космическим излучением (космическими лучами). Наиболее подробное
изучение космических лучей стало возможным после запусков спутников
Земли, космических ракет и межпланетных автоматических станций.
Различают: первичное и вторичное космическое излучение.
Первичное космическое излучение представляет собой поток протонов
(≈86%), ядер атомов гелия (≈13%) и атомов более тяжелых элементов (≈1%),
движущихся со скоростями, близкими к скорости света. Энергия
большинства частиц лежит в пределах от 109 до 1012 эВ. Вторичное
космическое излучение образуется в результате взаимодействия первичного
излучения с ядрами атомов атмосферы Земли. Во вторичном космическом
излучении встречаются все известные элементарные частицы.
Исследования последних лет показали, что интенсивность
космического излучения не постоянна во времени, что связано с
изменением
активности
Солнца,
которая,
согласно
академику
А.Л.Чижевскому влияет даже на человеческую активность и общество.
239
Согласно Чижевскому (см. монографию «Земля в объятиях Солнца») самые
кровопролитные в истории человечества войны случались во время вспышек
при высокой солнечной активности, а самые свирепые эпидемии (холеры,
т.п.) – во времена спада солнечной активности. Во время солнечных вспышек
интенсивности
космических
лучей
может
расти
многократно.
Предположительно некоторая часть космических лучей генерируется
Солнцем, но основная часть космического излучения возникает, вероятно,
при взрывах сверхновых звезд.
Первые сведения о распределении ионизирующего излучения вблизи
Земли были получены с помощью второго искусственного спутника Земли. В
околоземном пространстве существуют области, в которых интенсивность
потока заряженных частиц, захваченных магнитным полем Земли,
превышает интенсивность первичного потока космического излучения в
межпланетном пространстве в сотни миллионов раз. Эти области названы
радиационными поясами. Ранее считалось, что Земля окружена двумя или
тремя радиационными поясами. В настоящее время установлено, что
радиационный пояс Земли представляет собой единое образование.
Внутренняя граница радиационного пояса в плоскости экватора находится на
расстоянии 600 км от поверхности Земли в западном полушарии и около
1600 км в восточном. Внешняя граница пояса в плоскости экватора
находится на расстоянии 8–10 радиусов Земли. Несимметричное
расположение радиационного пояса Земли объясняется тем, что движение
заряженных частиц определяется структурой магнитного поля Земли.
Изучение радиационных и космических лучей служит источником получения
информации из мирового пространства. Их действие необходимо учитывать
при космических полетах, так как интенсивность космических лучей
оказывает определенное воздействие на организм человека.
19.2. Виды ускорителей частиц
(перед изучением данного вопроса желательно изучить вопрос 3, лекция
8, ч.II данного пособия)
В магнитном поле действие силы Лоренца искривляет траекторию
частицы, сообщая ей центростремительное ускорение, таким образом,
траектория заряженных частиц при наличии магнитного поля может быть
прямолинейной только в случае, когда сила Лоренца скомпенсирована
силами иной природы (например, электрические силы).
Из формул (8.17) и (8.19) ч.II данного пособия видно, что при
увеличении индукции В, шаг и радиус винтовой линии уменьшатся. На этом
эффекте основана фокусировка частиц в магнитном поле.
Ускорителями частиц называются устройства, в которых под действием
электрического и магнитного полей создаются и управляются пучки
заряженных частиц. Напомним, что электрическое поле (ЭП) действует на
подвижные и неподвижные заряженные частицы, а магнитное поле (МП) –
только на движущиеся заряженные частицы. Ускорители характеризуются
240
типом частиц, энергией сообщенной им, распределением частиц по энергиям
и интенсивностью пучка. По действию ускорители делятся на
непрерывные (постоянный и равномерный во времени пучок частиц) и
импульсные. По форме траектории и механизму ускорения частиц,
ускорители делятся на
- линейные (траектория – прямая линия; ускорение в ЭП);
- циклические (траектория окружность или спираль; ускорение
согласованными переменным ЭП и постоянным МП, или наоборот);
- индукционные (траектория окружность или спираль; ускорение
согласованными вихревыми (переменными) ЭП и МП, например, в
бетатроне).
v
E
E
v
Рис. 19.1
Например, смену «полярности» ЭП на противоположную (частоту
колебаний ЭП) можно подобрать таким образом, чтобы частица, описывая
полуокружность, вновь ускорялась ЭП (рис. 19.1, то же на витке спирали).
Колебания ЭП согласованы с полупериодом вращения частицы по
окружности или спирали.
Фазотроны (синхроциклотрон), синхротроны и синхрофазотроны –
ускорители, в которых используется фазировка пучков заряженных частиц:
согласование соответствующих колебаний полей по фазе путем изменения
величины управляющего поля и/или изменением частоты электромагнитных
полей для разгона частиц до максимально возможных в данном ускорителе
энергий (например, для электронов достижимы энергии ~10 ГэВ).
241
Лекция 20. Физическая картина мира.
Физика – фундамент инженерной практики
1. Основные положения современной физической картины мира
Представления современной физики об эволюции Вселенной.
2. Наш трехмерный мир. Многомерное пространство. Суперструны.
3. Уроки физики.
Заключительная лекция является обобщающей. В ней делается
ретроспективный взгляд
на то, что было изложено раньше, физика
рассматривается несколько “издали” и предпринимается попытка
презентации величественного здания Физики как основы естествознания,
техники и технологии, а значит, всей инженерной деятельности, а также
Физики как важной части современной культуры и цивилизации. Ряд
позиций представлен в лекции в виде кратких тезисов – каждый из них в
литературе развернут в десятки, сотни книг и статей.
20.1. Основные положения современной физической картины мира
Представления современной физики об эволюции Вселенной
-
Материя в окружающем мире образует некоторую последовательность
структурных форм, “вложенных друг в друга”. Во Вселенной проявляется
локальная неоднородность в распределении материи, что прямо
указывает на неравновесный характер её развития.
-
Из всех космических объектов для человечества выдающееся значение,
очевидно, имеет Земля. Условия возникновения, уровень гравитации и
положение Земли в космосе сделали возможным образования на ней очень
большого многообразия различных веществ (не имеющего аналога в
обозримом космосе). Приток солнечной энергии, образование атмосферы,
температурный режим, существование воды в жидком состоянии и ряд
других факторов привели на определённом этапе эволюции Земли к
возникновению на ней жизни.
-
Вакуум не является просто «пустотой»; в нём непрерывно
возникают виртуальные частицы (парами: частица-античастица).
Зарегистрировать их появление весьма сложно, так как обычно их время
жизни τ<∆t – времени, необходимого для регистрации частицы, которое,
согласно соотношению неопределённостей Гейзенберга, ∆t >ħ/(2mс2).
Реальными такие частицы могут становиться при наличии сильных внешних
полей. Например, электрическое поле, расходуя свою энергию на удаление
виртуальных электрона и позитрона друг от друга, создаёт эффект рождения
реальных частиц из вакуума.
242
-
Имеется ряд данных, косвенно свидетельствующих о неизвестных нам
состояниях вакуума. Так, рождение Вселенной трактуется как
“возникновение из ничего”, однако то, что понимается под словом
“ничего” есть физически ненаблюдаемое для нас состояние материи –
состояние так называемого “ложного вакуума”. Подробнее – в дополнении
проф. В.Н.Лозовского, см. ниже.
-
В микромире симметрия свойств частиц нарушается, причём, для
частиц и античастиц по-разному. Вследствие этого на начальных стадиях
эволюции Вселенной вещество возникло в значительно больших количествах
по сравнению с антивеществом. В обозримой Вселенной материя почти на
100% представлена поэтому именно веществом.
-
Элементарными называются микрочастицы, представляющие собой
простейшие формы материальных структур вплоть до ядра атома – протона.
Элементарные частицы делят на две большие группы – лёгкие (лептоны) и
тяжёлые (адроны). Последние образованы кварками (двумя или тремя).
Возможно, что и лептоны (например, электрон) имеют внутреннюю
структуру.
-
Общепринятой моделью происхождения Вселенной является так
называемая “модель Большого Взрыва и горячей Вселенной”. Эта модель
вытекает из уравнений общей теории относительности и находит ряд
серьёзных подтверждений в наблюдательной астрономии и астрофизике. В
соответствии с этой моделью до взрыва вся материя Вселенной была
сконцентрирована в одной исходной точке, в которой плотность материи и
энергии и кривизна пространства-времени были бесконечны, то есть,
пространство было свёрнуто в точку – до взрыва не существовало ни
времени, ни пространства и поэтому лишён смысла вопрос, о том, “что было
до Большого Взрыва?” Указанная точка называется космологической
сингулярностью. В ней утрачивают силу все законы физики и идеи о
свойствах материи оказываются за пределами изведанного. Оценки,
основанные на данных о движении галактик, приводят к выводу, что
Большой Взрыв произошёл 15 млрд. лет назад.
-
Сразу после взрыва материя (вещество + излучение) были в очень
горячем состоянии (Т~1032 К). Затем началось расширение Вселенной с
убывающей скоростью. Это расширение изотропно и проявляется в том, что
галактики и галактические скопления удаляются друг от друга со скоростями
V, пропорционально расстояниям R между ними (закон Хаббла):
V=HR
Постоянная Хаббла равна 75 Км/(с⋅Мпк). Если R измеряется в мегапарсеках
(1Мпк~3,1 ⋅ 10 19 км), то [V]=км/с. В астрофизике скорости галактик
относительно Земли определяются по красному смещению спектральных
линий в их излучении в соответствии с эффектом Доплера.
243
-
Образование атомов (вначале самых простых – водорода и гелия) стало
возможным только при охлаждении до Т~109 К, через τ~100 с после взрыва.
-
Звёзды возникли из газовых облаков, образовавшихся из галактик за
счёт случайных неоднородностей и гравитационных сил. Такие протозвёзды
сжимаются, гравитационное поле их нарастает (так как радиус уменьшается
при m=const), температура растёт. Затем начинаются термоядерные реакции
слияния ядер водорода с образованием гелия. Возникает весьма высокое
тепловое давление, которое противостоит гравитационному сжатию →
коллапс останавливается на τ~1010 лет. Солнце находится в середине этой
стадии (~ 5⋅109 лет ). После выгорания водорода – опять сжатие, затем
синтезируются гелий, углерод, кремний – также около ~5⋅109 лет. Затем
звезда вновь сжимается и температура повышается до таких значений, что
происходят мощные выбросы тяжёлых элементов, иногда сопровождаемые
огромными взрывами (“взрывы сверхновых” – звезда по яркости
превосходит излучение всей её галактики).
-
После завершения термоядерных реакций остатки звезды вновь
испытывают сжатие, в ходе которого разрушаются электронные оболочки
атомов и образуется весьма плотная смесь голых ядер и свободных
электронов – образуется плазма с высоким внутренним давлением. Если
масса остатков звезды М < 1,25Мс, где Мс – масса Солнца, это давление
предотвращает дальнейшее сжатие. Возникает устойчивое образование –
белый карлик с плотностью ~ 60 т/см3.Если же масса остатков М > 1,25Мс,
то давление плазмы не в состоянии уравновесить силы гравитационного
сжатия, и коллапс звезды продолжается. Достигается столь высокая
плотность вещества, при которой электроны вдавливаются в ядра и,
объединяясь с протонами, превращают их в нейтроны – формируется
устойчивая нейтронная звезда с плотностью ~20 млрд. т/см3.
Нейтронные звезды имеют малые размеры (15 – 20 км в поперечнике),
и, как правило, быстро вращаются (ν ≈ 1 об/с). Некоторые из них обладают
сильными магнитными полями, взаимодействие которых с окружающим
веществом сопровождается излучением радиоволн, регистрируемых на Земле
в виде регулярных импульсов. Такие объекты получили название пульсаров.
Если М > 3MC, то давление нейтронного вещества не может остановить
дальнейшее сжатие. В таких условиях вообще не существует известных нам
сил в природе, способных противостоять гравитации. Наступает коллапс.
Звезда стягивается в точку с бесконечной плотностью вещества и
бесконечной кривизной пространства – времени => образуется
сингулярность со свернутым пространством – временем. Вокруг нее
возникает гравитационно-замкнутая область, ограниченная сферической
поверхностью с R ≈ 10 км, называемая горизонтом событий. Все
материальные объекты, включая свет, попавшие внутрь этой поверхности,
затягиваются в сингулярность, и, как таковые, исчезают из Вселенной. Такие
объекты получили название черных дыр. По-видимому, в сингулярности
244
материя существует в какой-то другой, неизвестной нам форме. Свернутость
пространства – времени говорит о неприменимости известных нам законов
физики к таким формам.
Существует рад фактов в наблюдательной астрономии, которые просто
и естественно могут быть объяснены, если признать реальным
существование черных дыр во Вселенной. В основе этих фактов лежит
действие сильного гравитационного поля, создаваемого сингулярностью, на
движение окружающих тел. Кроме того, поле притягивает и ускоряет до
очень больших скоростей потоки газа и космической пыли. Столкновения
между частицами в таких потоках сопровождаются мощным рентгеновским
излучением, регистрируемым с искусственных спутников Земли.
- Современные модели эволюции Вселенной следуют из решения уравнений
общей теории относительности, полученного советским математиком А. А.
Фридманом. В условиях, когда распределение материи в целом
однородно, а ее движение изотропно, возможны 3 модели эволюции,
выбор между которыми определяется соотношением средней плотности
материи во вселенной ρср и так называемой критической плотности ρкр.
- Если ρср > ρкр, то расширение Вселенной сменится ее сжатием и
последующим схлопыванием (“Большой хлопок”). В этой модели Вселенная
замкнута, конечна, пространство имеет положительную кривизну и
описывается геометрией Римана. Двухмерным аналогом такого
пространства может служить сфера. Подобная модель называется закрытой;
- если же ρср < ρкр, расширение будет продолжаться вечно. Скорость
расширения, убывая после большого взрыва, будет стремиться к некоторому
пределу. В этой модели Вселенная бесконечна, пространство имеет
отрицательную кривизну и описывается геометрией Лобачевского.
Двухмерный аналог – гиперболический параболоид (седло).
- если ρср = ρкр, то, как и в предыдущей модели, расширение будет
продолжаться вечно, но V будет ассимптотически→ 0. Вселенная в этой
модели бесконечна, пространство не искривлено, то есть является плоским и
описывается геометрией Евклида.
Оценка критической плотности не слишком сложна; сейчас ее значение
ρкр≈ 10-29 г /см3. Оценка ρср крайне затруднительна; во Вселенной существует
огромное число “темных объектов”, массу которых определить очень
245
сложно. В 1997 г. 5 групп астрофизиков в США получили оценку ρср ≈ (2
±5)10-31 г/см3, что говорит в пользу второй модели. Для доли темной
энергии получено оценочное значение – 70 %.
В конце января 2007 г датскими учеными Йеспером Соллерманом и
Тамарой Дэвис из Центра темной космологии Копенгагенского университета
при Институте Нильса Бора (University of Copenhagen’s Dark Cosmology
Centre at the Niels Boht Institute) в журнале Space Daily опубликован цикл
новейших данных, из которых авторы делают вывод, что вопреки тенденции
последних десятилетий к постоянному усложнению космологической
модели, лучшей моделью, которая объясняет акселерацию Вселенной,
остается та, которую предложил Эйнштейн в 1917 г. Недавно начата работа
по масштабной международной программе ESSENCE (участники – 38
ведущих физиков из многих стран четырех континентов). Главная задача
Программы ESSENCE – измерить темную энергию с 10 % - погрешностью.
Судя по всему, космологическая постоянная (вопрос 2 лекции 7 1-й части –
Л.С.Лунин, А.В.Благин, А.А.Баранник, Новочеркасск, 2004) отражает силу
отталкивания, вследствие которой продолжается разбегание галактик и
общее расширение Вселенной. Возникновение же этой силы трактуется как
квантовый эффект, связанный с преобразованием энергии вакуума в энергию
движения материи. Об этом эффекте мы пока знаем очень мало. Однако еще
выдающийся нобелевский лауреат Ричард Фейнман (1911-1985) – см. начало
лекции 11 в настоящем издании, - указал на то, что энергетический
потенциал вакуума колоссален – “энергии вакуума, заключенной в объеме
обыкновенной электрической лампочки, хватило бы, чтобы вскипятить
все океаны на Земле”.
(Данные по исследованиям датчан приведены по сообщению Марины
Аствацатурян в рубрике “Радиоэхо” газеты “Поиск”, 2 февраля 2007 г).
До недавнего времени одним из самых сложных вопросов физики был
вопрос о самоорганизации материи – мы наблюдаем самопроизвольное
структурное и количественное усложнение материальных объектов; при этом
их энтропия убывает, что локально противоречит 2 закону термодинамики –
главному закону природы. В последние 20-25 лет наметилось позитивное
решение этой проблемы – теория диссипативных структур, или
синергетика (И.Пригожин, Бельгия). Согласно этой теории, за счет
гигантских флуктуаций в распределении материи (случайных отклонений),
имеющих место в системах, далеких от состояний равновесия, возможны
значительные оттоки энтропии, которые движут системы “вспять второму
началу” от беспорядка к порядку. В рамках этой теории намечается решение
проблемы возникновения жизни на Земле, как следствие некой вселенской
флуктуации.
246
Дополнение. (Лекция проф. В.Н.Лозовского, прочитанная в
феврале 2004 г по курсу “Концепции современного естествознания”
студентам специальности “Микроэлектроника и твердотельная
электроника”).
Понятие вакуума часто используется в различных псевдонауках для
«затуманивания» мозгов доверчивых и недостаточно грамотных людей.
Важно также отметить, что рассказ о вакууме можно построить так, что на
одном реальном примере убедительно продемонстрировать, чем отличается
по своему «происхождению» истинная наука от псевдоучений. Дело в том,
что псевдонауки (астрология, уфология, хиромантия, экстрасенсорика и т.д.)
представляет собой умозрительные построения, они “выдумываются”
авторами, т.е. не имеют экспериментальных основ и строгих теоретических
обоснований. Истинная наука не выдумывается, она доказательно
извлекается из природы вещей как неизбежное следствие строгих
экспериментов и строится с помощью проверенных многими
поколениями ученых теоретических методов. Иными словами, наука
“навязывается” человеку природой, а псевдонаука “навязывается” одними
людьми другим.
Понятием “физический вакуум” обозначается реальность, которую
ранее называли эфир, а именно то, что «остается», если убрать все
вещественное. Более тысячи лет эфиру приписывали свойства особого,
тонкого вещества, которое заполняет все пространство, но не препятствует
движению тел.
Несмотря на титанические усилия многих поколений ученых,
работающую модель эфира создать не удалось. Оказалось, что эфир в виде
особого тонкого вещества никак не обнаруживается и не может даже служить
системой отсчета при описании движения тел. (Опыты А. Майкельсона, 1881,
1886-87, 1929 годы).
Современные представления об эфире, но уже в качестве физического
вакуума, возникли «сами собой», при построении релятивистской квантовой
теории электрона английским ученым П. Дираком. (1930 г.). При создании
этой теории необходимо было использовать релятивистскую формулу,
связывающую энергию и импульс: W = ± c 2 p 2 + c 4 m 2 , где т и р – масса и
импульс электрона соответственно. Приведенное выражение соответствует
энергетическому спектру электрона, который приведен на рис. 20.1.
Положительные значения энергии (W+) в этом спектре отражают
обычные, наблюдаемые состояния электронов. Состояние для электронов с
отрицательными энергиями (W--) никогда не наблюдали. Кроме того, если
действительно существуют пустые энергетические квантовые состояния с
отрицательной энергией, то. на них должны самопроизвольно перейти
(переходы тип I на рис. 20.1, а) электроны с высших (положительных)
уровней, выделяя излишек энергии ≥ 2mc 2 = hv в виде γ -кванта. Иными
словами, все наблюдаемые электроны с положительной энергией неизбежно
должны «провалиться» на отрицательные уровни. Однако этого не
247
происходит. Электроны, образующие вещество, продолжают существовать.
Чтобы “спасти” теорию, Дирак предположил, что все уровни с отрицательной энергией уже заняты электронами и поэтому переходы типа I
запрещены (по принципу Паули).
Бесконечное число квантовых состояний с отрицательной энергией,
занятых электронами, называется “Море Дирака”. Море Дирака вместе с
системой положительных уровней энергетического спектра электронов и
составляет основу современного представления о физическом вакууме. В
рассмотренном примере - это так называемый электронно-позитронный
вакуум. Он может порождать электроны и их античастицы (позитроны).
Имеются и другие виды вакуума (протонно-антипротонный и т.д.).
Сами по себе электроны в Море Дирака ненаблюдаемы. Их,
например, нельзя непосредственно использовать для формирования
электронного луча в телевизоре. Однако из рис. 20.1,б) ясно, что если
“направить” в вакуум (а это значит куда угодно, т.к. вакуум - везде)-квант
γ -излучения с энергией hv ≥ 2mc 2 , то из Моря Дирака будет выбит электрон и
он перейдет в состояние с положительной энергией, т.е. станет реальным,
непосредственно обнаружимым (переход II на рис. 20.1,6). По закону
сохранения заряда одновременно должен появиться такой же по величине, но
противоположный по знаку заряд, т.е. положительный “дубликат” электрона
- антиэлектрон.
w+
w+
hv ≥ 2mc 2
mc2
mc2
0
2mc 2
0
hv ≥ 2mc 2
I
I
+
w−
+
w−
а)
б)
Рис. 20.1. “Море Дирака”
Антиэлектрон на схеме рис. 20.1 является просто свободным
энергетическим уровнем (“дыркой”). Антиэлектрон (предсказанный Дираком
в 1931 г.) назвали позитроном и открыли экспериментально в 1932 г.
(американский ученый К. Андерсон, получивший за это в 1936 г.
Нобелевскую премию). Позднее установили, что все элементарные частицы
имеют античастицы. Итак, из современного представления о физическом вакууме автоматически следует неизбежность существования в природе
помимо частиц их двойников - античастиц.
248
Из рисунка 20.1, а) видно, что встреча электрона со свободным
квантовым состоянием (дыркой) завершается переходом типа I, что называют
аннигиляцией - взаимным уничтожением электрона и дырки. При этом
выделяется энергия, равная или большая 2тс2 . Ее носителем может
оказаться γ -квант электромагнитного излучения. И это предсказание
современной теории вакуума также было подтверждено экспериментально.
Известно, что любая квантовая система (в отличие от классической) не
может быть переведена в «обездвиженное» состояние, в состояние с
энергией, равной нулю. В состоянии с наименьшей энергией в ней
продолжаются так называемые нулевые колебания. Они, воздействуя на
электроны с отрицательной энергией, могут переводить их в состояния с
положительной энергией по схеме II (рис. 20.1,6). Возникают электрон и его
античастицы (позитрон). На возникновение частицы и античастицы
расходуется энергия порядка ∆W = 2mc 2 , что больше средней энергии
нулевых
колебаний.
Следовательно,
(согласно
соотношению
h
) возникшая пара частиц может существовать
4π
h
≈ 10 − 21 с и поэтому
лишь в течение крайне малого времени ∆τ =
4π∆W
неопределенности ∆τ ⋅ ∆W ≥
экспериментально необнаружимы. Такие частицы называются виртуальными. Следовательно, в электронно-позитронном вакууме непрерывно, в
неограниченном количестве и спонтанно возникают виртуальные электроны
и позитроны. Сами по себе они непосредственно необнаружимы, однако
непрерывно воздействуют на реальные частицы и на атомы.
Теория предсказывает, что, воздействуя на атомы, виртуальные
частицы изменяют частоты их электромагнитного излучения, т.е. атомный
спектр. В наибольшей степени сдвигаются спектральные линии излучения
самого легкого атома -атома водорода. Для одной из спектральных линий
атома водорода теоретический расчет (с учетом влияния виртуальных
электронно-позитронных пар) дал частоту vT =1057,864 МГц. В
экспериментах, проведенных в 1947 г. американским физиком У. Лэмбом,
найдено, что νЭ =1057,862 МГц. Полученное совпадение (с точностью
порядка 10-5 %) продемонстрировало высокую предсказательную силу
современной теории вакуума. За этот результат У. Лэмб получил
Нобелевскую премию (1955 г.).
Виртуальные частицы влияют также на магнитный момент электрона.
Магнитный момент частиц принято оценивать величиной, которая
называется магнитным фактором «g», g-фактор – это магнитный момент
еh
, отнесенный к спиновому
2mc
h
). Для электрона согласно
моменту, выраженному в единицах h ( h =
2π
частицы, выраженный в магнетонах Бора µ В =
классической
электродинамики
g/2=1.
Эксперимент
дает
g/2-=
1,00115965240. Это расхождение классической теории с экспериментом
отлично объясняется квантовой электродинамикой (КЭД), которая
249
учитывает
влияние
виртуальных
электронов
и
позитронов,
взаимодействующих с рассматриваемым реальным электроном. Из КЭД
следует, что g/2= 1,00115965238. Таким образом, теоретический результат
совпал с экспериментальным с точностью до 10—9%. Это убедительно
демонстрирует состоятельность современной теории физического вакуума.
Отметим, что приведенный теоретический результат получен в 1981 г. с
помощью самых мощных ЭВМ того времени, причем учтено 800 слагаемых,
отражающих участие в воздействии на рассматриваемый реальный электрон
все более сложных комбинаций окружающих его виртуальных электронов и
позитронов.
Современные представления о вакууме вскрывают также механизм 4-х
фундаментальных сил. Все эти силы оказываются обменными. При
взаимодействии двух реальных частиц они непрерывно обмениваются
частицами - квантами взаимодействия. Все частицы - переносчики
взаимодействия
являются
виртуальными.
Для
электромагнитного
взаимодействия это, например, виртуальные фотоны.
По относительному «объему» физический вакуум «занимает» во
Вселенной почти все пространство; вещества в этом объеме менее 10—50%.
Из всех частиц число реальных составляет ничтожно малую долю, остальное
- виртуальные частицы. Таким образом, вакуум - основа окружающего нас
мира, основная форма материи.
Итак, физический вакуум – везде присутствующая сложная
материальная динамическая квантовомеханическая система, "для которой
характерны непрерывные (нулевые) колебания и связанные с ними
постоянно возникающие и исчезающие виртуальные частицы и античастицы,
порождающие реальные частицы, влияющие на их взаимодействия и на
свойства частиц и атомов.
Никакие процессы микромира не могут быть поняты без учета влияния
на них вакуума.
Никакая строгая теория возникновения и эволюции Вселенной не
может быть построена без учета свойств и роли вакуума.
Вакуум – единая квантово-механическая система. Поэтому и вся
Вселенная - единая целостная система.
20.2. Наш трехмерный мир. Многомерное пространство. Суперструны
Мы живем в 3-х-мерном пространстве. Зададимся вопросом, возможно
ли формирование и существование привычных нам материальных тел в
пространстве иной размерности? Вопрос далеко непростой. В весьма четкой
трактовке его обсуждают Н.П.Калашников и М.А.Смондырев в одном из
лучших современных учебников по физике - “Основы физики” в 2-х томах,
М., “Дрофа”, 2003, том 1. Изложим здесь их рассуждения в форме тезисов.
- Теорема Гаусса (см., например, Л.С.Лунин, А.В.Благин, А.А.Баранник,
“Лекции по физике”, часть 2 – “Электромагнетизм и колебания”,
Новочеркасск, 2006. Лекции 1 и 2), может быть получена из закона Кулона.
250
Верно и обратное – на самом деле, закон Кулона - частный случай теоремы
Гаусса для пары точечных зарядов в вакууме. То есть, теорема Гаусса носит
более общий характер, чем закон Кулона, так например, ее можно применять
к пространствам с размерностью D, где D не обязательно равно 3.
- Предположим, что мы живем в D-мерном пространстве – какой же будет
физика в этом странном мире? Возьмем точечный заряд и мысленно окружим
его сферой радиуса r. Поскольку объем сферы в нашем, 3-х-мерном мире,
4 3
πR ,
3
2
а площадь ее поверхности - S = 4πR ,
V =
(*)
(**)
значит, в D-мерном пространстве эти величины будут соответственно:
D −1
VD = CR D
, и S D = LR
, где C и L – некоторые числовые
коэффициенты. (В 2-мерном пространстве “сферой” является круг, и его
площадь есть аналог объема (*) для 2-мерного случая, V2 = πR , роль
“поверхности” (**) играет окружность, а ее длина есть аналог площади для 22
мерного мира, S 2 = 2πR ). Наши же объемы (*) – это ограничивающие
поверхности для “объемных шаров” 4-х мерного мира, уже недоступные
нашему восприятию.
1
- Поток вектора напряженности в D-мерном мире пропорционален ErD-1 и
должен быть пропорционален также, согласно теореме Гаусса, величине
заряда внутри сферы. Отсюда
E=K
q
r D −1
, где K – опять некий коэффициент пропорциональности.
Аналогичный вид, будет, очевидно иметь и сила гравитации D-мерном мире.
При D = 3 получаем привычный закон обратных квадратов, E ~ r-2
- обычный закон Кулона. При D = 2 имеем: E ~ r-1 ,
а именно так зависит от расстояния поле заряженного бесконечного
цилиндра – эта система имитирует электрическое поле в 2-мерном мире!
Аналогично можно прийти к полю плоскости, напряженность которого
постоянна, а потенциал всюду зависит только от одной координаты –
расстояния до плоскости! Плоскость – одномерный мир; точки, находящиеся
на одном и том же расстоянии от плоскости, с точки зрения 1-мерного
наблюдателя – это одна и та же точка!
- В 4-х мерном мире закон Кулона принял бы форму E ~ r-3 - отсюда
заключаем, что закон обратных квадратов есть прямое следствие 3-хмерности нашего мира.
251
Поскольку ϕ = - ∫Edr + const, поведение потенциала в мирах с различной
размерностью D можно описать зависимостями:
 1 D − 2 , D ≥3,
 r
ϕ ~  ln r, D = 2;
 r,
D =1.

- Отсюда следуют любопытные выводы. Поскольку в 1- и 2-мерном мирах
потенциалы растут на бесконечности, нужна бесконечно большая работа,
чтобы развести 2 притягивающихся заряда. Это означает, что в таких мирах
возможно лишь финитное движение (движение в ограниченной области
пространства). Поэтому в мирах с D =1,2 нельзя ионизировать атом (и
сделать работающую батарейку, например!), нельзя запустить спутник за
пределы земного тяготения. В таком мире не было бы химических реакций (а
значит, не возникла бы жизнь, и вообще, любой организм – это огромная по
разнообразию химических – биохимических реакций - фабрика), не могли
бы эволюционировать галактики и звезды. Даже если предположить некий
инопланетный разум, носителем которого являются неорганические объекты,
его жизнь в мирах малой размерности – с нашей, “человеческой” точки
зрения была бы невообразимо скучна.
- Можно было бы ожидать более интересной и насыщенной жизни в
многомерных (D ≥ 4) мирах. Увы, это – тоже иллюзия. Исследование
уравнений движения
r
r
d 2r
r K
m 2 = − D −1
rr
dt
приводит к выводу, что при D ≥ 4 в сущности отсутствует финитное
движение: оно реализуется только для круговых орбит, да и то является
крайне неустойчивым – малейшее возмущение приводит к падению
электрона на ядро или планеты на звезду, или убеганию этих тел на
бесконечно большое расстояние. В таком мире атомы, планетные системы и
все остальное вообще не могло бы образоваться. Никакой стабильности в
мирах высшей размерности – вот альтернатива 1- и 2-мерному “скучным”
мирам.
Только при D =3 возможно как устойчивое финитное, так и инфинитное
движение. Получается, что 3-х-мерное пространство – единственно удобная
форма существования и движения материи, по крайней мере, известных нам
ее видов, которые мы изучаем в физике – конец сокращенной цитаты.
То есть, мы не должны допускать равноправия, если не вообще
“права на жизнь” миров иной размерности. Хотя, возможно, существуют
некие иные, с нашей точки зрения – не “равноправные” нашим 3-м,
измерения – о них речь пойдет дальше, свернутые для 3-мерных
252
наблюдателей, и проявляемые для нас как фундаментальные
взаимодействия (природу которых мы до сих пор не знаем. Мы не знаем,
почему тело, обладающее массой, притягивает к себе другие массы. Не
знаем, что такое заряд. И поле – как гравитационное, так и
электромагнитное, а также поля слабых и ядерных взаимодействий – мы
умеем описывать механизм их силового и структурирующего действия,
однако единственное, что мы можем сказать о поле, это то, что оно
представляет собой некое возмущение пространства, убывающее с
расстоянием, и могущее “отрываться” от объекта – своего источника и
путешествовать независимо от него (как кот Матроскин, который гулял
сам по себе) – в виде волн).
В физике элементарных частиц еще много нерешенных вопросов.
Например, что может быть началом в ряду: атомы, ядра, адроны, кварки...
Очевидно, что так продолжаться до бесконечности не может. Началом
должна быть какая-то материальная система, не относящаяся к типу частиц, а
иной природы. Например, возможно, в качестве самой элементарной
«частицы» выступает некое возбуждение физического вакуума или какое-то
«неточечное» образование. Подобные гипотезы постоянно обсуждаются.
Однако они еще не переросли в общепризнанные теории. Для примера
познакомимся с основной идеей так называемой М-теорией (М - от mystery
загадка, тайна). Ее считают достаточно перспективной.
В М-теории показано, что исходным объектом для элементарных
частиц может быть не точечный, а подобный струне, но в многомерном
пространстве (суперструна). В рамках четырехмерного пространства
суперструне приписывают очень малый размер (10-34 см). Легко представить,
что отрезок струны, рассматриваемый с очень большого расстояния r
(r>>10-34 см), будет выглядеть как точка (частица). Однако фактически
являясь струной, он имеет бесконечный набор частот собственных колебаний
vi , проявляющихся в пространстве в виде волн с квантами hvi
( h = 6,62 ⋅ 10 −34 Дж ⋅ с - постоянная Планка). Согласно корпускулярно-волновому
дуализму этим квантам соответствуют некоторые частицы. Так струна
порождает самые элементарные частицы, на основе которых образуются
более сложные составные; кварки, адроны и т.д.
М-теория оперирует двенадцатимерным пространством. Однако она
позволяет «свернуть» все «ненужные» измерения и перейти к обычному 4-х
мерному пространству и объяснить происхождение элементарных частиц.
Кроме того, эта теория в принципе позволяет свести четыре
фундаментальные взаимодействия к меньшему их числу и в пределе к
одному – к так называемой Суперсиле. Важно также, что М-теория допускает
существование разных миров и определяет условия, обеспечивающие
возникновение нашего мира. Поэтому ее иногда называют «теория всего».
Однако М-теория еще недостаточно разработана и не общепризнанна.
253
20.3. Уроки физики
Трудно переоценить роль физики для развития техники, а значит, по
праву физика является основой инженерного образования. Но идеи, которые
генерирует эта наук, имеют куда более широкое значение – для всего
естествознания, даже для гуманитарных дисциплин, а значит, и всей
культуры в целом. Физику можно смело отнести к общечеловеческим
ценностям.
Рассмотрим физику с позиций компоненты цивилизации,
генерирующей идеи для многих других, “нефизических” областей
естествознания и для традиционной гуманитарной культуры.
Анализ этой ситуации был несколько лет назад блестяще проведен
замечательными физиками – Грибовым и Прокофьевой в своих “Основах
физики”. Великолепным примером является принцип дополнительности.
Понятие “дополнительность” было введено в науку Н. Бором в 1928 г.
в
период
становления
квантовой
механики
и
интенсивных
экспериментальных исследований микромира (атомов, молекул и т.д.). Нильс
Бор, отправляясь от решения чисто физических проблем, сразу же понял
общность этого принципа и уже в одной из своих первых работ смело
перекинул мост от физики к психологии и вообще ко всей теории познания и
формирования образа окружающего мири. Именно поэтому принцип
дополнительности следует считать одним из важнейших достижений науки,
и его знание нсоб ходимо для понимания очень многих фундаментальных
проблем философии и явлений окружающего нас мира.
Начнем с простейших рассуждений. Уже при исследовании
равномерного
прямолинейного
движения
материальной
точки
обнаруживается, что полное представление об этом движении можно
получить только в том случае, когда даны ответы на два вопроса: где в
данный момент находится точка и с какой скоростью она движется?
Ответы на эти вопросы в общем случае и прогноз движения точки возможны,
если задать уравнение ее движения. Для этого должны быть известны масса
точки и действующие на нее во время эксперимента силы. Однако и таких
сведений недостаточно: чтобы прогноз был вполне определенным, надо еще
указать, где было расположено тело в начальный момент и с какой скоростью
оно двигалось. Мы опять сталкиваемся с той же парой величин: координатой
(ее задание дает ответ на вопрос, где находилась точка в начальный момент
времени, с которого мы следим за движением) и скоростью.
В классической механике, наряду со скоростью, вводится, как известно,
понятие импульса. Оказывается, что введение этой величины не сводится
просто к перезаписи основных уравнений. На языке импульсов можно
описать, например, взаимодействие материальной точки и поля и говорить о
передаче телом импульса полю и, наоборот, импульса поля телу. Это нельзя
сделать на языке сил, так как, если можно приложить силу к телу, то
«приложить» ее к полю никак нельзя. Введение импульса позволяет
254
обобщить понятие силы и называть силой скорость изменения импульса тела.
Кроме того, наиболее общие пригодные для характеристики любых
механических объектов уравнения движения, предложенные Лагранжем и
Гамильтоном, записываются на языке координат и импульсов и их
изменений во времени. Например, пара взаимосвязанных уравнений Гамильтона имеет следующий вид:
−
dq ∂H
dp i ∂H
=0
= 0; i −
−
dt ∂pi
dt ∂q i
dp i
∂H
=−
;
dt
∂q i
dqi ∂H
=
dt
∂pi
или
, i = 1, … n.
Здесь п—число степеней свободы системы (число независимых
координат qi), qi и pi—произвольные координаты и соответствующие им так
называемые сопряженные импульсы, Н = T + U - функция Гамильтона (или
гамильтониан), являющаяся суммой кинетической и потенциальной энергий
системы. При этом координаты и импульсы, хотя и согласованные между
собой, рассматриваются как независимые переменные. Координаты и
импульсы встречаются в уравнениях движения и начальных условиях
парами, что позволяет называть их каноническими переменными,
полностью описывающими изменение состояния системы во времени.
Мы не будем далее углубляться собственно в механику. Для нас сейчас
важно усвоить только одно: описание даже простейшей механической
системы (материальной точки, движущейся вдоль одной выделенной оси
координат в заданном потенциальном поле, например, в так называемой
потенциальной яме определенной формы) требует для своей полноты двух
величин, двух составляющих. Обойтись только одной из этих составляющих
никак нельзя, поскольку они как бы дополняют друг друга.
Конечно, можно возразить, что, если материальная точка в начальный
момент находилась в минимуме потенциальной ямы и не двигалась, то она и
дальше будет находиться в состоянии покоя, и в этом смысле для полной
характеристики ее поведения достаточно знать координату. Однако не
следует забывать, что надо указать, что начальная скорость была равна нулю.
Кроме того, это все же крайний частный случай.
Это правило парности сохраняется и при переходе к квантовой механике и к
описанию движения микрочастиц. Однако, появляется и существенное
различие с классикой. Вернемся к лекции 9. Эксперименты по прохождению,
например, потоков электронов через экраны с узкими щелями (реально через
тонкую металлическую фольгу или кристаллы) показали, что наблюдается
дифракционная картина, подобная случаю прохождения электромагнитных
волн через соответствующие экраны. Далее, исследования спектров атомов и
молекул указали на существование вполне определенных дискретных
энергетических состояний этих объектов, переходы между которыми и
приводят к излучению или поглощению электромагнитных волн подходящих
255
длин. Эти новые особенности поведения микрочастиц потребовали для их
описания создания адекватной механики, которая получила название
квантовой или волновой. Классические уравнения движения были заменены
уравнением Шредингера.
Не вдаваясь в детали, напомним, что уже решение простейшей задачи
о частице в потенциальном ящике с бесконечно высокими стенками
(имитация частицы, находящейся в локализованной области пространства,
например, электрона в атоме водорода) приводит не только к заключению о
том, что энергия такой частицы должна принимать ряд дискретных значений,
но и к тому, что она не может обладать нулевой энергией, т. е. покоиться.
Значит, необходимость использования пары канонических переменных
проявляется во всех возможных случаях. Но и это еще не самое главное. Как
в классике, так и в квантовой механике большую роль играют так
называемые перестановочные соотношения, т. е., например, комбинации
типа (Д6) (Лекция 9, раздел 9.5)
Напомним (лекция 9), что если коммутатор пары операторов равен
нулю, т.е. действие пары операторов на некоторую функцию не зависит от
порядка их следования, то соответствующие физические величины могут
быть измерены одновременно, причем точность измерения одной величины
не зависит от точности измерения другой. Если коммутатор не равен нулю,
то такие физические величины одновременно измерить с высокой точностью
одним прибором в принципе нельзя. Если мы все же захотим прецизионно
измерить такие величины, то надо проводить измерения разными способами.
При этом в любом случае увеличение точности измерения одной величины
приводит к падению точности измерения другой, и наоборот.
В принципе невозможны одновременные точные измерения импульса и
координаты, энергии и времени жизни микрочастицы.
Это и позволяет сформулировать принцип дополнительности, в следующей
достаточно общей форме (формулировка принадлежит известному физику
Д.Бому): в области квантовых явлений наиболее общие физические
свойства какой-либо системы должны быть выражены с помощью
дополняющих друг друга пар независимых переменных, каждая из
которых может быть лучше определена только за счет
соответствующего уменьшения степени определенности другой.
Как указывалось, операторы, отвечающие такой паре величин, должны
иметь не равный нулю коммутатор.
Принцип дополнительности не ограничивается только этими
моментами. Например, волновые и корпускулярные проявления в поведении
микрочастиц также являются взаимодополняющими и отражают реально
существующий дуализм микромира. К паре взаимодополняющих понятий
надо отнести непрерывность и дискретность и т. д.
Нильс Бор увидел в приведенных выше чисто физических примерах
лишь частный случай чрезвычайно общего правила и написал в одной из
своих первых работ по квантовой теории: “...пытаясь анализировать наши
переживания, мы перестаем их испытывать. В этом смысле мы
256
обнаруживаем, что между психологическими опытами, для описания
которых адекватно употреблять такие слова, как «мысли» и «чувства»,
существует соотношение дополнительности, подобно тому, какое
существует между данными о поведении атомов...” Продолжая эту мысль,
Н. Бор отметил, что особенности измерений в атомной механике
представляют «близкую аналогию со своеобразными трудностями
психологического анализа, проистекающими из того факта, что духовное
содержание неизбежно меняется, если внимание сосредотачивается на какойнибудь его определенной стороне».
Таким образом, сформулированный в физике принцип дополнительности является лишь частным случаем весьма общей
закономерности, имеющей, множество весьма важных следствий. Физика
здесь сыграла роль катализатора, позволив на относительно простом примере
обнаружить нечто гораздо более важное. Мы еще вернемся к вопросам о
дополнительности и обсуждению следствий, а сейчас обратимся к еще
одному принципиальному моменту.
Как известно, в основе физики лежат измерения. Не только измерение,
но и любое наблюдение подразумевает, прежде всего, что имеется объект
наблюдения и субъект, или наблюдаемое и наблюдатель. В свою очередь,
производство измерения возможно только тогда, когда имеется какое-то
взаимодействие между наблюдателем и объектом. Это взаимодействие в
физике чаще всего происходит через посредника—прибор, измерительное
устройство, экспериментальную установку. Естественно, сразу же может
возникнуть вопрос: если исследование подразумевает взаимодействие
субъекта и объекта, не будет ли такое взаимодействие отражаться на
свойствах как того, так и другого?
Исторический опыт астрономии и классической физики не заставлял
физиков задумываться над этой проблемой. Опираясь на этот опыт, физики
молчаливо предполагали, что если и есть какие-нибудь воздействия прибора
на объект, то они, как правило, столь малы, что ими можно пренебречь.
Например, хотя и ясно, что подключение вольтметра параллельно исследуемому участку электрической цепи должно изменить силу тока на этом
участке по сравнению с тем током, который шел бы в отсутствие вольтметра,
однако, выбирая вольтметр со столь большим внутренним сопротивлением,
что его можно считать заведомо во много раз превосходящим сопротивление
участка цепи, можно сделать такие изменения пренебрежимо малыми. Науке,
правда, были известны во множестве и такие измерения, когда их влияния на
объект были столь большими, что уничтожался сам объект. Речь идет о
химии, где производство химического анализа вещества сплошь и рядом
приводит к разрушению самого исследуемого вещества. Тем не менее,
обсуждаемая проблема как-то не привлекала особенного внимания.
Считалось, что эксперимент всегда можно поставить так, чтобы он не
искажал изучаемого явления.
257
Положение принципиальным образом изменилось, когда начались
исследования микромира и происходило становление квантовой теории и ее
математического аппарата.
Предположим, что мы изучаем свойства атомов, наблюдая поглощение
света слоем вещества, состоящего из этих атомов. Согласно второму
постулату Бора, при взаимодействии света с веществом каждый атом может
захватить квант света с определенной энергией (частотой). Недостаток
соответствующих квантов в прошедшем через слой вещества луче света
будет восприниматься как поглощение волн определенных длин.
Атом при поглощении кванта света не остается неизменным, а
переходит в возбужденное состояние. Хотя он в этом состоянии долгое время
не остается и вновь переходит в основное с наименьшей энергией так, что в
целом при обычных экспериментах каких-либо изменений в слое газа на
макроуровне не замечается, однако на микроуровне воздействие прибора на
объект существует. И на макроуровне такое воздействие вполне может стать
существенным, если использовать столь интенсивные пучки света (сейчас
это реально возможно), что встреча атома со вторым квантом может
произойти до того, как он успеет излучить первоначально поглощенный. Это
наблюдается при исследовании так называемых нелинейных явлений при
прохождении света через вещество, когда само вещество меняет свои
свойства под действием света.
Поскольку весь мир состоит из атомов и молекул, то любые
особенности микромира не могут тем или иным способом не проявляться в
макроэкспериментах. В этом и заключается причина того, что идея
дополнительности,
первоначально
сформулированная
в
физике
применительно к микромиру, оказывается столь плодотворной в других
областях знания. Совершенно прав был Н. Бор, когда писал, что “...идея
дополнительности способна охарактеризовать существенную ситуацию,
которая имеет далеко идущую аналогию с общими трудностями образования человеческих понятий, возникающими из разделения
субъекта и объекта”. Дополнительность, таким образом, связана с
”разграничением объекта и средств наблюдения, свойственным самой идее
наблюдения”. При этом очень часто попытка более детального изучения
одной стороны объекта, в полной аналогии и с соотношением
неопределенности Гейзенберга (см. п. 9.3 настоящего учебного пособия),
приводит к потере определенности другой.
Согласно первому постулату Бора, состоящая из электронов и ядер
нераспадающаяся микросистема (атом, молекула) может находиться лишь в
определенных дискретных энергетических состояниях. Они называются
уровнями энергии. Согласно второму же постулату, свободная, не
находящаяся в контакте с другой, микросистема может изменить свое
энергетическое состояние (перейти с одного уровня энергии на другой)
только за счет либо поглощения, либо излучения электромагнитной энергии.
И то и другое можно обнаружить, если наблюдать соответственно спектры
поглощения или излучения. Таким образом, с помощью атомной и
258
молекулярной спектроскопии удается исследовать самые общие и
фундаментальные свойства микросистем, так как в спектрах,
регистрируемых в различных областях при разных условиях постановки
экспериментов, проявляются все особенности строения атомов и молекул.
Именно поэтому пример спектральных исследований является не
только очень удобным, но и весьма общим для того, чтобы можно было
сделать ряд далеко идущих выводов. Грибов и Прокофьева используют
особенности спектрального анализа, в котором они являются блестящими
специалистами, для иллюстрации плюрализма физических суждений,
показывая, что неоднозначность – атрибут не только измерений в физике
микрочастиц, но общая черта любых (!) научных интерпретаций:
“Представим себе, что такое исследование ведется с помощью
компьютеров (как реально сейчас и делают). Нам важно сейчас обратиться к
примеру компьютеров не для того, чтобы популярно рассказать о
компьютеризации молекулярной физики и химии, а потому, что
компьютерный подход отличается наибольшей объективностью. Недаром
считается, что если экзамен у абитуриента принимает человек, то он может
быть предвзятым, а компьютер-экзаменатор совершенно объективен!
Каждый, однако, кто имел дело с компьютерами, не может, с одной
стороны, не поражаться их мощью, а с другой - тупостью! Тупость эта
выражается в том, что компьютеру все нужно подробно растолковывать.
Иначе он просто не сможет работать. Это один человек другому может
сказать: “Смотри, какой красивый вид!” И второй, часто мгновенно,
ответит: “Да!” Компьютер задаст вопрос, на который вряд ли вообще
можно дать полный ответ: “А что значит «красивый?” Попробуйте-ка это
объяснить в деталях! Так и в случае создания компьютерных систем для
исследования молекул возникает, на первый взгляд, наивный вопрос: что
такое молекула и что значит ее исследовать? Надо дать точные
определения этих понятий, причем такие, какие могли бы быть совершенно
однозначно переведены на математический язык. Ведь компьютер, в
принципе, способен оперировать лишь понятиями, которые, как писали еще
древние философы, описываются “числом и мерою”. Недостаточно ввести
в компьютер просто утверждение: “чай горячий”. Надо указать, что
его температура такая-то или выше такой-то. Казалось бы, с
молекулами проблем не должно возникнуть: каждому школьнику известно,
что
молекулой
называется
достаточно
устойчивая электрически
нейтральная мельчайшая частица вещества—носительница его свойств,
состоящая из атомных ядер с данными зарядами
и
массами
и
соответствующего
числа
электронов. Вторая часть этого определения
легко переводится на компьютерный язык. В самом деле, в компьютер
можно ввести группу цифр: 12,12,12,12,12,12,1,1,1,1,1,1. Каждая цифра
означает массу (в атомных единицах) одного из ядер. Те, кто изучали
органическую химию, сразу скажут, что речь идет о молекуле бензола. Но
только ли? Уже давно было подсчитано, что брутто-формуле C,H,
могут
отвечать 217 так называемых топологических изомеров Некоторые
259
из них обнаружены – в 1960-70-х годах. Так что однозначности, как
видим, не получается. И это в простом случае С6Н6, а если взять,
например, тридцатиатомную систему? Здесь уже число изомеров может
исчисляться десятками тысяч. Вполне можно считать, что ясность теряется
полностью! Да и вообще на таком языке нельзя обсуждать столь сложный
объект, как молекулы, особенно крупные. Химики давно обнаружили, что
если знать только атомный состав регистрируемых молекул (бруттоформулы), то прогнозы того, что получится в результате реакций, или того,
как поведет себя индивидуальная система в конкретной сложной ситуации,
становятся чрезвычайно затруднительными, а то и просто невозможными.
Это все равно что пытаться выразить сложную мысль на иностранном языке,
обладая знанием лишь десятка слов. Значит, надо расширять богатство и
образность языка. В химии это было достигнуто введением в оборот
структурных
формул,
представлений
о молекулах как о
пространственных фигурах и т. д. Это означало, в сущности, что были
введены в употребление разного рода понятия, которые можно отнести
к категории физических моделей. Каждая из них может быть вполне строго
и однозначно определена набором чисел. Именно благодаря этому
можно выделить из всех изомеров желанный и удовлетворить требованию о том, чтобы объект был носителем свойств вещества. К этим моделям
относятся, во-первых, брутто-формулы (в этой модели указываются лишь
составляющие молекулу атомы), во-вторых, формулы, в которых
указываются не только атомы, но и отдельные структурные элементы (здесь
уже надо частично указать какой атом с каким соединен химической связью),
в-третьих, полные структурные формулы, математически описываемые так
называемыми матрицами смежности, содержащими всю информацию о
связях между атомами, в-четвертых, упругие пространственные модели, в
которых допускаются колебания атомов около положения равновесия, впятых, модели, в которых атомам—материальным точкам приписываются
определенные заряды, и ряд других.
Можно сказать, что понятия, характеризующие те или иные модели
составляют лексику языка, на котором и ведется обсуждение тех объектов,
которые мы называем молекулами. Вот здесь самое время вернуться к
принципу дополнительности. Дополнительной к истине, по мысли Бора,
является ясность. Если под истиной понимать то, что молекула есть
устойчивая система, состоящая из электронов и ядер, а это действительно
так, то, высказывая эту истину, мы полностью теряем ясность. Чтобы
получить эту ясность, надо отойти от истины и оперирован, моделями
молекул, ни одна из которых истиной не является, а отражает одно из
удобных и приближенных представлений об объекте - что-то
напоминающее представление слепых о слоне в известной притче о том,
как представили себе слона четверо слепых, когда им дали возможность
ощупать части его тела. Одному из слепых достался хобот. Он сказал,
что слон похож ил змею. Второй ощупал ногу и сказал, что слон похож
на дерево.
260
Третий, обследовав хвост, решил, что слон похож на палку.
Наконец, четвертый, дотянувшись до живота, заключил, что слон похож
на стену. Самое любопытное заключается в том, что каждый из них был
по-своему прав.
На пути использования моделей достигается требуемая ясность, но
теряется истина в том смысле, что реально существующему объекту—
молекуле уже нельзя дать какое-нибудь одно строгое и информативное
определение. Снова обратимся к Н. Бору, написавшему: ”..мы должны
быть готовы к тому, что всестороннее освещение одного и того же
предмета может потребовать различных точек зрения, препятствующих
однозначному описанию. Строго говоря, глубокий анализ любого
понятия и его непосредственное применение взаимно исключают друг
друга”.
Об этом знали восточные мыслители. Так, в даоских текстах, в притчах
дзэн-буддизма есть категория “не два”.
Грибов и Прокофьева напоминают читателям историю о Ходже
Насреддине.
Однажды Ходжа Насреддин исполнял обязанности судьи. К нему
обратились два человека с просьбой рассудить их. Сначала истец изложил
свою версию происшедшего. Ходжа его выслушал и сказал, что он
безусловно прав. Тогда выступил ответчик. Ходжа и его выслушал очень
внимательно, а потом заявил, что ответчик, разумеется, прав! Тогда один из
посторонних слушателей, пораженный таким странным судом, обратился к
Ходже и сказал: “Как же так, Ходжа, не может же быть, чтобы люди,
утверждающие прямо противоположное, оба оказались правыми!”. Ходжа и
его спокойно выслушал и потом промолвил: ”А ты тоже прав!”
Все представления об окружающем мире человек получает с помощью
своих органов чувств. Опыт общения с природой закреплялся в виде
определенных понятий и находил отражение в языке и образах,
складывающихся в мозгу человека. Постепенно эти понятия в уточненном
и формализованном виде переносились в науку, в частности в физику.
Необходимость ориентироваться в окружающем пространстве и как-то
характеризовать его привела к понятию длины. Эта характеристика на
первых порах опиралась на “естественные” стандарты. Вспомним названия
мер длины: локоть, шаг, фут (размер стопы) и др. Человек поднимал
и переносил грузы, сравнивал их. Приобретенный при этом опыт был
зафиксирован в понятии массы. Перемещение тел толканием или
натягиванием канатов естественным образом трансформировалось в
обобщенное понятие силы и т. д. Можно поэтому сказать, что вся механика в
конечном счете базируется на фундаментальных понятиях, генетически
непосредственно связанных с восприятием органов чувств. Несколько
сложнее дело обстоит со световыми явлениями. Глаз может отличить
темное от светлого, обладает цветным восприятием. Глазом можно
261
зафиксировать чередование темных и светлых полос за щелью в
непрозрачном экране, на который падает
параллельный
пучок
монохроматического
света.
Эта характерная картина, сравнимая с
картиной прохождения волн на поверхности жидкости через щель в стенке,
поставленной на пути распространения волн, может натолкнуть на аналогию
и привести к заключению о том, что и свет представляет собой
распространение колебаний чего-то. Однако для того, чтобы это что-то
конкретизировать, недостаточно уже только непосредственного чувственного
восприятия, а нужно еще, чтобы проникнуть в суть вещей, дополнительное
умственное построение, чтобы по косвенным признакам разного рода
догадаться, что свет есть электромагнитная волна. Это не так уж просто
было сделать, о чем свидетельствует то, что длительное время в науке
бытовала теория колебаний эфира. Мы не можем, если так можно сказать,
«ухватить руками световую волну», но наблюдать самые разнообразные
проявления ее взаимодействия с веществом, с экранами и др. мы вполне в
состоянии. То обстоятельство, что такие экспериментальные факты не
только качественно, но и количественно объясняются с одной и той же точки
зрения на свет как на электромагнитную волну, заставляет признать, что
объективно существует такая форма материи. Сказанное относится и
к взаимодействию заряженных частиц через поле и т. д.
Все наши представления об окружающем мире можно, таким
образом, разделить на две категории, являющиеся следствием
непосредственного чувственного восприятия и умственного усилия,
результат которого фиксируется в форме разного рода теорий, если говорить
о физике. Опять мы имеем дело с двумя взаимно дополняющими сторонами
создания образа окружающего нас мира в мозгу. Не случайно, по-видимому,
и мозг наш состоит из двух половин, выполняющих разные функции.
Встречаясь с определенными представлениями уже на ранних этапах
обучения, люди часто настолько сживаются с ними и привыкают ими
пользоваться, что перестают задумываться о том, что, собственно, послужило
основанием для формирования того или иного образа. Такое привыкание к
понятиям особенно характерно для профессионалов-ученых.
Возвращаясь к представлению о свете как об электромагнитной волне,
укажем, что оно базируется не на прямом впечатлении от разглядываний
колебаний электрического и магнитного векторов со стороны, а на анализе
экспериментов, в которых волна всегда с чем-то взаимодействует и что-то
меняет так, что соответствующий эффект регистрируется глазом. Можно
поэтому сказать, что сами колеблющиеся векторы Е и В являются
ненаблюдаемыми величинами. Правильная физическая теория, однако,
должна перевести эти ненаблюдаемые величины в наблюдаемые (почернение
на фотопластинке, радужные кольца за отверстием в экране, на который
падает белый свет, и т. д.). Не надо конечно отождествлять термин ненаблюдаемое с придуманным, нематериальным. Слепой от рождения человек не
видит света и окружающих предметов, однако отсюда не следует, что они
отсутствуют.
262
С еще более сложной ситуацией встретились физики, когда они перешли
к изучению элементарных частиц. Здесь уже пришлось вводить в обращение
понятие о волнах вероятности, совсем не связывая их ни с каким видом
колеблющейся материи, а пользуясь этим представлением просто как
математическим приемом, позволяющим, решая соответствующее уравнение
Шредингера, давать прогноз реально наблюдаемым и фиксируемым
органами чувств явлениям.
Несмотря на принципиальное различие в этом смысле между теорией
электромагнитных волн и волновой механикой, есть одно общее: и в том, и в
другом случае в результате соответствующих теоретических построений
можно описать опыты, результаты которых могут непосредственно
восприниматься органами чувств.
Это требование в физике было закреплено в так называемом принципе
соответствия.
Согласно этому принципу любая физическая теория
сейчас и в будущем может оперировать любыми понятиями как
имеющими смысл материальных объектов окружающего мира, так и
искусственными, абстрактными, пользоваться любой математикой
(действительными или комплексными числами и цеременными, так
называемыми матрицами, операторами и т. д.), но всегда должна
иметься возможность с помощью этих понятий и математических
преобразований получить такие величины, которые могут быть прямо
сопоставлены с реальными, воспринимаемыми органами чувств
человека, экспериментами.
Этот важнейший принцип устанавливает, таким образом, связь между
фактом физики и ее мыслью.
Мировоззренческое значение принципа соответствия заключается в том,
что он устанавливает связь между математикой, т. е. миром абстракций, и
реальным физическим миром. Математика есть плод деятельности
человеческого мозга. В ней используется масса понятий (комплексные числа,
операторы, матрицы и т. д.), не имеющих отображений в окружающем нас
мире. Оказывается, однако, что различные математические разделы
постоянно заимствуются из математики и переносятся в физику и тем самым
“связываются” с окружающим миром. Так, аппарат обыкновенных
дифференциальных уравнений является фундаментом классической
механики, уравнения в частных производных применяются в волновой
механике, матрицы (таблицы чисел или функций) широко используются в
теории строения и спектров молекул, полимеров, кристаллов, операторы
играют важнейшую роль в теории электромагнитных явлений и в квантовой
механике, криволинейная геометрия Римана составляет математическую
основу общей теории относительности и т.д. Все это становится возможным
именно благодаря неукоснительному следованию принципу соответствия.
Невозможно предсказать, что именно из математической области
знания станет завтра инструментом новых физических теорий. Впрочем,
с другой стороны, развитие физики как науки постоянно стимулирует и
появление новых направлений в математике – развитие физики и
263
математики, таким образом, носит резонансный характер – эти 2
базовые дисциплины естествознания - абстрактная и ориентированная
на конкретные материальные объекты соответственно, обогащают друг
друга.
Понимание процессов, происходящих в окружающем мире, и
формирование его образа, конечно, очень важно. Однако целью всякой науки
является не только понимание, но и, что главное, прогноз событий. Известно,
что физика в этом отношении достигла большого совершенства. Именно на
базе установленных в физике общих законов и хорошо развитого
математического аппарата создавались соответствующие методы расчетов
для обслуживания отдельных крупных направлений в технике: теория машин
и механизмов, теоретическая электротехника, методы расчетов летательных
аппаратов и т. д. Сейчас ни одно из существующих промышленных изделий
от кофеварки до космических ракет не реализуется в образце до тех пор, пока
соответствующая теоретическая проработка не покажет с вероятностью
минимум 90%, что изделие будет работать именно так, как это хочется
создателю. Поражающие воображение космические полеты на Марс, Венеру,
к дальним планетам Солнечной системы длительностью до нескольких лет с
минимальной коррекцией траектории в пути следования можно смело
назвать триумфом прогностической способности физического знания.
Характерной особенностью сегодняшнего периода является бурное
внедрение расчетных методов для прогнозирования свойств не только макро, но и микрообъектов: атомов, молекул, полимеров, кристаллов. Например, с
хорошей точностью и сравнительно быстро можно рассчитать
геометрическую структуру молекул и молекулярных кристаллов, предсказать
их спектральные свойства и т. д. При этом такие задачи решаются не только
для малых и средних по величине систем, но даже и для белков. Появилась
целая новая область науки, получившая название молекулярного дизайна.
В основе всех этих достижений и нашей уверенности в том, что события
будут развиваться именно так, как это предсказывает соответствующая
теория, лежит принцип детерминизма. Этот принцип впервые был сформулирован как обобщение достижений классической механики. Согласно ее
фундаментальным положениям, если известно уравнение движения или
система таких уравнений и начальные условия (значения координат и
скоростей в начальный момент времени), то, решая это уравнение или
систему, можно точно указать, где будет находиться предмет через
определенный промежуток времени и как он будет двигаться и
деформироваться. В свою очередь, такое уравнение (или систему уравнений)
всегда можно записать, если заданы массы и моменты инерции отдельных
компонентов объекта и действующие силы.
Сразу же бросается, конечно, в глаза, что поскольку прогноз будущего
состояния системы делается на основе решения соответствующих уравнений,
то это подразумевает, что во всем интервале времени, в пределах которого
осуществляется прогноз, уравнение движения не меняется. Можно, конечно,
снять это ограничение и учесть возможность появления новых факторов,
264
отсутствовавших в начальный момент. Например, принять во внимание, что
тело при своем движении должно проходить область с сильным
воздействующим на него полем, которое практически не действует на
начальных стадиях движения. Это, однако, все равно подразумевает знание
такой возможности в тот момент, когда движение только начинается, т. е. с
самого начала. Таким образом, оказывается, что все предопределено
(события детерминированы) теми рамками, которые могут быть установлены
в начальный момент времени.
Громадное число различных экспериментов, убеждающих в том, что
сделанные на такой основе прогнозы событий выполняются, отражены в
принципе детерминизма, который выражает нашу уверенность в том, что,
пользуясь установленными в физике приемами, мы действительно можем
предсказать события и пользоваться этим предсказанием в жизни.
Переход от механики Ньютона к механике Эйнштейна (больших скоростей)
и к электродинамике ничего в указанном выше смысле не меняет и только
может служить дальнейшим подтверждением обоснованности самого
принципа.
Выше было сказано, что если задано уравнение движения и
начальные условия, то все развитие дальнейших событий уже
предопределено. На самом деле все обстоит, конечно, сложнее, поскольку
прогнозирование реального эксперимента требует не идеального, а реального
знания масс, сил, начальных условий. Получение таких знаний невозможно
без соответствующих измерений. Любые реальные измерения имеют ту или
иную степень погрешности. Поэтому, строго говоря, не одну из названных
величин мы не можем указать точно, а лишь в определенном интервале
возможных значений. Отсюда следует, что и прогноз событий точным быть
не может. Более того, начальные ошибки при длительном течении времени
могут накапливаться, снижая достоверность прогноза. Именно поэтому при
полетах космических аппаратов и требуется периодическая коррекция на
промежуточных стадиях их движения к желаемой цели.
Далее, нет полной уверенности, что не появится какой-то неожиданный
фактор, например столкновение космического аппарата с метеоритом. Все
это приводит к тому, что реальный прогноз никогда не является абсолютно
достоверным, а имеет вероятностный характер. Правда, вероятность
правильного прогноза, как правило, достаточно велика.
Вероятностный элемент усиливается при переходе к микромиру и
при использовании квантовой механики. Аналогия с классикой сохраняется в
том смысле, что место классических уравнений движения занимает
уравнение Шредингера. Его снова можно решить при подходящих начальных
условиях (то, что надо задать уже не координаты и скорости, а начальные
значения волновой функции не является принципиальным). Однако
существенно новое состоит в том, что в результате решения находятся не
координаты и скорости движения частей системы, а значения функции Ψ в
заданный момент времени. Мы знаем, что сама по себе она не наблюдаема,
однако квадрат этой величины, т. е. произведение Ψ*Ψ передает вероятность
265
пространственного состояния системы в данный момент времени. Эта
вероятность уже не связана с тем, хорошо или плохо мы измерили параметры
системы (массы, характеристики потенциальной функции), а с существенно
квантовой природой объекта.
С учетом этих оговорок прогноз по-прежнему оказывается
возможным, и в этом смысле можно говорить, что принцип детерминизма
можно распространить и на область квантовых явлений.
Ситуация не меняется и тогда, когда от описания сравнительно несложных
объектов мы переходим к объектам множественным, статистическим,
например газам. Если изучать интегральные характеристики этих систем
(температуры, давления), то снова можно предсказать их изменения, если
указано, как должны меняться внешние воздействия и задать начальные
параметры р, V, Т. Ничего неожиданного не происходит и в тех случаях,
когда от обратимых процессов мы переходим к необратимым, таким как
диффузия, передача тепла и другие.
Если внимательно приглядеться ко всем рассмотренным выше
случаям, то можно обнаружить нечто общее—отсутствие качественных
изменений в изучаемых системах. Во все время, в течение которого делается
прогноз, сохраняются классические и квантовые уравнения, газ остается тем
же газом и т. д. Можно поэтому сказать, что все изменения в системе носят
количественный, но не качественный характер.
Правда, было отмечено, что может быть и такая ситуация, когда в
процессе эксперимента в какой-то момент включится новый фактор,
отсутствовавший в начальном уравнении движения. Однако и в этом случае
прогноз возможен, если появление нового действия заранее также известно.
Но ведь не только с такими ситуациями имеет дело современная физика.
Грибов и Прокофьева в “Основах физики” обосновали необходимость
расширения инженерного мышления, в частности, перехода к
представлениям
нелинейной
физики,
которые
основаны
на
многозначности сценариев поведения в зависимости от малейших
случайных изменений начальных условий (внешних возмущений, или
внутренних случайных отклонений - флуктуаций).
Используемые в курсе общей физики для инженеров модели, как
правило, линейны, а статистические закономерности приводятся, в
основном, для квазиравновесных, обратимых процессов. Тогда как мир
вокруг нас существенно далек от равновесия и насыщен нелинейными
эффектами. Однако необходимо детально знать именно базовую,
“линейную” физику – тогда ее законы можно использовать как
отправные, на которые накладываются возмущения.
Еще раз обратимся к фундаментальному анализу сущности
физического описания природы и урокам, которые могут быть извлечены из
него гуманитарным знанием, сделанному Грибовым и Прокофьевой.
Характерной особенностью многих сложных систем является наличие
в них флуктуаций. Эти флуктуации, не замечаемые при макроскопических
266
экспериментах, отчетливо регистрируются при микроскопических (опыт с
броуновским движением, например) и проявляются в отличном от нуля
значении энтропии. Закон возрастания энтропии при необратимых процессах
в замкнутой системе можно трактовать как отражение самопроизвольного
увеличения разнообразия этих флуктуации. Могут существовать и такие
флуктуации, которые способны менять свои свойства и при подходящих
условиях не распадаться, а нарастать. Именно этим объясняется сама
возможность появления более организованных, чем окружающая среда
(почва, например), растительных организмов: травы, деревьев.
Такой процесс сопровождается уменьшением энтропии. Это, в свою
очередь, возможно не для всякой системы, а только для такой, которая
находится в контакте с другими системами (внешней средой), т. е. является
открытой.
Примем теперь в качестве отправных два достаточно очевидных
утверждения и посмотрим, нет ли соответствующего аналога в
закономерностях развития общества. Утверждения эти следующие:
1) в сложной системе должны присутствовать флуктуации и 2) эти
флуктуации при подходящих условиях могут быть способными к
разрастанию.
Обратимся к человеческому обществу. Что это система сложная—ясно. Что
она состоит из большого числа взаимодействующих частей—тоже не
вызывает сомнения. Бросается в глаза и то, что в этой системе действительно
имеются флуктуации. В самом деле, когда на свет Божий появляется новый
человек, то это является результатом совершенно случайной встречи и
дальнейшего развития отношений какой-то пары женщина— мужчина.
Совсем уж непредсказуемым является факт рождения в семье Легации и
Карло Бонапарте будущего знаменитого полководца и императора Франции
или то, что через год после женитьбы Сергея Львовича Пушкина на Надежде
Осиповне Ганнибал у них не просто родится новый подданный Российской
Империи, что, в общем-то, как раз едва ли можно назвать неожиданным, а
именно, по выражению Н.Гоголя, русский человек во всем его развитии—
Александр Сергеевич Пушкин.
Вообще каждый человек, гений или не гений, уникален и неповторим
и поэтому вполне может рассматриваться как флуктуация (как ни странно
звучит этот термин в приложении к человеку). Эта флуктуация способна к
саморазрастанию (в прямом смысле слова и в смысле развития своего
интеллекта) и как таковая нуждается в контакте с ближайшим окружением
(семья) и с более удаленным. Группы людей могут объединяться по самым
разным признакам (сословным, производства, по интересам и т. д.). Эти
объединения приобретают некоторые новые по сравнению с отдельными
людьми черты, но по-прежнему могут сохранять некоторые характерные
свойства флуктуации. Они могут разрастаться, подавляться или усиливаться
за счет взаимодействий с другими флуктуациями-сообществами и т. д. Такие
же выводы можно сделать и по отношению к целым государствам.
267
Теперь вспомним, что в физических системах любое разрастание флуктуации
и переход системы в новое состояние возможны только в том случае, когда
система является открытой, т. е. достаточно энергично обменивается с
внешней средой энергией и веществом. Не трудно видеть, что и любое
человеческое сообщество также не может существовать замкнуто, т.е. без
взаимодействия хотя бы с природной средой обитания. В физических
замкнутых системах процессы могут развиваться самопроизвольно только в
сторону нарастания энтропии, т. е. разрушения организованной структуры
(подобно разложению трупа после смерти живого организма). Ну, а как ведет
себя человеческое общество?
Хорошо известным биологическим фактом является то, что небольшое
общество людей, вынужденных заключать браки между достаточно
близкими родственниками, постепенно вырождается. Впервые это было
замечено на примере царствовавших домов, где в силу династических правил
круг потенциальных врачующихся пар был невелик. Вырождение коснулось
императорского дома Габсбургов, наследственной генетической болезнью
страдал сын императора Николая II и т. д.
Значит, замеченное в физике правило деградации замкнутых статистических
структур проявляется и в биологии высших организмов.
Если сообщество людей более многочисленно, то физическое
вырождение может стать незаметным, но возникает другое.
Чтобы понять это, обратимся к двум примерам: древнегреческим городам
Спарте и Афинам. Древняя история Греции в исторической науке играет роль
простых моделей в физике. Как на примере идеального газа можно проще
всего установить и изучить законы состояния и преобразования
множественных объектов, так и на примере древнегреческой истории можно
обнаружить и изучить некоторые весьма общие закономерности.
Известно, что Спарта и Афины соперничали друг с другом в установлении
гегемонии над другими греческими государствами и даже вели длительные
войны, получившие названия Пелопоннесских. В конце концов Спарта
одержала военную победу. Однако посмотрим на карту современной Греции.
Спарту можно найти лишь на карте достаточно крупного масштаба. Об
Афинах с ее великолепными архитектурными памятниками, составляющими
бесценное наследие всего человечества, знает каждый. В долгосрочной
перспективе Афины, таким образом, оказались несомненными победителями.
Мы и культурный-то вклад древней Греции воспринимаем прежде всего как
вклад Афин. В чем же дело?
Конечно, невозможно указать на все факторы, которые привели к
такому результату. Но взгляд физика сразу же улавливает в истории Афин и
Спарты принципиальную разницу: Афины всегда были открытым
обществом,
с
широко
развитой
торговлей,
мощным
флотом,
обеспечивающим устойчивые связи с окружающим миром на достаточно
большом удалении от самого города, интенсивный обмен информацией.
Многие выдающиеся люди древнего мира из других его мест подолгу жили в
Афинах. Одним словом, Афины можно смело назвать примером открытой
268
системы. В этой системе и шло накопление культуры, интеллекта и т. д.
Условия для разрастания соответствующих флуктуации были вполне
подходящими.
Общество Спарты того же исторического периода, наоборот,
характеризуется ярко выраженной замкнутостью. Долгое время, следуя
законам Ликурга (справедливости ради надо отметить, что в них было много
привлекательного), основным требованием которых было сохранение, если
так можно выразиться, «спартанской чистоты» и замкнутости, это общество
в конце концов деградировало настолько, что стало терпеть поражения даже
в военной области, где раньше не имело равных. Показательно, что и
создатель новой военной тактики древнего мира полководец Эпаминонд
(разгромил спартанцев в битве при Левктрах, впервые применив так
называемый косой строй) появился не в Спарте—ярко выраженном военном
государстве, а в соседних Фивах, которые много лет этой же Спартой
разорялись, но принципа замкнутости не придерживались.
В наше время дошедшие до упадка Албания, Куба, Северная Корея
обязаны этим не только усиленному навязыванию нежизнеспособного
строя, но и полной изоляции от окружающего мира. Особенно сильно такая
изоляция воздействует именно на интеллектуальный уровень общества.
Скорее всего именно по этой причине и Спарта, явив миру целый ряд
примеров
воинской
доблести
(достаточно
вспомнить
ставшие
нарицательными Фермопилы), не породила ни одного философа, ученого,
поэта или скульптора.
Даже и наша собственная очень крупная страна сильнейшим образом
пострадала в результате длительной изоляции от остального мира. Примеры
такого рода можно продолжать.
Таким образом, открытый в физике закон, гласящий, что всякое
качественно новое развитие возможно только в открытой системе,
обладающей достаточным уровнем флуктуации, причем таких, которые
способны к разрастанию, оказывается верным и применительно к
человеческому обществу.
Факты физики и факты истории логично объясняются с одной и той же
точки зрения. Возникновение более совершенной организации, материальной
или интеллектуальной, т. е. процесс с понижением энтропии, в принципе,
возможен только в открытых системах и невозможен в изолированных. Этот
вывод физического мышления полезно использовать государственным
деятелям!
Авторы хотели бы заключить книгу словами выдающегося физика,
нашего соотечественника А.С.Компанейца:
“… ИЗВЕСТНО, ЧТО ДЕЙСТВИТЕЛЬНОСТЬ МОЖЕТ ПОРАЗИТЬ
СИЛЬНЕЕ ВСЯКОГО ВЫМЫСЛА. ТАКАЯ ДЕЙСТВИТЕЛЬНОСТЬ –
ЗАВОЕВАНИЯ ФИЗИКИ НАШИХ ДНЕЙ.”
269
ЗАКЛЮЧЕНИЕ
Основной задачей при подготовке инженера в техническом вузе
является обучение его умению видеть причинно-следственные связи во всех
явлениях независимо от их физической природы и строить корректные
физико-математические модели этих явлений. Приступая к обучению во
втузе и подходя к своей первой или второй сессии, всем студентам следует
помнить о том, что данное умение необходимо каждому инженеру
независимо от его специализации. Оно формируется исходя из общих
принципов для всех фундаментальных наук, которые тесно связаны друг с
другом. Авторы надеются, что данное пособие позволило студентам сделать
еще один шаг навстречу этому.
Физика становится частью мировой культуры. И это не случайно –
небывалый рост технических возможностей, развитие высоких технологий –
таких, как нанотехнология – все это имеет место благодаря труду тысяч
физиков. Знать и изучать физику престижно. Приведем здесь слова
нобелевского лауреата по физике Стивена Вайнберга:
“Мужчины и женщины не склонны убаюкивать себя
сказками о Богах и великанах или заниматься мыслями о
повседневных делах – они строят телескопы, спутники и
ускорители и нескончаемыми часами сидят за столами,
осмысливая собранные данные. Попытка понять Вселенную
– одна из вещей, которые чуть приподнимают
человеческую жизнь над уровнем фарса и придают ей
черты высокой трагедии”.
270
271
Учебное издание
Лунин Леонид Сергеевич,
Благин Анатолий Вячеславович,
Баранник Алексей Анатольевич,
Разумовский Павел Иванович
Лекции по физике
Часть 3
Оптика и строение вещества
Редактор А.А. Галикян
Подписано в печать 15.01.2007. Формат 60×84 1/16.
Бумага офсетная. Печать оперативная.
Печ. л. 16,25 Уч.-изд.л. 16. Тираж 100 экз.
Заказ 1411.
Южно-Российский государственный технический университет
Редакционно-издательский отдел ЮРГТУ
Типография ЮРГТУ
Адрес университета и типографии:
346428, г. Новочеркасск, ул. Просвещения, 132
272
Скачать