Избранные вопросы алгебры многочленов

1 МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «НИЖЕГОРОДСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ ИМ. КОЗЬМЫ МИНИНА» В.А. Глуздов ЧИСЛОВЫЕ МНОГОЧЛЕНЫ Учебно-методическое пособие Нижний Новгород 2013 2 Печатается по решению редакционно-издательского совета НГПУ им. Козьмы Минина Глуздов В.А. Числовые многочлены: Учебно-методическое пособие для студентов, обучающихся по направлению 050100 «Педагогическое образование», профиль «Математика». 3 Введение Предметом нашего рассмотрения в этом разделе являются многочлены и алгебраические уравнения от одной неизвестной с числовыми коэффициентами, а также их приложения к теории геометрических построений. Значительная часть содержания раздела профессионально ориентирована, имеет прямое отношение к школьному курсу математики. Более того, при надлежащей методической обработке содержание этого раздела может быть положено в основу элективного курса для старшеклассников, стать основой дополнительных занятий с математически одаренными учениками. Стандартные обозначения и стандартные соотношения между числовыми полями, кольцами, системами: С, R, Q, Z, N, N 0 , C  , R  , Q  , R  , Q  , Z < Q < R < C (здесь символ « < » означает «быть подкольцом»). В контексте наших рассуждений поле комплексных чисел С выступает предельно широкой числовой конструкцией в том смысле, что понятия «числовое поле», «числовое кольцо» выступают для нас синонимами понятий «подполе поля С», «подкольцо поля С». Глава I. Многочлены и алгебраические уравнения над числовыми кольцами и полями §1. Кольцо многочленов от одной неизвестной над полем комплексных чисел. Основные понятия Определение. Многочленом над полем С (многочленом с комплексными коэффициентами или - комплексным многочленом) от неизвестной х мы называем функцию вида f(x) = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (1) a n , a n 1 . . . , a 1 , a 0  С (2) где называются коэффициентами многочлена f(x). 4 Представление многочлена f(x) в виде (1) называют его канонической записью. Множество всех многочленов с комплексными коэффициентами от неизвестной х обознаяаем через С[x]. Комплексные числа - элементы из С - являются многочленами по определению. Их мы будем называть скалярами. Обозначение f(x) комплексного многочлена часто редуцируется до f. Записи (1), (2) могут дублироваться одной f(x)  С[x] (3 ) У нулевого многочлена f = 0 все коэффициенты - нули. Если f  0, то среди коэффициентов (2) хотя бы один отличен от 0. В этом случае ненулевой коэффициент с максимальным значением нижнего индекса обозначается через a n и называется старшим коэффициентом многочлена f, а сам индекс n называют степенью многочлена f и обозначают deg f (англ. degree степень). Коэффициент a 0 называется свободным членом многочлена f. Замечание. Степень определяется только для ненулевого многочлена. У ненулевого многочлена свободный член, в отличии от его старшего коэффициента, может быть любым комплексным числом - нулевым или нет. В кольце С[x] сложение многочленов происходит по достаточно очевидному предписанию: два многочлена складываются как линейные комбинации степеней неизвестной с последующим приведением подобных членов. Нетрудно заметить следующее правило степени суммы многочленов. Пусть складываются два ненулевых многочлена f и g. Тогда, если f+g  0, то deg (f+g)  max {deg f, deg g} (4) Т.е., степень ненулевой суммы ненулевых многочленов не превосходит максимальной из степеней слагаемых. В более значительной степени формализуется правило умножения многочленов и формула степени их произведения. Пусть даны два многочлена f, g  С[x]. Если один из них равен 0, то и произведение fg равно 0. Рассмотрим, поэтому случай, когда оба многочлена не равны 0. Пусть f задан полной своей записью (1) а g - записью g = b m x m +b m1 x m1 +…+b 1 x+b 0 (5) 5 Перемножая f g и приводя подобные, мы справедливости следующей формулы: убедимся f g = a n b m x m n + … +c k x k + … + a 0 b 0 в (6) В формуле (6) старший коэффициент и свободный член произведения многочленов f и g выписаны явно, а остальные коэффициенты с k находятся по формуле: c k = i j k a i b j , где i+j  n+ m, 0 (7) Поскольку старшие коэффициенты a n , b m и свободные члены a 0 , b 0 многочленов f и g в формуле (6) выписаны явно, то они отсутствуют в формулах (7), что и указано в ограничениях на индексы в этих формулах. Если всмотреться и вдуматься в формулы (7), то можно увидеть, что коэффициент с k есть результат приведения подобных слагаемых со степенью x k . Первое и последнее слагаемые в формуле (6) указывают на справедливость двух правил: Правило 1. Старший коэффициент и свободный член произведения двух ненулевых многочленов равны соответственно произведению старших коэффициентов и свободных членов перемножаемых многочленов (сомножителей). Правило 2. Степень произведения двух ненулевых многочленов равна сумме степеней сомножителей (проще - при перемножении двух ненулевых многочленов их степени складываются): deg (f g) = deg f + deg g (8) Замечание. Правило 2., равно как и дублирующая его формула (8), исполнены при молчаливом предположении, что произведение ненулевых многочленов всегда отлично от нуля. Без доказательства отметим, что справедлива Теорема. Кольцо С[x] - факториально. Приведем несколько утверждений о кольце С[x], представляющих собой версию - уточнение, перефразировку некоторых положений из теории колец. Во-первых, достаточно очевидно, что 6 G С[x] = GС = С \ {0} = С* (9) Далее, пусть многочлен f С[x] является простым элементом кольца С[x]. Это - как минимум - означает, в соответствии с (9), что f  С (не 0 и необратим или, что то же самое, deg f > 0). Специфика кольца С[x] специфицирует и понятия простоты - состАвности его элементов: в кольце С[x] простые многочлены чаще называют неприводимыми, а составные - приводимыми над полем С многочленами. Чтобы раскрыть суть спецификации «простота – состАвность» («приводимость – неприводимость»), оттолкнемся от состАвности (приводимости). Итак, пусть многочлен f С[x] приводим над полем С. Это означает, что у него в кольце С[x] имеются собственные делители. Пусть g - один из них: f=gh (10) По условию приводимости (состАвности) f сомножители g и h необратимы и неассоциированы с f: f, g  С *  f∙ С * (11) deg g > 0, deg h > 0 (12) Соотношение (11) указывает на то, что Теперь наши рассуждения, включающие формулы (10), (12), могут быть приняты в уачестве версии определения приводимости комплексных многочленов Определение. Комплексный многочлен f степени больше 0 называют приводимым над полем С, если его можно разложить в произведение двух многочленов (равенство (10)), у каждого из которых степень больше 0 (равенство (12)). Неприводимые многочлены характеризуются отрицанием данного предложения. Поскольку число 1  N никак не распадается в сумму двух натуральных чисел, то из (13) и (15) усматривается ((15) исключает равенство: deg f = 1 = deg g + deg h). Вывод: Любой комплексный неприводим на полем С. многочлен первой степени 7 §2. Деление многочлена на линейный двучлен. Схема Горнера Все дальнейшие рассмотрения проводятся в кольце С [х]. Среди многочленов первой степени выделяются многочлены со старшим коэффициентом 1 и свободный член которых записывается со знаком « - »: x-α. Такие и так записанные многочлены называются линейными двучленами. Определим и рассмотрим деление многочлена на линейный двучлен. Определение. Пусть дан многочлен f и линейный двучлен x-α. Говорят, что выполнено деление многочлена f(x) на линейный двучлен x-α, если удалось найти (построить) новый многочлен g и скаляр r такие, что многочлен f оказался представленным в виде: f = g×(x-α) + r (1) Если это удалось сделать, то найденные g и r называются соответственно - частным и остатком от деления многочлена f на линейный двучлен x-α. В случае, когда остаток r = 0, говорят что многочлен f делится (без остатка) на линейный двучлен x-α или, что линейный двучлен x-α делит многочлен f. Записывают это, соответственно, так: f ÷ (x-α) или (x-α)│ f (2) Покажем, что в кольце С[x] любой многочлен всегда можно разделить на линейный двучлен. Итак, пусть даны комплексный многочлен f и линейный двучлен x-α. Здесь необходимо отдельно рассмотреть два случая: 1. deg f =0 или сам многочлен f =0; 2. deg f(x) ≥1. Рассмотрим их по отдельности. 1. В этом случае многочлен f представляет собой просто скаляр: f = а  С. Мы можем составить очевидное равенство: f = 0(x- α) + а. Мы нашли частное g = 0 и остаток r = а. Таким образом, искомое равенство (1) составлено, а значит в этом случае требуемое действие выполнено. 2. Пусть многочлен f задан. Это значит, что нам известны все его коэффициенты. Запишем его в виде (1) §1: f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (3) 8 В этой записи deg f = n ≥1. Обратимся теперь к равенству (1), точнее к его правой части. Ясно, что deg (x- α) =1. А поскольку скаляр r на степень произведения g  ( x- α) не влияет, то deg f = deg g + deg (xα), т. е. n = deg g +1, или deg g = n-1 (4) Итак, при делении многочлена n-й степени (n ≥1) на линейный двучлен (x-α) - если такое деление возможно - частное является многочленом, степень которого на 1 меньше степени заданного многочлена. Исходя из (3) запишем искомое частное g в виде: g = b n 1 x n 1 +b n 2 x n 2 + … +b 1 x+b 0 (5) Здесь нужно иметь в виду, что многочлен g(x) является искомым, поэтому и его коэффициенты тоже являются искомыми, т.е пока неизвестными. Внесем теперь в (1) развернутые выражения многочленов f и g из (3) и (5). Получим: a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 = (b n 1 x n 1 +b n 2 x n 2 + … +b 1 x+b 0 )(x-  ) + r (6) Если теперь в правой части (6) произвести все указанные там действия, привести подобные члены и приравнять полученные коэффициенты при одинаковых степенях неизвестной х в правой и левой частях равенства (6). то последовательно по убыванию степеней неизвестной х получим n+1 равенств: a n = b n 1 a n 1 = b n 2 - αb n 1 . . . . . a k = b k 1 - αb k . . . . . a 1 = b 0 - αb 1 a 0 = r - αb 0 (7) Из первого равенства (7) мы находим b n 1 . Подставив найденный коэффициент b n 1 во второе равенство (7) мы найдем следующий коэффициент b n 2 и т. д. «Спускаясь » по равенствам (7) сверху вниз мы последовательно найдем все коэффициенты 9 многочлена-частного g и и остаток r. иными словами, мы разделили многочлен f(x) на линейный двучлен x-α. Равенства (7) являются алгоритмом деления многочлена на линейный двучлен. Этот алгоритм можно представить в виде изящной схемы, построенной английским математиком Горнером, и носящей его имя (Горнер Вильямс Джордж (1786 – 1837) английский математик, работавший в области алгебры. Его именем названа схема деления многочлена на линейный двучлен). Суть схемы Горнера достаточно легко усматривается из равенств (7), если их переписать так, чтобы в левых частях стояли искомые величины - коэффициенты многочлена-частного g и остаток r: b n 1 = a n b n 2 = а n 1 +αb n 1 . . . . . b k 1 = а k +α b k . . . . . b 0 = а 1 +α b 1 r = а 0 +α b 0 (8) Полученные формулы (8) удобно представить в виде таблицы следующим образом. В качестве первой строки выпишем коэффициенты заданного многочлена f. Во второй строке, отступив влево на один шаг, запишем число α, задающее линейный двучлен xα (обратить внимание на знак α). Затем в этой же второй строке под коэффициентами многочлена f выписываем левые части равенств (8) - это коэффициенты искомого многочлена-частного g и остатка r. В результате получится следующая таблица: an а n 1 … аk … а1 а0 α b n1 =a n b n2 =а n1 + ... b k 1 =а k + … b 0 = а 1 + r= а 0 + αb n 1 α bk αb 1 αb 0 (9) Полученная таблица и называется схемой Горнера. Пользоваться схемой Горнера очень просто и удобно. Итак, нам нужно разделить заданный многочлен f на линейный двучлен x-α. Мы выполняем последовательно следующие шаги: 1. Выписываем в строку коэффициенты многочлена f; 2. Во второй строке, отступив влево на один шаг, записываем число α; Далее вторую строку заполняем так: 10 2.1. под коэффициентом a n записываем его же вновь - это коэффициент b n 1 (см. схему Горнера); 2.2. каждый следующий коэффициент искомого многочленачастного g равен стоящему над ним коэффициенту многочлена f, сложенному с произведением числа α на найденный перед этим коэффициент этого (т.е. g) многочлена; 2.3. под свободным членом а 0 выписывается остаток r = а 0 +αb 0 (а 0 и α заданы, а b 0 мы нашли на предыдущем шаге). 2.4. вторая строка схемы Горнера задает нам многочленчастное g (его коэффициенты) и остаток r. Теперь мы можем явно записать равенство (1), т.е мы выполнили деление многочлена f на линейный двучлен x-α. §3. Корни многочлена. Функциональная и алгебраическая трактовки. Кратные корни. Пусть комплексный многочлен f задан в канонической записи (см. (1) §1): f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (1) Определение. Скаляр α  С называют корнем многочлена f, если f(α) = 0. (2) Это - так называемое функциональное определение корня многочлена . Но к понятию корня многочлена можно подойти по другому, опираясь на операцию деления многочлена на линейный двучлен. Пусть заданный многочлен f мы разделили на линейный двучлен x- α и, следовательно, получили равенство (1) §2: f = g×(x-α) + r (3) Здесь cкаляр α является произвольным и необязательно корень многочлена f. Положим теперь в равенстве (3) х = α. Так как в правой части (1) α - α = 0, то независимо от значения g(α) окончательно получим: f(α) = r (4) 11 Будучи прочитанным, равенство (4) представляет собой следующее (доказанное нами!) утверждение, называемое теоремой Безу (Безу Этьен (1730 - 1783) - французский математик. Работал в области алгебры. Написал учебник по математике, шеститомный «Курс математики». Его именем названа теорема об остатке от деления многочлена на линейный двучлен): Теорема (Безу). Значение многочлена f(x) при х = α равно остатку от деления этого многочлена на линейный двучлен (х – α). Если мы соединим теперь определение корня многочлена (равенство (2)) с теоремой Безу (равенство (4)), то придем к следующему выводу, представляющему собой (уже доказанную нами) теорему: Теорема. Скаляр α является корнем комплексного многочлена тогда и только тогда, когда линейный двучлен x- α делит этот многочлен: (x- α)│ f (5) Соотношение (5) указывает на то, что остаток r от отделения f на x- α равен нулю: r = 0. Это значит, что для корня α многочлена f равенство (3) принимает вид f = g×(x- α) (6) Поскольку сформулированная (и доказанная!) теорема носит необходимый и достаточный характер (критерий), то признак (5) можно тоже считать определением корня многочлена. Это - так называемое алгебраическое определение корня многочлена. В зависимости от характера поставленной задачи одно из двух определений корня многочлена бывает предпочтительнее другого. Так, например, именно алгебраическое определение корня многочлена позволяет ввести понятие кратности корня. Определение. Пусть Скаляр α является корнем комплексного многочлена f . Говорят, что корень α имеет кратность k или, что он является корнем кратности k, где k - натуральное число, если k является наибольшим показателем степени линейного двучлена x- α, делящего многочлен f. 12 Раскроем это определение более детально. То, что α - корень многочлена f, означает, что выполняется делимость (5). В (5) линейный двучлен x- α представлен в первой степени. Но можно спросить себя: а другие степени линейного двучлена x- α делят многочлен f ? И если да, то какова наибольшая степень линейного двучлена? Ответ на второй вопрос и приводит к понятию кратности корня. Итак, если k - кратность корня  многочлена f то обязательно (x- α) k │f (7) То, что k - наивысший показатель степени означает, что x- α в большей степени уже не делит многочлен f(x), т. е. (x- α) k  1 не делит f (8) Пусть α - корень многочлена f. Найти его кратность помогает схема Горнера. Действительно, то что α - корень многочлена f устанавливается с помощью схемы Горнера, из которой мы находим частное отделения f на x- α. В таблице (9) §2 это многочлен g с коэффициентами b j , где j = n-1, n -2, …, 1, 0. Если кратность корня α многочлена f больше 1, то это значит, что как минимум (x- α) │f 2 (7) Т. е., найдется многочлен, обозначим его g 1 такой, что f = (x- α) g 1 2 (8) Если в левой части (8) заменить f его выражением из (4), то получим g×(x- α) = (x- α) g 1 2 (9) Разделив обе части (9) на многочлен x- α, мы получим g = (x- α)g 1 (10) 13 Но равенство (10) говорит о том, что α корень многочлена g ((x- α) делит g)!), т. е. α - корень частного от деления исходного многочлена f на (x- α). Проверить же это можно схемой Горнера, причем не составляя новую, а используя прежнюю (см. схему Горнера (9) §2). Тем самым, мы получим многочлен g 1 . Не выписывая коэффициенты многочленов f, g, g 1 , мы изобразим результаты в новой схеме - мультисхеме - Горнера так: α α f (первая строка с коэффициентами многочлена f) g ( строка с коэффициентами многочлена g) 0 g 1 ( коэффициенты многочлена g 1 ) 0 (11) Нули в конце второй и третьей строк - это остатки отделения на линейный двучлен x- α соответственно многочленов f и g. Конечно, эту мультисхему Горнера можно продолжить. А именно, добавить четвертую строку, поделив имеющийся многочлен g 1 на линейный двучлен x- α. В четвертой строке будут выписаны коэффициенты многочлена-частного от указанного деления. Обозначим этот многочлен через g 2 . При этом получится некоторый остаток. Если этот остаток равен 0, то это значит, что g 1 (х) делится на линейный двучлен x- α: g 1 = (x- α) g 2 (12) Если теперь в (8) заменить g 1 (х) его выражением из (12), то получим f = (x- α) g 2 3 (13) Равенство (13) указывает на то, что корень многочлена f(x) имеет кратность не менее 3-х, т.е . кратность корня не менее числа нулевых остатков в обобщенной схеме Горнера. Допустим теперь, что полученный многочлен g 2 уже не делится на на линейный двучлен x- α, т. е. при делении g 2 на x- α получается некоторое частное g 3 и ненулевой остаток r: g 2 = (x- α) g 3 + r (14) Если внести в (13) вместо g 2 (х) его выражение из (14), то получим f =( x- α) ((x- α)g 3 + r) = (x- α) g 3 + (x- α) r 3 4 3 14 Отсюда видно, что в правой части не удается выделить 4 3 сомножитель (x- α) , а значит многочлен f(x), делясь на (x- α) , не 4 делится на бОльшую степень - (x- α) . Следовательно, в соответствии с определением кратности корня в нашем случае эта кратность равна 3. Если обратиться к мультисхеме Горнера, то легко видеть, что кратность 3 корня α многочлена f в точности совпадает с числом нулей, стоящих в конце каждой строки, начиная со второй, обобщенной схемы Горнера. Отсюда усматривается общее правило нахождения кратности α многочлена f: Пусть дан комплексный многочлен f и произвольный скаляр α. Чтобы выяснить, является ли α корнем многочлена f, и, если является, то какова кратность этого корня, мы поступаем следующим образом: 1. с помощью схему Горнера делим f на линейный двучлен xα. Если полученный при этом остаток r отличен от 0, то α - не корень и ответ получен; 2. если же r = 0, то α - корень многочлена f. Для определения кратности корня α начатую схему Горнера достраиваем нижними строками до мультисхемы Горнера (см (11)): последовательно делим на x- α многочлен-частное g, затем - g 1 , g 2 и т. д.. Построение мультисхемы Горнера завершаем по получении первого ненулевого остатка. При этом кратность корня α совпадает с числом нулей, стоящих в конце каждой строки, начиная со второй, мультисхемы Горнера. §. 4 Основная теорема алгебры. Формулы Виета. Фундаментальная характеристика поля комплексных чисел как предельно широкого числового поля (см. Введение) выражается следующей теоремой, исторически получившей название основной теоремы алгебры. Доказательство этой теоремы далеко выходит за пределы наших рассмотрений, поэтому мы прнинимаем ее формулируем, опираемся на нее - без доказательства (доказывается в теории функций комплесного переменного). Теорема (основная теорема алгебры). Всякий комплексный многочлен f степени больше нуля имеет в поле С хотя бы один корень. Теорема. 1.Неприводимыми над полем С являются только многочлены первой степени; 15 2. Всякий ненулевой комплексный многочлен f имеет в поле С ровно deg f корней, считая их кратности. Доказательство. 1. В §1 отмечалась неприводимость над С многочленов первой степени (см. Вывод, завершающий §1). Остается, следовательно, доказать приводимость над С любого многочлена f  С [x], deg f > 1 (1) Согласно условию, f имеет в поле С хотя бы один корень α  С. Тогда f делится на линейный двучлен х-α (алгебраическое определение корня), т.е. f может быть разложен в произведение: f =(х – α) g (2) На основании (1) из (2) выводим: deg (х – α) = 1 > 0, deg g = deg f - deg (х – α) >0 (3) Соотношения (3) (см. определение приводимости в конце §1) указывают на приводимость f, что завершает доказательство. 2. Если f  С *, то f не имеет корней и deg f = 0, что соответствует доказываемому утверждению. Пусть, поэтому, deg f > 0. Пусть, далее, α 1 , α 2 , . . . , α t - все попарно различные комплексные корни многочлена f соответственно кратностей s 1 , s 2 , … , s t . Тогда f можно записать в виде: f = (x-α 1 ) s (x-α 2 ) s … (x-α t ) s g 1 2 t (4) Поскольку всякий корень β многочлена g был бы дополнительным к α 1 , α 2 , . . . , α t корнем многочлена f, а нами выписаны все его корни, то комплексный многочлен g корней не имеет, следовательно его степень равна нулю: deg g = 0. Применяя теперь к (4) правило нахождения степени произведения многочленов (формул (8) §1), устанавливаем, что deg f = s 1 + s 2 + … + s t . А это - по прочтении - и есть требование нашего утверждения. Теорема доказана. Рассмотрим нормированный (со старшим коэффициентом, равным 1) комплексный многочлен f степени больше нуля: deg f = n > 0. Запишем его в каноническом виде: f = x n + a n 1 x n 1 + ….. + a 1 x + a 0 (5) 16 Согласно п 2 доказанной теоремы многочлен f имеет ровно n комплексных корней, считая их кратности. Пусть это будут корни α 1 , α 1 , …, α n (6) Имея корни (6) мы можем разложить нормированный многочлен f в произведение неприводимых сомножителей: x n + a n 1 x n 1 + ….. + a 1 x + a 0 = (х-α 1 )(х-α 1 ) … (х-α n ) (7) Производя умножения в правой части (7) и приводя подобные (собирая коэффициенты при одинаковых степенях неизвестной х), мы получим многочлен n-й степени. Так как левая и правая части (7) - это один и тот же многочлен, то последовательно приравнивая коэффициенты при одинаковых степенях х в левой и правой частях (7) мы получим серию из n равенств (при x n в обеих частях стоит 1): a n 1 = -(α 1 + α 2 + … + α n )      ...     ...    a n2 = (  ) 1 2 1 3 1 n n  1 n . . . . . n k   ...   ...    ...  a k = (-1) ( 1 ) 2 n  k k  1 k  2 n . . . a 0 = (-1) 12...n . (8) . n Формулы (8) и являются искомыми формулами Виета (Виет Франсуа (1540-1603) - французский математик). Лингвистическая версия формулы (8) для коэффициента a k может быть представлена так: Коэффициент при k-й степени неизвестной х нормированного комплексного многочлена n-й степени (больше нуля) равен сумме всевозможных произведений по n-k из n его корней, взятой со знаком (-1) nk . При n =2 многочлен f становится квадратным - f(x) = x 2 +a 1 x+a 0 и формулы Виета (8) превращаются в хорошо известные в школе формулы, только выводимые для квадратных уравнений: a 1 = - ( 1 +  2 ) a 0 = 1  2 17 §5. Корни действительных многочленов. Приводимость действительных многочленов над полем R В настоящем параграфе рассматривается вещественных (действительных) чисел. Изложим, вначале, вопросов, используемых в последующих рассуждениях. поле R несколько Сопряженные числа и их свойства. Сопряженными называются комплексные числа a+bi и a-bi. Обозначение: a+bi = a-bi или a-bi = a+bi (англ. сonjugate – сопряженный). Пусть α и β два любых комплексных числа и # - любая из четырех арифметических операций. Тогда α#β = α#β 1. (1) 2. α +αR (2) 3. αα ≥ 0 (3)  (4) (α  R) 4. (α = α ) Рассмотрим теперь действительный многочлен n-й степени: f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (5) a n , a n 1 , …, a 1 , a 0  R (6) Формально многочлен f можно рассматривать как комплексный. Поэтому в поле комплексных чисел он имеет n корней, среди которых действительные корни могут быть, а могут и не быть. Докажем следующее утверждение: Теорема. Если α - комплексный корень действительного многочлена, то сопряженное ему число  так же является его корнем. Доказательство. Если α - действительное число, то α =  (свойство 4 сопряженных чисел) и теорема становится очевидной. Пусть α - чисто комплексное, не действительное число. По условию f(α) = 0 или, более подробно с учетом (5): f(α) = a n (α) n + a n 1 (α) n 1 + ….. + a 1 (α) + a 0 = 0 (7) 18 Теорема будет доказана, если мы покажем, что f(  ) = 0. Вносим х =  в (5) и, опираясь на свойства сопряженных чисел, последовательно находим: f(  ) = a n (  ) + a n 1 (  ) n n 1 + ….. + a 1  + a 0 = а n  n + an1  n1 + ….. + a1  + a0 = an n  an1 n1  ...  a1  a0 = f (a ) = 0 = 0 Т.е., f(  ) = 0 и теорема доказана. Из теоремы следует, что все комплексные (не действительные) корни действительного многочлена распадаются на пары сопряженных корней, а значит справедливо утверждение: Cледствие 1. Число комплексных корней действительного многочлена обязательно четное. Из теоремы и ее следствия 1 из нее сразу вытекает еще одно утверждение: Следствие 2. Действительный многочлен нечетной степени обязательно имеет хотя бы один действительный корень. В самом деле, у такого многочлена в области комплексных чисел, по теореме о числе корней, число корней нечетно. А чисто комплексных корней число четное, отсюда и вытекает следствие 2. Вернемся к сопряженным корням α и  действительного многочлена f. Обозначим через ρ  следующий многочлен (легко усматривается, что он - действительный): ρ  = (х - α)(х -  )  R[x] (8) Поскольку, как доказано, в кольце C[x] многочлен f делится как на х α так и на х -  , а линейные двучлены х - α и х -  - взаимно простые (можно проверить критерием взаимной простоты), то f делится на их произведение, т. е. на ρ  - действительный квадратный трехчлен, обладающий двумя комплексными сопряженными корнями. Но тогда и частное от деления f на ρ  - обозначим его через g также многочлен действительный: 19 f = ρ  g, где g  R[x] (9) Лингвистическая интерпретация равенства (9) означает, что если f - действительный многочлен и α - его комплексный корень, то в кольце R[x] многочлен f делится на действительный квадратный трехчлен ρ  . На основании (9) доказывется следующая теорема, полностью решающая вопрос приводимости многочленов над полем R: Теорема. Над полем действительных чисел неприводимы лишь многочлены 1-й степени и 2-й степени с отрицательным дискриминантом. Доказательство. Возьмем произвольный многочлен f  R[x] степени больше нуля и протестируем его на «приводимость» над полем R в зависимости от его степени. 1. deg f = 1. Многочлен неприводим (см. последнее заключение §1). 2. deg f = 2. Если дискриминант многочлена f неотрицателен, то f имеет в R два корня, значит разлагается в произведение двух линейных множителей, что тождественно его приводимости над R. Если же дискриминант многочлена f отрицателен, а f - тем не менее - приводим над R, то f обязан разлагаться в произведение двух линейных вещественных сомножителей, доставляющих многочлену f два вещественных корня. Налицо - противоречие. Мы полностью протестировали на «приводимость» многочлены степени 1 и 2. Полученное выше противоречие, вместе со случаем 1, выделило множество многочленов, удовлетворяющих доказываемой теореме. Покажем, что иных, неприводимых над R мночленов нет. Действительно, если f  R[x] - не тестированный на предыдущих этапах многочлен, то его степень deg f > 2. Если f имеет вещественный корень, то он делится на вещественный линейный двучлен, а потому приводим над R. Если же f не имеет вещественных корней, то он обладает хотя бы одним комплексным корнем α, а значит делится на вещественный квадратный трехчлен ρ  , что приводит нас к равенству (9), которое, с учетом deg f > 2, указывает на приводимость многочлена f над полем вещественных чисел R. Теорема доказана. 20 §6. Числа, выражаемые в радикалах. Алгебраические уравнения и проблема их разрешимости в радикалах Пусть имеется n+1 комплексных чисел (для дальнейшего нам удобно обозначить количество выбранных чисел именно так): a n , a n 1 , ….. a 1 , a 0  C (1) Определение. Говорят, что число α  C выражается в радикалах через числа (1), если для выражения (представления, репрезентации) α через эти числа используются только четыре арифметические операции и операции извлечения корней (любой натуральной степени). Следует обратить внимание на то, что арифметических операций (бинарных) - всего четыре, в то время как операций извлечения корней любой натуральной степени (унарных) - бесконечно много. Применяться эти операции могут самым различным образом: к исходным числам (1), к результатам этих операций над числами (1), к результатам результатов … (иерархия или последовательность применения операций) и т.д. Определение. Алгебраическим уравнением n-й степени с комплексными коэффициентами называют уравнение вида f(x) = 0 (2) где f(x)  C [x] deg f(x) = n. Замечание. В более общем виде (и в конкретных примерах) многочлены могут стоять и в левой, и в правой частях (2). Но путем эквивалентных преобразования такие уравнения приводятся к стандартному виду (2). Записав многочлен f в левой части (2) в каноническом виде, получим каноническую запись алгебраического уравнения n-й степени: a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 = 0 (3) Определение. Комплексное число α называют корнем алгебраического уравнения (2), если α - корень многочлена, стоящего в его левой части, т.е.. если f(α) = 0 (4) 21 Из определения усматривается тождественность понятий «корень многочлена» и «корень алгебраического уравнения», что поможет нам в дальнейшем. В частности, из этого факта вытекает, что алгебраическое уравнение n-й степени с комплексными коэффициентами имеет в поле С в точности n корней. Проблема решения алгебраических уравнений состоит, следовательно, в нахождении (отыскании) их корней. В проблеме нахождения корней алгебраического уравнения выделяют два аспекта: 1. можно ли построить процедуру (алгоритм) нахождения корней, и 2. сводима ли такая процедура к выражению корней уравнения в радикалах через его коэффициенты. Нас интересует второй аспект. Определение. Говорят, что корень α алгебраического уравнения выражается в радикалах, если α выразим в радикалах через коэффициенты этого уравнения. Если все корни алгебраического уравнения выразимы в радикалах, то уравнение называют разрешимым в радикалах. К разрешимым в радикалах очевидно относятся алгебраические уравнения 1-й (линейные) и 2-й (квадратные) степеней. Нас интересует проблема разрешимости в радикалах алгебраических уравнений выше 2й степени. Сделаем два достаточно очевидных, но для дальнейшего очень важных замечания относительно алгебраических уравнений. Замечание 1. В алгебраическом уравнении (2) (или (3) - что то же самое) многочлен f всегда можно считать нормированным (старший коэффициент равен 1). Действительно, если это не так, то можно умножить обе части уравнения на 1 an («пронормировать» - 1 заменить многочлен f(x) на a f(x)), что оставляет неизменным набор n искомых корней. Замечание 2. Пусть уравнение (3) нормировано: рассматриваемое x n + a n 1 x n 1 + ….. + a 1 x + a 0 = 0 алгебраическое (6) Сделаем замену переменных, а именно, положим в (6) a n 1 x=y- n (7) 22 Преобразовав левую часть (6) на основании (7), мы получим новое алгебраическое уравнение той же степени n с неизвестной y, в котором - и это - цель осуществленной замены переменных - отсутствует слагаемое с y n 1 (коэффициент при y n 1 равен 0): y n + A n 2 y n 2 + ….. +A 1 x + A 0 = 0 (8) Определение. Алгебраическое уравнение n-й степени с нулевым коэффициентом при (n-1)-й степени неизвестной называют неполным. Таким образом, (8) - неполное (и даже нормированное) уравнение n-й степени. Из способа перевода алгебраического уравнения в неполное усматриваются необходимые для дальнейшего выводы. Любое алгебраическое уравнение подходящей заменой переменных (в нашем случае - это замена (7)) преобразуется в неполное, причем: a n 1 1. если  - корень уравнения (6), то  =  + n - корень уравнения (8) и наоборот: если  - корень уравнения (8), то  =  a n 1 - корень уравнения (6); n 2. если корень  уравнения (6) выражен в радикалах, то, как видно из (7), корень  уравнения (8) также выражается в радикалах и наоборот. Отсюда - важный вывод-подспорье: Если решается задача выявления разрешимости в радикалах заданного алгебраического уравнения, то ее можно заменить задачей выявления разрешимости в радикалах более простого нормированного и неполного уравнения, к которому соответствующими преобразования сводится исходное уравнение. Причем такой сводимостью мы, при необходимости и возможности, решим исходное уравнение (найдем все его корни). §7. Решение в радикалах кубических уравнений Задача. Дано алгебраическое уравнение 3-й степени (его называют кубическим) с комплексными коэффициентами. Требуется установить его разрешимость в радикалах и, если оно разрешимо в радикалах, найти все его корни. Приступаем к решению этой задачи. Во-первых, заменим в поставленной задаче кубическое уравнение неполным и нормированным (см. последний вывод §6): 23 x 3 + px + q = 0, p, q  C (1) Далее, запишем искомый корень α уравнения (1) в виде суммы двух чисел u и v: α = u +v (2) Вносим в левую часть (1) вместо х число α из (2). Совершив, после этого, достаточно элементарные и прозрачные преобразования, получим: u 3 + v 3 + (u + v)(3uv + p) + q = 0 (3) Выбранное нами представление (2) корня α (неявно задан) уравнения (1) указывает на то, что на числа u, v мы можем наложить какое либо нужное нам соотношение, позволяющее, при фиксации одного из этих чисел, найти второе и, следовательно, найти α. Равенство (3) подсказывает каким бы могло быть это соотношение, связывающее u и v. А именно, положим 3uv + p = 0 p или uv = - 3 (4) На основании (4) равенство (3) примет вид (перенеся q правую часть): u3 + v3 = - q (5) Итак, к настоящему моменту задачу решения в радикалах неполного кубического уравнения (1) мы заменили задачей решения системы уравнений (4), (5): u3 + v 3 = - q (6) p uv = - 3 Выразимся более определенно: 1. если α корень неполного кубического уравнения (1), то всегда можно подобрать два числа u и v, образующие решение (пара чисел) системы уравнений (6); 2. если какие либо числа u и v образуют решение системы уравнений (6), то их сумма (2) является корнем исходного уравнения (1). Для удостоверения этого факта вносим вместо х в левую часть (1) число u+v, преобразуем к (3) и убеждаемся, в силу (6), в обращении полученного выражения в 0, т.е. u+v - корень уравнения (1). Итак, если решим систему уравнений (6) относительно неизвестных u и v, то будет решено и исходное уравнение (1). Для 24 этого обе части второго уравнения (6) возведем в куб. система (6) преобразуется в систему уравнений: u 3 +v 3 = -q (7) p u3v3 = - ( 3 )3 Чем различаются системы уравнении (6) и (7)? Ясно, что всякое решение системы (6) является таковым и для системы (7). Система же (7) может иметь больше решений, чем система (6): переход от системы (7) к (6) требует извлечения корня кубического из обеих частей второго уравнения (7), а значений такого корня может быть три и лишь одно из них - это значение для второго уравнения системы (6). Иными словами, система уравнений (7) имеет излишние по отношению к системе (6) решения. Отсюда Предписание: решая систему уравнений (6) (а значит и исходное неполное кубическое уравнение (1)), заменяем ее системой (7). Решив систему (7), из ее решений оставляем только те, которые являются и решениями системы (6). Т.е., найденные числа u и v, образующие решение системы (7), должны удовлетворять второму уравнению (6) (первые уравнения в (6) и (7) одинаковы). Здесь вполне уместен вопрос: насколько мы продвинулись в решении системы уравнений (6)? Ведь формально система уравнений (7) сложнее системы (6)! При ответе на этот вопрос решающими являются два обстоятельства: 1. в поиске чисел u и v иногда удобнее искать их степени, в данном случае - их кубы; 2. (главное!) система уравнений (7) задает сумму и произведение кубов искомых чисел, а значит по обратной теореме Виета для квадратных уравнений они - u 3 и v 3 являются корнями нормированного квадратного уравнения: z 2 + qz - ( p 3 ) =0 3 (8) Решая (8) находим u 3 и v 3 : q u 3 , v 3 = z1, 2 = - 2  q p ( )2 ( )3 2 3 (9) 25 Отсюда q 2 q 2 p 3 3 () u = 3 ( )2 , v= q q2 p3  ( )  () 2 2 3 3 (10) Итак, найдены значения u и v, формирующие решения системы уравнений (7). Учитывая, что каждый из радикалов (10) имеет три значения, система (7) обладает девятью решениями. Из этих девяти решений системы (7) только три будут решениями системы (6) - это те решения, составленные из значений (10), для которых u и v, согласно предписанию, удовлетворяют второму уравнению (6). Окончательно, мы нашли и выразили формулами все три корня исходного неполного кубического уравнения (1): α= u+v= q q2 p3  ( )  () + 2 2 3 3 q q2 p3  ( )  () 2 2 3 3 (11) где значения u и v радикалов в правой части (11) удовлетворяют второму уравнению (6): p uv = - 3 (12) Формулы (11) корней неполного кубического уравнения (1) (конечно, при условии (12)) называются формулами Кардано (по имени итальянского математика Джироламо (или - Иеронимус) Кардано (24. 09. 1501 – 1576 г.г. Врач, механик. Его имя носит карданный вал, который он сконструировал, хотя и не был здесь первопроходцем.) Заключение. Поставленная в начале параграфа задача решена! Формулы Кардано (11) безапелляционно указывают на разрешимость в радикалах неполного - а значит произвольного кубического уравнения с комплексными коэффициентами. 26 §8. Тригонометрическая форма и исследование корней неполного кубического уравнения Вначале актуализируем необходимые для нас сведения о корнях в поле С. Тригонометрическая форма корней n-й степени из 1. Радикал n 1 имеет в поле С ровно n значений, которые можно записать в тригонометрической форме:  k = cos 2k 2k + i sin , n n k = 0,…,n-1 (1) Корни (1) образуют т.н. мультипликативную группу корней n-й степени из 1 - группу G(n,1). Cреди корней (1) n-й степени из 1 выделяются так называемые первообразные корни - натуральные степени от 0 до n-1 каждого из которых исчерпывают все множество этих корней. Если  - первообразный корень, то {  0 =1,  1 ,  2 , …,  n 1 } = G(n,1) (2) Основываясь на формуле умножения (возведения в степень) комплексных чисел в тригонометрической форме, из (1) следует, что корень  1 = cos 2 2 + i sin n n (3) является первообразным. Вообще (корень  k = n 1 - первообразный)  ((k,n) = 1) (4) Если извлекается корень n–й степени из комплексного числа a и α = a - одно из значений этого корня, то все значения α k корня получаются по формуле: n α k = αε k , k = 0,…,n-1 (5) Понятно, что в правой части (5) вместо ε k можно поставить степени выбранного первообразного корня n-й степени из 1. Если сказанное редуцировать к случаю n = 3, - а именно при этом значении n алгебраическое уравнение является кубическим, - то три значения кубического корня из 1 можно выписать явно: 27 3 1: 2 2 1; cos 3 ± i sin 3 1 3 = 2 ±i 2 (6) При этом каждый из двух комплексных (не 1) корней (6) является первообразным, а второй - его квадратом. Так что если обозначить через ε - любой из комплексных корней (6) ε = 1 3 ± i , 2 2 (7) то все три значения кубического корня из 1 могут быть записаны так: 3 1: 1; ε; ε 2 (8) При этом из (7) следует, что при любом выборе знака для ε (выбирается одно из двух значений ε) всегда ε2 =  , 1 + ε + ε2 = 0 (9) Пусть теперь дано неполное кубическое уравнение (1) §7: x 3 + px + q = 0, p, q  C (10) и α - его корни, записанные формулами Кардано (11) §7: α= u+v= q q2 p3  ( )  () + 2 2 3 3 q q2 p3  ( )  () 2 2 3 3 (11) Это означает, что значения кубических радикалов u и v в формулах (11) удовлетворяют равенству (12) §7: p uv = - 3 (12) Пусть u - одно из трех значений кубического радикала, стоящего в правой части (11) (первое слагаемое). Тогда, согласно формулам (5), для случая n=3, задаваемого формулами (8), мы можем выписать все три значения этого кубического радикала: u, uε , uε 2 (13) 28 Аналогично, если v - соответствующее для u значение другого радикала в правой части (11) (второе слагаемое), то по тем же основаниям выписываются все три его значения: v, vε , vε 2 (14) Помним, что каждое значение из (13) согласовано точно с одним значением (14). Инструмент согласования - равенство (12). Отсюда усматриваются следующие три пары согласованных значений (с учетом уже имеющейся согласованности u и v): u, v; uε, vε 2 и uε 2 , vε. Суммы значений каждой пары и есть три корня неполного кубического уравнения (10). выпишем эти корни в следующих обозначениях: α 1 = u + v, α 2 = uε + vε 2 , α 3 = uε 2 + vε (15) Формулы (15) и есть искомая тригонометрическая форма корней неполного кубического уравнения. Для получения формул (15) необходимо: 1. найти согласованную (удовлетворяющую равенству (12)) пару значений u и v кубических радикалов, стоящих в правой части (11); 2. записать корни (15), где ε и ε 2 берутся из (7). Исследовать корни неполного кубического уравнения значит выяснить условия наличия среди них кратных (совпадающих) корней. Исследование корней незамедлительно становится прозрачным, если хотя бы один из коэффициентов уравнения (10) «зануляется»: pq = 0. Поэтому рассматривается т.н. «общий» случай: pq ≠ 0 (16) Обратимся к формулам Кардано (11) корней уравнения (10). Определение. Выражение, стоящее под знаком квадратного корня в правой части формул Кардано q p D = ( 2 )2 + ( 3 )3 (17) называется дискриминантом неполного кубического уравнения. Теорема. Неполное кубическое уравнение с комплексными коэффициентами имеет кратные корни тогда и только тогда, когда его дискриминант равен нулю: D= ( q 2 p 3 ) + ( ) = 0 2 3 (18) 29 Доказательство. 1. Пусть уравнение (10) имеет кратные (совпадающие) корни и, для определенности (см. (15)): α1 = α 2 (19) Необходимо доказать (18). Заменив в (19) α 1 и α 2 их выражениями в тригонометрической форме из (15), после естественных преобразований получим: u(1-ε) = v(ε 2 -1). Сокращение обеих частей полученного равенства на (1-ε) дает: u = -(1+ε)v. Теперь на основании второго равенства (9) заменим, в полученном нами равенстве, -(1+ε) на ε 2 . Окончательно получим равенство: u = ε 2 v. Возведение обеих частей этого равенства в 3-ю степень дает (помним (8)): u3 = v3 (20) Но (20) указывает на кратность корней квадратного уравнения (8) §8, дискриминант которого (см. (8), (9) §8) и есть дискриминант D (см. (17)) нашего неполного кубического уравнения. Следовательно, D = 0 и (18) доказано. 2. Обратно, пусть выполняется (18). Обратимся к значениям радикалов (10) §8. В силу (18) первый радикал (10) §8 примет вид, который мы сразу подвергнем достаточно очевидным преобразованиям u = 3  q q q = 3 ( )3:( }2 = 2 2 2 q p ( )3:( ( )3) = 2 3 3 Из (21) следует, что одним из значений 3 ( 3q 3 ) 2p радикала (21) u будет 3q значение 2 p . Cогласованное c ним значение v находится из (12): v = p 3q (- 3 ):( 2 p ) . Найдем v, осуществляя необходимые преобразования и вновь опираясь на (18): p 3q p 2 p 6 q 6 3q v = (- 3 ):( 2 p ) = - ( 3 ) 2 q = - ( 3 ) 3 pq = ( 2 ) 2 pq = 2 p = u (22) Итак, при нулевом дискриминанте неполного кубического уравнения (выполняется (18)) в качестве одной пары согласованных значений кубических радикалов u и v можно выбрать равные значения u = v, причем 3q u = v = 2p (23) 30 На основании (23) находим корни неполного кубического уравнения в тригонометрической форме (15) (помним, что ε + ε 2 = -1: см. (9)): α1 = 3q p , 3q α 2 = α3 - 2p (24) Формулы (24) указывают на наличие кратного корня неполного кубического уравнения: это - корень α 2 . Теорема доказана. Более детальное прочтение формул (24) доказанной теоремы указывает на то, что нулевой дискриминант неполного кубического уравнения (при условии (16)) не только обеспечивает кратность одного из его корней, но позволяет явно записать все корни через коэффициенты уравнения. §9. Исследование корней действительного неполного кубического уравнения Пусть теперь неполное действительные коэффициенты: кубическое x 3 + px + q = 0, p, q  R уравнение имеет (1) По-прежнему рассматриваем случай pq ≠ 0 (cлучай pq = 0 в исследовании корней достаточно тривиален). Имея нечетную степень, уравнение (1) обязательно имеет хотя бы один вещественный корень. Исследованию подлежат, поэтому, два других корня уравнения (1): условия их вещественности или комплексности (а значит сопряженности!). Обратимся к дискриминанту уравнения (1) ((17) §8): q p D = ( 2 )2 + ( 3 )3 (2) Теперь D  R. Ясно, что выводы по комплексному уравнению справедливы и для вещественного. В частности, при D = 0 корни уравнения (1) находятся по формулам (24) §8 (запомним!). Поэтому, исследованию подлежит случай D ≠ 0. В силу вещественности D здесь возникают два случая (которых не было в «комплексном» варианте): D > 0 и D < 0. Рассмотрим эти случаи. 31 D>0 (3) Неравенство (3) позволяет найти вещественное число a  R такое, что D = a2 (4) Из формул (10) §7, в силу (4), следует, что одно из значений кубического радикала u является вещественным. Но тогда на основании (12) §7 согласованное с ним значение второго кубического радикала v так же является вещественным. Итак, промежуточный результат: При положительном дискриминанте вещественного неполного кубического уравнения для записи его корней в тригонометрической форме (по формулам Кардано) согласованные значения u и v могут быть выбраны вещественными. Считаем что указанный выбор совершен: u, v  R (5) Воспользовавшись тригонометрической формой корней (15) §8, мы, в силу (5), усматриваем: α 1 = u + v  R, α 2 = uε + vε 2  С (  R), α 3 = uε 2 + vε =  2 (6) Как вывод формулы (6) гласят: Вывод 1. При положительном дискриминанте вещественное, неполное кубическое уравнение имеет один вещественный и два комплексных, сопряженных корня. Рассмотрим теперь второй случай знака дискриминанта D: D<0 (7) Неравенство (7) позволяет найти вещественное число a  R такое, что D = -a 2 (8) В силу (8) формулы (10) §7 примут вид: q 2 u = 3   ai , v= 3 q  ai 2 (9) 32 Под знаками кубических радикалов (9) стоят сопряженные числа. Поэтому, значения этих радикалов попарно сопряжены (см. свойства сопряженных чисел). Пусть u 0 - одно из значений радикала u. Тогда u 0 - одно из значений радикала v. Отсюда по формулам (13), (14) §8 получим все значения радикалов u и v: u: u 0 , u 0 ε, u 0 ε 2 (9) v: u 0 , u 0 ε, u 0 ε 2 (10) Требованием (12) §8 каждое из значений (9) согласовано точно с одним значением (10) так, что суммы согласованных значений u и v (их - три пары!) и есть корни исходного уравнения (1). Но в нашем случае - в силу вещественности p (см. (1)) - такими согласованными парами могут быть только u 0 и u 0 , u 0 ε и u 0 ε 2 , u 0 ε 2 и u 0 ε. Отсюда получаем три корня уравнения (1) (см. (15) §8) : α 1 = u 0 + u 0 , α 2 = u 0 ε + u 0 ε 2 , α 3 = u 0 ε 2 + u 0 ε. (11) Из (11) сразу усматривается, что α 1  R. Далее, по первому равенству (9) §8 и свойству взаимности сопряженных чисел из (11) усматриваем, что α 2 =  2 и α 3 =  3 , т. е. α 2 , α 3  R. Отсюда получаем Вывод 2. Вещественное неполное кубическое уравнение с отрицательным дискриминантом имеет три действительных корня. Результаты исследования корней неполного кубического уравнения (1) как для комплексного, так и для вещественного случаев визуализируются в единую таблицу: Корни α 1 , α 2 , α 3 p, q  C p, q  уравнения x 3 + px + q = 0, pq ≠ 0 D≠0 α 1 , α 2 , α 3 - различны кратные корни: D=0 3q p , 3q D>0 α 2 = α3 = - 2p α 1  R, α 2 =  3  C D<0 α1 , α 2 , α 3  R R α1 = 33 §10. Решение в радикалах алгебраических уравнений 4-й степени. О разрешимости в радикалах уравнений выше 4-й степени Пусть дано алгебраическое уравнение 4-й степени с комплексными коэффициентами. Надлежит выяснить разрешимость такого уравнения в радикалах. Для решения этой задачи мы считаем это уравнение неполным и нормированным (см. вывод в конце §6): x 4 + px 2 + qx + r = 0, p, q, r  C (1) Внесем в левую часть (1) параметр α  C и выполним тождественные преобразования p p (x 2 + 2 + α) 2 - {2αx 2 - qx + (  2 + pα + ( 2 ) 2 - r)} = 0 (2) Поскольку левая часть (2) тождественна левой части (1) при любом значении α, мы выберем α так, чтобы обратить квадратный относительно х трехчлен в фигурных скобках левой части (2) в квадрат линейного двучлена. Для этого необходимо и достаточно, чтобы дискриминант квадратного относительно х трехчлена в фигурных скобках обращался в 0 (квадратный трехчлен имеет равные кратные - корни): p q 2 - 4  2α  (  2 + pα + ( 2 ) 2 - r) = 0 (3) Преобразовав левую часть (3) относительно α, мы получим относительно α - кубическое уравнение общего вида: Aα 3 + Bα 2 + Cα + D = 0 - (4) где A, B, C, D выражены через коэффициенты p, q, r исходного уравнения (1) посредством четырех арифметических операций, а значит - формально - выражены через них в радикалах. Применив к (4) необходимые разрешающие процедуры (пронормировать, привести к неполному виду, применить формулы Кардано, возвратиться к исходному уравнению (4) - см. §7), мы найдем три корня уравнения (4) (значит (3)) - искомые значения α, - выражаемые в радикалах через A, B, C, D, а следовательно и через p, q, r. Пусть α 0 - один из корней уравнения (3). Внеся α 0 в (2) и перенося в левую часть вновь образованное выражение в фигурных скобках (квадрат линейного двучлена), получим: 34 p q (x 2 + 2 + α 0 ) 2 = 2 α 0 (х - 4 ) 2 0 (5) Уравнение (5) эквивалентно совокупности двух квадратных относительно х уравнений (получаются извлечением квадратного корня из обеих частей (5)): p x2 + 2 + α0 = ± q 2 0 (х 4 0 ) (6) Решив оба квадратных уравнения (6), мы найдем все четыре корня (по два корня каждого квадратного уравнения) уравнения (5), являющиеся корнями и исходного уравнения (1). Формулы, выражающие корни уравнения (1) через его коэффициенты, будут очень сложными и громоздкими и экспликация их в явном виде нецелесообразна. Поэтому всякий раз, решая неполное уравнение ;-й степени, описанный выше алгоритм решения просто полностью повторяют. Этот алгоритм называют методом Феррари (Феррари Людовико (1522 – 1565) – итальянский математик, ученик Кардано. Публикации своего труда не дождался). Несмотря на то, что метод Феррари не представлен явными формулами, характер этих формул, тем не менее, описывается однозначно. Так как α 0 в уравнениях (6) выражается в радикалах через p, q, r, то из (6) усматривается, что корни этих уравнений, - а это - корни исходного уравнения (1), - выражаются в радикалах через p, q, r. Отсюда Вывод. Всякое алгебраическое уравнение 4-й степени с комплексными коэффициентами разрешимо в радикалах. О разрешимости в радикалах алгебраических уравнений выше 4-й степени. Итак, мы констатируем разрешимость в радикалах всех алгебраических уравнений с комплексными коэффициентами 1-й, 2-й, 3-й и 4-й степеней. При этом следует отметить, что повышение степени уравнения на 1 резко усложняет способ решения. Оказывается, что ни для какого алгебраического уравнений любой степени больше 4-х не существует единообразного способа решения, как это было для уравнений 1-й, 2-й, 3-й и 4-й степеней. Причем следует обратить внимание на то, что такого способа именно не существует. Это неравнозначно тому, что такого способа не удалось найти. Отсутствие единого способа решения для алгебраических уравнений данной степени (больше 4-х) означает неразрешимость в радикалах таких уравнений. Сказанное, конечно, не означает, что никакое такое уравнение неразрешимо в радикалах. Очевидный пример: уравнение 35 x n - 1 = 0 разрешимо в радикалах при любом натуральном n. Одним из первых неразрешимость в радикалах алгебраических уравнений выше 4й степени обосновал норвежский математик Нильс Хенрик Абель (18021829). Французский математик Эварист Галуа (25.11.1811 - 1832) создал специальную теорию, основанную на теории групп, представляющую собой аппарат, позволяющий каждое алгебраическое уравнение степени больше 4-х протестировать на разрешимость его в радикалах. §11. Примитивные многочлены Рассмотрим теперь целочисленные многочлены, т.е., многочлены с целыми коэффициентами или - что то же самое рассмотрим кольцо Z[x]. Возьмем f  Z[x] и запишем его в каноническом виде: f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (1) Определение. Многочлен f называют примитивным, если все его коэффициенты в совокупности взаимно просты: (a n , a n 1 , ….., a 1 , a 0 ) = 1 (2) Лемма Гаусса. Произведение примитивных многочленов вновь является примитивным многочленом. (Гаусс Карл Фридрих (1777 – 1855) - немецкий математик, физик, астроном, геодезист. Доказал т.н. основную теорему алгебры дал не менее шести различных доказательств. Трудно назвать отрасль математики, в которую Гаусс не внес бы существенного вклада). Доказательство. Доказываем методом от противного. Пусть наряду с многочленом f дан еще один примитивный многочлен g  Z[x] g = b m x m +b m1 x m1 +…+b 1 x+b 0 (b m , b m1 , …,b 1 , b 0 ) = 1 (3) (4) Построим их произведение h = f g = cn mx m n + … +c k x k + … + c 1 x +c 0 (5) 36 где коэффициенты c k находятся по формулам: ck =  i  j k a i b j , i = 1,...,n; j=1,...,m (6) Допустим, что - в отличии от f и g - произведение h = fg не является примитивным многочленом. Т. е., НОД его коэффициентов d = (c n m , …,c k ,..., c 1 ,c 0 ) (7) является составным числом. Тогда d разлагается в произведение простых чисел. Пусть p - простой делитель элемента d: p│d и p - простой (8) Выясним отношение «делит» элемента p к коэффициентам многочлена f. Во-первых, в силу (2) p не может делить все коэффициенты a i . Следовательно, тестируя коэффициенты многочлена f на признак «делиться на p» в последовательности возрастания индексов, мы непременно найдем в этой последовательности первый из коэффициентов с наибольшим индексом s, не делящийся на p: p│a 0 , …, p│ a s 1 , p не делит a s (9) Точно по тем же основаниям среди коэффициентов многочлена g в порядке возрастания индексов мы найдем первый наибольший среди них - пусть это будет t, - не делящийся на p: p│b 0 , …, p│ b t 1 , p не делит b t (10) Определив из (9) и (10) индексы s и t, мы рассмотрим и исследуем коэффициент c st произведения h = fg. Воспользуемся формулой (6), выделив в правой части слагаемое a s b t : c st = a s b t +  i  j  s t a i b j , где i ≠ s, j ≠ t (11) Протестируем «суперслагаемое» i  a i b j на свойство «делиться на j  s t p». Сделаем это анализируя значения индексов i и j суперслагаемого по отношению к индексам s и t. Здесь, в силу (11), возможны два случая: 1. i < s  p│a i  p│a i b j  p│ i  ai b j j  s t 37 2. i>s  j<t  p│b j  p│ i  ai b j j  s t В обоих случаях p делит суперслагаемое в правой части (11): p│ i  ai b j j  s t (12) Кроме того, из (7) и (8) следует, что p│c st (13) Но тогда на основании (12) и (13) из (11) следует, что p│ a s b t (14) А так как p простое число, то из (14) следует, что p│ a s или p│b t . В первом случае мы вступаем в противоречие с (9), во втором - с (10). Теорема доказана. §12. Рациональные многочлены и их приводимость над полем Q Оставаясь в контексте числовых многочленов, рациональными мы называем многочлены из Q[x]. Пусть задан такой многочлен f = a n x n + a n 1 x n 1 + … + a 1 x + a 0  Q[x] (1) Если через d обозначить НОД числителей коэффициентов a i многочлена f, а через k - НОК их знаменателей, то f можно представить так: d f = k f* (2) где f*  Z[x], причем f* - примитивный многочлен (см. §11), называемый ассоциированным многочлену f . Если предположить, что f приводим над Q, то f разлагается в произведение по крайней мере двух многочленов f 1 , f 2  Q[x]: 38 f = f1 f 2 (3) причем deg f 1 , deg f 2 < deg f (4) Если у многочленов f, f 1 , f 2 в левой и правой частях (3) выделить их ассоциированные многочлены, то, по аналогии с (2), получим: d1 d2 d f* = ( f 1 *) ( k1 k 2 f 2 *) k (5) Из (5), учитывая примитивность многочленов f*, f 1 *, f 2 *, получаем равненство целочисленных многочленов: f* = (f 1 *)(f 2 *) (6) Итогом наших коротких рассуждений является лингвистическая версия равенств (2), (3), (6): Вывод 1. У рационального многочлена и его целочисленного ассоциированного многочлена - одни и те же (в общем случае комплексные) корни (см. (2)). Следовательно, решая задачу нахождения корней рационального многочлена, можно заменить ее задачей отыскания корней некоторого целочисленного (например, ассоциированного для исходного) многочлена. Именно поэтому в дальнейшем мы, если не оговорено иное, будем рассматривать целочисленные многочлены. Вывод 2. Рациональный многочлен f приводим над полем Q (см. (3)) в том и только в том случае, когда над кольцом Z приводим его ассоциированный многочлен (см. (6)). Ситуацию с приводимостью целочисленных многочленов над Z проясняет следующее утверждение. Терема (критерий Эйзенштейна). Пусть задан целочисленный многочлен f = a n x n + a n 1 x n 1 + … + a 1 x + a 0  Z[x] (7) и пусть его коэффициенты подчиняются требованиям (обладают свойствами): существует такое простое число p, что 39 1. старший коэффициент a n не делится на p; 2. остальные коэффициенты a n 1 , … a 1 , a 0 делятся на p 3. свободный член a 0 - делясь на p - не делится на p 2 При этих условиях целочисленный многочлен кольцом Z. f неприводим над Примечание. Эйзенштейн Фердинанд (1823-1852) - немецкий математик. Сформулированную теорему исторически принято называть критерием, хотя логически она является признаком (достаточным условием). Доказательство (от противного). Допустим, что f приводим над Z, и, следовательно, разлагается в произведение двух целочисленных многочленов g и h меньшей чем deg f степени: f = gh, deg g, deg h < deg f (8) Запишем g и h в каноническом виде: g = b m x m + b m1 x m1 + … + b 1 x + b 0 , h = c k x k + c k 1 x k 1 + … + c 1 x + c 0 (9) Согласно правилу перемножения многочленов, из (7), (9) (сопоставляя коэффициенты) следует, что: an = bmck , a0 = b0c0, ai =  i u  v b u c v , i ≠ n, 0 (10) Обратимся теперь к простому p  N, фигурирующему в условии теоремы, и протестируем коэффициенты многочленов g и h на свойство «делиться на простое число p». Во-первых, согласно третьему условию теоремы и на основании второго равенства (10), заключаем, что p делит точно одно из чисел b 0 или c 0 . Пусть, для определенности, p| b 0 и p не делит c 0 (11) Исследуем теперь последнее равенство (10), придавая индексу i последовательно значения от 1 до m (степень многочлена g). При i = 1 конкретное равенство a 1 = b 0 c 1 + b 1 c 0 , на основании второго условия теоремы и (11), имплицирует отношение p| b 1 . Аналогично для i = 2 и с учетом полученного p| b 1 приходим к соотношению p| b 2 , и т.д. из 40 равенства, задаваемого значением i = m, по тем же основаниям получим, что p| b m , на основании чего первое равенство (10) «обязывает» a n делиться на p, что противоречит первому условию теоремы и тем доказывает ее. Доказанная теорема позволяет построить неприводимый над Z целочисленный многочлен любой степени. Действительно, при любом n  N выберем произвольное простое число p и построим многочлен f = x n + p(x n 1 + … + x + 1) (13) Коэффициенты многочлена f полностью удовлетворяют требованиям доказанной теоремы, а поэтому f - неприводим над Z. В свою очередь, Вывод 2 (см. выше) и сконструированный неприводимый над Z многочлен позволяют утверждать, что неприводимыми над Q могут быть многочлены любой степени. Резюме. Сопоставительный анализ состояний приводимости многочленов над C, R и Q выводит на следующее умозаключение, представляющее любопытный тренд: движение по нисходящей цепочке числовых полей C  R  Q повышает степень неприводимых над ними многочленов. §13. Рациональные корни целочисленных многочленов и их отыскание Целочисленными коэффициентами: называют многочлены с целыми f = a n x n + a n 1 x n 1 + ….. + a 1 x + a 0 (1) где, по определению, a n , a n 1 , ….. a 1 , a 0  Z (2) p Нас будут интересовать рациональные корни  = q  Q p целочисленных многочленов. Здесь p, q  Z, причем знак дроби q всегда можно отнести к числителю, считая знаменатель положительным, т.е. натуральным числом: 41 p  q Q, p  Z, q  N (3) p Кроме того, при рассмотрении дроби q мы всегда будем считать ее несократимой, т.е. ее числитель и знаменатель несократимой дроби - взаимно простые числа: (p,q) = 1 (4). Далее, если коэффициенты (2) целочисленного многочлена (1) имеют наибольший общий делитель d = (a n , a n 1 , ….. a 1 , a 0 ) (5) то f переписывается так: f(x) = d (b n x n +b n 1 x n 1 + … +b 1 x+b 0 ) (6) Обозначим через g многочлен, стоящий в скобках в правой части (6), т.е.: f=dg (7) Наши рассуждения и равенство (7) указывают на то, что любой целочисленный многочлен можно представить как произведение некоторого целого (даже натурального) числа - НОД коэффициентов этого многочлена - на примитивный многочлен, который называют ассоциированным для данного многочленом. Таким образом, в (7) многочлен g ассоциирован многочлену f. В чем важность ассоциированного многочлена? Во-первых, если d достаточно большое число, то коэффициенты ассоциированного многочлена g(x) по абсолютной величине гораздо меньше таких же величин исходного многочлена f(x) (см. (7)). А это значит, что обращаться с такими коэффициентами, производить над ними арифметические операции гораздо удобнее и легче, чем обращаться с коэффициентами исходного многочлена. Во-вторых - и это самое важное - исходный многочлен f и его ассоциированный многочлен g, отличаясь числовым сомножителем, имеют одни и те же корни, или не имеют их вовсе. Иными словами, если решается задача поиска корней целочисленного многочлена f, у которого достаточно большие по абсолютной величине коэффициенты, мы 42 можем ограничиться поиском корней его ассоциированного многочлена g, оперировать с которым бывает легче. Учитывая сказанное, мы в дальнейшем сразу будем исходить из того, что уже заданный многочлен f является примитивным, т. е. в (5) d = 1. На практике конечно, при необходимости, у заданного многочлена можно выделить его ассоциированный, примитивный многочлен. Замечание. Нас интересуют целочисленные многочлены. Но без особого труда можно увидеть, что по существу ничего принципиально не меняется, если исходный многочлен имел бы рациональные, дробные коэффициенты (рациональный многочлен). И в этом случае похожими приемами можно выделить его ассоциированный, целочисленный примитивный многочлен. Для этого необходимо привести все коэффициенты такого многочлена к общему (как правило наименьшему) знаменателю, пусть это будет k, а у полученных после этого числителей найти наибольший общий делитель d. После чего данный рациональный многочлен f(х) d g, где g - ассоциированный k будет представлен в виде: f(х) = для f многочлен. Нашей ближайшей задачей является построение (нахождение) правила, алгоритма (последовательности предписанных шагов) отыскания рациональных корней целочисленных многочленов любой натуральной степени. Итак, пусть задан целочисленный многочлен f p p и задан он формулой (1). Пусть рациональное число q  Q, (дробь q несократима имеет место (4)), является искомым корнем целочисленного многочлена f(x). Это значит, что p f( q ) = 0 (8) или, что то же самое, p p p a n ( q ) n + a n 1 ( q ) n 1 + ….. + a 1 ( q ) + a 0 = 0 (9) Умножив обе части (9) на q n (приведение к общему знаменателю), получим: a n p n + a n 1 p n 1 q + ….. + a 1 p q n 1 + a 0 q n = 0 (10) 43 Всмотримся в равенство (10). Все слагаемые левой части, кроме последнего, содержат множителем число p, поэтому, очевидно, каждое из них делится на p. Кроме того, вся левая часть (сумма) делится на p, потому что эта сумма равна 0. Следовательно, последнее слагаемое в левой части (10) обязано делится на p, или, что то же самое, p делит это слагаемое: p │ a0qn (11) Точно такие же рассуждения, примененные к числу q и всем слагаемым, кроме первого, левой части (10) приводят нас к аналогичному выводу: q│a n pn (12) Теперь исследуем соотношение (11). Здесь число p делит произведение двух чисел: a 0 и q n . Но поскольку p взаимно просто с одним из сомножителей, - а именно с q n , - то p │ a0 (13) Если по той же схеме исследовать (12), то, по аналогии, получим еще одно соотношение делимости: q│a (14) n Равенства (13), (14) являются промежуточным итогом наших рассуждений по отысканию (построению) алгоритма нахождения рациональных корней целочисленных многочленов. Лингвистической версией этого итога выступает Необходимое целочисленного условие многочлена. рационального Если несократимая корня дробь p q p (рациональное число q ) является корнем целочисленного многочлена f, то числитель этой дроби делит свободный член, а знаменатель делит старший коэффициент этого многочлена. Ценность этого необходимого условия заключается в том, что p если для несократимой дроби q не выполняется хотя бы одно 44 требование (13) или (14), то эта дробь заведомо не является рациональным корнем целочисленного многочлена f. С другой стороны нужно иметь в виду, что если даже условия (13), (14) p выполняются, еще не факт, что дробь q является корнем многочлена f(x): ее свойство «быть корнем» требует дополнительной проверки, например схемой Горнера. Таким образом, требования (13), (14) дают нам возможность составить список чисел p и q , из которых затем составляется список дробей p q - всех «кандидатов в рациональные корни» многочлена f. По сути дела мы уже описали искомый алгоритм нахождения рациональных корней целочисленных многочленов. Полностью формализованный этот алгоритм может быть представлен так: Пусть дан целочисленный многочлен fx (см. (1)) и требуется найти все его рациональные корни (или установить, что таковых нет). Для этого выполняем следующие шаги: 1. Выписываем все целые делители p свободного члена a 0 (см. (13)); 2. Выписываем все натуральные делители q старшего коэффициента a n (см. (14)); 3. Из найденных чисел p и q составляем всевозможные p дроби q ; 4. Каждую из построенных дробей p q испытываем (проверяем) «на корень» многочлена f(x). Делать это p можно либо находя значение f( q ), либо применяя к p 6. числу  = q схему Горнера; 5. Дроби, выдержавшие испытание «на корень», и будут всеми искомыми рациональными корнями исходного целочисленного многочлена f(x). Если же таковых не оказалось, многочлен рациональных корней не имеет. Задача решена! 45 §14. Целые корни целочисленных многочленов. Оптимизация вычислительных процедур при отыскании рациональных корней Вернемся к необходимому условию рационального корня целочисленного многочлена f и к соотношениям (13), (14) §13, определяющим это условие. Небольшие рассуждения помогают получить два важных вывода. Допустим, что в качестве рационального мы ищем целый корень многочлена f. Несократимая дробь p q является целым числом только в случае, когда ее знаменатель равен 1. Тогда сама дробь совпадает со своим числит (q = 1)  p ( q = p  Z) (1) Но при q = 1 соотношение (14) §13 заведомо выполнимо. Следовательно, остается только соотношение (13) §13 и, поэтому, необходимое условие рационального корня целочисленного многочлена f(х) для случая целого корня перефразируется так (это первый из заявленных выводов): Вывод 1. Необходимое условие целого корня  целочисленного многочлена. Если целое число p Z является корнем целочисленного многочлена f, то p является делителем свободного члена этого многочлена. т. е удовлетворяется соотношение (13) §13. Понятно, как надлежит действовать, если мы решаем задачу нахождения целых корней целочисленного многочлена f. Для этого используем тот же алгоритм нахождения рациональных корней, описанный в §13, с поправками: опускаем п.п. 2, 3 алгоритма, а в п. 4 тестируем только делители свободного члена, выписанные в п.1. Допустим теперь, что у целочисленного многочлена f старший коэффициент равен 1. Тогда соотношение (14) §13 примет вид: q│1. Это означает, что q = 1. Следовательно, искомый рациональный p корень q целочисленного многочлена f является целым числом. Это и есть Вывод 2. У целочисленного многочлена со старшим коэффициентом, равным 1, в качестве рациональных могут быть только целые корни. 46 Вычислительная сторона алгоритма отыскания рациональных корней может быть очень объемной, громоздкой. Можно оптимизировать (сократить) объем этих вычислений. Для этого обратимся к алгебраическому определению корня многочлена, т. е. соотношению (7) § 3. Итак, пусть дробь p q является корнем целочисленного многочлена f(х). Согласно (6) §3 имеем: p (х- q ) │f (2) В соотношении (2) нужно иметь в виду, что деление производится в кольце Q[x[. Если обозначить через g(х) частное от деления f(х) на p (х- q ), то (2) перепишется так: p f(х) = (х- q ) g(х) (3) p В (3) многочлены (х- q ) и g(х) - рациональные, а f(х) целочисленный. Причем, как это следует из (3), если deg f(x) = n, то deg g(x) = n-1. Если обратиться к схеме Горнера (9) §2 и заменить там p α на q , то, оставляя в стороне собственно значения коэффициентов многочлена g(х), при внимательном прочтении схемы Горнера мы усматриваем, что все дробные коэффициенты многочлена g(х) в качестве знаменателей имеют степень числа q. А поскольку deg g = n-1, то n-1 - самая большая степень q в знаменателях коэффициентов многочлена g(х). Отсюда следует, что многочлен q n 1 g  Z[x] (4) Опираясь на вывод (4), мы преобразуем (3), умножив обе части этого равенства на q n . Причем в правой части q n разобьем на два cомножителя - q и q n 1 : p q n f (х) = q (х- q ) q n 1 g (5) p Анализируя правую часть (5) мы видим, что q (х- q ) - это целочисленный многочлен. А поскольку, в силу (4), целочисленным 47 многочленом является и второй сомножитель q n 1 g. Используя этот факт, проделаем следующие операции. В обе части равенств (5) внесем вместо х произвольное целое число t  Z, то получим p q n f (t) = q (t- q ) q n 1 g(t) (6) p p Если (t- q ) и g(t) целыми числами могут и не быть, то числа q (t- q ) и q n 1 g(t) обязательно целые: p (t  Z )  (q (t- q ), q n 1 g(t)  Z) Понятно, что f(t)  Z (f q n f (t) (7) целочисленный многочлен), а значит и p  Z. Если учесть, что q(t- ) = qt-p, то (6) можно q интерпретировать как делимость целых чисел: (qt-p) | q n f (t) (8) Замечание. Вывод (8) следует из (7) только в том случае, p p если мы знаем, что t ≠ q , а это равенство может случиться, если q - целый корень! В ситуации равенства (8) (qt-p) и q n являются взаимно простыми, поэтому из (8) мы делаем вывод: (qt-p) | f (t) (9) Соотношение (9) удобно переписать и интерпретировать так: f (t)  qt  p Z (10) Полученное (выведенное, доказанное) соотношение (10) прочитывается (звучит) следующим образом: p Если f - целочисленный многочлен, q - его рациональный корень, то для любого целого t, не являющегося корнем многочлена f (t ) f(х), число qt  p является целым. Если же (10) не выполняется, то p q не является корнем f(х). 48 Этот вывод или, что то же самое, соотношение (10) можно использовать для оптимизации вычислительных процедур отыскания рациональных корней целочисленных многочленов. При этом получается следующий алгоритм, - назовем его оптимизатором, описываемый ниже п.п. A, B, C, D, E. Итак, пусть ищутся рациональные корни целочисленного многочлена f. A. Проверяем «на корень» простейшие целые числа 0, ±1. Причем, если какое-то из них является корнем, сразу устанавливаем кратность это корня и исключаем его из дальнейшего рассмотрения. Например, если 1 является k - кратным корнем многочлена f(х), то делим f(х) на (х - 1) k , получаем частное g (сделать это можно при помощи мультисхемы Горнера): f = (х - 1) k g (11) Из (11) следует, что все остальные рациональные корни многочлена f, если они существуют, являются корнями многочлена g. Теперь нужно искать рациональные корни многочлена g. Но для многочлена g целые числа 0, ±1 уже не являются его корнями. Чтобы согласовать наши дальнейшие рассуждения с проведенными ранее рассуждениями, будем считать, что числа 0, ±1 уже не являются корнями целочисленного многочлена f(х). B. По свободному члену и старшему коэффициенту многочлена p f составляем всевозможные дроби q - «кандидаты на корень». C. Выбираем поочередно для целого числа t значения ±1 и p каждую из испытуемых на корень» дробей q тестируем на свойство (10). Учитывая выбранные значения t, мы видим, что в знаменателе (10) получается: q – p - при t = 1 и (–q – p) - при t = - 1. Поскольку знак числа на делимость не влияет, мы, для удобства, выберем во втором случае p + q. Получаем два соотношения f (1)  pq Z, f (1)  pq Z, которые можно объединить одной записью: f (1) Z pq . (12) 49 В единой записи (12) указаны два соотношения, причем нужно обратить внимание на согласованность знаков: знаку « + » в числителе соответствует знак « - » в знаменателе и наоборот. Вывод из соотношения (10) (см. выше) говорит о том, что p если для тестируемой «на корень» дроби q хотя бы одно из двух p требований не выполняется, то дробь q заведомо не является корнем целочисленного многочлена f(х). Следовательно, дальнейшей p проверке «на корень» подлежат лишь дроби q , удовлетворяющие двум соотношениям (12). D. Из всех p q дробей выбраковываем (отбрасываем) неудовлетворяющие хотя бы одному из требований (12). E. Оставшиеся дроби p q проверяем «на корень» (прямой подстановкой или по схеме Горнера). Изложенное (п.п. A, B, C, D, E) - один из возможных оптимизаторов отыскания рациональных корней целочисленных многочленов. Существуют и другие. Приведем еще один, основанный на том соображении, что арифметические операции проще осуществлять над целыми чем над дробными (рациональными) числами. Пусть требуется найти рациональные корни целочисленного многочлена (1) §13. Умножим его на (a n ) n 1 и, сделав замену переменных y = a n x, (13) получим некоторый новый целочисленный многочлен g от переменной y, связанный с f очевидным соотношением: (a n ) n 1 f(x) = g(y), (14) где g - нормированный многочлен той же степени n (именно для этого выбиралась замена (13)). Понятно, что, отыскав корни одного из многочленов f или g, мы - через (13) - найдем корни другого. Но у нормированного многочлена g в качестве рациональных корней могут быть только целые. Найдя эти корни - целые значения y (или установив, что их нет), мы, обратной заменой через (13), найдем все рациональные корни исходного многочлена f. Описанная 50 процедура и есть второй оптимизатор отыскания рациональных корней целочисленных многочленов. Глава II. Расширения числовых полей. Решение геометрических задач на построение циркулем и линейкой. §1. Простые и составные расширения числовых полей, их строение Напомним, что числовым полем мы называем любое подполе поля комплексных чисел C. Числовыми, следовательно, являются стандартные поля Q и R. Но это - не единственные числовые поля. Описываемые ниже процедуры расширения доставляют бесконечно много примеров других числовых полей. Строго говоря, эти процедуры применимы для конструкций любых полей. Мы ограничиваемся числовыми полями из чисто утилитарных соображений: эти поля, вместе с их приложениями к геометрическим задачам на построение, непосредственно примыкают к кругу вопросов школьного курса математики. Определение. Пусть F - произвольное числовое поле и S любое числовое множество: F < C, S  C. Расширением поля F множеством S (при помощи множества S) - обозначается F(S) - называют наименьшее числовое поле, содержащее в себе как F так и S: F < F(S)  S  F(S) (1) Во-первых, заметим, что, при выбранных F и S, числовые поля. удовлетворяющие (1), обязательно существуют, например, само поле C. Поэтому искомое поле F(S) является пересечением всех таких полей. В дальнейшем мы ограничимся специально отобранными множествами S: 1. S = {α} - состоит из одного числа и 2. S = {α 1 , α 2 , …,α n } - состоит из n чисел. В первом случае расширение обозначают F(α) - называется простым расширением поля F 51 числом α, во втором - F(α 1 , α 2 , …,α n ) - составным расширением этого поля числами α 1 , α 2 , …,α n . Строение простого и составного расширений. Рассмотрим простое расширение F(α) числового поля F числом α. Тогда довольно легко усматривается выполнимость следующей цепочки импликаций: f ( ) (f, g  F[x])  (f(α), g(α)  F(α))  ( g ( )  F(α)) (2) Соотношение (2) - в иной редакции - означает, что f ( ) F  (α) = { g ( ) │ f, g  F[x]}  F(α) (3) Далее, формула (3), раскрывающая строение F  (α), указывает на то, что F  (α) - подполе поля F(α): F < F  (α) (4) α  F  (α) (5) Кроме того Учитываем, что в случае простого расширения числового поля S = {α}, формулы (4), (5) по существу совпадают с формулами (1). Но поскольку F(α) - наименьшее поле со свойствами (4), (5), то F(α)  F  (α) (6) Соотношения (3), (6) указывают, что F  (α) = F(α). тем самым раскрыто строение простого расширения F(α): f ( ) F(α) = { g ( ) │ f, g  F[x]} (7) Не вдаваясь в детали, по той же схеме устанавливается строение составного расширения числового поля: f (,..., ) 1 n F(α 1 , α 2 , …,α n ) = { g(,..., ) │ f, g  F[х 1 ,...,х n ]} 1 n (8) 52 Если вспомнить конструкцию кольца многочленов от n переменных F[х 1 ,...,х n ] = (F[х 1 ,...,х n 1 ])[х n ], (9) то (8), на основании(9), имплицирует равенство: F(α 1 , α 2 , …,α n ) = (F(α 1 , α 2 , …,α n 1 )) )(α n ) (10) Формула (10) указывает на то, что составное расширение числового поля строится, наряду с формулой (8), его задающей, и как последний элемент цепочки простых расширений: F → F(α 1 ) → (F(α 1 ))( α 2 )→ … →(F(α 1 , α 2 , …,α n 1 )) )(α n ) (11) Примечание. Пусть произвольное поле F является подполем другого поля T (T называют надполем поля F). Формализуем ситуацию. В поле T фокусируем внимание только на операции сложения. В новой ситуации структура (T, +) (умножение “депортировано“ из T) по отношению к полю F удовлетворяет всем требованиям векторного пространства. Лингвистическая редакция: из двух полей надполе (по сложению) является векторным пространством над другим полем подполем. Вывод. Сформулированное примечание дает основание рассматривать - по сложению - любое расширение F(S) числового поля F как векторное пространство над ним. §2. Алгебраические числа. Минимальный многочлен алгебраического числа Определение. Число α  C называется алгебраическим над полем F, если α является корнем некоторого ненулевого многочлена f  F[x]: def (α-алгебраическое над F)  ((α  C)  (  f F[x])  (f≠0)  (f(α)=0)) (1) Все многочлены кольца F[x], имеющие число α образуют идеал кольца F[x] (проверить): I  = { f  F[x] | f(α) = 0} <| F[x] своим корнем, (2) 53 Поскольку F[x] - будучи евклидовым - является кольцом главных идеалов, то I  - главный идеал. Пусть многочлен p   F[x] является образующим элементом идеала I  : I  = (p  ) (3) Определение. Если число α  C алгебраично над полем F, то образующий многочлен идеала всех многочленов из F[x], имеющих число α своим корнем, называется его минимальным многочленом. Определение минимального многочлена указывает на то, что он определяется с точностью до ассоциированного с ним многочлена, т.е. с точностью до обратимого в F[x] сомножителя, каковыми являются ненулевые числа из F. Возможна иная редакция определения минимального многочлена. С целью ее получения, заметим, что многочлен p  имеет наименьшую степень среди всех (ненулевых) многочленов идеала I  все они кратны образующему многочлену p  . Это свойство минимального многочлена является его характеристическим свойством, т.е. однозначно его определяющим. Действительно, обозначим через q   F[x] - ненулевой многочлен наименьшей степени, имеющий число α  C своим корнем (такой многочлен по достаточно прозрачным основаниям существует). Ясно, что q   I  и поэтому p | q  (4) С другой стороны, разделив в F[x] евклидово p  на q  , получим: p  = q  g + r, где r = 0 или deg r < deg q  (5) Из (5) получаем: p  (α) = q  (α) g(α) + r(α) (6) Поскольку α - корень для p  и q  , из (6) вытекает r(α) = 0. Поэтому, если в (5) r ≠ 0, то deg r < deg q  и мы вступаем в противоречие с выбором q  . В (5), следоватеельно, реализуется единственная возможность r = 0, что предопределяет соотношение q | p (7) 54 Делимости (4) и (7) обеспечивают ассоциированность многочленов p  и q  , значит q  так же является образующим многочленом идеала I  , т.е - минимальным многочленом алгебраического числа α. Итак, Вывод. Если число α  C алгебраично над полем F, то его минимальный многочлен - это ненулевой многочлен из F[x] наименьшей степени, имеющий α своим корнем. Теорема. Минимальный многочлен алгебраического чиловым полем F числа α  C неприводим над полем F. над Доказательство (легко!) - методом от противного на основании Вывода. Определение. Степень deg p  минимального многочлена p  алгебраического на полем F числа α называется степенью самого числа α и обозначается deg α (=deg p  ). §3. Простое алгебраическое расширение поля, его строение. Освобождение от иррациональности в знаменателе. Конечномерность простого алгебраического расширения Определение. Если α  C алгебраично над числовым полем F, то расширение F(α) называют простым алгебраическим расширением. Алгебраичность α над F позволяет специфицировать характеристическое свойство элементов (способ задания, предъявления) простого расширения F(α). Более того, мы дадим три уровня искомой спецификации. Итак, пусть α  C алгебраично над числовым полем F пусть p  - минимальный многочлен числа α. Начнем последовательно уточнять - специфицировать - строение F(α) (см. (7) §1: f ( ) F(α) = { g ( ) │ f, g  F[x]} (1) Возьмем произвольный элемент поля F(α): f ( )  F(α) g ( ) (2) 55 Так как g(α) ≠ 0 (стоит в знаменателе), то многочлен g  I  (см. (2) §2) и поэтому образующая идеала I  не делит многочлен g: p  не делит g Соотношение (3) и неприводимость p  над полем F (p  кольце F[x]) имплицируют взаимную простоту p  и g: (p  , g) = 1 (3) - прост в (4) Применив к (4) критерий взаимной простоты элементов p  и g кольца F[x[, получим:  u, v  F[x], u g + v p  = 1 (5) При х = α равенство (5) дает (α - корень для p  !): u(α) g(α) = 1 (6) Равенство (2) позволяет преобразовать произвольный элемент кольца F(α) (см. (2)) следующим очевидным образом:      f () f () u ()   f () u () g () g () u () (7) Обозначив через h произведение многочленов: h = fu, перепишем (7) в виде: f ( ) g ( ) = h(α) (8) Итак, «дробный» вид произвольного элемента простого алгебраического расширения F(α) нам удалось преобразовать к «беззнаменательному» виду. Названное преобразование, т.е. переход от левой части равенства (8) к его правой части называют освобождением от иррациональности в знаменателе (дроби). Будучи формализованной, процедура освобождения от иррациональности в знаменателе предстает следующим алгоритмом: 56 1. Задана дробь (2). Это, в частности, означает, что заданы многочлены f и g, порождающие эту дробь, и задан минимальный многочлен p  алгебраического числа α  C; 2. Находим многочлены u и v, удовлетворяющие (5); 3. Умножаем числитель и знаменатель дроби (2) на число u(α) (см. преобразование (7)) и получаем правую часть (8). Задача решена! Примечание. Частный случай освобождения от иррациональности в знаменателе известен из школьного курса математики. Там выражение g(α), стоящее в знаменателе дроби (2), содержит, как правило, неизвлекаемый в поле Q квадратный корень из положительного рационального (чаще - натурального) числа. В этом случае числитель и знаменатель «обрабатываемой» дроби умножаются на «сопряженное» знаменателю число, как раз и являющееся числом u(α) в нашей общей версии освобождения от иррациональности в знаменателе. Формула (8), артикулированная как алгоритм освобождения от иррациональности в знаменателе, одновременно являет собой первый уровень искомой спецификации задания простого алгебраического расширения F(α): F(α) = {h(α)| h  F[x]} (9) Сравнивая формулы (1) и (9), мы видим, что на этом этапе спецификация предъявления простого алгебраического расширения F(α) поля F состоит в избавлении от необходимости делить значения многочленов: достаточно ограничиться нахождением таких значений (все - при х = α). Продолжим. Возьмем произвольный элемент h(α)  F(α) и разделим евклидово многочлен h (определяется возможно неоднозначно - выбором элемента h(α) из F(α)) на минимальный многочлен p  : h = p  g + r , r = 0 или deg r < deg p  (10) При х = α равенство (10) дает, с учетом p  (α) = 0: h(α) = r(α) (11) Таким образом, равенство (9), на основании (10), (11), переписывается так: F(α) = {r(α) | r  F[x], r = 0  degr < degp  } (12) 57 Формула (12) - это второй уровень спецификации задания F(α). Чтобы выйти на третий уровень искомой спецификации, будем рассматривать простое алгебраическое расширение F(α) по сложению - как векторное пространство над F (см. вывод в конце §1). Проанализируем формулу (12). Если положить degp  = n, то r(α) формально можно записать так: r(α) = a n 1 α n 1 + ….. + a 1 α + a 0 , a i  F(α) (13) Действительно, если хотя бы один из коэффициентов a i - 0 ≤ i ≤ n-1 отличен от 0, то в (10) остаток r ≠ 0 и (см. (13)) deg r < deg p  =n. Если же в (13) все коэффициенты a i = 0, то r = 0 и в (13) r(α) = 0. Таким образом, на основании (12) формула (13) принимает вид: F(α) = { a n 1 α n 1 + ….. + a 1 α + a 0 | a i  F} (14) Внимательное прочтение формулы (14) указывает на то, что векторное пространство F(α) натянуто на векторы α n 1 , …, α, 1 (=α 0 ): F(α) = L{ α n 1 , …, α, 1 } (15) (16) Покажем, что векторы (15) линейно независимы. Действительно, допущение противного, т.е., обращение в нуль некоторой их нетривиальной линейной комбинации, эквиалентно тому, что r(α) = 0 (см. (13)) при том, что многочлен r ≠ 0. Но в этом случае соотношение deg r < deg p  вступает в противоречие с выводом по минимальному многочлену алгебраического числа, приведенному в конце §2. Итак, числа (15) - как векторы в F(α) - линейно независимы, что в свою очередь, вместе с (16), указывет на (15) как на базис пространства F(α). Вывод. Если α - алгебраическое степени n (deg α = n) число над числовым полем F, то F(α) - как векторное пространство - является конечномерным, причем dim F(α) = deg α и его строение задается формулой (16). Этот вывод и есть третий уровень спецификации задания простого алгебраического расширения F(α). Пролонгация исследований строения простого алгебраического расширения F(α), трактуемого как векторное пространство над числовым полем F, приводит к следующему критерию алгебраичности числа α над полем F: 58 Теорема (критерий алгебраичности α над F). Число α  C алгебраично над числовым полем F тогда и только тогда, когда простое расширение F(α) является конечномерным векторным пространством над F. Доказательство. Вышеприведенный вывод (доказан!) являет собой необходимое условие критерия. Докажем достаточность этого условия. Итак, F(α) - конечномерно над F. Пусть, для определенности, dim F(α) = n. В пространстве F(α) выделим последовательные степени числа α - векторы пространства, - количество которых превосходит размерность пространства F(α): α 0 = 1, α, α 2 , … , α m , m ≥ n (17) Превышение числа векторов (17) размерности пространства (m+1 > n) обеспечивает их линейную зависимость, т.е. обращение в нуль некоторой нетривиальной их линейной комбинации: a 0 + a1α + a 2 α 2 + … + a m α m = 0 (18) Нетривиальность линейной комбинации векторов в левой части (18) и само равенство (18) указывают на то, что α - корень ненулевого многочлена r = a 0 + a 1 x + a 2 x 2 + … + a m x m  F[x], т.е α алгебраично над F, что финализирует доказательство теоремы. Определение. Если F(α) - простое алгебраическое расширение, то dim F(α) (= deg α - см. последний Вывод) называют степенью расширения поля F и обозначают [F(α)‫׃‬F]: [F(α)‫׃‬F] = dim F(α) = deg α (19) §4. Составные алгебраические расширения числовых полей, их строение (обзор) В этом параграфе без доказательства приводятся необходимые для дальнейшего сведения. 59 Определение. Составное расширение F(α 1 , α 2 , …,α n ) числового поля F называют алгебраическим, если все числа α 1 , α 2 , …,α n  C алгебраичны над F. Утверждение 1. Если α 1 алгебраично над F. α 2 алгебраично над F(α 1 ) и т.д., α n алгебраично над F(α 1 , α 2 , …,α n 1 ) , то составное расширение F(α 1 , α 2 , …,α n ) является алгебраическим. Комментарий. В Утверждении 1 число α 1 уже алгебраично над F. Но числа α 2 , …,α n могут не быть алгебраическими над полем F! Утверждение фиксирует наличие чисел β 2 , …,β n  C, алгебраичных над F, которые - вместе с α 1 - обеспечивают равенство F(α 1 , α 2 , …,α n ) = F(α 1 , β 2 , …,β n ) (1) Равенство (1) - это формализованная редакция Утверждения 1. Утверждение 2. Всякое составное алгебраическое расширение числового поля является простым. Формализованная версия Утверждения 2 выглядит так: F(α 1 , α 2 , …,α n ) - алгебраическое   α  C алгебраическое над F  F(α 1 , α 2 , …,α n ) = F(α) (2) Простота составного алгебраичексого расширения, установленная Утверждением 2 (формулой (2)), позволяет говорить о степени [F(α 1 , α 2 , …,α n ) ‫ ׃‬F)] составного (как простого) алгебраического расширения (см. последнее определение §3). Теорема. Степень составного алгебраического расширения F(α 1 , α 2 , …,α n ) числового поля F находится по формуле: [F(α 1 , α 2 , …,α n ) ‫ ׃‬F)] = [F(α 1 , α 2 , …,α n ) ‫ ׃‬F(α 1 , α 2 , …,α n 1 )]  [F(α 1 , α 2 , …,α n 1 ) ‫ ׃‬F(α 1 , α 2 , …,α n 2 )]  …  [F(α 1 ) ‫ ׃‬F)] (3) Комментарий. Формула (3) легко запоминается, если каждое соотношения вида [U‫׃‬V] в левой и правой частях (3) формально U заменить дробью V (формула (3) «превращается в тождество»). 60 §5. Квадратичные расширения числовых полей. Разрешимость алгебраических уравнений в квадратных радикалах. Применим наработанный аппарат расширения числовых полей к частному случаю - квадратичным расширениям. Определение. Простое алгебраическое расширение F(α) поля F называется квадратичным (квадратическим), если выполняется одно из двух (эквивалентных - см. (19), §3) условий (degα = 2)  ([F(α)‫׃‬F] = 2) (1) Из определения следует, что простое квадратичное расширение F(α) числового поля F, будучи интерпретировано как векторное пространство над F, имеет следующее строение (см. (14) §3): F(α) = {aα + b | a, b  F} (2) Определение. Составное алгебраическое расширение F(α 1 , α 2 , …,α n ) поля F называют квадратичным (квадратическим), если таковым является каждое простое расширение в цепочке (11) §1: F → F(α 1 ) → (F(α 1 ))( α 2 )→ … →(F(α 1 , α 2 , …,α n 1 )) )(α n ) (3) Помним (см. (10) §1), что в цепочке (3) (F(α 1 , α 2 , …,α n 1 )) )(α n ) = F(α 1 , α 2 , …,α n ) (4) Найдем степень составного квадратического расширения [F(α 1 , α 2 , …,α n ) ‫ ׃‬F)]. Для этого воспользуемся формулой (3) §4. В этой формуле значение каждого сомножителя в правой части - на основании второго равенства (1) и содержания, вложенного в элементы цепочки (2) - равно 2. Отсюда [F(α 1 , α 2 , …,α n ) ‫ ׃‬F)] = 2 n (5) Интерпретирум в удобном для нас виде строение простого квадратического расширения F(α). По определению - первое равенство (1) - минимальный многочлен числа α - это квадратный трехчлен из F[x]. Будем считать этот многочлен нормированным и неполным, т.е. имеющим вид х 2 - a, где a  F. Следовательно, число α равно одному из значений кавадратного радикала a : 61 α= a (6) Итак, если F(α) - простое квадратичное расширение поля F, то его строение, на основании (6), можно считать заданным формулой: F(α) = F( a ), a  F, a  F (7) Определение. Говорят, что число α выражается в квадратных радикалах через числа a n , a n 1 , ….. , a 1 , a 0 , если α представлено через эти числа только с использованием четырех арифметических операций и опреации извлечения квадратного корня. Если указанные числа задают алгебраическое уравнение anх n + a n 1 х n 1 + ….. + a 1 х + a 0 = 0 (8) а α - его корень, то говорят, что корень α уравнения (8) выражен в квадратных радикалах. Установим теперь связь между понятиями «выражаться в квадратных радикалах» и «составное квадратическое расширение поля» применительно к алгебраическому уравнению. Обозначим через F составное расширение поля Q коэффициентами уравнения (8): F = Q(a n , a n 1 , ….., a 1 , a 0 ) (9) Расширение (9) называют областью рациональности уравнения (8). Формула (8) §1 указывает на то, что область рациональности алгебраического уравнения состоит из чисел (и только из них!), получаемых применением арифметических операций к коэффициентам этого уравнения. Обозначим через α корень уравнения (8), выражаемый в квадратных радикалах. Исполнение операций над числами a n , a n 1 , ….., a 1 , a 0 , имеющее результатом число α, поддается упорядочению - расположению в последовательность. Для удобства обозначим эту последовательность операций через S. В последовательности S присутствует t операций извлечения квадратного корня. После исполнения первой операции извлечения квадратного корня получается некоторое число α 1 = a1 , где а 1  F. Т.е., извлечение квадратного корня выводит (потенциально) в простое квадратичное расширение F(α 1 ). Аналогично, арифметические операции из S, следующие за первым извлечением квадратного корня, т.е. арифметические операции, совершаемяее над числами из F(α 1 ), не выводят из F(α 1 ), а извлечение второго квадратного корня из последовательности S выводит в простое - по отношению к F(α 1 ) - 62 квадратичное расширение (F(α 1 ))(α 2 ) или, что то же самое, в составное - по отношению к F - квадратичное расширение F(α 1 ,α 2 ). Продолжая цепочку таких же рассуждений, мы, после применения последней - t-й в S - операции извлечения квадратного корня, - а затем и оставшихся из S арифметических операций, - получим, что число α принадлежит некоторому составному квадратическому расширению поля F: α  F(α 1 , α 2 , …,α t ). Таким образом, если число α выражается в квадратных радикалах через коэффициенты уравнения (8), то этот корень находится в некотором составном квадратичном расширении области рациональности этого уравнения. Верно и обратное утверждение (не проверяем). В результате удается сформулировать следующий вывод, являющий собой искомую связь между понятиями «выражаться в квадратных радикалах» и «составное квадратическое расширение поля» Вывод. Корень α алгебраического уравнения с комплексными коэффициентами выражается в квадратных радикалах тогда и только тогда, когда он принадлежит некоторому составному квадратическому расширению области рациональности этого уравнения. §6. Критерий разрешимости в квадратных радикалах кубических уравнений Редуцируем результаты §5 к кубическим уравнениям. Теорема (критерий разрешимости в квадратных радикалах кубических уравнений). Кубическое уравнение с комплексными коэффициентами разрешимо в квадратных радикалах в том и только в том случае, когда хотя бы один его корень лежит в его же области рациональности. Доказательство. Пусть дано кубическое уравнение с комплексными коэффициентами. Всегда можно считать, что его левая часть нормирована x 3 + a 2 x 2 + a 1 x + a 0 = 0, а 3 , a 2 , a1, a 0  C (1) Пусть, далее, α 1 , α 2 , α 3 - его корни Необходимость. Пусть теперь один из этих корней, например α 1 , лежит в области рациональности уравнения (1): 63 α 1  F = Q(a 2 , a 1 , a 0 ) (2) Соотношение (2) указывает на (формальную) выразимость α 1 в квадратных радикалах. Далее, поскольку α 1 - корень многочлена в левой части (1), то (1) можно переписать так: (х - α 1 )( x 2 + А 1 x + А 0 ) = 0 (3) где - на основании (2): А1, А 0  F (4) Уравнение (3) указывает на то, что два оставшихся корня α 2 и α 3 исходного уравнения (1) являются корнями квадратного трехчлена x 2 + А 1 x + А 0 и поэтому выражаются в квадратных радикалах через коэффициенты исходного уравнения. Мы показали выразимость всех корней уравнения (1) в квадратных радикалах. Необходимость доказана. Достаточность. Пусть кубическое уравнение (1) разрешимо в квадратных радикалах. Логически возможны два случая: 1. хотя бы один из корней уравнения лежит в его области рациональности и 2. ни один из корней уравнения (1) не лежит в его области рациональности: α1, α 2 , α 3  F (5) В первом случае теорема считается доказанной. Остается рассмотреть случай 2 и доказать невозможность его реализации. Итак, пусть имеет место (5). Согласно Выводу §5 каждый из корней α 1 , α 2 , α 3 лежит в некотором (своем) составном квадратическом расширении области рациональности F уравнения (1). Обозначим эти расширения соответственно через S 1 , S 2 , S 3 . Степень каждого из этих расширений - на основании (5) - больше 1. Упорядочим эти степени по величине и пусть, для определенности: [S 1 ‫ ׃‬F] ≤ [S 2 ‫ ׃‬F] ≤ [S 3 ‫ ׃‬F] (6) Возьмем теперь корень α 1 уравнения (1) и подвергнем анализу его взаимоотношение с составным квадратичным расширением S 1 , в котором лежит этот корень. При этом мы фиксируем статус минимальности расширения S 1 , т.е. считаем, что S 1 - наименьшее составное квадратичное расширение для α 1 . Иными словами, если представить S 1 в виде: 64 S 1 = F(β 1 , …, β n 1 , β n ) = (F(β 1 , …, β n 1 ))(β n ), (7) то α 1  F(β 1 , …, β n 1 , β n )  α 1  F(β 1 , …, β n 1 ) (8) Замечание. Без ограничения общности дискурса, мы считаем, что статусом минимальности обладают и расширения S 2 , S 3 . Поскольку α 1  S 1 , то из (7) усматриваем, что α 1 может быть представлен в виде (см. (2) §5): α1 = u + v β n , u, v  F(β 1 , …, β n 1 ) (9) Положим в левой части (1) х = α 1 и выполним предписанные действия. Контекст наших рассуждений указывает на то, что выполнение означенных действии происходит в пределах расширения S 1 , а значит результат выполнения этих действий есть число из S 1 . Итак, при х = α 1 левая часть (1) - по аналогии с (9) - принимает вид: A + B β n = 0, A, B  F(β 1 , …, β n 1 ) (10) A Если B ≠ 0, то из (10) следует, что β n = - B  F(β 1 , …, β n 1 ), а значит, согласно (9), α 1  F(β 1 , …, β n 1 ) и мы вступаем в противоречие со вторым соотношением (8). Таким образом, тот факт, что α 1 - корень уравнения (1), имеет следствием B = 0, а значит (см. (10)) и A = 0: α 1 - корень уравнения (1)  A = B = 0 (11) Теперь, отталкиваясь от формулы (9), задающей корень α 1 исходного уравнения (1), сами построим число α, «сопряженное» корню α 1 : α = u - v β n . Внесем α в левую часть уравнения (1) и, выполнив предписанные действия, получим: x3 + a2 α 2 + a1 α + a 0 = A - B β n (12) где A и B - те же, что и в (10). Но тогда, в силу (11), правая часть (12) обращается в нуль, т.е., α - корень исходного уравнения (1), отличный от α 1 , а потому совпадающий с α 2 или α 3 . Пусть, для определенности, α = α 2 = u - v β n . Теперь, зная два корня - α 1 и α 2 - 65 уравнения (1), мы воспользуемся одной из формул Виета, чтобы найти третий корень α 3 : а 2 = -(α 1 + α 2 + α 3 ). Отсюда, с учетом выражений для α 1 и α 2 , находим α 3 и по виду α 3 , с учетом (9), устанавливаем квадратичное расширение, которому принадлежит α 3 : α 3 = - (а 2 + 2u)  F(β 1 , …, β n 1 ) (13) Согласно статусу минимальности квадратического расширения S 3 , которому принадлежит α 3 (см. Замечание после формулы (8)), соотношение (13) указывает на справедливость включения S 3  F(β 1 , …, β n 1 ), имеющего следствием подчиненность степеней расширений (размерности векторных пространств): [S 3 : F] ≤ [F(β 1 , …, β n 1 ):F] = 2 n 1 < [S 1 :F] = 2 n (14) Равенство [S 1 :F] = 2 n в цепочке соотношений (14) получено на основании (7). Но результирующее неравенство (14) вступает в противоречие с (6). Итак, исследуемый нами случай 2 нереализуем. Достаточность доказана. Применим доказанный критерий к рациональному кубическому уравнению. Итак, пусть в уравнении (1) коэффициенты a 2 , a 1 , a 0 Согласно (10) область рациональности рационального кубического уравнения совпадает с полем Q. Следовательно, для рассматриваемого случая сформулированный выше критерий выступает в следующей редакции: Теорема (критерий разрешимости в квадратных радикалах рационального кубического уравнения). Рациональное кубическое уравнение разрешимо в квадратных радикалах тогда и только тогда, когда оно имеет хотя бы один рациональный корень. §6. Геометрические задачи на построение циркулем и линейкой. Алгебраический признак разрешимости задач на построение. Примеры неразрешимых задач на построение. фигур В геометрии есть область построений плоских геометрических или отношений между фигурами (например, построить 66 срединный перпендикуляр данного отрезка) с помощью циркуля и линейки. Суть задач на построение заключается в следующем: 1. Имеется два специальных инструмента - циркуль и линейка с помощью которых можно производить некоторые базовые построения, фиксируемые в т.н. аксиомах этих инструментов (построить отрезок, задаваемый своими концами; построить окружность данного радиуса с центром в данной точке и т.д.); 2. Заданы элементы некотрой искомой геометрической фигуры или элементы некоторого искомого отношения между фигурами. Требуется, используя только циркуль и линейку, построить искомую фигуру или искомое отношение между фигурами. Все геометрические задачи на построение распадаются на два класса: имеющее решение - разрешимые при помощи циркуля и линейки и не имеющие решения - неразрешимые при помощи циркуля и линейки. Если для отнесения задачи на построение к первому классу достаточно ее решить, то для отнесения ее ко второму классу не решить ее явно недостаточно: нужны инструменты обоснования отсутствия решений в принципе! И здесь на помощь приходит алгебра, а именно теория квадратичных расширений числовых полей. Использование теории квадратичных расширений числовых полей в теории геометрических построений с помощью циркуля и линейки основано на переводе геометрических задач на язык алгебры. Происходит это при помощи соеобразного «словаря перевода» геометрических текстов (понятий, задач и пр.) в алгебраические следующим образом. Базовые геометрические фигуры плоскости отрезки и углы - заменяются их числовыми эквивалентами: отрезки их длинами, углы - их радианными мерами. В итоге алгебраический эквивалент геометрической задачи на построение часто предстает некоторым алгебраическим уравнением, коэффициентами которого являются числовые эквиваленты фигур, задающих условие геометрической задачи, а корень этого уравнения - числовым эквивалентом искомой - требующей построения - геометрической фигурой. При этом оказывается справедливой следующая теорема (доказывается в теории геометрических построений): Теорема. Пусть дана геометрическая задача на построение. Обозначим эту задачу через Р (англ. Problem). В задаче Р требуется построить при помощи циркуля и линейки фигуру F (англ. Figure). Алгебраическим эквивалентом геометрической задачи Р является алгебраическое уравнение AE (англ. Algebraic Equation), корень которого α - числовой эквивалент искомой на построение фигуры F. В этой терминологии задача на построение Р разрешима (фигура F стоится с помощью циркуля и линейки) тогда и только тогда, когда корень α уравнения AE выражается в квадратных радикалах. 67 Содержание теоремы хорошо просматривается на следующей схеме: Дано: Геметрические объекты a n , … ,a 1 ,a 0 (Задача Р) Построить циркулем и линейкой фигуру F α – (алг-й. экв-т F) корень уравнения АЕ; выражается (или нет) в квадратных радикалах Конструируется уравнение a n х n + … +a 1 х+a 0 =0 (уравнение АЕ) Проиллюстрируем действие этой теоремы на некоторых классических примерах. Задача об удвоении куба. Дан куб с ребром а. Требуется с помощью циркуля и линейки построить куб удвоенного объема (задача P). Решение. Мы исходим из того, что куб задан (известен, построен), если задано его ребро. Ребро заданного куба принимаем за масштабную единицу измерения, т.е., полагаем а = 1. Таким образом, в численном выражении объем заданного куба равен 1. Следовательно, объем искомого куба равен 2. Обозначим ребро искомого куба через х. Таким образом, х - это отрезок, который надлежит построить. Для простоты считаем, что х выражает и длину искомого ребра. Тогда, по условию задачи, число х удовлетворяет уравнению (уравнение AE) x3 = 2 (1) Уравнение (1) - рациональное и не имеет рациональных корней. Согласно последней теореме §5 это уравнение неразрешимо в 68 квадратных радикаклах, Тогда, на основании вышесформулированной теоремы, задача обудвоении куба неразрешима при помощи циркуля и линейки. Задача о трисекции угла. Заданный угол требуется разделить на три равные части (построить 1 этого угла) при помощи циркуля и 3 линейки (задача P). Решение. Предварительно сделаем замечание. Для отдельных углов задача их трисекции имеет решение и даже достаточно очевидное. Например, легко построить 1 прямого угла. Поэтому решить данную 3 задачу, означает построить универсальный алгоритм трисекции любого угла. Если хотя бы для одного угла решения не существует, то задача - неразрешима. Итак, пусть задан угол α. Сделаем обно замечание. С точки зрения геометрических построений угол α и cosα - взаимозаменяемы: если известен один объект, строится другой и наоборот (см. рисунок). α cosα Пусть φ =  3 - искомый угол. Воспользуемся теперь сделанным выше замечанием и вместо углов будем оперировать их косинусами. Известные тригонометрические формулы кратных аргументов дают: 69 cosα = cos3φ = 4cos 3 φ – 3cosφ Положим теперь cosα = (2) b x (известная величина) и cosφ = (искомая, 2 2 неизвестная величина). В этих обозначениях равкенство (2) примет вид: 4х 3 – 3х – b = 0 (3) Итак, искомая величина х является корнем уравнения (3) (уравнение AE). Конкретизируем теперь исходную задачу, а именно, возмем угол α = 1   . Тогда cos = , откуда, с учетом принятых обозначений, b = 1 и 2 3 3 уравнение (3) принимает вид: 4х 3 – 3х – 1 = 0 (4) Итак, мы решаем геометрическую задачу о трисекции угла  и нам 3 надлежит построить угол, косинус х котрого является корнем уравнения (4) (уравнение AE). Как и в предыдущей задаче об удвоении куба уравнение (4) - рациональное и не имеет рациональных корней. Таким образом, задача о трисекции угла задача неразрешима и в общем случае.  неразрешима, а значит эта 3 70 Литература (основная) 1. Курош А.Г. Курс высшей алгебры. 18 изд. Стереотип. – СПб.: Издательство «Лань», 2011 (2004,1968, 1971, 1975).рекомендовано 2. Винберг Э. Б. Курс алгебры.- М.: Издательство «Факториал Пресс», 2002. – 544 с. Литература (дополнительная) 1. Куликов Л.Я. Алгебра и теория чисел. Учебное пособие для студентов физ.мат. специальностей, пед. Институтов.- М.; Просвещение, 1993.

Избранные вопросы алгебры многочленов

Разделы

Поддержка

Избранные вопросы алгебры многочленов

Добавить этот документ в коллекции

Добавить этот документ в сохраненные

Предложите, как улучшить StudyLib