Лекция №10 18.10.24 8. Решение линейных уравнений и систем линейных уравнений в замкнутом полукольце (продолжение) Линейные уравнения Полезно иметь в виду следующее утверждение: Теорема. Полукольцо является полукольцом с тривиальной итерацией тогда и только тогда, когда единица полукольца есть его наибольший элемент (по естественному порядку). Доказательство. Достаточность условия очевидна. Обратно, пусть для любого a его итерация a* = 1 , то есть a* = a = (1 + a + ... + a ) = 1 + (a + ... + a ) = 1 + a n = 1 . n n =0 n n n =0 n =1 n =1 Отсюда для любого a имеем: a a n 1 , что и требовалось1. n =1 Следовательно, все идемпотентные полукольца рассмотренных выше примеров2, кроме полукольца бинарных отношений, являются полукольцами с тривиальной итерацией. В этом можно убедиться и непосредственным вычислением (см. Учебник, пример 3.5, с. 180-182). Замечание. Итерация бинарного отношения M есть 2 * = = idM n n =0 n (Учебник, пример 3.5г, с. 182). n =1 Можно показать, что это наименьшее по включению рефлексивное и транзитивное отношение, содержащее . Оно называется рефлексивно-транзитивным замыканием отношения . Например, рефлексивно-транзитивное замыкание отношения доминирования, если оно не пусто, будет соответствующее отношение порядка. Вопрос. Что будет рефлексивно-транзитивным замыканием пустого отношения? 1 Достаточность условия более подробно может доказана так: a* = a = (1 + a + ... + a ) = 1 = 1(единица поглощает все остальные слагаемые). n n =0 22 Лекция №9. n n =0 n =0 Пример. Вспомним уравнение относительно неизвестного множества, которое мы решали при обсуждении теоремы о неподвижной точке в индуктивно упорядоченных множествах (лекция №5): X = (A X ) B . Теперь мы с полным основанием можем утверждать, что это уравнение вида (1) в полукольце множеств (см. пример 2 из лекции №9) и, поскольку это полукольцо с тривиальной итерацией, его наименьшее решение есть множество B , что мы получили и на лекции №5 другими способами. Подчеркнем, что везде в теории линейных уравнений и систем линейных уравнений рассматриваются именно наименьшие решения. Это согласуется и с приложениями рассматриваемой теории к теории графов и формальных языков: в прикладных задачах важны именно наименьшие решения. Матрицы над полукольцом Необходимо теперь распространить теорию линейных уравнений на решение систем таких уравнений. Но прежде надо распространить структуру полукольца на множество матриц, элементы которых берутся из некоторого полукольца. Могут быть определены матрицы любого типа (размера) над некоторым исходным полукольцом. Мы уже фактически работали с такими матрицами, представляя с их помощью конечные соответствия. На самом деле это были матрицы над полукольцом B. Операции над такими матрицами производятся точно так же, как над числовыми, но только сложение, умножение, нуль и единица понимаются так, как они определены в исходном полукольце, которому принадлежат элементы матриц. Подробно это изложено в Учебнике, п. 3.3. Пусть S = (S , +, ,0,1) - некоторое полукольцо, не обязательно замкнутое (но обязательно идемпотентное! Напомним, что мы рассматриваем только идемпотентные полукольца). Обозначим M n ( S ) множество квадратных матриц n-го порядка, элементы которых принадлежат полукольцу S . Будем называть их матрицами над полукольцом S . Рассмотрим алгебру M n (S) = ( M n ( S ), +, , O, E ) с операциями матричного сложения и умножения, а также нулевой и единичной матрицами. Без доказательства сформулируем теорему: Теорема. Алгебра M n (S) = ( M n ( S ), +, , O, E ) есть полукольцо. Если исходное полукольцо замкнуто, то и полукольцо матриц также замкнуто. (Доказательство см. в Учебнике, п. 3.3.) Тогда в замкнутом матричном полукольце можно решать линейные матричные уравнения: X = AX + B (4) и X = XA + B (5) Решениями (наименьшими!) этих уравнений будут X = A * B и X = BA * соответственно. В частности, если матрица B = E (есть единичная матрица), то решения обоих уравнений совпадают и равны итерации матрицы A , то есть A* = A . n n =0 Но нужно разработать алгоритмы решения таких матричных уравнений. Как мы сейчас увидим, это и будут алгоритмы решения систем линейных уравнений в замкнутых полукольцах. Решение систем линейных уравнений Общий вид системы (право)линейных уравнений n-го порядка в замкнутом полукольце S = (S , +, ,0,1) : x1 = a11 x1 + a12 x2 + ... + a1n xn + b1 x = a x + a x + ... + a x + b 2 21 1 22 2 2n n 2 ................................................. xn = an1 x1 + an 2 x2 + ... + ann xn + bn (6) Вводя матрицу A = ( aij ) nn , называемую основной матрицей системы (6), векторыстолбцы неизвестных = ( x1 , x2 ,..., xn ) и свободных членов = (b1 , b2 ,..., bn ) , T T перепишем систему (6) в векторно-матричной форме: = A + (7) Вернемся теперь к праволинейному матричному уравнению (4). Обозначая j j -й столбец матрицы X , а через j - j -й столбец матрицы B , перепишем матричное уравнение (4) как систему векторно-матричных уравнений относительно столбцов неизвестной матрицы X : j = A j + j ,1 j n (8) Пример для матриц 2-го порядка: x11 x 21 x12 a11 a12 x11 = x22 a21 a22 x21 x12 b11 b12 + x22 b21 b22 Для 1-го столбца неизвестной матрицы: x11 = a11 x11 + a12 x21 + b11 x21 = a21 x11 + a22 x21 + b21 То есть: x11 a11 a12 x11 b11 = + x21 a21 a22 x21 b21 Второй столбец расписывается точно так же. Таким образом, решение матричного уравнения (4) сводится к решению системы векторно-матричных уравнений (8), каждое из которых, расписанное в скалярной форме, есть не что иное, как система (6). Само существование решения матричного уравнения (4) следует из доказанной выше разрешимости линейных уравнений в любом замкнутом полукольце. Можно строго обосновать3 алгоритм последовательного исключения неизвестных (аналогичный известному методу Гаусса для числовых линейных систем), позволяющий найти наименьшее решение системы (6). Из первого уравнения системы исключаем неизвестное x1 , выражая его через остальные слагаемые правой части: x1 = a11* (a12 x2 + ... + a1n xn + b1 ) . Во все остальные уравнения подставляем это выражение и после приведения подобных членов получим систему, порядок которой на единицу меньше: xk = (ak1a *11 a12 + ak 2 ) x2 + ... + (ak1a *11 a1k + akk ) xk + ... + + (ak1a *11 a1n + akn ) xn + (ak1a *11 b1 + bk ), k = 2,..., n Так последовательно исключаем все неизвестные и приходим, наконец, к уравнению относительно неизвестного xn xn = n xn + n , где выражения n и n уже не содержат неизвестных, и значение неизвестного xn получается в окончательном виде: xn = n* n . На этот заканчивается «прямой ход» процедуры решения. Далее «обратным ходом» последовательно находим значения всех неизвестных. См. статью Белоусов А.И. О некоторых свойствах полуколец //Машиностроение и компьютерные технологии//2018. - №3 (выложена в облаке). 3 Покажем это на примере системы 2-го порядка: x1 = a11 x1 + a12 x2 + b1 x2 = a21 x1 + a22 x2 + b2 Из первого уравнения выразим x1 : x1 = a11* (a12 x2 + b1 ) . Подставим это во второе уравнение: x2 = a21a11* (a12 x2 + b1 ) + a22 x2 + b2 , x2 = (a21a11* a12 + a22 ) x2 + a21a11* b1 + b2 Обозначим 2 = a21a11a12 + a22 , 2 = a21a11b1 + b2 и запишем найденное значение * * неизвестного x2 = 2 2 . Подставляя это в первое уравнение, получим * окончательное решение системы. Процедура сильно упрощается для полуколец с тривиальной итерацией. Все «звездочки» исчезают, и мы получим: x1 = a12 x2 + b1 , x2 = a21b1 + b2 x1 = a12 (a21b1 + b2 ) + b1 . См. примеры решения таких систем в семинаре №4. Такова практика решения и матричных уравнений, и систем линейных уравнений в замкнутых полукольцах. Замечание. По поводу матричных уравнений: если в уравнении X = AX + B матрицы X и B таковы, что только их первые столбцы отличны от нуля, то записанное выше матричное уравнение станет равносильным уравнению относительно неизвестного вектора - 1-го столбца матрицы X : = A + , где - первый столбец матрицы B . То есть примет вид системы (6) или (7). 9. Подгруппы. Теорема Лагранжа Определение подгруппы Пусть G = (G , ,1) - группа, а H G - некоторое подмножество ее носителя. Это подмножество называется замкнутым, если 1) для любых a, b H произведение ab H ; 2) для любого a H обратный a −1 H ; 3) 1 H . Тогда на множестве H G может быть определена группа H = ( H , ,1) . Она называется подгруппой группы G = (G , ,1) . Например, множество четных целых чисел образует подгруппу аддитивной группы целых чисел, а множество нечетных не образует, так как не является замкнутым. Множество диагональных (а также верхне- и нижнетреугольных) невырожденных матриц образует подгруппу группы всех невырожденных матриц. Множество степеней любого элемента произвольной группы образует подгруппу, а именно, циклическую подгруппу, порожденную этим элементом. Среди всех подгрупп данной группы выделяют две тривиальные: одна состоит только из единицы, а вторая совпадает со всей группой. Подгруппа, не совпадающая со всей группой, называется собственной подгруппой. Замечание. Понятие подгруппы является частным случаем понятия подалгебры, которое мы не рассматриваем (см. Учебник, п. 4.2). Заметим неформально, что по аналогии можно ввести понятие подкольца4 (и подполукольца), как кольца (полукольца), построенного на подмножестве носителя исходной структуры, которое замкнуто в том же смысле, что и выше, относительно всех операций кольца (или полукольца). Например, кольцо (на самом деле поле) рациональных чисел есть подкольцо (точнее, подполе) кольца (на самом деле, поля) всех действительных чисел. А кольцо целых чисел есть лишь подкольцо (но не подполе) поля рациональных чисел. На множестве невырожденных квадратных матриц нельзя построить подкольцо кольца всех матриц, так нулевая матрица не является невырожденной и сумма двух невырожденных матриц вполне может иметь нулевой определитель (придумайте пример!). Определение смежных классов Далее, ради простоты обозначений, будем группу обозначать так же, как и ее носитель. Пусть G - группа, а H - ее подгруппа (это обозначают так: H G 5; не следует путать это обозначение с обозначением включения, так как не всякое подмножество носителя группы будет носителем ее подгруппы). Множество aH = {ah : h H } , где a G (всей группе!) называется левым смежным классом подгруппы H по элементу a . Правый смежный класс есть, по определению, множество Ha = {ha : h H } . Для коммутативной группы левый и правый смежный классы (для произвольно фиксированного элемента), очевидно, совпадают. 4 5 См. Учебник, п. 2.6, с. 143-144. И H G для собственной подгруппы. Но в общем случае это не так. В группе GL(2) невырожденных квадратных матриц 2-го порядка рассмотрим подгруппу D(2) диагональных матриц (проверить, что это действительно a11 a12 из группы GL(2) . a21 a22 подгруппа!). Фиксируем произвольно матрицу A = Тогда левый смежный класс подгруппы D(2) по матрице A будет множеством a11d1 a12d 2 a a d 0 AD(2) = 11 12 1 : d , d 0 = : d , d 0 , 1 2 a d a d 1 2 a a 0 d 21 22 2 21 1 22 2 тогда как правый смежный класс a11d1 a12d1 d 0 a11 a12 D(2) A = 1 : d , d 0 = : d , d 0 AD(2) a a 1 2 1 2 0 d a d a d 2 21 22 21 2 22 2 Если подгруппа H такова, что для любого a левый и правый смежный классы совпадают, то есть aH = Ha , то она называется нормальной подгруппой, или нормальным делителем. Ясно, что в коммутативной группе любая подгруппа будет нормальной. В следующем разделе («Теория графов») мы рассмотрим еще некоторые примеры нормальных делителей (при обсуждении групп автоморфизмов неориентированных графов). А сейчас перейдем к анализу свойств смежных классов. Речь пойдет только для левых. Для правых все утверждения также будут справедливы. Свойства смежных классов Докажем 4 леммы. Лемма 1. Для любого h H hH = H . То есть левый смежный класс подгруппы по любому ее элементу совпадает с самой подгруппой. Доказательство. Для доказательства равенства двух множеств используем метод двух включений. Пусть x hH . Тогда x = hh1 для некоторого h1 H . Но в силу замкнутости H x H . Если же x H , то можно этот элемент представить так: x = 1 x = (hh −1 ) x = h(h −1 x) hH , так как h −1 x H . Итак, hH = H . Лемма2. Для любых a, b G abH = a(bH ). Доказательство сразу следует из ассоциативности групповой операции. Эта лемма показывает, как вычислять левый смежный класс по произведению. Лемма 3. Левые смежные классы образуют разбиение группы, т. е. попарно не пересекаются, и каждый элемент группы принадлежит какому-то из них. Доказательство. Во-первых, для любого a G a = a 1 aH , так как 1 H . Далее, если предположить, что aH bH для некоторых a, b G , то пусть c aH bH . Тогда для некоторых h1 , h2 H имеем: c = ah1 = bh2 , откуда b = ah1h2−1 , и, в силу леммы 2 bH = (ah1h2−1 ) H = (ah1 )(h2−1 H ) = (ah1 ) H = a (h1 H ) = aH , то есть указанные смежные классы совпадают. Лемма доказана, то есть левые смежные классы либо совпадают, либо не пересекаются. Лемма 4. Все левые смежные классы попарно эквивалентны6 (т. е. находятся во взаимно однозначном соответствии). Доказательство. Определим отображение : H → aH подгруппы H в произвольно фиксированный смежный класс aH следующим образом: (h) = ah . Это отображение сюръективно, так как любой элемент смежного класса aH имеет прообраз h . Но оно и инъективно, так как, если (h1 ) = (h2 ) , то есть ah1 = ah2 , то в силу законов сокращения в группе h1 = h2 . Итак, подгруппа находится во взаимно однозначном соответствии с любым смежным классом. Но тогда и два любых смежных класса находятся между собой во взаимно однозначном соответствии. Действительно, если 1 : H → aH и 2 : H → bH - две биекции подгруппы на два разных смежных класса, то композиция 1−1 2 является −1 1 2 биекцией смежного класса aH на смежный класс bH : aH ⎯⎯ → H ⎯⎯ → bH . Рассмотренные свойства смежных классов, истинные для любой группы, для конечных групп приводят к очень важному результату, называемому теоремой Лагранжа для конечных групп. Теорема. Порядок конечной группы делится на порядок любой ее подгруппы. Доказательство. В случае конечной группы из лемм 1—4 получаем, что при любой фиксированной подгруппе группа разбивается на одинаковые по числу элементов (левые) смежные классы этой подгруппы, среди которых находится и сама подгруппа. Стало быть, порядок подгруппы одновременно является числом элементов каждого Множества называют эквивалентными (или равномощными), если существует биекция одного на другое. 6 смежного класса, и порядок всей группы равен произведению порядка подгруппы на число смежных классов: | G |= k | H | . Теорема доказана. Число k смежных классов данной подгруппы (неважно, левых или правых, так как все полученные выше результаты остаются в силе и для правых смежных классов) называют индексом подгруппы H в группе G и обозначают | G : H | . Тогда можно записать | G |=| G : H | | H | . Образно говоря, всю группу можно уподобить делимому, подгруппу – делителю, а индекс – частному от деления. Лекция №11 23.10.24 8. Подгруппы. Теорема Лагранжа (продолжение) Выше (лекция №7) при рассмотрении конечных групп было дано определение порядка элемента a группы G (любой, не обязательно конечной7) как наименьшего положительного n , для которого a n = 1 . Теперь мы можем сказать, что порядок элемента группы равен порядку, порождаемой им циклической подгруппы (уже обязательно конечной!) и, в силу теоремы Лагранжа, в случае конечной группы, является делителем порядка всей группы. Поэтому получаем: Следствие. Для конечной группы G и любого ее элемента a имеет место a = 1 . |G| В частности, для мультипликативной группы вычетов по (простому) модулю p: a p −1 = 1, Откуда заодно получаем формулу для вычисления мультипликативного обратного в поле вычетов: a−1 = a p−2 . Для примера найдем элемент, обратный в поле 31 к числу 17. Имеем: 1729 = 1716 178 174 17 - разложили 29 по степеням двойки. Вычисляем последовательно квадраты: 172 = (−14)2 = 142 = 10;174 = 102 = 7;178 = 72 = 18;1716 = 182 = (−13)2 = 132 = 14. Тогда 1729 = 14 18 7 17 = 14 (−13) 7 17 = 14 2 17 = (−3) 17 = 11. Легко проверить: 17 11 = 187 = 1(mod31) . Иногда удается быстро найти порядок элемента, обратный к которому мы ищем и, если он достаточно мал, то показатель степени p-2 надо взять по модулю этого порядка. Пример конечной циклической подгруппы в бесконечной группе – подгруппа поворотов правильного многоугольника, вписанного в окружность. Вся группа в этом случае – группа поворотов окружности (см. Учебник, задача 2.20, с. 165). 7 Например, в том же поле 252 = (−6)2 = 62 = 5;253 = 5 25 = 1, то есть порядок 25 равен 3, и 2529 = 2529mod3 = 252 = 5 , что, впрочем, сразу было понятно из равенства 5 25 = 1 . Порядок элемента a конечной группы можно найти, вычислив наименьший положительный показатель степени k такой, что a k = −1 . Тогда понятно, что порядок элемента a будет равен 2k . Но надо быть уверенным в том, что k - наименьший показатель степени с таким свойством. Если это простое число, то так и есть. В случае составного k это может быть неверно. Например, пусть в группе *31 для некоторого a получилось a15 = −1. Но 15 = 3 5 , и может оказаться, что a3 = −1 или a5 = −1 . Например, в том же поле вычетов по модулю 31 263 = (−5)3 = −1 , и, конечно, 2615 = ((−5)3 )5 = −1 , но порядок 26 будет равен 6. И, кстати, 26−1 = 2629mod6 = 265 = (−5)3 (−5)2 = (−1)(−6) = 6 , что и так понятно из того, что (5)6=1(mod31). Проведем те же вычисления для 17. 1715 = 1716 17−1 = 14 11 = 154 = −1(mod31) , но при этом 173 = 172 17 = 10 17 = 15;175 = 173 172 = 15 10 = 26 = −5 . Отсюда следует, что 15 – наименьший показатель степени, дающий для 17 результат -1. Значит, порядок 17 равен 30, то есть порядку всей группы * 31 , и это число есть один из образующих элементов данной циклической группы. Здесь уместно кое-что сказать вообще об «устройстве» мультипликативных групп вычетов. Доказывается, что любая такая группа является циклической (доказательство это весьма непросто), причем число ее образующих элементов (называемых также генераторами) определяется формулой: (n) = n(1 − m 1 1 1 1 )(1 − )...(1 − ) = n (1 − ) , где n - порядок группы и его p1 p2 pm pk k =1 разложение на простые множители имеет вид: n = p1 1 p2 2 ... pmm . k k k Функция (n) называется функцией Эйлера. Она дает число всех чисел, меньших n и взаимно простых с n . Замечание. Эту формулу можно вывести из таких соображений. Если n есть некоторая степень простого числа p , то есть n = p , k 1 , то для k получения всех чисел от 1 до n , взаимно простых с n , достаточно из общего числа всех чисел от 1 до n вычесть число всех чисел, кратных p , которых будет p k −1 (включая само число n ). То есть 1 p ( p k ) = p k − p k −1 = p k (1 − ) . Нетрудно обобщить это на случай произвольного разложения на простые множители с учетом того, что все множители в разложении попарно взаимно просты. Для простого числа p получим ( p) = p(1 − 1 ) = p −1. p Часто приходится вычислять функцию Эйлера для числа, представленного в виде произведения попарно различных простых чисел: m ( p1 p2 ... pm ) = ( pk − 1) . k =1 Надо заметить также, что для мультипликативной группы вычетов поля p число генераторов будет всегда четным (исключая тривиальные случаи p = 2 и p = 3 ), так как образующие элементы всегда ходят парами взаимно обратных8. Например, группа 1 2 * 31 . 1 3 1 5 1 2 4 2 3 5 (30) = 30(1 − )(1 − )(1 − ) = 30 = 8 , то есть 4 пары взаимно обратных генераторов. Алгоритм вычисления генераторов основан на следующем утверждении: Если a - образующий элемент конечной циклической группы порядка n , то его степень a r будет образующим тогда и только тогда, когда число r взаимно просто с n. Тогда можно подбором найти образующий элемент наименьший в числовом порядке, а затем вычислить его степени, взаимно простые с порядком группы. Например, для группы * 31 наименьший – 3, обратный 21 = 3 . 29 Далее: В любом кольце вычетов по модулю k элемент k-1 обратен сам себе, так как (k-1)2 = 1(mod k), и порядок такого элемента будет равен 2. Следовательно он будет образующим только для группы вычетов по модулю 3 (если не учитывать тривиальную группу по модулю 2). 8 37 = 17,323 = 3−7 = 11; 311 = 13,319 = 3−11 = 12; 313 = 24,317 = 3−13 = 22. То, что 3 является генератором, усматривается из таких вычислений: 315 = (35 )3 = (19 3)3 = (−5)3 = −1 , но при этом 33 = 27 −1, а 35 = −5 . (См. также семинар №4.) Некоторые дополнения и приложения Малая теорема Ферма В теории чисел есть такая теорема: Пусть a - целое число, а p - простое число, не являющееся делителем a . Тогда a p −1 = 1(mod p) . ◄Разложим число a по модулю p : mp + r , m , r = mod(a, p) . По условию r 0 . Используя формулу бинома Ньютона, получим a p −1 = (mp + r ) p −1 p −1 = C pk −1 (mp) p −1− k r k = r p −1 (mod p) . k =0 Последнее равенство верно, так как все слагаемые записанной выше суммы, кроме последнего, делятся на p . Но число r {1, 2,..., p −1} , то есть является элементом группы * p и, в силу доказанного выше, r p −1 = 1 (в этой группе). Отсюда и вытекает утверждение теоремы. ► Малая теорема Ферма позволяет распознавать делимость очень больших чисел, не прибегая к прямым вычислениям. Например, при p = 97, a = 102 10296 −1 97 (такие примеры можно умножать). Теорема Эйлера Малая теорема Ферма допускает обобщение, называемое теоремой Эйлера. Для любого натурального k и целого a, взаимно простого с k, число a(k) = 1 (mod k), где (k) – значение определенной выше функции Эйлера для числа k. Доказательство аналогично предыдущему и основано на утверждении, что элемент кольца вычетов по модулю k обратим тогда и только тогда, когда он взаимно прост с k (см. в Облаке файл «Решение систем линейных уравнений в кольцах вычетов»). Число (k) есть не что иное, как порядок группы обратимых элементов указанного кольца. В случае поля (k)=k-1, и мы получаем малую теорему Ферма. Одна схема кодирования Можно доказать следующее утверждение: В кольце pq , где p и q простые числа, для любого M {0,1,... pq} и для любых D и E таких, что DE = 1 mod( p −1)(q −1) M DE = M mod pq . ◄Если M=0 или M=1, то доказывать нечего. Иначе по теореме Эйлера с учетом того, что ( pq) = ( p −1)(q −1) , получим M DE = M k ( p−1)( q−1)+1 = M k ( pq) M = M mod pq ► Этот результат используется при передаче шифрованных сообщений. Цифровой D код M кодируется посредством закрытого ключа D , т.е. передается код M . Получатель, зная число E (открытый ключ), декодирует сообщение, возводя полученный код в степень E . При этом отправитель знает также числа p, q , а получатель – число n . Например: 1) n = 33 = 3 11, D = 3, E = 7; (n) = 20 . 2) n = 65 = 5 13, (n) = 48, D = 5, E = 29; DE = 145 = 3 48 + 1 = 1mod48 . Во втором случае можно было бы положить D=E=7, но это нежелательно, так закрытый и открытый ключи не должны совпадать. Пусть, например, в первом случае передается число 4, кодирующее, скажем, букву “c” латинского алфавита (первую букву слова computer, которое передается побуквенно). Кодирование состоит в том, что число 4 возводится в куб по модулю 33: 4 = −2 = 31. 3 Получатель должен декодировать сообщение, возведя полученное число в 7-ю степень: (−2) = 2 (−2) = (−2) (−2) = 4 . 7 6 Конечно, эта схема становится надежной, если числа p, q, D и E достаточно велики. Числа Ферма Так называются числа вида 2 2n + 1, n 0 . Ферма думал, что все они простые. Действительно, как легко проверить, это верно для всех n 4 , но уже 2 + 1 = 2 + 1 делится на 641. В этом можно убедиться прямым вычислением в мультипликативной группе вычетов по модулю 641. Порядок 2 в этой группе равен, стало быть, 64 (можно проверить, что эта группа циклическая, одним из генераторов которой является число 3). 25 32 Можно, однако, доказать такое утверждение: Если число 2 + 1 простое, то число s есть некоторая степень двойки. s ◄Если число 2 + 1 простое, то кольцо вычетов по этому числу (модулю) есть поле, и s его мультипликативная группа имеет порядок 2 , причем 2 = −1(mod(2 + 1)) . Но в s s s любом кольце вычетов по модулю k единственный, кроме 1, обратный себе самому элемент есть k-1. Действительно, если предположить, что некоторый элемент k − обратен сам себе, то (k − ) = 2 = 1(mod k ) , откуда = 1. Но знак «минус» 2s s s невозможен, так как получится k + 1 k . Поэтому = 1 .Тогда 2 = 2 2 = 1 , то 2 есть порядок двойки равен 2s. (Иначе говоря, s- наименьшее число, для которого 2s = -1. Если предположить, что нашлось некоторое k < s такое, что 2k = -1, то 2k 2k = 22k = (-1)2=1(mod p), и элемент 2k при k < s был бы сам себе обратен, что невозможно9.) s По теореме Лагранжа тогда число 2s есть делитель числа 2 , что и означает, что s является степенью двойки. ► Доказывается также, что все числа Ферма попарно взаимно просты. Ну и, очевидно, что не может быть степени 2 , k s , такой, что 2 2 обратного элемента. 9 k s k = 1 в силу единственности Лекция №7 04.10.24 2. Группоиды, полугруппы, группы (продолжение) Далее операцию группы обозначаем «точкой», которая обычно опускается (как при записи числового умножения). Теорема. В каждой группе: 1) выполняются законы сокращения: 2) ab = ac b = c; ba = ca b = c. 3) однозначно разрешимы уравнения: ax = b(1), xa = b(2), axb = c(3). (относительно неизвестного x.) Доказательство. 1) Если ab = ac , то, умножая обе части равенства слева на a−1 , получим, что получим b = c. Второе условие доказывается также (но нужно умножать на a−1 справа). 2) Рассмотрим уравнение (1). Легко проверить, что x = a −1b есть решение: a(a−1b) = (aa −1 )b = b . Теперь надо доказать, что это единственное решение. Пусть x0 есть решение уравнения (1). Подстановка решения в уравнение превращает его в равенство: ax0 = b . Умножая обе части этого равенства слева на элемент a−1 , a −1 (ax0 ) = a −1b x0 = a −1b , что и означает, что только x = a −1b есть решение. Аналогично доказывается, что решениями уравнений (2) и (3) соответственно будут x = ba −1 и x = a−1cb−1 . Понятие степени элемента группы В полугруппе можно определить любую натуральную (положительную целую) степень элемента, полагая an = (an−1 )a, n 2; a1 = a . В моноиде дополнительно определяется нулевая степень любого элемента как равная нейтральному элементу. В группе может быть определена произвольная целая степень, и отрицательная степень определяется следующим образом: a− n (a n )−1 , n 0 Без доказательства сформулируем теорему о свойствах степеней: Теорема. Для произвольных целых чисел m и n выполняется: 1) am+n = am an 2) amn = (am )n (в частности, a− n = (a−1 )n ) 3) Если элементы a и b коммутируют, то есть ab = ba , то (ab)n = anbn Способы записи группы В общих рассуждениях о группах используют два способа обозначения (записи)операций группы: мультипликативную запись и аддитивную запись. При мультипликативной записи бинарную операцию обозначают точкой, которую часто опускают, и называют умножением (результат, соответственно, произведением), обратный к a элемент обозначают a−1 , а нейтральный называют единицей и записывают часто, как число 1 (хотя в общем случае это совсем не число). Выше мы и пользовались именно такой записью. При аддитивной записи бинарную операцию обозначают «плюсом» (+) и называют сложением (результат – сумма). Нейтральный элемент называют нулем и обозначают, как число 0 (и опять надо понимать, что в общем случае это никакое не число). Обратный к a элемент обозначают −a и называют противоположным к a . Аддитивную запись в основном используют при изучении коммутативных групп. При использовании аддитивной записи вводят такое обозначение степени элемента: n a (a + a + ... + a), n −n a −(n a ) = n (−a ) = (−a − a − ... − a), n 0; 0 a 0. n Так вводится аддитивная степень элемента при использовании аддитивной записи группы. Вычитание и деление Пусть дана коммутативная группа в аддитивной записи: (G, +,0) . Рассмотрим уравнение a+ x =b. Его решение x = −a + b = b + (−a) . Сумму b + (−a) обозначают как b − a и называют разностью элементов b и a. Так, в частности, определяется разность векторов в произвольном линейном пространстве, Коммутативная группа может быть представлена и в мультипликативной записи (например, упомянутые выше мультипликативные числовые группы). В этом случае решение уравнения ax = b можно записать так: x = a −1b = ba −1 b . a Так вводится понятие частного от деления (и, соответственно, сама операция деления, как выше – вычитания). Но это имеет смысл только для коммутативных групп! Легко видеть, что в коммутативной группе все виды уравнений сводятся к уравнению (1). 3. Группы подстановок Пусть M = {1, 2,..., n} - конечное множество, далее, как правило, отождествляемое с множеством первых n натуральных чисел. Симметрическая группа этого множества, называемая симметрической группой степени n и обозначаемая S n , состоит из биекций его на себя; эти биекции, взаимно однозначные отображения, называются подстановками и стандартно записываются в виде двустрочной матрицы: 1 2 ... n , i1 i2 ... in = где в верхней строке перечисляются элементы множества M в стандартном порядке (по возрастанию), и под каждым элементом в нижней строке подписывается его образ при отображении , то есть ik = (k ),1 k n . Таким образом, нижняя строка является некоторой перестановкой элементов верхней строки. Иногда саму подстановку называют перестановкой, но, строго говоря, это неверно: перестановка – это вектор значений функции (отображения), которая называется подстановкой. Отсюда же видно, что число элементов в группе S n равно n! (n факториал). Рассмотрим теперь выполнение операций группы: композиции и обращения. 1) Вычисление композиции Композиция двух подстановок 1 2 ... n 1 2 ... n и = j1 j2 ... jn i1 i2 ... in = вычисляется очень просто по формуле (k ) = ( (k )),1 k n , то есть это вычисление значения сложной функции. Первая подстановка переводит элемент k в элемент ik , а вторая полученный элемент ik переводит в элемент jik . Например: 1 2 3 4 1 2 3 4 1 2 3 4 , = , = 4 3 1 2 3 2 1 4 4 1 3 2 = Схема действий: 1→4→4, 2→3→1, 3→1→3, 4→2→2. При этом 1 2 3 4 , 1 3 4 2 = то есть композиция подстановок некоммутативна. 2) Обратная подстановка Чтобы найти подстановку, обратную данной, нужно переставить строки матрицы, а потом переставить столбцы так, чтобы верхняя строка приняла стандартный вид 1 2 … n. Например, 1 2 3 4 5 4 5 2 3 1 1 2 3 4 5 −1 → → = 4 5 2 3 1 1 2 3 4 5 5 3 4 1 2 = Перестановку строк можно выполнить «в уме» и сразу записать обратную подстановку, читая исходную снизу вверх1. 4) Циклы, разложение на независимые циклы Пусть фиксированы элементы 1 i1 , i2 ,..., ik n,1 k n и подстановка действует так: i1 → i2 → i3 → ... → ik → i1 , то есть (i j ) = i j +1 ,1 j k − 1 и (ik ) = i1 , причем для всякого m M \{i1 ,..., ik } (m) = m . Такая подстановка называется циклом длины k и записывается в виде (i1i2i3 ...ik ) . Из определения ясно, что любая циклическая перестановка элементов цикла, то есть элементов i1 , i2 ,..., ik , даст тот же самый цикл, ту же самую подстановку. Например, (12345)=(23451)=(34512) и т. д. Кроме того, цикл оставляет неподвижными все элементы исходного множества, которые не входят в цикл. Цикл длины 1 есть, как нетрудно сообразить, тождественная подстановка. Наибольшая длина цикла в группе S n равна n. n! = (n − 1)! , так n как существует ровно n циклических перестановок элементов цикла. Полезно заметить, что число циклов длины n в таком случае равно Понятно также, что цикл, обратный данному, получается инвертированием элементов исходного цикла: (i1i2 ...ik −1ik ) −1 = (ik ik −1...i2i1 ) . Два цикла называются независимыми, если они не имеют общих элементов. Важное свойство независимых циклов состоит в том, что они коммутируют по композиции, то 1 С начала п. 3 до этого места – повторение конца лекции №6. есть, если 1 и 2 - независимые циклы, то 1 2 = 21 (значок композиции будем, как правило, опускать). Доказывается теорема, согласно которой любая подстановка может быть разложена на композицию (иногда говорят – произведение) попарно независимых циклов. Покажем это на примере. 1 2 3 4 5 6 7 8 9 = (14576)(2389) 4 3 8 5 7 1 6 9 2 Чтобы построить такое разложение, нужно проследить «орбиту» каждого элемента под действием данной подстановки. Строим цикл, содержащий 1: 1→4→5→7→6→1 – замкнули первый цикл. Берем любой элемент, например, 2, не попавший в построенный цикл, и строим цикл, содержащий 2: 2→3→8→9→2. Так действуем до исчерпания всех элементов, не попавших в очередной цикл. Заметим, что сумма длин всех циклов в этом разложении должна быть равна числу элементов множества, на котором действует подстановка. В этом примере – 9. Заметим также, что в разложении могут быть циклы длины 1. Цикл длины 1 – это тождественная подстановка. Появление цикла длины 1 означает, что исходная подстановка оставляет соответствующий элемент неподвижным (переводит его в себя). Разложение подстановки на попарно независимые циклы позволяет легко вычислять любые целые степени подстановок. А именно, если = 1 2 ... m , где циклы i попарно независимы, то для любого целого s (1 2 ... m ) s = 1s 2s ... ms . При возведении же цикла в целую степень нужно учитывать, что цикл, возведенный в степень, равную его длине, даст тождественную подстановку. Следовательно, при возведении цикла в произвольную целую степень показатель степени нужно взять по модулю длины цикла (то есть вычислить остаток от деления показателя степени на длину цикла). Например, для построенного выше разложения [(14576)(2389)]2022 = (14576) 2022mod5 (2389) 2022mod4 = (14576) 2 (2389)2 = (15647)(28)(39) . Схема вычисления положительно целой степени s цикла (i1i2 ...ik ) такова: i1 → i1+ s → i2 + s → ... Так, образно говоря, шагаем через s-1 элемент и действуем так до тех пор, пока не получим произведение попарно независимых циклов (в частности, один цикл). Например: (123456789) 2 = (135792468);(123456789) 3 = (147)(258)(369); (123456) 2 = (135)(246);(123456) 3 = (14)(25)(36); (123456) 4 = (153)(264). Полезно заметить и следующее. Пусть дан цикл длины k, а положительное целое m<k. Тогда (i1i2 ...ik ) m = (i1i2 ...ik ) k (i1i2 ...ik ) m − k = (ik ik −1...i1 ) k − m , 12...n так как (i1i2 ...ik ) k = = - тождественная подстановка. 12...n Если число k-m>0 достаточно мало, то удобнее, для вычисления исходной m-й степени, возвести в степень k-m цикл, обратный данному. Например, (123456789)7 = (987654321)2 = (975318642) = (186429753) . Последний цикл мы получили бы, если бы «в лоб» шагали через 6 элементов в приведенной выше схеме (напомним, что цикл не меняется при любой циклической (i i ...i ) = (i2i3 ...ik i1 ) = (i3i4 ...ik −2i1i2 ) = ... перестановке его элементов: 1 2 k ). (1234) = (2341) = (3412) = (4123). В частности, если m=k-1, то m-я степень цикла длины k равна обратному циклу: (i1i2 ...ik ) k −1 = (i1i2 ...ik ) −1 = (ik ik −1...i1 ) (123456789)8 = (987654321) . Сделаем теперь замечание о разложении в произведение попарно независимых циклов подстановки, представленной в виде произведения (композиции) циклов, не являющихся независимыми. Поясним это на примере. Пусть в группе S9 дана подстановка (123)(23489)(5678) . Как видно, циклы в этой композиции не являются независимыми. Действуем так: имеем три подстановки, действующие последовательно. Строим «орбиту» каждого элемента под действием этих трех последовательно применяемых подстановок. Можно начать с 1: первый цикл переводит 1 в 2, второй переводит 2 в 3, а в третьем 3 отсутствует. В итоге 1 перешла в 3. Дальше следим за «судьбой» тройки (3): 3→1, и всё, так как единицы во втором и третьем цикле нет. Значит, мы замкнули цикл (13). Действуя таким же образом, получим цикл, содержащий двойку (2): (2456789). Итак, (123)(23489)(5678) = (13)(2456789) . (Подробнее - Орбита двойки (2): 2→3→4; в итоге 2 перейдет в 4, так как 4 в третьем цикле нет. Орбита 4: 4→8 (2-й цикл), 8→5 (3-й цикл); в итоге 4 переходит в 5. 5→6→7 (эти элементы находятся только в третьем цикле). Далее 7→8, 8 есть во втором цикле, поэтому сначала 8→9, после чего 9→2, и второй цикл в строящемся разложении замыкается.) Пример. В группе S 4 решить уравнение: 1234 4213 2021 1234 X 3214 −2019 = (12)829 . Решение Чтобы решить это уравнение, нужно сначала вычислить все степени указанных подстановок. Для этого надо каждую подстановку разложить на попарно независимые циклы, после чего каждый цикл возвести в степень, взяв показатель степени по модулю длины цикла. Будем иметь: 1234 4213 2021 = [(143)(2)]2021 = (143) 2 = (341); −2019 1234 = [(13)(2)(4)]−2019 = (13); 3214 829 (12) = (12). Исходное уравнение примет вид: (341) X (13) = (12). Решение: X = (341)−1 (12)(13)−1 = (143)(12)(13) = (14)(23). 4. Конечные группы. Циклические группы Число элементов конечной группы называется ее порядком. Порядком элемента a конечной группы называется наименьшее положительное число s такое, что a s = 1 . Через некоторое время мы докажем, что если G - конечная группа, a G и s порядок a , то a|G| = a s = 1 (где | G | - порядок группы G ). Поэтому, чтобы возвести элемент конечной группы в произвольную целую степень, надо показатель степени взять по модулю порядка группы, или по модулю порядка данного элемента (который предварительно надо найти). Рассмотрим один пример конечной группы. Мультипликативная группа вычетов по модулю 7. На множестве положительных целых чисел {1, 2,3, 4,5,6} определим операцию b = mod(ab,7) , то есть берется остаток от деления на 7 обычного произведения. Можно доказать, что такая алгебра есть группа. Она называется мультипликативной группой вычетов по модулю 7. умножения по модулю 7, полагая a 7 Таблица Кэли (см. стр. 143, пример 2.14) такой группы выглядит так: 7 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 2 4 6 1 3 5 3 6 2 5 1 4 4 1 5 2 6 3 5 3 1 6 4 2 6 5 4 3 2 1 По этой таблице легко найти пары взаимно обратных элементов. Скажем, надо найти обратный к 3. По строке «3» идем до клетки с «1». Номер соответствующего столбца даст обратный. В данном случае это будет 5. Дальше будет показано, что такая мультипликативная группа вычетов может быть построена для любого простого числа p . Такую группу называют мультипликативной группой вычетов по модулю p и обозначают * p . Ее операцию умножения по модулю p , определяемую в общем случае аналогично определению умножения по модулю 7, часто обозначают просто точкой, которую обычно опускают (если это не вредит пониманию). Пример. Решить в группе 32026 7 * 7 уравнение x = 5−2020. Имеем: x = 3−2026 7 5−2020 = 32 7 52 = 2 7 4 =1 . Вычисление степеней с показателями, меньшими порядка группы (равного 6) можно проводить «в лоб», используя формулу an = an−1a (в любой группе; обозначение операции опущено), но можно заметить, что для конечной группы G имеет место равенство an = an −|G| (n | G |) . Поэтому, если бы надо было вычислить 34 , то 34 = 3−2 = (32 )−1 = 2−1 = 4. Циклические группы Группа G = (G, ,1) называется циклической, если существует такой элемент a G , что любой элемент группы является некоторой целой степенью элемента a , который называется образующим элементом данной циклической группы. Сразу надо заметить, что вместе с каждым образующим элементом обратный к нему также будет образующим. Действительно, если любой элемент группы g = a n , n , то g = (a−1 )− n . Позже мы увидим, что таких пар образующих элементов может быть много. Примеры. 1) Аддитивная группа целых чисел ( , +,0) - циклическая с образующими элементами 1 и -1, так как для любого n можно записать n = n 1 = −n (−1) (см. выше определение аддитивной степени элемента аддитивно записанной группы). Замечание. Подробнее: если n 0 , то n = 1 + 1 + ... + 1 = n 1 = −(1 − 1 − ... − 1) = − n (−1) . n n Последнее число есть число, противоположное n-й степени минус единицы, то есть противоположное числу -n, то есть n. Если же n 0 , то пусть n = −m, m 0 . Тогда n = −m = −(1 + 1 + ... + 1) = −m 1 = m (−1) = −1 − 1 − ... − 1 , то есть опять получаем, что m m n = n 1 = −n (−1) . 2) Легко проверить, что рассмотренная выше мультипликативная группа вычетов по модулю 7 также циклическая с образующими элементами 3 и 5 (которые взаимно обратны). А в группе *11 будет уже две пары образующих элементов: 2 и 6, 7 и 8, что нетрудно проверить. Позже будет дана формула, по которой можно найти число всех образующих элементов в любой мультипликативной группе вычетов *p 2, а также мы рассмотрим определенный способ их перечисления. Циклическую группу с образующим элементом a будем обозначать [a] , называя ее циклической группой, порожденной элементом a . Очень важно понять, что каждый образующий элемент – один на всю группу, но не в том смысле, что он единственный (а он не единственный хотя бы потому, что и обратный к нему, в общем случае отличный от него, тоже будет образующим), а в том, что он через свои степени порождает всю группу. Вспомним теперь, что порядком элемента a конечной группы называется наименьшее положительное число s такое, что a s = 1 . Замечание. На самом деле, порядок элемента так же определяется и для любой группы, не обязательно конечной. Просто в этом параграфе мы рассматриваем почти исключительно конечные группы. Имеет место следующая важная теорема: Теорема. Порядок образующего элемента конечной циклической группы равен порядку (числу элементов) этой группы. Доказательство. Пусть a - образующий элемент некоторой конечной циклической группы, и его порядок равен n. Докажем, что в группе [a] ровно n элементов, которые 2 Доказывается, что любая такая группа является циклической. являются степенями a , то есть [a] = {a0 = 1, a, a2 ,..., a n−1} . Прежде всего докажем, что все эти элементы, степени a , попарно различны. Предположим, что нашлись два таких различных числа p и q таких, что a p = a q , причем 1 p q n −1 . Умножая записанное выше равенство на a− p , получим a q − p = 1, но 0 q − p n, а число n, как порядок образующего элемента, есть наименьшее положительное число такое, что a n = 1 . Отсюда следует, что равенство a q − p = 1 невозможно и указанные выше два числа p и q также невозможны. Значит, все степени a0 = 1, a, a2 ,..., an−1 попарно различны и их, стало быть, ровно n. Теперь докажем, что любая целая степень a есть одна из них. Произвольное целое число m представим в виде: m = kn + r , где r – остаток от деления m на n, то есть 0 r n −1 . Тогда am = akn+r = akn ar = (an )k a r = 1k a r = 1 a r = a r {1, a, a 2 ,..., a n−1} . Теорема доказана. Замечание. Легко показать, что любая циклическая группа коммутативна. Действительно, для любых элементов am и a n циклической группы [a] имеем: a m a n = a m+ n = a n + m = a n a m . Подчеркнем, что это относится к любой циклической группе, а не только к конечной. Лекция №8 09.10.24 5. Кольца, тела, поля Определение кольца Кольцо – это алгебра типа (2, 2, 0, 0), то есть алгебра с двумя бинарными и двумя нульарными операциями R = ( R, +, ,0,1) , называемыми соответственно сложением, умножением, нулем и единицей данного кольца и, по определению, обладающими следующими свойствами: a + (b + c) = (a + b) + c (сложение кольца ассоциативно), a + b = b + a (сложение кольца коммутативно), a + 0 = a (нуль есть нейтральный элемент по сложению), (a)(a ')(a + a ' = 0) (каждый элемент кольца имеет обратный по сложению, называемый противоположным к a и обозначаемый −a ), 5) a (b c) = (a b) c (умножение кольца ассоциативно), 6) a 1 = 1 a = a (единица есть нейтральный элемент по умножению), 1) 2) 3) 4) 7) a(b + c) = ab + ac; (умножение дистрибутивно относительно сложения как слева, (b + c)a = ba + ca так и справа)3. Записанные выше тождества, выражающие свойства операций любого кольца, называются основными тождествами, или аксиомами, кольца. Равносильно кольцо можно определить так: это алгебра типа (2, 2, 0, 0), где 1) ( R, +,0) - по сложению кольцо есть коммутативная группа (аксиомы 1-4), называемая аддитивной группой данного кольца, 2) ( R, ,1) - по умножению кольцо есть моноид (аксиомы 5 и 6), называемый мультипликативным моноидом кольца, 3) Выполняется аксиома дистрибутивности 7 (эта аксиома связывает две указанные алгебры друг с другом). Замечание. В алгебраической литературе есть другие определения кольца. Одно из самых распространенных отличается от приведенного выше тем, что по умножению кольцо только лишь группоид. Такой структурой будет, например, множество геометрических (трехмерных) векторов с операциями сложения и векторного умножения. После этого тогда определяются частные случаи ассоциативного кольца (по умножению кольцо становится полугруппой) и ассоциативного кольца с единицей, что соответствует приведенному выше определению. Нам будет сразу удобно рассматривать именно такой вид кольца и называть его просто кольцом, тем более что других видов «кольцеобразных» структур мы рассматривать не будем. Отметим сразу важный частный случай коммутативного кольца: кольцо называется коммутативным, если его операция умножения коммутативна, то есть имеет место тождество a b = b a . Примеры Перед рассмотрением примеров необходимо заметить следующее. Когда мы определяем какую-то конкретную алгебру и утверждаем, допустим, что это кольцо, мы обязаны проверить выполнение всех аксиом кольца, то есть подвести частный случай под общее определение. Переходим к рассмотрению конкретных колец. 1) Кольцо целых чисел ( , +, ,0,1) . Аксиомы легко проверяются с учетом известных свойств числовых операций. Структура кольца точно так же может быть определена на множестве рациональных, действительных и даже комплексных чисел, но не может быть определена на множестве неотрицательных целых (рациональных, Знак умножения («точка») опущен. Это делается часто при таком обозначении операции (абстрактного) умножения. 3 действительных) чисел в силу невыполнения аксиомы 4 (существования противоположного элемента). Это кольцо (как и все числовые кольца) коммутативно. 2) Кольцо квадратных матриц заданного порядка Mn = (M n , +, , O, E) . И здесь аксиомы легко проверить, помня свойства матричных операций. Это кольцо не коммутативно (матричное умножение не коммутативно). 3) Кольцо множеств R M = (2 M , , , , M ) , в котором сложение – симметрическая разность, умножение – пересечение, нуль – пустое множество, единица – всё множество M, подмножества которого образуют носитель данной алгебры. Выполнение аксиом кольца следует из доказанных ранее свойств операций над множествами: (1) A( BC) = ( AB)C - симметрическая разность ассоциативна, (2) AB = BA - симметрическая разность коммутативна, (3) A = A - пустое множество нейтрально по симметрической разности, (4) AA = - каждый элемент противоположен самому себе, (5) A ( B C) = ( A B) C - пересечение ассоциативно, (6) A M = A - всё множество нейтрально по пересечению, (7) A ( BC) = ( A B)( A C) - пересечение дистрибутивно относительно симметрической разности. Это кольцо коммутативно, так как пересечение – операция коммутативная. 4) Кольцо вычетов по модулю k k = ({0,1,..., k −1}, k , k ,0,1) . Это конечное кольцо, носителем которого является множество первых k неотрицательных целых чисел, а операции сложения и умножения по модулю k определяются известным образом (берется остаток от деления на k обычных суммы и произведения соответственно). Можно доказать (упражнение!), что все аксиомы кольца выполняются4. Это кольцо коммутативно. Заметим, что в противоположность кольцу множеств алгебра бинарных отношений (того же типа) Rl( M ) = (2 M M , , ,, ,id M ) не является кольцом, так как не выполняется аксиома 4 (нет противоположного элемента по операции объединения5). Рассмотрим теперь свойства кольца, вытекающие из его определения. Теорема. В любом кольце выполняются следующие тождества: 1) a 0 = 0 a = 0 (аннулирующее свойство нуля); 2) a (−b) = (−a) b = −(a b) 3) a (b − c) = a b − a c;(b − c) a = b a − c a - дистрибутивность умножения относительно вычитания. См. ниже дополнения к лекциям 7-9. Действительно, если предположить, что существуют два множества, объединение которых пусто, то оба эти множества должны быть пустыми. 4 5 Доказательство. В дальнейших выкладках точка как знак операции умножения опускается (если это не приводит к недоразумению). 1) a + a 0 = a 1 + a 0 = a(1 + 0) = a 1 = a . Итак, a + a 0 = a . Это можно рассматривать как уравнение в аддитивной группе кольца относительно неизвестного значения a 0 . Решая это уравнение, получим a 0 = a − a = 0 . Окончательно a 0 = 0 . Точно так же получаем, что a + 0 a = a , откуда 0 a = 0 . 2) Рассмотрим сумму a b + a (−b) = a (b + (−b)) = a 0 = 0 , но это значит, что a (−b) = −(a b) . Заметим, что использовано свойство (1). Точно так же доказывается, что (−a) b = −(a b) . Отсюда, в частности, легко получается, что −a = (−1) a = a (−1) . Также, основываясь на этом свойстве, можно доказать, что в любом кольце (−a)2 m = a 2 m , m (любая четная степень противоположного к данному элемента совпадает с той же степенью исходного элемента – как в элементарной арифметике). 3) a (b − c) = a(b + (−c)) = ab + a(−c) = ab − ac - в силу свойства (2). Правая дистрибутивность доказывается точно так же. Замечание. Свойство четной степени удобно применять при вычислениях в кольцах вычетов по большому модулю. Например, пусть надо возвести в квадрат число 76 в кольце вычетов по модулю 97. Тогда проще возвести квадрат противоположное число 21 и получить 441(mod 97)=53. А в кольце вычетов по меньшему модулю можно полностью устно провести такое вычисление. Например, в кольце вычетов по модулю 33: 272 = (-6)2 = 3. Подобные действия приходится совершать в некоторых алгоритмах шифрования и дешифрования, о чем позже будет немного сказано. Обратимость. Понятия тела и поля Некоторые элементы кольца могут быть обратимыми по умножению. Например, в кольце матриц это будут все невырожденные матрицы, а в кольцах рациональных и действительных чисел все ненулевые числа. Но если мы потребуем, чтобы все элементы кольца были обратимы, то получим −1 для нуля: 0 0 = 1 , откуда следует, что в таком кольце 0 = 1. Это не парадокс и не утверждение о равенстве числа 0 числу 1. Это означает, что, если в кольце все элементы обратимы, то в нем оба нейтральных элемента совпадают, то есть это кольцо состоит из одного единственного элемента, условно обозначаемого нулем: 0 . Это одноэлементное кольцо в конкретных случаях может быть, например, кольцом, состоящем из одного числа 0, или кольцом подмножеств пустого множества. Констатировав существование такого кольца, мы им больше заниматься не будем. Если потребовать обратимости (по умножению) всех ненулевых элементов кольца, то примеров таких колец уже много. Хотя бы перечисленные выше числовые кольца (кроме кольца целых чисел). Определение. Кольцо, все ненулевые элементы которого обратимы по умножению, называется телом. Тело, умножение которого коммутативно, называется полем. Можно доказать, что все обратимые элементы кольца образуют группу. Это следует из того, что произведение обратимых элементов обратимо, элемент, обратный к обратимому, также обратим и единица обратима (см. в лекции №6 свойства обратимых элементов любого моноида). Поэтому тело можно определить как кольцо, все ненулевые элементы которого образуют группу по умножению. Эта группа называется мультипликативной группой данного тела. Все записанные выше числовые кольца (кроме кольца целых чисел) являются полями. Самый «близкий» пример некоммутативного тела – тело кватернионов (см. Учебник, приложение к главе 2). Делители нуля. Область целостности Ненулевые элементы a и b кольца называются делителями нуля, если ab = 0 или ba = 0 . Ясно, что в теле не может быть делителей нуля. Но, например, их нет и в кольце целых чисел. Определение. Коммутативное кольцо без делителей нуля называется областью целостности (или целостным кольцом). Поэтому как раз кольцо целых чисел является областью целостности (термин, видимо, связан как раз с тем, что любая область целостности «устроена» подобно кольцу целых чисел). Одним из примеров бесконечной области целостности может служить кольцо многочленов с вещественными коэффициентами с определяемыми стандартно операциями сложения и умножения (см. Дополнения). Нас особенно будут интересовать конечные области целостности. Теорема. Конечная область целостности является полем. Доказательство. Пусть R = ( R, +, ,0,1) - конечная область целостности. Нужно доказать, что любой ненулевой элемент обратим, то есть для каждого a 0 существует единственный x 0 такой, что ax = 1(в силу коммутативности достаточно найти правый обратный к a 0 ). Для произвольного a 0 определим отображение f a : R \ {0} → R \ {0} так, что f a ( x) ax (это отображение называют правым сдвигом на a ). Докажем, что это отображение инъективно. Пусть ax = ay . Тогда ax − ay = a( x − y) = 0 . Так как в области целостности нет делителей нуля и a 0 , то x − y = 0 , то есть x = y , что и доказывает инъективность отображения сдвига. Но, как было замечено ранее, инъекция конечного множества в себя является биекцией6, откуда следует, что для любого y 0 существует единственный x 0 такой, что ax = y (любой ненулевой элемент имеет единственный прообраз при отображении сдвига). В частности, при y = 1 получаем ax = 1. Но это и значит, что этот элемент x 0 будет обратным к произвольно взятому a 0 . Другими словами, обратный к заданному a 0 есть не что иное, как прообраз единицы при отображении правого сдвига на a . Теорема доказана. Замечание. Доказанную теорему можно обобщить, доказав, что любое конечное кольцо без делителей нуля (не обязательно коммутативное!) есть тело. Идея доказательства такая же, но нужно определять два отображения сдвига – правого и левого, которые уже не будут совпадать. Рекомендуется доказать это самостоятельно. Поля вычетов В кольце вычетов k = ({0,1,..., k −1}, k , k ,0,1) отсутствие делителей нуля равносильно условию простоты числа k . Действительно, если это число составное, то делителями нуля будут любые два числа (строго меньшие k ), произведение которых (в обычном умножении) делится на k . Так в кольце 21 делителями нуля будут 3 и 7, 6 и 7, 7 и 15, 3 и 14 и т. д. Если же k простое, то, как нетрудно показать, произведение двух чисел делится на k тогда и только тогда, когда хотя бы одно из них делится на k (доказать самостоятельно!). Но это значит, что ab = 0(mod k ) k | ab k | a k | b a = 0(mod k ) b = 0(mod k ) . Возникает, таким образом, обширный класс конечных полей – полей простому модулю p. Мультипликативная группа поля p p вычетов по называется мультипликативной группой вычетов по модулю p и обозначается * p . Некоторые из этих групп мы уже рассматривали. Заметим, что порядок всех групп вычетов (кроме тривиальной группы вычетов по модулю 2, состоящей из одной единицы) является четным числом p-1. Поля вычетов не исчерпывают многообразие всех конечных полей, которые определенным образом строятся как расширения полей вычетов7. Конечные поля называются полями Галуа (в честь гениального французского математика Эвариста Галуа https://ru.wikipedia.org/wiki/Галуа,_Эварист) Поля Галуа имеют существенные приложения в теории кодирования и разработке алгоритмов защиты информации. 6 7 См. Учебник, теорема 1.8, с. 86. Простые примеры расширения полей рассмотрены в Дополнениях. В конечных полях можно делать всё то же, что мы привыкли делать в поле действительных (или комплексных) чисел. В частности, на них распространяется вся теория и практика решения систем линейных уравнений (включая теорию определителей). Нужно только не забывать, что все арифметические действия следует выполнять по соответствующему простому модулю p, оставляя в качестве результата остаток от деления на p. Замечание. То, что мультипликативная группа вычетов (по простому модулю) является мультипликативной группой соответствующего поля, позволяет упростить вычисления в самой группе, переходя, например, к противоположному числу при возведении исходного числа в какую-то степень. * Решим уравнение 7−1998 x 5115 = 2121 в группе Z 23 . Так как группа коммутативна, можно, конечно, это уравнение вида axb = c свести к уравнению вида ax = b , переставив все коэффициенты слева от неизвестного. Но можно решать, используя формулу x = a−1cb−1 . Тогда надо получить значения всех коэффициентов. При вычислении надо твердо помнить, что показатели степеней следует брать по модулю порядка группы, равного 22, а все вычисления проводить по модулю 23. Имеем: a−1 = 71998 = 71998mod22 = 718 = 7−4 = (74 )−1 = (32 )−1 = 9−1 . Позже мы выведем формулу для вычисления мультипликативного обратного в любом поле вычетов, а сейчас заметим, что 9 5 = −1(mod 23) . Значит, 9−1 = −5 = 18 . Итак, a−1 = 18 = −5 . Далее: c = 2121 = (−2)−1 = −12 = 11 , b−1 = 5−115 = 5−110−5 = 5−5 = (55 )−1 = (54 5)−1 = (22 5)−1 = (−3)−1 = −8 = 15 . Решение: x = 18 1115 = (−5) 11 (−8) = (−6) 11 = 3 . Использовалась записанная ранее формула (лекция №7) для вычисления степеней в конечных группах: an = an −|G| , n . Лекция №9 11.10.24 6. Полукольца Полукольцо – это алгебра того же типа (2, 2, 0, 0) и с теми же названиями операций, что и кольцо, свойства которых устанавливают следующие основные тождества (аксиомы): 1) a + (b + c) = (a + b) + c (сложение полукольца ассоциативно), 2) a + b = b + a (сложение полукольца коммутативно), 3) a + 0 = a (нуль есть нейтральный элемент по сложению), 4) a (b c) = (a b) c (умножение полукольца ассоциативно), 5) a 1 = 1 a = a (единица есть нейтральный элемент по умножению), a(b + c) = ab + ac; 6) (умножение дистрибутивно относительно сложения как слева, (b + c)a = ba + ca так и справа), 7) a 0 = 0 a = 0 (аннулирующее свойство нуля). В существенном отличии от кольца полукольцо по сложению есть только коммутативный моноид (нет противоположных элементов). Кроме этого, аннулирующее свойство нуля вводится по определению (как аксиома), и можно показать, что это свойство нельзя вывести из остальных аксиом. Важные частные случаи: 1) коммутативное полукольцо – это полукольцо с коммутативной операцией умножения; 2) идемпотентное полукольцо – это полукольцо, в котором операция сложения идемпотентна, то есть a + a = a для любого a . Этот класс полуколец особенно важен для нас. Более того, только такими полукольцами мы и будем заниматься. Примеры 1) Полукольцо неотрицательных целых чисел: ( 0 , +, ,0,1) . Это полукольцо коммутативно и не идемпотентно. 2) Полукольцо множеств: S M = (2M , , , , M ) . Это полукольцо коммутативно и идемпотентно. 3) Полукольцо бинарных отношений: Rl( M ) = (2 M M , , ,, ,id M ) . Это полукольцо не коммутативно и идемпотентно. 4) Полукольцо B = ({0,1}, +, ,0,1) , состоящее всего из двух элементов, операции которого определяются следующими таблицами: + 0 1 . 0 1 0 0 1 0 0 0 1 1 1 1 0 1 Это полукольцо коммутативно и идемпотентно. 5) Полукольцо R+ = ( + {+}, min, +, +,0) . Это полукольцо несколько необычно. Его носитель – множество всех неотрицательных действительных чисел, пополненное «плюс бесконечностью»; операция сложения – взятие числового минимума для произвольных двух чисел (например, min (5, 7)=5); операция умножения – обычное числовое сложение; «нуль», то есть нейтральный элемент по сложению - + (тем самым по определению принимается, что для любого элемента a этого полукольца, включая + , выполняется min(a, +) = a , то есть + является наибольшим элементом носителя данного полукольца в естественном числовом порядке); «единица» же этого полукольца есть число 0 – нейтральный элемент по числовому сложению). Полукольцо R+ коммутативно и идемпотентно. Полукольца примеров (4) и (5) очень важны в теории графов. 6) Полукольцо S[ a ,b ] = ([a, b], max, min, a, b) - полукольцо, носителем которого является отрезок [a, b] числовой прямой, операция сложения – наибольшее число из двух, операция умножения – наименьшее число из двух, «нуль» число a (левая граница отрезка), «единица» - число b (правая граница отрезка), Это полукольцо коммутативно и идемпотентно. 7) Полукольцо Dn = ( Div(n), НОК , НОД ,1, n) делителей натурального числа n с операциями НОК (сложения) и НОД (умножения), где «нуль» - число 1, «единица» - всё число n . Это полукольцо коммутативно и идемпотентно. Проверка аксиом полукольца во всех этих примерах не вызывает затруднений (с учетом известных свойств числовых операций, операций над множествами и отношениями. Подробный анализ свойств операций max и min содержится в конце текста семинара №4. А операции НОК и НОД, как можно показать, сводятся к операциям max и min (см. Учебник, пример 3.9, с. 195, а также пример 3.1, с. 167-168). Далее будут рассматриваться только идемпотентные полукольца. Поэтому всюду в дальнейшем термин «полукольцо» понимается как «идемпотентное полукольцо». Естественный порядок (идемпотентного) полукольца ab На носителе произвольного полукольца8 можно определить такое отношение: a + b = b . Легко проверяется, что это отношение порядка. Действительно: a + a = a a a , то есть отношение рефлексивно; a b, b a a + b = b, b + a = a = a + b a = b , то есть отношение антисимметрично; a b, b c a + b = b, b + c = c a + c = a + (b + c) = (a + b) + c = b + c = c a c , то есть отношение транзитивно. Получаем тем самым отношение порядка, которое называется естественным порядком данного полукольца. Посмотрим теперь, чем будет естественный порядок в полукольцах приведенных выше примеров (кроме первого – единственного среди них неидемпотентного полукольца). В полукольце множеств A B A B = B A B . Это значит, что в данном полукольце естественный порядок есть не что иное как отношение включения. Поскольку в полукольце бинарных отношений сложение есть тоже объединение множеств, то и в этом полукольце естественный порядок совпадает с включением. В полукольце B тривиально 0 < 1. 8 Подчеркнем еще раз, что везде далее полукольцо есть всегда идемпотентное полукольцо. + В полукольце R a R b min(a, b) = b b числ a . Это значит, что естественный + + порядок полукольца R является порядком, обратным (двойственным) естественному числовому. В полукольце S[ a ,b ] естественный порядок, очевидно, совпадает с естественным числовым, а в полукольце делителей есть отношение делимости (доказать самостоятельно). Так как 0 + a = a для любого a , то для любого a 0 a , то есть нуль полукольца оказывается наименьшим элементом по естественному порядку. Докажем теперь простой, но важный результат. Теорема. Сумма произвольного числа слагаемых в полукольце является точной n верхней гранью множества слагаемых: ak = sup{a1 ,..., ak } . k Доказательство. Рассмотрим сумму n n k k ai + ak = ai + (a1 + ... + ai + ... + an ) = a1 + ... + ai + ai + ... + an = a1 + ... + ai + ... + an = ak . Берем произвольно фиксированное i-е слагаемое и прибавляем к нему всю сумму. Дальнейшее следует из свойств ассоциативности, коммутативности и идемпотентности сложения. n n n k k k Итак, ai + ak = ak (i = 1,..., n)(ai ak ) , то есть сумма есть верхняя грань множества слагаемых. Докажем, что это точная верхняя грань. Пусть для некоторого b и любого i = 1,..., n выполняется ai b , то есть элемент b является какой-то верхней гранью множества n слагаемых. Тогда b + ak = b + (a1 + ... + an ) = b + a1 + ... + an = b + a2 + ... + an = ... = b + an = b , k то есть элемент b по очереди «съедает» (поглощает) все слагаемые и остается один. n Значит, сумма ak b , откуда и следует, что она есть точная верхняя грань k множества слагаемых. Теорема доказана. Следствие. В любом полукольце любое конечное множество имеет точную верхнюю грань, совпадающую с суммой его элементов. 7. Замкнутые полукольца Полукольцо называется замкнутым, если выполняются два условия: 1) любая последовательность имеет точную верхнюю грань по естественному порядку; 2) операция умножения непрерывна, то есть для любого элемента a и любой последовательности {bn }n 0 выполняются равенства a sup bn = sup(abn ),(sup bn )a = sup(bn a) . Из определения следует, что замкнутое полукольцо является индуктивно упорядоченным множеством (см. Лекцию №5). Это очень важный факт. Заметим, что в замкнутом полукольце любая (а не только неубывающая) последовательность имеет точную верхнюю грань. Замечание. Непрерывность умножения означает тогда непрерывность функций f ( x) = ax (умножение каждого x на фиксированный элемент a слева) и g ( x) = xa (умножение каждого x на фиксированный элемент a справа). Действительно, вспоминая определение непрерывного отображения индуктивно упорядоченного множества в себя, получим для первой функции f (sup xn ) = a sup xn = sup axn = sup f ( xn ) . Для второй функции – аналогично. Сразу отметим такой простой, но важный результат: Теорема. Любое конечное полукольцо замкнуто. Доказательство. В конечном полукольце любая последовательность {bn }n 0 имеет конечную область значений, и точная верхняя грань равна сумме элементов этой области значений. Непрерывность умножения тогда выражает обычное свойство дистрибутивности умножения относительно сложения: n n n n k =0 k =0 k =0 k =0 a bk = abk ,( bk )a = bk a . Можно показать, что все рассмотренные выше в примерах идемпотентные полукольца замкнуты. Подробнее см. Учебник, пример 3.5, с. 180-182. Понятие бесконечной суммы Под бесконечной суммой элементов a1 ,...an ,... замкнутого полукольца понимается точная верхняя грань последовательности {an }n0 , то есть, по определению an = sup an . n =0 Нижний предел суммирования может быть и больше нуля. Как правило, будем пользоваться обозначением an , полагая по умолчанию, что суммирование ведется от нуля до бесконечности. В случае, когда нижний предел отличен от нуля, будем это указывать. Рассмотрим здесь важнейшие свойства бесконечной суммы. Теорема 1. Для произвольных последовательностей { xn }n0 и { y n }n0 имеет место равенство ( xn + yn ) = xn + yn . Доказательство. Пусть a = x n + y n . Докажем, что элемент a есть точная верхняя грань последовательности {x n + y n }. Имеем: для любого n N вычислим a + xn + yn = xn + yn + xn + yn = xn + yn = a . Если верхняя грань указанной последовательности, то b b + a = b + xn + yn = b, так как для любого n N b x n + y n x n , y n (конечная сумма есть, как известно, точная верхняя грань множества слагаемых), т.е. элемент b является верхней гранью каждой из рассматриваемых двух последовательностей и, следовательно, не меньше точных верхних граней этих последовательностей, которые в указанной выше сумме поглощаются по очереди. Итак, b + a = b и a b , откуда a = (x + y ) n n Из доказанной теоремы вытекает важное свойство непрерывности операции сложения в замкнутом полукольце, а именно имеет место Следствие 1. Для любых последовательности { xn }n0 и элемента a замкнутого полукольца выполняется ( xn + a) = (a + xn ) =a + xn = ( xn ) + a . Доказательство. Частный случай утверждения теоремы 1, последовательность постоянна, то есть при y n = a для каждого n . когда вторая Итак, за бесконечную сумму можно выносить произвольное слагаемое, как и наоборот: вносить отдельное слагаемое в бесконечную сумму. Это и выражает свойство непрерывности операции сложения, то есть непрерывности функции f ( x) = a + x . Напомним, что операция умножения в замкнутом полукольце непрерывна по определению, то есть для последовательности { xn }n0 и элемента a замкнутого полукольца выполняется axn = a xn и xn a = ( xn )a . Это не что иное, как бесконечный аналог свойства дистрибутивности умножения относительно сложения. Следующее свойство бесконечной суммы связано с понятием частичной суммы последовательности. Положим для последовательности {x n }n0 k sk = x i k0 при и назовем это k-ой частичной i=0 последовательности {x n }n0 . Так как последовательность неубывающей, то k =0 k = m1 суммой {sk }k 0 является sk = sk для любого m . Теорема 2. Точная верхняя грань (бесконечная сумма) любой последовательности равна точной верхней грани последовательности ее частичных сумм, то есть x n = sn . Доказательство. Для произвольного неотрицательного k имеем: xk + sn = xk + sn = ( xk + sn ) = ( xk + x1 + ... + xk + ... + xk + m ) = n k nk m0 = ( x1 + ... + xk + ... + xk + m ) = sn = sn m0 nk (Использованы свойства коммутативности и идемпотентности операции сложения в полукольце.) Это значит, что точная верхняя грань последовательности частичных сумм есть верхняя грань последовательности {x n }n0 . Для произвольной верхней грани этой b последовательности аналогично предыдущему (доказательство теоремы 1), с учетом того, что для любого k b + sn = b + sn = b + ( x1 +...+ x n ) =b , b + xk = b откуда и следует доказываемое. 8. Решение линейных уравнений и систем линейных уравнений в замкнутом полукольце Линейные уравнения В замкнутом полукольце можно решать линейные уравнения вида x = ax + b (1) или x = xa + b (2) Уравнение (1) называют праволинейным, а уравнение (2) – леволинейным. получим: Подчеркнем, что в существенном отличии от колец тут невозможен никакой перенос слагаемых из одной части уравнения (или равенства) в другую. Выведем формулу для решения праволинейного уравнения. Это основной вид линейных уравнений в полукольцах, который мы только и будем изучать. Прежде всего заметим, что правая часть уравнения (1) непрерывна, так как умножение непрерывно по определению, а непрерывность сложения была доказана в лекции №9. Тогда, полагая f ( x) = ax + b , применяем формулу для наименьшего решения уравнения (1): x = sup{ f n (0)} = sup{0, f (0) = b, f ( f (0) = f 2 (0) = ab + b = (1 + a)b, f 3 (0) = a(ab + b) + b = (1 + a + a 2 )b,..., f n (0) = (1 + a + a 2 + ... + a n−1 )b,...} Отбрасывая 0, запишем это в виде бесконечной суммы: n =1 n =0 x = (1 + a + a 2 + ... + a n−1 )b = (1 + a + a 2 + ... + a n )b . Используя непрерывность умножения, выносим множитель b за знак бесконечной суммы (справа) и получаем x = (1 + a + a 2 + ... + a n )b n =0 n Под знаком бесконечной суммы стоит частичная сумма последовательности {a }n0 степеней элемента a . Согласно одному из свойств бесконечной суммы, n =0 n =0 (1 + a + a 2 + ... + a n ) = a n (точная верхняя грань последовательности совпадает с точной верхней гранью последовательности ее частичных сумм). Итак, получаем формулу для наименьшего решения уравнения (1): x = ( a n )b . n =0 Точная верхняя грань последовательности степеней элемента a называется итерацией (или замыканием элемента a ) и обозначается a * . Окончательно тогда формула для наименьшего решения уравнения (1) примет вид: x = a *b (3) Для леволинейного уравнения (2) аналогично может быть получена формула x = ba * . Формула (3) принимает совсем простой вид в полукольцах с тривиальной итерацией, то есть в таких, в которых итерация каждого элемента равна единице полукольца. Тогда наименьшее решение как праволинейного, так и леволинейного уравнения совпадет со свободным членом уравнения: x = b . Дополнения 1)Проверка аксиом для кольца вычетов (лекция №8) Покажем для примера доказательство ассоциативности операции сложения по модулю k. Обозначим mod( m, k ) остаток от деления m на k , а [ m]k - наибольшее целое, не превосходящее k и делящееся на k . Ясно, что mod( m, k ) = m − [ m]k По определению m k n mod(m + n, k ) . Имеем: m k (n k p) = mod(m + mod(n + p, k ), k ) = = mod(m + n + p − [n + p]k , k ) = mod(m + n + p, k ). (так как [ n + p ]k = 0 (mod k ) . Поскольку операция k , как очевидно, коммутативна, то (m k n) k p = p k (m k n) = mod( p + m + n, k ) = mod(m + n + p, k ). Аксиомы 5 и 7 проверяются аналогично, а проверка остальных тривиальна. 2) Кольцо многочленов над полем Пусть K - некоторое поле. Многочлен над полем K - это формальная конечная сумма вида P ( n ) ( x) = a0 + a1x + a2 x 2 + ... + an x n , n 0,(k {0,1,2,...n})(ak K ) . где x - формальная переменная. Часто считают, что эта переменная принимает значение в поле K , и тогда, придавая этой переменной то или иное значение и считая, что записанная выше сумма есть выражение, использующее операции поля K , можно придать многочлену функциональный смысл: он определяет некоторое отображение носителя поля в себя. Можно также видеть, что многочлен P ( n ) ( x) полностью определяется кортежем коэффициентов (a0 , a1 , a2 ..., an ) . Удобнее, однако, рассматривать такой кортеж как финитную последовательность, то есть такую бесконечную последовательность, у которой все члены, начиная с некоторого номера, равны нулю. Наибольший номер отличного от нуля члена называется степенью многочлена. При этом последовательность, состоящая из одних нулей, определяется как многочлен степени − . Последовательность, у которой только первый член отличен от нуля, определяет многочлен степени 0, который можно отождествить с элементом исходного поля. Рассмотрим теперь операции над многочленами. 1) Сложение Многочлены как финитные последовательности складываются почленно: (a0 , a1 ,..., an ,0,0,...) + (b0 , b1 ,..., bn , bn+1,..., bm ,0,0,...) (a0 + b0 , a1 + b1 ,..., an + bn ,0 + bn+1 ,...,0 + bm ,0,0,...) = = (a0 + b0 , a1 + b1 ,..., an + bn , bn+1 ,..., bm ,0,0,...); n m в предположении, что степень первого многочлена равна n, второго – m. Тогда понятно, что степень суммы равна наибольшей из степеней слагаемых. С функциональной точки зрения, здесь просто складываются две суммы, определяющие некоторые элементы базового поля: n m m a x + b x = (a + b ) x (a k k =0 k k k =0 k k k =0 k k n +1 = ... = am = 0); n m . 2) Умножение Член ck произведения двух финитных последовательностей указанного выше вида определяется формулой: k ck = a0bk + a1bk −1 + ... + ak b0 = aibk −i i =0 (сумма индексов в каждом слагаемом равна k). Опять-таки с функциональной точки зрения перемножаются две суммы (раскрываются скобки), как в обычной школьной алгебре: (a0 + a1 x + ... + an x n )(b0 + b1 x + ... + bm x m ) = = a0b0 + (a0b1 + a1b0 ) x + (a0b2 + a1b1 + a2b0 ) x 2 + ... + +(a0bk + a1bk −1 + ... + ak b0 ) x k + ... + anbm x n+m . Очевидно, что степень произведения равна сумме степеней сомножителей. Обозначим через K[ x] множество многочленов над полем K с переменной x . Тогда можно доказать такую теорему: Теорема. Алгебра K[ x] = ( K[ x], +, ,0,1) , где сложение и умножение определены выше, 0 и 1 суть нуль и единица поля K 9, является областью целостности. Рекомендуется доказать это самостоятельно. Замечание. Утверждение теоремы остается истинным, если вместо базового поля рассматривать любую область целостности. 3)Примеры расширений полей Задача. Является ли полем множество чисел вида x + y 2 , где x, y (рациональные числа) с обычными операциями сложения и умножения. Решение Свойства числовых операций проверять не нужно: они известны. Здесь нужно убедиться в том, что определенное в условии задачи множество M = {x + y 2 : x, y } замкнуто относительно операций сложения и умножения, то есть сумма и произведение двух чисел из M принадлежит M . Это легко проверить: (a + b 2) + (c + d 2) = (a + c) + (b + d ) 2 M ; (a + b 2)(c + d 2) = (ac + 2bd ) + (ad + bc) 2 M Кроме этого, нейтральные элементы 0 и 1 представляются как числа из этого же множества M : 0 = 0 + 0 2,1 = 1 + 0 2 . Множество M можно уподобить множеству комплексных чисел, у которых есть действительная и мнимая части. Здесь же мы можем говорить о рациональной и иррациональной части. Итак, мы имеем числовую алгебру M = (M , +, ,0,1) , которая, очевидно, является кольцом и подалгеброй поля действительных чисел. Чтобы ответить на вопрос, является ли это кольцо полем, нужно проверить обратимость по умножению произвольного ненулевого числа из множества M . Имеем: Точнее, нуль кольца многочленов есть нулевая последовательность, а единица – последовательность (1, 0, 0,…). 9 (a + b 2) −1 = 1 a −b 2 2 = 2 , a + b2 0 2 a + b 2 a − 2b . Знаменатель этой дроби не может оказаться равным нулю, так как тогда мы получили a = 2 бы, что b , но отношение рациональных чисел не может быть иррациональным числом. Итак, любой ненулевой элемент множества M обратим по умножению, и (a + b 2) −1 = a b − 2 2 a − 2b a − 2b 2 2 2 M , a 2 + b2 0 , так как обе дроби в написанной выше формуле являются рациональными числами (что совершенно очевидно). Итак, алгебра M = (M , +, ,0,1) есть поле. Оно является расширением поля рациональных чисел (то есть содержит последнее в качестве подполя). Это расширение поля рациональных чисел можно рассматривать как полученное путем добавления к этому полю корня уравнения x − 2 = 0 , не имеющего решения в поле рациональных чисел. 2 В сущности, также строится поле комплексных чисел: множество действительных чисел расширяется путем добавления к нему корня уравнения x + 1 = 0 , 2 обозначаемого i , и рассматриваются все линейные комбинации вида a + bi; a, b . То же самое поле (точнее, поле изоморфное10 полю комплексных чисел), мы получим, рассматривая в кольце многочленов над полем действительных чисел множество остатков от деления на многочлен x + 1. 2 Можно доказать, что множество остатков от деления на многочлен x + x + 1 (не имеющий действительных корней) также образует поле. Это поле уже не будет изоморфно полю комплексных чисел (см. Учебник, задача 2.14). 2 Операции сложения и умножения проводятся в этих случаях по модулям соответствующих многочленов. Поле рациональных чисел можно расширить, добавляя корень уравнения x − 2 = 0 , 3 то есть элемент = 2 . Но в этом случае, поскольку элемент = 4 также иррационален, элементами нового поля будут линейные комбинации вида a + b + c 2 ; a, b, c . Доказательство того, что они образуют поле аналогично 3 2 3 решению рассмотренной выше задачи, но, конечно, сложнее. Так, обратный к заданному, отличному от нуля, элементу, некий элемент a '+ b ' + c ' с неизвестными рациональными коэффициентами находится из условия 2 10 О гомоморфизмах и изоморфизмах см. Учебник, 2.8, 2.9, 4.3 и 4.4. (a '+ b ' + c ' 2 )(a + b + c 2 ) = 1 . Раскрывая скобки (с учетом того, что 3 = 2 ) и приравнивая коэффициенты при одинаковых степенях , получим систему относительно неизвестных a ', b ', c ' : aa '+ 2cb '+ 2bc ' = 1 ba '+ ab '+ 2cc ' = 0 ca '+ bb '+ ac ' = 0 Можно доказать, что главный определитель этой системы при рациональных a, b, c отличен от нуля, то есть система имеет единственное решение, что и позволяет определить элемент поля, обратный данному. В заключение простой пример конечного поля, построенного как расширение поля вычетов по модулю 3, то есть поля 3 (состоящего всего из трех элементов). Легко проверить, что в этом поле уравнение x + 1 = 0 не имеет решений. Введем новый 2 элемент = −1 (наподобие обычной мнимой единицы). Тогда элементами нового поля будут все линейные комбинации вида a + b ; a, b 3 . Все операции выполняются с учетом того, что = −1 и, конечно, в арифметике остатков от деления 2 на 3. Например, (1 + )(1 + 2 ) = (1 + )(1 − ) = 1 − = 2 = −1 . Число элементов в этом 2 поле равно, очевидно, 9=32. Это простой пример поля Галуа, являющегося расширением поля 3 . Одним из важных результатов алгебраической теории полей является то, что для любых простого числа p и натурального n может быть построено поле Галуа, состоящее из p n элементов, которое можно рассматривать как расширение поля вычетов по n модулю p . Такое поле обозначается GF ( p ) . Рассмотренное только что поле есть 2 поле GF (3 ) . Лекция №4 20.09.24 6. Отношения порядка и упорядоченные множества Определение и примеры Упорядоченная пара A = ( A, ) , где A - непустое множество, называемое носителем, а - некоторое отношение порядка на носителе, называется упорядоченным множеством. Примеры 1) ( , ) - множество действительных чисел с обычным отношением порядка («меньше или равно»), которое называется естественным числовым порядком. 2) (2M , ) - булеан некоторого (возможно, даже пустого) множества M с отношением включения. 3) Рассмотрим отношение делимости на множестве целых чисел: x | y (x делит y). Это отношение рефлексивно (каждое число делит само себя) и транзитивно, так как x | y, y | z y = kx, z = my(k , m ) z = mkx x | z . Но это отношение не антисимметрично, так как x | y, y | x x = y . То есть отношение делимости на множестве целых чисел есть только предпорядок. Если же ограничиться неотрицательными целыми числами, то отношение делимости становится порядком. Из этого примера видно также, что на одном и том же носителе можно определять разные отношения порядка и получать тем самым разные упорядоченные множества: на множестве 0 неотрицательных целых чисел можно задать естественный числовой порядок и отношение делимости; получим два разных упорядоченных множества: ( 0 , ) и ( 0 ,|) . Отношения, связанные с исходным порядком 1) Строгий порядок: x y ( x y) &( x y) ; это отношение иррефлексивно, антисимметрично и транзитивно. 2) Двойственный порядок – порядок, обратный исходному (легко показать, что отношение, обратное отношению порядка, также является отношением порядка). 3) Индуцированный порядок: если A = ( A, ) упорядоченное множество, а B A подмножество носителя, то можно определить отношение порядка на подмножестве B как ограничение исходного порядка на данное подмножество: x B y x y; x, y B . Этот порядок называют порядком на подмножестве B , индуцированным исходным порядком на всем множестве A . В сущности, это то же самое отношение порядка, но сравниваются только элементы выбранного подмножества. Для индуцированного порядка обычно используют то же обозначение, что и для исходного. 4) Доминирование: говорят, что элемент y упорядоченного множества доминирует над элементом x того же множества, если x y и не существует такого z , что x z y . Будем обозначать это так: x y . Например, для целых чисел можно написать (x)( x x + 1) . Но для естественного числового порядка на множестве рациональных (и, тем более, всех действительных) чисел отношение доминирования пусто, так как для любых таких двух чисел p q существует «промежуточное» число r такое, что p r q (свойство плотности рациональной и действительной прямой). Доминирующий элемент – ближайший больший, и он не всегда существует. 5) Несравнимость: говорят, что элементы x и y упорядоченного множества несравнимы, если неверно, что x y , а также неверно и обратное: y x . Будем обозначать это так: x y. Отношение порядка, в котором нет несравнимых элементов, называется линейным. Естественный числовой порядок линеен, а порядок, определяемый отношением включения (множеств) или определяемый делимостью, не является линейным. Наименьший (наибольший) и минимальный (максимальный) элементы Элемент a A упорядоченного множества A = ( A, ) называется наименьшим (соответственно, наибольшим) элементом данного множества, если (x A)(a x) (соответственно, (x A)(a x) ). Такие элементы упорядоченного множества существуют не всегда. Например, множество неотрицательных целых чисел имеет наименьший элемент (0), но не имеет наибольшего. Множество всех целых чисел не имеет ни наименьшего, ни наибольшего элемента. Интервал на числовой прямой не имеет ни наименьшего, ни наибольшего элемента, а отрезок имеет и тот, и другой. Имеет место следующая Теорема. Если упорядоченное множество имеет наименьший (наибольший) элемент, то он единственный. Доказательство. Пусть a, a ' A два наименьших элемента упорядоченного множества A = ( A, ) . Тогда a a ' , так как a наименьший, и a ' a , так как a ' наименьший. Отсюда, в силу антисимметричности отношения порядка, a ' = a , что и означает единственность наименьшего элемента. Единственность наибольшего элемента доказывается точно так же. Можно заметить, что определение наибольшего элемента получается из определения наименьшего заменой обозначения исходного порядка ( ) обозначением двойственного (обратного) порядка ( ). Как говорят, второе определение двойственно исходному (или «двойственным образом определяется»). В теории упорядоченных множеств имеет место следующий принцип: Принцип двойственности: 1) если в определении, касающемся упорядоченного множества, всюду заменить обозначение исходного порядка обозначением двойственного порядка и наоборот, то получим определение, которое называют двойственным к исходному; 2) любое утверждение, доказанное для упорядоченного множества, остается справедливым, если в нем произвести указанную выше взаимную замену. Строгое доказательство второго утверждения дается в математической логике. Понятно, что двойственное к двойственному есть исходное по той простой причине, что отношение, обратное к обратному, есть исходное. Можно говорить, следовательно, о взаимно двойственных определениях (например, определения наименьшего и наибольшего элемента) или утверждениях (например, в записанной выше теореме). От наименьшего (наибольшего) элемента следует отличать минимальный (максимальный) элемент. Элемент a A упорядоченного множества A = ( A, ) называется минимальным (максимальным) элементом данного множества, если (x A)(a x a x) (соответственно, (x A)(a x a x) ). Таким образом минимальный (максимальный) элемент либо меньше (больше) остальных, либо не сравним с ними. И минимальных (максимальных) элементов может быть много (и даже бесконечно много). Например, на множестве собственных (строгих) делителей числа 36 (то есть делителей, отличных от самого числа и единицы: 2, 3, 4, 6, ,9, 12, 18), упорядоченных отношением делимости, 2 и 3 будут минимальными, а 12 и 18 – максимальными элементами. Далее, на множестве точек плоскости 2 определим отношение (a, b) (c, d ) (a b, c d ) . Легко проверить, что это отношение порядка, в котором точки сравниваются покоординатно: абсцисса первой точки не больше абсциссы второй и, соответственно, ордината первой точки не больше ординаты второй. Но тогда, например, точки (1, 2) и (2, 1) окажутся несравнимыми. Теперь, если взять произвольную точку M = (a, b) и провести через нее две перпендикулярные прямые, параллельные осям координат, то в пределах прямого угла, который левее и ниже точки будут все точки, меньшие данной, в пределах прямого угла, который правее и выше точки будут все точки, больше данной, а в пределах двух других вертикальных прямых углов (левее – выше и правее-ниже) – все точки, не сравнимые с данной. Тогда для множества точек B = {( x, y) : x + y 1} (с индуцированным порядком), то есть для всех точек, расположенных не выше прямой x + y = 1, все точки на этой прямой будут максимальными элементами множества B (и не будет ни одного наибольшего), а для множества B1 = {( x, y) : x + y 1} точки этой же прямой будут минимальными элементами (и не будет ни одного наименьшего). Диаграммы Хассе. Верхние и нижние грани Пусть снова A = ( A, ) упорядоченное множество, а B A - подмножество носителя. Элемент a A называется верхней (нижней) гранью подмножества B A , если (b B)(b a) (соответственно, (b B)(b a) ). Множество всех верхних граней подмножества B A называется верхним конусом этого подмножества и обозначается B . Двойственно определяется нижний конус как множество всех нижних граней. Обозначение: B . Следует заметить, что подмножество может не иметь верхних, или нижних, граней, и даже ни тех и ни других. Например, рассмотренное выше множество точек плоскости, лежащих не выше (или не ниже) прямой x + y = 1. Такие множества можно назвать неограниченными. Ясно, что неограниченными будут множества всех действительных, рациональных и целых чисел (если не включать в них бесконечно удаленные точки ). Если множество имеет хотя бы одну верхнюю (нижнюю) грань, оно называется ограниченным сверху (снизу). Например, множество натуральных чисел ограничено снизу (и не ограничено сверху). Точная верхняя (точная нижняя) грань Если верхний конус ограниченного сверху подмножества B A имеет наименьший элемент, то он называется точной верхней гранью этого подмножества и обозначается sup B (supremum). Двойственным образом определяется точная нижняя грань (как наибольший элемент нижнего конуса). Обозначение: inf B (infimum). Поскольку наименьший (или наибольший) элемент множества существует не всегда, то и точные грани тоже не всегда существуют. Нижний конус для B – все точки 3-го квадранта (включая начало координат), верхний конус – все точки четверть-плоскости с вершиной в точке β правее и выше. Точная верхняя (нижняя) грань последовательности Пусть дана некоторая последовательность a1 , a2 ,..., an ,... элементов какого-то упорядоченного множества. Тогда ее точной верхней (нижней) гранью считается точная верхняя (нижняя) грань области значений этой последовательности как функции натуральной переменной. Обозначение: sup an (inf an ) . Цепи и антицепи Цепь в упорядоченном множестве – любое линейно упорядоченное подмножество. Максимальная цепь – цепь, максимальная по включению, то есть не являющаяся собственным подмножеством никакой другой цепи. Например, на множестве точек плоскости с покоординтным порядком множество точек, лежащих на любой прямой с положительным тангенсом угла наклона, а также на любой прямой, параллельной какой-либо оси координат, образует максимальную цепь. Антицепь в упорядоченном множестве – любое подмножество попарно не сравнимых элементов. Максимальная антицепь – антицепь, максимальная по включению, то есть не являющаяся собственным подмножеством никакой другой антицепи. Например, на множестве точек плоскости с покоординтным порядком множество точек, лежащих на любой прямой с отрицательным тангенсом угла наклона, образует максимальную антицепь. Заметим, что одноэлементное подмножество будет цепью и антицепью одновременно. Понятно также, что в линейно упорядоченном множестве никаких антицепей, кроме одноэлементных, не может быть. Лекция №5 25.09.24 7. Индуктивно упорядоченные множества. Теорема о неподвижной точке Индуктивно упорядоченное множество Упорядоченное множество A = ( A, ) называется упорядоченным (или индуктивным упорядоченным), если индуктивно 1) оно имеет наименьший элемент и 2) любая неубывающая последовательность его элементов имеет точную верхнюю грань. В дальнейшем используется аббревиатура ИУМ. Рассмотрим некоторые примеры 1) Отрезок числовой прямой с естественным числовым порядком: ([a, b], ) . В данном случае наименьший элемент – число a (левая граница отрезка), а существование точной верхней грани у любой неубывающей последовательности вытекает из известной теоремы Вейерштрасса, согласно которой любая неубывающая и ограниченная сверху числовая последовательность имеет предел, который в данном случае и оказывается точной верхней гранью последовательности. 2) Множество всех подмножеств произвольного множества M отношением M включения: (2 , ) Здесь наименьший элемент – пустое множество, а точная верхняя грань произвольной последовательности определяется как sup An = An = {x : (n)( x An )} 1. n =0 Рассмотрим это подробнее. Здесь уместно и важно показать, как доказывается, что элемент упорядоченного множества является точной верхней гранью последовательности (или подмножества). Сначала доказывается, что это просто верхняя грань. В данном случае это легко усматривается из того, что если элемент x An для некоторого n , то, просто 1 О бесконечных объединениях и пересечениях см. Учебник, п. 1.5. в силу определения бесконечного объединения множеств, x An . n =0 Следовательно, это объединение есть верхняя грань последовательности. Теперь пусть множество B является произвольной верхней гранью рассматриваемой последовательности, то есть для каждого n 0 имеет место включение An B . Тогда, если x x An , и, следовательно, x B , то есть n =0 An , то для некоторого n 0 An B , откуда следует, что n =0 данное объединение всех членов последовательности будет наименьшим по включению множеством, содержащем все члены последовательности, то есть будет точной верхней гранью последовательности. Еще раз обратим внимание на то, что этот супремум определен для любой последовательности множеств, а не только для неубывающей. 3) Множество неотрицательных целых чисел с отношением делимости: ( 0 ,|) , где по определению a | b b = ka, k 0 . Любая конечная монотонно возрастающая последовательность имеет, очевидно, супремум в виде наибольшего (по делимости) числа этой последовательности. Если же взять монотонно возрастающую бесконечную a | a | ...| a | a | ... последовательность 0 1 , то единственное число, которое n n +1 делится на все члены этой последовательности, будет равно нулю, то есть sup an = 0 . Отсюда же следует, что упорядоченное множество ( ,|) , носитель которого не содержит нуля, уже не будет ИУМ. Наименьший элемент, очевидно, единица. Этот пример несколько парадоксален, но поучителен. Заметим, что в конечном упорядоченном множестве любая цепь имеет наибольший элемент, который будет ее точной верхней гранью. Поэтому, конечное упорядоченное множество будет индуктивным, если оно имеет наименьший элемент. Докажем теперь некоторые утверждения об индуктивно упорядоченных множествах. Лемма 1. Если у произвольной неубывающей последовательности элементов ИУМ отбросить любое конечное число начальных членов, то ее точная верхняя грань не изменится. Доказательство. Пусть A = ( A, ) - ИУМ и пусть {an }n0 неубывающая последовательность его элементов. Для некоторого k 0 рассмотрим подпоследовательность {an }nk 0 , убрав тем самым первые k − 1 членов последовательности. Докажем, что a sup n0 an = sup nk an . То, что элемент a является просто верхней гранью «усеченной» последовательности, очевидно. Допустим, что b есть верхняя грань подпоследовательности {an }nk 0 . Тогда для любого n k an b , но поскольку последовательность {an }n0 не убывает, то a0 a1 ... ak −1 ak b , то есть элемент b является верхней гранью всей последовательности {an }n0 , откуда a b и a = sup n k an . Утверждение леммы аналогично известной теореме математического анализа, согласно которой предел сходящейся последовательности не изменится, если у последовательности отбросить произвольное число первых членов. Но никогда нельзя забывать, что понятия точной верхней грани неубывающей последовательности ИУМ и понятие предела числовой последовательности – совсем разные вещи. Отображение f : A → B (произвольного) упорядоченного множества A = ( A, ) в упорядоченное множество B = ( B, ) называется монотонным, если (x, y A)( x y f ( x) f ( y )) . В условиях предыдущего определения, если множества являются индуктивно упорядоченными, то отображение f : A → B называется непрерывным, если для любой неубывающей последовательности { xn }n0 последовательность { f ( xn )}n0 образов имеет точную верхнюю грань, причем f (sup xn ) = sup f ( xn ) . Заметим, что в этом определении априори не предполагается, что последовательность образов не убывает. Теорема 1. Всякое непрерывное отображение одного ИУМ в другое монотонно. Доказательство. Пусть x y; x, y A (в условиях данных выше определений). Рассмотрим последовательность x, y, y,..., y,... , в которой все элементы, начиная со второго, равны одному и тому же y . Тогда sup{ f ( x), f ( y), f ( y),..., f ( y),...) = sup{ f ( x), f ( y)} = f (sup{x, y}) = f ( y ) , в силу непрерывности отображения отображение монотонно. f , откуда f ( x) f ( y ) , то есть Отсюда и следует, что последовательность образов неубывающей последовательности тоже будет неубывающей (для непрерывного отображения). Из теоремы 1 вытекает также, что понятия непрерывности отображений ИУМ и непрерывности в классическом анализе далеко не тождественны, хотя определенное сходство между этими типами непрерывности и есть. Замечание. В конечном случае, как можно доказать, монотонность равносильна непрерывности, но в общем случае монотонное отображение может не быть непрерывным (см. Учебник, пример 1.19). Основной, и важнейший для приложений, результат теории индуктивно упорядоченных множеств, есть теорема о наименьшей неподвижной точке: Теорема 2. Всякое непрерывное отображение ИУМ в себя имеет наименьшую неподвижную точку. Доказательство. Пусть A = ( A, ) - ИУМ, и f : A → A - непрерывное отображение. Обозначим через наименьший элемент множества A . Построим последовательность , f (), f ( f ()),..., f n (),... , n −1 где f ( x) = f ( f ( x)), n 1; f ( x) = x - результат n-кратного применения функции f к элементу x . n 0 Докажем, что эта последовательность не убывает. Так как наименьший элемент, то f () . Если для любого k n 0 k −1 () f k () , то в силу монотонности непрерывного f получим отображения при k =n f ( f n−1 ()) = f n () f ( f n ()) = f n+1 () , предположить, что f n 0 имеет место откуда, в силу принципа индукции, для любого f () f n n +1 ( ) , что и означает неубывание последовательности { f ()}n0 . n Тогда эта последовательность имеет точную верхнюю грань. Положим a = sup n0 f () . n Докажем, что f (a) = a . Имеем: f (a) = f (supn0 f n ()) = sup n0 f ( f n ()) = sup n0 f n+1 () = = sup{ f (), f 2 (),..., f n (),...} = sup n1 f n () = a На втором шаге этой цепочки используется непрерывность отображения f , а не последнем – лемма 1: вычисляется супремум последовательности, полученной из исходной отбрасыванием нулевого члена. Итак, доказано существование неподвижной точки отображения f . Докажем теперь, что это именно наименьшая неподвижная точка. Пусть для какого-то b A выполняется f (b) = b . Так как b , то в силу монотонности любого непрерывного отображения f () f (b) = b, f ( f ()) f ( f (b)) = b,..., f n () b для любого n 0 , и, тем самым, элемент b A является верхней гранью исходной последовательности, откуда a = sup n0 f () b . n Теорема полностью доказана. Ее доказательство конструктивно, так как дает формулу вычисления наименьшей неподвижной точки любого непрерывного отображения ИУМ в себя. Теорему о наименьшей неподвижной точке можно трактовать, как утверждение о существовании наименьшего решения уравнения x = f ( x) в произвольном ИУМ. Это важно с точки зрения приложений этой теоремы в теории полуколец и основанных на ней методах анализа графов и автоматов. Рассмотрим в этой связи такой пример. В ИУМ всех подмножеств произвольного множества M (см. пример 2 выше) решим уравнение X = (A X ) B относительно неизвестного множества X . Можно доказать, что правая часть этого уравнения f ( X ) = ( A X ) B непрерывна (это доказывается в теории полуколец). Вычисляем последовательные приближения к решению: f () = B, f ( B) = ( A B) B = B , то есть для любого n 1 f n () = B . Это и есть наименьшее решение уравнения. Интересно показать попутно анализ этого уравнения независимым от теоремы о неподвижной точке методом. Рассматриваемое уравнение можно трактовать, как утверждение о равенстве двух множеств. Используя известный критерий равенства множеств, состоящий в том, что множества равны тогда и только тогда, когда их симметрическая разность пуста, получим: X (( A X ) B) = , откуда X (( A X ) B) = , X (( A X ) B) = . Преобразуем 1-е пересечение: X (( A X ) B ) = X ( A X ) B = X A B = X A B = , откуда X A B . Далее: X (( A X ) B) = X B = , откуда B X . Итак, B X A B . Это значит, что любое множество X, удовлетворяющее такому условию (и только такое), будет решением исходного уравнения, а X = B есть решение наименьшее. Лекция №6 27.09.24 II. Элементы общей алгебры 1. Основные понятия Понятие операции Отображение вида : An → A, n 0 называется n - арной операцией на множестве A . Это множество предполагается непустым. Здесь важно понимать следующее: 1) операция определена на любом кортеже (a1 ,..., an ) An и 2) принимает значение, элемент b (a1 ,..., an ) , также принадлежащий тому же множеству A . Если хотя бы одно из этих условий не выполняется, то это не операция в только что определённом смысле. Например, деление на множестве действительных чисел не есть операция (на ноль делить нельзя), матричные операции не являются операциями, так как не любые две матрицы можно сложить и не любые две матрицы можно перемножить. Скалярное (и смешанное) умножение векторов не является операцией, так как аргументы (компоненты кортежа) – векторы, а значение (результат) – число. Обобщая данное выше определение, можно ввести понятие частичной операции (записанное выше отображение частично) и многосортной операции как отображения вида : A1 ... An → B, n 0 , то есть аргументы и результат принадлежат, вообще говоря, разным множествам (которые иногда называют типами или сортами). Можно, конечно, ввести понятие частичной многосортной операции. Эти обобщения понятия операции мы в нашем курсе не рассматриваем. Рассмотрим теперь некоторые частные случаи операций в зависимости от значения числа n . 1) n = 0 Формально нульарная операция на множестве A есть отображение : A0 = {} → A; ( ) A . Результат ( ) есть какой-то элемент множества A (разные нульарные операции определят разные элементы множества A ). Поэтому обычно (и менее формально) нульарную операцию определяют как произвольно фиксированный элемент множества A . Иногда бывает необходимо фиксировать какие-то элементы множества, обладающие особыми свойствами. Например, число 0 при умножении на любое число дает 0, а при прибавлении нуля к любому числу это число не меняется; умножение на единицу также оставляет исходное число без изменений. n = 1 (унарные операции) Это переход к противоположному числу, возведение числа в фиксированную степень, дополнение множества, соответствие, обратное к данному соответствию. 3) n = 2 (бинарные операции) Это очень широкий класс операций, которыми мы и будем преимущественно заниматься. Это числовые операции сложения и умножения, сложение и векторное умножение векторов, сложение и умножение квадратных матриц одинакового порядка, операции над множествами (кроме дополнения), соответствиями (кроме диагонали – нульарной операции- и взятия обратного). 2) Операции более высоких «арностей» встречаются редко, и мы ими заниматься не будем. Понятие алгебраической структуры Неформально, алгебраическая структура есть множество (непустое) с некоторыми операциями на нем. Строго, алгебраическая структура есть упорядоченная пара A = ( A, ) , где A - непустое множество, называемое носителем, а - некоторое множество операций на носителе, называемое сигнатурой. Вместо термина «алгебраическая структура» обычно говорят просто «алгебра» (при том, что слово «алгебра» обозначает и всю науку, изучающую алгебраические структуры). Сигнатура разбивается на подмножества операций разных арностей: = (0) (1) (2) ... ( n) ... , где ( k ) (k = 0,1, 2,..., n,...) - подмножество операций арности k . Некоторые из этих множеств могут быть пустыми. Сигнатура может быть бесконечной (и даже несчетной), хотя дальше мы будем заниматься алгебрами с конечными сигнатурами. Примеры 1) Числовые алгебры R = ( , +, ,0,1) , Q = ( , +, ,0,1) , Z = ( , +, ,0,1) , R = ( , +, ,0,1) , N0 = ( 0 , +, ,0,1) - множества действительных, рациональных, целых и натуральных (неотрицательных целых) чисел с операциями сложения, умножения, а также нулем и единицей в качестве нульарных операций. 2) Векторные алгебры L = ( L, +, 0, | ) - векторное (линейное) пространство с операциями сложения векторов, нулевым вектором (нульарная операция) и бесконечным множеством унарных операций умножения вектора на действительное число . V = (V , +, , 0) - множество геометрических векторов с операциями сложения, векторного умножения и нулевым вектором (как нульарной операцией). 3) Матричные алгебры Mn = (M n , +, , O, E) - множество квадратных матриц n-го порядка со стандартными операциями сложения и умножения и нулевой и единичной матрицами (как нульарными операциями). 4) Алгебры множеств и отношений Set ( M ) = (2 M , , , \, , , , M ) - булеан (множество всех подмножеств) множества M с операциями объединения, пересечения, разности, симметрической разности, дополнения, пустым и универсальным, то есть всем множеством M как нульарными операциями. Rel( M ) = (2 M M , , , −1 , ,id M ) - множество всех бинарных отношений на множестве M с операциями объединения, композиции, взятия обратного, пустым отношением и диагональю как нульарными операциями. Типом алгебры с конечной сигнатурой называется кортеж, составленный из арностей ее операций. Например, типы записанных выше алгебр множеств и отношений будут (2, 2, 2, 2, 1, 0, 0) и (2, 2, 1, 0, 0) соответственно. Алгебры, имеющие один и тот же тип, называются однотипными. Например, рассмотренные выше числовые алгебры и алгебра квадратных матриц однотипны и их тип будет (2, 2, 0, 0). Заметим, что порядок перечисления операций в сигнатуре произволен, но обычно договариваются перечислять их по убыванию арностей. 2. Группоиды, полугруппы, группы Алгебра с одной бинарной операцией (то есть алгебра типа (2)) называется группоидом. Например, группоидами будут следующие алгебры: 1)( , +), 2)( , ),3)(V , ), 4)(2M , \),5)(2M , ) - 1) группоид действительных чисел с операцией сложения и 2) умножения; 3) группоид геометрических векторов с операцией векторного умножения; 4) и 5) группоид подмножеств некоторого множества M (может быть, даже и пустого) с операциями разности и симметрической разности соответственно. Пусть G = (G, ) - некий группоид. Если его операция ассоциативна, то есть имеет место тождество a (b c) = (a b) c (a, b, c G) , то такой группоид называется полугруппой. В записанных выше примерах группоиды (1), (2) и (5) -полугруппы, а группоиды (3) и (4) не являются полугруппами, так как их операции не ассоциативны. Элемент G группоида называется нейтральным по операции * (или просто нейтральным, если бинарная операция подразумевается), если для любого a G имеет место a = a = a . Теорема. Если группоид имеет нейтральный элемент, то он единственный. Доказательство. Пусть , - два нейтральных элемента одного и того же группоида. Тогда = , так как нейтральный элемент, и = , так как нейтральный. То есть = . Заметим, что при доказательстве существенно использовано «двустороннее свойство» нейтрального элемента: при «умножении» на него как слева, так и справа, тот элемент, который «умножается», остается неизменным. Операция группоида условно названа «умножением». Для нас особенно важны полугруппы с нейтральными элементами. Полугруппа с нейтральным элементом называется моноидом. В общем случае моноид записывают так: M = (M , , ) , где точкой обозначена бинарная операция (точку часто опускают), а - нейтральный элемент. Примеры моноидов: 1) ( , ,1),( , +,0) - числовые моноиды всех действительных чисел по умножению (мультипликативный моноид действительных чисел) и по сложению (аддитивный моноид действительных чисел); 2 2) (2 M , ,id M ) - моноид бинарных отношений на множестве M (напомним, что операция композиции отношений ассоциативна, а диагональ, то же самое, что тождественное отображение, есть нейтральный элемент по этой операции: ( ) = ( ) , id M = id M = ); 3) M n = ( M n , , E ) - моноид квадратных матриц n-го порядка по умножению: 4) (2M , , ),(2M , , M ),(2M , , ) - моноиды на булеане множества M. Заметим дополнительно, что множество натуральных чисел (положительных целых) по сложению не будет моноидом, так как не содержит нуля – нейтрального элемента по сложению; это будет просто полугруппа. Но по операции умножения получится моноид. Обратимые элементы моноида Некоторые элементы моноида могут оказаться обратимыми. А именно, элемент a ' называется обратным к элементу a , если выполняется двойное равенство a a ' = a ' a = . Тогда сам элемент a называется обратимым. Например, в моноиде квадратных матриц обратимыми будут невырожденные матрицы, то есть матрицы с ненулевым определителем. Теорема. Если элемент моноида обратим, то обратный к нему определен однозначно. Доказательство. Допуская, что для некоторого элемента a существуют два обратных, скажем a ' и a '' . Тогда строим такую цепочку преобразований: a '' = a '' = a ''(aa ') = (a '' a)a ' = a ' = a ' (точка, знак операции, опущена). Существенно использована ассоциативность операции моноида, а также «двустороннее свойство» обратного элемента: при «умножении» на обратный как слева, так и справа, получаем нейтральный элемент. Далее обратный к a обозначаем a−1 . Свойства обратимых элементов 1) (ab)−1 = b−1a −1 Действительно: (ab)(b−1a−1 ) = a(bb−1 )a−1 = a a−1 = aa −1 = Точно так же доказывается, что (b −1a −1 )(ab) = . Отсюда, в силу единственности обратного элемента, получаем, что (ab)−1 = b−1a −1 . 2) (a −1 ) −1 = a Равенство aa−1 = a −1a = следует прочитать как определение обратного к обратному. В силу единственности обратного отсюда и следует, что это будет исходный элемент. 3) Нейтральный элемент обратен себе самому. Моноид, все элементы которого обратимы, называется группой. Примеры групп 1) Числовые группы: 1)( \{0}, ,1), 2)( \{0}, ,1).3)( , +,0), 4)( , +,0),5)( , +,0) . Эти группы называются: 1) и 2) мультипликативные группы действительных и рациональных чисел, 3), 4) и 5) аддитивные группы действительных, рациональных и целых чисел. Такие же группы могут быть образованы на множестве комплексных чисел. 2) Группа векторов: (V , +, 0) 3) Группа матриц: GL( n) = ( M n+ , , E ) - группа невырожденных матриц по умножению. Определение этой группы корректно, так как произведение невырожденных матриц является невырожденной матрицей в силу известной теоремы об умножении определителей. 4) Группа множеств: (2 M , , ) . Эта группа интересна тем, что в ней каждый элемент обратен самому себе: AA = . Группу обычно записывают, как моноид, указывая носитель, бинарную операцию и нейтральный элемент. Иногда в сигнатуру добавляют унарную операцию взятия обратного. Следующий пример группы очень важен для всего дальнейшего изложения. Рассмотрим моноид бинарных отношений на некотором непустом множестве 2 (2 M , ,id M ) . Можно доказать, что отношение M 2 обратимо тогда и только тогда, когда оно является биекцией данного множества на себя. Тогда и только тогда выполняется равенство −1 = −1 = id M (рекомендуется доказать самостоятельно, хотя это не совсем тривиально). Следует подчеркнуть, что в общем случае для произвольного отношения и обратного к нему записанное выше двойное равенство не выполняется! (см. Семинар №2). Замечание. Если f : A → A биекция, то (x)(! y )( y = f ( x)) & (y )(! x)( y = f ( x)); f −1 ( y ) = x y = f ( x) −1 f f x ⎯⎯ → y = f ( x) ⎯⎯→ x −1 f f y ⎯⎯→ x ⎯⎯ → y; f f −1 = f −1 f = id M Обратное отношение тогда есть f −1 = {( y, x) : y = f ( x)} , и поскольку такой x единственный, то можно положить f −1 ( y) = x y = f ( x) , то есть обратное отношение есть отображение, как легко понять, тоже взаимно однозначное. Так как композиция биекций есть снова биекция, обратное отображение тоже биекция и, наконец, тождественное отображение (диагональ) – биекция (проверить эти утверждения!), то получаем группу на множестве биекций (взаимно однозначных отображений), которая называется симметрической группой данного множества и обозначается SM . Для нас особенно важен случай конечного множества. Биекция конечного множества на себя называется подстановкой этого множества, а группа подстановок n-элементного множества называется симметрической группой степени n и обозначается S n . Подстановка стандартно записывается в виде двустрочной матрицы: 1 2 ... n , i1 i2 ... in = где в верхней строке перечисляются элементы множества M в стандартном порядке (по возрастанию), и под каждым элементом в нижней строке подписывается его образ при отображении , то есть ik = (k ),1 k n . Таким образом, нижняя строка является некоторой перестановкой элементов верхней строки. Иногда саму подстановку называют перестановкой, но, строго говоря, это неверно: перестановка – это вектор значений функции (отображения), которая называется подстановкой. Отсюда же видно, что число элементов в группе S n равно n! (n факториал). Рассмотрим теперь выполнение операций группы: композиции и обращения. 1) Вычисление композиции Композиция двух подстановок 1 1 2 ... n и = j1 i1 i2 ... in = 2 ... n j2 ... jn вычисляется очень просто по формуле (k ) = ( (k )),1 k n , то есть это вычисление значения сложной функции. Первая подстановка переводит элемент k в элемент ik , а вторая полученный элемент ik переводит в элемент jik . Например: 1 2 3 4 1 2 3 4 1 2 3 4 , = , = 4 3 1 2 3 2 1 4 4 1 3 2 = Схема действий: 1→4→4, 2→3→1, 3→1→3, 4→2→2. При этом 1 2 3 4 , 1 3 4 2 = то есть композиция подстановок некоммутативна. 2) Обратная подстановка Чтобы найти подстановку, обратную данной, нужно переставить строки матрицы, а потом переставить столбцы так, чтобы верхняя строка приняла стандартный вид 1 2 … n. Например, 1 2 3 4 5 4 5 2 3 1 1 2 3 4 5 −1 → → = 4 5 2 3 1 1 2 3 4 5 5 3 4 1 2 = Перестановку строк можно выполнить «в уме» и сразу записать обратную подстановку, читая исходную снизу вверх. (См. Учебник, пример 2.10.) В заключение отметим важный частный случай коммутативной группы. Группа называется коммутативной (или абелевой), если ее бинарная операция коммутативна, то есть имеет место тождество ab = ba . Все числовые группы коммутативны; группа множеств также коммутативна, а группа матриц и симметрическая группа любого множества не коммутативны. Лекции по ДМ Основное учебное пособие: А.И. Белоусов, С.Б. Ткачев. Дискретная математика. – 7-е изд., испр. – М.: Изд-во МГТУ им. Н.Э. Баумана, 2021.- 703 с. Далее – Учебник. Лекция №1 06.09.24 I. Множества и отношения 1. Множества Почему наивная теория множеств. «Наивность» в данном случае означает, что исходное понятие множества строго формально не определяется, а поясняется содержательно. «Под многообразием или множеством я понимаю всё то многое, что посредством некоторого закона приводится к единству» (Г. Кантор). Отношение принадлежности: a A ; реже A a . Форма A = {x : P( x)} . Читается: A есть множество всех таких элементов x , что утверждение P( x) истинно. Это P( x) называется коллективизирующим свойством или характеристическим предикатом. Если переменной x придать то или иное значение, получится истинное или ложное высказывание. Примеры: “x – студент МГТУ”, “x – четное целое число”. Интуитивно мы будем понимать также, что такое натуральное число и конечное множество. Хотя, строго говоря, эти понятия следует уже строго определять через исходное понятие множества. Равенство множеств (принцип экстенсиональности, или объемности): A= B (x)( x A x B) Множество полностью определяется составом элементов. Для конечного множества не имеет значения порядок перечисления элементов, а также число повторений какого-то элемента при перечислении. {1,2,3} = {3,2,1} = ... = {1,1,2,2,2,3} = ... , но {1,2,3} {{1,2},3} Элементом множества может быть другое множество. Канонически элементы конечного множества перечисляются в каком-то договоренном порядке без повторений элементов. {a1 , a2 ,..., an } = {x : x = a1 x = a2 ... x = an } Подмножество: A B (x)( x A x B) Сопоставляя определение равных множеств с определением подмножества, получаем, что A = B ( A B) &( B A) Это равносильное исходному определение равенства множеств лежит в основе метода доказательства равенства множеств, называемого методом двух включений. О нем речь еще пойдет. Собственное (строгое) подмножество: A B ( A B) &( A B) Пустое множество: = {x : F ( x)} , где F ( x) - тождественно ложный предикат. По определению принимается, что пустое множество есть подмножество любого множества. Универсальное множество: U = {x : T ( x)} , где T ( x) - тождественно истинный предикат. По определению принимается, что любое множество есть подмножество универсального множества. Содержательно под универсальным множеством понимается наиболее широкий род объектов, рассматриваемых в данной теории. Произвольная трактовка этого понятия может привести к противоречиям. Итак, для любого множества A A U . Булеан: 2 A {X : X A} . Пример: 2{a,b,c} = {,{a},{b},{c},{a, b},{a, c},{b, c},{a, b, c}} . Можно доказать, что если конечное множество состоит из n элементов, то в его булеане 2 элементов. Операции 1) Объединение: A B {x : x A x B} 2) Пересечение: A B {x : x A & x B} Может оказаться, что A B = . Тогда множества A и B называют непересекающимися. 3) Разность: A \ B {x : x A & x B} 4) Дополнение: A {x : x A} = {x : x U & x A} = U \ A n Напомним, что каждый элемент считается элементом универсального множества. 5) Симметрическая разность: AB ( A \ B) ( B \ A) . Можно доказать, что AB = ( A B) \ ( A B) . Выше написано теоретико-множественное тождество. Его надо доказать. Основные тождества 6) A B = B A; A B = B A A ( B C) = ( A B) C; A ( B C) = ( A B) C A ( B C ) = ( A B) ( A C ); A ( B C ) = ( A B) ( A C ) A A = A A = A A ( A B) = A ( A B) = A A = A U = A; A = ; A U = U 7) A B = A B; A B = A B (тождества, или законы, Де Моргана) 1) 2) 3) 4) 5) A \ B = A B 9) = U ;U = (принимается по определению) 8) 10) A A = ; A A = U 11) AB = ( A B) \ ( A B) 12) AB = BA 13) A( BC) = ( AB)C 14) AA = ; A = A; AU = A 15) A ( BC) = ( A B)( A C) Рассмотрим на лекции метод двух включений. Примеры: 1) A ( B C ) = ( A B) ( A C ) A ( B C ) = ( A B) ( A C ) x A (B C) x A x B C (x A B & x A C ) 2) ( x B & x C ) ( x A B & x A C ) ( x A B & x A C ). x ( A B ) ( A C ) x A B & x A C. Далее рассмотрим два случая: 1. x A Тогда x принадлежит объединению A с любым множеством, в частности, x A ( B C ) . 2. x A Тогда, поскольку x принадлежит написанным выше объединениям, то x B & x C x B C x A (B C) . Тождество доказано. 2. Неупорядоченная и упорядоченная пары. Кортеж. Декартово произведение Неупорядоченная пара на множествах A A, B : {a, b}, a A, b B . Заметим, что если a = b , то {a, b} = {a, a} = {a} . Равенство неупорядоченных пар: {a, b} = {c, d} a = c, b = d a = d , b = c . Т.е., порядок перечисления неважен: {1,2}={2,1}. A, B обозначается (a, b) и определяется не только Упорядоченная пара на множествах составом, но порядком перечисления своих элементов, которые в этом случае называются компонентами или проекциями. Зависимость от порядка постулируется в определении равенства упорядоченных пар: принимается, что (a, b) = (c, d ) a = c & b = d , Т.е. в общем случае (a, b) (b, a) . Точка плоскости как упорядоченная пара действительных чисел. Факультативное замечание Упорядоченная пара может быть явно определена как некоторое множество, а именно: (a, b) = {{a},{a, b}} . Тогда сформулированное выше определение равенства упорядоченных пар надо доказать, как критерий. Достаточность условия очевидна. Докажем необходимость. Пусть (a, b) = (c, d ) . Рассмотрим сначала случай, когда a b . Тогда, поскольку одноэлементное множество не может быть равно двухэлементному, то {a} = {c},{a, b} = {c, d} , причем c d , так как иначе одноэлементное множество окажется равным двухэлементному. Отсюда a = c, b = d ( b не может совпасть с c , так как тогда получится, что a = c = b в противоречии с неравенством a b . Если же a = b , то (a, b) = (a, a) = {{a},{a, a}} = {{a},{a}} = {{a}} . Тогда из равенства упорядоченных пар получаем, что c = d (иначе опять получим равенство одноэлементного и двухэлементного множества) и a = b = c = d . Кортеж, равенство кортежей. Декартово произведение, декартова степень. Особый случай нулевой декартовой степени, пустой кортеж. Тождества с декартовым произведением. (См. Учебник, п. 1.2. Пустой кортеж – пример 2.7д.) Лекция №2 11.09.24 3. Отношения, соответствия, отображения n - арное отношение на множествах A1 , A2 ,..., An : A1 A2 ... An . Содержательные примеры. Строка учебного расписания есть кортеж (Дисциплина, Преподаватель, Уч.группа, Аудитория, День, Час) Конкретное расписание есть подмножество множества всех таких кортежей. Частные случаи: n-арное отношение на множестве (все указанные выше множества совпадают), унарные и бинарные отношения. Соответствия: область определения и область значений. Сечение по элементу и по множеству. Соответствие из множества A в множество B: A B . Можно также говорить: бинарное отношение на множествах A и B. Если A = B , то говорят о бинарном отношении на множестве A: A2 . Примеры: = {( x, y) : x2 + y 2 a2} 2) = {( x, y) : x y} - обычное отношение числового порядка 3) = {( x, y) : x - сын y} 1) Область определения соответствия A B : D = {x : ( x, y ) , y B} . Область значений соответствия R = { y : ( x, y ) , x A} . Сечение соответствия A B по элементу x A : ( x) = { y : ( x, y) , y B} . Сечение соответствия A B по множеству C D : (C) = { y : ( x, y) , x C, y B}. Замечание. Если множество C A , то под сечением (C ) следует понимать множество (C D ) . Если это пересечение пусто, то и множество (C ) считается пустым. Отображения и частичные отображения. Соответствие A B называется функциональным по второй компоненте, если для каждого x D сечение ( x) содержит единственный элемент y B . Или, что то же самое, для любых двух пар ( x, y),( x ', y ') при условии, что x = x ' имеет место равенство y = y ' . Это значит, что функциональному по второй компоненте соответствию не могут принадлежать пары с одинаковыми первыми компонентами и разными вторыми. Соответствие A B называется функциональным по первой компоненте, если для каждого y R существует единственный элемент x D такой, что ( x, y) . Или, что то же самое, для любых двух пар ( x, y),( x ', y ') при условии, что y = y ' имеет место равенство x = x ' . Это значит, что функциональному по второй компоненте соответствию не могут принадлежать пары с одинаковыми вторыми компонентами и разными первыми. Соответствие A B называется всюду (или полностью) определенным, если D = A , то есть для любого x A существует y B (не обязательно единственный!) такой, что ( x, y) . Соответствие A B , которое всюду определено и функционально по второй компоненте, называется отображением множества A в множество B (обратим внимание на предлог!). Для нас синонимом термина «отображение» будет термин «функция». Для отображения f A B принято обозначение f : A → B . Единственный элемент сечения f ( x) называется образом элемента x A при отображении f . Пишут при этом y = f ( x) (вместо записи ( x, y) f ). Тот же элемент x A , для которого y = f ( x) , называется прообразом элемента y при отображении f . Множество всех таких элементов называют полным прообразом элемента y при отображении f . Используется обозначение f −1 ( y) , то есть f −1 ( y) = {x : y = f ( x)} . Иногда именно это множество называют прообразом элемента y при отображении f . Соответствие A B , которое и только лишь функционально по второй компоненте, но не является всюду определенным, называется частичным отображением множества A в множество B . Можно говорить и «частичная функция». Мы будем в этом случае использовать обозначение f : A ⎯⎯ → B , ставя точку под стрелкой. Используют также понятие образа множества X A при отображении f : f ( X ) = { y : y = f ( x), x X } . Соответственно, прообраз множества Y B есть множество f −1 (Y ) = {x : f ( x) Y } . Классификация отображений • Инъективное отображение (или, просто, инъекция) – отображение, функциональное по 1-й компоненте, то есть для каждого y R f существует единственный x A , такой, что y = f ( x) . • Сюръективное отображение (сюръекция) – отображение f : A → B , у которого область значений совпадает со всем множеством B , то есть для каждого y B существует элемент x A (не обязательно единственный!), для которого y = f ( x) . • Про такое отображение говорят, что оно есть отображение множества A на множество B . Биективное отображение (биекция) – отображение, которое одновременно инъективно и сюръективно. Биекцию называют также взаимно однозначным соответствием (иногда (1, 1)соответствием). Для биекции f : A → B каждый элемент первого множества имеет единственный образ и каждый элемент второго множества имеет единственный прообраз. Операции над соответствиями 1) Теоретико-множественные операции 2) Композиция {( x, y) : (z)( x, z) &( z, y) } A D , где A B , а C D - композиция соответствий и . Можно доказать, что R D . Для отображений f : A → B и g : B → C композиция f g {( x, y ) : (z )( x, z ) f & ( z, y ) g} = {( x, y) : (z )( z = f ( x) & y = g ( z )} = = {( x, y ) : y = g ( f ( x))}, то есть ( f g )( x) = g ( f ( x)) . Обычная композиция функций, или сложная функция. 3 ) Обратное соответствие: если A B , то соответствие −1 {( y, x) : ( x, y) } B A называется обратным к . 4) Диагональ множества A Так называется бинарное отношение id A = {( x, x) : x A} . Ясно, что это не что иное как тождественная функция. Для бинарного отношения A2 композиция его с самим собой называется его квадратом, то есть 2 . Доказательство некоторых тождеств для отображений (задачи 1.7 и 1.8). 1. Пусть f : X → Y , A, B X . Доказать, что f ( A B) = f ( A) f ( B) . y f ( A B ) (x A B )( y = f ( x)) x A, y = f ( x) x B, y = f ( x) f ( x) = y f ( A) f ( x) = y f ( B) y f ( A) f ( B). y f ( A) f ( B) y f ( A) y f ( B ) y = f ( x), x A y = f ( x '), x ' B (z A B)( y = f ( z )) y f ( A B ). Если объединение заменить пересечением, доказательство обратного включения не пройдет (элементы x и x ' не обязаны совпадать), и будет иметь место только включение f ( A B) f ( A) f ( B) . Оно превратится в равенство, если f инъективно (и тогда x = x ' ). 2) В условиях предыдущей задачи доказать, что f −1 ( A B) = f −1 ( A) f −1 ( B) (но здесь A, B Y ). x f −1 ( A B) f ( x) A B f ( x) A f ( x) B x f −1 ( A) x f −1 ( B) x f −1 ( A) f −1 ( B ). В данном случае очевидна обратимость каждой стрелки, и тождество доказано. Легко видеть, что оно сохранится и при замене объединения пересечением. Лекция №3 13.09.24 Алгебраические свойства 1) 2) ( ) = ( ) ( ) = ( ) ( ) ( ) = ( ) ( ) (Доказательство первого тождества см. в Учебнике, стр. 54, после примера 1.10. Все страницы даются по 7-му изданию.) 3) ( ) −1 = −1 −1 4) Для бинарных отношений A2 : id A = id A = . 4. Специальные свойства бинарных отношений Запись x y далее используется вместо записи ( x, y) . Отношение A2 называется: 1) рефлексивным, если (x A)( x x) , то есть id A (диагональ полностью содержится в отношении); 2) иррефлексивным, если (x A)(( x, x) ) , то есть id A = (диагональ полностью исключается из отношения); 3) симметричным, если (x, y A)( x y y x) , то есть −1 = ; 4) антисимметричным, если (x, y A)( x y & y x x = y) , то есть −1 id A , в частности, −1 = ; 5) транзитивным, если (x, y, z A)( x y & y z x z) . Соответствующие свойства бинарных отношений называются 1) рефлексивностью, 2) иррефлексивностью, 3) симметричностью, 4) антисимметричностью и 5) транзитивностью. Критерий транзитивности Теорема. Отношение A2 транзитивно тогда и только тогда, когда 2 . Доказательство. Пусть A2 транзитивно и пусть x 2 y . Тогда для некоторого 2 z x z и z y . В силу транзитивности это означает, что x y , т.е. . Обратно: если 2 , то из x z и z y для произвольных x, y, z , т.е. из x 2 y , следует x y , т.е. отношение транзитивно. Замечание. Можно доказать, что рефлексивное и транзитивное отношение совпадает со своим квадратом. «Анкетирование» отношений. Эквивалентность, порядок, толерантность, предпорядок. Эквивалентность – отношение рефлексивное, симметричное и транзитивное. Порядок - отношение рефлексивное, антисимметричное и транзитивное. Толерантность - отношение рефлексивное и симметричное (но, вообще говоря, не транзитивное). Предпорядок - отношение рефлексивное и транзитивное. 5. Отношения эквивалентности и фактор-множества Отношение равенства по модулю k на множестве целых чисел. На множестве x k y целых чисел введем отношение равенства по модулю k: k | x− y ( x − y) k . Чтобы доказать, что это отношение эквивалентности, покажем, что равенство чисел по модулю k означает равенство их остатков от деления на k: x k y mod( x, k ) = mod( y, k ) . Через mod( x, k ) обозначен остаток от деления числа x на k . При этом 0 mod( x, k ) k −1, и mod( x, k ) = x − [ x]k , где через [ x ]k обозначено наибольшее число, не превосходящее x и делящееся на k. Пусть тогда x k y . Отсюда x − y = [ x]k + mod( x, k ) − [ y]k − mod( y, k ) . Так как эта алгебраическая сумма делится на k, то для этого необходимо, чтобы разность остатков mod( x, k ) − mod( y, k ) делилась на k (так как числа [ x ]k и [ y]k делятся на k). Но разность остатков на k по модулю меньше k и может делиться на k, только если она равна нулю. Что и означает равенство остатков mod( x, k ) = mod( y, k ) . Итак, если числа равны по модулю k, то остатки их от деления на k равны. Обратное очевидно. Другое доказательство см. в Учебнике стр. 68-69, пример 1.14. Но нам именно такой способ доказательства нужен, так как позже мы сошлемся на него в алгебре. Из доказанного сразу следует, что отношение равенства чисел по модулю k является отношением эквивалентности, так как определяется через отношение равенства. Понятие класса эквивалентности Класс эквивалентности элемента x по отношению эквивалентности : [ x] Для рассмотренного выше примера [ x]k { y : y x} . { y : mod( y, k ) = mod( x, k )} . Это означает, что классов эквивалентности здесь ровно k, каждый класс однозначно определен числом между 0 и k-1. Теорема. Классы эквивалентности попарно не пересекаются. Доказательство. Пусть A2 - отношение эквивалентности, классы [ x ] и [ y ] различны, но их пересечение не пусто. Пусть z [ x ] [ y ] . Так как классы [ x ] и [ y ] различны, то найдется элемент u [ x] \ [ y ] или элемент v [ y ] \ [ x ] . В первом случае получим цепочку эквивалентностей: z x, u x, z y , которая в силу симметричности любого отношения эквивалентности может быть переписана так: u x, x z, z y , откуда в силу транзитивности отношения получим, что u y , что невозможно, так как элемент u [ y ] (этот элемент выбран так, что не является эквивалентным элементу y ). Случай элемента v [ y ] \ [ x ] рассматривается точно так же. Тем самым доказано, что любые два различных класса эквивалентности не пересекаются. Другое доказательство теоремы см. в Учебнике (теорема 1.4, стр. 67-68). Разбиение множества. Определение. Говорят, что подмножества непустого множества A образуют его разбиение, если 1) все они не пусты, 2) каждый элемент A принадлежит какому-то из них и 3) они попарно не пересекаются. Подмножества, образующие разбиение множества A, называются членами разбиения. Теорема. Каждое отношение эквивалентности определяет однозначно разбиение множества, на котором оно задано, причем членами разбиения являются классы эквивалентности. Наоборот, любое разбиение множества определяет однозначно отношение эквивалентности на нем, и классы эквивалентности совпадают с членами разбиения. Доказательство. Первое утверждение очевидно в силу ранее доказанного. Заметим только, что каждый элемент множества, на котором определено отношение эквивалентности, принадлежит своему классу эквивалентности в силу свойства рефлексивности. Пусть теперь подмножества B, C,... A образуют разбиение множества A . Определим отношение A2 так: x y ( x B) &( y B) для некоторого члена разбиения B . Рефлексивность и симметричность такого отношения очевидны. Докажем транзитивность. Пусть x y, y z . Тогда для некоторых членов разбиения B, C имеем: x, y B; y, z C y B C B = C x, y, z B x z , что и доказывает транзитивность определенного таким образом отношения. Тривиальные разбиения: это 1) разбиение, единственным членом которого является само множество, а также 2) разбиение на одноэлементные подмножества. Можно сказать, что в первом случае все элементы множества эквивалентны, а во втором каждый элемент эквивалентен только самому себе. Фактор-множество. Множество классов эквивалентности {[ x] : x A} называется фактор-множеством множества A по отношению эквивалентности A2 и обозначается A / . / k = {[0]k ,[1]k ,...,[ k − 1]k } . Это множество конечно (оно Примеры. 1) Фактор множество состоит из k элементов), хотя каждый его элемент есть бесконечное множество всех чисел, дающих при делении на k остаток 0, 1,…, k-1. Тем самым устанавливается взаимно однозначное соответствие между фактор-множеством / k и множеством чисел {0,1,..., k −1} . 2) На множестве вещественных чисел x 1 y определим отношение равенства по модулю 1: x− y . Рекомендуется самостоятельно доказать, что это отношение эквивалентности и что фактор множество / 1 находится во взаимно однозначном соответствии с полуинтервалом [0, 1). Также рекомендуется проанализировать отношение x T y x − y = kT ; k , T + (положительное действительное число) . Здесь часто используется случай T = 2 (период). 3) На множестве точек плоскости 2 зададим отношение ( x1 , y1 ) ( x2 , y2 ) x12 + y12 = x22 + y22 . Легко проверяется, что это эквивалентность (проверить!). Класс эквивалентности точки [( x0 , y0 )] = {( x, y ) : x 2 + y 2 = x02 + y02 } - окружность радиуса x02 + y02 с центром в начале координат, и исходная точка лежит на этой окружности. Заметим при этом, что класс эквивалентности точки (0, 0) сводится только к этой точке. Фактор-множество есть здесь множество концентрических окружностей x2 + y 2 = r 2 , r 0 . Предлагается самостоятельно проанализировать отношение ( x1 , y1 ) ( x2 , y2 ) x12 − y12 = x22 − y22 .