Теория алгоритмов, формальных языков, грамматик и автоматов

advertisement
Министерство образования Российской Федерации
Восточно-Сибирский государственный технологический университет
Бильгаева Н.Ц.
Теория алгоритмов, формальных
языков, грамматик и автоматов
Учебное пособие для студентов специальности
220400 -"Программное обеспечение вычислительной
техники и автоматизированных систем"
Издательство ВСГТУ
Улан-Удэ 2000
УДК 681.5.01:512
Бильгаева Н.Ц. Теория алгоритмов, формальных языков, грамматик и автоматов: Учебное
пособие. Улан-Удэ: Изд-во ВСГТУ, 2000. - с.
В учебном пособии рассмотрены основные понятия теории алгоритмов, формальных языков,
грамматик и автоматов; рассмотрены формальные модели алгоритмов, дается классификация
формальных
грамматик, описаны используемые в практике программирования алгоритмы
преобразования грамматик и синтеза автоматов. По каждому разделу приведен теоретический
материал, даны методические рекомендации и примеры решения задач, а также задания для
самостоятельной работы.
Рецензенты:
Найханова Л.В. - к.т.н., доцент, заведующий кафедрой систем информатики ВСГТУ.
Дармаев Т.Г. – к.ф.-м. н., заведующий лабораторией геоинформационных технологий БИП СО
РАН.
Печатается
по
решению
редакционно-издательского
государственного технологического университета
совета
Восточно-Сибирского
 Восточно-Сибирский государственный технологический университет, 2000 г.
ВВЕДЕНИЕ
В пособии рассмотрены основные понятия теории алгоритмов и теории формальных
грамматик, языков и автоматов. Пособие ориентировано на студентов младших курсов,
обучающихся по специальности 220400 - "Программное обеспечение вычислительной
техники и автоматизированных систем". В процессе изучения одноименных дисциплин
студенты сталкиваются с тем, что учебный материал разбросан по разным источникам,
написан языком труднопонимаемым для первого знакомства, а для многих понятий
существует множество терминов. Поэтому при работе над пособием автор старался
совместить строгость изложения основных понятий с доходчивостью восприятия.
Теоретический материал по каждому разделу сопровождается методикой решения задач,
примерами, а также приводятся задания для самостоятельной работы. При написании
учебного пособия широко использовались книги и монографии, указанные в списке
литературы, без специальных ссылок на них в тексте пособия.
Пособие содержит введение, пять разделов и заключение. В первом разделе рассмотрены
основные понятия теории алгоритмов и необходимость математического определения
алгоритма. Во втором разделе рассмотрены рекурсивные функции, приводится понятие
простейших функций и приемы построения сложных арифметических функций с помощью
операций суперпозиции, примитивной рекурсии и минимизации. В третьем разделе дано
описание машин Тьюринга, рассмотрены способы их представления, операции над
машинами Тьюринга, рассмотрены алгоритмически неразрешимые проблемы теории
алгоритмов. В четвертом разделе рассмотрены основные понятия формальных грамматик и
языков, приводится классификация грамматик, стратегии грамматического разбора, а также
эквивалентные преобразования КС-грамматик. В пятом разделе рассмотрены различные
типы автоматов (конечные автоматы, автоматы с магазинной памятью, автоматы Мили и
Мура) и их связь с грамматиками и языками.
Автор считает своим долгом выразить признательность Бриковой М., Жаргалову Б.,
Крюкову Е., которые выполнили компьютерный набор первоначального варианта текста
пособия, оказали помощь при подборе заданий для самостоятельной работы.
Все замечания и пожелания по пособию автор просит направлять по адресу: 670013,
г.Улан-Удэ, ул. Ключевская, 40-а, ВСГТУ.
1. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ АЛГОРИТМОВ
1.1. Предварительные сведения
Понятие алгоритма, являющееся одним из основных понятий математики, возникло
задолго до появления вычислительных машин. На протяжении многих веков люди
пользовались интуитивным понятием алгоритма. Арабский математик IX века Мухаммед
ибн Муса Аль-Хорезми впервые выдвинул идею о том, что решение любой поставленной
математической и философской задачи может быть оформлено в виде последовательности
механически выполняемых правил, т.е. может быть алгоритмизировано. Этого же мнения
придерживались Декарт, Лейбниц, Гильберт.
Приведем интуитивное определение алгоритма.
Алгоритм - это строгая и четкая конечная система правил решения некоторого класса
задач, определяющая процесс преобразования исходных данных в искомый результат.
В рамках данного определения понятие алгоритма отождествлялось с понятием метода
вычисления, традиции организации вычислений складывались веками и стали составной
частью общей научной культуры, формулировались и успешно применялись на практике
различные вычислительные алгоритмы. Поэтому понятие метода вычислений считалось
изначально ясным и потребности в изучении самого этого понятия не возникало.
1.2. Основные требования к алгоритмам
Каждый алгоритм имеет дело с данными - входными, промежуточными и выходными.
Данные как объекты, с которыми могут работать алгоритмы, должны быть четко определены
и отличимы как друг от друга, так и от другой информации.
Данные для своего размещения требуют памяти. Память обычно считается однородной
и дискретной. Единицы измерения объема данных и памяти согласованы, при этом память
может быть бесконечной.
Если выполнение алгоритма заканчивается получением результатов, то говорят, что он
применим к рассматриваемой совокупности исходных данных. Любой применимый
алгоритм имеет следующие основные свойства, раскрывающие его определение.
1. Дискретность. Это свойство состоит в том, что алгоритм должен представлять
процесс решения задачи как последовательное выполнение простых (или ранее
определенных) шагов. При этом для выполнения каждого шага алгоритма требуется
некоторый конечный отрезок времени, то есть преобразование исходных данных в результат
осуществляется во времени дискретно.
2. Определенность (или детерминированность). Это свойство состоит в том, что каждое
правило алгоритма должно быть четким и однозначным. Благодаря этому свойству
выполнение алгоритма носит механический характер и не требует никаких дополнительных
указаний или сведений о решаемой задаче.
3. Результативность (или конечность). Это свойство состоит в том, что алгоритм
должен приводить к решению задачи за конечное число шагов.
4. Массовость. Это свойство состоит в том, что алгоритм решения задачи
разрабатывается в общем виде и должен быть применим для некоторого класса задач,
различающихся лишь исходными данными.
Для задания алгоритма необходимо выделить и описать следующие его элементы:
• набор объектов, составляющих совокупность данных: исходных, промежуточных и
конечных;
• правило начала;
• правила непосредственной переработки информации;
• правило окончания;
• правило извлечения результатов.
Алгоритм всегда рассчитан на конкретного исполнителя. Если исполнителем является
компьютер, то алгоритм должен быть записан на языке программирования.
1.3. Математическое определение алгоритма
Интуитивное определение алгоритма не позволяет рассматривать свойства
алгоритмов как свойства формальных объектов. Поэтому математическое определение
алгоритма необходимо по следующим причинам:
1) только при наличии формального определения алгоритма можно сделать вывод о
разрешимости или неразрешимости каких-либо проблем;
2) это дает возможность для сравнения алгоритмов, предназначенных для решения
одинаковых задач;
3) это дает возможность для сравнения различных проблем по сложности алгоритмов их
решения.
Одна из причин расплывчатости интуитивного определения алгоритма состоит в том,
что объектом алгоритма может оказаться все, что угодно. Поэтому естественно было начать
с формализации понятия объекта. В вычислительных алгоритмах объектами работы
являются числа, в алгоритме шахматной игры - фигуры и позиции, при алгоритмизации
производственных процессов объектами служат, например, показания приборов. Однако
алгоритмы оперируют не с объектами реального мира, а с изображениями этих объектов.
Поэтому алгоритмами в современной математике принято называть конструктивно
задаваемые соответствия между изображениями объектов в абстрактных алфавитах.
Абстрактным алфавитом называется любая конечная совокупность объектов,
называемых буквами или символами данного алфавита. При этом природа этих объектов нас
совершенно не интересует. Символом абстрактных алфавитов можно считать буквы
алфавита какого-либо языка, цифры, любые значки и даже слова некоторого конкретного
языка. Основным требованием к алфавиту является его конечность. Таким образом, можно
утверждать, что алфавит - это конечное множество различных символов. Алфавит, как
любое множество, задается перечислением его элементов.
Итак, объекты реального мира можно изображать словами в различных алфавитах. Это
позволяет считать, что объектами работы алгоритмов могут быть только слова. Тогда можно
сформулировать следующее определение.
Алгоритм есть четкая конечная система правил для преобразования слов из некоторого
алфавита в слова из этого же алфавита.
Слово, к которому применяется алгоритм, называется входным. Слово, вырабатываемое
в результате применения алгоритма, называется выходным.
Совокупность слов, к которым применим данный алгоритм, называется областью
применимости этого алгоритма.
Формальные определения алгоритма появились в 30-х - 40-х годах XX века. Можно
выделить три основных типа универсальных алгоритмических моделей, различающихся
исходными эвристическими соображениями относительно того, что такое алгоритм. Первый
тип связывает понятие алгоритма с наиболее традиционными понятиями математики вычислениями и числовыми функциями. Наиболее развитая и изученная модель этого типа рекурсивные функции - является исторически первой формализацией понятия алгоритма.
Эта модель основана на функциональном подходе и рассматривает понятие алгоритма с
точки зрения того, что можно вычислить с его помощью.
Второй тип основан на представлении алгоритма как некоторого детерминированного
устройства, способного выполнять в каждый отдельный момент некоторые примитивные
операции, или инструкции. Такое представление не оставляет сомнений в однозначности
алгоритма и элементарности его шагов. Основной теоретической моделью этого типа,
созданной в 30-х годах, является машина Тьюринга, которая представляет собой
автоматную модель, в основе которой лежит анализ процесса выполнения алгоритма как
совокупности набора инструкций.
Третий тип алгоритмических моделей - это преобразования слов в произвольных
алфавитах, в которых элементарными операциями являются подстановки, т.е. замены части
слова (подслова) другим словом. Преимущество этого типа состоит в его максимальной
абстрактности и возможности применить понятие алгоритма к объектам произвольной
природы. Модели второго и третьего типа довольно близки и отличаются в основном
эвристическими подходами. Примерами моделей этого типа являются
нормальные
алгоритмы Маркова и канонические системы Поста.
1.4. Понятие алфавитного оператора
Понятие алфавитного оператора является наиболее общим. К нему фактически сводятся
любые процессы преобразования информации. К изучению алфавитных операторов
фактически сводится теория любых преобразователей информации. Основой теории
алфавитных операторов являются способы их задания. Если область определения
алфавитного оператора конечна, то оператор может быть задан простой таблицей
соответствия. В случае бесконечной области определения алфавитного оператора он задается
системой правил, позволяющей за конечное число шагов найти выходное слово,
соответствующее заданному входному слову. Алфавитные операторы, задаваемые с
помощью конечной системы правил, называются алгоритмами.
Алгоритмы, в соответствии с которыми решение поставленных задач сводится к
арифметическим действиям, называются численными алгоритмами.
Алгоритмы, в соответствии с которыми решение поставленных задач сводится к
логическим действиям, называются логическими алгоритмами.
Различают однозначные и многозначные алфавитные операторы.
Под однозначным алфавитным оператором понимается такой алфавитный оператор,
который каждому входному слову ставит в соответствие не более одного выходного слова.
Под многозначным алфавитным оператором понимается такой алфавитный оператор,
который каждому входному слову ставит в соответствие более одного выходного слова.
никакого
Алфавитный оператор, не сопоставляющий данному входному слову аi
выходного слова bj (в том числе и пустого), не определен на этом слове.
Совокупность всех слов, на которых алфавитный оператор определен, называется
областью его определения.
Два алфавитных оператора считаются равными, если равны соответствующие им
алфавитные операторы и совпадает система правил, задающих действие этих алгоритмов на
выходные слова.
Два алгоритма считаются эквивалентными, если у них совпадают алфавитные
операторы, но не совпадают способы их задания (система правил). Обычно в теории
алгоритмов рассматриваются лишь такие алгоритмы, которым соответствуют однозначные
алфавитные операторы.
1.5. Задания для самостоятельной работы
Во всех заданиях необходимо разработать схемы алгоритмов и проанализировать
процесс реализации алгоритма, т.е. последовательность шагов, которая будет порождена при
применении алгоритма к конкретным исходным данным.
1. Разработать словесные алгоритмы вычитания из некоторого числа А
последовательности n чисел b1, b2, ..., bn:
а) алгоритм вычисления по формуле:
C=(...((A - b1) - b2) - ... - bn)
б) алгоритм вычисления по формуле:
n
C = A − ∑ bi .
i =1
2. Разработать алгоритм вычисления по формуле:
n
C k = ∑ a i − b k (1 ≤ i ≤ n, 1 ≤ k ≤ m) .
i =1
3. Разработать алгоритм вычисления по формуле:
m
C i = ∏ a k × b i (1 ≤ i ≤ m, 1 ≤ k ≤ m) .
k =1
4. Разработать алгоритм поиска максимального (минимального) элемента из
последовательности, заданной в виде одномерного массива А = {a1, a2, ... , ak}.
5. Разработать алгоритм определения количества одинаковых чисел в
последовательности, заданной в виде одномерного массива А={a1, a2, . . . , ak}.
6. Разработать алгоритм подсчета количества одинаковых элементов в матрице B
размерностью n × m. Размерность матрицы вводится с клавиатуры.
7. Разработать алгоритм умножения матрицы на вектор.
8. Разработать алгоритм умножения матрицы на матрицу.
9. Разработать алгоритм транспонирования матрицы.
10. Разработать алгоритм, реализующий операцию объединения
следующих двух
множеств:
A = {a1, a2, . . ., ak} и B= {b1, b2, ... , bn}
2. РЕКУРСИВНЫЕ ФУНКЦИИ
2.1. Общие сведения
Первой алгоритмической системой была система, основанная на использовании
конструктивно определяемых арифметических (целочисленных) функций, получивших
специальное название рекурсивных функций.
Рекурсией называется способ задания функции, при котором значение определяемой
функции для произвольных значений аргументов выражается известным образом через
значения определяемой функции для меньших значений аргументов.
Применение рекурсивных функций в теории алгоритмов основано на идее нумерации
слов в произвольном алфавите последовательными натуральными числами. Наиболее просто
такую нумерацию можно осуществить, располагая слова в порядке возрастания их длин, а
слова, имеющие одинаковую длину, - в произвольном порядке.
После нумерации входных и выходных слов в произвольном алфавитном операторе этот
оператор превращается в функцию y = f(x), в которой аргумент х и функция y принимают
неотрицательные целочисленные значения. Функция f(x) может быть определена не для всех
значений х, а лишь для тех, которые составляют область определения этой функции.
2.2. Понятие простейших функций
Числовые функции, значение которых можно установить посредством некоторого
алгоритма, называются вычислимыми функциями.
Для того чтобы описать класс функций с помощью рекурсивных определений,
рассмотрим набор простейших функций:
1) Z(x1, x2, ..., xn) = 0
- нуль-функция, которая определена для всех неотрицательных
значений аргумента;
2) s(x) = x+1 - функция непосредственного следования, также определенная для всех
целых неотрицательных значений своего аргумента;
3) I nm (x1, x2, . . ., xm, . . . , xn) = xm - функция выбора (тождества), повторяющая значения
своих аргументов.
Используя простейшие функции в качестве исходных функций, можно с помощью
небольшого числа общих конструктивных приемов строить сложные арифметические
функции. В теории рекурсивных функций особо важное значение имеют три операции:
суперпозиции, примитивной рекурсии и минимизации.
2.2.1. Оператор суперпозиции
Оператором суперпозиции S называется подстановка в функцию от m переменных m
функций от n одних и тех же переменных. Она дает новую функцию от n переменных.
Например, из функций f(x1, x2, ..., xm), f1(x1, x2, ..., xn), f2(x1, x2, ..., xn), . . ., fm(x1, x2, ..., xn)
можно получить новую функцию:
Sm+1(f, f1, f2, ..., fm) = g(x1, x2, ..., xn) = f(f1(x1, x2, ..., xn), f2(x1, x2, ..., xn), ..., fm(x1, ..., xn)).
(1)
В операции суперпозиции Sm+1 индекс сверху указывает на число функций.
Таким образом, при помощи оператора суперпозиции и функции выбора можно
выразить любую подстановку функции в функцию.
Например, осуществляя операцию суперпозиции функций f(x) = 0 и g(x) = x+1, получим
функцию:
h(x) = g(f(x)) = 0 + 1 = 1.
При суперпозиции функции g(x) с этой же функцией получим функцию h(x) = g(g(x)) = x
+ 2.
Используя подстановку и функции тождества, можно переставлять и отождествлять
аргументы в функции:
f(x2, x1, x3, . . ., xn) = f(I22(x1, x2), I12(x1, x2), x3, . . ., xn);
f(x1, x1, x3, . . ., xn) = f(I12(x1, x2), I12(x1, x2), x3, . . ., xn).
Таким образом, если заданы функции тождества и операторы суперпозиции, то можно
считать заданными всевозможные операторы подстановки функций в функции, а также
переименования, перестановки и отождествления переменных.
2.2.2. Оператор примитивной рекурсии
Оператор примитивной рекурсии Rn позволяет определить (n+1) - местную функцию f
по двум заданным функциям, одна из которых является n- местной функцией g, а другая
(n+2) - местной функцией h.
Функция f(x1, x2, ..., xn, y) получается оператором примитивной рекурсии из функций
g(x1, x2, ..., xn) и функции h(x1, x2, ..., xn, y, z), если:
f(x1, x2, ..., xn, 0) = g(x1, x2, ..., xn);
(2)
f(x1, x2, ..., xn, y+1) = h(x1, x2, ..., xn, y, f(x1, x2, ..., xn, y)).
Приведенная пара равенств (2) называется схемой примитивной рекурсии. Для
понимания операции примитивной рекурсии необходимо заметить, что всякую функцию от
меньшего числа аргументов можно рассматривать как функцию от большего числа
аргументов. Существенным в операторе примитивной рекурсии является то, что независимо
от числа переменных в f рекурсия ведется только по одной переменной у. Остальные n
переменных x1, x2, ..., xn на момент применения схемы (2) зафиксированы и играют роль
параметров.
2.2.3. Оператор минимизации
Отношение P(x1, x2, ..., xn) называется примитивно-рекурсивным, если примитивнорекурсивна его характеристическая функция:
1, если P( x 1 , x 2 ,..., x n ) - " истина" ,
χ( x 1 , x 2 ,..., x n ) = 
 0, если P( x 1 , x 2 ,..., x n ) - " ложь".
Предикат называется примитивно-рекурсивным, если его характеристическая функция
примитивно-рекурсивна.
Функция f(x1, x2, ..., xn) получается посредством оператора минимизации из предиката
P(x1, x2, ..., xn, z), если в любой точке значением функции f(x1, x2, ..., xn) является
минимальное значение z, обращающее предикат P(x1, x2, ..., xn, z) в значение «истина»:
f(x1, x2, ..., xn) = µz (P(x1, x2, ..., xn, z)),
где µz – оператор минимизации.
2.2.4. Ограниченный оператор минимизации
Функция f(x1, x2, ..., xn) получается ограниченным оператором минимизации из
предиката P(x1, x2, ..., xn, z) и функции U(x1, x2, ..., xn), если в любой точке значение этой
функции определено следующим образом:
1) для любого z < U(x1, x2, ..., xn) такого, что P(x1, x2, ..., xn, z) = "истина", значение
функции f(x1, x2, ..., xn) = µz(P(x1, ..., xn, z)),
2) не для любого z < U(x1, x2, ..., xn) такого, что P(x1, x2, ..., xn, z) = "истина", значение
функции f(x1, x2, ..., xn) = U(x1, x2, ..., xn).
Данное определение записывается следующим образом:
f(x1, x2, ..., xn) = µ z < U(x) (P(x1, x2, ..., xn, z)).
Ограничение z в ограниченном операторе минимизации дает гарантию окончания
вычислений, поскольку оно оценивает сверху число вычислений предиката P. Возможность
оценить сверху количество вычислений является существенной особенностью примитивнорекурсивных функций.
2.3. Примитивно-рекурсивные и частично-рекурсивные функции
Большинство вычислимых функций относится к классу примитивно-рекурсивных
функций.
Функция называется примитивно-рекурсивной, если она может быть получена из
простейших функций с помощью конечного числа операторов суперпозиции и примитивной
рекурсии.
Если некоторые функции являются примитивно-рекурсивными, то в результате
применения к ним операторов суперпозиции или примитивной рекурсии можно получить
новые примитивно-рекурсивные функции.
Существует три возможности доказательства того, что функция является примитивнорекурсивной:
а) показать, что заданная функция является простейшей;
б) показать, что заданная функция построена с помощью оператора суперпозиции;
в) показать, что заданная функция построена с помощью оператора примитивной
рекурсии.
Тем не менее примитивно-рекурсивные функции не охватывают все вычислимые
функции, которые могут быть определены конструктивно. При построении этих функций
могут использоваться другие операции. Функция называется частично-рекурсивной, если
она может быть получена из простейших функций с помощью конечного числа операторов
суперпозиции, примитивной рекурсии и минимизации. Указанные операции могут быть
выполнены в любой последовательности и любое конечное число раз. Если такие функции
оказываются всюду определенными, то они называются общерекурсивными функциями.
Частично-рекурсивные функции вычислимы путем определенной процедуры механического
характера. Практически понятием частично-рекурсивных функций пользуются для
доказательства алгоритмической разрешимости или неразрешимости проблем. Приведем
тезис Черча, который связывает понятие алгоритма и строгое математическое понятие
частично-рекурсивной функции. Тезис Черча: всякий алгоритм может быть реализован
частично-рекурсивной функцией. Утверждение о несуществовании частично-рекурсивной
функции эквивалентно несуществованию алгоритма решения соответствующей задачи.
2.4. Типы рекурсивных алгоритмов
Эффективность разработки рекурсивного алгоритма определяется наличием некоторых
условий:
1) если исходные данные имеют рекурсивную структуру, то процедуры анализа таких
структур будут более эффективны, если они сами рекурсивны;
2) если алгоритм обработки некоторого набора данных построить, разбивая данные на
части и обрабатывая в отдельности каждую часть, то из частичных решений можно получить
общее;
3) если по условию задачи необходимо выбрать оптимальный вариант из некоторого
множества решений, то искомое решение может быть найдено через конечное число шагов.
При этом на каждом шаге удаляется часть информации, и далее задача решается на меньшем
объеме данных. Поиск решения завершается после окончания данных либо при нахождении
искомого решения на текущем наборе данных.
2.5. Методика решения задач
2.5.1. Использование оператора примитивной рекурсии
Пример 1. Доказать примитивную рекурсивность функции f(x, y) = x + y.
Решение. Рассмотрим способ рекурсивного определения данной функции:
f(x, 0) = x,
f(x, y+1) = x + y + 1 = f(x, y) +1.
Чтобы показать соответствие данной рекурсивной схемы схеме примитивной рекурсии,
воспользуемся функциями выбора и следования:
f(x, 0) = x = I(x),
f(x, y+1) = f(x, y) + 1 = S(f(x, y)) = S(I3(x, y, f(x, y))).
Пример 2. Доказать примитивную рекурсивность функции f(x, y) = x ⋅ y.
Решение. Рассмотрим способ рекурсивного определения данной функции:
f(x, 0) = 0,
f(x, y+1) = x ⋅ (y + 1) = x ⋅ y + x = f(x, y) +x,
из которого следует, что Z(x) = x ⋅ 0.
Обозначим x ⋅ y = p(x, y), тогда:
p(x, 0) = Z(x);
p(x, y+1) = p(x, y) +x = S(p(x, y), x) = S( I 13 (x, y, p(x, y)), I 33 (x, y, p(x, y))).
Пример 3. Доказать примитивную рекурсивность функции
0, если x = 0,
Sg ( x ) = 
1, если x ≠ 0.
Решение. Рассмотрим способ рекурсивного определения данной функции:
Sg(0) = 0 = Z(x),
Sg(x+1) = Z(x) +1 = 1 = S(Z(x)).
Пример 4. Доказать примитивную рекурсивность функции f(x) = 2x.
Решение. Рассмотрим способ рекурсивного определения данной функции:
f(0) = 1 = S(Z(x)),
f(x+1) = 2 ⋅ 2x =2 ⋅ f(x) = S(S(Z(x))).
Пример 5. Доказать примитивную рекурсивность функции f(x, y) = xy.
Решение. Рассмотрим способ рекурсивного определения данной функции:
f(x, 0) = 1 = S(Z(x));
f(x, y+1) = xy+1 = xy ⋅ x = f(x, y) ⋅ I 12 (x, y) = p( I 33 (x, y, f(x, y)), I 13 (x, y, f(x, y))).
2.5.2. Использование оператора минимизации
Пример 1. Пусть f(x, y) = µz( 2⋅x + z = y+1), откуда предикат P(x, y, z) = 2⋅x + z = y + 1.
Покажем примитивную рекурсивность предиката P. Его характеристическая функция
может быть представлена следующим выражением:
Sg(Sg((2 ⋅ x + z) ÷( y + 1)) + Sg((y +1) ÷ (2 ⋅ x + z)).
Найдем значение функции в точке (1, 5):
При z = 0: P(1, 5, 0) = 2 ⋅ 1 + 0 = 5 + 1 - "ложь",
z = 1: P(1, 5, 1) = 2 ⋅ 1 + 1 = 5 + 1 - "ложь",
z = 2: P(1, 5, 1) = 2 ⋅ 1 + 2 = 5 + 1 - "ложь",
z = 3: P(1, 5, 1) = 2 ⋅ 1 + 3 = 5 + 1 - "ложь",
z = 4: P(1, 5, 4) = 2 ⋅ 1 + 4 = 5 + 1 - "истина".
Таким образом, минимальное значение переменной z, обращающее предикат в "истину",
дает значение функции в точке (1, 5), и оно равно 4.
2.5.3. Использование ограниченного оператора минимизации
Ограниченный оператор минимизации является удобным средством для построения
обратных функций.
Пример 1. C помощью ограниченного оператора минимизации определить функцию y(x,
z
z) =   - "целая часть от деления z на x" - как функцию, обратную умножению.
 x
Решение.
z / x = y, тогда y ⋅ x = z,
z / x < y + 1, поэтому z < x(y + 1).
С использованием ограниченного оператора минимизации запишем исходную функцию
через обратную:
z
y(x, z) =   = µ z ≥ y (P(x, y, z)),
 x
предикат P(x, y, z) = z < x(y + 1).
z
Тогда   = µ z ≥ y (z < x( y+1)).
 x
Вычислим значение функции при z = 11, x = 2.
При y = 0: P(2, 11, 0) = 2(0+1) < 11 - "ложь",
y = 1: P(2, 11, 1) = 2(1+1) < 11 - "ложь",
...
y = 5: P(2, 11, 5) = 2(5+1) > 11 - "истина".
z
Следовательно,   = 5.
 x
Пример 2. С помощью ограниченного оператора минимизации определить функцию
f ( x ) = x - "целая часть от корня из х".
Решение.
Пусть x = z. Тогда x < z +1, а предикат P равен:
P(x, z) = x < (z + 1)2.
С использованием ограниченного оператора минимизации запишем исходную функцию
через обратную: x = µ z ≤ x (x < (z +1)2).
Вычислим значение функции при x = 17.
При z = 0: P(17, 0) = 17 < 1 - "ложь",
z = 1: P(17, 1) = 17 < 4 - "ложь",
...
z = 4: P(17, 4) = 17 < 25 - "истина".
[ ]
[ ]
[ ]
[ ]
Следовательно, x = 4, что и требовалось доказать.
Пример 3. С помощью ограниченного оператора минимизации определить функцию f(x,
y) = [log y x ] - "целая часть от log y x".
Решение.
Пусть y z = x. Тогда y z+1 > x.
С использованием ограниченного оператора минимизации запишем исходную функцию
как:
[log x ] = µ z < x (y z+1 > x).
y
Предикат P(x, y, z) = y z+1 > x.
Вычислим значение функции при x = 8, y = 2.
При z = 0: P(8, 2, 0) = 1 > 8 - "ложь",
z = 1: P(8, 2, 1) = 2 > 8 - "ложь",
z = 2: P(8, 2, 2) = 8 > 8 - "ложь",
z = 3: P(8, 2, 3) = 16 > 8 - "истина".
Следовательно, [log y x ] = 3.
2.6. Задания для самостоятельной работы
Доказать примитивную рекурсивность следующих функций.
1. Усеченное вычитание
x − x 2 , если x 1 > x 2 ,
x1 ÷ x 2 =  1
если x 1 < x 2 .
0,
2. Функция знака
0, если x = 0,
Sg ( x ) = 
1, если x ≠ 0.
3. Нахождение минимального значения из двух заданных чисел f(x, y) = min(x, y).
4. Нахождение максимального значения из двух заданных чисел f(x, y) = max(x, y).
5. Усеченное вычитание
 x − 1, если x > 1,
x ÷1 = 
если x < 1.
0,
6. Функция r(x, y) - остаток от деления y на x.
7. Функция q(x, y) - частное от деления y на x.
8. Доказать, что предикат Pdn(x) "x делится на n" примитивно-рекурсивен для любого n.
9. Доказать, что предикат Pdn,m(x) "x делится на n и m" примитивно-рекурсивен для
любых n и m.
10. Доказать, что отношение x1 > x2 примитивно-рекурсивно.
11. Доказать, что предикат f(x) = g(x) примитивно-рекурсивен, если функции f(x) и g(x)
примитивно-рекурсивны.
12. Дано множество слов одинаковой длины, причем первые два слова выделены.
Построить цепь от первого выделенного слова ко второму так, чтобы все слова этой цепи
были только из заданного множества. Соседние слова построенной цепи должны отличаться
только одной буквой.
13. Дано множество слов. Построить из них кроссворд заданной конфигурации (число
слов может быть больше требуемого количества для заполнения кроссворда).
14. Грани кубика разбиты на клетки 5х5. Каждая из клеток выкрашена в белый или
синий цвет. Переход из клетки в клетку допускается только через общую сторону при
условии совпадения цветов этих клеток. Построить маршрут перехода из одной заданной
клетки в другую заданную клетку этого же цвета.
15. Имеется клетчатая ткань размером NxN клеток. Разрезать ее на M квадратных частей,
не нарушая целостности клеток.
3. МАШИНЫ ТЬЮРИНГА
3.1. Общие сведения
Одним из первых формальных определений алгоритма было определение английского
математика А. Тьюринга, который в 1936 г. описал схему некоторой гипотетической
(абстрактной) машины и формализовал правила выполнения действий при помощи описания
работы этой машины.
Машина Тьюринга является абстракцией, которую нельзя реализовать практически.
Поэтому алгоритмы для машины Тьюринга должны выполняться другими средствами.
Основным следствием формализации алгоритмов с использованием машины Тьюринга
является возможность доказательства существования или несуществования алгоритмов
решения различных задач.
Описывая различные алгоритмы для машин Тьюринга и доказывая реализуемость
всевозможных композиций алгоритмов, Тьюринг убедительно показал разнообразие
возможностей предложенной им конструкции, что позволило ему выступить со следующим
тезисом: “Всякий алгоритм может быть реализован соответствующей машиной Тьюринга”.
Доказать тезис Тьюринга нельзя, так как в его формулировке не определено понятие “всякий
алгоритм”. Его можно только обосновать, представляя различные алгоритмы в виде машин
Тьюринга. Было доказано, что класс функций, вычислимых на этих машинах, совпадает с
классом частично рекурсивных функций.
3.2. Неформальное определение машины Тьюринга
Машина Тьюринга представляет собой автомат,
имеющий бесконечную в обе стороны ленту, считывающую головку и управляющее
устройство. Управляющее устройство может находиться в одном из состояний, образующих
конечное множество Q = {q0, q1, ..., qn}. Множество Q называют внутренним алфавитом
машины Тьюринга.
Принципиальное отличие машины Тьюринга от вычислительных машин состоит в том,
что ее запоминающее устройство представляет собой бесконечную ленту, из-за которой
невозможна ее физическая реализация. Лента разделена на ячейки, в каждой из которых
может быть записан один из символов конечного алфавита A = {a0, a1, . . . , am}, который
называют входным алфавитом машины Тьюринга. Во время функционирования машины
Тьюринга может быть заполнено конечное число ячеек. Считывающая головка в каждый
момент времени обозревает ячейку ленты, в зависимости от символа в этой ячейке и
состояния управляющего устройства записывает в ячейку новый символ или оставляет его
без изменения, сдвигается на ячейку влево или вправо или остается на месте. При этом
управляющее устройство переходит в новое состояние или остается в старом. Среди
состояний управляющего устройства выделены начальное состояние q0 и заключительное
состояние qz.
Таким образом, за один такт работы машина Тьюринга может считать символ, записать
вместо него новый или оставить его без изменения и сдвинуть головку на одну ячейку влево
или вправо или оставить ее на месте.
3.3. Формальное определение машины Тьюринга
Алфавит A – это некоторое конечное множество символов.
Цепочкой над алфавитом называется последовательность символов из этого алфавита.
Длина цепочки x представляет собой число символов в цепочке и обозначается | x |. Длина
пустой цепочки равна нулю.
Конкатенацией цепочек X и Y называют цепочку, полученную приписыванием символов
цепочки Y справа к цепочке X.
Машиной Тьюринга называется семерка вида
T = (Q, A, δ, p0, pz, a0, a1), где
Q – конечное множество состояний, в которых может находиться управляющее
устройство;
A – входной алфавит;
δ – функция переходов, δ = Q ⋅ A → Q ⋅ A ⋅ S, где
S = {R, L, E} - направления сдвига;
p0 – начальное состояние; p0 ∈ Q;
pz – заключительное состояние; pz ∈ Q;
a0 – символ для обозначения пустой ячейки, a0 ∈ A;
a1 – специальный символ - разделитель цепочек на ленте, a1 ∈ A.
Командой машины Тьюринга называется элемент функции переходов qa → pbr, где q и
p∈ Q; a и b∈A; r∈S. Каждая команда описывает один такт работы машины Тьюринга.
Конфигурация машины Тьюринга представляется следующим образом: t = <CqaB>, где
C - цепочка, находящаяся слева от считывающей головки;
q - состояние машины Тьюринга;
a - символ, находящийся под головкой машины Тьюринга;
B - цепочка, находящаяся справа от головки машины Тьюринга.
Конфигурация <CqaB> непосредственно переходит в конфигурацию <CnqnanBn>, если
новая конфигурация получена в результате применения одной команды к исходной
конфигурации.
Обозначим непосредственный переход из одной конфигурации в другую следующим
образом: <CqaB>⇒<CnqnanBn>.
Конфигурация, содержащая начальное состояние, называется начальной, а содержащая
заключительное состояние - заключительной. Если цепочка С в конфигурации пустая, то
начальная и заключительная конфигурации называются стандартными.
Машина Тьюринга перерабатывает цепочку x в цепочку y, если, действуя из начальной
конфигурации и имея на ленте цепочку x, машина Тьюринга переходит в заключительную
конфигурацию, имея на ленте цепочку y. Если начальная и заключительная конфигурации
являются стандартными, то процесс переработки x в y является правильной переработкой.
3.4. Способы представления машины Тьюринга
Существует три способа представления машины Тьюринга: совокупностью команд, в
виде графа, в виде таблицы соответствия.
3.4.1. Представление машины Тьюринга совокупностью команд
Совокупность всех команд, которые может выполнять машина, называется ее
программой.
Машина Тьюринга считается заданной, если заданы ее внешний и внутренний алфавиты,
программа, начальная конфигурация и указано, какие из символов обозначают пустую
ячейку и заключительное состояние.
Чтобы записать совокупность команд, нужно воспользоваться следующими правилами:
1) начальному шагу алгоритма ставится в соответствие q 0 - начальное состояние;
2) циклы реализуются так, что последнее действие цикла должно соответствовать
переходу в то состояние, которое соответствует началу цикла;
3) соседним шагам алгоритма соответствует переход в смежные состояния, которые
соответствуют этим пунктам;
4) последний шаг алгоритма вызывает переход в заключительное состояние.
В качестве примера рассмотрим совокупность команд машины Тьюринга, которая
инвертирует входную цепочку, записанную с использованием нулей и единиц.
Пусть алфавит машины Тьюринга задан множеством A={0, 1, ε}, где
символ ε соответствует пустой ячейке, а число состояний устройства управления задано в
виде множества Q = {q0, q1, qz}.
Если, например,
начальная конфигурация имеет вид q0110011, то конечная
конфигурация после завершения операции инвертирования должна иметь вид qz001100. Для
решения задачи машиной будет порождена следующая последовательность команд:
q01 → q00R,
q10 → q10L,
q11 → q11L,
q00 → q01R,
q1ε → qzεR.
q0 ε → q1εL,
В стандартной начальной конфигурации головка стоит над первым символом слева, и
устройство управления находится в начальном состоянии. На следующем такте машина
Тьюринга, не меняя своего состояния, заменяет символ 0 на 1 или 1 на 0 и сдвигается вправо
на один символ. После просмотра всей цепочки под головкой оказывается символ,
указывающий на пустую ячейку. В этом случае машина Тьюринга переходит в новое
состояние и сдвигается влево на один символ. На последующих тактах управляющее
устройство не меняет своего состояния, оставляет без изменения символ под головкой и
перемещается влево до тех пор, пока не встретит пустую ячейку. Встретив пустую ячейку,
машина Тьюринга переходит в заключительное состояние и перемещается вправо на один
символ, переходя в стандартную заключительную конфигурацию.
3.4.2. Представление машины Тьюринга графом
При представлении машины Тьюринга посредством графа необходимо каждому
состоянию поставить в соответствие вершину графа, а каждой команде - помеченную дугу.
Машина Тьюринга из рассмотренного примера инвертирования цепочки, состоящей из
символов 0 и 1, будет представлена в виде графа следующим образом:
0→0L
0→1R
ε→εL
ε →R
q0
qz
q1
1→0R
1→1L
Начальная и конечная вершины графа обычно выделяются; на рисунке они отмечены
черным кружком. Если на очередном такте работы машины Тьюринга символ на ленте не
изменяется, то в правой части команды его можно не писать (ε на ребре в состояние qz ).
3.4.3. Представление машины Тьюринга таблицей соответствия
При представлении машины Тьюринга данным способом составляется таблица, в
которой каждому состоянию соответствует строка, а каждому символу из входного алфавита
- столбец. В клетках таблицы на пересечении строки и столбца будет находиться действие
(или правая часть команды).
Таблица соответствия для задания машины Тьюринга из рассмотренного примера будет
выглядеть следующим образом:
q0
q1
0
q0 1R
q1 0L
1
Q0 0R
Q1 1L
ε
q1 ε L
q z εL
Инвертирование входной цепочки можно выполнить программой машины Тьюринга,
приведенной в таблице соответствия. Эта программа включает шесть команд.
3.5. Вычислимые функции
Говорят, что машина Тьюринга вычисляет функцию f(x1, x2, ..., xn), если выполняются
следующие условия:
1) для любых x1, x2, ..., xn, принадлежащих области определения функции, машина
Тьюринга из начальной конфигурации, имея на ленте представление аргументов, переходит
в заключительную конфигурацию, имея на ленте результат (представление функции);
2) для любых x1, x2, ..., xn, не принадлежащих области определения функции, машина
Тьюринга из начальной конфигурации работает бесконечно.
Если начальная и заключительная конфигурации машины Тьюринга являются
стандартными, то говорят, что машина Тьюринга правильно вычисляет функцию f.
Функция называется вычислимой по Тьюрингу, если существует машина Тьюринга,
вычисляющая ее.
Для того чтобы доказать вычислимость функции, а в дальнейшем и существование
алгоритма, необходимо построить машину Тьюринга, реализация которой на практике
зачастую представляет собой трудоемкую задачу. В связи с этим возникает необходимость
разбиения алгоритма на отдельные задачи, каждая из которых будет решаться отдельной
машиной Тьюринга. Если объединить программы этих машин, то получится новая
программа, позволяющая решить исходную задачу.
Машины Тьюринга могут вычислять искомую функцию с восстановлением и без
восстановления. Вычисление функции с восстановлением означает работу машины
Тьюринга с сохранением исходных данных:
p0 1X1* . . * 1Xn
*
⇒
p z 1f(X1, X2, . . . , Xn) *1X1* . . * 1Xn.
Приведенное определение позволяет получать на ленте сначала результат, а затем
исходные данные. В отдельных случаях удобно сделать наоборот:
p0 1X1* . . * 1Xn
*
⇒
1X1* . . * 1Xn * p z 1f(X1, X2, . . . , Xn) .
Вычисление функции без восстановления означает работу машины Тьюринга без
сохранения исходных данных:
p0 1X1* . . * 1Xn ⇒* p z 1f(X1, X2, . . . , Xn) .
Справедливо утверждение, что всякая правильно вычислимая функция правильно
вычислима с восстановлением.
3.6. Операции над машинами Тьюринга
1. Композиция машин Тьюринга. Пусть машины Т1 и Т2 имеют программы Р1 и Р2.
Предположим, что внутренние алфавиты этих машин не пересекаются; пусть qz1 заключительное состояние машины Т1, а q02 - начальное состояние машины Т2. Заменим
всюду в программе Р1 заключительное состояние qz1 на начальное состояние q02 машины Т2
и полученную программу объединим с программой Р2. Новая программа Р определяет
машину Т, называемую композицией машин Т1
и Т2 по паре состояний (qz1, q02).
Композиция машин может быть обозначена Т1 ⋅Т2 или Т1Т2. Более подробно композиция
машин записывается следующим образом:
Т = Т(Т1, Т2, (qz1, q02)), где
T1 = (Q1, A1, δ1, p01, pz1, a01, a11),
Т2= (Q2, A2, δ2, p02, pz2, a02, a12).
Пусть a01 = a02 = a0 и a11 = a12 = a1.
Внешний алфавит композиции Т1Т2 является
объединением внешних алфавитов машин Т1 и Т2:
p02
Т= (Q1 ∪ Q2 \ {pz1}, A1 ∪A2, | (δ1,∪ δ2), p01, pz2, a0, a1).
pz1
Операция композиции, выполняемая над алгоритмами, позволяет получать новые, более
сложные алгоритмы из ранее известных простых алгоритмов.
2. Итерация машины Тьюринга. Эта операция применима только к одной машине.
Пусть qz - заключительное состояние машины Т, а qn - какое-либо состояние машины Т,
не являющееся заключительным. Заменим всюду в программе Р машины Т состояние qz на
qn . Полученная программа определяет новую машину Т′(qz, qn), которая называется
итерацией машины Т по паре состояний (qz, qn). Если машина Тьюринга имеет одно
заключительное состояние, то после выполнения итерации получается машина, не имеющая
заключительного состояния.
3. Разветвление машин Тьюринга. Пусть машины Тьюринга Т1, Т2 и Т3 задаются
программами Р1, Р2 и Р3 соответственно. Считаем, что внутренние алфавиты этих машин
попарно не пересекаются. Пусть qz11 и qz12 - какие-либо различные заключительные
состояния машины Т1. Заменим всюду в программе Р1 состояние qz11 начальным состоянием
q02 машины Т2, а состояние qz12 начальным состоянием q03 машины Т3. Затем новую
программу объединим с программами Р2 и Р3. Получим программу Р, задающую машину
Тьюринга и обозначаемую:
Т = Т(Т1, (qz11, q02), Т2, (qz12, q03), Т3).
Машина Т называется разветвлением машин Т2 и Т3, управляемым машиной Т1.
3.7. Примеры построения машин Тьюринга
Пример 1. Построить машину Тьюринга, которая правильно вычисляет функцию f(x) =
x+1 по правилам двоичного сложения.
Решение. Исходя из формулировки задачи, требующей вычислить функцию по правилам
сложения в двоичной системе сложения, выберем входной алфавит:
А ={0, 1, ε}.
Представим машины Тьюринга таблицей соответствия и графом.
Таблица соответствия:
0
1
ε
q0
q0 0R
q0 1R
Q1 ε L
q1
q2 1L
q1 0L
q2 1L
q2
q2 0L
Q2 1L
qz ε R
Представление машины Тьюринга в виде графа:
1→ 1R
q0
0 → 0L
1 → 0L
ε → ε L
0 → 1L
ε → ε R
q2
q1
qz
ε → 1L
0 → 0R
1 → 1L
Запишем программу построенной машины Тьюринга для случая, когда входная цепочка
на ленте равна двоичному числу 111. Слева от каждой команды приведем представление
входной цепочки на ленте до выполнения данной команды. Символ, который находится под
головкой, будем помечать подчеркиванием.
1) q01 → q01R ε111ε
6) q11 → q10L ε110ε
2) q01 → q01R
3) q01 → q01R
4) q0ε → q1εL
5) q11 → q10L
ε111ε
ε111ε
ε111ε
ε111ε
7) q11 → q10L
8) q1ε → q21L
9) q2 ε → qz εR
ε100ε
ε000ε
ε1000ε
Из примера видно, что машина Тьюринга из стандартной начальной конфигурации, имея
на ленте аргумент 111, выполнив совокупность команд 1-9, перешла в стандартное
заключительное состояние, имея на ленте результат 1000. Действительно:
1112 + 12 = 10002.
Пример 2. Построить машину Тьюринга, выполняющую операцию (x div 2) и имеющую
входной алфавит А = {0, 1, ε}.
Таблица соответствия данной машины Тьюринга будет иметь следующий вид:
q0
0
q0 0R
1
q0 1R
q1
q3 ε L
q2 ε L
ε
q1 ε L
q2
0
q3 1L
1
q2 0L
ε
q3 1L
q3
q2 0L
q2 1L
qz ε R
Операция (x div 2) реализована сдвигом цепочки вправо на 1 разряд.
Пример 3. Построить машину Тьюринга, которая выполняет копирование заданного
аргумента. Выберем входной алфавит А={0,1,ε}. Представим данную машину таблицей
соответствия:
q0
q1
q2
q3
0
q11L
q00R
1
q10R
q11R
q21R
q31L
*
q0*L
q2*R
ε
qzεR
q2*R
q31L
q3*L
Запишем программу построенной машины для заданной входной цепочки на ленте,
равной двоичному числу 111. Слева от каждой команды приведем представление входной
цепочки на ленте до выполнения данной команды. Символ, который находится под
головкой, будем помечать подчеркиванием.
1) q01 → q10R
2) q11 → q11R
3) q11 → q11R
4) q1ε → q2*R
5) q2ε → q31L
6) q3* → q3*L
7) q31 → q31L
8) q31 → q31L
9) q30 → q00R
10) q01 → q10R
11) q11 → q11R
12) q1* → q2*R
13) q21 → q21R
14) q2ε → q31L
ε111ε
ε011ε
ε011ε
ε011ε
ε011*ε
ε011*1ε
ε011*1ε
ε011*1ε
ε011*1ε
ε011*1ε
ε001*1ε
ε001*1ε
ε001*1ε
ε001*1ε
17) q31 → q31L
18) q30 → q00R
19) q01 → q10R
20) q1* → q2*R
21) q21 → q21R
22) q21 → q21R
23) q2ε → q31L
24) q31 → q31L
25) q31 → q31L
26) q3* → q3*L
27) q30 → q00R
28) q0* → q0*L
29) q00 → q01L
30) q00 → q01L
ε001*11ε
ε001*11ε
ε000*11ε
ε000*11ε
ε000*11ε
ε000*11ε
ε000*11ε
ε000*111ε
ε000*111ε
ε000*111ε
ε000*111ε
ε000*111ε
ε000*111ε
ε001*111ε
15) q31 → q31L ε001*11ε
16) q3* → q3*L ε001*11ε
31) q00 → q01L
32) q0ε → qz1R
ε011*111ε
ε111*111ε
Из примера видно, что машина Тьюринга из стандартной начальной конфигурации,
имея на ленте аргумент 111 и выполнив совокупность команд 1-32, перешла в стандартное
заключительное состояние, имея на ленте результат ε111*111ε.
3.8. Машина Тьюринга с полулентой
В рассмотренных выше определениях машины Тьюринга использовалась бесконечная в
обе стороны лента. Ограничим ленту с одной стороны и покажем, что машина Тьюринга с
правой или левой полулентой эквивалентна машине Тьюринга с бесконечной лентой.
Говорят, что функция, правильно вычислимая на машине Тьюринга с обычной лентой,
правильно вычислима и на машине Тьюринга с правой полулентой, т.е. для любой машины
Тьюринга Т существует эквивалентная ей машина с правой полулентой TR.
Идея доказательства этого утверждения основана на следующих предпосылках:
а) рабочая область ленты ограничена двумя маркерами: неподвижным - слева и
подвижным - справа;
б) на внутренней части ограниченной области машина Тьюринга с полулентой должна
работать как обычная машина Тьюринга, а при выходе на маркеры она должна освобождать
рабочее пространство, для этого правый маркер может сдвигаться вправо, а при выходе на
левый маркер необходимо сдвинуть всю цепочку вправо;
в) полученный результат, находящийся между маркерами, в конце работы машины
Тьюринга нужно сдвинуть вплотную к левому маркеру.
Машина Тьюринга может вычислять функцию с восстановлением, то есть с сохранением
исходных данных. Это позволяет получить на ленте сначала результат, а затем - исходные
данные или наоборот.
Рассмотрим пример построения машины Тьюринга с правой полулентой, вычисляющей
функцию f(x) = 2x. Алгоритм вычисления данной функции состоит в приписывании нуля к
входной цепочке справа.
Таблица соответствия данной машины Тьюринга будет иметь следующий вид:
<
q0
0
q0 0R
1
q0 1R
q1
q2
>
q1 0R
ε
q2 >L
qz < R
q2 0L
q2 1L
Здесь символ “<“ обозначает левый маркер, а символ “>“ - правый маркер. Машина
Тьюринга, начав работу из стандартной начальной конфигурации, после выполнения
совокупности команд переходит в стандартную заключительную конфигурацию.
Полученный результат располагается между маркерами и сдвинут вплотную к левому
маркеру.
3.9. Универсальная машина Тьюринга
До сих пор мы имели дело со специализированными машинами Тьюринга,
предназначенными для решения конкретных задач и отличающимися набором команд,
внутренним и внешним алфавитами. Однако можно построить универсальную машину
Тьюринга, способную выполнять любой алгоритм, а значит работу любой машины
Тьюринга. В ней входное слово должно включать изображение программы и входное слово
интерпретируемой машины.
Чтобы получить изображение программы интерпретируемой машины, нужно
последовательно, строка за строкой, закодировать эту программу в алфавите универсальной
машины. Универсальная машина Тьюринга должна иметь фиксированный внешний
алфавит, используемый при записи программы, включая и алфавит интерпретируемой
машины.
Она должна быть приспособлена к приему в качестве исходной информации
всевозможных состояний устройства управления и конфигураций, в которых могут
встречаться буквы из разнообразных алфавитов со сколь угодно большим числом различных
букв.
Это достигается путем кодирования конфигурации и программы любой заданной
машины Тьюринга в символах входного алфавита универсальной машины.
Само
кодирование должно выполняться следующим образом:
1) различные буквы должны заменяться различными кодовыми группами, но одна и та
же буква должна заменяться всюду, где бы она не встречалась, одной и той же кодовой
группой;
2) строки кодовых записей должны однозначным образом разбиваться на отдельные
кодовые группы;
3) должна существовать возможность распознать, какие кодовые группы соответствуют
различным сдвигам управляющей головки (R, L, E), и различать кодовые группы,
соответствующие буквам внутреннего алфавита и буквам внешнего алфавита.
Рассмотрим пример такого кодирования для машины Тьюринга Т, имеющей внешний
алфавит A = {a1, a2, ... , ak} и внутренний алфавит Q = {q1, q2, ... , qz}. Если внешний алфавит
состоит из символов А = {0, 1}, то условия кодирования будут соблюдены при следующем
способе кодирования.
1. В качестве кодовых групп возьмем 3+k+m различных слов вида 100...01, где между
единицами проставляются нули; k - число символов внешнего алфавита; m - число
состояний устройства управления.
Тогда разбивка строк на кодовые группы производится путем выделения
последовательностей нулей, заключенных между двумя единицами.
2. Сопоставление кодовых групп исходным символам внешнего и внутреннего
алфавитов осуществляется согласно следующей таблице кодирования:
Буква
R
E
L
К о д о в а я гр у п п а
101
1001
10001
100001
a1
a2
10000001
.................................
ak
1 0 ...........0 1
- 4 нуля
- 6 н у л ей
В н у т р ен н и й q1
1000001
а л фа в и т
q2
100000001
(со ст о я н и я )
.................................
1 0 ................0 1
qm
- 5 н у л ей
- 7 н у л ей
В н еш н и й
а л фа в и т
2 ( k + 1) н у л е й
Ч ет н о е
ч и сл о
н у л ей ,
б о л ь ш ее
ч ем 2
Н еч ет н о е
ч и сл о
н у л ей ,
б о л ь ш ее
2 ( m + 1) + 1 н у л е й ч е м 3
Например, для машины Тьюринга, которая перерабатывает слово bcad в слово bccd,
входное слово в универсальной машине Тьюринга с данным кодом будет представлено
следующей строкой:
10000001 1000000001 100001 100000000001,
где 100001 - a, 10000001 - b, 1000000001 - c, 100000000001 - d.
Программа же будет представлена следующими строками:
1) 1000001 10000001 1000001 10000001 101
(q 0b → q 0 b R)
2) 1000001 1000000001 1000001 1000000001 101
(q 0c → q 0 c R)
3) 1000001 100001 100000001 1000000001 101
(q 0 a → q 1 c R)
3) 100000001 100000000001 10000000001 100000000001 10001
(q1d→q2dL).
Рассмотрим еще один пример. Пусть на ленту универсальной машины Тьюринга
поступает слово, составленное из букв английского алфавита. Задача машины Тьюринга переставлять местами буквы n и o таким образом, чтобы сочетание on преобразовывалось в
no. Таким образом, после переработки входного слова в нем не должно остаться ни одного
буквосочетания on.
Возьмем слово mnonnop, которое должно преобразоваться универсальной машиной
Тьюринга в новое слово mnnnoop.
Пусть внешний алфавит универсальной машины Тьюринга состоит из символов A =
{0,1}, а внутренний алфавит Q = {q0, q1, q2, q3, qz }, где qz - заключительное
состояние. Разбивка входных символов на кодовые группы и сопоставление кодовых групп
исходным символам внешнего и внутреннего алфавитов осуществляется согласно
приведенной выше таблице кодирования.
Тогда входное слово будет представлено следующим образом:
100001 10000001 1000000001 10000001 10000001 1000000001 100000000001,
где 100001 - m, 10000001 - n, 1000000001 - o, 100000000001 - p.
Ниже представлены команды универсальной машины Тьюринга, которые будут
выполняться при обработке и преобразовании исходного слова. Напротив каждой команды
приводится входное слово таким, какое оно есть в момент начала выполнения данной
команды. Символ, на который указывает головка машины Тьюринга, показан как прописная
буква.
q 0m → q 0m R
q 0n → q 0n R
q 0o → q 1o R
q 1n → q 2o L
q 2o → q 0n R
q 0o → q 1o R
q 1n → q 2o L
q 2o → q 0n R
q 0o → q 1o R
q 1o → q 0o R
q 0p → q zp E
Mnonnop
mNonnop
mnOnnop
mnoNnop
mnOonop
mnnOnop
mnnoNop
mnnOoop
mnnnOop
mnnnoOp
m n n n o o P.
Программа же будет выглядеть так:
1000001 100001 1000001 100001 101
1000001 10000001 1000001 10000001 101
1000001 1000000001 100000001 1000000001 101
100000001 10000001 10000000001 1000000001 10001
10000000001 1000000001 1000001 10000001 101
1000001 1000000001 100000001 1000000001 101
100000001 10000001 10000000001 1000000001 10001
10000000001 1000000001 1000001 10000001 101
1000001 1000000001 100000001 1000000001 101
100000001 1000000001 1000001 1000000001 101
1000001 100000000001 1000000000001 100000000001
1001.
Таким образом, если какая-либо машина Тьюринга Т решает некоторую задачу, то и
универсальная машина Тьюринга способна решить эту задачу при условии, что кроме кодов
исходных данных этой задачи на ее ленту будет подан код программы машины Т. Задавая
универсальной машине Тьюринга Тu изображение программы любой данной машины
Тьюринга Тn и изображение любого ее входного слова xn, получим изображение выходного
слова yn, в которое машина Тn переводит слово xn .
Если же алгоритм, реализуемый машиной Тn, не применим к слову xn, то алгоритм,
реализуемый универсальной машиной Тu, также не применим к слову, образованному из
изображения xn и программы машины Тn.
Таким образом, машина Тьюринга Тn может рассматриваться как одна из программ для
универсальной машины Тu .
В связи с существованием универсальной машины Тьюринга таблицы соответствия,
описывающие различные состояния устройства управления машины, имеют двоякое
назначение:
1) для описания состояний устройства управления специальной машины Тьюринга,
реализующей соответствующий алгоритм;
2) для описания программы, подаваемой на ленту универсальной машины Тьюринга,
при реализации соответствующего алгоритма.
Современные ЭВМ строятся как универсальные; в запоминающее устройство наряду с
исходными данными поставленной задачи вводится также и программа ее решения.
Однако в отличие от машины Тьюринга, в которой внешняя память (лента) бесконечна, в
любой реальной вычислительной машине она конечна.
3.10. Алгоритмически неразрешимые проблемы
Свойство массовости алгоритмов означает, что они предназначены для решения
некоторой массовой проблемы, формулируемой в виде отображения множества входных
слов в соответствующие им выходные слова. Поэтому всякий алгоритм можно
рассматривать как универсальное средство для решения целого класса задач.
В теории алгоритмов известны некоторые задачи, для решения которых не существует
единого универсального приема. Однако алгоритмическая неразрешимость проблемы
решения задач того или иного класса не означает невозможность решения любой конкретной
задачи из этого класса. В данном случае речь идет о невозможности решения всех задач
одного класса одним и тем же приемом.
Таким образом, задачи (проблемы) можно разделить на алгоритмически разрешимые и
алгоритмически неразрешимые.
Обычно алгоритмическая неразрешимость новых задач доказывается методом
сведения к этим задачам известных алгоритмически неразрешимых задач. Тем самым
доказывается, что если бы была разрешима новая задача, то можно было бы решить и
заведомо неразрешимую задачу. Применяя метод сведения, обычно ссылаются на
искусственные задачи, которые не представляют самостоятельного интереса, но для
которых легко непосредственно доказать их разрешимость. К числу таких задач относится
проблема распознавания самоприменимости.
Самоприменимыми называются алгоритмы, которые, начав работу над собственным
описанием, рано или поздно останавливаются. Если же алгоритм в таком случае
зацикливается, он называется несамоприменимым. Аналогично можно говорить о
самоприменимости машин Тьюринга, имея в виду их применение к своим линейным
изображениям.
Таким образом, возникает задача: как узнать, является ли самоприменимым тот или
иной алгоритм.
Проблема распознавания самоприменимости алгоритмов состоит в том, чтобы найти
единый конструктивный прием, позволяющий за конечное число шагов по схеме любого
данного алгоритма узнать, является алгоритм самоприменимым или несамоприменимым.
Доказательство того, что общего алгоритма распознавания самоприменимости не
существует, можно проводить, используя алгоритмические системы Тьюринга. На основе
этого доказательства было показано, что проблема распознавания самоприменимости
алгоритмически неразрешима.
3.11. Задания для самостоятельной работы
1. Построить машину Тьюринга, выполняющую операцию конкатенации двух цепочек,
заданных во входном алфавите А = {0, 1, *, ε}.
2. Построить машину Тьюринга, выполняющую операцию копирования входной
цепочки, заданной в алфавите А = {1, *, ε }, где символ “*” используется в качестве
разделителя двух цепочек.
3. Построить машину Тьюринга в алфавите А={0, 1}, которая, начав работу с последней
единицы массива из единиц, сдвигает его на одну ячейку влево, не изменяя остального
содержимого ленты. Головка останавливается на первой единице перенесенного массива.
4. По заданной совокупности команд машины Тьюринга Т и начальной конфигурации К
найти заключительную конфигурацию.
4.1.
q01 → q01R,
q10 → qz1E,
q11 → q11L,
q00 → q11R,
а) К = 1101q001;
б) К = 101q0010.
4.2.
q00 → q01L,
q11 → q00R,
q10 → qz0L,
q01 → q11R,
а) K = 1q1 0111; б) K = 1q11111.
4.3.
q10 → q11L,
q00 → q10L,
q11 → qz0R,
q01 → q00R,
а) K = 1000q1 01; б) K = 11q111101.
5. Построить машину Тьюринга, которая во входной цепочке, заданной в алфавите А =
{0, 1, ε}, переставляет единицы и нули так, чтобы все единицы были в начале, а нули в конце
цепочки.
6. Построить композицию Т1⋅Т2 машин Тьюринга Т1 и Т2 по паре состояний (q1z, q20) и
найти результат применения композиции Т1⋅Т2 к слову D.
6.1. Машины Т1 и Т2 заданы таблицами соответствия:
T1:
0
1
q10
q1z0L
q111R
q11
q120R
q121R
q20
q12
q100R
q100R
q21
T2:
0
1
q211L
q211L
а) D = 111100111011;
q2z0R
q200L
б) D = 11010111.
6.2. Машины Т1 и Т2 заданы таблицами соответствия:
T1:
T2:
0
1
q10
q110R
q101R
q11
q120R
q101R
q12
q1z1L
0
1
q20
q210L
q201L
q21
q220L
q211L
q22
q2z0R
q221L
а) D = 11000101001;
б) D = 10100111110.
7. Найти результат применения итерации машины Т по паре состояний (qz1, qi) к слову D.
Заключительными состояниями машины Т являются qz1 и qz2. На ленте первоначально
записаны нули, а в начальной конфигурации головка указывает на левый символ входной
цепочки, состоящей из единиц.
7.1. Машина Тьюринга задана таблицей соответствия:
T:
0
1
a) i = 1, D = 13k,
q0
qz10E
q10R
q1
q30E
q20R
q2
q40E
q00R
q3
q41R
q4
qz21L
б) i = 1, D = 13k+2, k ≥ 1.
k ≥ 1;
7.2. Машина Тьюринга задана таблицей соответствия:
T:
0
1
a) i = 3, D = 12k+1, k ≥ 1;
q0
qz20R
q10R
q1
qz20R
q20R
q2
q30R
q21R
q3
q41L
q10E
q4
q50L
q41L
q5
qz10R
q51L
б) i = 1, D = 13k+2, k ≥ 1.
4. ФОРМАЛЬНЫЕ ГРАММАТИКИ И ЯЗЫКИ
4.1. Общие сведения
В последние три десятилетия появилось большое количество работ по общей теории
языков и грамматик. Можно выделить четыре научных направления, которые удалось
объединить по методам их исследования в одну общую задачу теории языков.
Первое из этих направлений связано с построением формальной, или математической,
лингвистики, которая начала особенно быстро развиваться в тот период, когда были
сформулированы вопросы машинного перевода. Эта проблема требовала формализации
понятий словарь, грамматика, язык, их классификации и умения относить конкретные
словари, грамматики, языки к определенному классу.
Интерес к задачам такого рода еще более усилился с появлением искусственных языков
программирования. С появлением трансляторов проблема перевода во многом определила
построение общей теории вычислительных машин, а сами языки программирования стали
все более приближаться к формально построенным математическим конструкциям.
Независимо от указанных двух направлений развивалось построение формальных
моделей динамических систем. Для создания продуктивной теории эти модели должны были
быть, с одной стороны, достаточно узкими, а с другой - достаточно широкими, чтобы
охватить некоторый общий класс прикладных задач. Типичным примером такого рода
является модель конечного автомата. Эта модель позволяет описать многие процессы,
заданные на конечных множествах и развивающиеся в счетном времени, что позволило
создать для нее продуктивную теорию. Если в эту модель ввести бесконечность по какомулибо параметру, то это приводит к общему классу систем, например, к машинам Тьюринга.
Независимо и параллельно развивалась общая теория алгоритмов как ветвь современной
математики. Развитие вычислительной техники поставило перед математической теорией
алгоритмов новую задачу: стало необходимым классифицировать алгоритмы по различным
признакам. Эквивалентность понятий "алгоритм" и "машина Тьюринга" позволила
предположить, что поиски классификации алгоритмов окажутся связанными с поисками
промежуточных моделей между моделями конечного автомата и машиной Тьюринга.
Таким образом, перечисленные четыре направления оказались тесно связанными. Теория
языков, порожденная чисто лингвистическими задачами, оказалась в центре интересов
математиков,
занимающихся
теорией алгоритмов, и ученых, разрабатывающих
абстрактные модели динамических систем и теоретические основы автоматики.
Теория формальных языков и грамматик является разделом математической
лингвистики - специфической математической дисциплины,
ориентированной
на
изучение структуры естественных и искусственных языков. По характеру используемого
математического аппарата теория формальных грамматик и языков близка к теории
алгоритмов и теории автоматов.
На интуитивном уровне язык можно определить как некоторое множество предложений
с заданной структурой, имеющих определенное значение. Правила, определяющие
допустимые конструкции языка, составляют синтаксис языка. Значение, или смысл фразы,
определяется семантикой языка.
Если бы все языки состояли из конечного числа предложений, то не было бы проблемы
синтаксиса. Но, так как язык содержит неограниченное (или довольно большое) число
правильно построенных фраз, то возникает проблема описания бесконечных языков с
помощью каких-либо конечных средств.
Различают следующие виды описания языков:
1) порождающее, которое предполагает наличие алгоритма,
последовательно
порождающего все правильные предложения языка;
2) распознающее, которое предполагает наличие алгоритма, определяющего
принадлежность любой фразы данному языку.
4.2. Основные понятия порождающих грамматик
Алфавит - это непустое конечное множество. Элементы алфавита называются
символами.
Цепочка над алфавитом Σ={а1, а2, …, аn} есть конечная последовательность элементов
аi. Множество всех цепочек над алфавитом Σ обозначается Σ*.
Длина цепочки х равна числу ее элементов и обозначается |x|. Цепочка нулевой длины
называется пустой и обозначается символом ε. Соответственно, непустая цепочка
определяется как цепочка ненулевой длины. Пусть имеется алфавит Σ={а, b}. Тогда
множество всех цепочек определяется следующим образом: Σ*={ ε, а, b, aa, ab, ba, bb, aaa,
aab, aba, . . .}.
Цепочки x и y равны, если они одинаковой длины и совпадают с точностью до порядка
символов, из которых они состоят.
Над цепочками x и y определена операция сцепления (конкатенации, произведения),
которая получается дописыванием символов цепочки y за символами цепочки x.
Язык L над алфавитом Σ представляет собой множество цепочек над Σ. Необходимо
различать пустой язык L=0 и язык, содержащий только пустую цепочку: L={ε}≠0.
Формальный язык L над алфавитом Σ - это язык, выделенный с помощью конечного
множества некоторых формальных правил.
Пусть M и L - языки над алфавитами. Тогда конкатенация LM = {xyx∈L, y∈M}. В
частности, {ε}L = L{ε}=L. Используя понятие произведения, определим итерацию L* и
усеченную итерацию L+ множества L:
L+ =
L* =
∞
i
UL ,
i =1
∞
i
UL ,
i =1
где i - степень языка, L определяется рекурсивно следующим образом:
L0 = {ε};
L1 = L;
Ln+1 = Ln L = L Ln;
{ε}L=L{ε}=L.
Например, если задан язык L={a}, тогда L*={ε, а, аа, ааа, …}, L+={a, aa, aaa, …}.
Порождающая грамматика - это упорядоченная четверка G= (VT, VN, P, S), где
VT - конечный алфавит, определяющий множество терминальных символов;
VN - конечный алфавит, определяющий множество нетерминальных символов;
Р - конечное множество правил вывода, т.е. множество пар следующего вида:
u → v,
где u, v ∈(VT∪VN)*;
S - начальный символ (аксиома грамматики), S∈VN.
Из терминальных символов состоят цепочки языка, порожденного грамматикой.
Аксиомой называется символ в левой части первого правила вывода грамматики.
Для того чтобы различать терминальные и нетерминальные символы, принято
обозначать терминальные символы строчными, а нетерминальные символы заглавными
буквами латинского алфавита.
В грамматике G цепочка х непосредственно порождает цепочку у, если х = αuβ, у = αvβ
и u→v ∈ Р, т.е. цепочка у непосредственно выводится из х, что обозначается х => у.
Языком, порождаемым грамматикой G = (VT, VN, Р, S), называется множество
терминальных цепочек, выводимых в грамматике G из аксиомы:
L(G) = {х | х ∈ VT*; S => *х}, где =>*- выводимость.
Пример. Дана грамматика G = (VT, VN, Р, S), в которой VT = {а, b}, VN = {S}, Р = {S →
aSb, S → ab). Определить язык, порождаемый этой грамматикой.
Решение. Используя рекурсию, выведем несколько цепочек языка, порождаемого данной
грамматикой:
S → ab;
S → aSb => aabb;
S → aSb =>aaSbb => aaabbb; . . .
Определим язык, порожденный данной грамматикой:
L(G) = {anbn | n > 0}.
Говоря о представлении грамматик, нужно отметить, что множество правил вывода
грамматики может приводиться без специального указания множеств терминалов и
нетерминалов. В таком случае обычно предполагается, что грамматика содержит в точности
те терминальные и нетерминальные символы, которые встречаются в правилах вывода.
Также предполагается, что правые части правил, для которых совпадают левые части,
можно записать в одну строку с использованием разделителя. Так, правила вывода из
приведенного примера можно записать следующим образом: S → aSb | ab.
4.3. Классификация грамматик
Правила порождающих грамматик позволяют осуществлять преобразования строк.
Ограничения же на виды правил позволяют выделить классы грамматик. Рассмотрим
классификацию, которую предложил Н. Хомский.
Грамматики типа 0 - это грамматики, на правила вывода которых нет ограничений.
Грамматики типа 1, или контекcтные грамматики -это грамматики, все правила которых
имеют следующий вид: хАу → хϕу, где A ∈ VN, x, y, ϕ ∈ (VN ∪ VT)+.
Грамматики типа 2 - это бесконтекстные, или контекстно-свободные грамматики (КСграмматики). Правила вывода для этих грамматик имеют следующий вид: А → ϕ, где А ∈
VN, ϕ ∈ (VN ∪ VT)*.
Грамматики типа 3 - это автоматные грамматики, которые делятся на два типа:
а) леволинейные (леворекурсивные), правила вывода для которых имеют следующий
вид: А → Аа | a, где А ∈ VN;
б) праволинейные (праворекурсивные), правила вывода для которых имеют следующий
вид: А → Aа | a.
Язык L называется языком типа i, если существует грамматика типа i, порождающая
язык L.
4.3.1. Методика решения задач
Пример 1. Дана порождающая грамматика G = (VT, VN, Р, S), в которой VT = {a, d, е}, VN
= {В, С, S}, Р = {S → аВ, В → Cd | dC, С → е}. Выписать терминальные цепочки,
порожденные данной грамматикой, и определить длину их вывода.
Решение. Получим следующие терминальные цепочки:
S → аВ → aCd → aed,
S → аВ → adC → ade,
длина вывода которых равна 3.
Пример 2. Дана грамматика G = (VT, VN, Р, C), в которой VT = {a, b, c, d, е}, VN = {A, В,
С, D, E}, Р = {A → ed, В → Ab, С → Bc, С → dD, D → Ae, E → bc}. Определить,
принадлежит ли языку L(G) цепочка eadabcb.
Решение. Выведем возможные терминальные цепочки из аксиомы с помощью заданных
правил вывода:
С → Bc → Abc → edbc,
С → dD → dAe → dede.
Так как первые же терминальные символы полученных цепочек не совпадают с
заданной, можно сделать вывод о том, что цепочка eadabcb не принадлежит языку L(G).
Пример 3. Построить КС-грамматику (грамматику типа 2), порождающую цепочки из 0
и 1 с одинаковым числом тех и других символов.
Решение. Определим множества, задающие грамматику: VT = {0, 1}; VN = {S}; Р =
{S → 0S1, S → 1S0, S → ε, S → S01, S → S10}.
Пример 4. Описать язык, порождаемый следующими правилами: S → bSS | а.
Решение. Построим несколько терминальных цепочек, применяя заданные правила
вывода:
S → a;
S → bSS → baa;
S → bSS → bbSSS → bbaaa;
S → bSS → bbSSbSS → bbaabaa;
S → bSS → bbSSbSS → bbbSSbSSbbSSbSS → ...
Из полученных цепочек видно, что:
а) цепочки всегда начинаются с терминала b, кроме аксиомы, и заканчиваются
терминалом а;
б) количество терминалов а в любой цепочке всегда на 1 больше, чем b.
Исходя из этих выводов, определим язык, порождаемый заданными правилами,
следующим образом:
L(G) = {α | α ∈ {a, b}*}, |a| = |b| + 1, причем цепочки начинаются с терминала b и
заканчиваются терминалом а.
4.4. Грамматический разбор
В КС-грамматике может быть несколько выводов, эквивалентных в том смысле, что в
них применяются одни и те же правила к одинаковым в промежуточном выводе цепочкам,
но в различном порядке. Например, для грамматики G с правилами вывода S → ScS|b|a
возможны следующие эквивалентные выводы терминальной цепочки acb: S → ScS →
Scb → acb и S → ScS → acS → acb.
Деревом вывода цепочки х в КС-грамматике G = (VT, VN, Р, S) называется
упорядоченное дерево, каждая вершина которого помечена символом из множества V ∪ VN
∪ {ε} так, что каждому правилу А → b1b2b3 ... bk, использующемуся при выводе цепочки х, в
дереве вывода соответствует поддерево с корнем А и прямыми потомками b1, b2, b3, ..., bk,
которое приведено на рисунке:
A
b1 b2
…
bk
В силу того, что цепочка х ∈ L(G) выводится из аксиомы S, корнем вывода всегда
является аксиома. Внутренние узлы вывода соответствуют нетерминальным символам.
Концевые вершины дерева вывода - листья - это вершины, не имеющие потомков. Такие
вершины соответствуют либо терминалам, либо пустым символам (ε) при условии, что среди
правил грамматики имеются правила с пустой правой частью. При чтении слева направо
концевые вершины дерева вывода образуют цепочку х.
Дерево
вывода
часто
называют
деревом грамматического разбора, или
синтаксическим деревом, а процесс построения дерева вывода - грамматическим разбором
(синтаксическим анализом). Одной цепочке языка может соответствовать больше одного
дерева, так как эта цепочка может иметь разные выводы, порождающие разные деревья.
КС-грамматика G == (VT, VN, Р, S) называется неоднозначной (неопределенной), если
существует цепочка х ∈ L(G), имеющая два или более дерева вывода.
Рассмотрим пример.
Пусть даны две КС-грамматики:
G1 = (VT, VN, Р1, S), VN = {S},
P1={S → S+S | S | S⋅S | (S) | a};
G2= (VT, VN, Р2, S), VN = {S, A, B},
P2 = {S → S + A | A | A, A → A⋅B | A / B | B, B → a| (S)}, содержащие в множестве
терминальных символов знаки операций, круглые скобки и символ а. Определить, являются
ли грамматики однозначными. Если какая-либо из них неоднозначна, привести пример
цепочки, для которой существует два различных дерева вывода.
Решение: Грамматика G1 является неоднозначной, так как она имеет правила с правой
частью, содержащей два вхождения нетерминала S и знак арифметической операции.
Построим два дерева вывода для простейшей цепочки а + а + а:
Грамматика G2 является однозначной, так как не содержит правил с двойным
вхождением нетерминального символа. Так, для цепочки а + а + а она имеет только одно
дерево вывода.
В некоторых случаях неоднозначность в грамматиках может устраняться путем
эквивалентных преобразований. Однако в общем случае проблема устранения
неоднозначности неразрешима. На практике от неоднозначности избавляются путем
задания словесных ограничений, называемых контекстными условиями языка, которые
включаются в его семантику.
Различают две стратегии грамматического разбора: восходящую и нисходящую, которые
соответствуют способу построения синтаксических деревьев. При нисходящей стратегии
разбора дерево строится от корня аксиомы вниз, к терминальным вершинам. Главной
задачей при нисходящем разборе является выбор того правила, которое следует применить
на рассматриваемом шаге. При восходящем разборе дерево строится от терминальных
вершин к корню дерева (аксиоме).
Преобразование цепочки, обратное порождению, называется редукцией.
4.4.1. Представление грамматики в виде графа
Дерево грамматического разбора не следует путать с представлением грамматики в виде
графа. Граф грамматики в качестве вершин содержит сентенциальные формы (любые
цепочки, выводимые из аксиомы).
Рассмотрим представление грамматики G в виде графа: G = (VT, VN, Р, S), в которой VT =
{a, b, с}, VN = {S}, P={S → aSa | bSb | c}.
4.5. Преобразования КС-грамматик
Часто требуется изменить грамматику таким образом, чтобы она удовлетворяла
определенным требованиям, не изменяя при этом порождаемый грамматикой язык. Для
этого используются эквивалентные преобразования КС-грамматик, некоторые из которых
рассмотрены ниже.
4.5.1. Удаление правил вида А → В
Преобразование первого типа состоит в удалении правил А → В, или <нетерминал> →
<нетерминал>.
Покажем, что для любой КС-грамматики можно построить эквивалентную грамматику,
не содержащую правил вида: А → В, где А и В - нетерминальные символы.
Пусть имеется КС-грамматика G=(VT, VN, P, S), где множество нетерминалов VN={A1,
A2, . . . , An}. Разобьем Р на два непересекающихся множества: P = P1 ∪ P2. В P1 включены
все правила вида Аi → Ak, в P2 включены все остальные правила, т.е. P2 = P \ P1. Затем для
каждого Аi определим множество правил P(Аi), включив в него все такие правила Аi→ϕ, что
Аi →* Aj и Аj → ϕ, где Аj → ϕ ∈ P2. Построим эквивалентную КС-грамматику Gэ = (VT, VN,
Pэ, S), в которой множества терминальных и нетерминальных символов, а также аксиома
совпадают с теми же объектами исходной грамматики G, а множество правил Pэ получено
объединением правил множества P2 и правил P(Аi) для всех 1≤ i ≤n:
Pэ =
n
U
i=1
P ( A i ) ∪ P2 .
Пример. Пусть задана грамматика G со следующими правилами вывода S → aFb | А; А
→ аА | В; В → aSb | S; F → bc | bFc.
Построим множества правил Р2, P(S), P(A), P(B), P(F).
Определим правила для Р2: Р2 = {S → aFb; А → аА; В → aSb; F → bc | bFc}.
Определим правила для P(S): S => A => B или S =>*А; S=>В, где =>* обозначает
непосредственную выводимость. P(S) = {S → аА; S → aSb).
Определим правила для Р(А): А => В => S или А =>* В; А => S. Р(А) = {А → aSb; А →
aFb}.
Определим правила для Р(В): В => S => А или В =>* S; В =>*А. Р(В) = {В → aFb; В →
аА}.
Определим правила для P(F): так как непосредственно выводимых нетерминалов не
существует, то P(F) = 0.
Объединив полученные правила, можно записать грамматику Gэ, эквивалентную
исходной:
S → aFb | aSb | аА;
А → аА | aSb | aFb;
В → аА | aSb | aFb;
F → bc | bFc.
Графическая модификация метода
Аналитическое преобразование по рассмотренному алгоритму оказывается довольно
сложным. При автоматизированном преобразовании грамматик проще применить
графическую модификацию этого метода. С этой целью каждому нетерминальному символу
и каждой правой части правил из множества Р2 поставлена в соответствие вершина графа.
Из вершины с меткой U в вершину с меткой V направлено ребро, если в грамматике
существует правило U → V.
aFb
aA
aSb bFc
S
A
B
bc
F
В эквивалентную грамматику будут включены правила вида А → w, A∈VN; w∈(VT ∪
VN)*, если из вершины с меткой А существует путь в вершину с меткой w.
S → aFb | aSb | аА;
А → аА | aSb | aFb;
В → аА | aSb | aFb;
F → bc | bFc.
Получено то же множество правил Р, что и аналитическим методом.
4.5.2. Построение неукорачивающей грамматики
Грамматика, не содержащая правил с пустой правой частью, называется
неукорачивающей грамматикой.
В грамматике с правилами вида А→ε длина выводимой цепочки при переходе от k-го
шага к (k+1)-му уменьшается. Поэтому грамматики с правилами вида А→ε называются
укорачивающими. Восходящий синтаксический разбор в укорачивающих грамматиках
сложнее по сравнению с разбором в неукорачивающих грамматиках, т.к. при редукции
необходимо отыскать такой фрагмент входной цепочки, в которую можно вставить пустой
символ.
Покажем, что для произвольной КС-грамматики, порождающей язык без пустой
цепочки, можно построить эквивалентную неукорачивающую КС-грамматику.
Построим множество всех нетерминальных символов грамматики G=(VT, VN, P, S), из
которых выводится пустая цепочка, выделив следующие множества:
W1= {A | A→ε ∈ P},
Wn+1 = Wn ∪{B | B→ϕ ∈ P, ϕ ∈ W*n }.
Затем найдем множество правил эквивалентной грамматики в два этапа:
а) удалив из множества P исходной грамматики правила с пустой правой частью P1' = P\{
A→ε | A→ε ∈ P};
б) получив новые правила A→ϕ' после удаления из каждого правила исходной
грамматики A→ϕ ∈ P те нетерминалы, которые вошли в множество Wn по правилу:
P1" = { A→ϕ' | A→ϕ ∈ P'; ϕ =ϕ1Bϕ2 | B∈Wn; ϕ'=ϕ1Bϕ2}.
Повторив п.б) для каждого нетерминала, принадлежащего множеству Wn, получим
эквивалентную грамматику G = (VT, VN, Pэ, S).
Пример. Пусть задана грамматика G со следующими правилами вывода: S → АbА | сАb |
Bb; А → аАb | ε; В→АА|а. Необходимо:
1) построить множество нетерминалов, из которых выводится ε;
2) построить неукорачивающую грамматику, эквивалентную исходной.
Для того чтобы построить множество всех нетерминалов грамматики, из которых
выводится пустая цепочка, выделим следующие множества:
W1 = {А | А → ε ∈ P};
Wm+1 = Wm ∪ {В | В → ϕ ∈ Р, ϕ ∈ W*m}.
Так как мы имеем правило А → ε ∈ Р, то можно построить множество W1 = {A},
включающее нетерминал А.
Построим множество W2. С нетерминалом А связан нетерминал В, т.е. существует
правило В → АА и А ∈ W1. Следовательно, W2={A,B}.
W3 = W2, т. к. множество W3={В|В → ϕ ∈ Р, ϕ ∈ W*m } является пустым.
Исключив правило, содержащее пустую цепочку в правой части, получим
неукорачивающую грамматику G1 следующего вида:
S → АbА | сАb | Bb | bA | Ab | cb | b;
A → aAb | ab;
В → АА | A | a.
4.5.3. Построение грамматики с продуктивными нетерминалами
Нетерминальный символ А называется непродуктивным (непроизводящим), если он не
порождает ни одной терминальной цепочки, т.е. не существует вывода А →* х, где х∈V*T.
Поэтому представляет интерес удаление из грамматики
всех непродуктивных
нетерминальных символов. Рассмотрим, как для произвольной КС-грамматики можно
построить эквивалентную КС-грамматику, все нетерминальные символы которой
продуктивны. С этой целью выделяется множество W1={A | A → ϕ ∈ P, ϕ ∈ V*T}. Затем
строится множество W1, W2, . . . , Wn+1 по следующим правилам:
Wn+1 = Wn ∪{BB → x ∈ P, x ∈ (VT ∪ Wn)*}.
Пусть задана грамматика G со следующими правилами вывода: S → SA | BSb | bAb; A →
aSa | bb; B → bBb | BaA. Построим множество продуктивных нетерминалов:
W1 = {A}, т.к. в множестве P есть правило A → bb;
W2 = {A, S}, т.к. имеется правило S → bAb и A ∈ W1;
W3 = W2.
Все символы множества VN\Wn являются непродуктивными, не используются в выводе
никакой терминальной цепочки и их можно удалить из грамматики вместе со всеми
правилами, в которые они входят. Грамматика G1, эквивалентная исходной грамматике,
будет включать следующее множество правил:
S → SA | bAb; A → aSa | bb.
В грамматике G1 все нетерминалы продуктивны.
4.5.4. Построение грамматики, аксиома которой зависит от всех нетерминалов
Существует еще один тип нетерминальных символов, которые можно удалять из
грамматики вместе с правилами, в которые они входят. Например, в грамматике G, заданной
множеством правил P: S → aSb | ba; A → aAa | bba, нетерминал А не участвует ни в каком
выводе, т.к. из аксиомы нельзя вывести цепочку, содержащую этот нетерминал. Поэтому из
заданной грамматики можно удалить нетерминал А. Рассмотрим, как для произвольной КСграмматики можно построить эквивалентную КС-грамматику, аксиома которой зависит от
всех нетерминальных символов.
Для этого построим множество нетерминалов, от которых зависит аксиома. С этой
целью выделим множества W1, W2, . . . , Wn+1 по следующим правилам:
W1 = {S},
Wn+1 = Wn ∪{B | A → xBy ∈ P, A ∈ Wn}.
Нетерминал B∈Wn тогда и только тогда, когда аксиома S зависит от B. Все нетерминалы,
не содержащиеся в Wn, можно удалить из грамматики вместе с правилами, в которые они
входят.
Пример. Пусть дана КС-грамматика G:
S → abS | ASa | ab; A → abAa | ab; B → bAab | bB.
Найдем нетерминалы, от которых зависит аксиома:
W1 = {S},
W2 = {S, A}, т.к. имеется правило S → Asa и S ∈ W1;
W3 = W2.
Эквивалентная грамматика G1, аксиома которой зависит от всех нетерминальных
символов:
S → abS | ASa | ab; A → abAa | ab.
4.5.5. Удаление правил с терминальной правой частью
Пусть в грамматике G имеется с терминальной правой частью A→β, где β ∈ V*T. Тогда
любой вывод с использованием этого правила имеет вид: S →* xAy → xβy. Здесь
нетерминал А в сентенциальной форме xAy появился на предыдущем шаге вывода B → uAv.
Если в это правило вместо А подставить β, получим правило B → uβv. Тогда длина вывода
некоторой цепочки сократится на один шаг. Следовательно, для того чтобы удалить
терминальное правило грамматики A→β, необходимо учесть следующие правила:
а) если для нетерминала А больше нет правил, тогда во всех правых частях А заменяется
на β;
б) если для нетерминала А есть другие правила, тогда добавляются новые правила, в
которых А заменяется на β.
Пример. Пусть дана КС-грамматика G:
S → aSb | bAa | B; A → ABa | b | ε; B → ab | ba.
Удалим правила для нетерминала В. Тогда эквивалентная грамматика G1 будет включать
следующие правила:
S → aSb | bAa | ab | ba;
A → Aaba | Abaa| b | ε.
4.5.6. Построение эквивалентной праворекурсивной КС-грамматики
Некоторые специальные методы грамматического разбора неприменимы к
леворекурсивным или праворекурсивным грамматикам, поэтому рассмотрим устранение
левой или правой рекурсии. В общем случае избавиться от рекурсии в правилах грамматики
невозможно, т.к. бесконечные языки порождаются грамматиками с конечным числом правил
только благодаря рекурсии. Поэтому можно говорить лишь о преобразовании одного вида
рекурсии в другой. Рассмотрим, как для любой леворекурсивной КС-грамматики построить
эквивалентную праворекурсивную КС-грамматику.
Пусть нетерминал А - леворекурсивен, т.е. для него имеются правила следующего вида:
A → Ax1 | Ax2 | . . . | Axp | w1| . . . | wk, где xi и wj - цепочки над множеством VT ∪ VN.
Введем дополнительные нетерминалы B и D и указанные правила заменим на
эквивалентные им:
A → AB | D;
B → x1 | x2 | . . . | xp;
D → w1| w2 | . . . | wk.
В результате замены получим вывод, который имеет вид:
A → AB→ ABB → ABBB → . . . → AB* → DB*.
Таким образом, для нетерминала А можно определить эквивалентные правила:
A → DK;
K → BK | ε.
Выполняя подстановку D и B в эти правила, получим следующие праворекурсивные
правила:
A → w1K| w2K | . . . | wkK;
K → x1K | x2K | . . . | xpK | ε.
Пример. Пусть задана грамматика G со следующими правилами вывода: S → Sa | ba.
Требуется построить эквивалентную ей праворекурсивную грамматику.
Для решения задачи воспользуемся рассмотренным выше алгоритмом. В исходной
грамматике один леворекурсивный нетерминал S. Построим для него вывод:
S → SB | D;
B → a; D → ba. Вывод из S имеет вид: S → SB→ SBB→ . . . →DB*.
Запишем эквивалентные правила для S:
S → DK; K → BK | ε.
Подставим в эти правила B и D и получим эквивалентную праворекурсивную
грамматику G1:
S → baK; K → aK | ε.
Рассмотрим вывод цепочки baaaa в исходной леворекурсивной грамматике G:
S → Sa → Saa → Saaa → baaaa.
Эту же цепочку можно вывести в эквивалентной праворекурсивной грамматике G1:
S → baK → baaK → baaaK → baaaaK → baaaa.
4.6. Задания для самостоятельной работы
1.
Построить КС-грамматику, порождающую язык an для n>0.
2.
Построить КС-грамматику, порождающую язык anbn для n>0.
3.
Построить КС-грамматику, порождающую язык (ab)nc*an+m для n>0 и m>0.
4.
Построить КС-грамматику, порождающую язык (ab)*ca*bn+m для n>0 и m>0.
5.
Построить КС-грамматику, порождающую язык anb3mcma2n = an(bbb)mcm(aa)n для
n>1 и m>1.
6.
Построить КС-грамматику, порождающую язык (ab)n(ca)*bn+2(abc)* для n>0.
7.
Для леворекурсивной грамматики G: S→SabA | ba; A→AbA|bAa|c построить
эквивалентную праворекурсивную грамматику.
8.
Построить алгоритм устранения правой рекурсии и доказать эквивалентность
соответствующего преобразования.
9.
Построить КС-грамматику, порождающую идентификаторы, при этом
обозначить символом t любую букву, а символом f - любую цифру.
10. Дана КС-грамматика G:
S → Aab | bSb | abB;
A→ abS | ba | bbA;
B → bB | Da | Aa;
D → Dbb | aDa.
Построить эквивалентную грамматику, все нетерминалы которой продуктивны.
5. ТЕОРИЯ АВТОМАТОВ
5.1. Понятие автомата. Типы автоматов
Автомат - это алгоритм, определяющий некоторое множество и, возможно,
преобразующий его в другое множество. Неформальное описание автоматов выглядит
следующим образом: автомат имеет входную ленту, управляющее устройство с конечной
памятью для хранения номера состояния, а также может иметь вспомогательную (рабочую)
и выходную ленты.
Существует два типа автоматов:
1) распознаватели - автоматы без выхода, которые распознают, принадлежит ли входная
цепочка заданному множеству L;
2) преобразователи - автоматы с выходом, которые преобразуют входную цепочку x в
цепочку y при условии, что x ∈ L.
Входную ленту можно рассматривать как линейную последовательность ячеек, причем
каждая ячейка может хранить один символ из некоторого конечного входного алфавита.
Лента автомата бесконечна, но занято на ней в каждый момент времени только конечное
число ячеек. Граничные слева и справа от занятой области ячейки могут занимать
специальные концевые маркеры. Маркер может стоять только на одном конце ленты или
может отсутствовать вообще.
Входная головка в каждый момент времени читает (обозревает) одну ячейку входной
ленты. За один такт работы автомата входная головка может сдвинуться на одну ячейку
вправо или остаться на месте, при этом она выполняет только чтение, т.е. в ходе работы
автомата символы в ячейках входной ленты не меняются.
Рабочая лента - это вспомогательное хранилище информации. Данные с нее могут
читаться автоматом, могут и записываться на нее.
Управляющее устройство - это программа, управляющая поведением автомата. Оно
представляет собой конечное множество состояний вместе с отображением, описывающим,
как меняются состояния в соответствии с текущим входным символом, читаемым входной
головкой, и текущей информацией, извлеченной с рабочей ленты. Управляющее устройство
также определяет направление сдвига рабочей головки и то, какую информацию записать на
рабочую ленту.
Автомат работает, выполняя некоторую последовательность рабочих тактов. В начале
такта читается входной символ и исследуется информация на рабочей ленте. Затем, в
зависимости от прочитанной информации и текущего состояния, определяются действия
автомата:
1) входная головка сдвигается вправо или стоит на месте;
2) на рабочую ленту записывается некоторая информация;
3) изменяется состояние управляющего устройства;
4) на выходную ленту (если она есть) записывается символ.
Поведение автомата удобно описывать в терминах конфигурации автомата, которая
включает в себя:
а) состояние управляющего устройства;
б) содержимое входной ленты с положением входной головки;
в) содержимое рабочей ленты вместе с положением рабочей головки;
г) содержимое выходной ленты, если она есть.
Управляющее устройство может быть недетерминированным. В таком случае для
каждой конфигурации существует конечное множество возможных следующих тактов,
любой из которых автомат может сделать, исходя из этой конфигурации. Управляющее
устройство будет детерминированным, если для каждой конфигурации будет возможен
только один следующий такт.
Существуют следующие типы автоматов:
1) машина Тьюринга (МТ);
2) линейно-ограниченный автомат (ЛОА);
3) автомат с магазинной памятью (МП-автомат);
4) конечный автомат (КА).
Сложность рабочей ленты определяет сложность автомата. Так, например:
1) машина Тьюринга имеет неограниченную в обе стороны ленту;
2) у линейно-ограниченного автомата длина рабочей ленты представляет собой
линейную функцию длины входной цепочки;
3) у МП-автомата рабочая лента работает по принципу магазина LIFO;
4) у конечного автомата рабочая лента отсутствует.
5.2. Формальное определение автомата
Неинициальный автомат - это пятерка вида А = (К, X, Y, δ, γ), где
К - множество состояний (алфавит состояний);
Х - входной алфавит;
Y - выходной алфавит;
δ - функция переходов, задающая отображение К⋅Х→К;
γ - функция выходов, задающая отображение К⋅Х→У.
Функционирование автомата можно задать множеством команд вида qx → py, где q и p
∈ K, x ∈ X, y ∈ Y.
Пусть на некотором такте ti управляющее устройство находится в состоянии q, а из
входной ленты читается символ x. Если в множестве команд есть команда qx → py, то на
такте ti на выходную ленту записывается символ y, а к следующему такту ti+1 управляющее
устройство перейдет в состояние p, т.е.:
y(t) = γ(q(t), x(t)), q(t+1) =δ(q(t), x(t)).
Если же команда qx → py отсутствует, то автомат оказывается блокированным и не
реагирует на символ, принятый в момент ti, а также перестает воспринимать символы в
последующие моменты времени.
В соответствии с определением неинициального автомата в начальный момент
состояние автомата может быть произвольным.
Если зафиксировано некоторое начальное состояние, то такой автомат называют
инициальным, т.е. q(0) = q0.
Инициальный автомат - это шестерка вида А = (К, X, Y, δ, γ, q0), где
К - множество состояний (алфавит состояний);
Х - входной алфавит;
Y - выходной алфавит;
δ - функция переходов (отображение К ⋅ Х → К);
γ - функция выходов (отображение К ⋅ Х → У);
q0 - начальное состояние.
5.3. Распознаватели
5.3.1. Языки и автоматы
Задача грамматического разбора заключается в нахождении вывода цепочки в заданной
грамматике и определения дерева вывода этой цепочки.
Языки могут быть заданы двумя способами:
1) грамматиками (порождающее средство языка);
2) автоматами (распознающее средство языка).
Различным по сложности автоматам соответствуют разные типы языков. Простейшим
типом автоматов являются конечные автоматы.
Конечный автомат имеет входную ленту, с которой за один такт может быть считан один
входной символ. Возврат по входной ленте не допускается.
Конечным автоматом называется пятерка вида А = (К, ∑, δ, p0, F), где
К - конечное множество состояний;
∑ - алфавит;
δ - функция переходов;
p0 - начальное состояние;
F - множество заключительных состояний.
Автомат можно определить как формальную систему через состояния, через символы,
которые пишутся (читаются) с ленты или с нескольких лент, и через набор команд.
Конечный автомат можно представить графом, таблицей переходов, командами, а также
матрицей переходов.
5.3.2 Регулярные множества
Регулярные множества образуют класс языков, имеющих важное значение для теории
формальных языков. Рассмотрим несколько методов задания языков, каждый из которых
определяет регулярные множества. Среди них - регулярные выражения, праволинейные
грамматики, детерминированные и недетерминированные конечные автоматы.
Пусть Σ - некоторый алфавит. Регулярное множество в алфавите Σ определяется
рекурсивно следующим образом:
1) 0 - пустое множество;
2) {ε} - множество из пустой цепочки;
3) {a} - регулярное множество для каждого элемента a ∈ Σ;
4) если P и Q - регулярные множества в алфавите Σ, то регулярными являются
множества:
а) P ∪ Q
б) PQ
в) P*.
Других регулярных множеств в алфавите Σ нет. Таким образом, некоторое множество
цепочек в заданном алфавите Σ называется регулярным тогда и только тогда, когда либо оно
является одним из множеств: 0, {ε} или {a} для некоторого a ∈ Σ, либо его можно получить
из этих множеств применением конечного числа операций объединения, конкатенации и
итерации.
Для каждого регулярного множества существует по крайней мере одно регулярное
выражение, обозначающее это множество.
Язык, распознаваемый конечным автоматом, - это множество цепочек, читаемых
автоматом при переходе из начального состояния в одно из заключительных состояний:
L(A)={a1 a2 ... an | p0a1 → p1, p1a2 → p2, ..., pn-1an → pn; pn ∈ F}.
Множество называется регулярным, если существует конечный детерминированный
автомат, распознающий его.
5.3.3. Операции над регулярными языками
Так
как
произвольному
конечному
автомату
однозначно
соответствует
детерминированный конечный автомат, операции над конечными автоматами эквивалентны
операциям над регулярными множествами, или регулярными языками.
Известно, что для произвольного конечного автомата можно построить эквивалентный
автомат без циклов в начальных и (или) конечных состояниях.
Теорема. Для произвольного конечного автомата существует конечный автомат без
циклов в начальном состоянии.
Доказательство. Пусть A = (К, ∑, δ, p0, F) - произвольный конечный автомат. Построим
автомат:
A1 = (K ∪ {q0}, Σ, δ ∪ {q0a → pi | p0a → pi ∈ δ}, q0, F ∪ {q0 | p0 ∈ F}).
Любая цепочка x = a1 a2 ... ak принадлежит языку L(A) тогда и только тогда, когда
существует следующая последовательность команд автомата А:
p0a1 → p1; p1a2 → p2; . . . ; ph-1ah → ph, ph ∈ F
и соответствующая ей последовательность команд автомата А1:
pk-1ak → ph.
q0a1 → p1; p1a2 → p2; . . . ;
Таким образом, имеем: A = A1.
Теорема. Для произвольного конечного автомата существует эквивалентный автомат без
циклов в заключительном состоянии.
Доказательство. Будем считать, что автомат не имеет циклов в начальном состоянии.
Сопоставим заданному произвольному конечному автомату A = (К, ∑, δ, p0, F) новый
автомат A1:
A1 = (K∪{f}, Σ, δ∪{qja → f | pja → pi∈δ & pi∈F}, p0, {f}∪{p0 | p0 ∈ F}).
В результате имеем: A = A1.
Теорема. Множество регулярных языков замкнуто относительно операций итерации,
усеченной итерации, объединения, произведения, пересечения, дополнения и разности.
Доказательство. Для доказательства необходимо выполнить операции
над
соответствующими конечными автоматами и показать, что в результате таких
преобразований построенный автомат допускает требуемый язык. Предполагается, что в
автомате удалены циклы из начальных и заключительных состояний. Для выполнения
перечисленных в теореме операций
необходимо выполнить соответствующие
преобразования над заданными автоматами.
1. Операция итерации реализуется удалением циклов из начальных и заключительных
состояний и объединения полученных состояний. Объединение начального и
заключительного состояний означает, что построенный автомат допускает пустую цепочку.
Однократный переход из начального в заключительное состояние исходного автомата
соответствует допуску цепочек языка L. Поскольку эти состояния объединены, автомат
допускает цепочки языков LL, LLL и т.д., т.е. он распознает язык {ε}∪L∪L2∪ . . . =L*.
2. Операция произведения над L(A1) и L(A2) выполняется с помощью двух
преобразований: а) удаляются циклы из начального состояния A2 и заключительного
состояния A1; б) каждому заключительному состоянию A1
ставим в соответствие свой
экземпляр A2 и объединяем заключительные состояния A1 с начальным состоянием
соответствующего экземпляра A2.
3. Объединение L(A1) и L(A2) строится с помощью удаления циклов в начальных
состояниях A1 и A2 и объединения полученных начальных состояний.
4. Усеченная итерация может быть построена двумя способами:
а) L(A1)+ = L(A1)* L(A1),
б) L(A1)+ = L(A1) L(A1)*.
5. Рассмотрим дополнение L(A1) до Σ*. Пусть автомат A1 детерминированный, тогда
любая цепочка x=a1a2 . . an распознается по единственному маршруту:
p0a1 → p1
p1a2 → p2
. . .
pn-1an → pn, pn∈ F.
Автомат не распознает только те цепочки, которые:
1) либо представляют собой начальную часть цепочки a1a2 . . aj, при чтении которой
автомат переходит в состояние, не являющееся заключительным;
2) либо имеют вид y = a1a2 . . akbc1c2 . . cm (k < n), где начало цепочки a1a2 . . ak совпадает с
началом цепочки x∈L(A1), но за символом ak стоит такой символ b, что автомат A1 его
прочитать не может.
Поэтому для того чтобы построить автомат, распознающий дополнение языка,
необходимо:
а) все заключительные состояния сделать незаключительными, а незаключительные
состояния - заключительными;
б) ввести дополнительное состояние, сделать его заключительным и из каждого
состояния провести в это состояние такие дуги, каждая из которых соответствует символам
алфавита, не читаемым в этом состоянии;
в) в построенном дополнительном состоянии построить петли для всех символов
алфавита, чтобы обеспечить чтение произвольного окончания цепочки c1c2 . . cm.
6. Разность L(A1) и L(A2) строится в соответствии со следующим преобразованием:
L(A1) \ L(A2) = L(A1) ∩ L(A2) .
7. Операция пересечения строится в соответствии со следующим преобразованием:
L(A1) ∩ L(A2) = L(A1) ∪ L(A2) .
На основании этой теоремы можно строить конечные автоматы, последовательно
синтезируя их на основе уже построенных автоматов.
5.3.4. Автоматные грамматики
Линейные грамматики (праворекурсивные и леворекурсивные) называются автоматными
грамматиками, так как языки, порождаемые ими, совпадают с языками, распознаваемыми
конечными автоматами.
Рассмотрим ряд теорем.
Теорема. Для каждой праволинейной грамматики существует эквивалентный конечный
автомат.
Доказательство. Каждому нетерминалу произвольной праволинейной грамматики G
поставим в соответствие одно состояние конечного автомата A. Добавим еще одно состояние
- единственное конечное состояние. Состояние, соответствующее аксиоме, назовем
начальным состоянием.
Каждому правилу A→aB поставим в соответствие команду Aa → B, а каждому
терминальному правилу A → a поставим в соответствие команду Aa → F.
Таким образом, выводу цепочки в грамматике
S ⇒ a1A1 ⇒ a1a2A2 ⇒ ... ⇒ a1a2...ak-1Ak-1⇒ a1a2...ak взаимно однозначно соответствует
последовательность команд построенного автомата A:
Aa1 → A1; A1a2 → A2; . . . ; Ak-1ak → F. Таким образом, язык L(G) = L(A).
Пример. Пусть для заданной грамматики G требуется построить конечный автомат.
S → aS | bB;
A → aA | bS;
B → bB | с | cA.
Решение. Граф автомата будет иметь четыре вершины, три из них помечены
нетерминальными символами грамматики S, A, B, четвертая вершина, помеченная символом
F, является единственным заключительным состоянием. Начальным состоянием является
вершина, соответствующая аксиоме S.
a
b
S
b
B
b
c
A
c
F
a
Каждому правилу грамматики поставим в соответствие команду конечного автомата:
Sa → S - в начальном состоянии при поступлении на вход терминального символа а
автомат остается в том же состоянии S;
Sb → B - из начального состояния при поступлении на вход терминала b автомат
переходит в состояние B;
Bb → B - в состоянии В при поступлении на вход терминала b автомат остается в том же
состоянии B;
Bc → F - из состояния В при поступлении на вход терминала c автомат переходит в
заключительное состояние F;
Bc → A - из состояния В при поступлении на вход терминала c автомат переходит в
состояние А;
Aa → A - в состоянии А при поступлении на вход терминала а автомат остается в этом
же состоянии А;
Ab → S - из состояния A при поступлении на вход терминала b автомат переходит в
состояние S.
Полученный недетерминированный конечный автомат распознает цепочки языка,
порождаемые праворекурсивной грамматикой G.
Теорема. Для произвольного конечного автомата существует эквивалентная
праволинейная грамматика.
Доказательство. Каждому состоянию произвольного автомата поставлен в соответствие
нетерминал грамматики, причем начальному состоянию будет соответствовать аксиома.
Тогда для каждой команды Ac → B в множество правил грамматики включим правило A
→ cB, причем в случае, если B - заключительное состояние, добавим правило A → c.
Эквивалентность исходного конечного автомата и построенной грамматики очевидна.
Теорема. Для каждой леворекурсивной грамматики существует эквивалентный
конечный автомат.
Доказательство. Каждому нетерминальному символу произвольной леворекурсивной
грамматики поставим в соответствие состояние конечного автомата, причем состояние,
соответствующее аксиоме S, сделаем заключительным. Добавим еще одно состояние N и
сделаем его начальным состоянием.
Каждому правилу грамматики A → Ba поставим в соответствие команду автомата Вa →
A. Тогда каждому выводу в грамматике:
S⇒A1ak⇒A2ak-1ak⇒ ... ⇒Ak-1a2a3...ak ⇒ a1a2 . . . ak однозначно соответствует
следующая последовательность команд построенного автомата A:
Na1 → Ak-1; . . .; A2ak-1 → A1; A1ak → S.
Таким образом, язык L(G) = L(A).
Теорема. Для произвольного конечного автомата существует эквивалентная
леворекурсивная грамматика.
Доказательство. Каждому состоянию произвольного автомата поставим в соответствие
нетерминальный символ грамматики, добавим нетерминал S и сделаем его аксиомой.
Каждой команде Aa → B в множество правил включим соответствующее правило B →
Aa, причем в том случае, если B - заключительное состояние, дополнительно введем правило
S → Aa, а если A - начальное состояние, то дополнительно введем правило B → a.
Тогда последовательности команд:
A0a1 → A1; A1a2 → A2; . . . ; Ak-1ak → F
соответствует следующий вывод:
S ⇒ Ak-1ak ⇒ ... ⇒ A1a2a3...ak ⇒ a1a2a3...ak.
Важной особенностью автоматных грамматик является возможность представления их с
помощью конечных графов. По графу грамматики легко отыскивается вывод нужной
цепочки.
Любой вывод цепочки в автоматной грамматике соответствует пути в графе этой
грамматики, который начинается из вершины S (вершины, помеченной аксиомой) и
заканчивается в конечной вершине.
Пример. Построить конечный автомат, распознающий язык L(A) = {(ab)*}.
Сначала построим некоторую грамматику G, которая бы порождала язык L(A):
S → aA;
A → bS | b.
Проверим, действительно ли эта грамматика порождает язык L(A). Для этого построим
несколько выводов возможных вариантов цепочек:
1) S ⇒ aA ⇒ ab;
2) S ⇒ aA ⇒ abS ⇒ abaA ⇒ abab;
3) S ⇒ aA ⇒ abS ⇒ abaA ⇒ ababS ⇒ ababaA ⇒ ababab; и т.д.
Таким образом, грамматика G действительно порождает язык L(A), следовательно,
можно построить соответствующий этой грамматике конечный автомат. Для этого введем
заключительное состояние F, начальное состояние соответствует аксиоме S.
b
S
А
a
b
F
Запишем преобразование правил вывода в команды:
Sa → A - из состояния S при поступлении на вход терминала а автомат переходит в
состояние А;
Ab → S - из состояния А при поступлении на вход терминала a автомат переходит в
состояние S;
Ab → F - из состояния А при поступлении на вход терминала b автомат переходит в
заключительное состояние F.
Таким образом, построен недетерминированный конечный автомат, распознающий
заданный язык L(G).
5.4. Автоматы с магазинной памятью
Автомат с магазинной памятью (МП-автомат) имеет рабочую ленту, которая
организована в виде магазина.
МП-автомат - это семерка вида:
M = (К, Σ, Г, δ, p0, F, B0), где
К - конечное множество состояний;
Σ - алфавит;
Г - алфавит магазина;
δ - функция переходов;
p0 - начальное состояние;
F - множество заключительных состояний;
B0 - символ из множества Г для обозначения маркера дна магазина.
В общем случае данное определение соответствует недетерминированному автомату.
В отличие от конечного автомата для произвольного МП-автомата нельзя построить
эквивалентный детерминированный автомат.
Основное использование распознавательных средств задания языков состоит в
построении алгоритмов грамматического разбора. Поэтому необходимо для произвольной
КС-грамматики уметь строить эквивалентный МП-автомат.
МП-автомат представляет интерес как средство разбора в КС-грамматиках
произвольного вида. Этот факт сформулирован в следующей теореме.
Теорема. Языки, порождаемые КС-грамматиками, совпадают с языками,
распознаваемыми МП-автоматами.
Доказательство. Существуют две стратегии разбора: восходящий и нисходящий разбор.
Рассмотрим обе стратегии разбора.
5.4.1. Восходящий разбор в МП-автомате
При восходящей стратегии необходимо найти основу и редуцировать ее к какому-нибудь
нетерминалу в соответствии с правилами данной грамматики. Это можно сделать в том
случае, если реализовать следующий алгоритм функционирования МП-автомата:
1) любой входной символ записывается в магазин;
2) если в верхушке магазина сформирована основа, совпадающая с правой частью
правила, то она заменяется на нетерминал в левой части этого правила;
3) разбор заканчивается, если в магазине остается аксиома, а входная цепочка
рассмотрена полностью.
В соответствии с этим алгоритмом для КС-грамматики G = (VT, VN, P, S) построим МПавтомат:
M = (К, VT, Г, δ, p0, F, B0), где Г = VT ∪ VN ∪ {B0},
K = {p0, F}, F = {f}.
Функция переходов δ будет содержать следующие команды:
а) p0, a, ε → p0, a - для любых a ∈ VT;
б) p0, ε, ϕ’ → p0, A - для всех правил A → ϕ ∈ P, где ϕ’ - зеркальное отображение ϕ;
в) p0, ε, SB0 → f, B0.
В общем случае команда выглядит так:
pi, σ, γ → pj, λ , где pi ∈ K – состояние автомата до выполнения команды, σ∈Vt – символ
на входной ленте, γ∈Γ - символ верхушки магазина, pj ∈ K – состояние автомата после
выполнения команды, λ∈Γ - символ, который записывается в магазин.
Таким образом, любому выводу в грамматике G взаимно однозначно соответствует
последовательность команд построенного МП-автомата. Обратное построение КСграмматики по произвольному МП-автомату также возможно, но не представляет
практического интереса.
Рассмотрим пример восходящей стратегии разбора.
Пусть дана грамматика G:
S → S+A | S/A | A
A → a | (S);
VN={S, A}, VT={a, (, ), +, /}.
Для заданной КС-грамматики G необходимо построить МП-автомат.
Эквивалентный МП-автомат должен содержать следующие команды:
1. Команды переноса терминальных символов в магазин:
p0, a, ε → p0, a ;
p0, +, ε → p0, + ;
p0, /, ε → p0, / ;
p0, (, ε → p0, (;
p0, ), ε → p0, ).
Эти команды обеспечивают занесение терминального символа из входной ленты в
магазин.
2. Команды редукции по правилам грамматики:
p0, ε, A+S → p0, S ;
p0, ε, A/S → p0, S ;
p0, ε, A → p0, S ;
p0, ε, )S( → p0, A ;
p0, ε, a → p0, A.
Эти команды заменяют зеркальное отображение правила, полученного в верхушке
магазина, на нетерминал в левой части данного правила грамматики.
3. Команды проверки на завершение разбора:
p0, ε, SB0 → f, B0.
Разбор завершается, если в магазине остались аксиома и маркер дна магазина, а входная
цепочка полностью рассмотрена.
Подадим на вход автомата цепочку
представлен в таблице 1.
a/(a+a)
и выполним разбор. Процесс разбора
5.4.2. Нисходящий разбор в МП-автомате
На любом шаге нисходящего разбора должно применяться какое-либо правило. В
начальный момент таким нетерминалом является аксиома. МП-автомат, выполняющий
нисходящий разбор, работает по следующему алгоритму:
1) в начальный момент времени в магазин заносится аксиома:
p0, ε, ε → p1, S;
2) для каждого правила A→ϕ∈P нетерминал в верхушке магазина заменяется на правую
часть правила с помощью команды: p1, ε, A → p1, ϕ;
3) для каждого терминала a∈VT выполняется сравнение символа на входной ленте с
символом в верхушке магазина и его поглощение: p1, a, a →p1, ε
4) разбор заканчивается по команде: p1,ε,B0 → f, B0.
Для грамматики, рассмотренной в предыдущем примере, разбор той же входной
цепочки по нисходящей стратегии
будет выполняться посредством следующего
множества команд:
1) команда занесения аксиомы в магазин:
p0, ε, ε → p0, S;
2) команды замены нетерминала правой частью правила:
p1, ε, S → p1, S+A
p1, ε, S → p1, S/A
p1, ε, S → p1, A
p1, ε, A → p1, a
p1, ε, A → p1, (S);
3) команды сравнения и поглощения символа с входной ленты и символа в верхушке
магазина:
p1, a, a → p1, ε
p1, +, + → p1, ε
p1, /, / → p1, ε
p1, (, ( → p1, ε
p1, ), ) → p1, ε;
4) команда завершения разбора:
p1, ε, B0 → f, B0.
Процесс разбора цепочки представлен в таблице 2.
5.5. Выводы
Рассмотренные выше МП-автоматы работают недетерминированно, то есть если цепочка
принадлежит языку, порождаемому заданной грамматикой, то какой-то из вариантов
функционирования автомата осуществит правильный разбор. Если же цепочка не
принадлежит языку, то никакой из вариантов разбора не приведет к цели.
Отсутствие детерминированного эквивалентного автомата для произвольной КСграмматики означает невозможность построения универсальной простой однопроходной
программы синтаксического анализа. Поэтому для эффективного разбора необходимо
выделять специальные классы КС-грамматик, удовлетворяющие требованиям конкретных
типов анализаторов.
Если требуется выполнить разбор для произвольной КС-грамматики, то придется
использовать детерминированную программную модель недетерминированного МПавтомата.
5.6. Понятие преобразователей
Автоматы с выходом называются преобразователями. В зависимости от вида функции,
отображающей множество состояний и входных символов в множество выходных символов
и новых состояний, а также от типа рабочей ленты различают разные виды
преобразователей. Рассмотрим конечные автоматы-преобразователи.
Конечным преобразователем называется шестерка вида
P = (К, X, Y, f, g, q0), где
K - конечное множество состояний;
X - входной алфавит;
Y - выходной алфавит;
f - функция переходов;
g - функция выходов;
q0 - начальное состояние.
Типы отображений f и g определяют различные виды автоматов. Если g - отображение
K ⋅ X в Y, то конечный преобразователь называется синхронным. В общем случае это
отображение имеет вид K ⋅ X → Y*.
Пусть P = (К, X, Y, f, g, q0) - конечный преобразователь. Тогда отображение S(x) = g(q0,
x), определенное для любой цепочки x ∈ X*, называется конечным преобразователем.
Заметим, что для того чтобы выходную цепочку y можно было считать переводом
входной цепочки x, цепочка x должна перевести преобразователь из начального состояния в
заключительное.
5.7. Автоматы Мили и Мура
Автоматы Мили и Мура являются неинициальными автоматами. В отображении S(x) =
g(q0, x) зафиксируем начальное состояние q0, в котором автомат находится в начальный
момент времени. Оно существенно влияет на процесс конечного преобразования, т.к.
определяет не только результирующую цепочку, но и множество входных цепочек.
Рассмотрим поведение инициальных автоматов, которые могут начинать работать из
любого указанного состояния. Такой автомат получает на вход одну цепочку бесконечной
длины и перерабатывает её. Реакция такого преобразователя на определенные воздействия
непредсказуема, если неизвестно его начальное состояние. Поэтому необходимо решить две
задачи, имеющие важное практическое значение:
1) определение того состояния автомата, в котором он находится в момент, начиная с
которого исследуется его поведение;
2) распознавание конечного состояния, в которое перешел автомат после завершения
испытательной операции. Это состояние будет начальным для следующей серии испытаний.
Эти задачи анализа получили название экспериментов по распознаванию состояния.
5.7.1. Автомат Мили
Автомат Мили - это пятерка вида M = (К, X, Y, f, g), где:
K - множество состояний автомата;
X - входной алфавит;
Y - выходной алфавит;
f - функция переходов (отображение K ⋅ X → K);
g - функция выходов (отображение K ⋅ X → Y).
Как и любой другой автомат, автомат Мили можно представить в виде таблицы
или графа. В графе переходов автомата Мили на дугах указываются через символ ‘/’
входные и выходные символы. Таблица переходов состоит из двух частей: в левой части
записываются значения функции выходов, в правой части - значения функции переходов.
Пример. Построим преобразователь,
выражения, порождаемые грамматикой:
который
распознает
арифметические
S → a+S | a−S | +S | −S | a
и устраняет из этих выражений избыточные унарные операции. Например, выражение –
a+−а−+−а он переведет в –а−а+а. Во входном языке символ а представляет идентификатор
и перед идентификатором допускается произвольная последовательность знаков унарных
операции + и −. Заметим, что входной язык является регулярным множеством.
Пусть M = (К, X, Y, f, g), где
1. К = {q0, q1, q2, q3, q4},
2. X = {a,+, −},
3. Y = X.
Преобразователь М начинает работу в состоянии q0 и, чередуя состояния q0 и q4 на
входном символе «−», определяет, четное или нечетное число знаков − предшествует
первому символу а. Когда появляется а, преобразователь М переходит в состояние q1,
допуская вход, и выдает а или −а в зависимости от того, четно или нечетно число
появившихся минусов. Для следующих символов а он подсчитывает, четно или нечетно
число предшествующих минусов, с помощью состояний q2 и q3. Единственное различие
между парами q2, q3 и q0, q4 состоит в том, что если символу а предшествует четное число
минусов, то первая из них выдает +а, а не только а.
Таблица переходов выглядит следующим образом:
К\Х
q0
q1
q2
q3
q4
a
a
+a
−a
−a
Y
+
ε
ε
ε
ε
ε
−
ε
ε
ε
ε
ε
a
q1
q1
q1
q1
K
+
q0
q2
q2
q3
q4
−
q4
q3
q3
q2
q0
5.7.2. Автомат Мура
Автомат Мура - это «пятерка» вида U = (К1, X, Y, f1, h), где:
K1 - множество состояний автомата;
X - входной алфавит;
Y - выходной алфавит;
f1 - функция переходов (отображение K ⋅ X → K);
h - функция выходов (отображение K ⋅ X → Y).
При представлении автомата Мура графом дуги помечаются символами входного
алфавита, а каждая вершина графа - состоянием и символом выходного алфавита.
При формальном сравнении определений автоматов Мили и Мура может показаться, что
автомат Мура может быть задан как входонезависимый автомат Мили, т.е. такой автомат
Мили, выходная функция которого удовлетворяет следующим условиям: ∀ a ∈ X, ∀ b ∈ X, ∀
z ∈ Z (g(z, a) = g(z, b)). Однако это не соответствует способу функционирования автоматов
Мура в соответствии с введенным определением.
В автомате Мура реализована иная временная связь между переходами из одного
состояния в другое и выходом, по сравнению с автоматом Мили, у которого выход,
соответствующий некоторому входу и определенному состоянию, порождается во время
перехода автомата в следующее состояние. У автомата Мура сначала порождается выход, а
потом - переход в следующее состояние, причем выход определяется только состоянием
автомата.
5.7.3. Равносильность автоматов Мили и Мура
Равносильность заключается в том, что множество реакций этих автоматов совпадает:
L(M) = {qz | qZ ∈ K};
L(U) = {ht | ht ∈ K1};
L(M) = L(U).
Теорема. Для каждого автомата Мура можно построить равносильный автомат Мили.
Доказательство. Граф равносильного автомата Мили M можно получить в том случае,
если каждому ребру автомата Мура U сопоставить ребро автомата M.
Пусть w = x1 x2 ... xn - входная цепочка, тогда множества реакций для автоматов M и U
будут соответственно представлены следующим образом:
q0 / y1, x1 → q1 / y2, x2 → ... → qn-1 / yn, xn;
q0, x1 / y1 → q1, x2 / y2 → ... → qn-1, xn / yn.
Теорема. Для любого автомата Мили можно построить эквивалентный автомат Мура.
Доказательство. В качестве множества K1 автомата Мура возьмем K1 = K ⋅ Y. Для
обеспечения равносильности автоматов M = U функции переходов и выходов определим
следующим образом:
f1(p ⋅ y, a) = {qb | f(p, a) = q, b ∈ X};
h(p ⋅ y) = y.
Если реакция автомата M на входную цепочку вида w = x1 x2 ... xn из состояния q0 имеет
вид
q0, x1 / y1 → q1, x2 / y2 → ... → qk-1, xk / yk
(1),
то существует такое состояние q0⋅x1 недетерминированного автомата U, что, начиная
работу из этого состояния, автомат U выполняет следующие действия:
q0 ⋅ x1 / y1 → q1 ⋅ x2 / y2 → ... → qk-1 ⋅ xk / yk, xk
(2).
Аналогично можно доказать и обратную теорему о том, что из существования реакции
(2) следует существование реакции (1), что подтверждает равносильность автоматов Мили и
Мура.
5.7.4. Задания для самостоятельной работы.
1. Построить конечный преобразователь, моделирующий работу светофора. Рассмотреть
различные алгоритмы переключения светофора.
2. Построить автомат Мили, который читает текст, написанный на русском языке.
Автомат должен считать все слова, начинающиеся с символа "б" и оканчивающиеся
символом "т", т.е. такие, как "бит", "байт", "батут" и т.д. При построении автомата все
буквы кроме "б" и "т" можно обозначить каким-либо символом, например, "|".
3. Построить автомат Мили, который читает программу, написанную на языке
программирования высокого уровня. Автомат должен считать все целые константы.
ЗАКЛЮЧЕНИЕ
Всякий алгоритм можно рассматривать как некоторое универсальное средство для
решения целого класса задач. Но существуют такие классы задач, для решения которых нет
общего универсального алгоритма. Проблемы решения такого рода задач называются
алгоритмически неразрешимыми проблемами. Однако алгоритмическая неразрешимость
проблемы решения задач того или иного класса не означает невозможность решения любой
частной задачи из этого класса. Переход от интуитивного понятия алгоритма к формальному
определению алгоритма (рекурсивные функции, машины Тьюринга) позволяет доказать
алгоритмическую неразрешимость ряда проблем.
Понятия, алгоритмы и методы теории формальных языков, грамматик и автоматов
являются теоретической основой современной теории программирования, построения
алгоритмических языков, проектирования языковых процессоров, в частности,
компиляторов, ассемблеров, макрогенераторов и т.д.
Рекомендуемая литература
1. Алферова З.В. Теория алгоритмов. - М.: Статистика, 1973.
2. Ахо А., Ульман Дж. Теория синтаксического анализа, перевода, компиляции. В 2 т. Т.
1, 2. - М.: Мир, 1980.
3. Брауэр В. Введение в теорию конечных автоматов. -М.: Радио и связь, 1987.
4. Гинзбург С. Математическая теория контекстно-свободных языков. - М.: Мир, 1970.
5. Гросс М., Лантен А. Теория формальных грамматик.- М.: Мир, 1971.
6. Крючкова Е.Н. Теория алгоритмов. - Барнаул; 1995.
7. Крючкова Е.Н. Теория формальных языков и автоматов. - Барнаул; 1996.
8. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инженера. - М.:
Энергоатомиздат, 1988.
9. Любимский Э.3., Мартынюк В.В., Трифонов Н.П. Программирование. - М.: Наука,
1980.
10. Мелихов А.Н., Кодачигов В.И. Теория алгоритмов и формальных языков. - Таганрог;
1983.
11. Рейуорд - Смит В. Дж. Теория формальных языков. Вводный курс. - М.: Мир, 1988.
12. Саломаа А. Жемчужины теории формальных языков. - М.: Мир, 1987.
ОГЛАВЛЕНИЕ
Введение
1. Основные понятия теории алгоритмов
1.1. Предварительные сведения
1.2. Основные требования к алгоритмам
1.3. Математическое определение алгоритма
1.4. Понятие алфавитного оператора
1.5. Задания для самостоятельной работы
2. Рекурсивные функции
2.1. Общие сведения
2.2. Понятие простейших функций
2.2.1. Оператор суперпозиции
2.2.2. Оператор примитивной рекурсии
2.2.3. Оператор минимизации
2.2.4. Ограниченный оператор минимизации
2.3. Примитивно-рекурсивные и частично-рекурсивные функции
2.4. Типы рекурсивных алгоритмов
2.5. Методика решения задач
2.5.1. Использование оператора примитивной рекурсии
2.5.2. Использование оператора минимизации
2.5.3. Использование ограниченного оператора минимизации
2.6. Задания для самостоятельной работы
3. Машины Тьюринга
3.1. Общие сведения
3.2. Неформальное определение машины Тьюринга
3.3. Формальное определение машины Тьюринга
3.4. Способы представления машины Тьюринга
3.4.1. Представление машины Тьюринга совокупностью команд
3.4.2. Представление машины Тьюринга графом
3.4.3. Представление машины Тьюринга таблицей соответствия
3.5. Вычислимые функции
3.6. Операции над машинами Тьюринга
3.7. Примеры построения машин Тьюринга
3.8. Машина Тьюринга с полулентой
3.9. Универсальная машина Тьюринга
3.10. Алгоритмически неразрешимые проблемы
3.11. Задания для самостоятельной работы
4. Формальные грамматики и языки
4.1. Общие сведения
4.2. Основные понятия порождающих грамматик
4.3. Классификация грамматик
4.3.1. Методика решения задач
4.4. Грамматический разбор
4.4.1. Представление грамматики в виде графа
4.5. Преобразования КС-грамматик.
4.5.1. Удаление правил вида А → В
4.5.1.1. Графическая модификация метода
4.5.2. Построение неукорачивающей грамматики
4.5.3. Построение грамматики с продуктивными нетерминалами
4.5.4. Построение грамматики, аксиома которой зависит от всех нетерминалов
4.5.5. Удаление правил с терминальной правой частью
4.5.6. Построение эквивалентной праворекурсивной КС-грамматики
4.6. Задания для самостоятельной работы
5. Автоматы
5.1. Понятие автомата. Типы автоматов
5.2. Формальное определение автомата
5.3. Распознаватели
5.3.1. Языки и автоматы
5.3.2 Регулярные множества
5.3.3. Операции над регулярными языками
5.3.4. Автоматные грамматики
5.4. Автоматы с магазинной памятью
(МП-автоматы)
5.4.1. Восходящий разбор в МП-автомате
5.4.2. Нисходящий разбор в МП-автомате
5.5. Выводы
5.6. Понятие преобразователей
5.7. Автоматы Мили, Мура
5.7.1. Автомат Мили
5.7.2. Автомат Мура
5.7.3. Равносильность автоматов Мили и Мура
5.7.4. Задания для самостоятельной работы
Заключение
Рекомендуемая литература
Оглавление
Таблица 1
вход
м
а
г
а
з
и
н
p
a
B0
p0
/
a
B0
р0
A
B0
p0
S
B0
p0
(
/
S
B0
p0
a
(
/
S
B0
p0
+
a
(
/
S
B0
p0
A
(
/
S
B0
p0
S
(
/
S
B0
p0
A
+
S
(
/
S
B0
p0
)
a
+
S
(
/
S
B0
p0
A
+
S
(
/
S
B0
p0
S
(
/
S
B0
p0
)
S
(
/
S
B0
p0
A
/
S
B0
p0
S
B0
p0
B0
f
Таблица 2
вход
м
а
г
а
з
и
н
p
a
B0
p0
S
B0
p1
S
/
A
B0
p1
а
/
A
B0
p1
a
/
A
B0
p1
/
(
/
A
B0
p1
(
S
)
B0
p1
A
B0
p1
S
)
B0
p1
S
+
A
)
B0
p1
A
+
A
)
B0
p1
a
+
а
+
A
)
B0
p1
+
A
)
B0
p1
A
)
B0
p1
a
)
a
)
B0
p1
)
B0
p1
B0
f
Download