ПЕРИФРАЗИРОВАНИЕ НА КОМПЬЮТЕРЕ

реклама
II
Ю. Д. Апресян, Л. Л. Цинман
ПЕРИФРАЗИРОВАНИЕ НА КОМПЬЮТЕРЕ*
1. ПЕРИФРАЗИРОВАНИЕ В МОДЕЛИ
«СМЫСЛ ⇔ ТЕКСТ»
Одной из самых захватывающих и парадоксальных мыслей,
сформулированных И. А. Мельчуком в работах по модели
«Смысл ⇔ Текст» еще в середине 60-х годов, была мысль о том,
что владение языком проявляется у человека в умении говорить
одно и то же по-разному, или, выражаясь более научно, перифразировать свои высказывания. Ср. Правительство контролирует
цены — Цены контролируются правительством — Правительство осуществляет контроль цен — Правительство держит
цены под контролем — Цены находятся под контролем правительства и т. п. В серии работ о лексических функциях (ЛФ) и
толково-комбинаторном словаре (Жолковский–Мельчук 1965,
1966, 1967, Мельчук 1968, Апресян–Жолковский–Мельчук 1968),
а затем в своей монографии по модели «Смысл ⇔ Текст» (Мельчук 1974) И. А. Мельчук представил и первую версию теории перифразирования.
Открытые им универсальные ЛФ (см., например, Mel’c›uk et al.
1992: 32–34, где приводятся примеры ЛФ из французского, английского, русского, немецкого, венгерского, польского, сомали,
албанского и персидского языков) оказались удивительно гибким
и мощным инструментом формального представления свойств
лексем и отношений между ними. Аппарат ЛФ позволяет на гораздо более принципиальной основе, чем раньше, подойти к решению ряда важнейших лингвистических задач. В частности, с
его помощью удалось:
1) Свести гигантское разнообразие не вполне свободных лексическо-семантических коллокатов (связанных элементов словосочетаний), ранее почти не поддававшихся систематизации, к ко*
Эта работа была выполнена при поддержке гранта РФФИ № 96-15-9805 и
гранта Института «Открытое общество» H2C705K. При выполнении работы авторы пользовались ценными советами своего коллеги Л. Л. Иомдина, за что выражают ему свою признательность.
177
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
нечному и не слишком большому набору классов лексем с общими синтаксическими и семантическими свойствами (синтагматические ЛФ, или параметры).
2) Упорядочить на единой основе большое число парадигматических лексико-семантических отношений между лексемами,
таких, как синонимия, конверсия, антонимия, гиперонимия, регулярная деривация и т. п. (парадигматические ЛФ, или замены).
3) Сформулировать в терминах синтагматических и парадигматических ЛФ очень существенный фрагмент универсальных
правил перифразирования высказываний — так называемые глубинно-синтаксические правила. Оказалось, таким образом, — и
это, конечно, самое замечательное свойство ЛФ, — что единый
формальный аппарат позволяет решать большой комплекс принципиально разных, хотя и связанных друг с другом задач.
Развитая И. А. Мельчуком модель «Смысл ⇔ Текст» достаточно хорошо известна, и мы не станем ее здесь пересказывать.
Напомним только несколько ключевых тезисов, относящихся к
собственно теории перифразирования, чтобы создать необходимый фон для изложения построенной нами системы.
(1) Перифразирование в модели «Смысл ⇔ Текст», как и все
другие преобразования, выполняется в ходе синтеза (т. е. при
движении от смысла к тексту), а именно, на уровне глубинносинтаксических структур (ГСС).
(2) ГСС — это линейно не упорядоченное дерево зависимостей. В узлах ГСС могут стоять (а) реальные слова данного естественного языка; (б) фраземы (главным образом, идиомы типа
подложить свинью кому-л., держать камень за пазухой, как ни в
чем не бывало); (в) фиктивные слова типа *вахтить, *компромиссировать, *преступать и т. п., вводимые для придания правилам перифразирования большей общности (ср. *вахтить =
стоять на вахте по аналогии с дежурить = быть на дежурстве,
беситься = быть в бешенстве и т. п.; *компромиссировать =
идти на компромисс по аналогии с уступать = идти на уступку,
мириться = идти на мировую и т. п.; *преступать = совершать
преступление по аналогии с грабить = совершать ограбление,
ошибаться = делать <совершать> ошибку и т. п.); (г) словасмыслы типа ‘приблизительно’, ‘по имени’, которым могут соответствовать поверхностно-синтаксические отношения (в нашем
примере — аппроксимативно-количественное в конструкциях типа человек шесть и номинативно-аппозитивное в конструкциях
типа исследовательское судно «Витязь»); (д) символы универсальных лексических функций OPER1, FUNC1, REAL1, FACT1,
178
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
S0, A0, SYN, GENER, FIGUR, MULT и т. п. Узлы ГСС могут
быть связаны одним из шести (в более поздней версии — одним
из девяти) глубинно-синтаксических отношений зависимости.
Отношения 1–4 (или 1–6) связывают предикатное слово с его аргументами (актантами); кроме них есть еще атрибутивное, координативное и служебное отношения.
(3) Вследствие указанных свойств ГСС их преобразование в
поверхностно-синтаксические структуры (ПСС) требует выполнения ряда сложных операций над их лексикой и отношениями. В
частности, узлы типов (б)–(д) должны быть представлены реальным лексическим материалом данного естественного языка: фраземные узлы должны быть заменены поддеревьями ПСС, ГСС с
фиктивными словами должны быть отфильтрованы на этапе глубинно-синтаксического синтеза (преобразования ГСС ⇒ ПСС),
узлы-смыслы типа ‘приблизительно’ должны быть преобразованы
в соответствующие ПС-отношения и опущены, ЛФ-узлы должны
быть лексически проинтерпретированы. Кроме того, все остающиеся ГС-отношения должны быть преобразованы в ПСотношения, что само по себе вырастает в исключительно сложную задачу хотя бы ввиду того, что ГС-отношений не больше девяти, между тем как ПС-отношений почти на порядок больше (в
системе ЭТАП-3 — 55 отношений для русского языка).
(4) Правила перифразирования были разделены на два основных типа: (а) лексические правила, устанавливающие эквивалентность различных формулировок одного и того же смысла в терминах ЛФ; (б) синтаксические правила, указывающие, как должна
быть перестроена ГСС после работы лексического правила
(Мельчук 1974: 149, 161).
(5) И лексические, и синтаксические правила применимы в обе
стороны. Например, правило X ⇔ OPER1 + S0(X), примененное
слева направо, дает перифразы дежурить = быть на дежурстве,
беситься = быть в бешенстве, уступать = идти на уступку,
грабить = совершать ограбление, ошибаться = делать ошибку и
т. п. То же правило, примененное справа налево, дает обратные
перифразы идти на уступку = уступать, совершать ограбление
= грабить и т. д.
(6) Правила считаются универсально значимыми, независимо
от степени применимости того или иного конкретного правила на
материале данного языка.
В конце 60-х годов была предпринята первая и, насколько нам
известно, единственная попытка реализовать систему перифразирования на компьютере (Арсентьева и др. 1969). На вход алго179
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
ритма перифразирования подавалась ГСС некоторого предложения русского языка. К ней применялись все допустимые лексические правила и соответствующие им синтаксические правила. В
результате получались все мыслимые ГСС, эквивалентные по
смыслу исходной. После этого алгоритм обращался к словарю и
отсеивал те из полученных ГСС, которые не удовлетворяли условиям правильности-неправильности, записанным там при каждой
самостоятельной лексеме. На выходе алгоритма получались все
допустимые ГСС, являющиеся перифразами исходной ГСС (Арсентьева и др. 1969: 6, 11).
Проверить эффективность этого алгоритма невозможно в силу
его эскизности и того, что он работал исключительно с конструктами: и на входе, и на выходе допускались только ГСС, а не реальные предложения языка. Это и побудило авторов вернуться к
задаче компьютеризации системы перифразирования и предпринять новую попытку ее решения.
2. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ
ПЕРИФРАЗИРОВАНИЯ В ЭТАП’Е
2.1. СРЕДА ЭТАП’А
Особенностью нашей работы является то, что она возникла в
теоретической и прикладной среде, отличной от классического
варианта модели «Смысл ⇔ Текст». Это — среда действующей
двунаправленной системы машинного перевода с английского
языка на русский и с русского на английский, известной под названием ЭТАП-3 (см. Апресян и др. 1992). Нынешний ЭТАП-3 —
хорошо развитая высокомодульная полифункциональная многоязычная система (помимо двух основных режимов работы — англо-русского и русско-английского — у нас были эксперименты по
французско-русскому, немецко-русскому и русско-корейскому
МП), опирающаяся на полные формальные грамматики языков
(морфологию и синтаксис) и комбинаторные словари с полным
набором лексико-синтаксических сведений о лексеме (объем английского и русского словарей — свыше 30 000 единиц). Различные модули ЭТАП’а опробовались и в других системах переработки текстов, например, в системе общения с базами данных на
ЕЯ, реализованной как перевод с ЕЯ на язык SQL и обратно. Перифразирование — просто новый режим работы ЭТАП’а, а именно, режим русско-русского перевода.
180
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
Система ЭТАП-3 как первый и до сих пор единственный опыт
реализации модели «Смысл ⇔ Текст» на компьютере представляет, конечно, большой теоретический интерес. Она создает уникальный экспериментальный полигон для проверки правильности
лингвистической теории. С другой стороны, по ряду исторических причин, которые научной общественности достаточно хорошо известны, ЭТАП-3 возникал как прикладная система, а
именно, система МП с иностранных языков на русский. Эта предопределило ряд существенных особенностей ЭТАП’а, не позволяющих рассматривать его как реализацию классического варианта модели «Смысл ⇔ Текст». Перечислим те из них, которые
непосредственно отражаются в модели перифразирования и составляют ее теоретическую основу.
1. На вход ЭТАП’а в любой из перечисленных систем подается какой-то текст на ЕЯ, который обрабатывается пофразно. В частности, в системе перифразирования в ее нынешнем виде ЭТАП
имеет дело с отдельными предложениями. Всякая переработка
начинается с а н а л и з а текста, а не с его синтеза, как в классическом варианте модели «Смысл ⇔ Текст».
2. Поскольку основные европейские языки (германские, романские, славянские) не только генетически, но и типологически
родственны, перевод с языка на язык не требует перехода ни на
уровень ГСС, ни тем более на уровень семантической структуры
высказываний. На основании экспериментов с материалами английского, немецкого, русского и французского языков мы можем
утверждать, что уже на уровне ПСС национальная специфика
входного языка снимается до такой степени, что ее преобразование в ПСС выходного языка становится вполне разрешимой задачей. Иными словами, лексико-синтаксическое сходство переводящих друг друга предложений названных языков в целом настолько велико, что экономнее снять остающееся различия на
этом уровне, чем вводить новый уровень представления высказываний и целых два новых блока правил преобразования (преобразование ПСС ⇒ ГСС при анализа и преобразование ГСС ⇒ ПСС
при синтезе).
В связи с этим нам представляется уместным усомниться в
том, что в пользу лингвистической реальности и автономности
глубинно-синтаксического уровня можно привести столь же убедительные свидетельства, как в пользу (поверхностно-)синтаксического.
3. ПСС в системе ЭТАП — это линейно упорядоченное дерево
зависимостей, узлы которого находятся во взаимно-однозначном
181
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
соответствии со словами входного предложения. Исключение составляют так называемые безусловные обороты типа как бы то
ни было, по крайней мере, которые еще на этапе предморфологического анализа собираются в один узел. Поскольку формальным
объектом правил перифразирования является не ГСС, а определенная таким образом ПСС, разом снимается большой комплекс
вопросов, связанных со словарем.
Фразеологические единицы, если они есть в исходной фразе,
сохраняются в виде поддеревьев ПСС. Для фиктивных слов типа
*вахтить, *компромиссировать, *преступать и т. п. места не
остается, поскольку процесс преобразований начинается с реальной фразы естественного языка, в которой их не может быть по
определению. Нет необходимости и в «синтаксических» словахсмыслах типа ‘по имени’, ‘приблизительно’, поскольку в ПСС сохраняются соответствующие семантически насыщенные поверхностно-синтаксические отношения (номинатовно-аппозитивное,
аппроксимативно-количественное и т. п.). Что касается символов
ЛФ, то они не замещают собою лексемы в узлах ПСС, а просто
приписываются им в качестве еще одной характеристики.
Равным образом снимаются все проблемы перевода поверхностно-синтаксических отношений в глубинно-синтаксические и обратно. Сохраняются, однако, проблемы линеаризации выходного
предложения, поскольку в результате конверсных преобразований словопорядок может меняться радикальнейшим образом.
4. В ЭТАП’е отпадает необходимость деления правил перифразирования на лексические и синтаксические. В нем действует
единая подсистема правил преобразования деревьев зависимостей, обслуживающая все системы переработки текстов. Любое
изменение в ПСС, будь то изменение морфологической характеристики, замена лексемы, введение нового узла с определенным
лексическим наполнением, устранение узла, перестановка узлов
или целых синтаксических групп, трактуется как изменение ПСС.
5. Как было сказано выше, правила перифразирования в классической версии модели «Смысл ⇔ Текст» верны в обе стороны,
так что, например, глагол дежурить можно преобразовать в словосочетание быть на дежурстве, а это последнее — снова в глагол дежурить. Но тогда возникает риск перифразирования ad
infinitum.
Конечно, процесс перифразирования можно было бы сделать
конечным с помощью простенького технического приема, скажем, маркирования уже примененных правил и недопущения их
повторного применения. Однако анализ устройства естественных
182
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
языков позволяет направить поиски решения проблемы по более
интересному пути.
Можно предположить, что в классе перифраз есть одна простейшая, или каноническая перифраза, составленная исключительно из таких лексем, которые являются каноническими манифестантами определенных концептов. Такой перифразе соответствует и простейшая синтаксическая структура.
Если это так, то правила перифразирования можно разбить на
правила канонизации (сведения исходных предложений к их каноническим вариантам) и правила перифразирования в собственном смысле. При такой стратегии процесс перифразирования естественным образом становится конечным.
Именно эта идея и была реализована в нашей работе. Более
подробно она будет рассмотрена и обоснована в разделе 2.3.
6. В ходе компьютерной реализации системы перифразирования обнаружилось, что различные правила имеют очень неравноценные области действия.
С одной стороны, есть весьма общие правила перифразирования, (например, правило X ⇔ OPER1 + S0(X)), имеющие широкие, хотя и не универсальные области действия.
Другие правила имеют гораздо более узкие, а иногда и просто
уникальные лексические, синтаксические и морфологические области действия. Одно из наиболее известных правил перифразирования с ЛФ GENER применительно к существительным
формулируется следующим образом: X ⇔ GENER(X) + A0(X).
Оно дает хороший результат на лексемах лингвистика — лингвистическая наука, манка — манная каша; существенно более
плохой на лексемах химия — химическая наука, холера — холерная болезнь; нелепый на лексемах клоп — клопиное насекомое,
лимон — лимонный фрукт; семантически неэквивалентный на
лексемах мать — материнская родственница, лето — летний
сезон и т. п.
Описанная ситуация идеальным образом укладывается в давно
сформировавшуюся идеологию ЭТАП’а, где различаются правила
двух основных типов — общие и частные. Общие правила отражают поведение больших классов слов типа частей речи и применяются при переработке любого текста. Частные правила отражают поведение небольших лексических групп (трафаретные
правила) или даже отдельных слов (словарные правила) и применяются только тогда, когда в перерабатываемой фразе имеется
соответствующий лексический материал. Он-то и активирует
183
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
нужное правило (подробнее см. Апресян–Цинман 1982 и Апресян
и др. 1992).
При реализации модели перифразирования мы сделали упор
на материал, поддающийся описанию в виде общих правил, с
эпизодическим включением материала, который можно описать
только с помощью трафаретных правил.
2.2. ЛЕКСИЧЕСКИЕ ФУНКЦИИ ДЛЯ ПРАВИЛ ПЕРИФРАЗИРОВАНИЯ
Как следует из заключительных замечаний в пункте 6 предшествующего раздела, далеко не все ЛФ, способные в принципе давать синонимические перифразы высказываний, представляют
равный интерес для правил перифразирования.
Можно, например, заметить, что ЛФ семейства REALi —
FACTi, имеющие, по определению, точно такие же синтаксические свойства, что и ЛФ семейства OPERi — FUNCi, иногда допускают синонимические преобразования, похожие на преобразования с OPER-ами и FUNC-ами. Ср. Дети ездят на школьном
автобусе (ездить = REAL1(автобус)) — Школьный автобус возит детей (возить = FACT1(автобус)); Он осуществил свою надежду поступить в университет (осуществить = REAL1М(надежда)) — Его надежда поступить в университет сбылась
(сбыться = FACT0-М(надежда)). Ср. также Он отдал мне долг
— Я получил с него долг, Я уплатил штраф — С меня взяли
штраф (преобразования по правилу REAL1-М + S0(X) ⇔
REAL3-М + S0(X))1.
Однако число ключевых слов, к которым такие преобразования применимы, ничтожно мало по сравнению с числом слов, которые их не допускают. В большинстве случаев для преобразований просто не хватает лексического материала, потому что при
данном ключевом слове оказывается выразимой только одна ЛФ
из данного семейства. Ср. REAL1 от артефактов — мыться в бане, лежать в больнице, ехать на велосипеде, читать газету,
тратить деньги, принимать лекарство, слушать музыку, говорить по телефону, сидеть в тюрьме, ходить в школу, стоять на
якоре и т. п., у которых нет никаких других ЛФ семейства REALFACT. Сказанное в полной мере приложимо и к REAL1-М; ср.
доказывать алиби, утолять аппетит, признавать вину, пользо1
Индекс М добавляется к тем ЛФ семейства REAL-FACT, аргументами которых являются лексемы с модальным значением типа надежда, просьба, требование, приказ, совет, возможность, шанс, долг, обязательство и т. п.
184
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
ваться возможностью, подчиняться закону, удовлетворять любопытство, соответствовать норме, сдерживать обещание,
соблюдать перемирие, преодолевать препятствие, выполнять
решение, носить траур, достигать цели, хранить честь и т. п.
Есть еще одно затруднение, связанное с ЛФ семейства REAL —
FACT. Как известно, эти ЛФ представлены полнозначными глаголами, модели управления которых определяются их собственными семантическими свойствами, а не свойствами ключевых
слов. Такие модели управления могут приходить в противоречие
с управляющими свойствами соответствующей ЛФ как они заданы ее собственным определением.
Модель управления глагола ехать, например, выглядит в нашем словаре следующим образом: кто едет (первое место), откуда едет (второе место), куда едет (третье место), на чем едет
(четвертое место). Такая модель управления для глагола ехать
диктуется семантическими соображениями. Ближайший к нему
родовой предикат, через который он толкуется, — это трехместный предикат перемещаться: кто перемещается, откуда и куда.
Еще один семантический актант, который вытекает из идеи неавтономности перемещения в случае ехать (на чем), естественно
считать четвертым. Однако по определению REAL1 этот актант
должен быть признан вторым: REAL1 — это такой глагол, при
котором первый актант ситуации, обозначаемой ключевым словом (в нашем случае — существительным со значением транспортного средства типа лошадь, велосипед, мопед, мотоцикл,
машина, автобус, трамвай, троллейбус и т. п.), является подлежащим, а само такое существительное — главным дополнением.
Подвергать глобальной ревизии всю трактовку большой группы нетранзитивных и транзитивных бесприставочных глаголов
перемещения (ехать — ездить, везти — возить, плыть — плавать, лететь — летать, катиться — катить, кататься — катать и т. п.) в угоду одному частному правилу перифразирования мы не сочли возможным, тем более, что для всех таких случаев перифразу всегда можно получать на основе ЛФ CONV.
Есть и другие не лишенные интереса трафаретные и словарные правила перифразирования, которые, однако, имеют чересчур узкие области действия. К ним относятся правила перифразирования с ЛФ EQUIP, MULT, SING, FIGUR, S-MED, S-INSTR и
многими другими, которые мы здесь представим небольшой подборкой примеров.
185
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
EQUIP: Парламент отклонил инициативу президента — Депутатский корпус отклонил инициативу президента, Театр выехал на гастроли — Труппа (театра) выехала на гастроли.
MULT: Послышались выстрелы — Послышалась стрельба,
Он продает свои книги — Он продает свою библиотеку.
SING: В комнату проникал свет — В комнату проникал луч
света, Ирак совершил агрессию — Ирак совершил акт агрессии.
FIGUR: Между ними возникло непонимание — Между ними
возникла стена непонимания, Ревность проникла в его душу —
Яд ревности проник в его душу.
S-MED: Сестра забинтовала рану — Сестра наложила повязку на рану, Охотник выстрелил в упор — Охотник выпустил
пулю в упор.
S-INSTR (Мельчук 1974: 154): Он думает — Он шевелит мозгами, Он убеждал меня выступить на конференции — Он приводил
мне доводы в пользу того, чтобы я выступил на конференции.
Легко заметить, что все эти и им подобные преобразования
ограничены лексическими, синтаксическими или морфологическими условиями или какой-то конфигурацией таких условий
почти до степени уникальности. EQUIP(самолет) = экипаж,
EQUIP(орудие) = расчет, EQUIP(университет) = профессорскопреподавательский состав, но вряд ли возможен контекст, где
лексемы самолет, орудие и университет можно было бы заменить на соответствующие им EQUIP + ключевое слово. В случае
Он думает перифразирование через S-INSTR становится невозможным при минимальном расширении синтаксического контекста исходного глагола, а в случае Он убеждал меня выступить на
конференции — при изменении его морфологической (видовой)
формы. Ср. неправильность Он думает о тебе — *Он шевелит
мозгами о тебе и семантическую неэквивалентность Он убедил
меня выступить на собрании ≠ Он привел мне доводы в пользу
того, чтобы я выступил на собрании.
Хотя аппарат ЭТАП’а позволяет формализовать все такие
преобразования, их компьютерная реализация потребовала бы от
лингвистов громадного объема технической работы. Поэтому в
нынешней версии модели перифразирования мы используем
лишь часть ЛФ, способных давать перифразы. Из числа ЛФ-замен
— это SYN и CONV, «синтаксические» производные типа S0
(имена действий, деятельностей, процессов, состояний, отношений, свойств, способностей, параметров типа совет, флирт, болезнь, надежда, власть, авторитет, память, скорость), семантические производные типа Si и Ai. Из числа ЛФ-параметров —
186
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
это главным образом глаголы «поддержки» семейства OPERFUNC, включая их регулярные суперпозиции с ЛФ INCEP, FIN,
CAUS и LIQU (всего около 40 ЛФ).
Все ЛФ были в большей или меньшей мере переопределены. В
частности, в нашей модели, в отличие от канонического варианта
модели «Смысл ⇔ Текст», ЛФ семейства OPER-FUNC (за исключением FUNC0) трактуются как строго двухместные предикаты.
Все актанты ситуации, отличные от i-го, в большинстве случаев
присоединяются к ключевому слову. Если же они присоединяются к OPER-у или FUNC-у, то обычно для этого используются обстоятельственные или другие неактантные отношения подчинения.
Суперпозиции
вида
INCEPOPER1,
INCEPOPER2,
INCEPFUNC1, INCEPFUNC2 и такие же суперпозиции с FIN, в
полном соответствии с правилами И. А. Мельчука не меняют актантных и других синтаксических свойств соответствующих «корневых» ЛФ. Суперпозиции вида CAUSOPER1, CAUSOPER2,
CAUSFUNC1, CAUSFUNC2 и соответствующие суперпозиции с
LIQU трактуются как строго трехместные глаголы, вызывающие
смещение прежнего подлежащего в позицию главного дополнения и смещения прежнего главного дополнения в позицию второго дополнения. С другими актантами ситуации, если они представлены во фразе, проводится та же работа, что и в случае с неосложненными ЛФ семейства OPER или FUNC.
2.3. КАНОНИЧЕСКИЕ ВАРИАНТЫ КОНЦЕПТОВ
Выше было сказано, что одним из главных теоретических
новшеств нашей модели является разбиение всех правил перифразирования на правила канонизации и правила собственно перифразирования. Произвольное предложение, поступая на вход
системы перифразирования, сначала сводится к своей канонической форме. Скажем, неканоническая фраза Цены находятся под
контролем правительства преобразуется в каноническую Правительство контролирует цены. Полученное каноническое
предложение поступает на вход правил перифразирования в собственном смысле, и из него получаются другие перифразы Цены
контролируются правительством — Правительство осуществляет контроль цен — Правительство держит цены под контролем и т. п., включая и исходное предложение Цены находятся под
контролем правительства.
187
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
Возникает вопрос, как в множестве перифраз выделить канонический вариант высказывания. Ответ на него дает сам язык.
Одно из фундаментальных свойств человеческих языков состоит в том, что если в них есть несколько синонимичных в широком смысле средств выражения какого-то концепта, ровно одно
из них оказывается привилегированным, каноническим, или прототипическим способом выражения этого концепта. Обычно это
лексема, характеризующаяся наибольшей свободой вхождения в
наиболее широкий круг контекстов, т. е. лексема, на употребление которой накладывается наименьшее число семантических,
прагматических, коммуникативных, синтаксических, морфологических, стилистических и иных ограничений. Рассмотрим несколько более систематически различные синонимичные в широком смысле средства выражения концептов. В предлагаемом иллюстративном материале такое средство приводится после знака
⇒. Тем самым мы пытаемся дать самое общее представление о
направлении действия правил канонизации. Мы начинаем с наиболее очевидных примеров, переходя ко все менее тривиальным
случаям канонических средств выражения концептов.
1. Если некий концепт выражается синонимичными лексемой
и словосочетанием, лексема либо является канонической формой,
либо ближе к ней, чем словосочетание. Ср. оказывать помощь ⇒
помогать, наука о языке ⇒ лингвистика.
2. Если концепт выражается двумя или несколькими лексемами, выбор одной из них в качестве канонического варианта зависит от типа семантических отношений, связывающих эти лексемы.
а) В случае «чисто синтаксической» деривации типа бег ⇒
бежать, помощь ⇒ помогать, белизна ⇒ белый, хорошо ⇒ хороший и т. п. в качестве канонического варианта выражения концепта выбирается деривационно более простое (в частном случае
— непроизводное) слово. При этом соображениям семантической
производности — непроизводности отдается предпочтение перед
соображениями формальной производности — непроизводности:
бег формально проще, чем бежать, но семантически производен
от глагола.
б) В случае синонимии, как знает всякий, кто профессионально занимался синонимами, один из синонимов, называемый доминантой ряда, превосходит все остальные по употребительности, простоте значения, полноте парадигмы, широте сочетаемости
и синтаксических конструкций, прагматической и стилистической
нейтральности и т. п. Ср. ожидать, дожидаться, поджидать ⇒
188
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
ждать; смыслить, разуметь ⇒ понимать 1; размышлять, раздумывать ⇒ думать; кидать ⇒ бросать; языкознание, языковедение ⇒ лингвистика.
в) В случае конверсии каноничность устанавливается несколько по-разному в разных случаях.
Если один из актантов ситуации, обозначаемой конверсивами, — живое существо, а второй — предмет или ситуация, в качестве канонического способа выражения концепта выбирается тот
из двух (или более) конверсивов, при котором актант со значением живого существа всегда является подлежащим. Ср. радовать
⇒ радоваться (Нас радуют успехи детей ⇒ Мы радуемся успехам детей), нравиться ⇒ любить 2 (Мне нравится гулять ⇒ Я
люблю гулять), представляться ⇒ считать (Мне представляется, что нам следует отложить поездку ⇒ Я считаю, что нам
следует отложить поездку).
Если оба актанта такой ситуации — живые существа, в качестве канонического способа выражения концепта выбирается тот
из конверсивов, при котором более активный актант выполняет
функцию подлежащего. В классической паре конверсивов продавать ⇒ покупать таков второй глагол: продавец только предлагает свой товар, а деятелен покупатель. Ср. также сдавать (дачу)
⇒ снимать (дачу), одалживать (деньги кому-л.) ⇒ занимать
(деньги у кого-л.) и другие подобные ситуации.
Если оба таких актанта равно активны (ср. ситуации партнерства и соперничества), в качестве канонического выбирается тот
конверсив, при котором подлежащим является актант, достигающий своей цели. Ср. проигрывать (матч кому-л.) ⇒ выигрывать
(матч у кого-л.).
Если оба актанта ситуации — предметы или ситуации, в качестве канонического способа выражения концепта выбирается тот
из двух конверсивов, который в меньшее число шагов сводится к
семантическому примитиву, сохраняя свое подлежащее. Ср. вмещать ⇒ входить (Бутыль вмещает пять литров ⇒ В бутыль
входит пять литров), меньше ⇒ больше (Он получил меньше,
чем я ⇒ Я получил больше, чем он) и т. п. Покажем справедливость нашего решения на примере первой пары конверсивов, где
подлежащим является группа пять литров. В бутыль входит
пять литров = ‘В бутыли может находиться пять литров’, где
уровень семантических примитивов достигается в один шаг (‘находиться’ и ‘мочь’ — семантические примитивы), причем подлежащее остается тем же самым. Для фразы Бутыль вмещает пять
литров такого результата получить не удается. Ср. также проис189
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
текать из-за ⇒ вызывать (Пожар проистек из-за неосторожного обращения с огнем ⇒ Неосторожное обращение с огнем
вызвало пожар), где вызывать = ‘быть причиной’, а ‘быть’ и
‘причина’ — семантические примитивы.
Вообще говоря, последний критерий — сведение к семантическому примитиву в меньшее число шагов при сохранении того же
подлежащего — можно было бы обобщить на все случаи выбора
канонического варианта выражения концепта в множестве конверсивов. Однако демонстрация этого факта потребовала бы чересчур много места, а несложные тесты типа изложенных выше в
практической работе даже удобнее.
г) В случае антонимии типа перестать — начать, всегда —
никогда, отсутствовать — присутствовать, нарушать — соблюдать, маленький — большой, низкий — высокий и т. п. (ср.
равнозначные преобразования типа Он перестал нарушать правила ⇒ Он начал соблюдать правила, Он всегда отсутствует на
наших собраниях ⇒ Он никогда не присутствует на наших собраниях, Он ниже Петра ⇒ Петр выше его) в качестве канонического способа выражения концепта выбирается тот антоним, который семантически и/или прагматически (в частности, психологически) проще. В нашем случае это слова начать, никогда, присутствовать, соблюдать, большой, высокий.
3. Все сказанное в пунктах 1 и 2, автоматически переносится
на ситуацию синонимичных способов выражения концептов с
помощью ЛФ. Получается, в частности, что OPER1 + S0(Х) «каноничней», чем OPER2 + S0(Х); LABOR1-2 + S0(Х) каноничней,
чем OPER2 + S0(Х); OPER1 + S0(Х) каноничней, чем FUNC1 +
S0(Х); OPER2 + S0(Х) каноничней, чем FUNC2 + S0(Х) и т. д.
Реализация намеченной теоретической стратегии в полном
объеме потребовала бы от лингвистов громадного объема технической работы. Поэтому мы реально пользовались альтернативным — несколько ослабленным — представлением о каноническом варианте концепта: канонической в классе перифраз считается та, из которой все остальные достижимы в один шаг (применением ровно одного правила перифразирования в собственном смысле слова). Таких канонических перифраз может быть
более одной. Поясним, что мы имеем в виду.
Правила собственно перифразирования в нашей системе применяются, естественно, п о с л е правил канонизации, но в «одной связке» с ними, и приводят к порождению куста перифраз.
Скажем, если на вход системы пефразирования поступает предложение типа Иван был пациентом Петра, из него сначала полу190
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
чается перифраза Иван лечился у Петра (замена COPUL + S1(Х)
на Х), а затем — все остальные (Петр лечил Ивана, Петр был
врачом Ивана, Петр был доктором Ивана и т. п.). Если же на
вход поступает предложение типа Петр был врачом Ивана, из него сначала получается перифраза Петр лечил Ивана (по тому же
правилу), а затем — все остальные (Иван лечился у Петра, Петр
был врачом Ивана, Петр был доктором Ивана и т. п.). В результате получается два канонических выражения концепта для данного гнезда — лечить и лечиться. Между тем с чисто теоретической точки зрения подлинным каноническим вариантом является
только глагол лечить.
Мы пошли по этому пути, чтобы сэкономить усилия лингвистов. В противном случае надо было бы полностью отказаться
от системы общих правил, в рамках которых данной лексеме достаточно приписать только ЛФ и больше ни о чем не думать, и перейти исключительно на трафаретные правила. Тогда в словарную статью каждой лексемы, которая не является каноническим
манифестантом соответствующего концепта, надо было бы вписать ровно одно правило канонизации, которое приводит эту лексему к ее каноническому виду. В словарную статью «канонической лексемы» надо было бы вписать все правила перифразирования, с помощью которых и порождалось бы требуемое множество перифраз. Очевидно, что при таком теоретически более
чистом подходе объем лингвистической работы возрос бы по
крайней мере на порядок.
Подчеркнем, однако, что не существует ровным счетом никаких принципиальных препятствий для того, чтобы реализовать
очерченную выше стратегию канонизации в полном объеме, т. е.
сделать все правила трафаретными, хотя вряд ли это целесообразно.
2.4. ЭТАПЫ ПЕРЕРАБОТКИ ПРЕДЛОЖЕНИЯ В СИСТЕМЕ
ПЕРИФРАЗИРОВАНИЯ
Модель перифразирования, как очевидно из сделанных выше
замечаний, использует почти всю информацию из комбинаторного словаря и почти все основные блоки правил ЭТАП’а-3 (за исключением правил собственно перевода с английского языка на
русский или с русского на английский). Ниже мы рассмотрим по
отдельности словарную информацию и систему правил переработки текста.
2.4.1. Словарная информация.
191
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
Для системы перифразирования в комбинаторном словаре заведена особая зона, где перечисляются все ЛФ данной лексемы,
включая и те (например, EQUIP, MULT, SING, S-INSTR, BON,
VER, REAL, FACT, DEGRAD, PREPAR, SON и т. д.), которые в
самой системе перифразирования не используются. Считается,
что в них может возникнуть нужда в системе МП при переводе
фразеологизованных словосочетаний соответствующего типа.
В качестве значений ЛФ учитываются только а) однословные
выражения (ср. MAGN(знать) = хорошо / основательно / глубоко,
MAGN(спать) = крепко / беспробудно), б) словосочетания, состоящие
из
полнозначного
слова
и
предлога
(ср.
INCEPOPER1(ярость) = приходить в (ярость), OPER2(влияние)
= находиться под (влиянием)). Многословные способы выражения (ср. MAGN(знать) = как свои пять пальцев, MAGN(спать) =
сном младенца / сном праведника) не учитывались. Следует заметить, что на долю таких сложных способов выражения ЛФ приходится менее 5 % материала, содержащегося в нашем компьютерном учебнике ЛФ, из которого черпалась лингвистическая информация для системы перифразирования.
Приведем в качестве примера зону ЛФ лексемы контроль:
MAGN: строгий, надежный, неослабный, особый, жесткий
ANTIMAGN: слабый
OPER1: осуществлять
FINOPER1: утрачивать, терять
LABOR1-2: держать (под2)
INCEPLABOR1-2: брать (под1)
FINLABOR1-2: выпускать2 (из-под)
OPER2: быть (под2), находиться (под2)
INCEPOPER2: попадать (под1)
FINOPER2: выходить (из-под)
CAUSOPER2: ставить (под1)
CAUSFUNC2: устанавливать (над), устанавливать (за2)
LIQUOPER1: лишать
LIQUOPER2: освобождать (от), выводить3 (из-под)
LIQUFUNC2: отменять (над)
CAUSFUNC0: устанавливать, налаживать
V0: контролировать
2.4.2. Правила преобразования предложения.
Вообще говоря, на вход правил перифразирования может поступать произвольное предложение перерабатываемого текста.
Очевидно, однако, что чем сложнее предложение в целом и чем
192
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
больше зависимых у критических лексем, тем меньше свобода
перифразирования. Поэтому реальные эксперименты проводились с относительно простыми предложениями. Это не значит,
впрочем, что мы пытались создать «тепличные» условия для нашей модели — наиболее типичные и часто встречающиеся осложняющие условия мы учитывали.
Чтобы сделать обозримой систему перифразирования в целом,
мы упомянем все используемые в ней блоки правил в естественном порядке их применения.
(а) Морфологический анализ (входное предложение ⇒ его
морфологическая структура или структуры).
(б) Синтаксический анализ (морфологическая структура ⇒
синтаксическая структура или структуры).
(в) Интерпретация синтаксической структуры в терминах ЛФ.
Правила интерпретации опознают в синтаксической структуре ЛФпараметры, проверяя у различных узлов наличие тех синтаксических связей, которые требуются по определению данной ЛФ, и тех
предлогов, которые записаны в строке этой ЛФ в словарной статье
ее ключевого слова. Допускается отсутствие прототипических связей, однако тогда в перерабатываемом предложении должен быть
материал, который их компенсирует, причем в этом случае одновременно с приписыванием символа ЛФ определенному узлу происходит и соответствующая перестройка структуры. Например, в
предложении Директор подавлял инициативу своих подчиненных
потенциально есть материал для того, чтобы опознать глагол подавлять как LIQUFUNC1(инициатива), а именно, группа своих
подчиненных. Она, однако, является квазиагентивным зависимым
существительного инициатива. Поэтому при опознании глагола
подавлять как LIQUFUNC1(инициатива) эта группа перевешивается на второе комплетивное отношение к глаголу — прототипической связи для этой ЛФ.
(г) Нормализация проинтерпретированной синтаксической
структуры, в частности, устранение пустых предлогов, стягивание
элементов аналитической глагольной формы в один узел и другие
подобные операции (правила блока REDUCT системы МП).
(д) Канонизация синтаксической структуры (см. выше).
(е) Перифразирование в собственном смысле. Сюда же встроен и блок простейших общих правил порядка слов, которые
удерживают обрабатываемую синтаксическую структуру в пределах грамматической правильности в тех случаях, когда вторжение
сложных ЛФ типа конверсных приводит к ее глубокой перестройке. Основные идеи линеаризации состоят в том, что, при
193
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
прочих равных условиях, группа подлежащего предшествует сказуемому; группы дополнений следуют за сказуемым; группа косвенного дополнения предшествует группе прямого; обстоятельство времени выносится в начало предложения; «тяжелое» обстоятельство места (с предлогом) выносится в конец предложения;
остальные типы обстоятельств располагаются ближе к глаголу; в
постпозиции к своему хозяину «легкие» (прежде всего, однословные) зависимые предшествуют однотипным «тяжелым» зависимым (дву- и многословным).
(ж) Реинтерпретация (коррекция) полученных синтаксических
структур, приводящая их к тому виду, который имеют синтаксические структуры системы англо-русского МП после этапа собственно перевода (правил блока TRADUCT).
(з) Введение в полученные синтаксические структуры предлогов, упоминаемых в строчках соответствующих ЛФ, если они не
вычисляются обычными средствами ЭТАП’а-3.
(и) Развертывание всех недостающих элементов синтаксической структуры будущего предложения (правила блока EXPANS,
вводящие пустые предлоги, строящие аналитические глагольные
формы и т. п.).
(к) Синтаксический синтез (синтаксическая структура ⇒ морфологическая структура).
(л) Морфологический синтез (морфологическая структура ⇒
предложение).
Блоки правил (а), (б) и (в) заимствованы из русско-английской
системы МП, а блоки правил (ж)–(л) — из англо-русской системы
МП.
2.5. ОСНОВНЫЕ ПРАВИЛА ПЕРИФРАЗИРОВАНИЯ
Ниже даются, в терминах символов ЛФ, основные используемые нами правила канонизации и перифразирования в собственном смысле. Правила перифразирования разбиты на два основных блока — направленные правила перифразирования (они обратны соответствующим правилам канонизации и поэтому опускаются) и двусторонние правила перифразирования. Каждое правило иллюстрируется реальным материалом, полученным в ходе
эксперимента. Приводятся только общие правила; в тех случаях,
когда применение общего правила к данной лексеме ограничено
какими-либо специфическими для нее условиями (например, у
синонима Х-а, в отличие от самого Х-а, есть только одна видовая
194
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
форма), оно переводится в трафаретное и записывается в ее словарной статье.
Общие правила канонизации:
(1) X, СТРАД ⇒ X (Дом строится — Дом строят, Дом
строится рабочими — Рабочие строят дом).
(2) COPUL + A1(X) ⇒ X (Север вреден для меня — Север вредит мне).
(3) COPUL + A2(X) ⇒ X (Этот человек мне ненавистен — Я
ненавижу этого человека).
(4) OPER1 + S0(X) ⇒ X (оказывать сопротивление — сопротивляться).
(5) OPER2+ S0(X) ⇒ X (Город подвергается обстрелу — Город обстреливают).
(6) FUNC0 + S0(X) ⇒ X (Идет спор между философами —
Философы спорят).
(7) FUNC1 + S0(X) ⇒ X (Страх владеет им — Он боится).
(8) LABOR1-2 + S0(X) ⇒ X (Враг подвергает город обстрелу
— Враг обстреливает город).
(9) COPUL + S1(X) ⇒ X (Он был врачом Ивана — Он лечил
Ивана).
(10) GENER(X) + A0(X) ⇒ X (лингвистическая наука — лингвистика).
Двусторонние общие правила перифразирования:
(11) X ⇔ SYN(X) (бросать — кидать).
(12) X ⇔ CONV1(X) (В сосуд входит 100 литров — Сосуд
вмещает 100 литров).
(13) X ⇔ CONV2(X) (Он сообщил мне новости — Он информировал меня о новостях).
(14) X ⇔ CONV3(X) (Я купил у него компьютер — Он продал
мне компьютер).
(15) X ⇔ CONV(X) (Петя — муж Маши — Маша — жена
Пети).
(16) X ⇔ ANTI2(X) (Он отсутствовал на собрании — Он не
присутствовал на собрании).
(17) X + Y ⇔ ANTI1(X) + ANTI2(Y) (Он стал соблюдать
правила — Он перестал нарушать правила).
(18) X ⇔ ANTI3(X) (Она моложе Маши — Маша старше ее).
(19) OPER1 + S0(X) ⇔ OPER2 + S0(X) (Начальство совершало несправедливости по отношению к нему — Он терпел несправедливости начальства).
(20) INCEPOPER1 + S0(X) ⇔ INCEPOPER2 + S0(X) (Я обратил на него внимание — Он привлек мое внимание).
195
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
(21) FINOPER1 + S0(X) ⇔ FINOPER2 + S0(X) (ООН прекратила опеку над этой территорией — Эта территория вышла
из-под опеки ООН).
(22) CAUSOPER1 + S0(X) ⇔ CAUSOPER2 + S0(X) (Парламент привел фашистов к власти в стране — Парламент отдал
страну под власть фашистов).
(23) LIQUOPER1 + S0(X) ⇔ LIQUOPER2 + S0(X) (Правительство лишило монополии контроля над ценами — Правительство вывело цены из-под контроля монополий).
(24) OPER1 + S0(X) ⇔ OPER3 + S0(X) (Он подал директору
заявление об уходе — Директор получил его заявление об уходе).
(25) OPER1 + S0(X) ⇔ FUNC1 + S0(X) (В любви он терпел неудачи — В любви его постигали неудачи).
(26) INCEPOPER1 + S0(X) ⇔ INCEPFUNC1+ S0(X) (Он внес
предложение прекратить дискуссию — От него поступило
предложение прекратить дискуссию).
(27) FINOPER1 + S0(X) ⇔ FINFUNC1+ S0(X) (Он освободился от чувства неловкости — Чувство неловкости оставило его).
(28) CAUSOPER1 + S0(X) ⇔ CAUSFUNC1 + S0(X) (Парламент облек его полномочиями диктатора — Парламент дал ему
полномочия диктатора).
(29) LIQUOPER1 + S0(X) ⇔ LIQUFUNC1 + S0(X) (Мы освободили его от этого бремени — Мы сняли с него это бремя).
(30) CAUSOPER2 + S0(X) ⇔ CAUSFUNC2 + S0(X) (Правительство поставило порнопродукцию под запрет — Правительство наложило запрет на порнопродукцию).
(31) LIQUOPER2 + S0(X) ⇔ LIQUFUNC2 + S0(X) (Суд вывел
его из-под опеки родственников — Суд прекратил опеку родственников над ним).
(32) OPER1 + S0(X) ⇔ COPUL + A1(X) (Он чувствовал вину
перед родителями — Он был виноват перед родителями).
(33) OPER2 + S0(X) ⇔ COPUL + A2(X) (Крестьяне находились под властью феодалов — Крестьяне были подвластны феодалам).
(34) OPER1 + S0(X) ⇔ COPUL + S1(X) (Советский Союз
одержал победу над Германией — Советский Союз был победителем Германии).
(35) OPER2 + S0(X) ⇔ COPUL + S2(X) (Феодалы находились
под властью короля — Феодалы были подданными короля).
196
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
3. РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТОВ
Ниже в порядке иллюстрации приводится небольшая часть
кустов перифраз, полученных по указанным правилам на компьютере. Перифразы перечисляются в том порядке, в каком они появляются на экране. Потенциальные комментарии по поводу не
слишком удачных перифраз, ввиду их очевидности, не приводятся. Существенно, что корни ошибок всегда можно обнаружить и
что большинство ошибок в принципе устранимо.
(1) Дом строится рабочими — Рабочие строят дом — Дом
возводится рабочими — Рабочие возводят дом.
(2) Нельзя было нарушать правила безопасности — Было надо не нарушать правила безопасности — Было нельзя не соблюдать правила безопасности — Было надо соблюдать правила
безопасности.
(3) Они беседовали шепотом — Они шепотом говорили —
Разговор ими шепотом велся — Они шепотом вели разговор —
Они шепотом разговаривали — Они шептали.
(4) Комиссия поставила порнографическую продукцию под
запрет — Запрет был наложен комиссией на порнографическую
продукцию — Комиссия наложила запрет на порнографическую
продукцию — Запрет был введен комиссией на порнографическую продукцию — Порнографическая продукция была поставлена комиссией под запрет.
(5) Ненависть к этому человеку горит в мне — Этот человек
мне ненавистен — Ненависть к этому человеку кипит в мне —
Ненависть к этому человеку клокочет в мне — Ненависть к
этому человеку мной испытывается — Ненависть к этому человеку мной питается — Я испытываю ненависть к этому человеку — Я питаю ненависть к этому человеку — Я чувствую ненависть к этому человеку — Этот человек мной ненавидим — Я
ненавижу этого человека.
(6) Газ всегда равномерно давит на стенки сосуда — Всегда
равномерное давление на стенки сосуда оказывается газом —
Всегда газ оказывает равномерное давление на стенки сосуда —
Всегда стенки сосуда подвергаются равномерному давлению газом.
(7) Немцы разрушили город — Город был уничтожен немцами — Немцы уничтожили город — Город был разрушен немцами
— Разрушение города было произведено немцами — Немцы произвели разрушение города — Город подвергся разрушению нем-
197
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
цами — Город был подвергнут разрушению немцами — Немцы
подвергли город разрушению.
(8) Между философами давно идет спор о смысле жизни —
Давно философы спорят о смысле жизни — Давно философы ведут спор о смысле жизни — Давно философы участвуют в споре
о смысле жизни.
(9) В последние годы происходит резкий рост преступности
— В последние годы преступность резко увеличивается — В последние годы преступность резко возрастает — В последние годы преступность резко поднимается — В последние годы преступность резко растет.
(10) От мяса исходил дурной запах — Дурной запах издавался
мясом — Мясо издавало дурной запах — Дурной запах испускался
мясом — Мясо испускало дурной запах — Мясо дурно пахло.
(11) Противник подвергает город интенсивному обстрелу —
Производится противником интенсивный обстрел города —
Противник производит интенсивный обстрел города — Ведется
противником интенсивный обстрел города — Противник ведет
интенсивный обстрел города — Город подвергается интенсивному обстрелу противником — Происходит интенсивный обстрел города противником — Город интенсивно обстреливается
противником — Противник интенсивно обстреливает город.
(12) Журналисты подробно прокомментировали это событие
— Подробный комментарий по поводу этого события был дан
журналистами — Журналисты дали подробный комментарий по
поводу этого события — Это событие было сопровождено
журналистами подробным комментарием — Журналисты сопроводили это событие подробным комментарием — Это событие подробно было прокомментировано журналистами.
(13) Укрепленный пункт подвергся атаке врага — Атака на
укрепленный пункт была предпринята врагом — Атака на укрепленный пункт была произведена врагом — Враг произвел атаку
на укрепленный пункт — Враг предпринял атаку на укрепленный
пункт — Укрепленный пункт был атакован врагом — Враг атаковал укрепленный пункт — Укрепленный пункт подвергся атаке
противника — Укрепленный пункт подвергся атаке неприятеля
и т. д. (повторяются все предшествующие перифразы с синонимами слова враг).
(14) Я полностью лишился аппетита — Я полностью потерял аппетит — Аппетит полностью пропал у меня — Аппетит
полностью был мной потерян.
198
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
(15) Это зрелище вызвало у него ужас — Это зрелище привело его в ужас — Это зрелище повергло его в ужас — Это зрелище вселило ужас в него — Это зрелище навело ужас на него —
Это зрелище внушило ему ужас — Он был приведен этим зрелищем в ужас — Он был повергнут этим зрелищем в ужас — Ужас
был вселен этим зрелищем в него — Ужас был наведен этим зрелищем на него — Ужас был вызван этим зрелищем у него —
Ужас был внушен этим зрелищем ему.
(16) Правительство установило контроль над ценами — Цены были поставлены правительством под контроль — Правительство поставило цены под контроль — Контроль был установлен правительством над ценами.
(17) Правительство контролирует цены — Контроль цен
осуществляется правительством — Правительство осуществляет контроль цен — Цены под контролем правительства —
Цены держит правительство под контролем — Цены контролируются правительством.
(18) Правительство отменило контроль над ценами — Цены
были освобождены правительством от контроля — Правительство освободило цены от контроля — Цены были выведены правительством из-под контроля — Контроль был отменен правительством над ценами.
(19) Иван был врачом Петра — Иван был доктором Петра —
Петр был пациентом Ивана — Петр лечился у Ивана — Иван лечил Петра.
(20) Я поменялся с ним местами — Он поменялся местами с
мной.
В качестве курьеза приведем перифразу, основанную на известной шутке, которая воспроизведена в книге «Легендарная
Ордынка» (Михаила Ардова, Бориса Ардовых и Алексея Баталова): — Что такое «лицо еврейской национальности»? — Это —
государственный эвфемизм для выражения «жидовская морда».
Формализация отношений между двумя фраземами в терминах
ЛФ и последующее экспериментирование на компьютере привели
к следующей серии перифраз: лицо еврейской национальности —
жидовская морда — морда жидовской национальности — еврейская морда — жидовское лицо — лицо жидовской национальности — еврейское лицо.
199
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
4. ЗАКЛЮЧЕНИЕ
1. Построенная нами модель перифразирования описывает синонимическую систему языка, которой интуитивно владеет всякий говорящий на нем человек. Однако не следует думать, что
любое высказывание можно реально перифразировать с помощью
всех имеющихся в ней средств. Высказывание чересчур укоренено в контексте и в конситуации, чтобы допускать столь свободное
трансформирование.
2. Рассмотренная система перифразирования работает на материале русского языка. Но поскольку, как было указано выше,
теория ЛФ носит универсальный характер, для переноса системы
перифразирования на материал других языков, в частности, английского, требуется лишь выполнить некоторый объем по существу технической работы. Действительно, список ЛФ и типов
правил сохраняется. В нынешней версии английского комбинаторного словаря, как и в русском комбинаторном словаре, уже
есть свыше 1000 словарных статей, снабженных информацией о
ЛФ. Остается написание самих правил канонизации и перифразирования, идентичных правилам на русском материале (с точностью до названий синтаксических отношений), а также сборка нового режима работы комплекса — англо-английского перевода,
включающего эти правила.
3. Эксперименты с моделью перифразирования дали несколько неожиданных побочных результатов, представляющих принципиальный интерес. Упомянем два из них.
а) Коррекция правил синтаксического анализа. Пример. Во
фразах типа Отец был окружен заботой сына слово заботой, в
результате правил синтаксического анализа, оказывается агентивным зависимым глагола окружен. На самом деле заотой должно
быть его вторым комплетивным зависимым; ср. окружать кого
чем. Именно такая синтаксическая структура нужна для того,
чтобы опознать глагол окружать как ЛФ LABOR1–2 îò слова забота. Разумеется, всегда есть возможность провести перестройку
полученной синтаксической структуры в ходе ее ЛФинтерпретации (см. об этом пункт (в) в разделе 2.4.2) и получить
нужную для данной ЛФ структуру зависимостей. Более принципиальное решение, однако, состоит в том, чтобы не получать неправильных структур еще на этапе синтаксического анализа. Для
этого в агентивную синтагму достаточно ввести условие, запрещающее ключевому слову (в нашем случае — существительному
забота) быть агентивным зависимым лексемы, записанной в ка200
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
честве ЛФ LABOR1-2 в его словарную статью, если само это существительное имеет агентивное или квазиагентивное зависимое
êâàçèàãåí ò
(ср. заботой
сына).
б) Коррекция словаря. Пример. От многих ключевых словсуществительных возможны ЛФ INCEPOPER1, FINOPER1,
INCEPOPER2, FINOPER2 и другие подобные, значениями которых являются глаголы типа приходить в (ярость), входить в
(азарт), попадать под (обстрел) и т. п. При разработке комбинаторного словаря модели управления таких глаголов, как уже было
сказано в разделе 2.2, описывались по единой схеме, в основу которой была положена актантная структура нейтральных глаголов
перемещения: что перемещается (первый актант), откуда (второй актант) и куда (третий актант). В соответствии с этой схемой
группы в ярость, в азарт, под обстрел оказывались вторыми
комплетивными зависимыми (третьими актантами) глаголов приходить, входить и попадать соответственно, между тем как по
определению ЛФ INCEPOPER1, FINOPER1, INCEPOPER2,
FINOPER2 и т. п. они должны быть первыми комплетивными зависимыми глаголов (вторыми актантами). По указанной причине
полученные структуры в ходе ЛФ-опознания подвергались реинтерпретации. Более принципиальной была бы дифференцированная трактовка глаголов типа выходить и входить: лишь у первых
начальная точка перемещения соответствует второму актанту, а
конечная — третьему. У глаголов типа входить, наоборот, конечная точка соответствует второму актанту, а начальная — третьему. Здесь, следовательно, требуется кардинальная ревизия словаря.
Эти два примера свидетельствуют о том, что модель перифразирования на глазах превращается в экспериментальный полигон
лингвистической теории, обладающий огромными возможностями: от него идут мощные корректирующие импульсы в оба
главных компонента лингвистического описания — синтаксис и
словарь.
4. Построенная нами модель перифразирования может иметь
несколько вполне разумных практических применений. Упомянем возможность ее использования в системе МП в тех случаях,
когда в выходном языке отсутствует выражение для данной ЛФ
или когда условия контекста вынуждают искать вариант выражения данного содержания другими средствами. Мы также предполагаем использовать перифразирование в качестве еще одной
лингвистической игры в разработанной нами системе изучения
лексики с помощью компьютера. Упомянем, наконец, становя201
Ю. Д. Апресян, Л. Л. Цинман. Перифразирование на компьютере
щиеся популярными системы компьютерной поддержки текстопорождения (так называемые authoring systems), где модель перифразирования могла бы служить средством поиска оптимального
варианта выражения мысли или, во всяком случае, облегчать автору поиск такого варианта.
ЛИТЕРАТУРА
Апресян Ю. Д., Жолковский А. К., Мельчук И. А. О системе семантического синтеза. III. Образцы словарных статей // НТИ, серия 2, 1968,
№ 11.
Апресян Ю. Д., Цинман Л. Л. Об идеологии системы ЭТАП-2 // Формальное представление лингвистической информации. Новосибирск,
1982.
Апресян Ю. Д., Богуславский А. В., Иомдин Л. Л., Лазурский А. В.,
Митюшин Л. Г., Санников В. З., Цинман Л. Л. Лингвистический процессор для сложных информационных систем. М., 1992.
Арсентьева Н. Г., Баландина Н. А., Красовская А. И. О машинной
реализации системы перифразирования. Ордена Ленина Институт прикладной математики АН СССР. Препринты 25, 26, 27. М., 1969.
Жолковский А. К., Мельчук И. А. О возможном методе и инструментах семантического синтеза // НТИ, серия 2, 1965, № 6.
Жолковский А. К., Мельчук И. А. О системе семантического синтеза.
I. Строение словаря // НТИ, серия 2, 1966, № 11.
Жолковский А. К., Мельчук И. А. О семантическом синтезе // Проблемы кибернетики, 1967, вып. 19.
Мельчук И. А. Об одном классе фразеологических сочетаний (описание лексической сочетаемости с помощью семантических параметров)
// Проблемы устойчивости и вариантности фразеологических единиц.
Тула, 1968.
Мельчук И. А. Опыт теории лингвистических моделей «Смысл ⇔
Текст». М., 1974.
Mel’c›uk Igor, Arbatchewsky-Jumarie Nadia, Iordanskaja Lidija et Mantha
Suzanne. Dictionnaire explicatif et combinatoire du français contemporain.
Recherches lexico-semantiques III. Montreal, 1992.
202
Скачать