Î ÐÅÊÎÍÑÒÐÓÊÖÈÈ ÏÎ ÒÅÊÑÒÓ ÌÎÄÅËÈ ÌÎÐÔÎËÎÃÈ×ÅÑÊÎÉ ÊÀÒÅÃÎÐÈÈ

advertisement
О РЕКОНСТРУКЦИИ ПО ТЕКСТУ МОДЕЛИ
МОРФОЛОГИЧЕСКОЙ КАТЕГОРИИ
Ольга А. Невзорова
Казанский государственный университет
Olga.Nevzorova@ksu.ru
ВВЕДЕНИЕ
Традиционные проблемы языка,
мышления и сознания получили
мощный импульс своего развития в последние десять - пятнадцать лет в
связи с теорией
произошло
искусственного
становление
искусственного
идея
в
этот
период
когнитивной парадигмы исследований в области
интеллекта.
фундаментальная
интеллекта. Именно
о
В
основе
том,
что
когнитивного
подхода
лежит
представляет
собой
представлениями
типа
мышление
манипулирование внутренними (ментальными)
фреймов, планов, сценариев, моделей и других структур знаний. Современные
представления
о
природе мышления как системе манипулирования с
ментальными представлениями опираются на следующую базовую идею. В
процессе обработки информации можно выделить два
независимых подпроцесса. Первый связан
представления знаний, концептуальной
с
относительно
формированием структуры
организацией
знаний.
Второй — с
функционированием стратегий и механизмов вывода на знаниях.
Современный уровень понимания проблемы позволяет вплотную
подойти к постановке задачи построения интегральной
информации
модели
обработки
человеком, включающей сферы эмоций, чувств, образных
представлений, человеческих навыков и т.д. Одной из составляющей такой
модели является модель усвоения языка развивающимся интеллектом. В
настоящей работе будет рассмотрен когнитивный подход к построению модели
усвоения грамматики ЕЯ и ряд результатов, полученных при реализации данной
модели.
КОГНИТИВНАЯ МОДЕЛЬ РЕКОНСТРУКЦИИ ГРАММАТИКИ
ЕЯ
Развитие
грамматики
является когнитивным
которого ребенком усваиваются основные
синтаксиса
родного языка.
другими познавательными
семантической
Усвоение
процессом,
закономерности
грамматики
процессами,
такими
морфологии
тесно
как
в ходе
и
связано
с
формирование
модели языка, развитие коммуникативных намерений и др.
Эти когнитивные процессы являются первичными по отношению к процессам
становления грамматики и составляют необходимую базу для последних.
Формирование когнитивной модели грамматики базируется на представлении
о том, что развитие познавательных процессов
и
языковое развитие не
происходят абсолютно параллельно. Для того, чтобы овладеть грамматикой
родного языка, ребенку необходимо прежде осознать
те
физические
и
социальные явления, информация о которых передается при помощи языка и
лишь затем найти языковые средства для выражения осознанных фактов.
В когнитивной модели грамматики представлены когнитивные механизмы,
позволяющие обрабатывать, организовывать и хранить информацию
о
грамматике языка на базе сформированных семантических знаний о мире.
В
работах
универсальности
допущения
ряда
психолингвистов
онтогенеза
того,
что
грамматики.
выдвинута
Эта гипотеза
гипотеза
исходит
об
из
ребенок руководствуется некоторыми общими
принципами, независимыми от частных особенностей конкретного ЕЯ при
решении задачи овладения языком. В работе Д.Слобина сформулированы
гипотетические
грамматические
механизмы
и
стратегии, используемые
ребенком для получения знаний об организации языка.
Рассматриваемая в настоящей работе когнитивная модель грамматики
ЕЯ
базируется
Подробный
на
анализ
оперативных принципах
стратегий
Д.Слобина
дан
и стратегиях Д.Слобина.
в
[1].
Основная
идея
предложенного подхода состоит в рассмотрении процесса усвоения грамматики
как процесса реконструкции по тексту (речи) грамматических правил на основе
индуктивных обобщений. Уровень моделирования грамматики при дальнейшем
рассмотрении будет ограничен построением модели морфологического понятия.
Когнитивная модель реконструкции грамматики ЕЯ (КМРГ ЕЯ)
представляет собой интегральную модель,
которая содержит следующие
составляющие (см. рис.1):
- объектно-ориентированную модель проблемной области;
- опорную модель грамматических значений;
- модель
формирования грамматических понятий.
В основе построения концепции КМРГ лежат следующие исходные
положения.
1. Процесс формирования модели грамматики ЕЯ тесно связан с
процессом формирования представлений о семантической модели мира.
Грамматика является средством выражения в языке знаний о структуре мира,
системе
взаимосвязей
объектов
мира. Семантическая модель мира не
формируется в КМРГ, а задается априорно. Семантические знания о мире
описываются в структурах объектно-ориентированной
модели
проблемной
области.
2. В КМРГ анализируется множество обучающих примеров, в которых
фиксируются
грамматические
способы
выражения определенных
семантических явлений, Семантические значения грамматических объектов
(категорий) задаются в структурах опорной модели грамматических значений.
3. Модель грамматического (морфологического) понятия формируется
на основе когнитивных стратегий распознавания грамматики Д.Cлобина и
индуктивных стратегий обобщения.
Рассмотрим обобщенную
схему процесса формирования модели
морфологического понятия. Исходные тексты на ЕЯ интерпретируются в
структурах объектно-ориентированной модели проблемной
построении
интерпретации
используется
смешанная
стратегия
анализа.
На
интерпретация
строится
без использования грамматических знаний. По
накопления
механизмы
грамматических
дополняются
На основе
этапах
При
cемантического
мере
начальных
области.
знаний
формирования
КМРГ
базовые семантические
механизмами грамматического анализа.
результатов
интерпретации
исходных текстов с учетом
определенных критериев, отражающих связь семантических и грамматических
явлений, строится обучающая выборка примеров, в которых фиксируются
способы
маркировки определенных
грамматических
значений
исследуемой морфологической категории (морфологического понятия). На
основе примеров обучающей выборки посредством индуктивных обобщений
формируется модель морфологического понятия.
ОПОРНАЯ МОДЕЛЬ ГРАММАТИЧЕСКИХ ЗНАЧЕНИЙ
Остановимся
подробнее
на
рассмотрении
опорной
модели
грамматических значений. Основные результаты по другим составляющим
интегральной модели изложены в [3].
Итак, целью дальнейшего изложения является построение гомоморфного
отображения множества определенных семантических признаков на множество
грамматических признаков. Другими словами, требуется установить, какая
семантика лежит в основе определенных грамматических явлений и в каких
структурах знаний моделируемые явления могут быть представлены.
В дальнейшем: объектом рассмотрения будут категориальных значений
морфологических категорий русского языка и описание элементов опорной
модели грамматических значений для некоторых выделенных морфологических
категорий.
Опорная модель состоит из конечного множества элементов, каждый из
которых представляет собой модель связи "грамматический объект/опорный
объект". В этой связи опорный объект мотивирует грамматический объект. Тип
опорного объекта может быть как семантическим,
так и асемантическим
(формальным).
Безусловно, опорная
модель (прежде всего элементы семантических
типов) является довольно приближенным описанием реальной картины
семантической
мотивированности
грамматических
значений.
Хотя
в
грамматических формах представлены все основные виды мотивированных
связей с явлениями и реалиями внешнего мира, в силу того, что эти связи
мотивированы как бы отраженным светом,
через призму глубинных
семантических явлений языка и через категории мышления, грамматические
значения служат в целом для языка значениями внутренними. Грамматические
значения воздействуют изнутри языка на его содержание и на мышление,
последние
непосредственно
отражают
внешний
свойственные данному языку структуры,
мир,
организуя
их
в
которые не всегда параллельны
структурам реалий внешнего мира. Тем не менее, представляется допустимым
использовать связи указанного вида на этапе формирования грамматических
понятий в качестве базовой стратегии распознавания соответствующих
грамматических явлений.
В качестве опорных объектов могут выступать семантические классы
объектов,
определенные типы семантических отношений, определенные
наборы семантических элементов,
формальные классы признаков и др.
Неоднородный характер опорных объектов связан в первую очередь с
различными по уровню сложности моделируемыми явлениями. Опишем
элементы опорной модели для морфологических категорий рода и падежа
существительных русского языка.
Категория
рода
существительного
-
это
несловоизменительная
синтагматически выявляемая морфологическая категория, выражающаяся в
способности существительного в формах единственного числа относиться
избирательно к родовым формам согласуемой (в сказуемом - координируемой)
с ним словоформы [4].
Данная категория выступает как классификация существительных по
разрядам, при этом основания для именной классификации в различных
языках могут быть как семантическими, так и формальными.
Опорным объектом для категории рода является синтаксическая связь
"согласование в роде", задающая способ согласования существительного с
атрибутом-признаком.
Категория рода определяет разбиение множества объектов на конечное
число классов M={Mi} i=1,k,
таких что элементы
одного
класса
имеют
одинаковые модели согласования "объект - признак объекта". а элементы,
относящиеся к различным классам, - различные модели согласования
указанного вида.
Обобщение по значениям формального показателя согласования в роде
позволяют
построить
родовые
классы
и
решающие
правила
для
грамматического понятия рода [2].
Категория падежа [4] - это словоизменительная категория имени,
выражающаяся в системе противопоставленных друг другу рядов форм и
обозначающая отношение имени к другому слову (словоформе) в составе
словосочетания или предложения. Основными и самыми обобщенными
падежными значениями являются объектное, субъектное и определительное
(последнее объединяет в себе все виды определительности,
включая и
обстоятельственно-определительные значения). Внутри каждого из названных
значений существует дальнейшая дифференциация, отражающая те частные
виды общего значения, которые связаны с конкретным падежом [4].
В функциональном
отношении
падежи образуют сложную и
разветвленную систему, совмещающую в себе множество содержательных и
формальных функций. Разнотипные функции существительных объединены в
падежной системе под эгидой позиционных функций,
то есть
функций
субъекта и прямого объекта. Помимо позиционных падежи осуществляют и
обстоятельственные функции.
вторых заключается в их
предиката.
Главное отличие функций первого рода от
различном отношении к значению глагольного
Обстоятельственные
функции
указывают
на
локальные,
темпоральные, каузальные и другие условия протекания глагольного действия.
Позиционные функции характеризуют глагол `изнутри',
выделяя предметы,
непосредственно участвующие в обозначенном глаголом действии.
В качестве опорного объекта для категории падежа выступает ролевой
фрейм специального типа, который представляет собой полную коллекцию
ролей объекта в выделенных контекстах. Из слотов ролевых фреймов
выделяются множества падежных форм существительных, на основе которых
формируется модель категории падежа.
ОСНОВНЫЕ ВЫВОДЫ
Опорная
модель
грамматических
значений
описывает
основные
категориальные значения морфологических категорий существительных и
глаголов. Элементы опорной модели выделяют для каждого рассматриваемого
грамматического объекта (морфологической категории) опорный
объект
семантического или асемантического (формального) типа. Множество опорных
объектов выделяется при анализе ЕЯ-текстов. Это множество впоследствии
становится исходным для индуктивных алгоритмов формирования модели
соответствующий морфологической категории. Описанный подход, конечно, не
учитывает всех аспектов значений морфологических категорий. Кроме того, при
заданном подходе требуется некоторым специальным
способом выделять
определенную семантическую информацию (значения видовых характеристик
глагола, модальность действий и др.). Эта информация является внешней
для
алгоритмов формирования
моделей морфологических категорий и не
извлекается при построении семантической интерпретации исходных текстов.
Предлагаемая модель позволяет моделировать процесс реконструкции
морфологических
категорий путем формирования обучающей выборки на
основе опорных объектов и индуктивных обобщений на построенном
множестве примеров [Невзорова]. Представление моделей морфологических
категорий на основе опорных объектов позволяет описывать морфологические
знания в познавательных схемах. В познавательных схемах представляется
базовая семантика морфологического явления и формально-языковые способы
ее выражения. Обобщения в множестве познавательных схем позволяют
строить модели морфологических категорий.
ЛИТЕРАТУРА
1. Невзорова О.А. Когнитивная модель грамматики: первая ступень
//Труды международного семинара Диалог’95 по компьютерной лингвистике и
ее приложениям. Казань, 1995. С.216-222.
2. Невзорова
О.А.
Индуктивный
подход
к
построению
модели
грамматического рода //Труды международного семинара Диалог’96. М., 1996. С.175-176.
3. Когнитивная и компьютерная лингвистика. Вып. 1. Казань, 1994. С. 547.
4. Русская грамматика. Том 1. М.: Наука, 1980.
Download