временных отношений

advertisement
1
Методика преобразования текста на
естественном языке в объектно-атрибутную
семантическую сеть
НИУ ВШЭ,
Московский институт электроники и математики
Петрова С. Б.
Салибекян С. М.
Тиновицкий К. Д.
КОНФЕРЕНЦИЯ «НЕЙРОКОМПЬТЕРЫ И ИХ ПРИМЕНЕНИЕ» (17 МАРТА 2015 Г.)
Семантический
объектно-атрибутный граф
Class
Stage
Atr
Atr
Состояние
Subj
Act
Свойство 1
Obj
Объект
Class
Субъект
SubAtr
Atr1
Atr2
Atr3
Свойство 2
Stage
SubAtr
Atr1
Atr2
Atr3
2
Семантические атрибуты ОА-графа












3
Elem – элемент множества;
Excl – исключение из множества (от англ. exclude);
Class – класс объекта;
Name – имя объекта;
SetMemb – член множества;
Action – действие (состояние) объекта;
Subj – субъект действия;
Obj – объект действия (выражается дополнением);
Recipient – адресат (тот, для кого совершается действие);
Track – ссылка на описание пространственно-временных отношений;
MoveType – тип движения (пешком, на машине, и т.п.);
Time – указатель на описание момента времени, привязанного к
локативу;
 Place – описание места;
 State – состояние объекта;
 ……
Структура семантического
ОА-графа
Описание множества
объектов
Объекты
Элементы множества
Объекты
Описание множества
свойств
Элементы множества
Состояния, свойства
Трассы (множество
локативов)
Точки трассы
Локативы
Измерения и числа
Свойства и
состояния
Описание множества чисел
Элементы множества чисел
Измерения (числа)
Пространственно-временные и
причинно-следственные
отношения
4
Пример описания пространственновременных отношений предложения
«Он увидел машину через окно.»
5
Пример описания пространственновременных отношений (ОА-граф)
Set
Set
Set
Elem
Elem
Elem
Class
Class
Atr
Set
Track
Elem
Subj
Action
Obj
Look
ZeroPoint
Atr
Track
Track
Set
Elem
Elem
Action
Action
nil
nil
SetOrder
Direction
AxisPoint
Forward
Elem
State
ОБЪЕКТЫ
Car
Window
Person
Set
Class
Atr
6
Elem
State
Elem
State
СВОЙСТВА
ПРОСТРАНСТВОВРЕМЯ
Формат семантикоморфологического словаря
7
Мнемоника Толкова
ния
...
Сем. св.
Часть
речи 1
Род 1
Сущ.
Муж.
Семантические
свойства
Сем. св.
Сем. св.
Мнемоника Толкова
ния
...
Часть
речи 2
Род 2
Сущ.
Муж.
ОПИСАНИЕ
ЛЕКСЕМЫ
Класс
Объект 1
Класс 1
Объект
Класс
Объект 2
Класс 2
Семантические
свойства
Сем. св.
Сем. св.
Объект
МОРФОЛОГИЧЕСКИЕ
СВОЙСТВА
СЕМАНТИЧЕСКИЕ
СВОЙСТВА
Преобразования текста в ОА-граф
СЕМАНТИЧЕСКИЙ ОА-ГРАФ
ОБЪЕКТ (СЕМ)
СВЯЗЬ
СПИСОК СЛОВОФОРМ
ИЗ ПРЕДЛОЖЕНИЯ
УДАЛЕННОЕ
ОПИСАНИЕ
СЛОВОФОРМЫ
8
Сцепка толкований словоформ
Прил.
Сем. св.
Сущ
Сем. св.
Признак 1 Признак 2
Сущ
Сем. св.
Свойство
Признак 1 Признак 2
9
Фазы для преобразования
русского языка











10
Числительное.Составное – Число
Наречие.Меры и степени + Глагол
Наречие.Меры и степени + Наречие
Существительное.Собирательное – Множество
Существительное.Конкретное + Число – Множество
Существительное.Измерение + Число – Измерение
Прилагательное + Существительное
Местоимение.Притяжательное + Существительное
Предлог.Пространственные + Локатив.Место –Полутрек.Место
Предлог.Временные + Время – Полутрек.Время
Глагол + Трек
Расфоркивание толкований
словоформ
2
3
1
11
2
4
2
4
2
5
2
5
3
4
3
4
3
5
3+5
4
5
СЦЕПКА
СЛОВОФОРМ
6
1
6
1
6
Семантические атрибуты для
согласования толкований словоформ
-
Зрение;
Слух;
Чувства (зрение, слух, обоняние, осязание, вкус);
Вместилище (то, что может вмещать в себе что-то);
Движение;
Статика;
Физический объект;
Абстрактное понятие;
Множество;
Топология;
Временной интервал;
Измерение длинны;
Измерение времени;
Преобразование;
Географический объект;
Процесс;
……
12
Пример использования атрибутов для
согласования толкований словоформ
Атрибут
первого
слова
Атрибут
второго
слова
Смысл
13
Пример
Глагол
статики
Физический
объект
Находиться за
объектом
«Прятаться за
деревом»
Глагол
динамики
Движимый
физический
объект
Движение
«Следовать за
одного объекта гидом»
за другим
Глагол
процесса
Временной
интервал
Длительность
действия
«Я сделаю это за
две недели.»
Глагол
мнения
Роль
Мнение, что
кто-то
выступает в
роли кого-то
«Принимать за
умного»
Выводы
14
 разработан формат семантического ОА-графа,
состоящего из 4 уровней, каждый из которых
разделяется на 3 подуровня, и описывающий смыл,
заложенный в тексте;
разработана псевдофизическая логика (правила
описания и вывода знаний о пространственновременных отношениях)
 выделены
некоторые
признаки
для
семантического согласования слов;
 разработана общая методика семантического
анализа ЕЯ и методики для русского языка.
15
Спасибо
за внимание!
Download