ppt, 240K - Летняя лингвистическая школа

advertisement
Машинный перевод,
основанный на правилах:
есть ли у него будущее
Леонид Лейбович Иомдин
Лаборатория компьютерной
лингвистики Института проблем
передачи информации РАН им.
А.А.Харкевича
Что такое машинный перевод?
Машинный перевод – это
процесс, при котором
компьютер по заданному тексту
на одном языке производит
новый текст на другом
языке, которого раньше в этом
компьютере не было
Летняя лингвистическая школа2010, Дубна
2
Когда можно говорить, что текст A на
одном естественном языке является
переводом текста Б на другом языке?
Тогда, когда оба текста – А и Б –
имеют одинаковый смысл. Задача
любого переводчика состоит в том,
чтобы передать смысл текста на
одном языке средствами другого
языка. В этом же состоит и задача
машинного перевода.
Летняя лингвистическая школа2010, Дубна
3
Разные подходы к
машинному переводу
правиловый подход (rule-based
approach)
статистический подход
(statistical approach)
Летняя лингвистическая школа2010, Дубна
4
Система машинного
перевода ЭТАП-3: основана
на лингвистических
правилах
Летняя лингвистическая школа2010, Дубна
5
Теория «Смысл  Текст»
И.А. Мельчука
Летняя лингвистическая школа2010, Дубна
6
И.А. Мельчук.
Опыт теории лингвистических
моделей «Смысл  Текст».
Москва, «Наука», 1974 /
Москва, Школа «Языки
русской культуры», 1999
Летняя лингвистическая школа2010, Дубна
7
Теория интегрального
описания языка
Ю.Д.Апресяна:
идеальное соответствие словаря и
грамматики
Летняя лингвистическая школа2010, Дубна
8
Ю.Д.Апресян.
Избранные труды, том 2.
Интегральное описание языка
и системная лексикография. М.: Школа «Языки русской
культуры», 1995.
Летняя лингвистическая школа2010, Дубна
9
Язык есть универсальный
преобразователь из
смыслов в тексты и обратно
Летняя лингвистическая школа2010, Дубна
10
Наблюдаемый текст
Ненаблюдаемый смысл
Летняя лингвистическая школа2010, Дубна
11
Смысл – конструкт,
представление на специальном
семантическом языке
Летняя лингвистическая школа2010, Дубна
12
Направление преобразования,
осуществляемого языком
• Анализ текста
• Синтез текста
Летняя лингвистическая школа2010, Дубна
13
Лингвистические уровни:
фонетический
морфологический
синтаксический
семантический
Летняя лингвистическая школа2010, Дубна
14
Диалог vs. перевод
Чередование анализа и
синтеза
Самая трудная проблема
машинного перевода неоднозначность
естественного языка
Проблема неоднозначности
Я купил капусту
I bought a cabbage
Она продает капусту
She sells a cabbage
She sells cabbage
Летняя лингвистическая школа2010, Дубна
17
Проблема неоднозначности
Мальчик упал.
Мальчик поднялся.
Ручка упала.
Ручка поднялась.
Монетка упала.
Рубль упал.
Рубль поднялся.
Летняя лингвистическая школа2010, Дубна
18
Проблема неоднозначности
Наша цель: хорошо учиться.
Our purpose is to learn well
Наше мнение: хорошо учиться
Our opinion is to learn well
Our opinion is that to learn is good
Летняя лингвистическая школа2010, Дубна
19
Download