Аннотация рабочей программы дисциплины «Автоматизированная обработка текстовых массивов» Цель изучения дисциплины Целью освоения дисциплины «Автоматизированная обработка текстовых массивов» является формирование у обучающихся системного представления о методах автоматизированной обработки естественно-языковых текстовых массивов на всех уровнях лингвистического анализа; ознакомление обучающихся с теоретическими концепциями, практическими методами и системами автоматизированной обработки естественно-языковых текстовых массивов. Место дисциплины Дисциплина «Автоматизированная обработка текстовых массивов» в структуре относится к базовой части учебного планапо направлению подготовки образовательной 45.03.02 Лингвистика. программы В результате освоения дисциплины выпускник должен обладать следующими компетенциями: - умеет работать с основными информационно-поисковыми и экспертными системами, системами представления знаний, синтаксического и морфологического анализа, автоматического синтеза и распознавания речи, обработки лексикографической информации и автоматизированного перевода, автоматизированными системами Формируемые идентификации и верификации личности (ПК-21); компетенции - владеет методами формального и когнитивного моделирования естественного языка и методами создания метаязыков (ПК-22); владеет методами формального и когнитивного моделирования естественного языка и методами создания метаязыков (ПК-23); владеет стандартными способами решения основных типов задач в области лингвистического обеспечения информационных и других прикладных систем (ПК-24). В результате освоения дисциплины обучающийся приобретает следующие навыки: Знать: общие принципы построения систем автоматической обработки текста (письменного и устного); структуру систем синтеза и анализа; построение графематического, морфологического, синтаксического анализа (для одной из моделей ЕЯ); основные формальные модели для уровней графематического, морфологического, синтаксического и семантического анализа текстовых массивов; основные алгоритмы автоматической обработки текстовых массивов при порождении речи; Знания, умения и морфологическом и синтаксическом анализе текстовых массивов; навыки, основные принципы автоматической обработки фонетических, получаемые в лексических, грамматических элементов естественного языка; результате основные этапы обработки текста в системах автоматического синтеза освоения и распознавания речи; практические возможности современных систем дисциплины автоматической обработки естественного языка; принципы построения систем автоматического индексирования и реферирования тестовых массивов. Уметь: охарактеризовать принципы морфологического, синтаксического анализа (на примере одной из систем);. описывать подмножества языка для различных метаязыков (на уровне графематики, морфологии; синтаксиса); работать с системами морфологического и синтаксического анализа текста. Иметь навыки: работы с инструментами автоматической обработки естественного языка; моделирования морфологических и синтаксических структур на одном из метаязыков; работы с морфоанализаторами, автоматическими словарями; автоматического реферирования текста с использованием компьютерных средств. 1. Автоматическая обработка устной речи 2. Автоматы, формальные грамматики и языки 3. Ввод, распознавание и графематический анализ текста 4. Морфологический анализ в системах автоматической обработки текста 5. Синтаксический анализ в системах автоматической обработки текста Содержание дисциплины 6. Семантический анализ в системах автоматического анализа текста 7. Словарная поддержка 8. Синтез текстов на естественном языке 9. Лингвистическое обеспечение прикладных систем различного назначения 10. Автоматическое преобразование текста Основная и дополнительная литература 1. Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции. Т.1-2. - М., 1978. 2. Баранов А.Н. Введение в прикладную лингвистику. - М.: Изд-во ЛКИ, 2007. – 360 с. 3. Всеволодова А.В. Компьютерная обработка лингвистических данных: учебное пособие. М.: Флинта: Наука, 2007. – 96 с. 4. Гладкий А.В. Синтаксические структуры естественного языка. М.: Изд-во ЛКИ, 2007. – 152 с. 5. Зубов А.В., Зубова И.И. Основы искусственного интеллекта для лингвистов: Учеб. пособие. – М.: Университетская книга, Логос, 2007. – 320 с. 6. Леонтьева Н.Н. Автоматическое понимание текстов: системы, модели, ресурсы. - М.: Академия, 2006. 7. Лосев А.Ф. Введение в общую теорию языковых моделей: учебное пособие. М., 2004. 8. Марчук Ю.Н. Компьютерная лингвистика: учебное пособие. М.: Используемые Восток-Запад, 2007. – 317 с. информационные, 9. Пиотровский Р.Г. Инженерная лингвистика и теория языка. Л.: инструментальные Наука, 1979 и программные 10. Потапова, Р.К. Новые информационные технологии и средства лингвистика: учебное пособие. М.: КомКнига, 2005. – 364 с. 11. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука, 1989. 12. Хомский Н., Миллер Дж. Введение в формальный анализ естественных языков: Пер с англ. М.: Едиториал УРСС, 2003. – 63 с. 13. Хопкрофт Дж., Мотвани Р., Ульман Дж. Введение в теорию автоматов, языков и вычислений. М., 2007. – 528 с. 14. Захаров В.П. Информационно-поисковые системы. СПб., 2005. 15. Коваль С.А. Лингвистические проблемы компьютерной морфологии. СПб., 2005. 16. Мельчук И.А. Опыт теории лингвистической модели "Смысл – Текст". М., 1999. 17. Падучева Е.А. Динамические модели в семантике лексики. М., 2004. 18. Пиотровский Р.Г., Бектаев К.Б., Пиотровская А.А. Математическая лингвистика. М.: Высшая школа, 1977. 383 с. 19. Севбо И.П. Структура связного текста и автоматизация реферирования. М.. 1969. 20. Сухотин Б.В. Выделение морфем в текстах без пробелов между словами. М.: Наука, 1984. 96 с. 21. Леонтьева Н.Н. Общесемантический компонент в систем понимания текста // Проблемы прикладной лингвистики. М.. 2002. 22. Налимов В.В. Вероятностная модель языка: О соотношении естественных и искусственных языков. Томск, М., 2003. 23. Труды международной конференции "Корпусная лингвистика2008". – СПб.: С.-Петербургский гос. Ун-т, 2008. 418 с. 24. Шайкевич А.Я. Пространство семантических словарей // Язык как материя смысла. М.: "Азбуковник", 2007. 25. Шенк Р. Обработка концептуальной информации. М., 1980. 26. Якушин Б.В. Алгоритмическое индексирование в информационных системах. М., 1978. Программное обеспечение и Интернет-ресурсы: 1. Автоматическая обработка текста – http://www.aot.ru/ 2. Каталог лингвистических программ и ресурсов в сети – http://www.rvb.ru/soft/catalogue/catalogue.html 3. Лингвистика в России: ресурсы для исследователей – http://uisrussia.msu.ru/linguist/index.jsp 4. Российская ассоциация искусственно интеллекта – http://www.raai.org/ 5. Национальный корпус русского языка–http://corpora.yandex.ru/ 6. Увлекательная лингвистика– http://katori.pochta.ru/ 7. Московский лингвистический журнал – http://mjl.rsuh.ru/ 8. Вестник Ивановского государственного университета. Серия «Филология»- http://lib.ivanovo.ac.ru/ 9. Вестник Воронежского Государственного университета «Лингвистика и межкультурная коммуникация» http://www.vestnik.vsu.ru / 10.Вестник Красноярского государственного университета. Гуманитарная серия– http://lib.krasu.ru/ 11.Международная конференция по компьютерной лингвистике– http://www.dialog-21.ru/ 12.Научно-техническая информация. Сер.2. Информационные процессы и системы – http://catalog.viniti.ru/search_extra.asp 13.Электронная лингвистическая библиотека – http://www.superlinguist.com/ 14.Журнал Вычислительные методы и программирование: http://num-meth.srcc.msu.ru/ 15.Журнал Компьютерная лингвистика и интеллектуальные системы - http://www.dialog-21.ru/conference/?id=157806 16.Образование. Лингвистика. Технологии & Коммуникация – http://alumni.iubip.ru/Sokolova/index.htm 17.Language Learning & Technology - http://llt.msu.edu/ 18.Internet TESL Journal (For ESL-EFL Teachers) - http://iteslj.org/ 19.The Modern Journal of Applied Linguistics - http://mjal.org/ 20.Indian Journal of Applied Linguistics http://www.highbeam.com/Indian+Journal+of+Applied+Linguistics/publicati ons.aspx 21.«Академия Google». http://scholar.google.com. Поиск научной литературы по различным дисциплинам. 22.Scholar.ru. Поиск информации научного происхождения из научных центров и вузов для ученых, специалистов, аспирантов, студентов, учащихся. 23.Российское образование: Федеральный портал http://www.edu.ru. 24.Электронная гуманитарная библиотека http://www.gumfak.ru. 25.Википедия – Свободная энциклопедия http://ru.wikipedia.org 26.Морфологический анализатор http://starling.rinet.ru/morph.htm ; 27.Лингвоанализатор http://www.rusf.ru/books/analysis/index.htm ; 28.Русский морфологический словарь Дмитрия Григорьева ([email protected]); 29.Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. — М.: МИЭМ, 2011. // http://www.webground.su/ ; 30.Ягунова Е.В. Исследование перцептивной устойчивости фонем как элементов речевой цепи // Человек говорящий: исследования XXI века: колл. монография под ред. Л.А.Вербицкой, Н.К. Ивановой. Иваново, 2012, с. 67-75 //http://www.webground.su/ ; 31.Ландэ Д. В., Снарский А. А., Безсуднов И. В. ИНТЕРНЕТИКА. Навигация в сложных сетях: модели и алгоритмы. Москва, 2009 // //http://www.webground.su/ ; Обучающие компьютерные программы и специализированные модули: a. Система дистанционного обучения Moodle; b. Электронные учебники из серии «Читай и работай», размещенные на сервере кафедры и в системе Moodle; c. Текстовый процессорMicrosoft Office Word; d. Обозреватель Internet Explorer; e. Система анализа текстов TextAnalyst 2.0; f. Программа автоматического реферирования TextReferent 1.0; g. Программа контент анализа текстов Text-Analizer; h. Система редактирования морфологических словарей MorphWizard; i. Русская морфология для программистов RusLemmatizer.zip . Для освоения данной дисциплины требуются следующие инструментальные и программные средства: -лекционная аудитория, оборудованная компьютером и мультимедийным проектором; -лицензионное программное обеспечение: ОС Microsoft Windows XP/7, офисный пакет Microsoft Office 2007; - -канал связи с Интернетом. Фонд оценочных средств текущего Проблемные лекции; дискуссии в режиме «круглого стола»; контроля контрольные задания; рефераты; доклады; лекции-конференции. успеваемости обучающихся Форма итоговой Экзамен. аттестации