Uploaded by Alex Larchenko

Программа итогового государственного экзамена по специальности «Фундаментальная и прикладная лингвистика»

advertisement
ПРОГРАММА ИТОГОВОГО ГОСУДАРСТВЕННОГО ЭКЗАМЕНА
по специальности
«Фундаментальная и прикладная лингвистика»
(бакалавриат)
1. Цели
Целью междисциплинарного экзамена является проверка знаний, полученных
студентами за 4 года обучения. В программу экзамена входят вопросы по основным
теоретическим и прикладным дисциплинам.
2. Структура и содержание
Экзамен проводится в письменной форме в течение 3 астрономических часов по
30 билетам. Каждый билет состоит из трёх вопросов, по одному из каждого блока,
приведённого в пункте 4. Блок I включает вопросы, соответствующие дисциплинам:
Общая фонетика, Современный русский язык: фонетика, Общая морфология,
Современный русский язык: морфология, Общий синтаксис, Современный русский
язык: синтаксис, Общая семантика и лексикология, Современный русский язык:
семантика, Общая теория дискурса. Блок II включает вопросы, соответствующие
дисциплинам: Языки мира и языковые ареалы, Типология, Старославянский язык,
История русского языка, Сравнительно-историческое языкознание, Психолингвистика,
Социолингвистика. Блок III включает вопросы, соответствующие дисциплинам:
Введение в прикладную лингвистику, Автоматическая обработка естественного языка
(в т.ч. Автоматическая обработка текста и Автоматическая обработка звучащей речи),
Корпусная лингвистика, Искусственный интеллект, Статистические методы обработки
языковых данных.
3. Процедура проведения
В присутствии как минимум одного члена государственной экзаменационной
комиссии (далее ГЭК) и секретаря ГЭК каждый студент вытягивает один
экзаменационный билет. После того как последний экзаменуемый получает билет,
засекается время для написания ответов на вопросы, содержащиеся в билете, равное
трём астрономическим часам.
Ответ на каждый вопрос пишется на новом чистом листе формата А4,
выдаваемом экзаменуемым секретарём ГЭК. Каждый лист должен содержать фамилию
экзаменуемого и номер вопроса в билете.
На протяжении всего времени, отведённого на написание ответов на вопросы,
содержащиеся в экзаменационном билете, в аудитории с экзаменуемыми находится
секретарь ГЭК и/или как минимум один из членов ГЭК, осуществляющий /
осуществляющие контроль за самостоятельностью выполнения экзаменационных
заданий.
В случаях, когда выполнение экзаменационного задания подразумевает
использование сети Интернет, а также тех или иных компьютерных программ,
экзаменуемый проводится в компьютерный класс, где в присутствии как минимум
одного члена ГЭК выполняет задание.
В случаях, когда выполнение экзаменационного задания подразумевает
использование каких-либо дополнительных материалов (например, толкового словаря,
тезауруса и под.), таковые материалы предоставляются экзаменуемым секретарём ГЭК.
По истечении трёх астрономических часов письменные ответы сдаются
секретарю ГЭК, который далее передаёт их для проверки членам ГЭК.
По результатам проверки каждому экзаменуемому выставляется итоговая оценка
(см. подробнее пункт 5), сообщаемая экзаменуемым в день проведения междисциплинарного экзамена. Итоговая оценка заносится в протокол и зачётную книжку
экзаменуемого секретарём ГЭК. Каждый протокол и соответствующий разворот
зачётной книжки подписывается председателем ГЭК и членами ГЭК (не менее двух
третей утверждённого состава). Заполненные и проверенные протоколы
подписываются секретарём ГЭК и вместе с зачётными книжками сдаются в учебную
часть факультета.
4. Содержание дисциплины
В таблицах ниже представлены типовые формулировки вопросов. Конкретное
наполнение и компоновка вопросов обновляются каждый год. Обновление типовых
формулировок происходит в соответствии с обновлением программ учебных курсов.
Блок I
Общая фонетика /
Даны рентгенограммы русских звуков. Отождествить эти звуки
1
2
СРЯ: фонетика
Общая фонетика /
СРЯ: фонетика
3
Общая фонетика /
СРЯ: фонетика
4
Общая фонетика /
СРЯ: фонетика
5
Общая фонетика /
СРЯ: фонетика
6
Общая фонетика /
СРЯ: фонетика
и указать артикуляционные механизмы их образования.
Дана матрица фонетических (артикуляционных) признаков для
русской словоформы. Отождествить эту словоформу и дать её
фонетическую транскрипцию и орфографическую запись. (При
наличии нескольких решений привести все). Среди фонетических признаков каждого звука отметить его дифференциальные
признаки.
Дать фонетическую транскрипцию представленного предложения. Указать типы фонетических процессов, происходящих при
произнесении этой фразы, и привести из нее соответствующие
примеры.
Даны глубинные и поверхностные записи словоформ некоторого языка. Запишите фонологические правила, реализующие переход от глубинного представления к поверхностному, в системе нотации порождающей фонологии; укажите порядок их
применения (если порядок важен).
Дан набор из 5 осциллограмм и список из 5 русских слов. Установить соответствие между осциллограммами и словами. Пояснить решение.
Дан набор из 5 спектрограмм и список из 5 русских слов. Установить соответствие между спектрограммами и словами. Пояснить решение.
2
7-8
9
10
11
12
13-14
15-17
18
19
20
21
22
23
24
25
Общая морфология / Дан небольшой текст на русском языке. Укажите в этом тексте
СРЯ: морфология
все клитики, назовите их тип (проклитика, энклитика и т.п.) и
дайте обоснование своему решению.
Общая морфология / Дан небольшой текст на русском языке. Укажите в нем все приСРЯ: морфология
меры частичной и полной фузии.
Общая морфология / Дан небольшой текст на русском языке. Найдите в нем все покаСРЯ: морфология
затели актантной деривации и укажите, какое значение каждый
из них выражает в данном контексте.
СРЯ: морфология
Дан список русских существительных. Выявить те, у которых
представлены регулярные отклонения от стандартного субстантивного склонения.
СРЯ: морфология
Дан список русских глаголов. Выявить те, которые относятся к
продуктивным морфологическим классам.
Общий синтаксис /
Дано русское предложение. Построить для него дерево зависиСРЯ: синтаксис
мостей.
Общий синтаксис /
Дано русское предложение. Построить для него дерево непоСРЯ: синтаксис
средственных составляющих.
Общий синтаксис /
Дано дерево непосредственных составляющих русского предСРЯ: синтаксис
ложения. Найти ошибки в этом дереве и обосновать ответ.
Общая семантика и
Проведите компонентный анализ значения заданного слова,
лексикология /
пользуясь любым из известных методов, и представьте его реСРЯ: семантика
зультаты в виде толкования на семантическом метаязыке, построенном на основе русского языка.
Общая семантика и
Даётся короткий отрывок текста на русском языке. Требуется
лексикология /
охарактеризовать содержащиеся в нем финитные предикаты по
СРЯ: семантика
их семантическому и имликативному типу, а именные группы –
по их денотативному статусу.
Общая семантика и
Даётся русское слово (с указанием его значения, если данное
лексикология /
слово многозначно). Требуется описать морфосинтаксические,
СРЯ: семантика
лексические, семантические, и прагматические ограничения на
его употребление.
Общая семантика и
Даётся высказывание на русском языке в контексте, достаточлексикология /
ном для определения его иллокутивной функции. Требуется
СРЯ: семантика
определить его иллокутивную функцию и сформулировать
условия успешности соответствующего речевого акта.
Общая семантика и
Даётся многозначное русское слово. Представить структуру его
лексикология /
полисемии в виде радиально-цепочечной сети и дать обобщенСРЯ: семантика
ную характеристику всех встретившихся семантических переходов (напр., синекдоха: род —> вид; метафора по сходству формы
из области ‘животные: части их тела’ в область ‘артефакты: их
части’ и т. п.).
Общая семантика и
Даётся русское слово (или термин) Х (с указанием типового
лексикология /
контекста, если данное слово многозначно). Требуется построСРЯ: семантика
ить для него статью тезауруса по образцу информационнопоискового тезауруса С. Е. Никитиной.
Общая теория дисВыберите по своему усмотрению отрывок письменного дискуркурса
са длиной около 150 слов. Необходимо создать реферат (резюме,
«макроструктуру») данного отрывка и детально описать процедуру сжатия исходного дискурса. Используйте метод макропропозиций по ван Дейку. Сформулируйте исследовательские про-
3
26-27
Общая теория дискурса
28
Общая теория дискурса
29
Общая теория дискурса
30
Общая теория дискурса
блемы.
Выберите по своему усмотрению отрывок письменного дискурса длиной 100–150 слов. Необходимо разделить его на элементарные дискурсивные единицы и построить семантическую
сеть, связывающую все эти единицы между собой, на основе
теории риторической структуры. Сформулируйте исследовательские проблемы.
Выберите по своему усмотрению отрывок письменного дискурса длиной около 150 слов. Постройте набор необходимых и достаточных факторов, в том числе количественных, описывающих все случаи референциального выбора (выбора между полными, местоименными и нулевыми ИГ). Сформулируйте исследовательские проблемы.
Выберите по своему усмотрению отрывок письменного дискурса длиной около 150 слов. Проверьте в этом отрывке наличие
взаимосвязи между дискурсивной ролью каждого события
(вхождение либо невхождение в основную линию повествования) морфосинтаксическим оформлением клаузы. Сформулируйте исследовательские проблемы.
Выберите по своему усмотрению отрывок письменного дискурса длиной около 150 слов. Постройте набор необходимых и достаточных факторов, описывающих все случаи взаимного расположения подлежащего и сказуемого. Сформулируйте исследовательские проблемы.
Блок II
31
Языки мира и
языковые ареалы
32
Языки мира и
языковые ареалы
33
Языки мира и
языковые ареалы
34
Языки мира и
языковые ареалы
Указывается одна из крупнейших языковых семей мира. Дается
список из 15–20 широко известных языков. Для каждого из
языков требуется определить, входит он в данную семью или
нет.
Указывается одна из крупнейших языковых семей мира. Дается
список из 10-15 типологических признаков. Для каждого из
признаков требуется определить, является он характерным для
языков данной семьи или нет.
Указывается некоторый языковой ареал или макроареал. Дается
список из 10–15 различных признаков (географическое
расположение, физико-географические особенности, физикоантропологические
характеристики
населения,
история
заселения,
демографические
и
социолингвистические
особенности, генеалогическая плотность ареала, система
письма, типологические признаки). Для каждого из признаков
требуется определить, является он характерным для данного
(макро)ареала или нет.
Указывается некоторый языковой ареал или макроареал. Дается
список из 10–15 известных языков или групп языков. Для
каждого из данных языков или групп языков требуется
определить, распространен(а) он(а) в данном (макро)ареале или
нет.
4
35
Языки мира и
языковые ареалы
36
Типология
37
Типология
38
Типология
39
Типология
40
Типология
41-42 Старославянский
43-44
45
46-47
48
49
50
51
язык / История
русского языка
Старославянский
язык / История
русского языка
Старославянский
язык / История
русского языка
Сравнительноисторическое
языкознание
Сравнительноисторическое
языкознание
Сравнительноисторическое
языкознание
Сравнительноисторическое
языкознание
Психолингвистика
Указывается один из центральных типологических признаков
(например, тот или иной тип/локус выражения грамматических
значений, вершинное или зависимостное маркирование,
эргативная конструкция и т.п.). Дается список из 10 ареалов и
макроареалов. Для каждого из этих (макро)ареалов требуется
определить, характерен ли для них данный типологический
признак.
На основе выборки языков была создана импликативная
семантическая карта. Позже были дополнительно рассмотрены
ещё два показателя X и Y, дистрибуция которых показана на
карте. Что можно сказать о карте на основании данных о
показателях X и Y и почему.
Даны два набора признаков. Языки с каким сочетанием
характеристик более распространены? Кратко аргументируйте
свой ответ.
Дано утверждение Р. Какие закономерности можно
прогнозировать на его основании? Кратко аргументируйте свой
ответ.
Дано утверждение Р. Прокомментируйте его с позиций
современной типологии.
Дано утверждение Р. Как соотносится данное явление с
современными представлениями о процессах грамматикализации? Кратко аргументируйте свой ответ.
Переведите предложенные фразы на современный русский язык
и проведите их грамматический и фонетический анализ.
Чем объясняются расхождения в написании и произношении в
предложенных парах слов современного русского языка?
Приведите аналогичные примеры.
Объясните различия в написании предлагаемых лексем в
зависимости от памятника.
Дано утверждение Р. Прокомментируйте его с позиций
современной компаративистики.
Дано предположение P. Какие аргументы следует привести,
чтобы его доказать или опровергнуть?
Дано наблюдение N, сделанное неким исследователем. Какое
реальное положение вещей может стоять за этим?
Дано русское слово Х. Найдите его этимологию. Обоснуйте свое
решение. Возможность каждого из предполагаемых Вами
преобразований подтвердите примерами. Если Вы считаете, что
это слово подверглось нерегулярным преобразованиям,
докажите это.
Дан фрагмент экспериментального материала на русском языке.
Необходимо определить цель эксперимента, описать его
дизайн, составить экспериментальный лист, определить
гипотезы эксперимента и возможные методики его проведения.
5
52
Психолингвистика
53
Психолингвистика
54
Психолингвистика
55
Психолингвистика
56-57 Социолингвистика
58
Социолингвистика
59-60 Социолингвистика
Блок III
61-64 Введение в
прикладную
лингвистику
65-68 Введение в
прикладную
лингвистику
69-70 Введение в
71
прикладную
лингвистику
Автоматическая
обработка текста
Дан фрагмент экспериментального материала на некотором
иностранном
языке.
Необходимо
определить
цель
эксперимента, описать его дизайн, определить гипотезы
эксперимента и возможные методики его проведения.
Описана некоторая психолингвистическая проблема (из области
общей
или
детской
психолингвистики).
Необходимо
сформулировать экспериментальные способы ее решения.
Дана расшифровка фрагмента диалога с ребенком. Необходимо
сосчитать MLU, а также описать особенности фонетического и
морфосинтаксического развития ребёнка.
Дано краткое описание нескольких экспериментов с детьми.
Необходимо
определить
тип
использованной
экспериментальной процедуры и кратко изложить достоинства
и недостатки данного метода.
Прокомментировать предложенное утверждение, опираясь на
данные Всероссийской переписи населения 2010 г.
Распределить предложенные языки по группам (искусственные
языки, языки контактного происхождения, региональные
варианты и языки с сильным внешним влиянием), объяснить
решение, опираясь на их грамматические и иные
характеристики.
Дана лексема в контексте и её толкование из нескольких
словарей. Истолковать контекст. Расположить словари во
времени, пояснив ответ. Заполнить пропуски после слова
ПОМЕТА. Опираясь на свою языковую интуицию, оценить
справедливость этих помет с точки зрения современного
состояния языка, привести доказывающие это примеры из
литературных текстов.
Напишите
алгоритм
для
извлечения
заданного
факта / тональности отзыва. Факт должен включать:
1. примеры (не менее 7); 2. указанных участников; 3. указанные
обстоятельства; 4. список предикатов (желательно - не менее 5),
соответствующих факту; 5. правила, которые должны покрывать
приведенные примеры и различные вариации из них.
Напишите регулярные выражения, соответствующие заданной
конструкции. Постарайтесь сделать правило максимально
экономным. Оцените классы случаев, где написанные правила
будут страдать недостаточной точностью.
Используя поиск Яндекса, ответьте на заданный вопрос.
Приведите логику рассуждений, результат и поисковый запрос.
Дан результат автоматического морфологического анализа и
золотой стандарт. Вычислить точность, полноту, f-меру,
прокомментировать расхождения.
6
72
Автоматическая
обработка текста
73
Автоматическая
обработка текста
74
Автоматическая
обработка текста
75
Корпусная
лингвистика
76
Корпусная
лингвистика
77
Корпусная
лингвистика
Корпусная
лингвистика
79-80 Автоматическая
обработка звучащей
речи
78
81-82 Автоматическая
83
84
85
86
обработка звучащей
речи
Автоматическая
обработка звучащей
речи
Искусственный
интеллект
Искусственный
интеллект
Искусственный
интеллект
Дан фрагмент морфологии для языка Х, подсистемы Y
(например, образование форм настоящего времени глаголов в
русском языке). Предложить 3 типа описания этой системы:
квазиагглютинативная, с учётом морфонологических чередований и любой 3-й вариант.
Дан текст. Определить проблемные места с точки зрения
токенизации, разбиения на предложения и морфологического
анализа.
Дан текст и коллекция текстов. Выбрать в тексте 4 ключевых
слова и два не ключевых. получить ранжированный по tf.idf
список по убыванию веса. Ответ прокомментировать.
Используя язык запросов к корпусам CQP в корпусе русского
языка университета Leeds найти примеры конструкции,
указанной в задании. Используя режим коллокаций, определить
наиболее типичные коллокаты заданной части речи в данной
конструкции.
Используя корпус НКРЯ, найти примеры с конструкцией Х.
Определить, связано ли распределение данной конструкцией с
лингвистическим параметром Y / жанром / временным
периодом / автором. Для выявления зависимости применить
один из статистических критериев.
Описать, какие основные подходы используются в разметке
заданного в задании типа, какие признаки учитываются в
разметке. Привести примеры разметки данного типа. Привести
пример корпуса с данным типом разметки. Типы разметки:
метаразметка, морфологическая разметка, синтаксическая
разметка, разметка по ошибкам в Learner Corpus, семантическая
разметка, разметка семантических ролей. Указать 3-4
проблемы/места неоднозначности для данного типа разметки.
Указать 2-3 «условных», зависящих от практических задач
системы (не соответствующих теоретическим подходам)
Дан текст. Предложить свою схему разметки указанного в
задании типа на основе данного текста.
Дана спектральная диаграмма речевого фрагмента из слова.
Определить её тип (спектральный срез, динамическая
спектрограмма – широкополосная / узкополосная) и звук/слог,
для которого она сделана. Обосновать свой ответ.
Найти ошибочные слова-доноры среди предлагаемых для
синтеза и предложить правильную замену. Ответ обосновать.
Оценить
правильность
предлагаемой
автоматической
сегментации, указать очевидные ошибки и их типы. Объяснить
возможные причины допущенных ошибок автосегментации.
Создать связную семантическую сеть из заданных понятий
(рассматриваются только те значения слов, которые
соответствуют этой сети)
Можно ли установить отношения класс-подкласс или классэкземпляр между указанными понятиями и почему
Записать указанный предикат в виде семантической сети
7
87
Искусственный
интеллект
88
Искусственный
интеллект
89
Статистические
методы обработки
языковых данных
90
Статистические
методы обработки
языковых данных
Стоит задача извлечь заданную информацию из текстов
методами машинного обучения. Предложить признаки слов,
которые будут полезны в этой задаче. Ответ обоснуйте.
Система автоматической фильтрации документов отбирает из
потока документы заданной тематики. Для оценки качества
системы сделана экспертная разметка. Найти характеристики
качества классификации (точность, полноту, F-меру) по
указанным числовым данным.
Дано
содержательное
описание
лингвистического
исследования. Дана некоторая таблица с данными.
Проанализировать данные: зависимые vs. независимые
переменные, типы шкал. Предложить переходы от типов шкал
данных в таблице к типам шкал, указанным в задании.
Предложить
собственную
группировку
данных.
Аргументировать выбранный способ группировки. Построить
гистограмму по заданному параметру. Составить «обобщённое»
описание данных в рамках описательной статистики: разные
типы средних, размах, отклонения, «ящичковую» диаграмму.
Проверить заданный параметр на нормальность.
Дано представление данных (а) результат обработки данных в
статистическом пакете (например, ANOVA, критерий
Стъюдента, критерий Фишера, критерий Манн-Уитни); (б)
фрагмент научной статьи. Определить исходные условия
проверки статистической гипотезы (какие переменные
зависимые, какие независимые, типы шкал, объемы выборок и
т.п.), какой статистический критерий использовался, какая
гипотеза проверялась, какой вывод по представленному
фрагменту результатов можно сделать.
5. Критерии оценки результатов сдачи итогового государственного экзамена
Каждый вопрос экзаменационного билета оценивается по десятибалльной шкале,
где «10 баллов» соответствует отличному ответу на вопрос, «0 баллов» – отсутствию
ответа на вопрос. Для получения итогового балла баллы за каждый вопрос
суммируются. Максимальное количество баллов у одного экзаменуемого составляет
30 баллов.
8
Критерии перевода баллов в оценку приведены в таблице:
25-30 баллов
«отлично»
18-24 балла
«хорошо»
10-17 баллов
«удовлетворительно»
0-9 баллов
«неудовлетворительно»
В ряде случаев по решению председателя и членов ГЭК результат в 24 балла
может соответствовать оценке «отлично».
6. Литература
Основная и дополнительная литература для подготовки к экзамену соответствует
спискам, приводимым в программах по соответствующим дисциплинам.
Программу разработал
Коллектив кафедры ТиПЛ
филологического факультета
МГУ имени М. В. Ломоносова
под руководством заведующего кафедрой
профессора, доктора филологических наук В. А. Плунгяна
9
Download