"Составные слова" и перцептивный словарь

реклама
А.В.Венцов
Санкт-Петербургский государственный университет
Санкт-Петербург, Россия
[email protected]
«Составные» слова и перцептивный словарь*
Корпус русского литературного языка (Венцов, Грудева, 2009) создавался изначально как
собрание материалов, используемых при исследованиях механизмов восприятия речи
человеком. Предполагалось, что в первом приближении его тексты и словари могут быть
использованы в компьютерных моделях сегментации и поиска в словарях в качестве весьма
приблизительного аналога звучащей речи. Поэтому в нем последовательно проведена
сплошная акцентуация (во всех словах маркирован ударный гласный) и восстановлена в
правах буква «ё».
Из этих же соображений в Корпусе в качестве самостоятельных единиц фигурируют так
называемые «составные» слова. Под «составными» словами имеются в виду единицы,
которые иногда в литературе называют «сочетаниями, эквивалентными слову».Составной
характер части таких сочетаний (в обни+мку, в отме+стку, до упа+ду, на о+щупь) является
чисто орфографической особенностью, с грамматической же точки зрения это слова-наречия.
Использование других позволяет разрешить омографию (например, различать союзное
«слово» и сочетание местоименного существительного с глаголом): «…, то_есть надежда
пропала» vs «…то есть надежда, что…».
Теперь важно установить, не содержатся ли эти слова в перцептивном словаре, т.е. в том
разделе ментального лексикона, который обеспечивает переход от акустического сигнала к
лексическим единицам языка, именно в таком «составном» виде. К такому выводу можно
было бы прийти, если бы при анализе речи носителей языка оказалось, что подобные
«составные» слова систематически и устойчиво образуют фонетические слова с
соблюдением всех правил качественной и количественной редукции.
Всего в Корпусе на 120 тыс. разных словоформ насчитывается 1129 «составных» слов
(Венцов, Грудева, 2008: 143). Чтобы оценить каждое из них на предмет включения или не
включения в перцептивный словарь, потребуется длительная масштабная работа. На сегодня
были рассмотрены наиболее частотные сочетания «потому+_что» и «то+_есть», частотность
которых составила 482 и 353 на миллион словоупотреблений соответственно.
Для этого были проанализированы оцифрованные записи телевизионной программы
«Культурная революция» (Горбова и др., 2006), а также имеющиеся в Интернете записи
*
Работа выполнена при поддержке гранта РФФИ № 09-06-00244-а
актерского чтения художественной прозы
(http://www.repository.voxforge1.org/downloa
ds/Russian/Trunk/Audio/16kHz_16bit/).
Последовательность слов «потому» и
«что» в текстах на русском языке
встречается в двух вариантах: как
разделенная запятой последовательность
местоименного наречия и союза (…потому,
что…) и как союзное слово (…, потому
что). В речевом сигнале наречие и союз
могут разделяться паузой (рис. 1а) или
произноситься слитно (рис. 1б), но в любом
случае реализуются с характерным
значительным повышением частоты
основного тона на ударном слоге наречия,
воспринимаемым как пограничный сигнал
даже при отсутствии паузы. Союзное слово
никогда не произносится с паузой перед
«что», и его реализация не сопровождается
специфическими изменениями основного
тона (рис. 1в,г). При этом второй
предударный гласный составного слова
может редуцироваться вплоть до полного
выпадения (рис. 1г).
Этим подтверждается наблюдение, что в
спонтанной речи союзное слово может
подвергаться весьма значительной
редукции: [пътамуштъ], [птамуштъ],
[птамуш].
Из сказанного выше можно заключить,
что составное союзное слово потому_что в речевом сигнале систематически реализуется,
Рис. 1. Спектрограммы типичных реализаций
сочетаний «потому» и «что» в спонтанной
речи.
Жирные черные кривые – интонограммы.
как устойчивое фонетическое слово, и в
таком виде может быть элементом
перцептивного словаря. При этом нельзя
исключить возможность того, что в этом
словаре данное составное слово представлено всеми возможными реализациями,
встречающимися в спонтанной речи, при обязательной ссылке на то, что на следующем
уровне ментального лексикона всем им соответствует составное союзное слово
потому_что.
Но в спонтанной речи и в Корпусе часто встречаются сочетания словоформ, к категории
«составных» пока не отнесенные. Это все те случаи, когда в речи ударение переносится на
предлог или частицу «не»: на+ сторону, до+ смерти, за+ год, не+ был, не+ было, не+ с кем,
не+ на что. В сущности, все это варианты наречий, по значению аналогичные таким
наречиям, как на+голову, до+верху, за+мужем, не+зачем, но орфографически еще не
образующие целого слова.
Список литературы
Венцов А.В., Грудева Е.В. Частотный словарь словоформ русского языка (проект).–
Череповец: Изд-во ЧГУ, 2008.– 204 с.
Венцов А.В., Грудева Е.В. О корпусе русского литературного языка (narusco.ru) // Russian
Linguistics.– 2009.– V. 33, N 2.– С. 195-209.
Горбова Е.В. и др. Предварительные результаты мониторинга современной русской
спонтанной речи // Современная русская речь: Состояние и функционирование. Вып. II / Под
ред. С.И. Богданова, Н.О. Рогожиной и Е.Е. Юркова.– СПб.: Изд-во «Осипов», 2006.–
С. 7-31.
Скачать