А. Я.Шайкевич A. Ya. Shaikevich ЛЕКСИЧЕСКАЯ ДИНАМИКА РУССКОЙ ПРОЗЫ XIX в. LEXICAL EVOLUTION OF 19th CENTURY RUSSIAN PROSE Аннотация. В докладе излагаются результаты статистического исследования корпуса русской прозы XIX в. общим объемом 25 млн словоупотреблений. Показаны основные тенденции лексических изменений на протяжении века, обусловленных лингвистическими, литературными и социальными причинами. Abstract. The paper presents the results of statistical analysis of lexical vocabulary changes in Russian prose of 19th century. The size of the corpus under study is about 25 million words. The main tendencies due to linguistic, literary, and social factors are shown. Настоящая статья представляет некоторые результаты анализа русской прозы 1815–1904 гг., полученные на корпусе объемом 25 млн словоупотреблений. Нижеследующие таблички показывают относительную частоту лексем (на 100 тысяч словоупотреблений) в восьми десятилетиях XIX в. Начнем со слов, у которых хронологические колебания минимальны. есть за зато по дорога лошадь 1820 1830 1840 1850 1860 1870 1880 1890 90 92 97 91 114 104 98 100 449 486 443 424 475 476 459 497 18 15 16 15 13 17 12 12 479 480 464 433 446 483 462 489 58 54 44 41 43 34 41 48 41 43 38 48 41 33 42 37 Такая стабильность вполне ожидаема у первой четверки служебных слов, но достойна удивления у следующих за ними знаменательных слов – свидетельство замечательного постоянства некоторых тем прозы. Глядя из XXI века, можно ожидать сокращение частоты у более или менее очевидных архаизмов. однако же нежели любезный поутру столь другой день 1820 1830 1840 1850 1860 1870 1880 1890 30 42 24 11 11 11 5 1 29 20 11 5 5 3 3 1 20 14 7 5 3 3 2 1 18 8 7 6 3 3 1 1 21 16 5 5 9 15 7 4 20 14 11 14 12 8 7 9 Значительно труднее априорно предсказать рост частоты следующих слов, ведь живое ощущение их новизны в XIX в. нам не дано, оно может возникнуть лишь при экстенсивном чтении тогдашней прозы. вроде серьезно вообще из-за точно маленький все-таки все равно тон 1820 1830 1840 1850 1860 1870 1880 1890 1 3 5 9 9 9 12 14 1 1 3 8 11 10 10 11 8 9 19 24 24 21 26 23 11 15 14 19 22 25 30 33 16 27 40 44 45 40 74 99 21 28 38 45 36 41 43 71 6 10 13 28 41 42 35 38 5 7 10 11 16 16 17 20 3 5 7 13 17 17 17 20 Хронологические изменения частоты становятся особенно выразительными при изучении пар и целых групп синонимов: прежде раньше 1820 1830 1840 1850 1860 1870 1880 1890 55 36 41 42 45 47 32 20 2 1 2 3 5 7 15 21 беспрестанно 17 13 20 18 9 3 2 2 постоянно 2 2 9 12 13 10 10 11 довольно достаточно 66 3 38 2 52 4 49 4 42 9 40 6 25 11 24 8 добрый хороший 87 18 60 17 55 32 43 37 39 35 49 37 39 42 40 50 ибо потому что так как 70 27 11 21 52 12 15 75 20 8 94 22 12 82 31 17 74 34 10 69 32 8 60 32 весьма совершенно чрезвычайно очень 57 34 5 75 16 30 10 83 28 56 15 146 24 58 18 214 26 57 10 183 26 42 11 162 10 28 4 127 9 29 5 134 подле возле около рядом 32 5 41 5 23 13 27 6 14 14 31 8 14 8 39 11 10 7 33 13 5 7 27 14 2 7 50 18 2 8 46 25 16 132 1 17 114 1 15 85 2 34 140 8 13 69 23 15 79 47 7 29 39 9 45 55 56 14 10 1 12 29 24 10 2 22 6 27 11 9 17 8 12 5 11 21 8 12 5 16 21 6 7 6 21 35 1 6 4 16 10 1 9 6 28 23 возразил отвечал ответил вскричал закричал крик крикнул воскликнул Если сравнить динамику частот многих слов в прозе и в драме, то обнаружится замечательная корреляция: слова, чья употребительность в прозе нарастает, одновременно демонстри- руют еще более высокую частоту в драме (эта частота дается справа в квадратных скобках). ныне нынче теперь сейчас 1820- 1840- 1860- 18801830 1850 1870 1890 21 3 6 3 6 12 15 11 138 160 200 181 17 41 62 66 [ 3] [ 41] [284] [134] да (союз) а 266 552 338 784 356 975 260 1018 [766] [1493] вот же ничего ну просто значит 146 351 78 61 14 16 238 483 129 133 34 24 245 577 140 181 33 39 233 473 126 163 31 38 [658] [902] [227] [580] [ 58] [ 91] Общая тенденция очевидна – начиная с 1840-х гг. проза все более сближается с разговорной речью, звучащей со сцены. Рассмотренный до сих пор материал так или иначе соотнесен с диахронической или жанрово-стилистической окраской слов, которая могла быть замечена лингвистами. Некоторые тенденции обусловлены не движением языка, а движением литературы. Нижеследующие примеры ограничены сферой прозы как таковой, лингвистический материал выступает в ней лишь как средство, подчиненное задачам разработки темы, построения сюжета, ориентации на тот или иной стилистический регистр. итак между тем наконец 1820 1830 1840 1850 1860 1870 1880 1890 27 13 11 6 5 4 4 3 43 51 36 30 31 27 21 16 83 89 129 82 82 71 50 45 признаюсь имя работа баба мужик честь знак бросился о! бедный сердце слезы любовь страсть душа 11 51 8 3 6 24 12 29 55 50 131 53 77 16 77 9 60 14 5 8 31 12 23 48 56 163 52 109 24 130 10 26 22 18 23 15 5 23 29 48 100 54 61 15 81 8 20 17 12 26 9 3 13 17 23 72 40 58 11 60 4 24 18 18 33 11 4 15 27 24 56 32 46 15 51 5 26 19 13 21 11 4 15 30 28 65 31 36 9 59 2 24 26 19 29 10 4 12 18 25 55 32 37 9 58 1 27 30 20 24 9 4 13 24 22 60 36 38 9 75 Монотонные тренды не единственная возможность в лексической динамике литературы. Можно представить себе пик частоты слова или группы слов, приходящийся на одно или два десятилетия, или двухвершинное распределение в пределах изучаемого периода, ср. 1820 1840 1860 1880 1830 1850 1870 1890 великий 68 17 28 32 русский 94 34 45 34 над, под, вокруг 220 163 166 208 вода, ветер, земля, берег, море, небо, солнце, огонь 228 157 120 235 В русской прозе XIX в. довольно часто наблюдается распределение с одной вершиной, приходящейся на середину периода, ср. 1820 1830 1840 1850 1860 1870 1880 1890 гостиная перебил прибавил стало быть впрочем даже насчет про уж -то -с 6 1 8 1 18 72 5 15 37 46 1 9 4 20 2 29 84 9 24 88 33 19 10 9 22 8 51 145 8 35 147 154 59 22 13 41 14 54 194 14 47 164 205 78 14 8 31 19 43 189 17 59 167 240 97 10 8 31 15 41 239 20 80 132 249 65 14 4 15 8 29 155 13 46 107 176 40 12 5 18 7 21 140 12 38 110 162 33 Последние три слова подкреплены не только данными прозы, но и частотами в драме, ср. уж -то -с 1830-1840 370 796 179 1850-1870 373 636 213 1880-1890 161 354 26 Создается впечатление, что русская литература, с 1840-х гг., качнувшаяся в сторону разговорности, к 1880-м гг. пресытилась этими приемами. (Частица -с уходит из языка вообще.) Материал наших таблиц указывает на то, что между 1820-ми и 1830-ми гг., между 1870-ми и 1880-ми гг. обнаруживаются различия, основной же водораздел приходится на границу 1830-х и 1840-х гг. Десятилетие 1830-х гг. отмечено тенденцией избавиться от ярких архаизмов (сей, поутру, добрый, ибо, весьма, вскричал), в собственно литературном отношении оно сохраняет или усиливает колорит 1820-х гг. (ср. такие слова, как наконец, имя, честь, сердце, слезы, любовь, душа). Десятилетие 1840-х г.г. резко сокращает частоту этих слов, главное же – происходит кардинальный поворот к разговорности (уж, -то, -с) и к новым социальным сферам (особенно баба и мужик). Новая лексическая картина статистически мало менялась на протяжении трех десятилетий. В последние два десятилетия XIX в. мы видим признаки социальных и собственно лингвистических инноваций, ср. барин ли полно 1820 1830 1840 1850 1860 1870 1880 1890 30 23 31 28 27 21 12 11 232 266 231 213 195 209 153 153 12 11 17 13 9 9 5 5 Возрастные поколения в какой-то степени подчиняются общим тенденциям, но лексические предпочтения отдельных авторов настолько разнообразны, что четкую картину обнаружить здесь очень трудно. Степень адаптации к общим тенденциям эпохи сильно варьирует от автора к автору. Пушкин или Толстой выглядят языковыми консерваторами, Даль или Достоевский шагают в ногу со временем.