17 мая на очередном заседании семинара с докладом «Лексическая динамика русской прозы XIX в.» выступил д. ф. н. А. Я. Шайкевич. В докладе был представлен анализ лексики, употребляемой в русской прозе XIX века. Материалом исследования послужил корпус русской прозы 1815–1904 гг. (от Булгарина до Бунина) общим объемом 25 миллионов словоупотреблений. Для анализа были взяты 2000 самых частых слов и 500 самых частых бинарных словосочетаний. В нижеследующих таблицах показана относительная частота (на 100 тысяч словоупотреблений) в восьми десятилетиях XIX в.1 Обратимся к словам, у которых хронологические колебания минимальны. 1820 1830 1840 1850 1860 1870 1880 Табл. 1 1890 90 449 18 479 92 486 15 480 97 443 16 464 91 424 15 433 114 475 13 446 104 476 17 483 98 459 12 462 100 497 12 489 ДОРОГА 58 ЛОШАДЬ 41 КВАРТИРА, КОМНАТА, 229 ДВЕРЬ, СТЕНА, ПОЛ, ОКНО, СТОЛ 54 43 256 44 38 269 41 48 231 43 41 251 34 33 194 41 42 202 48 37 250 есть* за зато по Такая стабильность вполне ожидаема у первой четверки служебных слов, но достойна удивления у следующих за ними знаменательных слов — это свидетельство замечательного постоянства прозы. Табл. 2 1820 1830 1840 1850 1860 1870 1880 1890 однако же нежели любезный* поутру столь другой день 30 29 20 18 21 20 42 20 14 8 16 14 24 11 7 7 5 11 11 5 5 6 5 14 11 5 3 3 9 12 11 3 3 3 15 8 5 3 2 1 7 7 1 1 1 1 4 9 вроде серьезно вообще из-за 1 1 8 11 3 1 9 15 5 3 19 14 9 8 24 19 9 11 24 22 9 10 21 25 12 10 26 30 14 11 23 33 В верхнем регистре даются леммы; по умолчанию частота глагольных форм прош. вр., муж. рода включает и частоту форм женского рода. Астериском (*) отмечены следующие уточнения: есть* — без то есть; любезный* — без любезный друг; СЕЙ* — без сих пор; ТОТ* — без тем и то; ЭТОТ* — без это; более* — без более или и тем более; далее* — без так далее; точно* — без точно так; едва* — без едва ли и едва не; чуть* — без чуть ли и чуть не; надо* — без надо мной; СТАТЬ* — без стало быть; совсем* — без не совсем и совсем не; только* — без как только, лишь только и только что; друг* — без друг друга и т.п, без любезный друг, мой друг и друг мой; честь* — без честь имею и имею честь; -с* — без да-с, нет-с и ну-с; -то* — кроме неопределенных местоимений и местоименных наречий (типа что-то, почему-то). 1 точно* МАЛЕНЬКИЙ все-таки все равно ТОН 16 21 6 5 3 27 28 10 7 5 40 38 13 10 7 44 45 28 11 13 45 36 41 16 17 40 41 42 16 17 74 43 35 17 17 99 71 38 20 20 ДИВАН пальто 2 ... 5 2 11 5 14 6 13 4 10 8 7 12 10 Глядя из XXI века, можно ожидать сокращение частоты у более или менее очевидных архаизмов, значительно труднее априорно предсказать рост частоты слов вроде, серьезно, вообще, из-за, маленький, тон, ведь живое ощущение их новизны в XIX в. нам не дано, оно может возникнуть лишь при экстенсивном чтении тогдашней прозы. Появление и дальнейший рост частоты слова пальто можно предсказать, зная историю вещей, но слово диван априорно было бы отнесено к последней группе таблицы 1, если бы не резкий скачок 1840-х гг. Хронологические изменения частоты становятся особенно выразительными при изучении пар и целых групп синонимов: 1820 1830 1840 1850 1860 1870 1880 Табл. 3 1890 1055 1204 1257 1250 1295 1421 1257 1286 298 345 250 240 236 225 102 107 23% 22% 17% 16% 16% 14% 8% 8% более*, далее* больше, дальше 115 33 110 25 79 61 75 79 83 89 75 86 58 98 46 111 Я, ТЫ, МЫ, ВЫ МОЙ, ТВОЙ, НАШ, ВАШ 4059 1274 3527 981 3712 722 3999 637 3792 580 3290 576 2835 510 3204 499 24% 22% 16% 14% 13% 15% 15% 13% прежде раньше 55 2 36 1 41 2 42 3 45 5 47 7 32 15 20 21 беспрестанно постоянно 17 2 13 2 20 9 18 12 9 13 3 10 2 10 2 11 довольно достаточно 66 3 38 2 52 4 49 4 42 9 40 6 25 11 24 8 ДОБРЫЙ ХОРОШИЙ 87 18 60 17 55 32 43 37 39 35 49 37 39 42 40 50 1820 1830 1840 1850 1860 1870 1880 1890 234 36 20 9 15 36 15 12 чтобы, бы, между, ли, же, али, перед, через чтоб, б, меж, ль, ж, аль, пред, чрез СЕЙ* 25% 395 321 34% 3,4% 369 665 62% 2,4% 313 485 59% 1,0% 294 619 67% 1,3% 359 737 67% 3,3% 391 662 61% 1,7% 294 586 65% 1,3% 291 599 66% 70 65% 27 11 21 22% 52 12 15 14% 75 20 8 6% 94 22 12 10% 82 31 17 13% 74 34 10 9% 69 32 8 8% 60 32 57 33% 34 5 75 16 11% 30 10 83 28 12% 56 15 146 24 8% 58 18 214 26 9% 57 10 183 26 11% 42 11 162 10 6% 28 4 127 9 5% 29 5 134 32 39% 5 41 5 23 33% 13 27 6 14 21% 14 31 8 14 19% 8 39 11 10 14% 7 33 13 5 9% 7 27 14 2 3% 7 50 18 2 2% 8 46 25 возразил отвечал ответил 16 132 1 1% 17 114 1 1% 15 85 2 2% 34 140 8 4% 13 69 23 22% 15 79 47 32% 7 29 39 52% 9 45 55 50% вскричал закричал крик крикнул воскликнул 56 14 10 1 12 29 24 10 2 22 6 27 11 9 17 8 12 5 11 21 8 12 5 16 21 6 7 6 21 35 1 6 4 16 10 1 9 6 28 23 ОТЕЦ батюшка папа 127 30 1 88 23 1 80 31 2 70 28 11 74 27 5 109 21 7 89 12 5 90 11 9 МАТЬ маменька матушка мама 57 1 15 64 7 12 2 80 14 25 1 74 12 15 3 59 6 16 9 73 5 28 8 55 6 19 14 71 3 7 ТОТ* ЭТОТ* ибо потому что так как весьма совершенно чрезвычайно очень подле возле около рядом Достойно внимания некоторое увеличение доли устаревающих слов (сей, ибо, весьма, столь) в 1870–х гг. Хорошо известно, что многие архаизмы сохраняются в особых стилистических "нишах". В данном случае это стилизованная проза вообще и особенно проза, насквозь проникнутая иронией. Не ограничиваясь 1870–ми гг., а обращаясь ко всему творчеству писателя, обнаружим следующие частоты подобных слов у СалтыковаЩедрина (ибо 31, сей 44, столь 21) и у Лескова (весьма 23, сей 44, столь 23). В меньшей степени сохранность некоторых архаизмов наблюдается в историческом романе, например, в текстах Мордовцева: сей — 59. Если сравнить динамику частот многих слов в прозе и в драме, то обнаружится замечательная корреляция: слова, чья употребительность в прозе нарастает, одновременно демонстрируют еще более высокую частоту в драме (эта частота дается справа в квадратных скобках). Табл. 4 1820 1830 1840 1850 1860 1870 1880 1890 ныне нынче теперь сейчас 6 2 137 22 28 8 139 15 5 8 165 35 1 16 148 47 5 15 203 66 8 14 196 57 3 12 176 61 2 10 186 72 [3] [41] [284] [134] и да а 4090 169 619 3812 304 519 4115 371 777 3933 304 791 4284 340 911 4438 372 1037 4441 272 1011 5013 249 1025 [3040] [766] [1493] собой, мной, тобой, рукой, головой собою, мною... 26 61 104 133 138 116 108 146 [212] 179 151 100 68 65 61 62 55 [43] 87% 72% 49% 33% 32% 34% 36% 27% [20%] 33 103 13 3 331 74 56 174 8 19 112 51 168 13 6 361 80 63 248 17 14 126 57 252 20 10 483 125 98 268 34 15 153 87 225 21 20 483 133 168 297 35 32 142 101 251 30 20 593 151 197 312 35 39 169 77 239 26 15 560 129 165 298 31 38 203 77 223 24 11 456 123 141 293 29 33 174 93 243 23 18 490 128 184 306 34 44 166 [898] [658] [49] [53] [902] [227] [580] [361] [58] [91] [289] да (утв.) вот вон пожалуйста же ничего ну только* просто значит ДЕЛО Общая тенденция очевидна — начиная с 1840-х гг. проза все более сближается с разговорной речью, звучащей со сцены. Впрочем, противоположное влияние книжной речи тоже иногда проявляется, но реже и в меньшем масштабе, ср.: Табл. 5 конечно ведь пожалуй разумеется очевидно 1820 1830 1840 1850 1860 1870 1880 1890 30 24 8 11 1 24 34 8 13 1 25 89 16 25 8 46 111 20 25 6 40 131 22 25 12 50 124 24 27 13 42 101 16 17 17 43 109 14 10 14 [71] [304] [40] [26] [2] повидимому видимо 4 7 9 6 7 11 11 9 [1] ... 3 5 10 12 13 8 11 [2] надобно проценты надо* нужно придется, пришлось приходится, -лось 55 65% 12 12 5 27 27% 39 24 7 32 23% 48 44 10 27 19% 71 29 10 13 8% 92 46 12 9 5% 99 32 16 4 2% 86 52 22 1 1% 99 51 21 [17] [5%] [163] [117] [11] 1 1 7 7 8 9 17 16 [6] Пять таблиц, рассмотренных выше, так или иначе соотнесены с диахронической или жанрово-стилистической окраской слов, которая могла быть замечена лингвистами. Некоторые тенденции обусловлены не движением языка, а движением литературы. Такова, например, тенденция сокращения доли притяжательных местоимений в общей частоте местоимений 1 и 2 лица. Нижеследующие таблицы ограничены сферой прозы как таковой, лингвистический материал выступает в ней лишь как средство, подчиненное задачам разработки темы, построения сюжета, ориентации на тот или иной стилистический регистр. Табл. 6 1820 1830 1840 1850 1860 1870 1880 1890 итак между тем наконец 27 43 83 13 51 89 11 36 129 6 30 82 5 31 82 4 27 71 4 21 50 3 16 45 признаюсь ИМЯ 11 51 9 60 10 26 8 20 4 24 5 26 2 24 1 27 ДОЧЬ, СЫН ДЕДУШКА, ТЕТУШКА МАЛЬЧИК, ДЕВОЧКА 130 8 92 9 67 21 52 23 57 10 60 2 58 5 62 3 8 13 29 22 21 27 29 44 РАБОТА 8 14 22 17 18 19 26 30 БАБА МУЖИК 3 6 5 8 18 23 12 26 18 33 13 21 19 29 20 24 друзья друг* 13 39 12 32 4 12 4 13 5 14 3 13 5 13 5 13 честь* 24 31 15 9 11 11 10 9 знак бросился 12 29 12 23 5 23 3 13 4 15 4 15 4 12 4 13 о! БЕДНЫЙ 55 50 48 56 29 48 17 23 27 24 30 28 18 25 24 22 СЕРДЦЕ СЛЕЗЫ ЛЮБОВЬ СТРАСТЬ ДУША 131 53 77 16 77 163 52 109 24 130 100 54 61 15 81 72 40 58 11 60 56 32 46 15 51 65 31 36 9 59 55 32 37 9 58 60 36 38 9 75 где-то, как-то, кто-то, что-то, почему-то 42 72 107 119 132 132 140 182 СТАТЬ* 84 110 137 115 162 150 158 170 засмеялся, УЛЫБАТЬСЯ, УЛЫБКА, СМЕХ, УЛЫБНУТЬСЯ 29 39 56 63 66 65 60 95 Монотонные тренды не единственная возможность в лексической динамике литературы. Можно представить себе пик частоты слова или группы слов, приходящийся на одно или два десятилетия, или двухвершинное распределение в пределах изучаемого периода, ср.: Табл. 7 182 0 183 0 184 0 185 0 186 0 187 0 188 0 1890 коня 14 14 4 1 4 4 3 4 ВЕЛИКИЙ России РУССКИЙ 54 12 62 81 22 110 20 6 45 14 6 24 20 9 44 37 12 46 38 7 37 26 6 31 над, под, вокруг ВОДА, ВЕТЕР, ЗЕМЛЯ, БЕРЕГ, МОРЕ, НЕБО, СОЛНЦЕ, ОГОНЬ 176 187 242 248 176 184 149 130 171 111 162 129 189 196 226 275 В русской прозе XIX в. довольно часто наблюдается распределение с одной вершиной, приходящейся на середину периода, ср.: Табл. 8 1820 1830 1840 1850 1860 1870 1880 1890 ГОСТИНАЯ 6 9 10 22 14 10 14 12 перебил 4 9 13 8 8 4 5 1 прибавил 8 20 22 41 31 31 15 18 стало быть 1 2 8 14 19 15 8 7 впрочем 18 29 51 54 43 41 29 21 даже 72 84 145 194 189 239 155 140 насчет про это 5 15 285 9 24 429 8 35 438 14 47 593 17 59 703 20 80 633 13 46 539 12 38 575 уж -то* -с* 37 46 1 88 33 19 147 154 59 164 205 78 167 240 97 132 249 65 107 176 40 110 162 33 [22] [65] [942] Последние три слова подкреплены не только данными прозы, но и частотами в драме, ср.: Табл. 9 1830-1840 370 796 179 уж -то -с* 1850-1870 373 636 213 1880-1890 161 354 26 Создается впечатление, что русская литература, с 1840–х гг. качнувшаяся в сторону разговорности, к 1880–м гг. пресытилась этими приемами. (Частица -с* уходит из языка вообще.) Новая лексическая картина статистически мало менялась на протяжении трех десятилетий. В последние два десятилетия XIX в. мы видим признаки социальных и собственно лингвистических инноваций, ср.: БАРИН ли полно 30 232 [ 12 [ 23 266 341 11 26 31 231 357 17 27 28 213 181 13 4 27 195 ] 9 ] 21 209 12 153 Табл. 10 11 153 9 5 5 Материал самых частых слов дает основания для выделения некоторых рубежей: 1831 г., 1841 г. (главный рубеж) и 1881 г. Собственно возрастные поколения в какой-то степени соотнесены с этими датами, но лексические предпочтения отдельных авторов настолько разнообразны, что четкую картину обнаружить здесь очень трудно. Степень адаптации к общим тенденциям эпохи сильно варьирует от автора к автору.