УДК 808 Р. К. Потапова, М. В. Хитина Потапова Р. К. – д-р филол. наук, проф., академик МАИ, директор института прикладной и математической лингвистики, зав. каф. прикладной и экспериментальной лингвистики ф-та ГПН МГЛУ, e-mail: [email protected] Хитина М. В. – д-р филол. наук, проф. каф. прикладной и экспериментальной лингвистики ф-та ГПН МГЛУ, e-mail: [email protected] ОСОБЕННОСТИ СМЫСЛОВОГО ДЕКОДИРОВАНИЯ ЗВУЧАЩИХ ТЕКСТОВ В данной статье рассматриваются вопросы поэтапного восстановления компонентов звучащего текста – монолога как фрагмента разговорного диалога. Анализируются представленные информантами последовательности слов – словосочетания в каноническом смысле и не являющиеся таковыми (неканонические словосочетания), а также целостные тексты. Проводится качественный и количественный анализ полученного материала. Исследуются основные типы связи, использованные информантами при построении словосочетаний и текстов. Ключевые слова: монолог; восстановление текста; последовательности слов; словосочетание (каноническое и неканоническое). Речевое восприятие – это неоднородный многоплановый процесс, сложное психическое явление, являющееся процессом опосредованного второсигнального отражения действительности. Это процесс раскрытия опосредованных словами связей и отношений, включающий осмысление (смысловое восприятие). Осмысление определяется как процесс раскрытия и установления связей и отношений. Положительный результат в процессе осмысления в акте речевого восприятия является пониманием (отрицательный – непониманием). Единый процесс взаимодействия восприятия и понимания определяется как смысловое восприятие. При определении смыслового восприятия как уровневой системы отмечается, что имеется в виду уровень опознания. Когда вербальные образы сформированы, можно говорить об уровнях распознавания, разборчивости и смыслового восприятия. Только с появлением слова как значимой единицы языка и предложения как минимальной единицы речевого сообщения восприятие протекает на уровне собственно речевого восприятия, который был назван смысловым восприятием. 193 Вестник МГЛУ. Выпуск 13 (619) / 2011 Это симультанная в целом опознавательная деятельность по приему и осмыслению, а в результате – пониманию (непониманию) вербального сообщения. Исследователи речи отмечают от трех до семи уровней симультанного процесса восприятия. Это процесс от определения значения слова до «действительного смысла сообщения» [1]. Дискретная обработка сигнала предполагает применение специального механизма «накапливания» и укрупнения, результатом которого является «выделение смысловых опорных пунктов» или «смысловых вех» на основе смысловой группировки (расчленения, анализа, синтеза) материала. По мнению специалистов, выделяя и запоминая опорные пункты, мы имеем в виду именно смысл, который они представляют. В процессе восприятия человек имеет дело в основном с количеством единиц или «отрезков» информации, причем особую важность приобретает группировка или организация в единицы или отрезки информации, являющиеся смыслообразующим целым. Это целое – более осмысленное и связанное. Процесс увеличения единицы путем накопления ее смысловой группировки называется перекодированием. «Порция» накопленной информации (смысловая единица, по которой принимается решение в результате смыслового перекодирования) может быть большей или меньшей. Таким образом, единицы решения могут быть разного объема – слово, несколько слов или предложений [там же]. Схема смыслового восприятия предполагает четыре взаимосвязанные фазы: 1. фазу смыслового прогнозирования; 2. фазу вербального сличения; 3. фазу установления смысловых связей а) между словами, б) между смысловыми звеньями; 4. фазу смыслоформулирования. В качестве промежуточной единицы, находящейся между словом и предложением, можно выделить словосочетание. Словосочетание – это синтаксическая конструкция, образующаяся на основе подчинительной грамматической связи (согласования, управления, примыкания). Грамматически и семантически главенствующее слово составляет стержневой (главный) компонент словосочетания. Грамматически подчиненное слово – его зависимый (подчиненный) компонент. По стержневому компоненту словосочетания 194 Р. К. Потапова, М. В. Хитина подразделяются на субстантивные, адъективные (стержневое слово – прилагательное), глагольные и наречные. Словосочетания строятся по определенным грамматическим образцам, формирующимся в языке на основе категориальных свойств слов. С учетом структуры различаются простые словосочетания, сложные и комбинированные. Простые словосочетания, в свою очередь, могут быть двучленными, трехчленными и четырехчленными. Двучленные словосочетания образуются на основе одиночной связи, трех– и четырехчленные – на основе двойной и тройной сильной связи. Трехчленные словосочетания могут быть образованы и с помощью создания сильной связи и такой слабой связи, которая без сильной невозможна. Сложные словосочетания создаются с помощью разных типов связи стержневого слова. Например, согласование плюс примыкание, управление и примыкание. Комбинированные словосочетания образуются на базе связей от разных стержневых слов (это соединение словосочетаний). Словосочетание является единицей, качественно отличной от предложения (единицы сообщающей). Словосочетание лишено основных признаков предложения – синтаксических категорий модальности, времени, лица, интонации сообщения. Оно функционирует в составе предложения. Словосочетания могут выступать в неизменном виде или измененном. При определенных условиях словосочетание может приобретать предикативность и становиться предложением. Слова разных частей речи имеют различную сочетаемость (способность соединяться с определенным кругом распространяющих его слов). Целью проводимого эксперимента являлся анализ предложенных информантами словосочетаний, составленных из специального списка слов, а также исследование текстов, созданных на их основе. Непосредственной задачей проводимого в рамках настоящего исследования эксперимента было определение возможности установления связей, существующих в разговорном монологе; установление потенциальных (не реализованных в тексте) связей (между словами и между более крупными фрагментами – условными «синтагмами» и «предложениями» (фразами); исследование структуры текста, а также определение его темы. В качестве фактора, затрудняющего восстановление текста, в данном случае выступало его специфическое представление, в котором 195 Вестник МГЛУ. Выпуск 13 (619) / 2011 были практически нарушены как связи между словами в рамках словосочетания, так и связи в пределах более крупных фрагментов. Поэтому поэтапное «восстановление» текста (начиная с установления всех возможных словосочетаний и кончая целостным текстом) предполагает достаточно сложную деятельность информантов. Кроме того, определенную сложность представляет и сам исходный текст (монологический фрагмент разговорного диалога, организованный в соответствии с правилами разговорной речи, где доминирующим оказывается не тематический, а коммуникативный аспект). В качестве материала исследования были отобраны три монологических фрагмента из разговорных диалогов (соответственно Текст 1, Текст 2 и Текст 3), представленные в орфографической форме (с разбиением на реплики и делимитацией внутри реплик на более мелкие единицы – сегменты). При отборе материала мы руководствовались следующими критериями: каждый монологический фрагмент диалога должен был иметь значительный объем (в словах); развивать одну микротему (подтему) диалога; быть понятным информанту без привлечения дополнительной информации, сохранять относительную целостность, а также связи между более мелкими единицами данного материала и т. д. Указанные тексты были представлены в виде последовательности составляющих их слов, расположенных в алфавитном порядке (с сохранением предлогов и отрицательных частиц). Далее материалы были распечатаны, снабжены инструкцией и предъявлены информантам, прошедшим предварительное анкетирование, в ходе которого были зафиксированы их социальные и личностные параметры. Информанты руководствовались представленной ниже инструкцией. 1. На основании предъявленных списков слов необходимо составить: а) все возможные словосочетания из 2 слов; б) все возможные словосочетания из 3 слов; в) все возможные словосочетания из 4 слов. Примечание. При составлении словосочетаний учитывать, что это должны быть именно словосочетания, а не синтагмы или фразы. 2. Составить из предъявленных слов фразы (предложения). 3. Сформировать из предъявленного списка слов текст, используя максимальное количество этих слов. 196 Р. К. Потапова, М. В. Хитина Примечание. При восстановлении текста нельзя добавлять слова, не входящие в предложенный список, а также изменять их грамматическую форму. 4. После восстановления текста сформулировать с помощью одной-двух фраз его основное содержание. В эксперименте приняло участие 36 информантов (в основном женщин в возрасте 19–20 лет). Полученные данные сформировали базу данных (БД) и были обработаны по следующей программе. а) Для каждого текста (для всех дикторов) полученные словосочетания сведены в единый список и просчитано количество повторяющихся лексических единиц. Таким образом получены списки словосочетаний из 2, 3 и т. д. слов. б) Из полученных наборов словосочетаний исключены те, которые содержали добавленные слова (отсутствующие в предложенных списках). в) На основе выбранной трактовки понятия «словосочетания» (в соответствии с определением Н. Д. Шведовой) из рассмотрения исключены единицы, ей не соответствующие (последовательности слов, которые могут следовать друг за другом в рамках конкретной фразы, но не являются словосочетанием в каноническом смысле). г) Из рассмотрения исключены единицы, соответствующие простым предложениям. Для проведения дальнейшего анализа из всего материала исследовалось примерно 30 % словосочетаний, соответствующих выбранной трактовке. д) Проведен анализ возможной вариативности слов в рамках словосочетания (проанализированы словосочетания, имеющие тот же набор слов, но отличающиеся порядком их следования). е) На полученной выборке определялся тип словосочетания (на основе базовых связей – согласования, управления, примыкания) и просчитывалось количество словосочетаний каждого из указанных типов. На примере текста 1 рассмотрим полученные результаты. Исследование показало, что всего было представлено более 200 словосочетаний из двух слов и более 1000 последовательностей из двух слов, которые нельзя рассматривать как словосочетания. Соотношение числа словосочетаний и последовательностей слов, не являющихся словосочетанием, составляет соответственно 17 % и 83 %. Таким 197 Вестник МГЛУ. Выпуск 13 (619) / 2011 образом, наибольшее количество последовательностей слов, предложенных информантами и состоящих из 2 компонентов, составляют именно те, которые нельзя рассматривать как словосочетания, обладающие всеми характерными для них признаками. Анализ различных словосочетаний из 2 слов показал, что частота их появления варьировала от 1 до 36 (т. е. данные словосочетания формировали все участники эксперимента). Среди них можно указать следующие: «половое созревание» (36), «всю блокаду» (33), «восемьдесят детей» (32), «восемьдесят лет» (32), «в восемьдесят лет» (32), «одиннадцать лет» (32), «работала прачкой» (30), «ушел на войну» (30) и др., имеющие частоту менее 30. Что касается последовательностей слов, не являющихся словосочетанием, то в основном они были представлены последовательностями слов с частотой от 1 до 3, реже они имели частоту появления от 10 до 14. Незначительное количество последовательностей слов, не являющихся словосочетанием, имело частоту встречаемости, превышающую 20. Например, «бабушка работала» (27), «бабушка умерла» (28), «она работала» (28), «было поздно» (24), «блокадница умерла» (24) и др. Среди последовательностей слов, не являющихся словосочетанием и имевших большую частоту встречаемости, преобладали (несмотря на ограничения, данные в инструкции) предложения. Менее частотные варианты представляли собой практически не связанные между собой последовательности слов – например, «а детей» (16), – которые могли встретиться рядом в пределах предложения. Анализ различных словосочетаний и последовательностей слов, не являющихся словосочетаниями, имевших частоту встречаемости более 10, показал, что первых всего 60, а вторых 185 (т. е. реальных словосочетаний было 24,5 %). Определение видов наиболее частотных словосочетаний показывает, что из 60 словосочетаний с согласованием было выделено только 6 (10 %), с управлением – 20 (33,3 %), а наибольшее количество представлено словосочетаниями с примыканием – 34 (56,61 %). Таким образом, доминирующей оказалась связь словосочетаний типа «примыкание» (более 50 % от представленных словосочетаний из 2 слов). Анализ словосочетаний из 3 слов показал, что из 258 различных последовательностей слов, предложенных информантами, только 34 (13,1 %) могут претендовать на статус словосочетаний 198 Р. К. Потапова, М. В. Хитина (в соответствии с предложенным определением). Среди них можно отметить следующие: «бабушка в семьдесят лет», «восемьдесят лет работала», «всю блокаду недоедали» и др. Среди последовательностей слов, которые нельзя отнести к разряду словосочетаний, были представлены, во-первых, те, которые можно считать фрагментами предложений (или «условными» предложениями – высказываниями, встречающимися в разговорной речи, например, «как на войну ушел», «как в восемьдесят лет» и т. д.). Вовторых, это были те словосочетания, которые могут претендовать на статус предложения («бабушка не работала», «было уже поздно», «муж ушел на войну» и др.). Таким образом, в качестве трехсловных словосочетаний в 86 % случаев были даны последовательности слов, не являющиеся словосочетаниями. Из 34 реальных трехсловных словосочетаний 38 % составили словосочетания глагольного типа, 62 % – именного. Анализ четырехсловных последовательностей слов не проводился ввиду недостаточности полученного экспериментального материала. Восстановление текста по предложенному списку слов Исследования на тему смыслового восприятия текста являются на сегодняшний день одними из самых интересных и в то же время неоднозначных направлений в рамках фундаментального и прикладного речеведения. В литературе представлены различные определения понятия «смысл», который рассматривается авторами на основе собственного понимания данного феномена. В общелингвистическом понимании можно сформулировать такое обобщенное определение: смысл – субъективный образ, возникающий при понимании текста. Ключевыми в определении смысла являются понятия субъективности, целостности и связи. Из 37 составленных информантами текстов были отобраны те, которые в наибольшей степени отвечали перечисленным выше требованиям. Из анализа были исключены тексты, не удовлетворяющие условиям эксперимента (в которых добавленные слова составляли более 30 %). Оставшиеся тексты (n=31) были проанализированы и оценены в соответствии со следующими критериями: – подсчитано среднее количество слов в полученных текстах; – определено соотношение количества слов из предложенного списка и слов, добавленных информантами; 199 Вестник МГЛУ. Выпуск 13 (619) / 2011 Количество слов в тексте – установлен количественный и качественный состав добавленных слов в полученных текстах; – исследовано соотношение количества слов, относящихся к различным частям речи, в исходном тексте по сравнению с восстановленными текстами. Результаты представлены в виде сводных таблиц в программе Microsoft Excel. Среди наиболее существенных результатов анализа данных можно отметить следующие. Количество слов в полученных текстах варьирует от 39 до 69, среднее по выборке количество слов составляет 53. Как видно из диаграммы (рис.1), это меньше, чем количество слов в исходном тексте. Участники эксперимента Рис. 1. Количество слов в восстановленных текстах по сравнению с исходным текстом (n=75) Данный результат позволяет сделать вывод, что информанты использовали не все слова из перечня. Однако восстановленные тексты зачастую отличались большим содержательным наполнением, чем исходный текст, а также более эксплицитным представлением информации. Количество добавленных слов в восстановленных текстах было различным (в 5 текстах из 31 информанты использовали только слова, имеющиеся в списке, в остальных текстах доля добавленных слов достигала 21 %). Более подробно эти результаты показаны на 200 Р. К. Потапова, М. В. Хитина диаграмме (см. рис. 2). Среднее соотношение добавленных слов и слов, принадлежащих исходному списку (анализируемому тексту), составляло 5 % к 95 %. Процент творчества (доля слов, которые не содержались в исходном тексте) Рис. 2. Количество добавленных слов (в %) от количества слов в восстановленных текстах Добавленные информантами слова (отсутствующие в исходном списке) анализировались с точки зрения их принадлежности к различным частям речи. Также учитывались следующие моменты: а) является ли добавленное слово грамматической формой слова из перечня, б) близко к нему семантически или в) не имеет никакого отношения к словам из предложенного списка. Исследование показало, что замены касались в большей степени глаголов и существительных. Дополнительно было подсчитано количество слов, относящихся к различным частям речи (глаголы, существительные, прилагательные, наречия, местоимения, числительные, предлоги, союзы, вводные слова) в исходном тексте и в каждом из текстов, полученных от информантов. Далее были вычислены средние значения количества слов каждой части речи в текстах информантов, а полученные результаты сопоставлены с соответствующими значениями исходного текста. Так, среднее отношение количества глаголов к количеству существительных в текстах информантов по сравнению с исходным текстом составляет 0,58:0,44. 1. Результаты эксперимента показывают, что среди последовательностей из двух слов, представленных информантами, только 201 Вестник МГЛУ. Выпуск 13 (619) / 2011 17 % могут быть действительно расценены как словосочетания. Частота появления этих словосочетаний применительно к группе информантов (n=36) различна (от 1 до 36). 2. Последовательности из двух слов, не являющиеся словосочетаниями, преимущественно имели частоту от 1 до 3, небольшое количество – от 1 до 14, и только некоторые (примерно 12 последовательностей слов) имели частоту 20 и более. 3. Среди словосочетаний из двух слов и последовательностей, не являющихся словосочетаниями, с частотой 10 и более преобладали последние (75,5 % по сравнению со словосочетаниями – 24, %). 4. Анализ распределения словосочетаний из двух слов по типам синтаксической связи показывает, что преобладает примыкание (56,6 %), затем идет управление (33,3 %). Наименьшее количество словосочетаний относится к типу «согласование» (10 %). 5. Словосочетания из трех слов составляют 13,1 % от всех предложенных информантами последовательностей. Среди выделенных трехсловных словосочетаний преобладают именные (61,8 %). 6. Анализ полученных данных показал, что количество слов в восстановленных текстах меньше, чем количество слов в исходном тексте (варьирование по разным восстановленным текстам от 39 до 69 слов). 7. Доля добавленных слов (не содержащихся в исходном тексте) составляла по разным информантам от 34 % до 78 %. Среди этих слов преобладали глаголы и служебные части речи. 8. Соотношение слов по их принадлежности к разным частям речи в исходном и восстановленных текстах показало в ряде случаев наличие сходства полученных распределений. Исключение составляют местоимения (13 % в исходном тексте и около 6 % в восстановленных). Менее значимые отличия наблюдались для наречий, числительных, предлогов и частиц. 9. Отношение числа глаголов к числу существительных в исходном тексте составляло 44 %, в восстановленных – 58 %. СПИСОК ЛИТЕРАТУРЫ 1. Смысловое восприятие речевого сообщения (в условиях массовой коммуникации) / отв. ред. Т. М. Дридзе и А. А. Леонтьев. – М.: Наука, 1976. – 264 с. 202