ПРОБЛЕМА СЕГМЕНТАЦИИ УСТНОГО ДИСКУРСА И КОГНИТИВНАЯ СИСТЕМА ГОВОРЯЩЕГО* А.А. Кибрик (Институт языкознания РАН), В.И. Подлесская (РГГУ), Ю.В. Дараган (МГУ им. М.В. Ломоносова), З.В. Ефимова (РГГУ), Н.А. Коротаев (РГГУ), А.О. Литвиненко (МГУ им. М.В. Ломоносова), В.Л. Цуканова (РГГУ), Москва [email protected] [email protected] * Исследование выполнено при поддержке гранта РГНФ № 04-04-00220а. Дискурс – это наиболее общий термин, включающий разные формы использования языка: устную речь и письмо, диалог и монолог, любые жанры – рассказ, телефонный разговор, спортивный репортаж и т.п. Как любое целенаправленное поведение, дискурс имеет структуру. Лингвисты традиционно предпочитают изучать письменный текст, т.к. он более доступен и удобен для наблюдения, чем устная речь. В письменном тексте глобальная структура эксплицитно выражена в виде абзацев и более крупных фрагментов, а локальная структура передается пунктуацией. Между тем, исходной формой использования языка является устная речь, и она не может не учитываться в лингвистических и когнитивных исследованиях. Поскольку непосредственное обращение только к звуковой форме устной речи недостаточно для аналитических целей, возникает задача транскрибирования устной речи. Такая транскрипция должна передавать наиболее важные компоненты устной речи в графическом виде. Одна из центральных проблем любой транскрипции устной речи – проблема сегментации. Дискурс порождается говорящим не в виде плавного потока, а в виде последовательности квантов, пульсаций, толчков. Такие кванты мы называем элементарными дискурсивными единицами (ЭДЕ). ЭДЕ далее организуются в более крупные иерархические объединения, в соответствии с коммуникативным намерением говорящего. В докладе мы собираемся рассмотреть лишь вопрос об объеме ЭДЕ и о границах между ними. Как и в любом целенаправленном поведении, в большей части случаев границы между квантами очевидны, но есть существенная доля случаев, когда отождествить границы ЭДЕ оказывается нелегко. Наш основной исследовательский вопрос: какими когнитивными факторами обусловлена сегментация на ЭДЕ? Настоящее исследование – часть проекта по изучению устных детских рассказов о сновидениях, но для данного доклада важно лишь то, что это устная русская речь. Сегментация на ЭДЕ графически отображается в виде деления на строки. Типичная ЭДЕ совпадает по объему с предикацией (элементарным предложением, clause). Согласно гипотезе У. Чейфа, ЭДЕ – это вербализация «фокуса сознания» говорящего, т.е. совокупности информации, которую селективное человеческое сознание может одновременно удерживать в активном состоянии. Поскольку знания хранятся в основном в предикативной форме, минимальный квант дискурса типично совпадает с предикацией. Однако существует несколько типовых случаев, когда ЭДЕ по объему менее одной предикации. 1. Вынесенный топик. Говорящему необходимо одновременно активизировать и новый референт, и событие, в котором данный референт участвует, и он выносит именную группу, обозначающую референт, «влево» от предикации, в позицию так называемого топика, а в саму предикацию включает местоименный дублет референта. (Ср. строки 1, 4 в таблице ниже.) 2. Парцелляция. Часто бывает, что говорящий не включает в предикацию какую-то ее составляющую, особенно сирконстант, а вербализует эту составляющую позже в виде отдельной ЭДЕ.. Это может иметь по крайней мере две когнитивных причины: (а) избыточное количество новой информации для одной ЭДЕ (б) в процессе выбора просодического оформления предикации говорящий временно упускает из виду какой-то ее элемент, но еще имеет возможность «пристроить» этот элемент апостериори. (Ср. строки 20, 25 в таблице.) 3. Разрыв. Говорящий начинает формулировать предикацию и в процессе обнаруживает, что один из начальных элементов этой предикации требует уточнения. В этом случае предикация может быть разорвана на две ЭДЕ, между которыми вклинивается другая ЭДЕ: /Утром — когда \мама мне обычно даёт ...(0.6) /попить, — ..(0.2) /она мне дала /б-бутылку, 4. Сильный фальстарт. Говорящий начал вербализацию ЭДЕ, но в процессе осознал, что принятый план не соответствует его глобальным задачам. Это может происходить по двум основным причинам: (а) ошибка планирования: ЭДЕ формулируется не в нужной точке дискурса (б) неудачно пропозициональное содержание самой ЭДЕ, и в результате говорящий полностью отказывается от ЭДЕ и строит новую от начала. (Ср. строки 22, 23 в таблице.) 5. Регуляторные ЭДЕ. Это ЭДЕ, состоящие исключительно из дискурсивных маркеров – специальных слов, регулирующих дискурсивный процесс между говорящим и адресатом. /Потом || ....(3.4) ну –потом мы там ....(3.1) чего-то на \физкультуре были, \играли там. ....(1.5) \Вот ..(0.1) <чего-то’>. ….(2.4) /Ну-у там вот \так. Бывают также случаи, когда ЭДЕ содержит более одной предикации. Этот эффект возникает, когда один из предикатов когнитивно ослаблен и фактически является фазовым, модальным или цитационным маркером. Независимо от этого другой предикат может быть частично номинализованным, например инфинитивным, – в этом случае событие концептуализируется как объект и предикация уже не является полноценной. (Ср. строку 5 в таблице.) ЭДЕ, бóльшие, чем предикация, возникают также в результате слабого фальстарта: в отличие от сильного фальстарта, говорящий отказывается лишь от части текущей ЭДЕ. При этом в одной ЭДЕ может оказаться более одного предиката. (Ср. строку 17 в таблице.) Немного похож на слабый фальстарт феномен быстрой подстановки: говорящий не находит удовлетворяющую его вербализацию составляющей, и подставляет на ее место акцентированный заместитель (\это, это \самое, \такой, \как его и т.п.). (Ср. строки 10, 18 в таблице.) Разрабатываемая в рамках проекта система транскрипции устного дискурса позволяет регистрировать и восстанавливать главные динамические события, происходящие в когнитивной системе говорящего в процессе порождения дискурса. Пример одного рассказа, с указанием на описанные выше и некоторые другие явления: 1. 2. 3. ээ(0.4) С /другом с моим ..(0.1) \самым \лучшим, ..(0.3) (\Санёк. ...(0.7) Он у меня там \<в школе>.) 4. 5. ..(0.4) мы с ним /пошли, .…(1.5) и мы /стали копать ..(0.3) там ..(0.4) у себя \яму, 6. 7. чтоб \сделать себе \шалаш, ...(0.5) ну \столбы чтоб поставить, 8. ...(0.6) и /нашли чего-то такое \железное. 9. .…(1.2) /Выкопали, 10. ...(0.7) а там-м \это..(0.3) лежат всякие такие /\сокро-овища /сокровища_ 11. ...(0.6) И мы ..(0.2) /набрали этих сокровищ, 12. ..(0.4) но не \все. 13. ...(0.6) Остальное /закопали, 14. ….(1.7) и’ /пошли \домой. 15. ..(0.1) /Принесли \домой. 16. ...(0.8) А потом мы \п-пошли там ….(1.2) в Вынесенный топик Парентеза: вставление предложения внутрь другого предложения База вынесенного топика Два предиката в ЭДЕ: фазовый маркер и инфинитив Постпозитивные уточнения с характерным слабо падающим тоном в главном акценте ЭДЕ Конечная ЭДЕ повествовательного предложения с сильно падающим тоном в главном акценте Неконечная ЭДЕ с восходящим тоном в гл. акценте Быстрая подстановка Хезитация, не приводящая к 17. 18. 19. 20. 21. 22. 23. 24. 25. какой-то й= ...(0.5) ювелир= =ный /магазин с родителями, .…(1.1) и-и они /сдали эти || ...(0.6) /\ну-у ...(0.8) /сдали вот эти ю= ..(0.3) =велир=~ ...(0.6) и \это..(0.3) мы получили \деньги. .…(1.0) И-и /\мы-ы с Саньком ..(0.1) тогда /пошли, ...(0.6) в \магазин, чего-нибудь \покупать, ..(0.4) а-а == ...(0.5) и Са= == и я \проснулся. На самом там ..(0.2) интересном \месте. слабому фальстарту Слабый фальстарт Быстрая подстановка Парцелляция Сильный фальстарт Сильный фальстарт Парцелляция