ABC Blocks

advertisement
КОММУНИКАТИВНЫЕ
МАКРОЭПИЗОДЫ В КОРПУСЕ
ПОВСЕДНЕВНОЙ РУССКОЙ РЕЧИ
«ОДИН РЕЧЕВОЙ ДЕНЬ»:
ПРИНЦИПЫ АННОТИРОВАНИЯ И
РЕЗУЛЬТАТЫ СТАТИСТИЧЕСКОЙ
ОБРАБОТКИ
Т. Ю. Шерстинова
Санкт-Петербургский
Государственный Университет
• Исследование выполнено в рамках
проекта «Информационная система
коммуникативных сценариев
спонтанной русской речи»
(РГНФ № 12-04-1201).
• Речевым материалом для изучения
коммуникативных макроэпизодов
на русском языке является звуковой
корпус повседневной русской
коммуникации «Один речевой день»
2
«Макроэпизод»
• Речевая деятельность человека, осуществляемая
им ежедневно, распадается на крупные эпизоды,
объединенные местом коммуникации,
ее условиями и участниками.
• Например: «завтрак в кругу семьи», «дорога на
работу», «рабочее совещание», «работа с
клиентами в офисе», «обеденный перерыв»,
«телефонные переговоры с партнерами»,
«покупки в магазине», «встреча в кафе»,
«посещение фитнес-клуба», «домашние занятия
с детьми» и т. п.).
• За сутки каждый человек участвует в среднем
в 20-50 коммуникативных эпизодах такого типа,
3
которые мы называем «макроэпизодами».
Система кодирования макроэпизодов
• социальная роль говорящих (родственники: «мать»,
«отец», «сын», «дочь» и др., коллеги: «начальник»,
«подчиненный», «коллега», друзья, клиенты,
знакомые, посторонние и др. категории)
• место коммуникации (дом, офис, учебное заведение,
магазин, кафе и др.).
• тип коммуникации (например, «бытовой разговор»,
«профессиональная беседа», «публичная речь»,
«клиент-сервис»-общение, «обучение/инструктаж»)
• условия коммуникации (в частности, «кухонные»
разговоры, застолья, телефонные разговоры и т. п.)
• Макроэпизод = звуковой файл корпуса ОРД
4
СОЦИАЛЬНАЯ РОЛЬ ИНФОРМАНТА:
родственники
•
•
•
•
•
•
•
•
•
•
•
•
МУ – муж,
ЖЕ - жена
ОТ - отец
МА – мать
СЫ – сын
ДО – дочь
СЕ – сестра
БР – брат
БА – бабушка
ДЕ – дедушка
ВН – внук
ВА – внучка
• СР – старшие родственники
тетя, свекровь, теща, дядя,
свекр, тесть, крестный
• МР – младшие родственники зять, невестка, племянник,
племянница и пр.
• РР - родственники-ровесники
• НР – непонятный родственник
• АР – ассоциируемый
родственник
(чей-то родственник)
5
СОЦИАЛЬНАЯ РОЛЬ ИНФОРМАНТА:
коллеги
и
друзья
• КО – коллега
(непосредственно
по работе – с которым
вместе работаешь),
но есть еще «партнер»
• КП – коллега
подчиненный
(младший по возрасту)
• КН – коллега-начальник,
командир
• КД – коллега-друг
или коллега-подруга
• БД – близкий друг (бойфренд)
• БП – близкая подруга
(гёрл-френд)
• ДР – друг
• ПО - подруга
• АД – ассоциируемый друг
(друг друзей,
родственников) или
родственник друзей для
подруги матери)
6
СОЦИАЛЬНАЯ РОЛЬ ИНФОРМАНТА:
«парные отношения» и член группы людей
• КЛ – клиент
(покупатель, пациент,
родители пациента)
• СС – сервис, сервисная
служба (продавец,
фотограф, квартирная
хозяйка, врач)
• УЧ – ученик,
обучаемый, студент
• ПР – преподаватель,
учитель
• СТ – сокурсник,
одноклассник
• ПА – «партнер» (член того
же спортивного клуба,
церковной общины, соседи
по общежитию, по даче
• АП – «антипартнер»
• ПП – «попутчик», а также
посетитель того же кафе,
магазина, поликлиники и
пр. общественных мест
• АУ - часть толпы,
массовки, аудитории
7
СОЦИАЛЬНАЯ РОЛЬ ИНФОРМАНТА:
прочее
• ЗН – просто знакомый, не друг, не клиент, не
«партнер»
• ЧУ – чужой, посторонний, незнакомый
человек
• ХО – хозяин/хозяйка (общение с животными)
• СА – сам(а) себе коммуникант, включая
разговоры с неодушевленными предметами
• ДИ – диктор радио, ТВ, голос из фильма, в
метро – (для «коммуникантов»)
• ХХ – прочее
• НИ – ни с кем не говорит
8
МЕСТО КОММУНИКАЦИИ
• ДОМ – дом, место проживания (квартира, общежитие, дача, номер в
гостинице)
• ДОГ – «в гостях» (квартира, общежитие, дача, номер в гостинице)
• КАЗ - казарма
• ОФ – офисное помещение + рабочее, служебное помещение.
• КАФ – кафе, столовая, ресторан, буфет на работе
• МАГ – магазин (торговый центр, аптека, киоск)
• СЦ – сервис-центр (любые услуги – коммерческие и государственные
учреждения, (сбер)банк, ателье, библиотека)
• УЗ – учебное заведение (школа, университет, училище)
• ПОЛ – поликлиника, больница, мед. кабинет
• ОМ – прочие общественные места (музей, театр, кинотеатр, храм) )
• УЛ – улица, парк, открытый воздух
• ТР – все виды транспорта + места остановок + вокзалы, аэропорт
• ПОД – подсобные помещения (сарай, гараж, мастерская, объект
капитальных ремонтных работ
• НО – неопределенное место
9
Тип КОММУНИКАЦИИ / КОММУНИКАТИВНЫЙ
СЦЕНАРИЙ: основные маркеры
• П - Публичная речь, (лекции, презентации и пр.)
• Д - деловой (между коллегами, бизнес),
профессиональная беседа (если хотя бы один из
участников беседы профессионал в обсуждаемой
области)
• В – общение с внешними организациями, разговор
клиент-сервис (магазины, службы, поликлиника,
библиотека и т.п.)
• У - обучение, инструктирование, практическое
занятие, занятия с ребенком дома и пр.
• Б - Разговор бытовой (о вещах, о ситуациях,
семейный, сплетни) – все остальное, что не попадает
в первые 4
10
Тип КОММУНИКАЦИИ / КОММУНИКАТИВНЫЙ
СЦЕНАРИЙ: условия коммуникации
•
•
•
•
•
•
•
•
•
•
•
•
К – «кухонные» (за непраздничной едой где угодно)
З – застолья (за праздничной едой где угодно)
Д – (дело) за решением рабочих дел
Б – за решением повседневных бытовых дел
Ж - на фоне восприятия какого-то внешнего источника
Х – на ходу (в дороге, на прогулке, в транспорте)
Г – решение организационных, бухгалтерских и пр. дел
П – покупки и выбор товара
О – в ожидании чего-то или кого-то
Ы - отдых, перекур, расслабление, игра с ребенком
Ь – выпивая
Ц – осмотр врача
11
Тип КОММУНИКАЦИИ / КОММУНИКАТИВНЫЙ
СЦЕНАРИЙ: факультативные маркеры
•
•
•
•
•
•
М – монолог – присутствие монологических фрагментов
Р - Отдельные реплики и микродиалоги
Т - Телефонный разговор
Ф - Фоновые разговоры
Е - Пение – присутствие в файле таких фрагментов
Ч - Чтение текстов, стихов, анекдотов, молитвы
• Э – позитивные эмоции
• Н – негативные эмоции, конфликтные ситуации, спор
• Ю – юмор, забавные ситуации, смех
12
Объем исследования
• 1110 макроэпизодов
• 44 информанта
• 288 часов речевого материала
13
Образец заполнения базы данных
14
15
II. РЕЗУЛЬТАТЫ СТАТИСТИЧЕСКОЙ ОБРАБОТКИ
1) РАСПРЕДЕЛЕНИЕ СОЦИАЛЬНЫХ РОЛЕЙ
КО
ПО
СС
МУ
10 %
9%
9%
КЛ
ПР
СТ
7%
7%
6%
32 %
ДР
ЗН
МА
КД
ДО
ОТ
5%
5%
5%
4%
4%
4%
СА
ПП
ПП
3%
3%
3%
МР УЧ БП АУ ХО ЖЕ СЫ ДЕ КП
по 2 %
по 1 %
16
2) РАСПРЕДЕЛЕНИЕ МЕСТ КОММУНИКАЦИИ
ДОМ ОФИС
18 %
УЧЕБНОЕ
ЗАВЕДЕН.
12 %
16 %
В
ГОСТЯХ
СЕРВИС
-ЦЕНТР
9%
7%
УЛИЦА
ПОЛИКЛИНИКА
6%
6%
ОМ
КАФЕ
ТР
МАГ
5%
5%
5%
4%
КАЗ ПОД
по 1 %
17
КАЗАРМА ПОДСОБНОЕ
2% ПОМЕЩЕНИЕ
МАГАЗИН
1%
4%
ПРОЧЕЕ
5%
ТРАНСПОРТ
5%
ДОМ
18%
ОФИС
16%
КАФЕ
5%
ОБЩ. МЕСТО
5%
ПОЛИКЛИНИКА
6%
НА УЛИЦЕ
6%
СЕРВИСЦЕНТР
7%
"В ГОСТЯХ"
8%
УЧ.
ЗАВЕДЕНИЕ
12%
18
3) РАСПРЕДЕЛЕНИЕ ПО ТИПУ КОММУНИКАЦИИ
ДЕЛОВЫЕ
БЫТОВЫЕ
21 %
58 %
КЛИЕНТСЕРВИС
10 %
ПУБ
УЧЕБНЫЕ
3%
7%
19
3) РАСПРЕДЕЛЕНИЕ ПО ТИПУ КОММУНИКАЦИИ
НАИБОЛЕЕ ЧАСТОТНЫЕ БЫТОВЫЕ МАКРОЭПИЗОДЫ
БЫТОВЫЕ
ББ
БР
11 %
9%
БХ
58 %
БК
9%
БМ
БФ
4%
3%
8%
БД БЗ
по 1 %
20
3) РАСПРЕДЕЛЕНИЕ ПО ТИПУ КОММУНИКАЦИИ
НАИБОЛЕЕ ЧАСТОТНЫЕ ДЕЛОВЫЕ МАКРОЭПИЗОДЫ
ДЕЛОВЫЕ
21 %
ДД
10 %
ДМ
ДР
3%
3%
ДГ ДК ДХ ДЫ
по менее 1 %
21
3) РАСПРЕДЕЛЕНИЕ ПО ТИПУ КОММУНИКАЦИИ
НАИБОЛЕЕ ЧАСТОТНЫЕ КЛИЕНТ-СЕРВИС МАКРОЭПИЗОДЫ
КЛИЕНТ-СЕРВИС
10 %
ОСМОТР
ВРАЧА
ПОКУПКИ
2%
4%
ВУ
1,5%
ВГ
<1 %
22
3) РАСПРЕДЕЛЕНИЕ ПО ТИПУ КОММУНИКАЦИИ
НАИБОЛЕЕ ЧАСТОТНЫЕ УЧЕБНЫЕ МАКРОЭПИЗОДЫ
УЧЕБНЫЕ
7%
У
2%
УМ
2%
УР
2%
23
Наиболее типичные макроэпизоды в зависимости
от социальной роли информанта и места
коммуникации
• 344 комбинаторных вариантов разных
сочетаний соц. роли информанта и
места коммуникации позволили
построить 344 частотных таблицы.
• Анализ результатов позволил выявить
наиболее частотные комбинации.
24
Наиболее типичные макроэпизоды в зависимости
от социальной роли информанта и места
коммуникации
• КОЛЛЕГА – ОФИС (125 эпизодов, 11%)
• ПРЕПОДАВАТЕЛЬ – УЧ. ЗАВЕДЕНИЕ
(47 эпизодов, 4%)
• ПОДРУГА – ДОМ (35 эпизодов, 3%)
• КОЛЛЕГА – СЕРВИС-ЦЕНТР
(34 эпизода, 3%)
• МУЖ – ДОМ
(26 эпизодов, 2%)
25
КОЛЛЕГА – ОФИС (125 эпизодов, 11%)
65 разных кодов эпизодов
ДДРТ
ДДР
ПМ
ДД
ПМР
ДТР
БХ
ДДФ
ДДТ
ДДР/БР
ДДРЭ
ДРФ
ДДМР
ДДЮТ
ДФ
ДФ/БФЮ
ДДЮ
БМ
ПМЧ
ДМР
Частота
%
14
11
11
5
5
3
3
3
3
2
2
2
2
2
2
2
2
2
2
2
11
9
9
4
4
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
Деловые
84
Бытовые
23
Публичные речи
18
26
ПРЕПОДАВАТЕЛЬ – УЧ. ЗАВЕДЕНИЕ
(47 эпизодов, 4%), 19 разных кодов
Частота
%
У
21
45
УМР
7
15
БМ
2
4
ББМР
2
4
БЮ
1
2
БЮТ/У
1
2
УРМ/ДДР
1
2
УР/ДДР
1
2
УР/ДДГР
1
2
УМР/БТ
1
2
БР
1
2
Б
1
2
ББМ
1
2
УРЖ
1
2
ББ
1
2
ББР
1
2
УМРЧ
1
2
УМРЖ
1
2
УМРБ
1
2
Собственно
занятие
36
Бытовые
11
27
ПОДРУГА – ДОМ
(35 эпизодов, 3%), 21 разный тип
БЫМР
ББ
БКЬЮМ
ББЖ
БР
ББТ
БКЮМ
БМЮЭ
БМЖЬЮ
БМ
БМЮ
Б
БКМР
ББК
ББКЮ
ББЮ
БХ/ББ
БКМ
ББР
ББЮМЖ
ББЮЖ
Частота
4
4
3
2
2
2
2
1
1
1
1
1
1
1
1
1
1
1
1
1
1
%
12
12
9
6
6
6
6
3
3
3
3
3
3
3
3
3
3
3
3
3
3
Бытовые
35
28
КОЛЛЕГА – СЕРВИС-ЦЕНТР
(34 эпизода, 3%), 16 разных кодов
Частота
%
БР
4
13
БКМ
1
3
ДН
1
3
ДДМ
1
3
ДР
4
13
БМР
2
6
БМЮР
2
6
БМРЮ
3
9
БМЮ
5
16
ДБМР
1
3
ДРЮ
1
3
БТЮ
1
3
БМЮЧ
3
9
БРЮЖЧ
1
3
ДР/БРМЮ
1
3
БМ
1
3
Бытовые
23
Деловые
11
29
МУЖ – ДОМ
(26 эпизодов, 2%), 15 разных кодов
Частота
%
ББ
8
31
ББМР
2
8
ББЕ
2
8
ББК
2
8
Б
2
8
ББЭ
1
4
БРБК
1
4
БЖ
1
4
БДР
1
4
БКЮМ
1
4
ББТ
1
4
БКМ
1
4
БКЮ
1
4
БКЖ
1
4
ББКМ
1
4
Бытовые
26
30
Частота других факультативных помет
•
•
•
•
•
•
•
•
М (монологические фрагменты) – 298
Т (телефонный разговор) - 190
К («кухонные» разговоры) – 146
Ю (юмор) – 138
Ь (выпивают) – 38
Э (положительные эмоции) – 48
Н (негативные эмоции) – 32
З (застолья) - 13
31
Условия коммуникации в зависимости
от конкретного информанта
•
•
•
•
S24 –
S35 –
S30 S04 -
12 разных ролей / 7 типов мест
10 разных ролей / 6 типов мест
10 разных ролей / 8 типов мест
9 разных ролей / 7 типов мест
• S11 – 48 типов эпизодов / Б Д У В
• S05 - 23 типа эпизодов / Б Д У В
32
Чего не хватает ?
• Гендерно-возрастной маркера
(разговоры с детьми, женские и
мужские разговоры)
• Т2 – «двусторонний» телефонный
разговор
• Сленговый маркер ?
• ?...
33
Продолжение исследования:
• Создание базы данных основных
коммуникантов.
• Разметка и анализ микроэпизодов.
34
СПАСИБО!
Download