Лекция 3.2. Ассоциативный эксперимент

advertisement
Тема 3.
КОМПЬЮТЕРНАЯ КОГНИТОЛОГИЯ
СЕМИОТИЧЕСКИХ СИСТЕМ
ОСНОВНЫЕ РАЗДЕЛЫ ТЕМЫ
3.1. Вербальное сознание — лекция 1.
3.2. Ассоциативный эксперимент — лекция 2.
3.3. Когнитивный эксперимент — лекция 3.
ФАКУЛЬТАТИВНЫЕ РАЗДЕЛЫ ТЕМЫ ДЛЯ
САМОСТОЯТЕЛЬНОГО ИЗУЧЕНИЯ
3.4. Язык и сознание — лекция 1.
Лекция 2.
АССОЦИАТИВНЫЙ ЭКСПЕРИМЕНТ
ТЕХНОЛОГИЯ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ
АССОЦИАТИВНЫЙ ОПРОС
СПОСОБ ИНТЕГРАЦИИ ДАННЫХ АССОЦИАТИВНОГО
ОПРОСА
РЕЧЕМЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ ЧЕЛОВЕКА
ИНСТРУМЕНТАРИЙ ИССЛЕДОВАНИЯ
Основные публикации
Ю.Н.Филиппович, Г.А.Черкасова,
Д.Дельфт
Ассоциации
информационных
технологий:
эксперимент на русском и
французском языках. /
Серия «Компьютерная
лингвистика».
Вступ. Статья Н.В.Уфимцевой.
М.: МГУП, 2002.
— книга в комплекте с CD ROM
— С. 5–102.
ТЕХНОЛОГИЯ АССОЦИАТИВНЫХ
ЭКСПЕРИМЕНТОВ
Первые ассоциативные вербальные эксперименты
были использованы для исследования речевого поведения
людей и описаны в 1901 году
немецкими исследователями А.Тумбом и К.Марбе
{слова-стимулы}  испытуемый  {слова-реакции}

психология
лингвистика


устройство его вербального сознания
особенности языка
Современная практика
Технология ассоциативного вербального
эксперимента - основной инструмент
психолингвистики и когнитологии
Результат ассоциативных экспериментов

словарь-тезаурус

семантические связи слов 
 семантические поля


модель языковой способности модель языковой системы
носителя языка


образы взаимопонимания
• пол,
• возраст,
• образование,
• профессия
...
Сферы использования
Преподавательская деятельность
(изучение языков и контроль знаний обучающихся)
Авторская деятельность
(написание текстов учебных материалов,
подготовка публичных выступлений)
Реклама
Информационный поиск
Машинный перевод
Примеры ассоциативных словарей
Kiss G., Armstrong C., Milroy R.
The Associative Thesaurus of English
Ю.Н.Караулов, Г.А.Черкасова, Н.В.Уфимцева,
Е.Ф.Тарасов, Ю.А.Сорокин. Русский ассоциативный
словарь
M. Sánchez Puig, Yu. Karaúlov, G. Cherkásova. Normas
asociativas del español y del ruso
Н.В.Уфимцева, И.А.Стернин, Х.Эккерт, В.И.Милехина,
В.М.Топорова. Ассоциативные нормы русского и
немецкого языков.
Н.В.Уфимцева, Г.А.Черкасова, Ю.Н.Караулов,
Е.Ф.Тарасов.
Славянский ассоциативный словарь:
русский, белорусский, болгарский, украинский
Ю.Н.Филиппович, Г.А.Черкасова, Д.Дельфт,
Ассоциации информационных технологий
Примеры ассоциативных словарей
Ю.Н.Караулов, Г.А.Черкасова,
Н.В.Уфимцева, Е.Ф.Тарасов,
Ю.А.Сорокин.
Русский ассоциативный словарь
СПОСОБ ИНТЕГРАЦИИ ДАННЫХ
АССОЦИАТИВНОГО ОПРОСА (1)
формальные правила лингвистического конструирования АВС:
1)
одинаковые слова-реакции разных респондентов являются эквивалентными
это позволяет для каждого слова-стимула построить частотное поле его реакций,
и для каждого слова-реакции – частотное поле его стимулов
Оружие (пр.)
ОРУЖИЕ: холодное 9; массового поражения, ружье 5; огнестрельное, ядерное 4; война,
стреляет, убийства 3; безопасность, мощное, пистолет, смертельное, смерть, старинное,
убийцы 2; абсолютное, автомат, армия, Бальзак, винтовка, военное, возмездия, врага, в руках,
выстрелило, газовое, грозное, дерево, железо, зонтик, именное, и пушка, кинжал, командира,
кровь, любви, массового уничтожения, мести, мое, мортира, МП, на складе, нож, опасно,
опасное, орудие, перестройки, перо, пищаль, продавать, пролетариата, прощай, прятать, разоружение, самозащиты, секретное, сильный, слово, сложить, смерти, спортивное, ствол,
стрельба, стрелять, твое, холодная, черный 1; 105+67+3+52
Оружие (обр.)
ОРУЖИЕ* огнестрельное 93; применять 10; сдать 9; пистолет, пушка 7; пулемет 6;
заряжать, стрельба 5; булыжник, кинжал, носить, сдавать, ствол 4; Калашников, слово, шпага 3;
автомат, бросать, войска, вооружен, древнее, копье, ликвидировать, орудийный, патрон, ружье,
убийство 2; армия, атаковать, атом, атомная бомба, атомный, байки, бандит, битва, боец,
болванка, бомба, борьба, бумага, везти, вершина, военный, воин, Вторая мировая война,
выбросить, выстрел, град, дубина, защитник, инструмент, клинок, конструктор, личный, лук,
наше, нужно, оборона, отнять, отобрать, птица, ракета, ржавое, самоубийство, склад,
смертельный, создавать, солдат, спрятать, танк, убивать, убийца, уничтожить, хранение,
хранить, цели, цепь, чистить, юмор, ядерный, ядро 1; 81+247
СПОСОБ ИНТЕГРАЦИИ ДАННЫХ
АССОЦИАТИВНОГО ОПРОСА (2)
формальные правила лингвистического конструирования АВС:
2) одинаковые слова-реакции и слова-стимулы, в том числе и разных респондентов,
также являются эквивалентными
это позволяет искусственно «удлинить» и «замкнуть» стимульно-реактивные цепочки,
преобразовать иерархические связи между стимулами и реакциями в сетевые.
арбалет
1
1
стрельба
1
1
борьба
12
орудие
1
война
охота
2
1
1
1
1
пушка
5
операция
топор
3
1
7
кровь
армия
пистолет
1
2
1
оружие
ружье
2
1
5
1
10
ствол
перо
1
1
СПОСОБ ИНТЕГРАЦИИ ДАННЫХ
АССОЦИАТИВНОГО ОПРОСА (3)
МАКЕТ
КОГНЕМНОГО СЛОВАРЯ АССОЦИАТИВНЫХЦЕПОЧЕК
АРБАЛЕТ. Мир вне человека: Время:История. Рецепт. Сравн.
Старинное оружие в форме лука.
<старинный; оружие; форма; лук><арбалет> = <2: старинный1 двор1 ствол1 орудие1 арбалет,
старинный1 двор1 ружье1 стрельба1 арбалет; 1: оружие1 стрельба1 арбалет; 2: форма1 спорт1
стрельба1 арбалет, форма1 война1 стрельба1 арбалет; 1: лук3 стрела1 стрельба1 арбалет>
6=0+1+3+2+0
<арбалет>  <старинный; оружие; форма; лук> = <3: арбалет 1орудие1 работа1 стол1 старинный,
арбалет 1стрельба5ору-жие1 зонтик1старинный, арбалет 1стрельба1огонь7камин2ста-ринный; 5:
арбалет1орудие1пистолет7 оружие, арбалет 1орудие4 пушка7 оружие, арбалет 1орудие
8убийство2 оружие, арбалет 1орудие1 выстрел 1 оружие, арбалет 1стрельба 5оружие; 10: арбалет
1орудие1 работа1 фигура1 форма, арбалет 1орудие 1пистолет 1милиция 2форма, арбалет
1орудие 1работа 1отличная 1форма, арбалет 1орудие 1работа 1служба 2форма, арбалет
1орудие 2лопата 1солдат 6форма, арбалет 1орудие 4пушка 1солдат 6форма, арбалет
1стрельба 5оружие 1армия 2форма, арбалет 1стрельба 7 пистолет 1милиция 2форма, арбалет
1стрельба 1кровь 3сдать 1форма, арбалет 1стрельба 1огонь 1сердце 1форма; 7: арбалет
1орудие 1работа 2мука 1лук, арбалет 1орудие 4труд 1мука 1лук, арбалет 1орудие 1выстрел
1стрела 7лук, арбалет 1орудие 1пистолет 2―> стрельба 4лук, арбалет 1орудие 4пушка 1
стрельба 4лук, арбалет 1орудие 1топор 1капуста 1лук, арбалет 1стрельба 4лук> 25=0+2+4+19+0
СПОСОБ ИНТЕГРАЦИИ ДАННЫХ
АССОЦИАТИВНОГО ОПРОСА (4)
«ПРОСТРАНСТВЕННО-ВРЕМЕННАЯ СТРУКТУРНОСТЬ»
Предположение об «эргодичности» двух процедур
многократный длительный
опрос
одного респондента

однократный симультанный
опрос
многих респондентов
Основное допущение событийно-статистического моделирования
речемыслительной деятельности
Речемыслительная деятельность субъекта (респондента) и
«типового (усредненного) носителя языка» –
это дискретные стационарные случайные эргодические
семиотические (вербальные) процессы смены в фокусе их «умного
зрения» (центре внимания) мыслей-знаков (вербальных единиц) –
многомерная случайная величина
R(s, t) = [rj(si, tk)], где:
i =1--I — стимулы; j = 1--J, — реакции; k = 1--K, — моменты испытаний.
РЕЧЕМЫСЛИТЕЛЬНАЯ ДЕЯТЕЛЬНОСТЬ
ЧЕЛОВЕКА
Субъект
…
{МЗi-m} …
{МЗi-1}
{МЗi}
tвосприятия
…
{ЯЕi-m} …
{МЗi+1} …
tсоздания
{ЯЕi-1}
{ЯЕi}
{ЯЕi+1} …
…
{МЗi+k}
Время t
{ЯЕi+k}
…
текст
• «Событийность в большом» — квантитативный анализ:
формирование (организация) корпуса текстов, отбор и определение
статистических параметров ЯЕ.
• «Событийность в малом» — это анализ «линеарности» построения и
динамики развития текста и составляющих его ЯЕ.
• «Пространственно-временная структурность» — это представление
текста в виде связанных между собой синтагматическими и
парадигматическими отношениями ЯЕ.
СОПОСТАВЛЕНИЯ
ТЕКСТ — АВС
Текст или его фрагмент

АВС в целом или какая-либо ее часть
ближайшая, удаленная на К шагов
стимульно-реактивная окрестность
элементов пропозиции
ЯЕ текста

(пропозиция предложения)
стимульно-реактивная цепочка длины L
Ряска – это зеленое «одеяло» водоемов.
ЯЕ текста (слово)

<зеленый; одеяло; водоем><ряска> = <зеленый 1 лягушка 7 болото 1 ..., зеленый 1 газ 1
болото 1 ..., зеленый 10 крокодил 3 болото 1 ..., зеленый 1лягушка 2 пруд 1... 4; одеяло 1ночь
1туман 1болото 1..., одеяло 1ночь 1рассвет 1болото 1... 2; водоем 3 лягушка 7 болото 1...,
водоем 1море 1болото 1..., водоем 10 озеро 2 болото 1 ..., водоем 2 река 1болото 1...,
водоем 6 вода 1болото 1..., водоем 3лягушка 2 пруд 1 ..., водоем 2 река 1пруд 1..., водоем
1речка 1пруд 1 ..., водоем 4 рыба 1 пруд 1... 9> 15=0+0+13+2+0
f
Слово-стимул
Слово-реакция
Синтагм. отн.
8
ОПЕРАТОР
ЭВМ
СЛОВОСОЧЕТАНИЕ
4
ОПЕРАТОР
ЯЗЫКА
СЛОВОСОЧЕТАНИЕ
3
ОПЕРАТОР
ПОЛЬЗОВАТЕЛЬ
ВИД-РОД
3
ОПЕРАТОР
ЧЕЛОВЕК
ВИД-РОД
2
ОПЕРАТОР
ПРОГРАММИСТ
1
ОПЕРАТОР
КИНОСТУДИЯ
ЧАСТЬ-ЦЕЛОЕ
1
ОПЕРАТОР
КОМАНДА
СИНОНИМ
СЛОЖНОЕ СЛОВО
Парадигм. отн.
РОД-ВИД
ИНСТРУМЕНТАРИЙ ИССЛЕДОВАНИЯ
Области и практические задачи:
индексирование, реферирование, создание онтологий,
информационный поиск, обучение языку, редактирование,
библиометрия и др.
Основные инструменты
гиперболические распределения — законы Ципфа и Бредфорда:
i(k,r) = рk (r+v)-b, где:
b, k, v – const
r – ранг слова
i(k,r) – частота слова
•
•
•
•
•
Ji = bkJi-1 = bki-1J1, где:
i = 1, 2, ..., k; k = 1, 2, ..., m;
J1 — количество областей в ядре;
bk > 1 — множитель Бредфорда для
разбиения
J названий на k групп.
Методы и технологии:
дистрибутивно-статистический анализ
компонентного анализа
частотно-семантический метод
методы многомерного анализа
кластерный анализ.
ОБОБЩЕННАЯ МОДЕЛЬ ДАННЫХ ДЛЯ АНАЛИЗА
«ПРОСТРАНСТВЕННО-ВРЕМЕННОЙ
СТРУКТУРНОСТИ» ТЕКСТА И АВС
Матрица связности языковых единиц (слов)
или ассоциативная матрица
функции «силы связи» fij = F(ЯЕi, ЯЕj).
Слово
(частота)
...
ЯЕi = а
(fа )
...
...
ЯЕj = b
(fb )
...
fаb
...
...
Download