Анекдоты для анализа

advertisement
Конструируем машину,
создающую
эмоциональные тексты
Артемий Котов
Курчатовский институт
почта: kotov@harpia.ru
твиттер: @timkotov
Курчатовский
институт
Корпус - много текстов или видео

295
университетских
зачётов и
экзаменов (Москва
и Санкт-Петербург)

510 фрагментов
общения с
клиентами в ГУ ИС
одного из районов
Москвы
Мы собираем Русскоязычный
эмоциональный корпус
Корпус может использоваться системами,
автоматически распознающими мимику
Анализ внимания
Технологии
регистрации
движений глаз
(eye-tracking)
 Оценка
внимания и
состояния
пользователя

Метод ландшафтов внимания
Эмоциональные компьютерные агенты
Машина, которая пишет романы и
листовки
Джордж Оруэлл
(1903-1950)
 Роман “1984” (~1948)
 Наша машина должна:




эмоционально отвечать в
диалоге
воздействовать на
человека (создавать
рекламу или листовки)
писать романы!
Машина, поддерживающая диалог



Джозеф Вейценбаум (1923-2008) –
программа Элиза (ELIZA), 1966
Программы-собеседники должны проходить
«Тест Тьюринга».
Loebner Prize – ежегодные соревнования программсобеседников
Агент Макс
(Университет Билефельда, Германия)


собираем самолётик в
виртуальном пространстве
эмоц. взаимодействие с
человеком – видео
Параметрическая модель эмоций
Возбуждение
(arousal)
счастье1
гнев
интерес
отвращение
подавленность
Валентность
(valency)
счастье2
Контент-анализ и Sentiment analysis
(оценка тональности текста)

Можно просто создать словарь:





добрый +1
заболел -0,9
…
Или можно разметить тексты, а потом
попросить компьютер создать словарь. Слова
из негативных рецензий будут иметь -, а слова
из позитивной рецензии +.
«Замечательный сценарий»
«Гениальный замысел»
- это положительная или отрицательная
оценка?
Анализ настроения в блогах:
Sentiment analysis
[Zhang, Kawai, 2009]
«война в Ираке» 5-7 октября 2008
Модель bag-of-words – текст
рассматривается как мешок слов
Трудности:
I love this story - this is a love story
don’t love
 Exploding on the screen in a riot of
movement, music and color.
(взрывается на экране в бунте
движения, музыки и цвета)
 Структура текста игнорируется, поэтому
нельзя делать системы диалога и
системы, создающие новые тексты.
 Нам нужно учитывать структуру текста!

Что такое семантические роли?
(глубинные падежи)
Подъезжая к станции и глядя
на природу в окно, у меня слетела
шляпа.
 Получив пробоину, танк был подожжен.
 Оказав сопротивление, преступник был
убит.

Наши семантические роли

Ag – агенс (активное действующее лицо)
Pat – пациенс (объект, испытывающий на себе
действие)
Exp – экспериенцер (человек,
воспринимающий или оценивающий ситуацию)
Instr – инструмент

.. и ещё несколько типов, которые нам не будут нужны.







ВасяAg разбилP окноPat.
ВасяAg разбилP камнемInstr окноPat.
ВасяAg стукнулP ПетюPat.
РомаExp виделP1, что ВасяAg стукнулP2 ПетюPat.
Клаузы (синтаксис) или
предикации (семантика)
P – предикат (имеет валентности, может
сочетаться с актантами)
Ag, Pat, Exp, Instr – актанты (участники
ситуации)
•
Ag(Вася)
•
Р(разбил)
•
Рat(окно)
•
Instr(камень)
Как манипулировать семантическими
ролями?
Полиция разогнала демонстрантов.
Полиция рассеяла демонстрантов.
Демонстранты были рассеяны полицией.
Демонстранты были рассеяны.
(пассив позволяет снизить агентивность)
Как спрятать агенса?
Действия пикетчиков были хорошо
организованы и скоординированы. … столь
желанных – по крайней мере, для журналистов
и фотографов – картин избитых людей, луж
крови и т.п., конечно, не получилось.
Милиционеры выбирали из толпы людей по
одному и направляли в служебные автобусы.
Партийные и государственные флаги
аккуратно сворачивались, плакаты с агитацией
отбирались. Таким образом, около половины
участников пикета отправились по отделениям
писать объяснительные, другая половина
разошлась по домам.
Игорь Абросимов. Кто культивирует фашизм в
Москве? Дни.ру

Как спрятать агенса?
Действия пикетчиков были хорошо
организованы и скоординированы. … столь
желанных – по крайней мере, для журналистов
и фотографов – картин избитых людей, луж
крови и т.п., конечно, не получилось.
Милиционеры выбирали из толпы людей по
одному и направляли в служебные автобусы.
Партийные и государственные флаги
аккуратно сворачивались, плакаты с агитацией
отбирались. Таким образом, около половины
участников пикета отправились по отделениям
писать объяснительные, другая половина
разошлась по домам.
Игорь Абросимов. Кто культивирует фашизм в
Москве? Дни.ру


Наша система должна распознавать в
тексте предикации
•
Ag
•
Р
•
Рat
•
Instr
… и активизировать эмоции в зависимости
от распознанных структур.
 Она должна использовать эти
предикации, чтобы воздействовать на
слушателя!
Делаем Машину Оруэлла:
Компьютер может состоять из любых элементов
Джон Серл
(John Searle
1932- )
Сирл Д. Разум, мозг и программы // Глаз разума /
Ред Д. Хофштадтер, Д. Деннет. - Самара: Барах-М, 2003. - С. 315-331.
И вот ещё:

Домзад:


Выписываем ответы на высказывание
ЯAg просто пытаюсь понятьP, что такое
лингвистикаPat.
(для каждого сценария)
Завтра:


Занимаемся подменой валентностей!
Делаем заготовки для романов!
Улыбка: знак удовольствия или
смягчения агрессии
•144 улыбки на подкорпусе



…на чужих словах
(n = 707)
…на своих словах
(n = 1435)
Начинает смеяться…
18 (12,5% улыбок)
(2,54% высказываний)
54 (37,5% улыбок)
(3,7% высказываний)
Заканчивает смеяться…
28 (3,9% выск)
45 (3,14% выск)
Улыбка – форма смещённой активности
[Козинцев, 1999, 2002]
Знак игрового поведения, знак подчинения, знак для
снижения агрессии оппонента у обезьян [Haig, 198,
Бутовская, 2004]
Laughter punctuates speech [Provine, 1993]: говорящий
смеятся на 46% чаще, чем слушающий.
Распределение валентностей для
негативных сценариев

Мнимая аг рессия
Конфликт
Ты всю жизнь меня
обманывал! (ОБМАН)
Ты думаешь только о
себе! (СУБЪЕКТ)
адресант
Exp
адресат
Ag
Он должен счит ат ь
себя жерт вой
(Pat / Exp)
3г о лица (Ag)
3- е лицо
пуст ая роль
Мнимая аг рессия
Правительство нас
обманывает! (ОБМАН)
Он думает только
о себе! (СУБЪЕКТ)
адресант
пуст ая роль

Воздействие
адресат
Exp
3- е лицо
Ag
Хвастовство
Я не такой, как все!
Когда настанет
момент, я смогу всех
спасти!
адресант
EXP/ AG
адресат
3- е лицо
(пуст ая роль) (пуст ая роль)
Реклама
Смотри, какая
вкуснятина!
Он сделает тебя
счастливым!
адресант
(пуст ая роль)
адресат
EXP
Pat / Inst r
Комплимент
Ты потрясающе
выглядишь!
Ты такой умный!
Ты так меня понимаешь!
адресант
адресат
EXP
3- е лицо
(пуст ая роль)
Как строить речь?

Текущая ситуация
(всё плохо фрустрация)

Будущая ситуация
(всё хорошо)
Как строит сюжеты?
Владимир Яковлевич
Пропп (1895-1970)
 Морфология сказки
(1928)
 Морфология волшебной
сказки


[автомобиль] # Он здесь, чтобы взять свое. #
Он вышел из самого сердца джунглей, чтобы
стать хозяином этого города. Он – воплощение
царящего здесь закона: сильнейший получает
все. # [автомобиль]. В стремительный чертах
его мощного корпуса – сила и грация дикого
зверя. Двигатель 4,2 л мощностью 350 л. с. –
основа его превосходства, а благодаря
легендарному приводу [т. м.] и
многоуровневой пневмоподвеске этот хищник
мягко и уверенно движется по любой дороге. #
Его час настал. Он пришел, чтобы взять свое.
(реклама автомобилей; печатный журнал)
Домзад:

Написать самый необычный сюжет для
романа!



Выбрать 3-5 сценариев
Нарисовать схемы сценариев, связать
валентности (установить кореферентность)
Текстом на ½ страницы описать события
романа, обозначить героев.
Что читать?








Солсо, Р. Когнитивная психология.
Сирл Д. Разум, мозг и программы // Глаз разума /
Ред Д. Хофштадтер, Д. Деннет. - Самара: Барах-М,
2003. - С. 315-331.
Пропп В. Я. Морфология волшебной сказки.
Психология мышления: хрестоматия / под ред. Ю. Б.
Гиппенрейтер, В. Ф. Спиридонова и М. В. Фаликман. –
МГУ, АСТ : Астрель , 2008.
Когнитивная психология: история и современность /
сост. М. Фаликман, В. Спиридонов.- Москва:
Ломоносовъ, 2011.
Горизонты когнитивной психологии: Хрестоматия / Под
ред. В. Ф.Спиридонова и М. В. Фаликман. - М.: Языки
славянских культур, РГГУ, 2012.
twitter: @timkotov или facebook.com/timkotov
Мне можно писать: kotov@harpia.ru
Download