Конструируем машину, создающую эмоциональные тексты Артемий Котов Курчатовский институт почта: [email protected] твиттер: @timkotov Курчатовский институт Корпус - много текстов или видео 295 университетских зачётов и экзаменов (Москва и Санкт-Петербург) 510 фрагментов общения с клиентами в ГУ ИС одного из районов Москвы Мы собираем Русскоязычный эмоциональный корпус Корпус может использоваться системами, автоматически распознающими мимику Анализ внимания Технологии регистрации движений глаз (eye-tracking) Оценка внимания и состояния пользователя Метод ландшафтов внимания Эмоциональные компьютерные агенты Машина, которая пишет романы и листовки Джордж Оруэлл (1903-1950) Роман “1984” (~1948) Наша машина должна: эмоционально отвечать в диалоге воздействовать на человека (создавать рекламу или листовки) писать романы! Машина, поддерживающая диалог Джозеф Вейценбаум (1923-2008) – программа Элиза (ELIZA), 1966 Программы-собеседники должны проходить «Тест Тьюринга». Loebner Prize – ежегодные соревнования программсобеседников Агент Макс (Университет Билефельда, Германия) собираем самолётик в виртуальном пространстве эмоц. взаимодействие с человеком – видео Параметрическая модель эмоций Возбуждение (arousal) счастье1 гнев интерес отвращение подавленность Валентность (valency) счастье2 Контент-анализ и Sentiment analysis (оценка тональности текста) Можно просто создать словарь: добрый +1 заболел -0,9 … Или можно разметить тексты, а потом попросить компьютер создать словарь. Слова из негативных рецензий будут иметь -, а слова из позитивной рецензии +. «Замечательный сценарий» «Гениальный замысел» - это положительная или отрицательная оценка? Анализ настроения в блогах: Sentiment analysis [Zhang, Kawai, 2009] «война в Ираке» 5-7 октября 2008 Модель bag-of-words – текст рассматривается как мешок слов Трудности: I love this story - this is a love story don’t love Exploding on the screen in a riot of movement, music and color. (взрывается на экране в бунте движения, музыки и цвета) Структура текста игнорируется, поэтому нельзя делать системы диалога и системы, создающие новые тексты. Нам нужно учитывать структуру текста! Что такое семантические роли? (глубинные падежи) Подъезжая к станции и глядя на природу в окно, у меня слетела шляпа. Получив пробоину, танк был подожжен. Оказав сопротивление, преступник был убит. Наши семантические роли Ag – агенс (активное действующее лицо) Pat – пациенс (объект, испытывающий на себе действие) Exp – экспериенцер (человек, воспринимающий или оценивающий ситуацию) Instr – инструмент .. и ещё несколько типов, которые нам не будут нужны. ВасяAg разбилP окноPat. ВасяAg разбилP камнемInstr окноPat. ВасяAg стукнулP ПетюPat. РомаExp виделP1, что ВасяAg стукнулP2 ПетюPat. Клаузы (синтаксис) или предикации (семантика) P – предикат (имеет валентности, может сочетаться с актантами) Ag, Pat, Exp, Instr – актанты (участники ситуации) • Ag(Вася) • Р(разбил) • Рat(окно) • Instr(камень) Как манипулировать семантическими ролями? Полиция разогнала демонстрантов. Полиция рассеяла демонстрантов. Демонстранты были рассеяны полицией. Демонстранты были рассеяны. (пассив позволяет снизить агентивность) Как спрятать агенса? Действия пикетчиков были хорошо организованы и скоординированы. … столь желанных – по крайней мере, для журналистов и фотографов – картин избитых людей, луж крови и т.п., конечно, не получилось. Милиционеры выбирали из толпы людей по одному и направляли в служебные автобусы. Партийные и государственные флаги аккуратно сворачивались, плакаты с агитацией отбирались. Таким образом, около половины участников пикета отправились по отделениям писать объяснительные, другая половина разошлась по домам. Игорь Абросимов. Кто культивирует фашизм в Москве? Дни.ру Как спрятать агенса? Действия пикетчиков были хорошо организованы и скоординированы. … столь желанных – по крайней мере, для журналистов и фотографов – картин избитых людей, луж крови и т.п., конечно, не получилось. Милиционеры выбирали из толпы людей по одному и направляли в служебные автобусы. Партийные и государственные флаги аккуратно сворачивались, плакаты с агитацией отбирались. Таким образом, около половины участников пикета отправились по отделениям писать объяснительные, другая половина разошлась по домам. Игорь Абросимов. Кто культивирует фашизм в Москве? Дни.ру Наша система должна распознавать в тексте предикации • Ag • Р • Рat • Instr … и активизировать эмоции в зависимости от распознанных структур. Она должна использовать эти предикации, чтобы воздействовать на слушателя! Делаем Машину Оруэлла: Компьютер может состоять из любых элементов Джон Серл (John Searle 1932- ) Сирл Д. Разум, мозг и программы // Глаз разума / Ред Д. Хофштадтер, Д. Деннет. - Самара: Барах-М, 2003. - С. 315-331. И вот ещё: Домзад: Выписываем ответы на высказывание ЯAg просто пытаюсь понятьP, что такое лингвистикаPat. (для каждого сценария) Завтра: Занимаемся подменой валентностей! Делаем заготовки для романов! Улыбка: знак удовольствия или смягчения агрессии •144 улыбки на подкорпусе …на чужих словах (n = 707) …на своих словах (n = 1435) Начинает смеяться… 18 (12,5% улыбок) (2,54% высказываний) 54 (37,5% улыбок) (3,7% высказываний) Заканчивает смеяться… 28 (3,9% выск) 45 (3,14% выск) Улыбка – форма смещённой активности [Козинцев, 1999, 2002] Знак игрового поведения, знак подчинения, знак для снижения агрессии оппонента у обезьян [Haig, 198, Бутовская, 2004] Laughter punctuates speech [Provine, 1993]: говорящий смеятся на 46% чаще, чем слушающий. Распределение валентностей для негативных сценариев Мнимая аг рессия Конфликт Ты всю жизнь меня обманывал! (ОБМАН) Ты думаешь только о себе! (СУБЪЕКТ) адресант Exp адресат Ag Он должен счит ат ь себя жерт вой (Pat / Exp) 3г о лица (Ag) 3- е лицо пуст ая роль Мнимая аг рессия Правительство нас обманывает! (ОБМАН) Он думает только о себе! (СУБЪЕКТ) адресант пуст ая роль Воздействие адресат Exp 3- е лицо Ag Хвастовство Я не такой, как все! Когда настанет момент, я смогу всех спасти! адресант EXP/ AG адресат 3- е лицо (пуст ая роль) (пуст ая роль) Реклама Смотри, какая вкуснятина! Он сделает тебя счастливым! адресант (пуст ая роль) адресат EXP Pat / Inst r Комплимент Ты потрясающе выглядишь! Ты такой умный! Ты так меня понимаешь! адресант адресат EXP 3- е лицо (пуст ая роль) Как строить речь? Текущая ситуация (всё плохо фрустрация) Будущая ситуация (всё хорошо) Как строит сюжеты? Владимир Яковлевич Пропп (1895-1970) Морфология сказки (1928) Морфология волшебной сказки [автомобиль] # Он здесь, чтобы взять свое. # Он вышел из самого сердца джунглей, чтобы стать хозяином этого города. Он – воплощение царящего здесь закона: сильнейший получает все. # [автомобиль]. В стремительный чертах его мощного корпуса – сила и грация дикого зверя. Двигатель 4,2 л мощностью 350 л. с. – основа его превосходства, а благодаря легендарному приводу [т. м.] и многоуровневой пневмоподвеске этот хищник мягко и уверенно движется по любой дороге. # Его час настал. Он пришел, чтобы взять свое. (реклама автомобилей; печатный журнал) Домзад: Написать самый необычный сюжет для романа! Выбрать 3-5 сценариев Нарисовать схемы сценариев, связать валентности (установить кореферентность) Текстом на ½ страницы описать события романа, обозначить героев. Что читать? Солсо, Р. Когнитивная психология. Сирл Д. Разум, мозг и программы // Глаз разума / Ред Д. Хофштадтер, Д. Деннет. - Самара: Барах-М, 2003. - С. 315-331. Пропп В. Я. Морфология волшебной сказки. Психология мышления: хрестоматия / под ред. Ю. Б. Гиппенрейтер, В. Ф. Спиридонова и М. В. Фаликман. – МГУ, АСТ : Астрель , 2008. Когнитивная психология: история и современность / сост. М. Фаликман, В. Спиридонов.- Москва: Ломоносовъ, 2011. Горизонты когнитивной психологии: Хрестоматия / Под ред. В. Ф.Спиридонова и М. В. Фаликман. - М.: Языки славянских культур, РГГУ, 2012. twitter: @timkotov или facebook.com/timkotov Мне можно писать: [email protected]