На правах рукописи Михеенкова Мария Анатольевна Принципы и логические средства интеллектуального анализа социологических данных Специальность 05.13.17 Теоретические основы информатики АВТОРЕФЕРАТ диссертации на соискание учѐной степени доктора технических наук МОСКВА 2011 Работа выполнена во Всероссийском институте научной и технической информации РАН (ВИНИТИ РАН) Научный консультант: доктор технических наук, профессор, Заслуженный деятель науки РФ Финн Виктор Константинович Официальные оппоненты: доктор технических наук, профессор Вагин Вадим Николаевич доктор физико-математических наук, профессор Грушо Александр Александрович доктор технических наук, профессор Гаврилова Татьяна Арнольдовна Ведущая организация: Институт проблем управления им. В.А. Трапезникова РАН Защита диссертации состоится 28 марта 2012 г. в 1100 часов на заседании диссертационного совета Д 002.026.01 при Всероссийском институте научной и технической информации РАН (ВИНИТИ РАН) по адресу: 125190, Москва, ул. Усиевича, д. 20, комн. 502. Тел. совета (499) 155-46-21. С диссертацией можно ознакомиться в библиотеке ВИНИТИ РАН. Автореферат разослан ______________________ 2012 г. Учѐный секретарь диссертационного совета Д 002.026.01 доктор технических наук, профессор Цветкова Валентина Алексеевна 2 Общая характеристика работы Актуальность темы диссертации Интеллектуальный анализ данных является одним из приоритетных направлений исследований в области искусственного интеллекта. Его возможности в области представления данных и знаний, создания методов обнаружения новых знаний и извлечения закономерностей особенно востребованы в областях с обширными массивами исходных фактов, нуждающихся в структурировании, упорядочении и систематизации. Широкое распространение качественных методов анализа социологических данных в сочетании с отсутствием развитых инструментов преобразования плохо структурированных данных в знания свидетельствуют о назревшей потребности интеллектуализации исследовательских эвристик, принятых в этой области, с последующей реализацией в современных компьютерных системах. Развитие социологии как эмпирической науки неотделимо от перманентных дискуссий о соотношении теоретического, концептуального подхода к изучению социальных явлений и феноменологической составляющей этого процесса. Стремление придать социальным исследованиям по возможности объективный характер и исходное представление об общности естественнонаучного и социально-исторического познания отразилось в намерении исследователей использовать методы, обладающие достаточно развитым формальным аппаратом и принятые в естественных науках. Массовый характер многих социальных явлений и очевидные трудности учѐта множества влияющих на них факторов привели к тотальному доминированию количественных и, прежде всего, статистических методов изучения социальной действительности. Однако представление о единстве теоретико-методологических моделей естествознания и социальных наук и соответствующее ему отношение к субъекту поведения как обезличенной типической модели трудно совместимо с интересом к изучению взаимодействия мотивированных, целенаправленно действующих, учитывающих важные для них факторы индивидуумов. Отсюда естественно возникает восприятие социологии как науки, «…стремящейся, истолковывая, понять социальное действие и тем самым каузально объяснить его процесс и воздействие»1, а социального действия – как осмысленного, соотносящегося с действием других людей и ориентирующегося на него. Стремление к развитию «понимающей» социологии (не просто воспринимающей и описывающей непосредственно эмпирические явления, но и объясняющей смысловые связи в этих явлениях), анализу форм человеческих взаимодействий, не являющихся простым проявлением воздействия социальной структуры, привело к развитию качественных – в противоположность количественным – методов, концентрирующихся на 1 М Вебер. Избранное: протестантская этика и дух капитализма. М.: РОССПЭН, 2006, с. 453. 3 социальных взаимодействиях, личностном повседневном опыте действующего субъекта. Фундаментальной слабостью качественного анализа, рассматриваемого широко как исследование, не использующее формальных средств, оказалась прямая зависимость от способностей, здравого смысла и воображения исследователя, а порождаемые эмпирические теории заслужили статус уникальных и невоспроизводимых. С развитием компьютерной техники объективизация качественных исследований первоначально пошла по пути усовершенствования обработки, структурирования и управления данными, и здесь возможности современной генерации пакетов CАQDAS2 (Computer-Assisted Qualitative Data Analysis Software) выглядят достаточно впечатляющими. Вызванный этим сдвиг стандартов в качественном анализе в сторону строгости заставил социологов обратиться к специалистам в области искусственного интеллекта (ИИ) с призывом к развитию средств, формализующих аналитические индуктивные стратегии создания теорий и связанные с этим когнитивные процессы абдукции. С точки зрения эпистемологического содержания качественный анализ видится как «восходящая» стратегия «доказательного и последовательного» построения теории на основе эмпирических фактов. Таким образом, речь идѐт о получении нового знания из эмпирического материала. Формализация этой стратегии – формализованный качественный анализ социологических данных (ФКАСД) – предполагает создание инструмента для анализа нечисловых отношений и установление причин эффектов на основе этого анализа. Использование методов искусственного интеллекта (ИИ) в этом процессе позволяет говорить об интеллектуальном анализе социологических данных (ИАСД, knowledge discovery в социологии). Целью диссертационной работы является создание логических средств для формализованного качественного анализа социологических данных с использованием методов искусственного интеллекта, а также разработка понятийного и логического аппарата для поддержки социологических исследований. Это означает, в частности, формализацию эвристик качественного анализа социологических данных для решения задач когнитивной социологии –направления в современной социологии, использующего когнитивные средства анализа данных, – и их реализацию средствами современных компьютерных интеллектуальных систем. Вдохновляющим основанием для такой постановки является фундаментальный тезис об основной задаче интеллектуальных систем (ИС) как задаче конструктивной имитации (возможно, лишь до некоторой степени) познавательных способностей человека3. Реализация таких способностей в ИС предполагает наличие средств извлечения знаний из баз 2 Lewins A., Silver C. Using Software in Qualitative Research: A Step by Step Guide. London: Sage Publications, 2007. 3 См. Финн В.К. К структурной когнитологии: феноменология сознания с точки зрения искусственного интеллекта // Вопросы философии, 2009, № 1, с. 4 – 20. 4 фактов (БФ), автоматического порождения гипотез и объяснения имеющихся фактов на основании порожденных гипотез, а также способность осуществлять дедуктивный вывод из исходных и полученных знаний (баз знаний, БЗ). Таким образом, интеллектуальный анализ социологических данных (ИАСД) – автоматическое извлечение интерпретируемых зависимостей, неявно содержащихся в массивах эмпирических данных, между различными факторами – позволяет говорить о возможности построения теории на основе эмпирических фактов средствами формализованных познавательных процедур в компьютерных системах высокого уровня. Такой анализ требует более высокого, чем это принято в качественном анализе, уровня формализации изучаемых психосоциальных явлений и нуждается в первичном структурировании данных и знаний и формировании системы отношений для них. Следующим шагом оказывается выбор адекватных предложенному представлению формальных средств анализа. В совокупности это означает создание формального языка с дескриптивной и аргументативной функциями – для представления данных и знаний (с возможностью определения их сходства) и формализации рассуждений (и выдвижения гипотез), соответственно. Для реализации этих целей в диссертации решены следующие задачи: – первичная структуризация данных и знаний о социальном субъекте и его поведении (действиях, поведенческих установках, мнениях); – разработка логических и понятийных средств для формализации правдоподобных рассуждений в базах эмпирических социологических фактов с нечисловыми параметрами; – логическая формализация принципа ситуационного детерминизма, позволяющего включать контекст поведения в структуру анализа; – задание формальной структуры закрытых опросов – теоретической основы для представления предсказательных опросов; – формулирование логических принципов анализа рациональности мнений; – создание архитектуры интеллектуальной системы типа ДСМ для формализованного качественного анализа социологических данных, включающей средства распознавания рациональности мнений. Методы исследования В работе используются методы математической логики и интеллектуального анализа данных – ДСМ-метод автоматического порождения гипотез, прежде всего. Для создания архитектуры Интеллектуальных систем для качественного анализа социологических данных используются методологические принципы конструирования интеллектуальных систем типа ДСМ (ИС-ДСМ). При этом практические исследования требуют препроцессинга данных для настройки на класс решаемых задач, осуществляемого в рамках инженерии знаний в диалоге ИС и эксперта-социолога. Для подготовки эмпирических социологических 5 данных используются различные качественные методологии, а также традиционное анкетирование. Научная новизна работы состоит в формализации исследовательских эвристик социолога современными логическими средствами, позволяющими осуществлять каузальный анализ социального действия, решая, тем самым, задачи классической «понимающей социологии». Основным инструментом такого анализа является ДСМ-метод автоматического порождения гипотез, являющийся синтезом познавательных процедур4 – эмпирической индукции (формальных расширений и уточнений индуктивных методов Д.С. Милля), структурной аналогии и абдукции (принятия гипотез на основе объяснения исходных данных) Ч.С. Пирса. Источником детерминаций поведения при этом является сходство субъектов поведения, что требует разработки принципов представления знаний о субъекте поведения и самом поведении. Формализация и уточнение указанных процедур для использования их при анализе эмпирических социологических данных является пионерской и не имеет прецедентов в современной практике – как социологической, так и в области исследований Искусственный интеллект. Заметим, что неформальное использование методов Д.С. Милля составляет многолетний тренд в качественном анализе социологических данных. При этом очевидной подразумевается невозможность их формализации, а даже минимальное использование логических средств (булевой алгебры) в таком анализе воспринимается как «революция»5. Расширение класса социологических задач – рассмотрение такой специфической формы поведения как мнение – потребовало адекватного расширения языка представления данных о мнениях индивидуумов и создания процедур для рассуждения «от причины – к следствию» (от сходства мнений – к сходству индивидуумов) – обратного ДСМ-метода. Включение ситуационных параметров реализации поведения (контекста поведения) также потребовало создания новых формальных средств их адекватного представления и учѐта – ситуационной версии ДСМ-метода. Существенным расширением имеющихся логических средств является реализация познавательной активности «анализ данных – предсказание – объяснение» в форме эвристики «алгебра логики – аналогия – абдукция» с использованием булевой алгебры для порождения гипотез о причинных зависимостях. При этом предлагаемые средства значительно превосходят по своим познавательным возможностям известный в мировой социологический практике инструмент качественного анализа данных – Качественный Сравнительный Анализ (Qualitative Comparative Analysis6, QCA) американского социолога Ч. Рейджина, где используется лишь одна 4 Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ, Сер.2, 1999, № 1-2, с. 8 – 45. Vaisey S. QCA 3.0: The “Ragin Revolution” Continues // Contemporary Sociology: A Journal of Reviews, 2009, vol. 38, No 4, p. 308 – 312. 6 Rihoux B., Ragin C.C. (eds). Configurational Comparative Methods. Qualitative Comparative Analysis (QCA) and related techniques (Applied Social Research Methods). Thousand Oaks. CA and London: SAGE Publications, Inc. 2009. 5 6 составляющая предлагаемой схемы: анализ сходства примеров социальных явлений средствами алгебры логики. Другим новым направлением является точное определение закрытых опросов посредством задания формальной структуры. Предлагаемая теоретическая концепция предусматривает использование средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов. В рамках этой структуры создаются логические и процедурные средства распознавания и предсказания рациональности результатов опроса, понимаемой как выбор вариантов ответов на основе аргументационной схемы. Использование средств формальной аргументации для автоматического формирования мнений меняет традиционную опросную схему и позволяет объективизировать социологические данные, являющиеся исходными для формализованных процедур рассуждений. Интеллектуальный анализ данных осуществляется, таким образом, для целого класса закрытых опросов со стабилизированным множеством ответов (при расширении множества респондентов новые варианты ответов не появляются) и формализацией когнитивных рассуждений. Развитые теоретические принципы и логический аппарат формализации закрытых опросов позволяют охарактеризовать идеальный тип опроса, выражающий концептуализацию технологии анализа и прогнозирования мнений. Идеальный тип составляет каркас новой технологии социологического опроса – с использованием аргументационной семантики и логической структуры опроса, – допускающий реальные технологические приближения. Наконец, формализация качественного анализа средствами ИИ, т. е. интеллектуальный анализ социологических данных, может рассматриваться как новый когнитивный инструмент – формализованная оболочка для решения проблем когнитивной социологии, – который реализуется в современных интеллектуальных системах (ИС типа ДСМ). Теоретическая и практическая значимость работы Теоретическая значимость работы состоит в разработке средств представления и объективизации фактов (результатов эмпирических наблюдений) и знаний (результатов применения когнитивных процедур) о социальном поведении и мнении, создании концептуального и логического аппарата формализованного качественного анализа социологических данных, использующего правдоподобные (нестатистические) рассуждения – ДСМметод автоматического порождения гипотез. Формальный аппарат может служить не только логическим средством анализа эмпирических социологических данных о поведении социальных субъектов (как индивидов, так и социальных общностей), но и даѐт возможность приближения к логической реконструкции идей классической «понимающей» социологии, в частности построения формальной теории каузального объяснения социального поведения. Разработка теоретических принципов и логического аппарата для формализации закрытых опросов, анализа мнений и логических 7 средств распознавания рациональности мнений, включающих средства формальной аргументации, также имеет несомненную ценность для развития объективных подходов в субъективной области социальных исследований. Практическая ценность работы заключается в разработке научных основ технологии интеллектуального анализа социологических данных, в частности технологии социологического опроса и нестатистического изучения мнений. Для реализации технологий такого рода предусмотрена специальная архитектура Интеллектуальной системы типа ДСМ, включающей как средства предварительной обработки эмпирических социологических данных, так и специфические процедуры для их анализа. Система дополняется инструментами анализа рациональности мнений на основе аргументационной семантики и ДСМ-рассуждений. Предложенные подходы могут быть использованы для анализа и предсказания результатов реальных опросов. Достоверность и обоснованность результатов определяется использованием комплекса методов математической логики и интеллектуального анализа данных – ДСМ-метода автоматического порождения гипотез, прежде всего. Подтверждением этого являются практические исследования – изучение поведения рабочих на конфликтных предприятиях (совместно с Институтом социологии РАН), а также анализ электоральных предпочтений и рациональности электорального выбора студентов (совместно с РГГУ). Основные результаты и положения, выносимые на защиту: – разработка средств представления и объективизации фактов и знаний о социальном поведении и мнении для решения задач социологии и социальной психологии; – создание концептуального и логического аппарата формализованного качественного анализа мнений; – формальное представление синтеза познавательных процедур, использующих алгебру логики для порождения гипотез о причинных зависимостях; – создание новых логических средств для порождения детерминаций с учѐтом контекста социального поведения – ситуационного ДСМ-метода; – задание формальной структуры закрытых m-значных (m2) опросов и предсказательных опросов; – создание логических и процедурных средств распознавания и предсказания рациональности результатов опроса; – предложение новой технологии опроса (с учѐтом некоммутативности различных видов опросов) с использованием средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов; – создание архитектуры новых когнитивных инструментов – ИС-ДСМ для формализованного качественного анализа социологических данных, 8 формализованной оболочки для решения проблем когнитивной социологии (с предварительной содержательной работой социолога). Личный вклад автора диссертации в совместных работах с другими авторами был существенным, а во многих случаях и решающим. Автору диссертации принадлежит разработка принципов представления знаний о социальном субъекте и его поведении, формулировка основных процедур анализа данных – обратного ДСМ-метода и ДСМ-метода с параметром ситуации, а также формализация синтеза познавательных процедур с использованием алгебры логики. Автор самостоятельно проводил экспериментальные исследования (разумеется, в кооперации с экспертамисоциологами для предоставления эмпирического материала) поведения и анализа электоральных мнений. В последнем, в частности, вычислялись предложенные автором критерии рациональности мнений. Автором развиты предложения по внедрению средств логики аргументации в опросные технологии для объективного формирования мнений. Формирование концепции формализованного качественного анализа социологических данных и его применения к задачам когнитивной социологии также принадлежит автору. То же от носится к разработке принципов архитектуры обучающей интеллектуальной системы для анализа социологических данных, а также принципов создания информационной среды и интеллектуального интерфейса для ИС-ДСМ, реализующей ФКАСД. Реализация этих принципов осуществлена в ИС, созданных по руководством автора диссертации. Апробация работы Основные положения и результаты работы докладывались и обсуждались на всероссийских и международных конференциях, конгрессах, чтениях: 1. 4-я международная конференция «Интеграция. Информационные технологии. Телекоммуникации. НТИ-99», Москва, Март 17-19, 1999. 2. VII Национальная конференция с международным участием «Искусственный интеллект-2000», Переславль-Залесский, Октябрь 2426, 2000. 3. VIII Национальная конференция с международным участием «Искусственный интеллект-2002», Коломна, Октябрь 8-11, 2002. 4. 6-я Международная конференция «НТИ-2002»: «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 16 – 18 октября, 2002. 5. Сорокинские чтения-2002, «Актуальные проблемы социологической науки и социальной практики», Москва, Декабрь 17-18, 2002. 6. II Всероссийский социологический конгресс «Российское общество и социология в XXI веке: социальные вызовы и альтернативы», Москва, 30 сентября – 2 октября, 2003. 9 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. Международная конференция «Математическое моделирование социальной и экономической динамики (MMSED-2004)», Москва, 23 – 25 июня, 2004. IX Национальная конференция с международным участием «Искусственный интеллект-2004», Тверь, Сентябрь 8-11, 2004. I Всероссийская научная конференция Сорокинские чтения-2004: "Российское общество и вызовы глобализации», Москва, 7-8 декабря 2004. Всероссийская междисциплинарная конференция «Философия искусственного интеллекта», Москва, 17-19 января, 2005. Первая международная конференция «Системный анализ и информационные технологии» САИТ-2005, Переславль-Залесский, 12-16 сентября 2005 г. X Национальная конференция с международным участием «Искусственный интеллект-2006», Обнинск, Сентябрь 26-28, 2006. III Всероссийский социологический конгресс «Глобализация и социальные изменения в современной России», Москва, 3 – 5 октября, 2006 г. Вторая международная конференция «Системный анализ и информационные технологии» САИТ-2007, Обнинск, 10 – 14 сентября 2007 г. 7-ая международная конференция НТИ-2007 «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 24–26 октября 2007 г., Москва, ВИНИТИ. III Всероссийская научная конференция Сорокинские чтения: "Социальные процессы в современной России: традиции и инновации» в 5 томах, Москва, 4-5 декабря 2007. XI Национальная конференция с международным участием «Искусственный интеллект-2008», Дубна, 29 сентября – 2 октября 2008 г. III Всероссийский социологический конгресс «Социология и общество: проблемы и пути взаимодействия», Москва, 21 – 24 октября 2008 г. Международная научная конференция – Первые Санкт-Петербургские социологические чтения «Питирим Александрович Сорокин и современные проблемы социологии», С.-Пб., 16 – 17 апреля 2009 г. Третья международная конференция «Системный анализ и информационные технологии» САИТ-2009, Звенигород, 14 – 18 сентября 2009 г. Гуманитарные чтения РГГУ-2010, Москва, 26 марта – 2 апреля 2010 г. Четвертая международная конференция по когнитивной науке, Томск, 22 – 26 июня 2010 г. XII Национальная конференция с международным участием «Искусственный интеллект-2010», Тверь, 20 – 24 Сентября 2010 г. Российско-британская конференция «Идеи Д.С. Милля об индукции и логике наук о человеке и обществе в когнитивных исследованиях и 10 системах искусственного интеллекта», Москва, РГГУ, 15 – 17 июня 2011 г. 25. V Поспеловские чтения «Искусственный интеллект: проблемы и перспективы», Москва, Политехнический музей, 29 – 30 ноября 2011 г. Под руководством автора диссертации и по тематике исследования аспиранткой ВИНИТИ РАН Ж.И. Бурковской была защищена диссертация по специальности 05.25.05 – информационные системы и процессы – по теме «Создание информационной среды для Интеллектуальной системы анализа социологических данных». Содержание работы включено в лекционные курсы, читаемые автором в Отделении интеллектуальных систем Института лингвистики РГГУ и на факультете Социологии НИУ-ВШЭ. Публикации Содержание диссертации опубликовано в статьях в ведущих отечественных и зарубежных журналах, а также в материалах перечисленных выше конференций, конгрессов, чтений (всего 43 печатные работы, из них – 13 опубликованы в журналах, входящих в Перечень ВАК). Опубликованные по теме диссертации работы полностью отражают ее содержание. В конце автореферата приведены: список работ, опубликованных в рецензируемых журналах, входящих в Перечень ВАК, список работ, опубликованных в других изданиях, а также работ, опубликованных в материалах конференций. Структура и объем работы. Диссертация состоит из Введения, 6 глав, Заключения и списка цитированной литературы. Объем диссертации составляет 212 страниц, 3 рисунка, 5 таблиц. Список цитированной литературы включает 171 наименование. Содержание работы Во Введении дан краткий обзор актуальных проблем формализации анализа качественных (неколичественных) данных в социологии, показана научная новизна и практическая значимость полученных результатов, представлено краткое содержание и основные результаты работы. В Первой главе рассматривается процесс развития подходов к качественному анализу социологических данных – от качественного анализа как такового до использования компьютерных инструментов. Эволюция последних означает переход от простой компьютерной обработки данных к современному интеллектуальному анализу данных. В главе представлен обзор современных средств компьютерной поддержки качественных исследований – CАQDAS. Если суммировать возможности последней генерации пакетов CАQDAS, можно утверждать, что главные достижения этих инструментов лежат в области обработки, структурирования и управления данными (текстами, графическими 11 объектами, аудио-, видео-), но никак не в области анализа – извлечения нового знания из имеющихся данных. Компьютер не обеспечивает даже простого выигрыша во времени: для более тщательной подготовки и ввода данных его требуется достаточно много. Что бесспорно – компьютер позволяет выполнить обработку данных более тщательным и систематическим образом, делает еѐ результаты прозрачными и, соответственно, объясняемыми, позволяет обрабатывать большие объѐмы информации, хотя иногда при этом возникает опасность оказаться погребенными под этими массивами. К сожалению, нельзя считать, что в общем случае компьютерный анализ даѐт более надѐжные, достоверные и объективные результаты – многое здесь по-прежнему зависит от самого исследователя. Следует сказать, что большинство инструментов CАQDAS создавалось под влиянием парадигмы одной из наиболее развитых и авторитетных методологий качественного анализа – «обоснованной теории» (grounded theory)7. Эта методология предполагает построение теории на основе эмпирических фактов с использованием индуктивного анализа и ориентируется, прежде всего, на анализ свидетельств информантов, не сосредотачиваясь на фиксации процедур рассуждений. Использование компьютера способствует реабилитации качественного анализа в глазах «жѐстких» позитивистов и более широкому его распространению, в особенности там, где слабости количественного подхода очевидны. Но CАQDAS не заменяет аналитика, а лишь усиливает возможности исследователя по кодированию текстов и упорядочиванию данных. Разумеется, эффективное усиление возможно лишь там, где выбор пакета соотносится, прежде всего, с природой задачи и потребностями исследования. К сожалению, часто при работе с CАQDAS эксплуатируется лишь возможность управления данными, а более продвинутые опции остаются невостребованными. На распространении этих инструментов сказываются даже более банальные факторы: наличие пакета в распоряжении коллектива, интерес руководства к их приобретению, готовность компьютерных центров исследовательской организации осваивать и поддерживать их. Обучение работе часто происходит в процессе самой работы, а информация о пакетах распространяется их поклонниками. Это даже заставляет порой апологетов CАQDAS сетовать: «Компьютеризация социальных наук началась и закончилась статистическими пакетами»8. С момента появления «Системы логики» английского философа и логика Д.С. Милля9 теоретическую социологическую мысль прельщала возможность использования индуктивных правил для анализа социологических данных, хотя и сам Д.С. Милль, и Э. Дюркгейм, и др. 7 Glaser B., Strauss A. The Discovery of Grounded Theory: Strategies for Qualitative Research. Chicago, New York: Aldine de Gruyter. 1967. 8 Fielding N. G. Automating the ineffable: Qualitative software and the meaning of qualitative research // In: Tim May (ed.). Qualitative research in action. Sage Publication Inc. London. 2003 (403 p.). p. 169. 9 Последнее издание на русском языке: Милль Д.С. Система логики силлогистической и индуктивной. М.: ЛЕНАНД, 2011. 12 отмечали ограниченность их возможностей в этой области. Современные исследователи готовы числить методы Милля инструментальным воплощением приѐмов экспериментальной социологии, но в неформальном виде – ввиду отсутствия в их распоряжении формализаций этих методов. Для реализации этих устремлений, для решения проблем качественной социологии в качестве инструмента современного интеллектуального анализа социологических данных предлагается ДСМ-метод автоматического порождения гипотез, реализующий формализованный качественный анализ социологических данных – формальный анализ нечисловых отношений. Глава 2 посвящена построению формальных оснований для поиска закономерностей социального поведения. Предлагаются подходы к решению проблемы логической систематизации социологических знаний, т.е. выделения исходных отношений и установления зависимостей между ними, разрабатывается логический язык для представления данных и знаний о субъекте и поведении, а также формализации рассуждений о фактах социальной действительности. Описываются формальные средства ДСМметода автоматического порождения гипотез, предназначенных для автоматического извлечения интерпретируемых зависимостей из имеющегося эмпирического материала. ДСМ-метод представляет собой специальный класс рассуждений (ДСМ-рассуждения), реализующий синтез познавательных процедур – эмпирической индукции (формальных расширений и уточнений индуктивных методов Д.С. Милля, в честь которого и назван метод), структурной аналогии (переносе гипотез о причинах на случаи с неопределенным исходом) и абдуктивного рассуждения Ч.С. Пирса как средства принятия гипотез на основе объяснения начальных данных. Рассматривается два класса задач: анализ социального поведения, реализующий рассуждение типа «от причины – к следствию» – прямой ДСМметод, – и анализ мнений, где реализуется тип рассуждений «от следствия – к причине», обратный ДСМ-метод. Соответственно, описываются предикаты и правила правдоподобного вывода (п.п.в.) для прямого и обратного методов. Фундаментальным принципом качественного анализа данных является принцип «сходство фактов влечет наличие (отсутствие) изучаемого эффекта и его повторяемость». Конкретизируя его для реализации идеи причинности, можно сказать, что в рамках качественного анализа исследуется тип каузальности «структура – эффект» (а не «явление – явление»). Гипотетические причины представляются в виде сходств фактов, имеющих определенную структуру, т.е. «сходство» в этой схеме является нестатистическим и может анализироваться посредством логикоалгебраического подхода (QCA) и средств интеллектуального анализа данных, включающих формализацию индуктивных процедура (ДСМ-метод АПГ). Подчеркнем, что порождение причинно-следственных зависимостей на основе структурного сходства позволяет анализировать небольшие массивы данных (например, малые группы), что является несомненным преимуществом качественного анализа перед количественным при решении 13 ряда проблем – прежде всего, связанных с представлениями классической «понимающей социологии» М.Вебера. Этим проблемам соответствует круг задач формализованного качественного анализа. Соответственно, интеллектуальный анализ социологических данных (ИАСД) и реализующая его интеллектуальная система предполагают возможность – исследования индивидуального поведения, порождения детерминант поведения и типологизации социума на их основе; – анализа и прогнозирования мнений респондентов как варианта поведения; – выяснения влияния ситуации на поведение индивидуума; – анализа рациональности мнений (в т.ч. степени рациональности мнений данной социальной общности). Из описанного принципа структурализма вытекает потребность первичной (до решения собственно задач ФКАСД) структуризациии данных и знаний, т.е. предварительной алгебраической формализации сходства объектов и их свойств. Однако при существующей традиции обработки эмпирических социологических данных количественными методами и, соответственно, подготовки данных именно для такого анализа реализация этой потребности трудно достижима. В предлагаемом варианте формализованного качественного анализа социологических данных с использованием ДСМ-рассуждений указанная трудность преодолевается выделением обозримого множества характеристик социальных субъектов (как индивидов, так и социальных общностей). Основой представления знаний о субъекте является так называемый «постулат поведения». Этот постулат адекватно отражает представления современных социологов: «для анализа поведения необходимо знать … структуру характера, типичного для данной социальной системы»10. Сюда же можно отнести представления Д.С. Милля о возможности предсказания поведения индивида на основе знания о его характере и настроениях. Пусть имеются три множества характеристик, входящих в описание субъекта поведения: признаки, представляющие социальный характер11 субъекта (SC); индивидуальные черты личности (IP); биографические данные (BD). Поведение В субъекта С определяется подмножеством характеристик DetС таким, что Det = Det1Det2Det3, где (Det1(SC))&(Det2(IP))& (Det3(BD)), причем хотя бы одно Deti , i = 1, 2, 3. Таким образом, индивидуальные характеристики социального субъекта являются информативным основанием для порождения детерминант социального поведения и, соответственно, материалом для построения возможных моделей социальной структуры с использованием установленных детерминант поведения. 10 11 Парсонс Т. О структуре социального действия. М.: Академический Проект, 2000. В соответствии с представлением Э. Фромма (Фромм Э. Иметь или быть. М.: АСТ, 2000). 14 На успешное решение задач ИАСД можно надеяться лишь при выборе методов анализа, адекватных исследуемой социальной реальности – об остроте проблемы такого соотнесения писал еще П.А. Сорокин12. Вопреки традициям количественного анализа, социальные явления по большей части не представляются множествами случайных событий, которые только и могут изучаться статистическими средствами. Для анализа каузально обусловленных событий, к которым «понимающая» социология относит социальные взаимодействия, необходимы детерминистские методы. Разумеется, о причинной обусловленности социальных явлений (таких как, к примеру, индивидуальное поведение) можно говорить, имея в виду некоторые уточнения. Детерминированность здесь – это, скорее, предрасположенность к совершению поведенческих актов (действий, установок, мнений). Более того, предрасположенность эта реализуется при отсутствии противодействующих влияний (как внутренних – личностных, так и внешних – ситуационных). Формализуемость отношения сходства между позитивными (+)- и негативными (–)-фактами (далее иногда – ()-фактами) мира (социума) W(), наличие в БФ позитивных и негативных примеров изучаемого эффекта поведения и предполагаемая ()-квазисимметрия причин (существенных влияний)13 проявления этих эффектов являются основанием для реализации основного принципа качественного анализа социологических данных. Указанные условия составляют принципиальные для успешного применения ДСМ-метода онтологические допущения и описывают класс задач, для решения которых создаются различные ИС, реализующие один тип формализованных эвристик: «сходство – аналогия – абдукция». В ДСМ-методе автоматического порождения гипотез указанная схема формализованного качественного анализа социологических данных представляется эвристической схемой «индукция – аналогия – абдукция». Реализующий эту схему синтез познавательных процедур, примененный к объединению БФ и БЗ, порождает новое знание – расширение БЗ. Архитектура интеллектуальной системы (ИС), предназначенной для приближенного отображения познавательной деятельности «анализ данных – предсказание – объяснение» представляется следующим образом14: ИС = Решатель задач + Информационная среда (БФ+БЗ) + Интеллектуальный интерфейс. Решатель реализует познавательные процедуры и включает Рассуждатель, Вычислитель и Синтезатор. В ИС-ДСМ Рассуждатель реализует процедуры ДСМ-метода автоматического порождения гипотез, формализующие соответствующую эвристику анализа данных. Вычислитель обеспечивает потребности количественного анализа (который может 12 Сорокин П.А. Квантофрения // В кн.: Социология. Хрестоматия для вузов. Составитель А.И. Кравченко. М.: Академический проект, 2002, с. 63 – 74. 13 Мы говорим о квазисимметрии (а не о полной симметрии) позитивных и негативных влияний, так как отсутствие эффекта может быть вызвано не только наличием негативного влияния, но и явным отсутствием позитивного. 14 Арский Ю.М., Финн В.К. Принципы конструирования интеллектуальных систем // Информационные технологии и вычислительные системы, 2008, № 4, с. 4 – 36. 15 оказаться востребованным для некоторых видов социологических данных), сюда же можно отнести вычисление предложенных в работе критериев рациональности мнений (см. ниже). Синтезатор регулирует взаимодействие Рассуждателя и Вычислителя. В результате работы соответствующих ИС из данных не только извлекаются «образцы» в смысле data mining, но и порождаются гипотезы о закономерностях, которые обнаруживаются в расширяемых (вследствие потребностей абдуктивного объяснения имеющихся фактов) последовательностях БФ. Подчеркнем, что наличие в социуме причинно-следственных ()зависимостей типа «подмножество характеристик субъекта есть причина наличия (отсутствия) эффектов поведения (поведенческих актов, установок, мнений)» не просто делает качественный анализ предпочтительнее статистического (количественного). Это фундаментальная характеристика социума W(), которая является основанием для реализации двух важнейших функций формализованного эмпирического исследования. Во-первых, наличие ()-причин позволяет автоматически порождать фальсификаторы индуктивных гипотез, что увеличивает их степень правдоподобия (что важно для правдоподобных ДСМ-рассуждений). Во-вторых, представление о наличии у каждого ()-факта объясняющей его ()-причины (называемое в ДСМ-методе аксиомами каузальной полноты АКП()) является основанием для абдуктивного принятия порождаемых гипотез. ДСМ-метод состоит из: описанных выше условий применимости; правдоподобных ДСМ-рассуждений (синтеза трех познавательных процедур), представленных в формальном языке с дескриптивной и аргументативной функциями; квазиаксиоматических теорий КАТ для представления и систематизации открытого множества знаний о предметной области; дедуктивной имитации правдоподобных рассуждений в КАТ (гарантирующей корректность их результатов); интеллектуальных систем с Рассуждателем, реализующим ДСМ-рассуждения и базой знаний БЗ, представленной соответствующей КАТ. Дополнением к этому являются средства распознавания непротиворечивости различных стратегий ДСМрассуждений, а также выявления законов и тенденций среди полученных эмпирических закономерностей15. Открытая квазиаксиоматическая теория КАТ формируется с помощью формализованных правил правдоподобного вывода на основе исходной базы фактов. КАТ есть T = , , R, где открытое (допускающее пополнение) множество аксиом, лишь частично характеризующих предметную область, открытое множество фактов и гипотез, а R множество правил Rp правдоподобного и Rd достоверного вывода, R = Rp Rd. В ИС-ДСМ множество Rp правил правдоподобного вывода представлено синтезом познавательных процедур – взаимодействием индукции, аналогии и абдукции. Σ' представляет начальную БФ предметной области типа W(). БЗ Σ 15 Финн В.К. Об определении эмпирических закономерностей посредством ДСМ-метода автоматического порождения гипотез // Искусственный интеллект и принятие решений, 2010, № 4, с. 41 – 48. 16 изначально включает в себя инвариантное для всех допустимых W() ядро и специфицирующие предметную область аксиомы. Для формализации ДСМ-рассуждений формулируется язык представления знаний (ДСМ-язык), включающий: – индивидные переменные 1-го сорта X, Z, V, ... (быть может, с нижними индексами) – переменные для объектов и подобъектов (например, субъектов поведения); С, С1, С2, ... – индивидные константы 1-го сорта; – индивидные константы 2-го сорта Y, U, W, ... (быть может, с нижними индексами) – переменные для эффектов (например, эффектов поведения); Q, Q1, Q2, ..., а также А, А1, А2, … – индивидные константы 2-го сорта; – переменные для натуральных чисел: n, m, k, ...; – функциональные символы (для булевской структуры данных): , , , . – двуместные предикатные символы: (для множеств – подобъектов, объектов и множеств свойств), (для переменных приведѐнных трѐх сортов), , (для числовых переменных); 1, 2, 3; – логические связки двузначной логики: , &, , ; – унарные логические связки – J-операторы Россера-Тюркетта J , где = , n или = (, п), ν {1, –1, 0}, n = 0, 1, 2, …; 1, –1, 0, – типы истинностных значений «фактическая истина», «фактическая ложь», «фактическая противоречивость» и «неопределенность», соответственно; – кванторы , (соответственно, для трѐх сортов индивидных переменных). Термы и формулы языка определяются стандартным образом, но с добавлением формул переменной длины16 для отображения сходства конечного, но заранее не определѐнного числа примеров. Пусть даны конечные множества U(1) = {d1, …, dr} – множество характеристик социальных субъектов (описанных в соответствии с постулатом поведения) – и U(2) = {a1, …, as} – множество эффектов их поведения (действий, установок, мнений). Тогда структуризация фактов и (1) знаний о социуме состоит в задании двух булевых алгебр B1 = 2 U , , U(1), (2) , , и B2 = 2 U ,, U(2), , , – алгебры эффектов поведения – и (1 ) (2) (1 ) (2) (2 ) (1) предикатов 1: 2 U 2 U Vin, 2: 2 U 2 U Vin, 3: 2 U 2 U Vin, где Vin множество «внутренних» (эмпирических) истинностных значений. Vin = {, n| ({1, 1, 0})&(nN)}{(, n)| nN}, N – множество натуральных чисел. 1, 1, 0, типы истинностных значений; , n истинностные значения (n – их степень правдоподобия, выражающая число применений правил правдоподобного вывода); (, n) – множество 16 Скворцов Д.П. О некоторых способах построения логических языков с кванторами по кортежам // Семиотика и информатика, 1983, № 20, с. 102 – 106. 17 истинностных значений. (, n) характеризуется рекуррентным соотношением (,n) ={1, n+1,1, n+1,0, n+1(, n+1), которое описывает возможные истинностные значения гипотез, порождаемых в результате ДСМрассуждений, J(,n) ⇌ J1, n+1J-1, n+1J0, n+1J(, n+1) . «Внешние» истинностные значения Vex= {t, f}, где t и f – истинностные значения двузначной логики «истина» и «ложь», соответственно. Они приписываются формулам, построенным из термов, операций и отношений булевой алгебры множеств таким, что все вхождения термов находятся в сфере действия J-операторов. Внутренние истинностные значения используются для представления фактов и гипотез, внешние – для представления высказываний о фактах (фактов с оценками) и п.п.в. J ν = t, если v[] = ν , J ν = f, если v[] ν , где v[] – функция оценки. J(, n) = n J, i. i 1 Массив начальных данных содержит высказывания типа “высказывание «субъект C обладает эффектом поведения Q» имеет истинностное значение , n” (или (, n)), что представляется формулой J, n(C 1 Q) (или J(, n)(C 1 Q)) в ДСМ-языке. Здесь {1, –1, 0, } – типы фактических истинностных значений, n – номер шага вычислений, отражающий степень правдоподобия истинностного значения. Высказывания вида J, 0(C 1 Q) суть факты, J, n(C j Q) (j = 1, 2) и J, n(C 3 Q), n>0, – гипотезы. В результате применения ДСМ-рассуждений порождаются гипотезы вида J, n(C 2 Q) или J, n(C 3 Q) (в зависимости от используемой стратегии анализа данных, о чем мы будем говорить ниже), n>0. J, n(C 2 Q) означает, что «высказывание “подмножество характеристик субъекта C есть причина эффекта поведения Q” имеет истинностное значение , n”». Соответственно, J, n(C 3 Q) означает, что «высказывание “эффект поведения Q предполагает наличие характеристик субъекта C” имеет истинностное значение , n». Иными словами, предикаты V 2 W и W 3 V представляют порожденное из предиката X1Y отношение причинности. Таким образом, в этом процессе в автоматическом режиме формируются фрагменты базы знаний (БЗ) интеллектуальной системы типа ДСМ, поскольку гипотезы о причинах, представляющие сходство фактов, являются обобщением знания. ДСМрассуждение формализуется средствами бесконечнозначной логики предикатов (1-го порядка для конечных моделей и слабой логики предикатов 2-го порядка для бесконечных моделей17). Первый шаг ДСМ-рассуждения – порождение гипотез о причинах вида J, n(C2Q), где n>0, {1, 1, 0}, или J(, n)(C2Q) на основании правил индуктивного вывода п.п.в.-1 (правил правдоподобного вывода 1-го рода). В этом варианте индукции – прямом методе сходства – реализуется условие 17 Виноградов Д.В. Формализация правдоподобных рассуждений в логике предикатов // НТИ, сер. 2, 2000, № 11, с. 17 – 20. 18 «сходство субъектов поведения (предполагаемая причина) влечет наличие эффектов поведения». Для формализации индукции определяются предикаты простого прямого сходства M a,n (V, W), {+, –}, где n – параметр, отображающий число применений правил правдоподобного вывода к БФ. M a,n (V, W) служит для порождения утверждений о возможных причинах наличия изучаемых свойств. Предикат включает подформулы, содержащие экзистенциальное условие ЭУ, описывающее существование k (+)-фактов вида J(1,n)(Xi1Yi), i = k 1, …, k; СХ, условие сходства (+)-фактов ( Xi = V) & (V); ЭЗ, условие i 1 причинно-следственной зависимости V и W и УИ, условие исчерпываемости k сходных (+)-фактов XY((J(1,n)(X1Y)&(V X))((WY)&( i (X=Xi)))); 1 условие нижней границы числа сходных (+)-фактов k2 (для практических целей она может быть увеличена). Эти условия являются непременными составляющими формализаций всех пяти индуктивных методов Д.С. Милля18. Аналогично определяется предикат M a,n (V, W) для порождения кандидатов в гипотезы о причинах (–)-фактов. Возможна и иная стратегия индуктивного анализа, определяющая обратный метод сходства, когда реализуется принцип «сходство эффектов поведения определяет сходство самих субъектов поведения». Для этого варианта с некоторыми модификациями определяются предикаты простого обратного сходства M a,n (V, W) ({+, –}), которые содержат подформулы, описывающие условия, подобные условиям M a,n (V,W). ~ M a,n (V, W) ⇌ k M a,n (V,W,k), где k k ~ M a,n (V,W,k)⇌X1XkY1Yk(( & J(1,n)(Xh1Yh))&( Xh=V)&(V)& h 1 h 1 k ( h1 Yh=W) & (W) &ij (((i j)&(1 i, j k)) (XiXj))& k XY((J(1,n)(X1Y)&(WY))((VX) &( (Y=Yh))))&(k2)). h 1 Эмпирическая зависимость и условие исчерпываемости в обратном методе описываются подформулой XY((J(1,n)(X1Y)&(WY))((VX) ~ k &( (Y=Yh)))), аналогично формулируются эти условия для M a,n (V,W,k). h 1 Собственно гипотезы о (+)-причинах в обратном методе есть результат применения правил правдоподобного вывода п.п. в. -1, имеющих следующий вид: ( I )+ J(,n)(W 3V), M a,n (V, W)& M a,n (V, W) , J1,n+1(W 3V) 18 Финн В.К. Индуктивные методы Д.С. Милля в системах искусственного интеллекта // В кн.: Милль Д.С. Система логики силлогистической и индуктивной. М.: ЛЕНАНД, 2011. С. 787 – 828. 19 где J(,n)( W 3V) – часть посылки (на n-м шаге неизвестно, является ли V причиной W), а J1,n+1(W 3V) – заключение, которое является гипотезой о (+)-причине с истинностным значением 1, n+1 и со степенью правдоподобия, характеризующейся шага рассуждений n+1. – 0 номером Аналогично формулируются ( I ) , ( I ) и ( I ) для заключений J–1,n+1(W 3V), J0,n+1(W 3V) и J(,n+1)(W 3V) и посылок, включающих, помимо J(,n)(W 3V), M a,n (V, W)& M a,n (V, W), M a,n (V, W)& M a,n (V, W) и M a,n (V, W)& M a,n (V, W), соответственно. Гипотезы, порождаемые индуктивными п.п.в.-1 (I)n для прямого метода, имеют вид J,n+1(V2W) или J(,n+1)(V2W) («V – причина W» с соответствующей оценкой), {1, –1, 0}, {+, –, 0, }. Таким образом, отношение, представленное в БФ предикатом X1Y, посредством (I) и ( I ) ({+, –, 0, }) порождает отношения 2* и *3, соответственно. Эти отношения представлены множеством гипотез Н1, являющимся фрагментом БЗ – части КАТ. Онтологической особенностью социологических данных является наличие в исходной БФ противоречивых примеров отношения 1*. Для анализа конфликтных вариантов поведения (мнения) – (0)-фактов – ~ ~ формулируются предикаты M a0,n (V,W) ⇌ k M a0,n (V,W,k). M a0,n (V,W,k) ~ воспроизводят структуру M a,n (V,W,k) с заменой J(1,n)(Xh1Yh) на J(0,n)(Xh1Yh) и J(1,n)(X1Y) на J(0,n)(X1Y), соответственно. Система правил правдоподобного вывода п.п. в. -1 должна исчерпывать все возможные случаи порождения гипотез вида J,n+1(W 3V) или J(,n+1)(W 3V), {1, –1, 0}, {+, –, 0, }. Это достигается выполнением так называемого «условия M -полноты»: дизъюнкция всех посылок, содержащих конъюнкции M -предикатов, должна быть общезначимой формулой. Посылки правил для порождения гипотез вида J1,n+1(W 3V) должны содержать M a,n (V, W)& M a,n (V, W)& M a0,n (V, W), J1,n+1(W 3V) – M a,n (V, W)& M a,n (V, W)& M a0,n (V, W), J(,n+1)(W 3V) – M a,n (V, W)& M a,n (V, W)& M a0,n (V, W). Тогда, в соответствии с требованием M полноты, порождению гипотез вида J0,n+1(W 3V) для причин фактических противоречий отвечают посылки M a,n (V, W)& M a,n (V, W) M a0,n (V, W), т.е. противоречие является либо результатом «столкновения» (+)- и ()- условий («эпистемическое противоречие»), либо порождается только (0)-примерами (фактами) («онтологическое противоречие»). Предикаты сходства – как прямого, так и обратного – могут быть дополнены условиями, повышающими правдоподобие порождаемых гипотез и носящими название «усиливающих добавок». Основными добавками являются условие «запрета на контрпримеры» и условие единственности причины (для прямого и обратного), а также условие единственности следствия (для обратного). 20 Условие «запрета на контпримеры» (b)+ задаѐтся выражением XY(((VX&WY))(J(1, n)(X1Y)J(,n)(X1Y))). Единственность причины следствия W для обратного метода определяется формулой ( е )+ Z(J(1,n)(W 3Z)(Z=V)). Единственность следствия задаѐтся выражением (с)+ U(J(1,n)(U 3V)(U=W)). Соответствующие добавки (b)–, (с)– и ( е )– определяются аналогично. Тогда усиления предикатов M a,n (V, W) ({+, –}) представляются формулами M ab , n (V, W) ⇌ M a , n (V, W)&(b) , M aс , n (V, W) ⇌ M a,n (V, W)&(с) , M aе W) ⇌ M a,n (V, W)&( е ), соответственно. , n (V, Построение множества индуктивных предикатов позволяет формировать различные стратегии порождения гипотез о причинах включением различающихся по силе предикатов в посылки правил правдоподобного рода п.п. в. -1 для обратного и п.п.в.-1 для прямого методов. Следующий шаг ДСМ-рассуждения – вывод по аналогии для уточнения неопределѐнностей J(, n)(V1W) из БФ – выполняется посредством правил правдоподобного вывода 2-го рода ( п.п. в. - 2 ). Для посылок этих правил для обратного метода формулируются предикаты п (V, W) ({+, –, 0, }), позволяющие предсказывать наличие (отсутствие) эффекта поведения W у ~ субъекта V. п (V, W) ⇌ k п (V,W,k). Подформула k & i 1 k Xi(J(1, n)(Yi 3Xi)&(XiV)&( Yi=W)) i 1 предиката ~ п (V,W,k) выражает утверждение, что V содержит положительные причины X1, ..., Xk (полученные обратным методом) наличия свойств (мнений, действий) Y1, ..., Yk соответственно, причем изучаемый эффект W полностью k покрывается этими множествами свойств ( Yi=W, k – параметр). В предикат i 1 также входит запрет на включение в рассматриваемый объект V отрицательных или противоречивых причин Z для любых подмножеств U свойств из W: U((UW)&U)Z((J(1,n)(U 3Z) J(0,n)(Z2U)& (ZV))). ~ k k п (V,W,k) ⇌ Y1 ... Yk(( & Xi(J(1, n)(Yi 3Xi)&(XiV)&( Yi=W))& i 1 i 1 U((UW)&U)Z((J(1,n)(U 3Z) J(0,n)(Z2U)&(ZV)))). Предикат п (V,W) определяется аналогично с заменой J(1, n) на J(1, n) и J(1, n) на J(1, n). Для порождения гипотез о фактических противоречиях 0 («конфликтах») вида J0,n+1 (X1Y) определим предикат п (V,W): 0п (V,W) ⇌ X1Y1X2Y2(J(1, n)(Y1 3X1)&J(–1, n)(Y2 3X2)& (Y1Y2)&(X1V)& (X2V)&(Y1W)&(Y2W)) XY(J(0, n)(Y 3X)& (XV)& (YW)). п (V,W) определяется естественным образом: п (V,W) ⇌ 21 ( п (V,W) п (V,W) 0п (V,W)) Сформулируем теперь правила правдоподобного вывода по аналогии ( п.п. в. - 2 ): J(,n)(V1W), п (V,W) ( I I )+ . J1,n+1(V1W) Подобным же образом определяются правила ( I I )–, ( I I )0 и ( I I ) с посылками п (V,W), 0п (V,W) и п (V,W) для порождения гипотез J– 1,n+1(V1W), J0,n+1(V1W) и J(,n+1)(V1W), соответственно. Аналогично формулируются предикаты п (V, W) и правила (II) ({+, –, 0, }) для прямого ДСМ-метода АПГ с использованием гипотез о причинах J(,n) (X 2Y), {1, –1, 0, }. Гипотезы, порожденные посредством (II) и ( I I ), образуют множество Н2, составляющее часть БЗ. Из определений предикатов п (V,W) и п (V, W) ({+, , 0}) следует, что они являются средством формализации выводов по аналогии. В качестве подформул предикаты содержат гипотезы о причинах, выражающие сходство (выявленное в результате применения индуктивных правил) примеров из БФ и полученных на предыдущих шагах гипотез о свойствах объектов. Следовательно, результат применения правил правдоподобного вывода второго рода сходен с породившими гипотезы о причинах примерами и реализует принцип структурной аналогии. ДСМ-рассуждение состоит из последовательного применения правил правдоподобного вывода 1-го и 2-го рода до стабилизации множества порождаемых гипотез. Этот этап ДСМ-рассуждения образует цикл применения двух познавательных процедур – индукции и аналогии. Вторым этапом ДСМ-рассуждения является абдуктивное объяснение начального состояния БФ, т.е. принятие порожденных гипотез первого и второго рода посредством рассуждения, формализующего абдукцию Ч.С. Пирса. Схема абдуктивного принятия гипотез в ДСМ-методе АПГ может быть представлена следующим образом. БФ – множество фактов, представляющих X 1Y, H = H1H2 – множество гипотез, порожденных индукцией и аналогией, соответственно, Е(Н1, БФ) – реализация отношения объяснения БФ посредством Н1. hj((hjH) hj правдоподобна), где j = 1,…, 6, hj – гипотезы, h1 = J, n(C1Q), h2 = J, n(C2Q), h3 = J, n(Q 3C), h4 = J(, n)(C1Q), h5 = J(,n)(C2Q), h6 = J(, n)(Q 3C) , а {1, 1, 0, }, n>0. n – число применений правил правдоподобного вывода (п.п.в.-1 или п.п. в. -1 – индукции – и п.п.в.-2 или п.п. в. - 2 – аналогии), выражающее степень правдоподобия гипотезы hj: чем больше n, тем меньше степень правдоподобия hj. 22 Реализация отношения объяснения БФ порожденными гипотезами о причинах Н1 формализуется посредством аксиом каузальной полноты () () (АКП для прямого метода и А К П для обратного) предметной области (социума) W(): «всякий эффект социального поведения Y субъекта X имеет причины V1, …, Vk, его вызывающие». k А К П(+) : XYkV1VkW1Wk(J1,0(X1Y)n( & J(1,n)(Wi 3 Vi) i 1 k &(ViX)& (Vi) &(Wi))& ( i1 Wi=Y))). А К П(–) формулируется аналогично, поскольку, как уже говорилось, онтологической особенностью рассматриваемой социальной реальности является представление о ()-квазисимметрии причин. Соответственно, формулируются АКП() для прямого метода. В случае наличия в исходной БФ (0)-примеров проверяется также выполнимость А К П(0): ZU((J0, 0(Z1U)n 0п (Z, U)). А К П() и АКП() являются критерием достаточного основания для принятия гипотез. Если эти аксиомы выполняются для БФ, то порожденные гипотезы принимаются на достаточном основании. В противном случае () БФ расширяется для всех тех фактов, которые не объясняются – А К П или АКП() (в зависимости от принятой стратегии рассуждений – прямой или обратной) ложны относительно соответствующих пар С, Q, где С – объект, а Q – множество его свойств. После расширения БФ ДСМ-рассуждение продолжается до достижения одного из трѐх возможных исходов. (1) аксиомы каузальной полноты выполняются для всех фактов из БФ – гипотезы принимаются на достаточном основании; (2) после серии расширений БФ остается незначительная область необъясненных фактов – гипотезы принимаются на квазидостаточном основании; (3) аксиомы не выполняются и при этом возникают вновь необъясненные факты – гипотезы не принимаются. Рассмотрим последовательность расширяемых (пополняемых новыми фактами) баз фактов БФ1 БФ2 БФm. Пусть БФi+ и БФi–, соответственно, – множества (+)- и (–)- фактов из БФi, i = 1, …, m, |БФi| – число элементов БФi, {+, –}. Пусть, далее, БФ i БФi, где БФ i – подмножество БФi такое, что для каждого ()-факта из этого подмножества найдется объясняющая его ()-гипотеза ()(это означает выполнение аксиомы () каузальной полноты АКП или А К П ). Тогда, если существует m для назначенного порога каузальной полноты такое, что 1 … m , где | БФ i | (i) = , i = 1, …, m, {+, –}, то будем говорить, что имеет место | БФ i | абдуктивная сходимость ДСМ-метода АПГ. Формализованный качественный анализ социологических данных средствами ДСМ-метода автоматического порождения гипотез позволяет решать задачи социологии и социальной психологии. Первый тип задач 23 предполагает исследование индивидуального поведения, порождение детерминант поведения и типологизацию социума на их основе. Проблемы как собственно социологии, так и социальной психологии решаются в рамках анализа и предсказания мнений (также с выявлением детерминаций и возможного определения структуры социума на их основе), дополняемого определением рациональности этих мнений специально созданными средствами. Задача первого типа решалась на примере изучения солидарного поведения рабочих на конфликтных предприятиях (в частности, участия или неучастия в забастовке). Поскольку информативность представления субъекта в этом случае превосходит информативность описания его действий, в качестве стратегии анализа был выбран прямой ДСМ-метод АПГ. Эмпирической базой эксперимента были данные, полученные сотрудниками лаборатории проф. В.А. Ядова Института социологии РАН при изучении рабочих двух предприятий: завода «Арсенал» в СанктПетербурге (157 респондентов) и Завода тракторных гидроагрегатов в г. Ельце (132 респондента). Эти предприятия существенно отличались друг от друга по социо-культурным параметрам, по состоянию трудовых отношений и стадии развития трудового конфликта (о наличии конфликтов на предприятиях было известно заранее) – фактически, по ситуационным параметрам. Впоследствии это сказалось на порождении различных детерминант различных форм коллективного поведения для этих предприятий, привело, соответственно, к различной типологизации рабочих коллективов и послужило практическим стимулом для создания ситуационного варианта ДСМ-метода, представленного в 5 Главе работы. Первичные (исходные) данные, непосредственно полученные как ответы на вопросы интервью и тестов, агрегировались и представлялись таким образом, что определенная комбинация ответов порождала комплексную характеристику. Эти комплексные признаки конструировались исследователями на основании знаний о связях между переменными (полученных из опыта, методами факторного анализа и т.п.). Признаки были сформированы в соответствии с постулатом поведения: социальный характер – переменные, характеризующие обобщенные установки ценностного характера, нормативные установки, характеризующие предпочитаемую стратегию поведения в социальнотрудовом конфликте; данные об индивидуально-психологических характеристиках испытуемых, полученные с помощью тестов, которые позволили выделить три психологических типа: лидеры, миссионеры, зависимые; биографические данные – ресурсные характеристики, обусловленные объективным статусом (материальное положение, образование, наличие приработков), характеристики идентичности (наемные работники или коллектив предприятия). В качестве детерминируемых признаков рассматривались готовности к тому или иному виду поведения в проективной ситуации забастовки: 24 инициативный («войду в забастовочный комитет»), активный («буду участвовать в забастовке»), подражательный («поступлю как большинство»), уход («не буду участвовать в забастовке»). В результате анализа имеющихся данных средствами ДСМ-метода автоматического порождения гипотез были выявлены детерминанты различных видов поведения и на основе этих детерминант социологами определены различные поведенческие типы, причем, как уже говорилось, они оказались различными для изучаемых предприятий. Так, например, в Санкт-Петербурге был описан тип «Крестьянин, потерявший опору» (индивидуализм, непризнание закона в сочетании с желанием «договариваться», средний уровень материального положения). В Ельце – «Советский рабочий» (зависимость от предприятия, ощущение себя совладельцем, лояльность к директору, низкий уровень материального положения). Тип «Боязливый обыватель, одиночка» (осуждение забастовок, установка на переговоры, низкий-средний уровень материального положения) оказался универсальным – он был выделен на обоих предприятиях. Второй этап эксперимента опирался на представление характеристик субъекта в соответствии с уровнем диспозиции переменных19. В один признак не могли войти переменные, характеризующие диспозиции разного уровня (например, переменные, характеризующие ценность солидарности, "Ц", и готовность к солидарному поведению, "П"). В результате была выстроена типологизация поведения на более глубоком уровне, позволяющем выделить ядро типа в сочетании с нюансами позиции. Так, всех рабочих завода «Арсенал», заявивших о готовности участвовать в забастовке, объединяет поведенческая установка на солидарность-П (они готовы материально поддержать бастующих другого предприятия и готовы участвовать в защите тех, кто отстаивает интересы рабочих) и слабая ресурсная база (средний-низкий и низкий уровень материального положения, отсутствие приработков, сравнительно невысокий уровень образования). Но дальше фиксируются различия, разделяющие активистов на два подтипа. «Борцы за интересы рабочих» разделяют идеологему закрытости (солидарность – только у рабочих, рабочие должны бороться за свои права, у рабочих – больше врагов, чем друзей), демонстрируют установку на мобилизацию ресурсов солидарности (готовность поддержать обращения к населению и работникам). Для них характерно ценностное обоснование солидарности в сочетании с отрицанием ценностей корпоративизма. У «Борцов за интересы трудового коллектива» ценностная и поведенческая установка на солидарность и идентичность наемного работника сочетаются с поведенческой установкой на корпоративизм, отсутствующей в первой группе. Как нюансы позиции присутствует идентичность наемного работника и поведенческая установка 19 Ядов В.А. О диспозиционной регуляции социального поведения личности // В кн.: Социальная психология. Хрестоматия. М.: Аспект Пресс, 2000. С. 416 – 432. 25 на консенсуализм при слабости собственных ресурсов. Совместная работа оказалась плодотворной как для содержательного социологического исследования, так и для развития ДСМ-метода (идея аргументационного оценивания, увеличение числа типов истинностных значений – для промежуточных между +1 и –1 оценок, – ситуационное расширение). Социологами были высоко оценены возможности комбинации социального и индивидуального, повышение уровня формализации данных и знаний, формирование эмпирических социологических понятий (типологизация), которые оказались основанием для уточнения социологической модели и порождения социологической концепции. Предложенные метафорические описания различных поведенческих типов представляют собой реализацию редкой возможности эмпирического формирования понятий, что, несомненно, является одной из важнейших задач когнитивной социологии. Таким образом, ДСМ-метод оказался эффективным инструментом формализованного качественного анализа данных. Для решения второго типа задач ФКАСД – анализа и прогнозирования мнений – была выбрана стратегия обратного ДСМ-метода АПГ, поскольку информативность представления мнений значительно превосходит представление характеристик индивидуума. Реализация этой стратегии возможна лишь при наличии адекватной структуризации мнений и представлении их в виде, отвечающем условиям применимости ДСМ-метода (подобно тому, как было структурировано описание индивидуумов на основании постулата поведения). Это составляет один из разделов Главы 3. Здесь же представлены формализации т-значных закрытых социологических опросов средствами специально созданных многозначных Jm-логик. Описываются критерии рациональности результатов опроса – степень непротиворечивости, степень близости к «идеальному мнению», степень согласованности. Предложенные характеристики уточняются для предсказательных опросов, когда средствами выбранной формальной эвристики порождаются возможные ответы респондентов. Рассматриваемый подход к структуризации мнений опирается на уточнение идеи «темы» (или множества «тем») в концепции немецкого социолога Н. Лумана, согласно которой опросы общественного мнения должны быть представлены как ответы на вопросы по соответствующей теме. На основе такого представления предложен вариант семантики ДСМметода для анализа и прогнозирования мнений. Пусть задана некоторая тема опроса Т*, характеризующаяся утверждениями из множества Р = {p1, …, pn}, которое будем называть каркасом темы Т*, а элементы p1, …, pn – корнями вопросов (параметрами опроса). В результате опроса устанавливается отношение респондентов к элементам каркаса и к теме в целом. Задана функция оценки v[pi] с областью значений {1, –1, 0, }. Каждому элементу pj (j = 1, …, n) каркаса Р соответствует вопрос ?pj – «Какова оценка корня 26 вопроса pj ?», {1, –1, 0, }, ответом на который является высказывание Jpj. Jpj = t, если v[pj] = ; Jpj = f, если v[pj] . Ответом j-го респондента по теме Т* будем назвать максимальную конъюнкцию j ≖ J p1&…& J pn (вид мнения), где j – метасимвол, “≖” – ( j) 1 ( j) n предикат графического равенства формул, v(j)[pi] = i(j), i(j) {1, 0, }, i = 1, …, n; j = 1, …, 4n. Такой ответ представляет собой понимание j-м респондентом темы Т*. Множество членов этой конъюнкции обозначим [j]={ J p1, …, J pn} и будем назвать составом мнения. ( j) 1 ( j) n Множество всех возможных ответов по теме Т* с каркасом Р обозначим К, К = {j | (j ≖ J1( j ) p1& … & J n( j ) pn)&(i(j) {1, 0, }), i = 1, …, n, j = 1, …, 4n}, |К| = 4n. Заметим, что число респондентов может превышать 4n, поскольку различные респонденты могут иметь одинаковые ответы, при этом число различных ответов может быть меньше 4n. Предлагаемая семантика позволяет формализовать анализ мнений средствами ДСМ-метода АПГ в соответствии со следующей стратегией. Формулируется тема мнения, пригодная для построения модели социальной структуры. Затем задается система вопросов, раскрывающих содержание темы – каркас темы. Оценка эмпирического отношения C 1 Q («субъект – мнение») есть оценка отношения к теме в целом, Q – состав мнения субъекта С (множество { J1( j ) p1, …, J n( j ) pn} образующих (атомов) мнения с оценками, Q = []). Пусть U(2) = {(≖ J pi)& (i{1, –1, 0, }), i =1, …, n}, |U(2)| = 4n. Задача изучения мнений сводится к изучению высказываний из БФ J j (Cj1[j]) – «субъект Cj имеет мнение j». В результате применения правил индуктивного вывода обратного ДСМ-метода ( п.п. в. -1) порождаются гипотезы вида J j ([j] 3 Cj) – «мнение j определяет наличие характеристик субъекта Cj». Порожденные детерминанты мнений в дальнейшем используются для прогнозирования мнений с помощью правил вывода по аналогии ( п.п. в. - 2 ), а также служат основанием для построения модели структуры изучаемого социума. Здесь Cj, Cj, [j], [j] – константы, Cj, (1) (2) Cj 2 U , [j], [j] 2 U , j = j, m или j = (, m) – истинностное i значение, полученное применением ДСМ-метода АПГ, где j{1, 0}, а m – число применений ДСМ-правил правдоподобного вывода. Социологический опрос не случайно представляется на уровне обыденного сознания «визитной карточкой» социологии. Для профессионального анализа социальной действительности опрос является универсальным и наиболее широко практикующимся источником получения эмпирического материала. При этом нельзя сказать, что формальные описания тех или иных сторон исследования совершенно выпадают из поля зрения социологов. Но поскольку для обработки полученных результатов, как правило, используются статистические методы, эти формальные средства 27 и определяют различного рода статистические характеристики, вплоть до построения репрезентативной выборки. При этом такие задачи как формулировка вопросов с целью получения наиболее релевантных целям исследователя ответов, учет контекста опроса, уровни измерения, выбор формата для ответов и т.п. решаются почти исключительно на основании интуитивных и эмпирических представлений исследователя. При этом сама структура опроса не находит своего формализованного представления, хотя это обеспечило бы унификацию процедур проведения опроса и позволило бы упорядочить некоторые результаты опроса на основании численных критериев рациональности для различных социальных общностей. Рассмотрим общий случай m-значного (m2) закрытого социологического опроса: респонденту предлагается выбрать один из m предложенных ответов. С точки зрения предлагаемой формализации mзначные закрытые опросы являются обобщением закрытых булевских опросов (m=2), со шкалой оценок {0, 1}, где 0 – истинностное значение «ложь» (оценка для ответа «нет»), а 1 – истинностное значение «истина» (оценка ответа «да»). Логическими средствами формализации m-значного опроса являются m-значные логики Jm и исчисление эквивалентных формул ИЭФ-Jm20. Таким образом, задано множество оценок переменных Vm = {0, m2 1 m 1 ,…, m 1 , 1} (разумеется, социологически интерпретируемых), заданы атомарные оценки v(i)[pj] = j(i), i = 1, …, mn, j = 1, …, n. Функция оценки v[] формул логики Jm определяется индуктивно по сложности формулы и принимает значение из {0, 1}. Таким образом, для формул логики Jm имеет место v(i)[]=(v(i)[p1], …, v(i)[pn]), где i=1, …, mn, а p1, …, pn – все переменные, входящие в . Система этих равенств определяет функцию F такую, что она отображает множество Vm в {0, 1}, т.е. F: Vm{0, 1}. Для представления эквивалентных формул (реализующих одну и ту же функцию) строится ИЭФ-Jm, которое является модификацией ИЭФ двузначной логики с J-атомами, законом противоречия (JрJр)0 (, , Vm) и законом исключенного (m+1)-го. Ответом на вопрос «Какова оценка корня вопроса pj ?» для элементов pj (j = 1, …, n) каркаса Р, как и выше, является высказывание Jpj, однако в этом случае Vm. Понимание i-м респондентом темы Т* отображается в его ответе Ci ≖ J p1&...& J pn, представляющем J-максимальную конъюнкцию логики Jm. (i) 1 (i) п Эта конъюнкция определяется по аналогии с максимальной конъюнкцией двузначной логики, т.е. для каждой pk в Ci входит без повторений J pk (k=1, (i) k …, n), а J pk и J pk, где k(i) j(i), одновременно в Ci не входят. (i) k (i) j Соответственно, множество всех возможных ответов по теме Т с каркасом Р К = {i | (i ≖ J p1&...& J pn)&(jVm), v(i)[pj] = j(i), , j = 1, …, n, i = 1, …, (i) 1 (i) п 20 Finn V.K., Mikheyenkova M.A. Plausible Reasoning for the Problems of Cognitive Sociology // Logic and Logical Philosophy, Vol. 20 (2011), pp. 113 – 139. 28 mn}. Число элементов этого множества |К|=mn, поскольку каждой Jмаксимальной конъюнкции взаимно однозначно соответствует m-значный (n мерный) вектор σ ( i ) = 1(i), …, n(i). Специфической особенностью предлагаемой технологии анализа мнений является возможность конструктивного порождения насыщенной выборки – одной из основных идей обоснованной теории – стратегии качественного анализа социологических данных. Пусть при опросе респондентов получено множество ответов КК, которое не изменяется при расширении множества опрашиваемых. В этом случае мы имеем дело со стабилизированным множеством ответов, причем стабилизация эта достигается экспериментальным путем. Пусть стабилизированному множеству ответов К соответствует множество респондентов R = {b1, …, br}, R = {X | J,0(X1[])&(К)&(Vm)}. Тогда множество респондентов R можно считать качественным аналогом репрезентативной выборки статистического анализа. Итак, простой эмпирический m–значный социологический опрос (m2) Оm по теме Т со шкалой оценок Vm = {0, m11 ,…, mm12 , 1} реализуется средствами дедуктивной m-значной логики Jm и может быть представлен в виде Оm = Jm, Р, K, R, X1Y, причем K задается исследователемсоциологом в результате эмпирического получения стабилизированного множества ответов. Анализ результатов такого опроса производится средствами ДСМ-метода автоматического порождения гипотез. Средства логики Jm и ИЭФ-Jm позволяют дополнить это описание. Рассмотрим множество = {1, …, s} формул 1, …, s логик Jm, выражающих логические зависимости между элементами каркаса Р – корнями вопросов ?p1, …, ?pn. Указанные зависимости задаются исследователем и, таким образом, представляют имплицитное экспертное знание относительно темы Т*. Множество «постулатов значения» должно быть непротиворечивым, при этом формула = (1…s) не должна быть тавтологией логики Jm. Заметим, что контроль непротиворечивости и содержательности системы вопросов является одним из основных требований опросной методологии. Введение множества позволяет определить простой расширенный эмпирический опрос Оmе = Jm, Р, , K, R, X1Y. Цель всякого опроса – получение эмпирического материала, могущего служить базисом для построения социологических концепций. Оптимальным для достижения этой цели является такой опрос, где реализуется рациональное восприятие респондентом темы опроса. Анализ рационального поведения – классическое направление теоретической и прикладной социологии, возведѐнное «понимающей социологией» М. Вебера в ранг одного из центральных. Традиционное понимание рациональности опирается на представление о действии как акте, направленном на некоторую цель. В этом случае рациональность действия определяется как устанавливаемое с 29 помощью рассудка соотношение между интенцией и имеющимися у субъекта знаниями, объективными возможностями и избранными средствами. С появлением когнитивной социологии исследования рациональности получили возможность развиваться и в другом измерении, в частности при анализе мнений респондентов в социологических опросах. Описанная семантика ДСМ-метода АПГ для анализа мнений включает возможность описания и анализа такой рациональности, рассматриваемой вне зависимости от целеполагания субъекта. В центре внимания оказывается вопрос об аргументированном принятии решений (высказываемых мнений), не сводимом к дедуктивному рассуждению. Предложенное представление опроса по теме Т* с описанием каркаса темы Р = {p1, …, pn} есть приближение к аргументированному и, соответственно, рациональному восприятию темы. При этом в базовом варианте формирование оценок отношения к элементам каркаса Р осуществляется в результате непосредственных ответов респондента на вопросы анкеты. Возможность формирования рационального мнения может быть усилена, если предложить респонденту множество аргументов А относительно принятия или непринятия утверждений p1, …, pn. Для реализации аргументационной схемы оценивания элементов Р рассмотрим семантику логику аргументации А421. Пусть А – множество доводов (аргументов и контраргументов), Р – множество всех пропозициональных переменных (например, для каркаса Р = {p1, …, pn} темы Т*). Определим на Р две функции. g+: Р2A, g+(pj)A, g–: Р 2A, g–(pj)A, j = 1, …, n. Пару функций g+, g– будем называть нормальной, если для всех р Р g+(p)g–(p) = . Атомарная оценка для множества истинностных значений {1, –1, 0, } определяется следующим образом (j = 1, …, n): v[pj] = 1 g+(pj) , g–(pj) = (т.е. имеются аргументы за принятие pj и нет контраргументов – аргументов против); v[pj] = –1 g+(pj) = , g–(pj) ; v[pj] = 0 g+(pj) , g–(pj) ; v[pj] = g+(pj) = g–(pj) = ; Таким образом, для i-го субъекта определяются его аргументационные + + функции Gi =gi (p1), ..., gi (pn), gi (p1), ..., gi (pn), где Gi =gi(p1), ..., gi(pn), {+, –}, gi(ph) A, h = 1, …, n, i = 1, …, s, где s – число участвующих в опросе респондентов. Обязательным условием рационального выбора является gi+(ph)gi–(ph) = . Опрос, в котором формирование оценок осуществляется на основании аргументационного выбора, называется аргументационным: Оmа = Jm, Р, K, 21 Финн В.К. Об одном варианте логики аргументации // В сб.: Многозначные логики и их применения, т. 2: Логики в системах искусственного интеллекта. Под ред. проф. В.К. Финна. М.: Издательство ЛКИ, 2008, с. 13 – 58. 30 R, X1Y, А, { Gi }1i|R|. Расширенный аргументационный опрос Оmае = Jm, Р, , K, R, X1Y, А, { Gi }1i|R|. Для формализации явного влияния аргументации субъекта на оценку элементов Р для темы Т и оценку его отношения к ней рассмотрим расширенное представление знаний об i-том субъекте Sbti=Ci, gi+(p1), ..., gi+(pn), gi(p1), ..., gi(pn). Пусть Gi =gi+(p1), ..., gi+(pn), gi(p1), ..., gi(pn). Расширим ДСМ-язык включением термов, образованных кортежами Сi, Gi , где Ci – описание субъекта множества характеристик в соответствии с постулатом поведения. Исходными элементами базы данных теперь будут формулы вида J, 0(Ci, Gi 1 [i]) ( {1, 1, 0}), которые включаются в экзистенциальные условия предикатов сходства для правил индуктивного вывода. Соответственно, порождаются гипотезы вида J , n([] 3 C, G ) или J(, n)([] 3 C, G ), где {1, 1, 0}, n>0, C – пересечение множеств характеристик Ci сходных субъектов, G – покомпонентное пересечение кортежей Gi , входящих в представления субъектов. Порождѐнные гипотезы представляют явным образом аргументационную составляющую формирования мнения, т.е. обнаруживают влияние когнитивных процессов на социальное поведение. Отметим, что аргументационная база А рассматривается как общая для всех респондентов – это может быть, к примеру, объединение всех аргументационных баз. В случае необходимости индивидуальная база может быть добавлена к описанию респондента, что потребует дополнительного расширения ДСМ-языка. Одной из важнейших характеристик рациональности мнения является его непротиворечивость. Пусть consis({}) – метапредикат непротиворечивости множества формул ({}). Тогда множество всех (ответов респондентов) – J-максимальных конъюнкций логики Jm, – не противоречащих , обозначим К+ = {|consis({})(К)}; множество ответов , противоречащих , обозначим = {|consis({})(К)} (здесь возможна замена К на К – для реальных опросов). Определим следующие функции: (К, К+) = |КК+|/|К| и (К, ) = |К|/|К|, характеризующие, соответственно, степень непротиворечивости и степень противоречивости закрытого m–значного опроса по теме Т. Степень непротиворечивости результатов опроса может также задаваться функцией (К, ) = 1 – (К, ). Здесь |К|, |КК+| и |К| – числа элементов множеств К, КК+ и К, соответственно. Легко показать, что (К, К+) + (К, ) = 1, т.к. К = К+, К+ = и КК. Выбор той или иной функции для вычисления степени непротиворечивости определяется характером эмпирической выборки и следует целям минимизации вычислительной сложности. 31 Для вычисления функции (К, ) используется метод аналитических таблиц для логик JА4 и JА5 (4-х и 5-значных логик с аргументационной семантикой, соответственно). JА4 – специальный вариант Jm-логики для опроса с минимальным для ДСМ-метода набором истинностных значений {1, 1, 0, }. Функция оценки атомарных формул логики JА4 определяются следующим образом: v[Jp] = t (истинностное значение двузначной логики “истина”), если v[p] = , где v[p] – функция оценки, а {1, 1, 0, }. Таким образом, v[J1p] = t тогда и только тогда, когда g+(p) и g(p)= (для 1, 0, аналогично). Поскольку JА4 является специальным вариантом т-значных логик Jm, достаточно рассмотреть метод аналитических таблиц для последних. Если – формула Jm, то t и f – помеченные формулы, где t («истинно») и f («ложно») – пометки. Для классификации помеченных формул логик Jm и основанных на ней правил используются эквивалентности: t эквивалентно k ( – формула Jm), fJр эквивалентно , 0 k m–1. J i р, где = 0 i m 1 m 1 ik m 1 Соответственно, к обычным - и -правилам метода аналитических таблиц для двузначной логики добавляется ещѐ одно -правило (конъюнктивного tJ p , где Vm. Дополнительным типом правил являются -правила: J p fJ 0 p fJ 1 p ,…, . p | | J m2 p | J 1p J 0 p | J 1 p | | J m2 p типа) J 1 m 1 m 1 m 1 m 1 Пусть – множество «постулатов значения», соответствующих теме Т, а – максимальная конъюнкция формул J pi. Тогда, если аналитическая i таблица для множества {} замкнута, то {} – противоречиво и , где – множество «запрещенных» максимальных конъюнкций. Отсюда возникает простая процедура вычисления степени непротиворечивости опроса (К, ): для каждого мнения проверяется, входит ли оно в , и в соответствии с долей противоречивых мнений в общем числе мнений и вычисляется функция (К, ). Точно так же, с помощью метода аналитических таблиц для логик Jm, могут быть вычислены функции (К, К+) и (К, ). Для вычисления первой строится завершенная аналитическая таблица с корнем , дизъюнкция открытых ветвей этой таблицы в ИЭФ-Jm приводится к совершенному виду. Указанное представление возможно, т.к. каждая формула, тождественно не равная 0, представима посредством Jm-совершенной дизъюнктивной нормальной формы (дизъюнкции максимальных конъюнкций Jp формул). Множество, состоящее из всех J-максимальных конъюнкций построенной совершенной формы и есть множество К+ – множество ответов, не противоречащих . Для вычисления второй функции – степени противоречивости результатов опроса – строится множество = К – К+. Однако это множество может быть также независимо построено с помощью 32 метода аналитических таблиц. Для этого строится завершенная таблица с корнем f(1…s), где i, i = 1, …, s. Дальнейшая процедура совпадает с описанной: дизъюнкция открытых ветвей преобразуется в совершенную нормальную форму, состав этой формы образует . Для рассматриваемой социальной общности (респондентов опроса) может быть сформировано «описание состояния рациональности» – с помощью специально определенных предикатов Ph(К) (h = 1, 2, 3; {0, x, 1}). Предикат Р1(К) для = 0, x, 1, соответственно, определяется следующим образом: (К, ) = 0, x((К, ) = x&0<x<1), (К, ) = 1 (К – переменная, фиксировано, поскольку фиксировано множество ). Этот предикат представляет собой 1-й критерий рациональности результатов опроса – степень его непротиворечивости. Предикат Р2(К) характеризует степень близости мнения респондентов к некоторому «идеальному мнению», представленному «правильным» ответом по теме Т. Наиболее естественно этот предикат определяется для электоральной общности – в этом случае «идеальное мнение» сторонника некоей партии представлено принятием программных положений партии. Критерий «близость к идеальному мнению» определяется следующим образом. Пусть «идеальное партийное мнение» для i-й партии (i = 1, …, s) описывается выражением i = J p1&...& J pn, (i)k – число респондентов, п 1 ответы которых совпадают с идеальным мнением i в (n – k) пунктах программы, (i)0 – число респондентов с «идеальным партийным мнением» i, (i) – число сторонников i-й партии при опросе, К = Кi. Степень близости к идеальному мнению задается функцией (i) = p( i ) nβ ( i ) , где p(i) = (i)0n + (i)1(n – 1) + … + (i)k(n – k) + … + (i)n-11. Наконец, Р3(К) представляет согласованность (однородность) ответов респондентов изучаемой социальной общности (в частности, и электората iтой партии). Будем рассматривать согласованность ответов как характеристику их сходства, тогда вычисление степени согласованности может осуществляться следующим образом. Рассмотрим множество респондентов, имеющих мнение j: Rj = {X| J1, 0(X 1 [j]}, j = 1 …, r, число таких респондентов |Rj| = j, j = 1, …, r, |К| = 1(i) + … + r(i). Определим сходство мнений [k][j ] = [kj], |[kj]| = mkj, такое сходство имеют kj = min(k, j) респондентов. Определим совпадение первого мнения с остальными: 1 = 12m12 + 13m13 + … + 1jm1j + … + 1rm1r, 2 j r. Совпадение второго (без учета уже вошедшего в первую сумму совпадения второго с первым) 2 = 23m23 + 24m24 + … + 2jm2j + … + 2rm2r, 3 j r; и т.д. Соответственно, k = k k+1mk k+1 + k k+2mk k+2 + … + kjmkj + … + krmkr, k+1 j r; …; r-1 = r-1 rmr-1 r . Определим величину как сумму j (j = 1, …, r–1): 33 α1n, если r 1 r 1 r = α jh m jh , если r 1 . j 1 h j 1 Величина характеризует реальные сходства существующих ответов респондентов, которое отличается от максимально возможных сходств, имеющих место в случае полной согласованности мнений (когда = 1). ~ Определим величину γ для идеального случая, для чего нам понадобится определение соответствующих ~γ j (j = 1, …, r–1). Рассмотрим упорядочение 1 … r. Пусть 1 соответствует некий ответ по теме 1. Минимально возможное отличие от 1 для остальных ответов (2, …, r) – одна позиция (расхождение в ответе на один вопрос). Стало быть, максимально возможные ~ значения m1j (j = 2, …, r) – (n–1), и таких элементов – (r–1). Итак, γ 1 = 1 (n– 1) (r–1). Соответственно, идеальное 2 отличается от остальных ответов (3, …, r) также не менее чем в одной позиции, m2j (j = 3, …, r) – (n–1), и таких ~ элементов – (r–2), т.е. γ 2 = 2 (n–1) (r–2), и т.д. Тогда в идеале ~γ j = j (n–1) r 1 α1n, если r 1 ~γ max r 1 ~γ α ( r j ) (r–j) и , * = ~γ , если r 1 . Тогда степень j j = (n–1) j 1 j 1 согласованности результатов опроса социальной общности есть = γ γ* . Эмпирическое исследование второго типа задач – анализ и прогнозирование мнений респондентов, а также анализ рациональности мнений – было осуществлено на массиве данных об электоральных предпочтениях студентов старших курсов РГГУ на выборах в Государственную Думу 2003 и 2007 гг. В работе принимали участие сотрудники, студенты и аспиранты Социологического факультета РГГУ, а также студенты и аспиранты Отделения интеллектуальных систем в гуманитарной сфере Института лингвистики РГГУ. Описание респондента было осуществлено в соответствии с постулатом поведения. В анкете, разработанной для эксперимента, среди биографических данных рассматривались такие, как семейное и материальное положение, образование членов семьи и т.п. Социальные характеристики включали в себя вопросы относительно общественнополитической активности студентов, знакомства их с партийными положениями и, соответственно, отношения к ним, выбора базовых ценностей. Психологические тесты были направлены на анализ таких сторон личности, как кооперация, связанная с вниманием человека к интересам других людей, доминантность, для которой характерен акцент на защите собственных интересов, социабельность, самодостаточность. Для формализации качественного анализа данных о мнениях был выбран обратный ДСМ-метод. Решались следующие задачи. 34 (1) порождение детерминант электорального поведения, представленного парой мнение, выбор действия, где «мнение» есть выбор программных установок (без указания в исходных данных их принадлежности конкретной партии), а «действие» – выбор одной из шести заданных партий или другой, или выбор «против всех» (в 2003 г.) или отказ от участия в выборах. Иными словами, изучались расширенные высказывания J (Cj1[j], Тi), где Тi – одна из выбираемых партий, j = j, п или j = (, п) – истинностное значение, полученное применением j ДСМ-метода АПГ, где j{1, 0}, а п – число применений ДСМ-правил правдоподобного вывода. (2) предсказание электорального выбора 10% (из 231) (в 2003 г.) опрошенных студентов (у которых был зафиксирован только выбор установок, но не электоральный выбор) посредством порожденных детерминант с последующей валидацией предсказаний посредством повторного опроса после голосования; (3) выяснение некоммутативности двух технологий опросов: а). сначала – мнение, затем – электоральный выбор, б). сначала – электоральный выбор, затем – мнение. С этой целью массив опрашиваемых разбивается на две равновеликие части; (4) анализ рациональности выбора программных установок и электорального действия (выбора политической партии в том числе). Каркасом тем опроса являлись программные установки различных партий (по соответствующим проблемам – «земля», «приватизация», «СМИ», «внешняя политика», «экономика», «свобода личности», «социальная политика» и.т.п.). Например (в исследовании 2003 г.), р57: «Земля всецело должна быть в государственной собственности» (КПРФ); р61: «Социальная рыночная экономика наиболее эффективна в условиях России» (Яблоко), р68: «Необходимо узаконить итоги приватизации» (СПС), р85: «Основная угроза России исходит от США» (ЛДПР). В результате применения обратного ДСМ-метода были порождены, например, следующие зависимости (эксперимент 2007 г.): J1, 2(C1[], Т1), где С = {Ж, низкий уровень авторитарного подчинения, материальная помощь родителей, совмещение работы с учебой, бесплатное отделение, не замужем, средний уровень политической активности}, [] = {J1p1, J1p2, J1p3, J–1p4, J0p5}, T1 – Единая Россия. Здесь p1: «государственная собственность должна преобладать над частной», p2: «естественные монополии должны принадлежать государству», p3: «армия должна быть не только контрактной, но и по призыву», p4: «в формировании пенсии должно участвовать не только государство, но и работодатель», p5: «внешняя политика России должна быть ориентирована на Запад» (здесь номера элементов каркаса не совпадают с номерами вопросов в анкете). J1, 2(C1[], Т2), где С = {4 курс, низкий уровень авторитарного подчинения, материальная помощь родителей, не женат/не замужем, средний уровень политической активности}, [] = {J1p1, J–1p2, J–1p3, J1p6, J1p7, 35 J0p8}, T2 – СПС или Яблоко. Здесь p6: «СМИ должны быть независимы и от государства, и от каких-либо организаций», p7: «необходимо упрочение федерализма», р8: «одобрение Болонского процесса». Для анализа рациональности в качестве элементов – непротиворечивого множества {1, …, s} формул 1, …, s логик Jm – были выбраны формулы вида (), которые характеризовали логические связи между относящимися к одним и тем же темам пунктами программ различных партий. Например, для отношения к частной собственности на землю были сформулированы следующие зависимости: {J1p57J–1p88, J1p57J–1p84, J1p67J–1p88} и т.п. Здесь p57: «Земля всецело должна быть в государственной собственности», p67: «Продажа земли в частные руки должна быть строго ограниченной», p84: «Земля должна постепенно приватизироваться, но при условии строгого соблюдения законности», p88: «Необходима свободная без ограничений продажа сельскохозяйственных угодий». Для отношения к средствам массовой информации задана зависимость J1p77(J–1p59&J–1p69), где р59: «СМИ должны быть независимы как от монополий, так и от государства», р69: «Необходимо создать благоприятные условия для развития частных СМИ и их разнообразия», р77: «Основные каналы телевидения должны находиться в государственной собственности». Подчеркнѐм, что формирование множества – творческая задача, решение которой относится к компетенции эксперта и зависит как от собственного восприятия социологом изучаемого явления, так и от конкретных задач исследования. Поэтому в общем случае приходится считаться с неполнотой представленных связей. Соответственно, полученные значения непротиворечивости не носят абсолютного характера, а лишь позволяют упорядочить различные общности по степени непротиворечивости мнений входящих в эти общности респондентов. Для охарактеризованного выше эмпирического материала были получены следующие значения критерия (K, К+): все респонденты (231) – 0,1991, ответившие «буду участвовать в выборах» (147) – 0,163, «не буду участвовать в выборах» (26) – 0,269, «не знаю» (58) – 0,258. Для сторонников различных партий получены следующие результаты: СПС (27 сторонников), (K, К+) = 0,222; «против всех» (57), (K, К+) = 0,2105; ЛДПР (5), (K, К+) = 0,2; Яблоко (27), (K, К+) = 0,1851; «Другие партии» (11), (K, К+) = 0,1818; Единая Россия (21), (K, К+) = 0,0952; КПРФ (5), (K, К+) = 0; Народная партия (6), (K, К+) = 0. Невысокий общий уровень непротиворечивости мнений свидетельствует как о невнимательном отношении студентов к программным положениям партий, сторонниками которых они являются, так и об общей неоформленности отношения к существенным для общественнополитической жизни вопросам. Схема изучения социума в эксперименте была уточнена с учетом очевидной некоммутативности опросов по теме и по содержанию темы. Если первичным опросом является опрос относительно самой темы Т, а 36 вторичным – относительно ее содержания (т.е. Р), то весьма правдоподобно, что к ответам на вопросы из Р респондент отнесется с учетом ответа на вопрос относительно Т*. Следовательно, опрос по теме, предваряющий опрос по содержанию темы, обеспечивает аргументированное (рациональное) мнение. Полученные результаты подтвердили первичные теоретические предположения: а). сначала – мнение, затем – электоральный выбор, (K, К+) = 0,169; б). сначала – электоральный выбор, затем – мнение, (K, К+) = 0,285. В обоих экспериментальных исследованиях для сторонников различных партий были вычислены значения описанных выше критериев рациональности – непротиворечивости , близости к «идеальному мнению» , согласованности мнений , – определено отношение частичного порядка ≼ для полученных значений критериев и построена диаграмма этого отношения. Нельзя не сказать о содержательном различии описанных характеристик рациональности результатов опроса. Степень непротиворечивости есть скорее комплексная характеристика когнитивных способностей респондентов различать заложенные исследователем связи между вопросами, описывающими заданную тему, и, разумеется, одинаковым образом вычисляется для различных по тематике опросов. Степень согласованности характеризует близость взглядов респондентов друг другу относительно некоторой темы, и может касаться как электорального выбора, так и любых других тем, объединяющих респондентов в некоторую общность. Наконец, близость к «идеальному мнению» – наиболее соответствующая электоральным опросам характеристика, поскольку говорит не просто о сходстве ответов, но о сходстве их с «единственно правильным» множеством ответов. Введение нестатистических количественных величин, характеризующих социальную общность и опрос мнений, расширяет возможности интерпретации результатов качественного анализа, частично объективизируя их. Более того, интеллектуальный анализ социологических данных средствами ДСМ-рассуждений порождает нетривиальную схему связи качественных и количественных данных: отношения 1*, 2* и *3 отображаются в количественные характеристики (, , ), которые затем представляются отношениями между кортежами числовых данных , , (в виде диаграмм состояний рациональности). Нетривиальной особенностью описанного формализованного качественного анализа социологических данных является пополнение базы знаний доопределенными посредством вывода по аналогии примерами отношения 1*, а также возможность расширения базы фактов БФ на основе абдуктивного принятия (непринятия) гипотез. Множество респондентов, участвующих в опросе, R = {X | J,0(X1[])&(K)}, [] = { J p1, ..., 1 J pn}, {1, 1, 0}, пополняется гипотезами о наличии у заранее не п 37 определившихся со своими мнениями респондентов тех или иных вариантов ответов, полученными средствами ДСМ-метода. Это означает реализацию предсказательного опроса. Пусть R* множество респондентов, мнение которых не представлено в исходной БФ: X((XR*)(J(, 0)(X1[])&(K))). В процессе реализации ФКАСД происходит предсказание возможной оценки отношения для некоторых респондентов, образующих множество R* = {X | (J,n(X1[])&({1, 1, 0}))&(n0)&(K)}. Предсказанные мнения (на п-м шаге ДСМ-рассуждений) представлены множеством Kn* = K1,n*K– где K,n* = {|XJ, n(X1[])&(XR*)&(n1)} – 1,n*K0,n*K,n*, множество предсказанных мнений с оценкой , {1, 0}, K,n* = {|XJ(, n)(X1[])&(XR*)&(n1)}. В предсказательном опросе такой параметр, как стабилизированное множество ответов К, с порождением предсказаний может меняться. Соответственно, меняются значения вычисленных характеристик рациональности – *, *, *. Таким образом, мы имеем дело с предсказанием возможной рациональности социальных сообществ, и сравнение исходных и новых характеристик представляет несомненный интерес. Предсказательные опросы могут быть представлены следующими структурами. Простой эмпирический предсказательный опрос Ompr, = Jm, J, Р, K, R, X1Y, V 3W, где Vin() множество «внутренних» (эмпирических) истинностных значений бесконечнозначной ДСМ-логики. Vin() = {, n| ({1, 1, 0})&(nN)}{(, n)| nN}, N – множество натуральных чисел. Ompr,е = Jm, J, Р, , K, R, X1Y, V 3W – расширенный эмпирический предсказательный опрос. Omа ,pr е = Jm, J, Р, , K, R, X1Y, V 3W, А, { Gi }1i|R| – расширенный аргументационный предсказательный опрос. Отметим, что анализ мнений и реализация предсказательного опроса средствами ДСМ-рассуждений является основанием для конкретизации тзначного опроса как четырѐхзначного – с четырьмя типами истинностных значений {+1, –1, 0, }, используемых в ДСМ-логике. Соответственно, анализ непротиворечивости проводится с использованием метода аналитических таблиц для логики JА4. Напомним, что процедура абдуктивного принятия гипотез в ДСМметоде, предусматривающая возможность интерактивного расширения исходных данных в случае недостаточной объясненности имеющихся фактов полученными гипотезами, также приводит к изменению R и, соответственно, К. А это естественным образом влечет вычисление значений критериев рациональности для новых данных с их возможным изменением. Кроме того, расширение БФ на основании требования абдуктивного принятия гипотез позволяет ввести еще одну численную характеристику – уровень каузальной 38 полноты, определяемый как отношение числа объясненных с помощью порожденных ДСМ-гипотез исходных фактов к общему числу фактов в БФ. Если в процессе пополнения БФ этот уровень растет, можно говорить об абдуктивной сходимости ДСМ-рассуждения. В Четвѐртой главе предлагается рассмотрение двух подходов к реализации познавательной схемы «анализ данных – предсказание – объяснение». Первый, конкретизирующий уточнение этой схемы синтезом познавательных процедур «индукция – аналогия – абдукция» и представляющий класс когнитивных рассуждений, реализован в ДСМ-методе автоматического порождения гипотез. Второй восходит к Качественному сравнительному анализу (QCA) американского социолога Ч. Рейджина и использует для поиска сходства социологических объектов аппарат булевой алгебры. Дополнение логико-алгебраических процедур поиска сходства QCA адекватными процедурами вывода по аналогии и абдуктивного объяснения позволило говорить о реализации общей эвристической схемы «сходство – аналогия – абдукция» (AlAnAb). Для Jm-логик, являющихся средством формализации m-значного опроса, верна теорема о представимости всякой не эквивалентной 0 формулы логики высказываний Jm посредством совершенной дизъюнктивной нормальной формы Jm-СДНФ (Jm-С) и притом единственным образом. Формулируется обобщение алгоритма Куайна для перевода Jm-СДНФ в сокращенные Jm-ДНФ. Применяя последовательно, пока это возможно, «обобщенное склеивание» и поглощение к формуле логики Jm (в нашем случае – к дизъюнкции мнений i ≖ J p1&...& J pn, v(i)[pj] = j(i), j(i)Vm, j = (i ) 1 (i ) n 1, …, n, i = 1, …, m из начального состояния БФ), получим – сокращенную ДНФ формулы . Полученные импликанты используются для определения отношения причинности. Рассмотрим опрос для стандартной 4-х-значной ДСМ-логики, когда отношение к теме характеризуются оценками {+1, –1, 0, }. Опрос относительно элементов каркаса может быть m-значным с соответствующим использованием Jm-логик для порождения импликант и отношения каузальности. Сходство мнений в ДСМ-методе при этом есть теоретикомножественное сходство составов мнений и не зависит от значности опроса. Без ограничения общности можно считать, что и внутренний опрос представлен вариантами ответов +1 («да»), –1 («нет»), 0 («и да, и нет»), (не определено). Ответом i-го респондента по теме опроса Т будет максимальная конъюнкция i ≖ J p1&...& J pn, где i(j) {1, 0, }, i = 1, …, n; j = 1, …, 4n. n (i ) 1 (i ) n Пусть в БФ представлено множество респондентов R0 = R0(+1)R0(–1) R0(0) R0(), где R0() = {X|J, 0(X1[])&(K)}, {+1, –1, 0}, R0() = {X|J(, 0)(X1[])&(K)}, R0()R0()= для . Аналогично, соответствующие мнения представлены множествами К0() = () {|XJ, 0(X1[])&(K)}, {+1, –1, 0}, К0 = {| XJ(, 0)(X1[])& (K)}. 39 В случае, если выбор отношения к теме (и/или элементам каркаса) осуществляется на основе аргументов «за» и «против» (с использованием логики аргументации), множества мнений задаются непротиворечиво: ( К0()К0()=), , {+1, –1, 0, }. Однако в общем случае это не обязательно. Для возможны также варианты: а). (К0() = К0()); б). (К0()К0() = К0()); в). ((К0()К0() )&((К0()К0() = К0()) (К0()К0() = К0()))). Для всех этих случаев в процессе ДСМ-рассуждения могут быть порождены противоречивые гипотезы (разумеется, если сходства соответствующих респондентов также совпадут), поскольку (+)- и (–)гипотезы являются в ДСМ-методе взаимно фальсифицирующими. Однако и схема AlAnAb может быть дополнена соответствующими процедурами. Рассмотрим определенные выше множества мнений К0(1) = {1,…, s }, 1 К0 = {1,…, s }, К0 (–1) 2 респондентов R0 (1) (0) = {1,…, s } и соответствующие множества 3 = {X1, …, X m }, R0 1 (–1) = {X1, …, X m }, R0(0) = {X1, …, 2 X m }. Для каждой СДНФ 1 … s , i = 1, 2, 3, с помощью обобщенного i 3 алгоритма Куайна строятся сокращенные ДНФ (1 … s ) ≖ 1 … r i () с соответствующим множеством импликант [] 0}. Каждой импликанте j из [] () i = {1, …, r }, {+1, –1, i поставим в соответствие такое множество К0 j мнений , что покрывается импликантой j, К0()j = { | j ⊏ }, j = 1, …, ri, i = 1, 2, 3. Соответственно, множество субъектов, мнение которых есть элемент К0()j, обозначим R0()j = {X| J1,0(X1[q])&qК0()j}, R0()j = { X j , …, X j }. Сходство элементов R0()j – всех Х таких, что их мнение () 1 h покрывается импликантой j – обозначим V()j, V()j = h X k 1 jk . Тогда отношение каузальности С()(V()j, j) будет представлено парами V()j, j (Vj, j = 1, …, ri, i = 1, 2, 3). Итак, V()j – детерминанта мнения qК0()j, V()j Х, J, 0(X1 [q]). Множеству импликант []() соответствует множество детерминант {V()1, …, Vr }. i Абдуктивное объяснение исходных примеров из БФ в этом случае имеет место всегда, если только сходство V()j респондентов, мнение которых покрывается импликантой j, не пусто. Предикат объяснения примеров из БФ – J, 0(Х1Y), {+1, –1, 0} – импликантами может быть записан в виде Е()(Х,Y)⇌V()((V()X)&(V())&([]Y)&С()(V(), )&J, 0(Х1Y)), где [] – множество атомов, входящих в импликанту , [] = { J pi , …, i1 1 J pi }. ik k Предикат для вывода по аналогии – для доопределения отношения к теме субъектов, описание которых представлено в БФ – может быть уточнен (по сравнению с простым булевским – двузначным – опросом). Вследствие того, что респонденты с разным отношением к теме могут иметь одинаковые 40 мнения, возможны импликанты , входящие одновременно в разные множества []() и []() (, , {+1, –1, 0}), и мнения, покрываемые импликантами для разных и одновременно. Следовательно, для порождения, например, гипотезы J1,2(Х1Y) необходимо проверить, выполняется ли предикат П+(Х, Y) ⇌ V(+)((V(+)X)&(V(+))& ([]Y)&С(+)(V(+), )&(([]Y)(V(–)(С(–)(V(–), )& V(–)X) V(0)(С(0)(V(0), )&V(0)X))). П–(Х, Y) определяется аналогично. Поскольку возможно существование одних и тех же мнений у респондентов с различным отношением к теме, может быть определен также предикат П0(Х, Y) ⇌ V(+)((V(+)X)&(V(+))&([]Y)&С(+)(V(+), )& V(–)((V(–)X)&(V(–))&([]Y)& С(–)(V(–), ))V(0)((V(0)X)& (V(0))&([]Y)&С(0)(V(0), ))). П(Х, Y) ⇌ (П+(Х, Y)П–(Х, Y)П0(Х, Y)). Порождение импликант предполагает замкнутость мира – представленные в БФ примеры рассматриваются как полное описание возможного проявления эффектов поведения (мнения). Вследствие этого, даже при наличии итеративной процедуры доопределения с помощью предложенных предикатов корректное доопределение возможно только для мнений из множества К, которые уже встречались в БФ. Использование логических средств для интеллектуального анализа эмпирических социологических данных предоставляет исследователю возможности не только для выявления каузальных зависимостей, но и для предсказания неизвестных ранее вариантов поведения (мнений) и, что особенно нетривиально, для оправдания принятых гипотез, и тем самым может рассматриваться как когнитивный инструмент анализа социологических данных. При этом каждый из представленных вариантов формализованных когнитивных эвристик «сходство – аналогия – абдукция» обладает своими возможностями. Гипотезы о причинах, порождаемые в алгебраическом подходе, являются максимальными по числу использовавшихся при их порождении примеров (что, соответственно, повышает степень их правдоподобия), однако число таких гипотез меньше числа ДСМ-гипотез. При этом по самой процедуре построения множества гипотез о каузальных зависимостях в этом подходе степень каузальной полноты, как правило, превышает аналогичный показатель для ДСМ-метода. Причиной этого является более емкий характер абдуктивного объяснения в ДСМ-методе – здесь требуется объяснить все свойства объектов, алгебраический же подход довольствуется покрытием имеющихся свойств соответствующими импликантами. В алгебраическом подходе, в отличие от ДСМ-метода, не реализуется формальное доопределение примеров с ранее не встречавшимися свойствами (мнениями). Отсюда – отсутствие последовательного и повторяющегося использования процедур порождения причинных зависимостей и доопределения неизвестных свойств объектов, которое столь существенно для формирования стратегии ДСМ-рассуждения. 41 Эти различия обусловлены, в первую очередь, исходными онтологическими предпосылками, характеризующими области применимости обоих подходов. ДСМ-метод изначально ориентирован на открытые предметные области, где эмпирические данные и знания неполны, процедуры извлечения знаний из фактов включают правдоподобные рассуждения, а данные и знания могут пополняться не только за счет порожденных гипотез, но и внешним образом, на основании признания недостаточности полученных результатов. ДСМ-метод есть инструмент машинного (индуктивного) обучения. Алгебраический же подход создавался для анализа имеющихся данных в предположении, что ничем иным исследователь не располагает (к примеру, когда число примеров заведомо ограничено или провести новый эксперимент, опрос не представляется возможным). Это лишний раз напоминает о необходимости выбора средств анализа, адекватных природе исследуемой области. В Главе 5 описываются формальные средства ситуационного расширения ДСМ-метода автоматического порождения гипотез – прямого («от причины – к следствию», сходство субъектов поведения влечѐт сходство их поведения) и обратного («от следствия – к причине», сходство мнений означает сходство индивидуумов, выражающих эти мнения) типов рассуждения. При осуществлении социальных взаимодействий несомненное влияние на поведение субъекта оказывают внеличностные, ситуационные факторы, способствующие или препятствующие поведению. По мнению К.Р. Поппера22 введение знаний о ситуации сообщает социологическим рассуждениям объективный характер и устраняет психологизм как средство анализа социального поведения. Необходимость учета ситуации подтверждается современными исследованиями в области социальной психологии. К такому же заключению привѐл опыт анализа коллективного поведения рабочих, описанный выше. Указанные соображения послужили основой перехода от изучения отношения «субъектповедение» к отношению «субъект, ситуация поведение», которому соответствует исходный предикат P(X,Y,S), интерпретируемый как «субъект X обладает (не обладает) множеством свойств Y в ситуации S». В результате индуктивного анализа порождается предикат причинности Ri(V,S,W) – «подмножество характеристик V и фрагмент ситуации S есть причина наличия (отсутствия) множества свойств W». Ri (i=1, 2, 3, 4) характеризует структуру мира – насколько в ней существенны сам объект и ситуация проявления свойств. Пусть R=R1R2R3; R1R&(V&S=); R2R&(V&S); R3R&(V=&S); R4=R. Изучение влияния ситуаций на поведение потребовало расширения ДСМ-языка включением переменных S, S1,…, Sn … и констант 22 Поппер К. Логика социальных наук // Эволюционная эпистемология и логика социальных наук. М.: Эдиториал УРСС, 2000. С. 298 – 313. 42 S , S1 ,..., S n …3-го сорта для ситуаций, а также задания булевой алгебры ситуаций B3 = 2 U ,, U(3), , , , где U(3) = {s1, …, sq} – множество ситуационных параметров. Решающий предикат тернарного положительного сходства-2 3 ~ непараметрический вариант которого используется в 2 M a , n (V,W,S0,k), индуктивных п.п.в.-1, имеет структуру, сходную со структурой предиката простого сходства. Индекс «2» указывает на реализацию причинной зависимости R2, где существенными детерминирующими факторами являются как особенности личности, так и внешние обстоятельства (V&S). Подформула XYS((J(1,n)P(X,Y,S)&U(J(1,n)P(X,U,S) (3) k UY)&(VX)&(S0S))(WY&W&( i1 (X=Xi))) описывает эмпирическую зависимость (ЭЗ), прогнозируемую как искомое причинноследственное отношение («подобъект V есть причина наличия свойств W в ситуации S0»). Эта зависимость есть результат сходства V рассматриваемых субъектов поведения и ситуаций S0 поведения (V&S0). Подформула k & (J(1,n)P(Xi,Yi,Si)&U(J(1,n)P(Xi,U,Si)UYi)) описывает экзистенциальное i 1 условие (ЭУ), характеризующее рассматриваемое множество примеров. Предикат тернарного отрицательного сходства формулируется аналогично. Конструктивное порождение оценки «фактическое противоречие» посредством правил правдоподобного вывода позволяет в рамках ДСМметода осуществлять логический анализ модели конфликта. К числу онтологических особенностей социальной реальности следует отнести наличие в исходных данных утверждений с оценкой 0 – «эмпирическое противоречие», т.е. фактов вида J(0, n)P(С,А, S ). Для анализа таких фактов формулируется предикат тернарного конфликтного сходства-2. Правила правдоподобного вывода 1-го рода п.п.в.-1 для порождения гипотез о причинах могут быть записаны в виде (при наличии противоречий в исходной БФ): 3 3 3 0 J(,n)R(V,S0,W), 2 M a ,n (V,W,S0)& 2 M a ,n (V,W,S0) & 2 M a ,n (V,W,S0) (I)(+)2 . J1,n+1R2(V,S0,W) Соответственно, записываются правила (I)(–)2 и (I)()2 – по аналогиями с правилами простого ДСМ-метода. В соответствии с условием М-полноты (0)правило принимает вид 3 3 3 0 J(,n)R(V,S0,W), 2 M a ,n (V,W,S0) 2 M a ,n (V,W,S0)& 2 M a ,n (V,W,S0) (I)(0)2 . J0,n+1R2(V,S0,W) 43 Разумеется, множество М-предикатов для ситуационного варианта ДСМметода может быть расширено с помощью усиливающих добавок, как это сделано выше. Для переноса найденных закономерностей на случай неопределѐнности в БФ формулируются решающие предикаты для п.п.в.-2. Эти предикаты, как и описанные в Главе 2, включают подформулы, описывающие вхождение в доопределяемый пример полученных ранее гипотез о причинах k k & XiSi(J(1,n)R2(Xi,Si,Yi) &XiV&SiS)&( Yi=W). В предикат также i 1 i 1 входит запрет на включение в рассматриваемый объект V отрицательных или противоречивых причин Z,S для любых подмножеств U свойств из W: U((UW&U)ZS(J(-1,n)R2(Z,S,U)&ZV&SS)). Аксиомы каузальной полноты для ситуационного варианта ДСМ-метода формулируются по аналогии с приведѐнными в Главе 2. 3 АКП(+) : XYSkV1VkW1WkS1Sk(J1,0P(X,Y,S) k n( & J(1,n)R2(Vi,Si,Wi)&(ViX)& i 1 (SiS)& (Vi)&(Si) &(Wi))& k ( i1 Wi=Y))). Глава 6 представляет результат исследований как создание инструмента для решения задач когнитивной социологии – изучения как собственно познавательной деятельности в исследовании социальных явлений, так и влияния познавательной активности индивидуумов на поведение. Предложенные средства предполагают совместное использование стандартных эвристик формирования массива данных (т.е. предварительной содержательной работы социолога) и формализованных эвристик анализа данных для решения социологических проблем на основе эмпирического материала. Эвристики формализуются средствами ДСМ-метода автоматического порождения гипотез в Интеллектуальных системах типа ДСМ. Особенностью реализации предложенной технологии анализа социологических данных в ИС-ДСМ является имитация ряда познавательных способностей естественного интеллекта – как в автоматическом, так и в интерактивном режиме. Это и автоматическое порождение аргументации на основе аргументационных функций респондента, и абдуктивное объяснение имеющихся фактов (имитирующее рефлексию и объяснение как ответ на вопрос «Почему?»), и, что особенно важно, реализация познавательного процесса – синтеза познавательных процедур. Этот ряд дополняется собственными когнитивными инструментами ДСМ-метода: структурированным описанием субъекта, представляющим источник мотивации его поведения (действий, установок, мнений), представлением мнения как аргументированного отношения к теме, стабилизацией опроса, измерением рациональности на основе качественного анализа социологических данных, анализом противоречивости мнений с учетом 44 объективного (внешнего) знания (предложенных исследователем зависимостей между элементами опроса). Рассмотренная технология опроса позволяет также зафиксировать явным образом влияние когнитивных эффектов на формирование мнений. Это отображается в некоммутативности различных вариантов проведения опроса относительно рационального восприятия элементов опроса, что было отмечено в реальном эксперименте. Составная часть Решателя ДСМ-системы – Рассуждатель – реализует процедуры ДСМ-метода автоматического порождения гипотез, формализующие соответствующую эвристику анализа данных. Интеллектуальная система для анализа эмпирических социологических данных должна обеспечивать выбор стратегий исследования в зависимости от структуры предикатов и правил – прямой или обратный методы, ситуационный вариант ДСМ-метода, рассмотрение противоречивых примеров из исходной БФ («анализ конфликта»). В рамках выбранной стратегии необходимо иметь возможность реализации усиливающих добавок к решающим предикатам и формирования правил правдоподобного вывода первого рода из различных по силе методов разного знака. Важной составляющей такой системы является подсистема обнаружения законов и тенденций на основе выявления взаимной непротиворечивости стратегий. Вычислитель ИС-ДСМ для анализа социологических данных включает подсистему вычисления значений критериев рациональности. Интеллектуальная система способна полноценно реализовать познавательный процесс при наличии развитых инструментов накопления знаний (Информационная среда), а также восприятия и отображения (Интеллектуальный интерфейс). ИС эффективно решает задачи ФКАСД, если при наличии описанной структуры превращается в автоматизированное рабочее место социолога, обеспечивающее проведение качественного исследования. Сюда входит хранение, структурирование и управление данными (препроцессинг) в едином информационном пространстве, применение различных стратегий анализа данных, реализуемых Решателем (ДСМ-метод или QCA), использование полученных результатов для последующих форм анализа (например, анализа рациональности мнений). Отметим, что препроцессинг – подготовка данных и уточнение модели предметной области – может осуществляться как автоматически (с помощью специальных диагностических процедур, позволяющих выбрать наиболее адекватные стратегии Решателя), так и в интерактивном режиме с привлечением инженерии знаний. В технологическом смысле можно рассматривать Информационную среду не просто как совокупность БФ и БЗ, но как активную оболочку ИС, обеспечивающую функционирование всех компонентов системы как единого целого. Здесь не только осуществляется надежное и безопасное хранение и управление данными, но и организуются и упорядочиваются процессы взаимодействия пользователей с Решателем в целях максимально эффективного использования возможностей предлагаемых технологий 45 качественного анализа данных. Интеллектуальный интерфейс обеспечивает возможность внесения изменений в Информационную среду, предоставляет различные инструменты препроцессинга и предлагает средства интеграции с другими прикладными системами. Последнее обстоятельство особенно важно учитывать при решении задачи анализа социологических данных, где огромную роль играют укоренившиеся традиции статистической обработки результатов эмпирических исследований. Одним из наиболее широко распространенных инструментов такого анализа является пакет SPSS (Statistical Package for the Social Sciences), интеграция с которым позволяет комбинировать в одном исследовании инструменты не только качественного, но и количественного анализа. В таком варианте ИС может характеризоваться как специфическая интегрированная: наряду с Рассуждателем Решатель включает также внешний Вычислитель и, соответственно, Синтезатор, регулирующий взаимодействие Рассуждателя и Вычислителя. Примерами реализации Интеллектуальных систем для анализа социологических данных на основе изложенных принципов являются созданные под руководством автора диссертации Обучающая ДСМ-система для анализа социологических данных (дипломная работа студентки Отделения интеллектуальных систем РГГУ Феофановой Т.Л.) и Интеллектуальная система Socio Magic для формализованного качественного анализа социологических данных (кандидатская диссертация аспирантки ВИНИТИ РАН Бурковской Ж.И.). В Заключении сформулированы основные результаты работы и обсуждаются открытые проблемы. Заключение В результате работы созданы основания и разработан инструмент для применения методов современного интеллектуального анализа данных для решения задач когнитивной социологии – формализации самого процесса порождения нового знания из качественных эмпирических социологических данных и анализа влияния когнитивной активности индивидуумов на социальное поведение. Предложены средства представления плохо структурированных данных и знаний о субъекте и его поведении. Развит аппарат интеллектуального анализа социологических данных с синтезом познавательных процедур для извлечения закономерностей из эмпирических данных. Таким образом, разработаны принципы формализованного качественного анализа социологических данных. Это означает, что созданы научные основы современных технологий анализа эмпирических социологических данных и обнаружения и извлечения из них новых знаний. Созданный когнитивный инструмент реализуется в современных интеллектуальных системах (ИС типа ДСМ). Разработанные теоретические принципы и логический аппарат формального представления закрытых и предсказательных опросов предоставляют возможности для решения задач анализа и предсказания 46 результатов реальных опросов. Развитие средств формальной аргументации объективизирует субъективные социологические данные, в результате чего они оказываются основой дальнейшего анализа средствами правдоподобных рассуждений. Аргументационная семантика для формирования оценок результатов опросов включается в общую структуру логического аппарата распознавания и предсказания рациональности мнений. Использование числовых характеристик рациональности является реализацией идеи содержательного отображения отношений в измеряемые параметры. Предлагаемые средства интеллектуального анализа социологических данных не могут заменить содержательной работы исследователя-социолога, а представляют собой лишь формализованную оболочку для решения некоторых социологических задач. Необходим диалог профессионального (сциентистского) применения исследовательских процедур и глубокого (гуманистического) понимания сущности изучаемых социальных проблем. Подобное содружество представляет собой ответ на вызов потребностей формализации качественного анализа социологических данных и расширяет возможности обработки эмпирических социологических данных. Стандартные эвристики формирования массива данных должны предшествовать формализованным эвристикам анализа данных. Подготовка данных в соответствии с требованиями условий применимости формальных средств – ДСМ-метода автоматического порождения гипотез и соответствующих интеллектуальных систем – позволяет надеяться на получение полезных результатов, что и было продемонстрировано на примере решения конкретных задач анализа поведения рабочих на конфликтных предприятиях (совместно с Институтом социологии РАН) и изучения рациональности электоральных предпочтений студентов (совместно с РГГУ). Использование интеллектуального анализа социологических данных способствует объективизации эмпирических социологических исследований, развитию логики и методологии социальных наук. С другой стороны, потребности такого анализа являются стимулом для развития компьютерной поддержки таких исследований, и, стало быть, средств интеллектуальных систем. Взаимодействие идей классической социологии и методов интеллектуального анализа социологических данных позволяет говорить о возникающем разделе современной когнитивной социологии. Основные публикации по теме диссертации Работы, опубликованные в рецензируемых журналах, входящих в Перечень ВАК: 1. Данилова Е. Н., Михеенкова М. А., Климова С. Г. Возможности применения логико-комбинаторных методов для анализа социальной информации // Социология: методология, методы, математическое моделирование, 1999, № 11, с. 142 – 160. 47 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. Климова С.Г., Михеенкова М.А., Панкратов Д.В. ДСМ-метод как метод выявления детерминант социального поведения // НТИ, сер.2, 1999, № 12, с.20 – 26. Финн В.К., Михеенкова М.А. О ситуационном расширении ДСМметода автоматического порождения гипотез // НТИ, сер.2, 2000, № 11, с. 20 – 30. Гусакова С.М., Михеенкова М.А., Финн В.К. О логических средствах автоматизированного анализа мнений // НТИ, сер.2, 2001, № 5, с. 4 – 24. Финн В.К., Михеенкова М.А. О логических средствах концептуализации анализа мнений // НТИ, сер.2, 2002, № 6, с. 4 - 24. Финн В.К., Михеенкова М.А., Бурковская Ж.И. О логических принципах анализа электорального поведения // НТИ, сер. 2, 2004, № 8, с. 18 – 22. Михеенкова М.А., Феофанова Т.Л. Обучающая ДСМ-система для анализа социологических данных // Вестник Российского государственного гуманитарного университета. Серия «Информатика. Информационная безопасность. Математика», 2009 г., вып. 10, с. 152 – 169. Михеенкова М.А. О принципах формализованного качественного анализа социологических данных // Информационные технологии и вычислительные системы, 2009, № 4, с. 40 – 56. Михеенкова М.А. О логических средствах интеллектуального анализа социологических данных // Искусственный интеллект и принятие решений, 2010, № 1, с. 20 – 32. Михеенкова М.А. О формализованных эвристиках качественного анализа социологических данных // Вестник Российского государственного гуманитарного университета. Серия «Информатика. Информационная безопасность. Математика», 2010, вып. 12 (55), с. 193 – 213. Михеенкова М.А., Финн В.К. Об одном подходе к распознаванию рациональности в коллективах агентов // Искусственный интеллект и принятие решений, 2010, № 3, с. 20 – 32. Михеенкова М.А. Возможности компьютерной поддержки качественных исследований в социологии // НТИ, сер. 2, 2011, № 8, с. 1 – 21. Михеенкова М.А. Интеллектуальный анализ социологических данных и некоторые задачи когнитивной социологии // НТИ, сер.2, 2011, № 10, с. 1 – 17. Работы, опубликованные в других изданиях: 14. Михеенкова М.А., Финн В.К. Интеллектуальные системы для анализа социологических данных: задачи, логика, архитектура // «Математическое моделирование социальных процессов», 2004, вып. 6. 15. Михеенкова М.А., Финн В.К. Логические средства формализации закрытых опросов и проблемы распознавания рациональности мнений // 48 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. Математическое моделирование социальных процессов, 2005, вып. 7, с. 127 – 135. Финн В.К., Михеенкова М.А. Логические средства анализа рациональности мнений // Математическое моделирование социальных процессов, 2006, вып. 8, с. 37 – 40. Финн В.К., Михеенкова М.А. Формализованный качественный анализ социологических данных и проблемы когнитивной социологии // Математическое моделирование социальных процессов, 2007, вып. 9, с. 120 – 125. Finn V.K., and Mikheyenkova M.A. “Quantofrenia” by P.A. Sorokin and Formalized Qualitative Analysis // European Society or European Societies: a View from Russia. Ed. V.A. Mansurov. Moscow – Lisbon, 2009, pp. 189 – 192. Finn V.K., Mikheyenkova M.A. Plausible Reasoning for the Problems of Cognitive Sociology // Logic and Logical Philosophy, Vol. 20 (2011), pp. 113 – 139. Михеенкова М.А., Финн В.К. Интеллектуальный анализ данных и проблемы когнитивной социологии // Математическое моделирование социальных процессов, 2011 (в печати) Михеенкова М.А. Принципы когнитивной социологии и реализация познавательной активности «анализ данных – предсказание – объяснение» // Труды Российско-Британской конференции «Идеи Д.С. Милля об индукции и логике наук о человеке и обществе в когнитивных исследованиях и системах искусственного интеллекта», Москва, 15 – 17 июня 2011 г. (в печати). Работы, опубликованные в сборниках Трудов конференций: Михеенкова М.А. О контекстном варианте причинно-следственного отношения в ДСМ-методе автоматического порождения гипотез // 4-я международная конференция «Интеграция. Информационные технологии. Телекоммуникации. НТИ-99», Москва, Март 17-19, 1999, Труды конференции, с. 275 – 280. Михеенкова М.А., Финн В.К. Правдоподобные рассуждения с информацией о ситуации // VII Национальная конференция с международным участием «Искусственный интеллект-2000», Переславль-Залесский, Октябрь 24-26, 2000, Труды конференции, с. 50 – 58. Михеенкова М.А., Панкратов Д.В. Об интеллектуальной системе анализа социального поведения // VII Национальная конференция с международным участием «Искусственный интеллект-2000», Переславль-Залесский, Октябрь 24-26, 2000, Труды конференции, с. 76 – 82. Финн В.К., Михеенкова М.А. Проблемы и логические средства интеллектуального анализа социологических данных // VIII Национальная конференция с международным участием 49 26. 27. 28. 29. 30. 31. 32. 33. 34. «Искусственный интеллект-2002”, Коломна, Октябрь 8-11, 2002, Труды конференции в 2 томах, т. 1, с. 15 – 30. Финн В.К., Михеенкова М.А. Анализ социологических данных средствами интеллектуальных систем // 6-я Международная конференция «НТИ-2002»: «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 16 – 18 октября, 2002, Материалы конференции, с. 434 – 436. Финн В.К., Михеенкова М.А. Логические средства анализа мнений // Сорокинские чтения-2002, «Актуальные проблемы социологической науки и социальной практики», Москва, Декабрь 17-18, 2002, Сборник научных докладов в 3 томах, т.3, с.93-106. Михеенкова М.А., Финн В.К. Интеллектуальные системы для анализа социологических данных: задачи, логика, архитектура // II Всероссийский социологический конгресс «Российское общество и социология в XXI веке: социальные вызовы и альтернативы», Москва, 30 сентября – 2 октября, 2003, Тезисы докладов и выступлений в 3 томах, т. 1, с. 544 – 545. V.K. Finn, M.A. Mikheyenkova “Non-statistic method for sociological data analysis and the problem of rational opinion choice», Международная конференция «Математическое моделирование социальной и экономической динамики (MMSED-2004)», Москва, 23 – 25 июня, 2004, Бурковская Ж.И., Михеенкова М.А., Финн В.К. Об интеллектуальной системе для анализа электорального поведения // IX Национальная конференция с международным участием «Искусственный интеллект2004», Тверь, Сентябрь 8-11, 2004, Труды конференции в 2 томах, т.1, с.120-128. Михеенкова М.А., Финн В.К. Проблемы создания интеллектуальных систем для анализа социального поведения // «Философия искусственного интеллекта», Материалы Всероссийской междисциплинарной конференции, Москва, 17-19 января, 2005, с. 366368. Михеенкова М.А., Финн В.К. Логика интеллектуальных систем как средство системного анализа в социологии // Первая международная конференция «Системный анализ и информационные технологии» САИТ-2005, Труды конференции, Переславль-Залесский, 12-16 сентября 2005 г., с. 31-35. Михеенкова М.А., Финн В.К. Об одном варианте формализованного качественного анализа социологических данных // X Национальная конференция с международным участием «Искусственный интеллект2006», Обнинск, Сентябрь 26-28, 2006, Труды конференции в 3 томах, т.1, с. 284 – 292. Михеенкова М.А., Финн В.К. Анализ мнений и многоагентные системы // X Национальная конференция с международным участием 50 35. 36. 37. 38. 39. 40. 41. 42. 43. «Искусственный интеллект-2006», Обнинск, Сентябрь 26-28, 2006, Труды конференции в 3 томах, т. 3, с. 902 – 907. Михеенкова М.А., Финн В.К. Формализованный качественный анализ социологических данных и проблемы когнитивной социологии // III Всероссийский социологический конгресс «Глобализация и социальные изменения в современной России», Москва, 3 – 5 октября, 2006, Тезисы докладов и выступлений, т. 11, с. 151 – 155. Михеенкова М.А., Финн В.К. Правдоподобные рассуждения и булева алгебра для анализа социологических данных (проблемы когнитивной социологии) // Вторая международная конференция «Системный анализ и информационные технологии» САИТ-2007, Труды конференции, Обнинск, 10-14 сентября 2007 г., т. 1., с. 153 – 155. Финн В.К., Михеенкова М.А. К формальному определению закрытого социологического опроса // Тезисы докладов III Всероссийской научной конференции Сорокинские чтения: «Социальные процессы в современной России: традиции и инновации» в 5 томах, Москва, 4-5 декабря 2007, М.: Университет. Книжный дом, 2007, Т. 1, с. 214 – 217. Михеенкова М.А., Финн В.К. Интеллектуальный анализ данных для проблем когнитивной социологии // XI Национальная конференция с международным участием «Искусственный интеллект-2008», Дубна, Сентябрь 29 – Октябрь 2, 2008, Труды конференции в 3 томах, т. 2, с. 61 – 69. Финн В.К., Михеенкова М.А., Сидорова А.В. О когнитивных эвристиках анализа социологических данных // III Всероссийский социологический конгресс «Социология и общество: проблемы и пути взаимодействия», Москва, 21 – 24 октября 2008 г., Тезисы докладов и выступлений, http://www.isras.ru/abstract_bank/1214905899.pdf Михеенкова М.А., Финн В.К. «Квантофрения» по П.А. Сорокину и формализованный качественный анализ // Международная научная конференция – Первые Санкт-Петербургские социологические чтения «Питирим Александрович Сорокин и современные проблемы социологии», С.-Пб., 16 – 17 апреля 2009 г., Материалы конференции в 2-х томах, т. 2, с. 496 – 499. Михеенкова М.А., Финн В.К. О количественных характеристиках в качественном анализе социологических данных // Третья международная конференция «Системный анализ и информационные технологии» САИТ-2009, Звенигород, 14-18 сентября 2009 г., Труды конференции, с. 191 – 196. Михеенкова М.А. Логические средства когнитивной социологии // Четвертая международная конференция по когнитивной науке, Томск, 22 – 26 июня 2010 г., Тезисы докладов в двух томах, т. 2, с. 420 – 421. Михеенкова М.А., Финн В.К. Интеллектуальный анализ данных в когнитивной социологии // XII Национальная конференция с международным участием «Искусственный интеллект-2010», Тверь, Сентябрь 20 – 24, 2010, Труды конференции в 4 томах, т. 1, с. 142 – 152. 51