Judgment under Uncertainty: Heuristics and biases Edited by Daniel Kahneman University of British Columbia Paul Slavic Decision Research A Branch of Perceptronics, Inc. Eugene, Oregon Amos Tversky Stanford University This work in preparing this book was supported by Office of Naval Research Grant N00014-79-C-0077 to Stanford University and by Office of Naval Research Contract N0014-80-C-0150 to Decision Research. Cambridge UNIVERSITY PRESS, 2001 Даниелъ Канеман П ауль Словак А м ос Тверски Принятие решений в неопределенности Правила и предубеждения П од редакцией Заслуж енного работ ника высшей ш колы Российской Федерации, доктора психологических наук, проф. Г. В. Суходольского Перевод с английского Гуманитарный Центр Харьков, 2005 УДК 1 5 9 .9 2 2 .2 7 ББК 8 8 .5 3 Научный редактор: доктор психол. наук Г. Б. Суходольский (СПбГУ), Редактор: доцент, кандидат психол. наук С. Г. Тарасов (СПбГУ) Перевод. Изд-во И нститут прикладной психологии “Гуманитарный Ц ентр” Д. К анем ан, П. Слоник, А . Т верски. П ринятие реш ений в неопределенности: П равила и предубеж дения / Пер. с англ. -X .: Изд-во Институт прикладной психологии “Гуманитарный Центр”, 2005,- 632 с. ISBN 9 6 6-8 3 2 4 -1 4 -5 Перед Вами фундамент альный т руд по психологии принятия реш ений . Ссылки на отдельные работы эт их авторов достаточно часто встречаются в академической лит ерат уре , но полный сборник эт их статей на русском язы ке опубликован впервые . Выход этой книги , безусловно , важное событие для специалист ов в области управления , ст рат егического планирования , принятия решений , поведения потребителей и m 3 . Книга представляет интерес для специалистов в области менеджмента , экономики , психологии , как в теории , тпатс и в практ ике , которые имеют дело с такой сложной и интересной областью человеческой деят ельност и , /са/с принятие решений. You сага see а fundam ental work on psychology of decision-making . The references to separate works of these authors can be found often enough in the academ ic literatu re , Z?uZ Jfre complete volume of these articles has been published in Russian for the first tim e . T7*e issue о / £/us froofe is undoubtedly an im portant event for the experts in the field of m anagem ent , strategic planning , decision-making , consumers* conduct etc . TTie froofe is о / in terest to the experts in the field of m anagem ent , econom y , psych ology , iu theory as well as in p r a c tic e , irfro d eai u;i£/i such com plex and in terestin g sphere of hum an action as decision-m aking. Все права защищены. Никакая часть данной книги не может быть воспроизведена в какой бы то ни было форме без письменного разрешения владельцев авторских прав. Права на публикацию книги на русском языке принадлежат издательству «Гуманитарный Центр». ISBN 0-521-28414-7 (англ.) ISBN 966-8324-14-5 © Cambridge University Press, 2001 © Институт прикладной психологии «Гу­ манитарный центр», перевод на русский язык, оформление, 2005 Содержание Предисловие научного редактора......................................................... 9 Предисловие авторов............................................................................... 11 Часть I: Введение....................................................................................... 1. П ринятие реш ений в условиях неопределенности: правила и предубеждения..................................................................................... 15 Часть II: Репрезентативность................................................................. 2. Вера в закон малых чисел................................................................... 37 39 3. Субъективная вероятность: оценка репрезентативности............ 49 4 .0 психологии прогнозирования........................................................ 66 5. Изучение репрезентативности.......................................................... 89 6. О ценкирецрезентативностиинаосноверепрезентативности.... 105 Часть III: Причинность и атрибуция.................................................... 7. Общепринятое положение: инф ормация не обязательно информативна....................................................................................... 121 123 8. Причинные схемы при принятии реш ений в условиях неопределенности................................................................................ 140 9. Недостатки процесса атрибуции: о происхождении и исправлении ошибочных социальных оценок.................................. 153 10. Очевидное воздействие базового значения................................... 179 17 Часть IV:Доступность............................................................................. 11. Доступность: эвристика оценки частоты и вероятности......... 189 191 12. Эгоцентрические предубеждения в доступности и атрибуции.. 208 13. П редубеждения доступности в социальном восприятии и взаимодействии........................................................................................ 220 14. Эвристика моделирования............................................................ 232 Часть V: Ковариация и контроль........................................................... 15. Субъективная оценка ковариации: суж дения, основанные на данных против суждений, основанных на теориях................ 241 16. И ллю зия контроля............................................................................ 265 17. Результаты тестов - такие, каким и Вы их себе представ­ ляете...................................................................................................... 274 18. Вероятностные рассуж дения в клинической медицине: проблемы и возможности................................................................. 286 19. Получение знаний из опыта и условно-оптимальных правил при принятии реш ения..................................................................... 308 Часть VI. Чрезмерная уверенность............................................... 20. Чрезмерная уверенность в суж дениях, основанных на конкретны х примерах.............................................................. 243 327 329 21. Сообщение о процессе обучения оцениванию вероят­ ности.............................................................................................. 337 22. Калибровка вероятностей: положение дел к 1980 г............. 351 23. Обреченным необходимо изучать прошлое: эвристики и пред убеждения в ретроспективе............................................. 383 Часть VII: Многоступенчатая оценка.................................................. 24. Оценка составных вероятностей в последовательном выборе... 403 405 25. Консерватизм в процессе обработки информации человеком... 410 26. Гипотеза угады вания в многоступенчатом выводе..................... 422 27. Заклю чения о личны х характеристиках на основе информации, восстановленной из пам яти.................. 431 ЧастьVIII: Коррективные процедуры.................................................. 28. У стойчивая привлекательность ошибочных линейных моделей при принятии реш ений..................................................... 445 29. Ж изнеспособность мифических чисел.......................................... 466 30. Интуитивное прогнозирование: предубеждения и коррек­ тирующие процедуры....................................................................... 473 31. Освобождение от предубеждения................................................... 482 32. Улучшение индуктивного вывода................................................. 508 Часть IX: Восприятие риска................................................................... 33. Ф акты против страха: понимание воспринимаемого риска........................................................................................................... 527 Часть X: Поскриптум............................................................................... 34. К вопросу о статистической интуиции........................................... 447 ^29 као 565 35. Варианты неопределенности........................................................... 582 Л итература................................................................................................ 595 Предисловие научного редактора В предлагаемой Вашему вниманию книге изложены результаты размышлений и экспериментальных исследований зарубежных ученых, малоизвестные русско­ язычному читателю. Речь идет об особенностях мышления и поведения людей при оценке и прогно­ зировании неопределенных событий и величин, таких как, в частности, шансы на выигрыш или заболевание, предпочтения на выборах, оценка профпригодности, экспертиза аварийности и многое другое. Как убедительно показано в книге, принимая решения в неопределенных усло­ виях, люди обычно ошибаются, иногда весьма значительно, даж е если они изуча­ ли теорию вероятности и статистику. Эти ошибки подчинены определенным пси­ хологическим закономерностям, которые выявлены и хорошо экспериментально обоснованы исследователями. Надо сказать, что не только закономерные ошибки человеческих решений в си­ туации неопределенности, но и сама организация экспериментов, выявляющих эти закономерные ошибки весьма интересна и практически полезна. Можно с уверенностью думать, что перевод этой книги будет интересен и поле­ зен не только отечественным психологам, врачам, политикам, разного рода экс­ пертам, но и многим другим людям, так или иначе связанным с оценкой и прогно­ зом по сути случайных социальных и личных событий. Научный редактор , доктор психологических наук , профессор СПбГУ Г £ . Суходольский , Санкт-Петербург , 2004 г . Предисловие авторов П одход к процессу принятия решений, представленный в данной книге, основыва­ ется на трех направлениях исследований, получивших развитие в 50-х и 60-х го­ дах X X столетия. Например, сравнение клинического и статистического прогно­ зирования, начатое Паулем Милом (Paul Meehl); изучение субъективной вероятно­ сти в парадигме Байеса (Bayes), представленное в психологии Бардом Эдвардсом (Ward Edwards); и исследование эвристики и стратегий рассуждения, представлен­ ной Гербертом Саймоном (Herbert Simon) и Джеромом Брунером (Jerome Bruner). Наш сборник также включает современную теорию, находящуюся на стыке про­ цесса принятия решений с другой отраслью психологического исследования: изу­ чением причинной атрибуции и бытовой психологической интерпретации, впер­ вые представленной Фрицом Хайдером (Fritz Heider). Классическая книга Мила, изданная в 1954, подтверждает тот факт, что про­ стые линейные комбинации высказываний превосходят интуитивные суждения экспертов в предсказании существенных поведенческих критериев. Не теряющее актуальности и сегодня интеллектуальное наследие этой работы, и шумная поле­ мика, последовавшая за ней, вероятно, не доказывали, что клиницисты плохо спра­ вились со своей работой, за которую, как отмечал Мил, им и не стоило бы браться. Скорее, это была демонстрация существенного несоответствия между объективны­ ми показателями успеха людей в задачах предсказания и их искренним убеж дени­ ем о собственной продуктивности. Это заключение верно не только для клиницис­ тов и клинических прогнозов: мнения людей о том, как они делают выводы и то, насколько хорошо они это делают, не могут быть приняты в качестве основания. Ведь исследователи, практикующие клинический подход часто использовали са­ мих себя или своих друзей в качестве испытуемых, а интерпретация ошибок и от­ клонений были скорее когнитивными, чем психодинамическими: в качестве моде­ ли использовались скорее впечатления об ошибках, чем действительные ошибки. С момента привлечения Эдвардсом и его коллегами идей Байеса в психологи­ ческое исследование, пенологам впервые предложили целостную и четко сформу­ лированную модель оптимального поведения в условиях неопределенности, с ко­ торой можно было сравнить принятие решений человеком. Соответствие приня­ тия решений нормативным моделям стало одной из главных парадигм исследова- ни я в области суж дения в условиях неопределенности« Это неизбежно затрагивало проблему предубеждений, к которым люди тяготеют при индуктивных выводах, и методов, которые могли бы использоваться для их коррекции. Эти проблемы рас­ сматриваются в большинстве разделов этого издания. Однако во многих ранних работах использовалась нормативная модель для объяснения человеческого пове­ дения, а такж е вводились дополнительные процессы для объяснения отклонений от оптимальных показателей. Напротив, целью исследования в области эвристик в принятии решений является объяснение как правильных, так и ошибочных суж ­ дений в терминах одних и тех ж е психологических процессов. Появление такой новой парадигмы, как когнитивная психология, оказало се­ рьезное влияние на исследование принятия решений. Когнитивная психология рассматривает внутренние процессы, ментальные ограничения, и то, как именно ограничения влияют на эти процессы. Ранними примерами концептуальной и эм­ пирической работы в этой области являлись исследование стратегий мышления Брунера и его коллег, а такж е трактовка эвристик рассуждений и ограниченной рациональности Саймона. И Брунер, и Саймон занимались стратегиями упрощ е­ ния, которые уменьшают сложность задач принятия решений для того, чтобы сде­ лать их приемлемыми для образа мышления людей. Мы включили в эту книгу боль­ шинство работ, исходя из подобных соображений. В течение последних лет большой объем исследований был посвящен эвристи­ кам суж дений, а также исследованию их эффектов. Данное издание комплексно рассматривает этой подход. В нем собраны новые работы, написанные специально для этого сборника, и уж е изданные статьи по вопросам суждений и предположе­ ний. Хотя граница меж ду суждением и принятием решения не всегда ясна, мы со­ средоточились здесь скорее на суж дении, чем на выборе. Тема принятия решения достаточно важна для того, чтобы быть предметом отдельного издания. Книга состоит из десяти частей. Первая часть содержит ранние исследования эвристики и стереотипов при интуитивном принятии решений. В части II специ­ ально рассмотрена эвристика репрезентативности, которая, в части III, расширена до проблем причинной атрибуции. Часть IV описывает эвристику доступности и ее роль в социальном суж дении. Часть V рассматривает понимание и изучение кова­ риации, а такж е показывает наличие иллюзорных корреляций в принятии реш е­ ний обычными людьми и специалистами. В части VI обсуждается проверка вероят­ ностных оценок и обосновывается распространенное явление самоуверенности в прогнозировании и объяснении. Предубеждения, связанные с многоступенчатым выводом рассматриваются в части VII. Часть VIII рассматривает формальные и не­ формальные процедуры для коррекции и улучшения интуитивного принятия ре­ шений. Часть IX суммирует изучение последствий стереотипов при принятии ре­ шений в области риска. Заключительная часть содержит некоторые современные мысли по поводу нескольких концептуальных и методологических проблем по изу­ чению эвристики и предубеждений. Для удобства все ссылки собраны в отдельном списке в конце книги. Номера, напечатанные жирным шрифтом, относятся к материалу, включенному в книгу, обозначая главу, в которой данный материал появляется. Мы использовали скоб­ ки (...) чтобы указать на удаленный материал из предварительно изданных статей. Наша работа по подготовке этой книги была поддержана Службой военно-морс­ ких исследований, Грант N00014-79-C-0077 Стэнфордскому Университету и Служ­ бой военно-морских исследований, Контракт N0014-80-C-0150 по исследованию при­ нятия решений. Мы хотим поблагодарить Пэгги Рокер, Нэнси Коллинс, Джерри Хенсона и Дона МакГрегора за их помощь в подготовке этой книги. Даниелъ Канеман Пол Словик Амос Теерски Часть I Введение 1. Принятие решений в условиях неопределен­ ности: правила и предубеждения* Амос Тверски и Даниелъ Канеман Многие реш ения основаны на убеж дениях о вероятности неопределенных событий, таких к ак , например, результат выборов, вина ответчика в суде или будущий курса доллара. Эти убеж дения обычно вы раж аю тся в заявле­ ниях типа “ я думаю, что... “, “ вероятность такова... “, “маловероятно, что... ” и т.д. И ногда убеждения относительно неопределенных событий вы раж е­ ны в численной форме к ак ш ансы или субъективные вероятности. Что оп­ ределяет такие убеждения? К ак люди оцениваю т вероятность неопределен­ ного события или значения неопределенной величины ? Этот раздел пока­ зы вает, что люди полагаю тся на ограниченное число эвристических прин­ ципов, которые сводят сложные задачи оценки вероятностей и прогнозиро­ вания значений величин до более простых операций суж дения. Вообще, эти эвристики весьма полезны, но иногда они ведут к серьезным и системати­ ческим ош ибкам. Субъективная оценка вероятности похож а на субъективную оценку фи­ зических величин, таких к ак расстояние или размер. Все эти оценки осно­ ваны на данны х ограниченной достоверности, которые обработаны соглас­ но правилам эвристики. Н априм ер, предполож ительное расстояние до объекта частично определяется его четкостью . Чем резче объект, тем ближе он каж ется. Это правило имеет некоторое обоснование, потому что на любой местности более удаленные объекты каж утся менее четкими, чем более близ­ кие объекты. Однако постоянное следование этому правилу ведет к систе­ матическим ош ибкам в оценке расстояния. Х арактерно, что при плохой видимости расстояния часто переоцениваю тся, потому что контуры объек­ тов размы ты . С другой стороны, расстояния часто недооцениваются, когда видимость хорош ая, потому что объекты каж утся более четкими. Таким образом, использование четкости в качестве показателя расстояния ведет к распространенным предубеждениям. Такие предубеждения такж е можно *Эта глава впервые появилась в Science, 1974,185,1124-1131. Авторское право© 1974 при­ надлежит Американской Ассоциации достижений науки. Переиздано в соответствии с раз­ решением. 18 ВВЕДЕНИЕ обнаруж ить в интуитивной оценке вероятности. В этой книге описываются три вида эвристик, которые использую тся для оценки вероятности и про­ гнозирования значений величин. П риводятся предубеждения, к которым ведут эти эвристики, а такж е обсуждается практическое и теоретическое значение этих наблюдений. Реп резен тативн ость Больш инство вопросов о вероятности принадлеж ат к одному из следующих типов: К акова вероятность того, что объект А принадлеж ит классу В? К ако­ ва вероятность, что причиной события А является процесс В? К акова веро­ ятность, что процесс В приведет к событию А? Отвечая на такие вопросы, люди обычно полагаю тся на эвристику репрезентативности, в которой ве­ роятность определяется степенью, в которой А репрезентативно по отнош е­ нию к В, то есть степенью, в которой А похоже на В. Н апример, когда А в высокой мере репрезентативно В, вероятность того, что событие А происхо­ дит из В, оценивается к ак вы сокая. С другой стороны, если А не похоже на В, то вероятность оценивается как низкая. Д ля иллю страции суждения репрезентативности, рассмотрим описание человека его бывшим соседом: “Стив очень замкнутый и застенчивый, всегда готов мне помочь, но слиш ком мало интересуется другими людьми и реаль­ ностью вообще. Он очень кроткий и опрятный, любит порядок и системати­ зированное ть, а такж е склонен к детализации. ” К ак люди оценивают вероят­ ность того, кто Стив по профессии (например, фермер, продавец, пилот само­ лета, библиотекарь или врач)? К аким образом люди располагают эти профес­ сии от наиболее до наименее вероятной? В эвристике репрезентативности, ве­ роятность того, что Стив - библиотекарь, например, определяется степенью, в которой он репрезентативен библиотекарю, или соответствует стереотипу библиотекаря. Действительно, исследование подобных проблем показало, что люди распределяют профессии точно таким ж е образом (Kahnem an и Tversky, 1973,4). Этот подход к оценке вероятности приводит к серьезным ошибкам, потому что на подобие или репрезентативность не оказывают влияние отдель­ ные ф акторы , которые должны влиять на оценку вероятности. Н ечувст вит ельност ь к априорной вероятности результ ат а Одним из ф акторов, которые не оказы ваю т влияния на репрезентатив­ ность, но значительно влияю т на вероятность — является предш ествующ ая вероятность, или частота базовых значений результатов (исходов). В слу­ чае Стива, например, тот ф акт, что среди населения намного больше ферме­ ров, чем библиотекарей, обязательно принимается в расчет при любой р а­ зумной оценке вероятности того, что Стив скорее является библиотекарем, чем фермером. П ринятие во внимание частоты базовых значений, однако, в действительности не влияет н а соответствие Стива стереотипу библиотека­ Принятие решений в условиях неопределенности 19 рей и фермеров. Если люди оценивают вероятность посредством репрезен­ тативности, следовательно, предш ествующ ими вероятностями они будут пренебрегать. Эта гипотеза была проверена в эксперименте, в котором и з­ м енялись предш ествующ ие вероятности (K ahnem an и T versky, 1973, 4). Испытуемым показы вали краткие описания нескольких людей, выбранных наугад из группы 100 специалистов - инженеров и адвокатов. Тестируемых просили оценить, для каж дого описания, вероятность того, что оно принад­ леж ит скорее инж енеру, чем адвокату. В одном экспериментальном случае, испытуемым сообщалось, что группа, описания из которой были даны , со­ стоит из 70 инженеров и 30 адвокатов. В другом случае испытуемым сооб­ щ алось, что группа состоит из 30 инженеров и 70 адвокатов. Ш ансы того, что каж дое отдельное описание принадлеж ит скорее инж енеру, чем адво­ кату, долж на быть выш е в первом случае, где большинство инженеров, чем во втором, где большинство адвокатов. Это можно показать, прим еняя пра­ вило Байеса заклю чаю щ ееся в том, что пропорция этих шансов должна быть (0 .7 /0 .3 )2, или 5.44, для каж дого описания. Грубо наруш ая правило Байе­ са, испытуемые в обоих случаях, продемонстрировали, в сущности, одина­ ковы е оценки вероятности. Очевидно, участники эксперимента оценили ве­ роятность того, что конкретное описание принадлеж ит скорее инженеру, чем адвокату как степень, в которой это описание было репрезентативно этим двум стереотипам, мало учиты вая, если учиты вая вообще, предшествую­ щ ие вероятности этих категорий. Испытуемые правильно использовали предш ествующ ие вероятности, когда они не обладали иной информацией. В отсутствии краткого описания личности, они оценивали вероятность того, что неизвестный человек я в л я­ ется инженером, к ак 0.7 и 0.3, соответственно, в обоих случаях, при обоих условиях частоты базовых значений. Однако предш ествующ ие вероятнос­ ти полностью игнорировались, когда было представлено описание, даже если оно было полностью неинформативно. Реакции на нижеизлож енное описа­ ние иллю стрирую т это явление: Дик - 30-летний мужчина. Женат, еще не имеет детей. Очень способный и мотивиро­ ванный сотрудник, подает большие надежды. Пользуется признанием коллег. Это описание было задумано таким образом, чтобы не предоставить инфор­ мации о том, является ли Д ик инженером или адвокатом. Следовательно, вероятность того, что Д ик является инженером, долж на равняться пропор­ ции инженеров в группе, к ак если бы не было дано описания вовсе. И спыту­ емые, однако, оценили вероятность того, что Д ик является инженером, к а к 5 независимо от того, к ак ая дана пропорция инженеров в группе (7 к 3 или 3 к 7). Очевидно, что люди реагирую т по-разному в ситуациях, когда описа­ ние отсутствует и когда дано бесполезное описание. В случае, когда описа­ ния отсутствуют, предш ествующ ие вероятности использую тся долж ны м образом; и предшествующие вероятности игнорирую тся, когда дается бес­ полезное описание (K ahnem an и Tversky, 1973,4). 20 ВВЕДЕНИЕ Н ечувст вит ельност ь к размеру выборки Чтобы оценивать вероятность получения конкретного результата в выбор­ ке, отобранной из указанной совокупности, люди обычно применяю т эври­ стику репрезентативности. То есть они оценивают вероятность результата в выборке, например, то, что средняя высота в случайной выборке из десяти человек будет б футов (180 сантиметров), в степени в какой этот результат подобен соответствующему параметру (то есть средней высоте людей среди всего населения). Подобие статистики в выборке типичному параметру у всего населения не зависит от размера выборки. Следовательно, если веро­ ятность рассчиты вается с помощью репрезентативности, то статистическая вероятность в выборке будет по сущ еству независима от размера выборки. Действительно, когда тестируемые оценивали распределение средней вы ­ соты для выборок различны х размеров, они производили идентичные рас­ пределения. Н апример, вероятность получения средней высоты более чем 6 футов (180 см) бы ла оценена подобной для выборок 1 .0 0 0 ,1 0 0 и 10 человек (K ahnem an и Tversky, 1972b, 3). Кроме того, испытуемые не сумели оце­ нить роль размера выборки даж е, когда это было подчеркнуто в формули­ ровке проблемы. Приведем пример, подтверждающ ий это. Некоторый город обслуживается двумя больницами. В большей по размеру больнице рождаются приблизительно 45 младенцев каждый день, а в меньшей больнице, при­ близительно 15 младенцев каждый день. Как Вы знаете, приблизительно 50% от всех младенцев - мальчики. Однако точный процент меняется со дня на день. Иногда он может быть выше, чем 50%, иногда ниже. В течение одного года, каждая больница делала учет тех дней, когда больше чем 60% рожденных младенцев были мальчиками. Какая больница, по вашему мнению, сдела­ ла учет большего количества таких дней? Большая по размеру больница (21) Меньшая больница (21) Примерно поровну (то есть в пределах разницы в 5%) (53) Ч исла в круглы х скобках указы ваю т количество отвечавш их студентов пос­ ледних курсов. Больш инство тестируемых оценивало вероятность того, что будет более 60% мальчиков в равной степени и в маленькой, и в большой больнице, воз­ можно, потому что эти события описаны одинаковой статистикой и, таким образом, одинаково репрезентативны по отношению ко всему населению. Напротив, согласно теории выборок, ожидаемое число дней, в которые боль­ ш е чем 60% рожденных младенцев являю тся мальчиками, намного выше в маленькой больнице, чем в большой, потому что для большой выборки менее вероятно, отклонение от 50% . Это фундаментальное понятие статистики, оче­ видно, не является частью интуиции людей. Подобная нечувствительность к размеру выборки была зафиксирована в оценках апостериорной (posteriori) вероятности, то есть вероятности, что вы борка была отобрана скорее из одной совокупности, чем из другой. Рас- Принятие решений в условиях неопределенности 21 смотрим следующий пример: Вообразите корзину, наполненную шарами, из которых 2 /3 одного цвета и 1/3 другого. Один человек вынимает из корзины 5 шаров и обнаруживает, что 4 из них красные, а 1 белый. Другой человек вынимает 20 шаров и обнаруживает, что 12 из них красные, а 8 белые. Который из этих двух людей должен с большей уверенностью сказать, что в кор­ зине скорее 2 /3 красных шаров и 1/3 белых шаров, чем наоборот? Каковы шансы у каждого из этих людей? В этом примере, правильны м ответом является оценка последующ их ш ансов к ак 8 к 1 для выборки 4:1 и 16 к 1 для выборки 12:8, при условии, что предш ествующ ие вероятности равны . Однако большинство людей ду­ мает, что первая вы борка обеспечивает намного более серьезное подтверж ­ дение для гипотезы , что корзина наполнена в основном красны ми ш арами, потому что процентное отношение красны х ш аров в первой выборке боль­ ш е, чем во второй. Это снова показы вает, что интуитивные оценки превали­ руют за счет пропорции выборки, а не ее размера, который играет реш аю ­ щую роль в определении реальны х последую щ их ш ансов. (K ahnem an и Tversky, 1972b). Кроме того, интуитивны е оценки последующ их шансов (posterior odds) гораздо менее радикальны , чем правильны е значения. В проблемах этого типа неоднократно наблюдалась недооценка влияния оче­ видного (W . Edw ards, 1968, 25; Slovic и L ichtenstein, 1971). Этот феномен назван «консерватизмом ». Ошибочные концепции шанса Люди полагаю т, что последовательность событий, организованная к ак слу­ чайны й процесс представляет существенную характеристику этого процес­ са даж е, когда последовательность короткая. Н апример, относительно вы ­ падения монеты «орлом» или «реш кой», люди считаю т, что последователь­ ность О-Р-О-Р-Р-О, более вероятна, чем последовательность О-О-О-Р-Р-Р, которая не каж ется случайной, а такж е более вероятна, чем последователь­ ность О-О-О-О-Р-О, которая не отраж ает равнозначность сторон монеты (K ahnem an и Tversky, 1972b, 3). Таким образом, люди ожидаю т, что сущ е­ ственные характеристики процесса будут представлены, не только глобаль­ но, т.е. в полной последовательности, но такж е и локально - в каж дой из ее частей. Однако локально репрезентативная последовательность системати­ чески отклоняется от ож идания ш ансов, на которые рассчитывали: в ней слиш ком много чередований и слиш ком мало повторений. Другое послед­ ствие убеждения по поводу репрезентативности — хорошо известная ошиб­ ка игрока в казино. Видя, что красны е слиш ком долго выпадаю т на колесе рулетки, например больш инство лю дей, ошибочно полагает, что, скорее всего, теперь должно вы пасть черное, потому что выпадение черного завер­ ш ит более репрезентативную последовательность, чем выпадение еще од­ ного красного. Ш анс обычно рассматривается к а к саморегулирую щ ийся 22 ВВЕДЕНИЕ процесс, в котором отклонение в одном направлении приводит к отклоне­ нию в противоположном направлении с целью восстановления равновесия. Н а самом деле отклонения не исправляю тся, а просто «растворяются» по мере протекания случайного процесса. Неправильные представления о шансе характерны не только для неопыт­ ны х тестируемых. Изучение интуиции в статистических предположениях у опытных психологов-теоретиков (Tversky и Kahnem an, 1971,2) показало ус­ тойчивое верование в то, что можно назвать законом малых чисел, согласно которому даж е маленькие выборки являю тся высоко репрезентативными по отношению к совокупностям, из которых они отобраны. Результаты этих ис­ следователей отразили ожидание того, что гипотеза, достоверная относительно всей совокупности, будет представлена к ак статистически значимый резуль­ тат в выборке, причем размер выборки не имеет значения. К ак следствие, специалисты слиш ком верят в результаты , полученные на маленьких выбор­ ках, и слиш ком переоценивают повторяемость этих результатов. П ри прове­ дении исследования, это предубеждение ведет к отбору выборок неадекват­ ного размера и к преувеличенной интерпретации результатов. Н ечувст вит ельност ь к надежности прогноза Люди иногда вынуж дены делать числовые предсказания, такие к ак буду­ щ ий курс акции, спрос на товар или результат футбольной игры. Такие пред­ сказани я основываются на репрезентативности. Н апример, предположим, некто получил описание компании, и его просят предсказать ее будущую прибы ль. Если описание компании очень благоприятно, то по этому описа­ нию наиболее репрезентативной будет казаться очень высокая прибыль; если описание посредственно - то наиболее репрезентативным будет казаться за­ урядное развитие событий. То, насколько описание является благоприят­ ны м, не зависит от достоверности этого описания или степени, в которой оно позволяет проводить точное прогнозирование. Следовательно, если люди делают прогноз, исходя исклю чительно из благоприятности описания, их предсказания будут нечувствительны к н а­ дежности описания и к ожидаемой точности предсказания. Этот способ делать суж дения наруш ает нормативную статистическую теорию, в которой экстремум и диапазон предсказаний зависит от предска­ зуемости. Когда предсказуемость равна нулю, во всех случаях должно быть сделано одно и то ж е предсказание. Н апример, если описания компаний не содерж ат инф ормации относительно прибыли, тогда для всех компаний долж на быть спрогнозирована одна и та ж е величина (в размере среднего значения прибыли). Если прогнозируемость идеальна, конечно, предсказы ­ ваемы е величины будут соответствовать ф актическим величинам, и диапа­ зон прогнозов будет равняться диапазону результатов. Вообще, чем выш е предсказуемость, тем ш ире диапазон предсказанных величин. Н екоторы е исследования численного прогнозирования показали, что Принятие решений в условиях неопределенности 23 интуитивные предсказания наруш аю т это правило, и что испытуемые мало учиты ваю т, если учиты ваю т вообщ е, соображ ения прогнозируем ости (K ahnem an и T versky, 1973,4). В одном из этих исследований, испытуемым было предоставлено несколько абзацев текста, каж ды й из которых описы­ вал работу преподавателя ВУЗа в течение отдельно взятого практического занятия. Н екоторых тестируемых попросили оценить качество урока, опи­ санного в тексте с помощью процентной ш калы , относительно указанной совокупности. Других тестируемых просили спрогнозировать, такж е ис­ пользуя процентную ш калу, положение каж дого преподавателя ВУЗа че­ рез 5 лет после этого практического занятия. Суждения, сделанные при обо­ их условиях были идентичными. То есть предсказание отдаленного во вре­ мени критерия (успех преподавателя через 5 лет) было идентично оценке информации, на основе которой это предсказание было сделано (качество практического занятия). Студенты, которые предположили это, несомнен­ но, знали о том, насколько ограничена прогнозируемоеть компетентности преподавателя, основанная на единственном пробном уроке, проведенного 5 годами ранее; однако их прогнозы были столь ж е крайним и, сколь и их оценки. И ллю зи я валидност и К ак мы уж е говорили, люди часто делают прогнозы, вы бирая исход (напри­ мер, профессию), которы й является наиболее репрезентативным по отно­ шению к входным данным (например, описание человека). То, насколько они уверены в своем прогнозе, зависит, прежде всего, от степени репрезен­ тативности (то есть качества соответствия выбора входным данным) безот­ носительно факторов, которые ограничиваю т точность их прогноза. Таким образом, люди вполне уверены в прогнозе, что человек является библиоте­ карем, когда дано описание его личности, которое соответствует стереотипу библиотекаря, даж е если оно скудно, ненадежно или устарело. Необосно­ ванная уверенность, которая является следствием удачного совпадения предсказываемого результата и входных данны х, мож ет назы ваться иллю­ зией валидности. Эта иллю зия сохраняется даже тогда, когда испытуемый знает факторы , которые ограничиваю т точность его прогнозов. Вполне рас­ пространенным является вы сказы вание, что психологи, которые проводят выборочные интервью , часто обладают значительной уверенностью по по­ воду своих прогнозов, даж е если они знакомы с обширной литературой, ко­ торая показы вает что в выборочных интервью вы сока вероятность ошибок. П родолжительная уверенность в правильности результатов клинического выборочного интервью , несмотря на повторные свидетельства его неадек­ ватности, является достаточным свидетельством силы этого эффекта. Внутренняя согласованность образца входных данных является основным показателем степени уверенности в прогнозе, основанном на этих входных данных. Например, люди выражаю т больше уверенности в прогнозе средне­ 24 ВВЕДЕНИЕ го балла успеваемости студента, чей табель за первый год обучения состоит полностью из В (4 балла), чем в прогнозе среднего балла студента, в чьем табе­ ле за первый год обучения много оценок, как А (5 баллов), так и С (3 балла). Высоко согласованные образцы наиболее часто наблюдаются, когда входные переменные очень избыточны или взаимосвязаны . Следовательно, люди склонны быть уверенными в прогнозах, основанных на избыточных входных переменных. Однако элементарное правило в статистике корреляции, утвер­ ж дает, что, если у нас есть входные переменные определенной валидности, прогноз, основанный на нескольких таких входных данных, может дости­ гать более высокой точности, когда переменные независимы друг от друга, чем если они являю тся избыточными или взаимосвязанными. Таким обра­ зом, избыточность входных данных уменьшает точность, даж е если она уве­ личивает уверенность, таким образом, люди часто уверены в прогнозах, ко­ торые, скорее всего, будут ошибочными (K ahnem an и Tversky, 1973,4). Н еправильны е предст авления о регрессии П редположим, что больш ая группа детей была протестирована с помощью двух подобных версий теста на способности. Если некто отберет десять де­ тей из числа тех, кто справился лучш е всех с одной из этих двух версий, он обычно будет разочарован выполнением ими второй версии теста. И напро­ тив, если некто отберет десять детей из числа тех, кто хуж е всех справился с первой версией теста, то в среднем он обнаружит, что с другой версией они справились несколько лучш е. Обобщая, рассмотрим две переменные X и Y, которы е имеют одинаковое распределение. Если выбрать людей, чьи сред­ ние X оценки отклоняю тся от среднего X на к единиц, тогда среднее от их Y ш калы будет обычно отклоняться от среднего Y меньш е чем на к единиц. Эти наблю дения иллюстрируют общее явление известное к ак регресс к сред­ нему, которое было открыто Гальтоном более чем 100 лет назад. В обычной ж изни все мы сталкиваем ся с большим количеством случаев регресса к среднему, сравнивая, например, рост отцов и сыновей, уровень интеллекта мужей и ж ен, или результаты сдачи экзаменов, следующих один за другим. Тем не менее, у людей отсутствуют предполож ения по этому по­ воду. Во-первых, они не ожидаю т регрессии во многих контекстах, где она долж на произойти. Во-вторых, когда они признаю т возникновение регрес­ сии, они часто изобретаю т неверны е объяснения причин. (K ahnem an и Tversky, 1973,4). Мы полагаем, что явление регресса остается неуловимым, потому что оно несовместимо с мнением о том, что прогнозируемый резуль­ тат долж ен быть максимально репрезентативен по отношению к входным данны м, и, следовательно, значение переменной результата должно быть настолько ж е крайним , к ак и значение входной переменной. Неспособность признать смысл регрессии может иметь пагубные послед­ ствия, к ак было проиллюстрировано в следующих наблюдениях (Kahnem an Принятие решений в условиях неопределенности 25 и Tversky, 1973,4). При обсуждении учебных полетов, опытные инструкто­ ры отметили, что похвала за исключительно мягкое приземление обычно при следующей попытке сопровождается более неудачным приземлением, в то время к ак резкая критика после жесткого приземления обычно сопровожда­ ется улучшением результатов при следующей попытке. Инструкторы сдела­ ли вывод, что словесные поощ рения вредны для обучения, в то время к ак вы­ говоры приносят пользу, вопреки принятой психологической доктрине. Это заклю чение несостоятельно из-за присутствия регресса к среднему. К ак и в других случаях, когда экзамены следуют один за другим, улучшение обычно следует за плохим выполнением работы, а ухудшение - за отлично проделан­ ной работой, даж е если преподаватель или инструктор никак не реагирует на достижения учащ егося при первой попытке. Поскольку инструкторы похва­ лили своих учеников после хороших приземлений и поругали их после пло­ хих, они приш ли к ошибочному и потенциально вредному заключению, что наказание является более эффективным, чем награда. Таким образом, неспособность понимать эффект регрессии ведет, к тому, что эффективность наказан и я оценивается слиш ком высоко, а эффектив­ ность награды недооценивается. В социальном взаимодействии, такж е, к ак и в обучении, награда обычно прим еняется, когда работа выполнена хоро­ шо, и наказание, когда работа выполнена плохо. Следуя только закону рег­ рессии, поведение, вероятней всего, улучш ится после наказания и , скорее всего, ухудш ится после награды . Следовательно, выходит так, что, по чис­ той случайности, людей поощ ряю т за то, что они наказы ваю т других, и на­ казываю т за их поощрение. Лю ди, в целом, не знаю т об этом обстоятель­ стве. Ф актически, неуловимая роль регрессии в определении очевидных последствий награды и н аказания, каж ется, ускользнула от вним ания уче­ ны х, работаю щ их в этой области. Доступность Бывают ситуации, в которы х люди оцениваю т частоту класса или вероят­ ность событий на основе легкости, с которой они вспоминают примеры слу­ чаев или события. Н апример, можно оценивать вероятность риска сердеч­ ного приступа среди людей средних лет, вспоминая такие случаи среди сво­ их знакомы х. П охожим образом некто может оценивать вероятность того, что некоторое бизнес-предприятие потерпит неудачу, представляя себе раз­ личные трудности, с которыми оно могло бы столкнуться. Эта эвристика оценки назы вается доступностью. Доступность очень полезна для оценки частоты или вероятности событий, потому что события, принадлеж ащ ие большим классам , обычно вспоминаю тся и быстрее, чем случаи менее час­ тых классов. Однако на доступность воздействуют и другие факторы , кроме частоты и вероятности. Следовательно, уверенность относительно доступ­ ности ведет к вполне прогнозируемым предубеждениям, некоторые из ко­ торых проиллю стрированы ниж е. 26 ВВЕДЕНИЕ Предубеж дения, обусловленные степенью восст анавливаемост и событий в пам ят и Когда размер класса оценивается на основе доступности его элементов, класс, элементы которого легко восстанавливаю тся в пам яти, будет казаться бо­ лее многочисленным, чем класс такого ж е размера, но элементы которого, менее доступны и хуж е вспоминаются. При простой демонстрации этого эф­ ф екта, испытуемым зачитали список известных людей обоих полов, и за­ тем попросили оценить, было ли в списке больше м уж ских имен, чем ж енс­ ких. Различны е списки были предоставлены разны м группам тестируемых. В некоторых из списков муж чины были более известны, чем ж енщ ины , а в других, ж енщ ины были более известны, чем муж чины . В каж дом из спис­ ков, испытуемые ошибочно считали, что класс (в данном случае пол), в к о­ тором были более известные люди, был более многочисленным (Tversky и K ahnem an, 1973,11). В дополнение к узнаваемости, имеются другие факторы , такие к ак яр ­ кость, которая влияет на восстанавливаемость событий в пам яти. Н апри­ мер, если человек наблюдал воочию пож ар в здании, то он будет считать возникновение таких несчастных случаев, наверное, более субъективно ве­ роятны м, чем, если бы, он прочитал об этом пож аре в местной газете. Кроме того, недавние происш ествия, вероятно, будут вспоминаться несколько про­ щ е, чем более ранние. Часто бывает, что субъективная оценка вероятности возникновения дорожных происш ествий временно повыш ается, когда че­ ловек видит около дороги перевернутый автомобиль. Предубеж дения, обусловленны е эфф ект ивност ью н а п р а влен и я поиска П редположим, из английского текста наугад выбрано слово (из трех букв илиболы пе). Что является более вероятным, то, что слово начинается с бук­ вы г или что г является третьей буквой? Люди подходят к решению этой проблемы, вспоминая слова, которые начинаю тся с г (road - дорога), и сло­ ва, которы е имеют г в третьей позиции (саг - автомобиль), и оцениваю т от­ носительную частоту, основываясь на легкости, с которой слова этих двух типов приходят на ум. П оскольку гораздо легче искать слова по первой бук­ ве, чем по третьей, большинство людей считаю т, что больше слов, которые начинаю тся с этой согласной, чем слов, в которых тот ж е самый согласный появляется в третьей позиции. Они делают такой вывод даже для таких со­ гласны х, к ак г или к, которые чащ е появляю тся в третьей позиции, чем в первой (Tversky и K ahnem an, 1973,11). Различны е задачи требуют различны х направлений поиска. Н апример, предположим, Вас попросили оценить частоту, с которой слова с абстракт­ ным значением (мысль, любовь) и конкретны м значением (дверь, вода) по­ являю тся в письменном английском язы ке. Естественный способ ответить Принятие решений в условиях неопределенности 27 на этот вопрос - найти контексты , в которых эти слова могли бы появлять­ ся. К аж ется, легче вспомнить контексты , в которых может быть упомянуто абстрактное значение (любовь в ж енских романах), чем вспомнить контек­ сты , в которы х упоминается слово с конкретны м значением (например, дверь). Если частота слов определяется на основании доступности контек­ стов, в которы х они появляю тся, слова с абстрактным значением, будут оценены к ак относительно более многочисленные, чем слова с конкретным значением. Этот стереотип наблю дался в недавнем исследовании (G albraith и U nderwood, 1973), которое показало, что частота возникновения слов с абстрактным значением бы ла намного выш е частоты слов с конкретны м значением, в то время к ак их объективная частота равна. Оценивалось так ­ ж е, что абстрактные слова появлялись в намного большем разнообразии контекстов, чем слова с конкретны м значением. Предубеж дения, обусловленны е способностью к предст авлению образов И ногда нужно оценить частоту класса, элементы которого не хранятся в пам яти, а могут быть созданы согласно определенному правилу. В таких ситуациях, обычно воспроизводятся некоторые элементы, а частота или вероятность оценивается той легкостью , с которой могут быть построены соответствующие элементы. Однако легкость воспроизведения соответству­ ющ их элементов не всегда отраж ает их фактическую частоту, и этот способ оценки приводит к предубеждениям. Д ля иллю страции этого рассмотрим группу из 10 человек, которые формируют комитеты , состоящие из ft чле­ нов, причем 2 < ft < 8. Сколько различны х комитетов, состоящ их из ft чле­ нов может быть сформировано? П равильны й ответ на эту проблему дается биноминальным коэффициентом ( k 10), который достигает максимума, рав­ ного 252 для ft = 5. Ясно, что число комитетов, состоящ их из ft членов, рав­ няется числу комитетов, состоящ их из (10 - ft) членов, потому что для любо­ го комитета, состоящего из ft членов, существует единственно возмож ная группа, состоящ ая из (10 - ft) человек, не являю щ ихся членами комитета. Одним из способов ответить без вы числения - это мысленно создать ко­ митеты, состоящ ие из ft членов, и оценить их количество, используя лег­ кость, с которой они приходят на ум. Комитеты, состоящ ие и з небольшого количества членов, например, 2, более доступны, чем комитеты , состоящ ие из большого количества членов, например, 8. Самая простая схема созда­ ния комитетов - разделение группы на непересекаю щ иеся множества. Сра­ зу видно, что легче создать пять непересекаю щ ихся комитетов по 2 члена в каж дом, в то время как невозможно сгенерировать и двух непересекаю щ их­ ся комитетов по 8 членов. Следовательно, если частота оценивается за счет способности представить это, или доступностью к мысленному воспроизве­ дению, будет казаться, что маленьких комитетов больше, чем больш их, в отличие от правильной параболической ф ункции. Действительно, когда 28 ВВЕДЕНИЕ тестируемых-неспециалистов просили оценить число различны х комитетов разны х размеров, их оценки представляли собой монотонно-убывающую функцию от размера комитета (Tversky и K ahnem an, 1 9 7 3 ,11). Например, средняя оценка числа комитетов, состоящ их из 2 членов, была 70, в то вре­ м я к ак оценка для комитетов, состоящ их из 8 членов — 20 (правильный ответ - 45 в обоих случаях). Способность представлять образы играет важную роль в оценке вероят­ ностей возникновения реальны х ж изненны х ситуаций. Риск, с которым связана опасная экспедиция, например, оценивается, посредством мыслен­ ного воспроизведения непредвиденных обстоятельств, для преодоления ко­ торы х у экспедиции нет достаточного оборудования. Если многие из таких трудностей ярко изображаю тся, экспедиция может показаться чрезвы чай­ но опасной, хотя легкость, с которой воображаются бедствия, вовсе не обя­ зательно отраж ает их фактическую вероятность. Наоборот, если возмож ­ ную опасность трудно вообразить, или она просто не приходит на ум, риск, связанны й с каким-либо событием, может быть чрезвычайно недооценен. И ллю зорн ая взаимосвязь Чепмен и Чепмен (Chapm an and Chapm an, 1969) описали интересное преду­ беждение в оценке частоты, с которой два события произойдут одновремен­ но. Они предоставили испытуемым-неспециалистам информацию относи­ тельно нескольких гипотетических пациентов с психическими расстрой­ ствами. Данные по каж дому пациенту вклю чали клинический диагноз и рисунки пациента. П озже испытуемые оценили частоту, с которой каж ды й диагноз (такой к ак паранойя или м ания преследования) сопровождался раз­ личны ми особенностями рисунка (специфической формой глаз). И спытуе­ мые заметно переоценили частоту совместного появления двух естествен­ ны х событий, таких как мания преследования и специфическая форма глаз. Это явление получило название иллю зорная корреляция. В ош ибочных оценках представленных данных, испытуемые «заново открыли» многое из уж е известны х, но необоснованных, клинических знаний относительно ин­ терпретации рисуночного теста. Иллюзорный эффект корреляции был чрез­ вычайно стойкий по отношению к противоречащ им данным. Он сохранил­ ся даж е, когда взаимосвязь между признаком и диагнозом была ф актичес­ ки негативной, что не позволило испытуемым определить действительные отнош ения меж ду ними. Доступность является естественным объяснением эффекта иллю зорной корреляции. О ценка того, насколько часто два явления взаимосвязаны и происходят одновременно, может быть основано на силе ассоциативной свя­ зи меж ду ними. Когда ассоциация сильна, можно, скорее всего, прийти к выводу, что события часто происходили одновременно. Следовательно, если ассоциация меж ду событиями крепкая, то, по оценке людей, они будут час­ то происходить одновременно. Согласно этой точке зрения, иллю зорная кор­ Принятие решений в условиях неопределенности 29 реляция между диагнозом мании преследования и специфической формой глаз на рисунке, к примеру, появляется из-за того, что м ания преследова­ ния скорее ассоциируется с глазам и, чем с любой другой частью тела. Продолжительный жизненный опыт научил нас, что, в общем, элементы больших классов вспоминаются лучш е и быстрее, чем элементы менее час­ тотных классов; что более вероятные события легче вообразить, чем малове­ роятные; и что ассоциативные связи между событиями укрепляю тся, когда события часто происходят одновременно. В результате, человек получает в свое распоряжение процедуру (эвристику доступности) для оценки размера класса, вероятность события, или частота, с которой могут одновременно про­ исходить события, оцениваются той легкостью, с которой могут быть выпол­ нены соответствующие ментальные процессы вспоминания, воспроизведения или ассоциации. Однако, как показали предшествующие примеры, эти про­ цедуры оценивания систематически приводят к ошибкам. К орректировка и «привязка» (an ch o rin g ) Во многих ситуациях, люди делают оценки, отталкиваясь от начальной ве­ личины , которая специально подобрана таким образом, чтобы получить окончательный ответ. Н ачальная величина или отправная точка, может быть получена посредством формулировки проблемы, или она мож ет быть частично результатом вы числения. В любом случае, такой «прикидки» обычно недостаточно (Slovic и L ichtenstein, 1971). То есть, различны е от­ правные точки приводят к различны м оценкам, которые смещены к этим отправным точкам. Мы называем этот феномен «привязкой» (anchoring). Недостаточная «корректировка» Для демонстрации эффекта «привязки », тестируемых просили оценить раз­ личные величины , вы раж енны е в процентах (например, процент А фрикан­ ских стран в О рганизации Объединенных Н аций). Каждой величине с по­ мощью случайного выбора в присутствии тестируемых, был присвоен но­ мер от 0 до 100. Тестируемых вначале попросили указать, больше или мень­ ше этот номер, чем значение самой величины , и затем оценить значение этой величины, двигаясь в большую или меньшую сторону относительно его но­ мера. Различным группам тестируемых предлагались различные номера для каждой величины , и эти произвольные номера имели значительное вли я­ ние на оценки тестируемых. Н апример, средние оценки процента А фрикан­ ских стран в О рганизации Объединенных Н аций были 25 и 45 для групп, которые получили 10 и 65 в качестве отправных точек соответственно. Д е­ нежные вознаграж дения за точность не уменьш али эффект «привязки». «П ривязка» происходит не только, когда испытуемым задана отправная точка, но такж е когда испытуемый основывает свою оценку на результате некоторого неполного вы числения. Изучение интуитивной числовой оцен­ 30 ВВЕДЕНИЕ ки иллю стрирует этот эффект. Две группы студентов средней ш колы оце­ нивали, в течение 5 секунд, значение числового вы раж ения, которое было написано на доске. Одна группа оценивала значение вы раж ения 8х7х6х5х4хЗх2х1, в то время как другая группа оценивала значение вы раж ения 1х2хЗх4х5х6х7х8. Д ля быстрого ответа на такие вопросы, люди могут произвести несколько ш агов вы числения и оценить значение вы раж ения с помощью экстраполя­ ции или «корректировки». П оскольку «корректировки» обычно недоста­ точно, эта процедура долж на вести к недооценке значения. Более того, так к ак результат первы х немногих ш агов умнож ения (выполненный слева н а­ право) выш е в убывающей последовательности, чем в возрастаю щ ей, пер­ вое упомянутое вы раж ение должно быть оценено больше последнего. Оба п редсказан и я бы ли подтверж дены . С редняя оценка д л я возрастаю щ ей последовательности была 512, в то время к ак средняя оценка для убываю­ щ ей последовательности была 2.2 5 0 . П равильный ответ-4 0 . 320 для обеих последовательностей. Предубеж дения в оценке конъю нкт ивны х и дизъю нкт ивны х собы­ т ий В недавнем исследовании Бар-Х иллел (B ar-H illel, 1973) тестируемым дава­ ли возможность сделать ставку на одно из двух событий. Использовались три типа событий: (i) простое событие, к ак, например, вы тягивание красно­ го ш ара из м еш ка, содержащ его 50% красны х и 50% белых ш аров; (И) свя­ занное событие, к ак , например, вы тянуть красны й ш ар семь раз подряд из м еш ка (с возвращ ением ш аров), содержащ его 90% красны х ш аров и 10% белых; и (ш ) несвязанное событие, к ак, например, вы тянуть красны й ш ар, по крайней мере, 1 раз в семи последовательных попы тках (с возвращ ением ш аров) из меш ка, содержащ его 10% красны х ш аров и 90% белых. В этой проблеме, существенное большинство тестируемых предпочло сделать став­ ку на связанное событие (вероятность которого - 0.48), а не на простое (веро­ ятность которого - 0.50). Испытуемые такж е предпочитал и , ставить скорее на простое событие, чем на дизъю нктивное, которое имеет вероятность 0.52. Таким образом, большинство тестируемых сделало ставку на менее вероят­ ное событие при обоих сравнениях. Эти реш ения тестируемых иллю стри­ руют общий вывод: изучение реш ений в азартны х играх и оценки вероят­ ности указы ваю т, что люди имеют тенденцию оценивать слиш ком высоко вероятность конъю нктивны х событий (Cohen, Chesnick и H ar ап, 1972,24) и склонны недооценивать вероятность дизъю нктивны х событий. Эти стерео­ Принятие решений в условиях неопределенности 31 типы полностью объясняю тся эффектом «привязки». У становленная веро­ ятность элементарного события (успех в любой стадии) обеспечивает есте­ ственную отправную точку для оценки вероятностей к ак конъю нктивны х, таки дизъю нктивных событий. Так как «корректировки» от отправной точ­ ки обычно недостаточно, заклю чительные оценки остаю тся слиш ком при­ ближенными к вероятностям элементарны х событий в обоих случаях. Об­ ратите внимание, что полная вероятность конъю нктивны х событий ниж е, чем вероятность каждого элементарного события, в то время к ак полная вероятность несвязанного события выш е, чем вероятность каж дого элемен­ тарного события. Следствием «привязки» является то, что полная вероят­ ность будет завыш ена для конъю нктивны х событий и заниж ена - для дизъ­ ю нктивных. Предубеждения в оценке слож ны х событий особенно существенны в кон­ тексте планирования. Успешное заверш ение бизнес-предприятия, напри­ мер, разработка нового продукта, обычно носит комплексны й характер: чтобы предприятие преуспевало, каж дое событие из ряда должно произой­ ти. Даж е, если каждое из этих событий весьма вероятно, полная вероятность успеха может быть довольно низкой, если количество событий большое. Общая тенденция оценивать слиш ком высоко вероятность конъю нктивных событий ведет к необоснованному оптимизму в оценке вероятности, что план будет удачным, или что проект будет закончен вовремя. Наоборот, с дизъ­ юнктивными структурами событий обычно сталкиваю тся при оценке рис­ ка. Сложная система, такая к ак ядерный реактор или тело человека, повре­ дится, если любой из его необходимых компонентов выйдет из строя. Д аж е, когда вероятность сбоя в каж дом компоненте небольш ая, вероятность отка­ за всей системы может быть вы сока, если в нее вовлечено много компонен­ тов. И з-за предубеждения «привязки», люди имеют тенденцию недооцени­ вать вероятность отказа в слож ны х системах. Таким образом, предубежде­ ние привязки мож ет иногда зависеть от структуры события. Структура со­ бытия или явления похож ая на цепочку звеньев ведет к переоценке вероят­ ности этого события, структура события похож ая на воронку, состоящ ая из дизъю нктивных звеньев, ведет к недооценке вероятности события. «Привязка» при оценке распределения субъективной вероятности При анализе принятия реш ений, от экспертов часто требуется вы разить свое мнение относительно какой-либо величины , например, среднего значения индекса Доу-Джонса (Dow-Jones) в отдельно взяты й день, в виде распреде­ ления вероятности. Такое распределение обычно строится путем выбора значений для величины , которые соответствуют его процентной ш кале рас­ пределения вероятности. Н апример, эксперта можно попросить выбрать число, Х90 так, чтобы субъективная вероятность того, что это число будет выше, чем значение среднего числа Доу-Джонса, бы ла 0.90. То есть, он дол­ жен выбрать значение Х90, так чтобы в 9 случаях к 1 среднее значение ин­ 32 ВВЕДЕНИЕ декса Доу-Джонса не превыш ало это число. Распределение субъективной вероятности значения среднего числа Доу-Джонса может быть построено из нескольких таких оценок, вы раж енны х с помощью различны х процент­ ны х ш кал. П утем накопления таких субъективны х распределений вероятности для различны х величин, можно проверить правильность оценок эксперта. Экс­ перт считается калиброванным (см. гл. 22) должным образом в определен­ ном наборе проблем, если только 2 процента правильны х значений оценен­ ны х величин будут ниж е заданных значений Х2. Например, правильные зна­ чения долж ны быть ниж е Х01 для 1% величин и быть выш е Х 99, для 1% величин. Таким образом, истинные значения должны строго попадать в ин­ тервал между Х 01 и Х 99в 98% задач. Н есколько исследователей (A lpert и R aiffa, 1969, 21; Stael von H olstein, 1971b; W inkler, 1967) проанализировали наруш ения в оценке вероятности для многих количественны х величин для большого числа экспертов. Эти распределения указали на обширные и систематические отклонения от над­ леж ащ их оценок. В большинстве исследований, фактические значения оце­ ненны х величин или меньш е Х 01 или больше, чем Х 99 приблизительно для 30% задач. То есть, испытуемые устанавливаю т слиш ком узкие строгие интервалы , которые отражаю т их уверенность, чем их знания относитель­ но оцененных величин. Это предубеждение характерно к ак для подготов­ ленны х, так и для простых тестируемых, и этот эффект не устраняется пу­ тем введения правил оценки, которые обеспечивают стимулы для внеш ней оценки. Этот эффект, по крайней мерю, частично, относится к «привязке». Чтобы выбрать Х90как значение среднего числа Доу-Джонса, например, естественно начать с размы ш ления о лучш ей оценке индекса Доу-Джонса и «скорректировать» верхние значения. Если эта «корректировка» - как и боль­ шинство других - является недостаточной, то Х ^ не будет достаточно экстре­ мальным. Подобный эффект фиксирования произойдет в выборе Х 10, кото­ ры й предположительно получен путем корректировки чьей-либо лучш ей оценки в сторону понижения. Следовательно, достоверный интервал между Х 10 и Х90 будет слиш ком узкий, и оцененное распределение вероятности бу­ дет слиш ком ж естким. В подтверждение этой интерпретации можно пока­ зать, что субъективные вероятности систематически меняются посредством процедуры, в которой чья-либо лучш ая оценка не служит «привязкой». Распределения субъективной вероятности для данной величины (сред­ нее число Доу-Джонса) могут быть получены двумя различны ми способа­ ми: (i), попросить испытуемого выбрать значение числа Доу-Джонса, кото­ рое соответствует распределению вероятности выраж енной с помощью про­ центной ш калы и (ii), попросить испытуемого оценить вероятности того, что истинное значение числа Доу-Джонса превысит некоторые указанны е ве­ личины . Эти две процедуры формально эквивалентны и должны приводить в результате к идентичным распределениям. Однако они предлагаю т раз­ личны е способы корректировки от различны х «привязок». В процедуре (i), Принятие решений в условиях неопределенности 33 естественная отправная точка - лучш ая оценка качества. В процедуре (ii), с другой стороны, тестируемый может «привязаться» к величине, установ­ ленной в вопросе. В противоположность этому, он может «привязаться» к равным шансам, или к шансам 50 на 50, которые являю тся естественной отправной точкой при оценке вероятности. В любом случае, процедура (ii) должна завершаться менее крайними оценками, чем процедура (i). Чтобы противопоставлять эти две процедуры, группе тестируемых был предоставлен набор 24 количественных измерений (как, например, рассто­ яние по воздуху от Нью-Дели до Пекина), которые оценивали или Х10 или Х90 для каждой задачи. Другая группа тестируемых получила средние оцен­ ки первой группы для каждой из этих 24 величин. Их попросили оценить шансы того, что каж дая из данных величин превысила истинное значение соответствующей величины. В отсутствии какого-либо предубеждения вто­ рая группа должна восстановить вероятность, указанную первой группой, то есть 9:1. Однако если равные шансы или заданная величина служат «при­ вязкой» , вероятность, указанная второй группой должна быть менее экст­ ремальной, то есть ближе к 1:1. В действительности, средняя вероятность, указанная этой группой, во всех задачах, была 3:1. Когда суждения из этих двух групп были проверены, обнаружилось, что испытуемые в первой груп­ пе были слиш ком экстремальны в оценках в соответствии с более ранними исследованиями. События, вероятность которых, они определили к ак 0.10, фактически произошли в 24% случаев. Напротив, тестируемые во второй группе были слишком консервативны. События, вероятность которых, они определили к ак 0.34, фактически произошли в 26% случаев. Эти результа­ ты иллюстрируют то, как степень правильности оценки зависит от проце­ дуры оценки. О бсуж ден и е В этой части книги рассматривались когнитивные стереотипы, которые воз­ никают к ак результат уверенности в эвристиках оценивания. Эти стереоти­ пы не характерны для эффектов мотивации, таких к ак принятие желаемо­ го за действительное или искаж ения суждений из-за одобрения и порица­ ния. Действительно, как уже сообщалось ранее, некоторые серьезные ошиб­ ки в оценивании происходили, несмотря на тот факт, что тестируемых по­ ощ ряли за точность и вознаграждали за правильные ответы (Kahneman и Tversky, 1972b, 3; Tversky и K ahneman, 1973,11). Уверенность в эвристиках и распространенность стереотипов свойствен­ на не только обывателям. Опытные исследователи такж е склонны к тем ж е самым предубеждениям - когда они думают интуитивно. Например, тен­ денция предсказывать результат, который наиболее репрезентативен по от­ ношению к данным, без достаточного внимания к априорной вероятности наступления такого результата, наблюдались в интуитивных суждениях людей, которые обладали обширными познаниями в статистике (Kahneman 34 ВВЕДЕНИЕ и Tversky, 1973,4; Tversky и Kahneman, 1971,2). Хотя те, кто имеют позна­ ния в статистике и избегают элементарных ошибок, как, например, ошиб­ ки игрока в казино, в интуитивных суждениях для более запутанных и ме­ нее понятных задач делают подобные ошибки. Не удивительно, что полезные разновидности эвристики, такие как реп­ резентативность и доступность сохраняются, даже при том, что они иногда ведут к ошибкам в прогнозах или оценках. Что возможно и является удиви­ тельным, так это неспособность людей вывести из длительного жизненного опыта такие фундаментальные статистические правила к а к регресс к сред­ нему или эффект размера выборки при анализе изменчивости внутри вы ­ борки. Х отя все мы в течение ж изни встречаемся с многочисленными ситу­ ациям и, к которым эти правила могут быть применимы, очень немногие самостоятельно открывают принципы отбора выборки и регресса на своем опыте. Статистические принципы не познаются на основе каждодневного опыта, потому что соответствующие примеры не закодированы нужным образом. Например, люди не обнаруживают, что средняя длина слова в стро­ ках следующих друг за другом в тексте, отличается больше чем на следую­ щ их друг за другом страницах, потому что они просто не обращают внима­ ния на среднюю длину слова в отдельных строках или страницах. Таким образом, люди не изучают отношение между размером выборки и изменчи­ востью внутри выборки, хотя данных для такого вывода предостаточно. Недостаток соответствующей кодировки такж е объясняет, почему люди обычно не обнаруживают стереотипы в своих суж дениях о вероятности. Человек мог бы узнать, правильны ли его оценки, подсчитывая число собы­ тий, которые действительно происходят из тех, которые он считает равно­ вероятными. Однако для людей не естественно группировать события по признаку их вероятности. При отсутствии такой группировки человек не может обнаружить, например, что только 50% предсказаний, вероятность которых он оценил к ак 0.9 или выше фактически сбылись. Эмпирический анализ когнитивных стереотипов имеет значение для тео­ ретической и прикладной роли оценки вероятностей. Современная теория принятия решений (de F inetti, 1968; Savage, 1954) рассматривает субъек­ тивную вероятность к ак количественное мнение идеализированного чело­ века. Определенно, субъективная вероятность данного события определя­ ется набором шансов относительно этого события, из которых человеку пред­ лагается выбрать. Может быть получено внутренне последовательное или целостное измерение субъективной вероятности, если выборы человека сре­ ди предложенных шансов подчиняются некоторым принципам, то есть а к ­ сиомам теории. Полученная вероятность субъективна в том смысле, что различные люди могут иметь различные оценки вероятности одного и того ж е события. Главный вклад этого подхода состоит в том, что он обеспечива­ ет строгую субъективную интерпретацию вероятности, которая является применимой к уникальным событиям и является частью общей теории ра­ ционального принятия решений. Принятие решений в условиях неопределенности 35 Возможно, стоит отметить, что, в то время к ак субъективные вероятнос­ ти могут иногда выводиться из выбора шансов, они обычно не формируют­ ся этим способом. Человек делает ставку скорее на команду А, чем на ко­ манду В, потому что верит, что команда А, вероятнее всего, победит; он не выводит свое мнение к ак результат предпочтений тех или иных шансов. Таким образом, в действительности, субъективные вероятности определя­ ют предпочтения в шансах, но не выводятся из них, в отличие от аксиома­ тической теории рационального принятия решений (Savage, 1954). Субъективный характер вероятности привел многих ученых к мнению, что целостность, или внутренняя последовательность - единственный име­ ющий силу критерий, в соответствии с которым должны быть оценены ве­ роятности. С точки зрения формальной теории субъективной вероятности, любой набор внутренне последовательных вероятностных оценок столь ж е хорош к а к любой другой. Этот критерий не вполне удовлетворителен, пото­ му что внутренне последовательный набор субъективных вероятностей мо­ ж ет быть несовместим с другими мнениями, которых придерживается че­ ловек. Рассмотрите человека, чьи субъективные вероятности для всех воз­ можных результатов подбрасывания монеты отражают ошибку игрока в казино. То есть его оценка вероятности появления «решки» при каждом конкретном подбрасывании увеличивается с числом последовательно вы ­ павш их «орлов», которые предшествовали этому подбрасыванию. Сужде­ ния такого человека могут быть внутренне последовательными и поэтому приемлемыми к а к адекватные субъективные вероятности согласно крите­ рию формальной теории. Эти вероятности, однако, являю тся несовмести­ мыми с общепринятым мнением, что у монеты “нет пам яти” и поэтому она не способна производить последовательные зависимости. Чтобы оцененные вероятности, считались адекватными, или рациональными, внутренней последовательности недостаточно. Суждения должны быть совместимы со всеми прочими взглядами этого человека. К сожалению, не может быть про­ стой формальной процедуры для оценки совместимости набора вероятност­ ных оценок с полной системой взглядов субъекта. Рациональный эксперт будет, однако, бороться за совместимость, даже при том, что внутреннюю последовательность более легко достичь и оценить. В частности он будет пытаться делать свои вероятностные суждения совместимыми с его знани­ ями относительно предмета, законов вероятности и своей собственной эври­ стики оценки и предубеждений. Резюме Эта статья описывает три типа эвристики, которые используются при оцен­ ках в условиях неопределенности: (i) репрезентативность, которая обычно используется, когда людей просят оценить вероятность того, что объект А или случай принадлежит классу или процессу В; (ii) доступность событий или сценариев, которая часто используется, когда людей просят оценить частоту класса или правдоподобия отдельно взятого варианта развития со­ бытий; и (Ш) корректировка или «привязка», которая обычно использует­ ся при количественном прогнозировании, когда доступна соответствующая величина. Эти эвристики высоко экономичны и обычно эффективны, но они приводят к систематическим ошибкам в прогнозе. Лучшее понимание этих эвристик и отклонений, к которым они приводят, могло внести вклад в оцен­ ку и принятие решений в условиях неопределенности. Часть II Репрезентативность 2. Вера в закон малых чисел* Амос Тверски и Даниелъ Канеман “Предположим, что Вы провели эксперимент с 20 испытуемыми, и получи­ ли значим ы й результат, которы й подтверж дает Вашу теорию (z = 2.23, р < 0.05, «двустороннее»). Вы теперь имеете основание для проведения экс­ перимента с дополнительной группой из 10 испытуемых. К ак Вы думаете, какова вероятность того, что результаты будут значимыми, если будет про­ водиться испытание с односторонним критерием, причем отдельно для этой группы? “ Если Вы считаете, что вероятность где-то около 0.85, Вы можете быть удовлетворены тем, что принадлежите к большинству. Действительно, это был среднестатистический ответ двух малых групп, которые любезно со­ гласились ответить на анкету, распространенную на встрече Группы мате­ матической психологии в Американской Психологической Ассоциации. С другой стороны, если Вы считаете, что вероятность около 0.48, Вы при­ надлежите к меньшинству. Только 9 из наш их 84 респондентов дали ответы между 0.40 и 0.60. Однако оказывается, что 0.48 — намного более обоснован­ ная оценка, чем 0.851. 1 Требуемую оценку можно интерпретировать несколькими способами. Один возможный подход состоит в том, чтобы следовать общей практике исследования, где оценка, получен­ ная в одном исследовании, принимается для того, чтобы определить правдоподобную аль­ тернативу отсутствующей гипотезе. Требуемую вероятность можно тогда интерпретиро­ вать как достоверность второго теста (то есть, вероятность получения значимого результата во второй выборке) в противоположность альтернативной гипотезе, определенной резуль­ татом первой выборки. В особом случае теста среднего значения с известной изменчивос­ тью, можно было бы вычислить достоверность теста по отношению к гипотезе, что среднее для всей совокупности равняется среднему для выборки. Так как размер второй выборки - половина первой выборки, подсчитанная вероятность получения z > 1.645- только 0.473. Теоретически более достоверный подход состоит в том, чтобы интерпретировать требуемую вероятность в пределах структуры Байеса, вычислить ее относительно соответственно выб­ ранного предшествующего распределения. Допуская предыдущую равномерность распре­ деления, требуемая вероятность в последующем - 0.478. Ясно, что, если предшествующее 40 РЕПРЕЗЕНТАТИВНОСТЬ Очевидно, большинство психологов преувеличенно верят в вероятность успешного повтора полученных результатов. Вопросы, которых касается эта часть книги - это источники такой уверенности, и их последствия для проведения научного исследования. Наш тезис состоит в том, что люди об­ ладают сильными предубеждениями относительно случайной выборки; что эти предубеждения ошибочны фундаментально; что эти предубеждения характерны к ак для простых испытуемых, так и для подготовленных уче­ ных; и что ее применение в ходе научного исследования имеет неудачные последствия. Мы представляем на обсуждение тезис о том, что люди рассматривают выборку отобранную случайным образом из совокупности к ак высоко реп­ резентативную, то есть подобную всей совокупности во всех существенных характеристиках. Следовательно, они ожидают, что любые две выборки, взя­ тые из ограниченной совокупности, будут более подобны друг другу и сово­ купности, чем предполагает теория выборок, по крайней мере, для малых выборок. Тенденция расценивать выборку к ак репрезентативную наблюдается в самых разнообразных ситуациях. Когда тестируемых просят создать слу­ чайную последовательность гипотетических подбрасываний монеты, напри­ мер, они создают последовательности, где пропорция «орла» на любом ко­ ротком отрезке гораздо ближе к 0.50, чем предсказала бы теория вероятно­ сти (Tune, 1964). Таким образом, каж ды й отрезок полученной последова­ тельности высоко репрезентативен по отношению к «справедливости» мо­ неты. Подобные эффекты наблюдаются, когда тестируемые последователь­ но предсказывают события в созданном случайным образом ряде событий, к ак в экспериментах по изучению вероятности (Estes, 1964) или в других последовательных играх с шансами. Тестируемые действуют так, к ак буд­ то, каждый отрезок случайной последовательности должен отражать пра­ вильную пропорцию: если последовательность отклонилась от пропорции во всей совокупности, ожидается корректирующее отклонение в другом направлении. Это получило название ошибки игрока казино. Суть ошибки игрока казино - неправильное представление о справедли­ вости закона случайности. Игрок чувствует, что равнозначность сторон мо­ неты дает ему право ожидать, что любое отклонение в одном направлении будет скоро компенсировано соответствующим отклонением в другую сто­ рону. Д аж е самая сбалансированная монета, однако, обладая ограничения­ ми морали и памяти, не может при подбрасывании выдавать столь же рав­ новероятные результаты, как того ожидает игрок в казино. Эта ошибка свой­ ственна не только игрокам. Рассмотрим следующий пример: распределение подтверждает нулевую гипотезу, как это часто бывает, следующая вероят­ ность будет даже меньшей. Данная глава первоначально появилась в Психологическом Бюллетене, 1971, 2,105 -110. Авторское право © 1971 Американской Психологической Ассоциацией. Переиздано в соот­ ветствии с разрешением. Вера в закон малых чисел 41 Средний IQ среди восьмиклассников в городе, как известно, является 100. Вы выбрали случайную выборку из 50 детей для изучения достижений в учебе. Первый протестиро­ ванный ребенок имеет IQ 150. Каким, как Вы ожидаете, будет средний показатель ин­ теллекта для всей выборки? Правильный ответ - 1 0 1 . Неожиданно большое количество людей полага­ ют, что ожидаемый IQ для выборки все равно 100. Это может быть оправда­ но только мнением, что случайный процесс самокорректируется. Высказы­ вания типа “ошибки компенсируют друг друга” отражают представление людей об активном процессе самокоррекции случайных процессов. Некоторые распространенные процессы в природе подчиняются таким законам: отклонение от устойчивого равновесия порождает силу, которая восстанавливает равновесие. Законы вероятности, напротив, не работают подобным образом: отклонения не отменяются по мере перебора элементов выборки, они ослабляются. До сих пор, мы пытались описать два взаимосвязанных вида предубеж­ дений для определения шансов. Мы предложили гипотезу репрезентатив­ ности, согласно которой люди полагают, что выборки будут очень подобны­ ми друг другу и совокупностям, из которых они отобраны. Мы такж е пред­ положили, что люди считают, что процессы в выборке — это самокорректи­ рующийся процесс. Эти два мнения ведут к одним и тем ж е последствиям. Оба порождают ожидания относительно выборки, и изменчивость этих про­ гнозов меньше, чем реальная изменчивость, по крайней мере, для малых выборок. Закон больших чисел гарантирует, что очень большие выборки будут дей­ ствительно высоко репрезентативны по отношению к совокупности, из ко­ торой они взяты . Если, кроме того, действует тенденция саморегуляции, то маленькие выборки должны такж е быть высоко репрезентативными и по­ добными друг другу. И нтуиция людей относительно случайных выборок, каж ется, соответствует закону малы х чисел, который утверждает, что за­ кон больших чисел применяется такж е и к малым числам. Рассмотрим гипотетического ученого, который ж ивет в соответствии с законом малых чисел. К ак его убеждения влияли бы на его научную рабо­ ту? Предположим, что наш ученый изучает явления, величина которых маленькая относительно ее неконтролируемой изменчивости, то есть, соот­ ношение сигнала и помехи в сообщениях, которые он получает от природы изучаемого явления, невелико. Наш ученый мог быть метеорологом, фар­ макологом, или возможно психологом. Если ученый верит в закон малых чисел, то он будет переоценивать вы ­ воды, сделанные на маленьких выборках. Чтобы проиллюстрировать это, предположим, что он занят изучением того, какую из двух игруш ек пред­ почли бы маленькие дети. Из первых пяти малышей, которых он изучил, четыре отдали предпочтение одной и той ж е игрушке. Немало психологов на этом этапе будут ощущать некоторую уверенность в том, что нулевая ги­ потеза о том, что никакой из игруш ек не отдается предпочтение, ложна. К 42 РЕПРЕЗЕНТАТИВНОСТЬ счастью, такая убежденность не является достаточным условием для пуб­ ликации статьи в журнале, хотя оно может подойти для книги. С помощью быстрых подсчетов, наш психолог обнаружит, что вероятность результата, который был бы столь ж е предельным, как полученный им, столь ж е высо­ к а к а к 3 /8 при нулевой гипотезе. Безусловно, применение статистической проверки гипотезы для научного вывода связано с серьезными трудностями. Тем не менее, вычисление уров­ ней значимости (или коэффициентов вероятности, к ак предпочел бы Байес) заставляет ученого оценивать полученный эффект скорее в терминах оцен­ ки надежности изменчивости выборки, чем в терминах своей субъективной оценки, в которой присутствуют отклонения. Статистические испытания, исходя из этого, защ ищ ают научное сообщество от чрезмерно поспешного отказа от нулевой гипотезы (ошибка первого рода) контролируя многих сво­ их членов, которые предпочли бы ж ить в соответствии с законом малых чисел. С другой стороны, не имеется никаких эффективных гарантий про­ тив того, что не удастся утвердить вполне обоснованную исследовательскую гипотезу (ошибка второго рода). Вообразите психолога, который изучает взаимосвязь между потребностью в достижениях и ученой степенью. Реш ая, какой размер будет у его выборки, он может рассуждать следующим образом: “Какую взаимосвязь я ожидаю? г = 0.35. Какой N мне нужен для того, чтоб мой результат был значимым? (Смотрит в таблицу.) N = 33. Прекрасно, это — моя выборка”. Единственный недостаток в этом рассуждении — то, что наш психолог забыл о разнообразии среди элементов выборки, возможно, потому что он полагает, что любая выборка должна быть высоко репрезентативна по отно­ шению к совокупности, из которой она взята. Однако, если его предположе­ ние относительно корреляции в совокупности верно, корреляция в выборке может быть около 0.35. Следовательно, вероятность получения значимого результата (то есть, надежность теста) для N —33 приблизительно равна 0.50. В детальн ом исследован ии м ощ ности стати сти ческ и х к р и тер и ев , Д ж . KoeH(J. Cohen, 1962,1969) привел правдоподобные определения боль­ ш и х, средних, м алы х результатов, обширного набора вычислительны х средств для оценки мощности разнообразных статистических тестов. В нор­ мальном тесте значение разности между двумя средними, например, раз­ ность 0.2 5а считается маленькой, разность 0.50 а — средней, и разность в 1а является большой, согласно предложенным определениям. Средняя раз­ ность между уровнем интеллекта служ ащ их и уровнем интеллекта рабочих со средней квалификацией - это средний результат. В исследовании науч­ ной практики, Д ж . Коен (1962) рассмотрел все статистические исследова­ н ия, изданные в одном томе ж урнала «Психопаталогия и социальная пси­ хология» , и вычислил вероятность обнаружения каждого из трех значений результата. Средняя мощность для обнаружения маленьких результатов была 0.18, 0.48 - для средних результатов, и 0.83 - для больших результа­ тов. Если психологи к а к обычно ожидают появление средних результатов и Вера в закон малых чисел 43 выбирают размер выборки по такому ж е принципу, как и в вышеупомяну­ том примере, надежность их исследований должна действительно быть при­ близительно 0.50. Анализ Дж. Коена показывает, что статистическая мощность многих пси­ хологических исследований очень мала. Это - пагубная практика: она разо­ чаровывает ученых и понижает эффективность исследования. Исследовате­ лю, который проверяет действенную гипотезу, но не может получить значи­ мых результатов, ничего не остается, кроме к ак рассматривать природу не­ надежной или даже враждебной. Кроме того, к ак показал Оверолл (Overall, 1969), распространенность исследований, несовершенных в статистической мощности не только иррациональна, но и фактически вредна: результатом ее является большое количество необоснованных отказов от использования ну­ левой гипотезы среди опубликованных результатов. Поскольку изучение статистической мощности имеет особую важность в смысле организации повторных исследований, мы исследовали отношение к повторяемости в нашем анкетном опросе. Предположим, что один из Ваших докторантов закончил трудный и продолжитель­ ный по времени эксперимент, включающий в качестве испытуемых 40 животных. Он зафиксировал и проанализировал большое количество переменных. Пока результаты неокончательные, но одно предварительное сравнение оказалось высоко значи­ мым t = 2.70, что было очень неожиданным и могло представлять большое теоретичес­ кое значение. Учитывая важность результата и его неожиданное значение, и количество анализов, которые проделал докторант, порекомендовали бы Вы ему воспроизвести исследова­ ние перед публикацией работы? Если Вы рекомендуете ему повторить исследование, то с каким количеством животных Вы посоветуете ему поработать? Среди опрошенных психологов, преобладало мнение относительно повтор­ ного исследования: его порекомендовало 66 из 75 респондентов, вероятно, потому что они подозревали, что единственно значимый результат был слу­ чайным. Среднестатистическая рекомендация докторанту была обработать 20 испытуемых в повторном исследовании. Поучительно рассмотреть веро­ ятные последствия этого совета. Если среднее значение и дисперсия элемен­ тов во второй выборке фактически идентичны тем ж е показателям первой выборки, то результирующее значение t будет 1.88. Следуя рассуждениям в Примечании 1 шанс докторанта получить значимый результат при повто­ рении - только немного выше половины (для р = 0.05, одностороннего тес­ та). Так к а к мы ожидали, что повторная выборка из 20 испытуемых, будет казаться обоснованной для наш их респондентов, мы добавляли следующий вопрос: Предположите, что Ваш несчастный докторант фактически повторил начальное иссле­ дование, увеличив размер выборки животных на 20, и не получил значительного резуль­ тата в этом направлении, t = 1.24. Что бы Вы порекомендовали ему теперь? Числа в круг­ лых скобках указывают число респондентов, которые отметили этот ответ ( А) Он должен объединить результаты и издавать свои выводы как факт. (0) РЕПРЕЗЕНТАТИВНОСТЬ 44 ( B) Он должен сообщить о результатах как о предварительном открытии. (26) ( C) Он должен поработать с другой группой животных (состоящей в среднем из 20). ( 21 ) (D) Он должен пробовать найти объяснение различиям между этими двумя группа­ ми. (30) Обратите внимание, что независимо от уверенности в первоначальном от­ кры тии, его правдоподобность, конечно, возросла после повторного прове­ дения опыта. Не только был получен похожий экспериментальный резуль­ тат в двух выборках, но такж е и значимость результата в повторном опыте составила полных две трети величины результата в первоначальном иссле­ довании. Ввиду размера выборки (20), который порекомендовали наши рес­ понденты, повторное проведение эксперимента было приблизительно на­ столько успешным, насколько можно ожидать. Распределение ответов, од­ нако, отражает существующий и поныне скептицизм относительно откры ­ тия докторанта, за которым последовал повторный эксперимент, к ак и ре­ комендовалось. Это плачевное состояние дел - типично последствие недо­ статочной статистической надежности. В отличие от ответов В и С, которые могут иметь некоторые основания, наиболее популярный ответ, ответ D, является неприемлемым. Мы сомне­ ваемся, что этот ж е ответ был бы получен, если бы респонденты понимали, что разница между двумя исследованиями даж е приблизительно не явл я­ ется значимой. (Если дисперсия элементов этих двух выборок равны , то t = 0.53.) В отсутствии статистической проверки, наши респонденты следо­ вали гипотезе репрезентативности: поскольку различие между этими дву­ м я выборками была больше, чем, они ожидали, они рассмотрели это к ак основание для объяснений. Однако попытка «найти объяснение различию между этими двумя группами», является, по всей вероятности, попыткой объяснить появление помехи. Н аш и респонденты, все вместе, оценили проведение повторного исследо­ вания довольно грубо. Это следует из гипотезы репрезентативности: если мы ожидаем, что все выборки очень похожи друг на друга, то почти все по­ вторения правомерной гипотезы должны быть статистически значимы. Гру­ бость критерия для успешного повторения опыта может быть продемонст­ рирована в ответе на следующий вопрос: Исследователь сообщил результат, который Вы считаете неправдоподобным. Он про­ вел исследование с 15 испытуемыми, и получил значимую величину, t = 2.46. Другой исследователь попытался повторить его опыт, но он получил не значимую величину t для того же числа субъектов. Инструкция была та же самая в обоих экспериментах. Вы просматриваете литературу. Какова наибольшая величина t во втором эксперимен­ те, про которую Вы могли бы сказать, что ее невозможно воспроизвести? Большинство наш их респондентов оценило t = 1.70 как неудачу в повторе­ нии исследования. Если суммировать данные двух таких исследований (t = 2.46 и t = 1.70), значение t для объединенных данных приблизительно Вера в закон малых чисел 45 3.00 (при равных дисперсиях). Таким образом, перед нами парадоксальное положение дел, при котором одни и те ж е данные, которые увеличили бы нашу уверенность по поводу результата, при рассмотрении к ак часть перво­ начального исследования, пошатнули бы наш у уверенность, если бы рас­ сматривались как независимое исследование. Этот двойной стандарт осо­ бенно беспокоит с тех пор, к а к , по многим причинам, повторные проведе­ ния опытов обычно рассматриваются к ак независимые исследования, и ги­ потезы часто оцениваются с помощью перечня непоследовательных данных, подтверждающих их. Вопреки широко распространенному мнению, может быть так, что вы ­ борка повторного опыта часто больше, чем изначальная. Решение воспро­ извести когда-то полученный результат часто является следствием того, что исследователь очень доволен результатом и хочет, чтобы скептически на­ строенное научное сообщество его приняло. Так к а к сообщество необосно­ ванно требует, чтобы результаты повторного эксперимента были значимы независимо от изначального эксперимента, или, по крайней мере, чтобы они были хотя бы приблизительно значимыми, существует необходимость об­ рабатывать большую выборку. В качестве иллюстрации приведем пример, что если неудачливый докторант, чья диссертация обсуждалась, приним а­ ет валидность своего первоначального результата (t = 2.70, N = 40), и если он хочет, чтобы риск того, что он получит t меньше 1.70, была только 0 Л , он должен будет провести работу приблизительно с 50 животными в своем по­ вторном исследовании. С несколько более слабым первоначальным резуль­ татом (t = 2.20, N = 40), размер повторной выборки, требуемый для получе­ ния такой ж е мощности теста, возрастает приблизительно до 75. То, что результаты, обсужденные к настоящему времени, не ограничены только гипотезами относительно средней величины и дисперсии показыва­ ют ответы на следующий вопрос: Вы выполнили исследование корреляции, оценивая 20 переменных для 100 испытуе­ мых. Двадцать семь из 190 коэффициентов корреляции являются значимыми на уров­ не 0.05; и 9 из них значимы за пределами 0.01. Среднее абсолютного уровня значимых корреляций - 0.31, и образец результатов теоретически обоснован. Как вы считаете, сколько из 27 значимых корреляций, по Вашим ожиданиям, снова будут значимыми, при точном повторении исследования, при N = 40? При N = 40, требуется корреляция приблизительно 0.31 уровня для того, чтобы она была существенной на уровне 0.05. Это средняя величина значи­ мых корреляций в первоначальном исследовании. Таким образом, только около половины первоначально значимых корреляций (то есть, 13 или 14) остались бы значимыми при N =40. Кроме того, конечно, корреляции в повтор­ ном исследовании должны отличаться от корреляций в оригинальном ис­ следовании. Следовательно, благодаря регрессии, первоначально значимые коэффициенты, наиболее вероятно, уменьшатся. Таким образом, от 8 до 10 повторяемых корреляций из первоначальных 27 - это максимум из того, 46 РЕПРЕЗЕНТАТИВНОСТЬ что можно ожидать. Средняя оценка наш их респондентов - 18. Это больше чем количество значимых корреляций повторного опыта, которые будут получены, если корреляции повторно вычислены для 40 испытуемых, выб­ ранны х наугад из первоначальных 100! Очевидно, люди ожидают больше­ го, чем простое дублирование первоначальной статистики в выборке повтор­ ного исследования; они ожидают, повторения значимых результатов, не принимая в расчет размер выборки. Это ожидание требует нелепого продол­ ж ения гипотезы репрезентативности; даже закон малых чисел не способен произвести подобных результатов. Надежда на то, что результаты возможно воспроизвести почти во всей полноте, объясняет обычное, хотя и довольно прискорбное явление. Иссле­ дователь, который вычисляет все корреляции между тремя индексами тре­ вожности и тремя индексами зависимости, будет часто сообщать и доволь­ но уверенно интерпретировать единственную полученную существенную корреляцию. Его уверенность в неточном результате является следствием его убеждения, что полученная матрица корреляций высоко репрезентатив­ на и легко воспроизводима. В этом разделе, мы увидели, что сторонник закона малых чисел ведет свою научную деятельность следующим образом: 1. Он подвергает риску свои исследовательские гипотезы на небольших выборках, не осознавая, что шансы в его пользу чрезвычайно низки. Он пе­ реоценивает мощность. 2. Он необоснованно уверен в ранних тенденциях (например, в данных, полученных на первых нескольких испытуемых) и в стабильности наблю­ дений (например, в количестве и идентичности значимых результатов). Он переоценивает значимость. 3. В оценке повторных исследований, своих собственных или чуж их, он имеет необоснованно высокие ожидания относительно воспроизводимости значимых результатов. Он недооценивает величину доверительных интер­ валов. 4. Он редко объясняет отклонение от ожидаемых результатов выборки изменчивостью выборок, потому что он находит “объяснение” любому не­ соответствию. Таким образом, он имеет мало возможностей распознать и з­ менчивость выборок в действии. Поэтому его вера в закон малых чисел, на­ всегда останется непоколебимой. Наш анкетный опрос вы являл многочисленные примеры распространен­ ности веры в закон малы х чисел2. Нашим типичным респондентом являлся сторонник этого закона, независимо от группы, к которой он принадлежит. 2В. Эдвардз (1968,25) обосновал, что люди терпят неудачу в извлечении достаточного коли­ чества информации или определенности из вероятностных данных. Он назвал эту неудачу консерватизмом. Наши респонденты вполне подходят под описание консерваторов. Ско­ рее, в соответствии с гипотезой репрезентативности, они имеют тенденцию извлекать из данных большее количество определенности, чем данные, фактически, содержат. Вера в закон малых чисел 47 Не было фактически никаких различий между среднестатистическими от­ ветами в аудитории на собрании, где обсуждались проблемы математичес­ кой психологии и на общей сессии съезда Американской Психологической Ассоциации, хотя мы не заявляем о репрезентативности любой из этих двух выборок. Очевидно, познания в области формальной логики и теории веро­ ятности не уменьшают ошибочную интуицию. Что же, в таком случае, мож ­ но сделать? Можно ли искоренить веру в закон малых чисел или, по край­ ней мере, контролировать ее? Опыт исследований, вряд ли, сильно поможет, потому что дисперсия выборок такж е легко «объясняется». Корректирующие эксперименты - это эксперименты, которые не обеспечивают ни мотива, ни возможности для ложного объяснения. Таким образом, студент, изучающий статистику, мо­ жет брать повторяемые выборки заданного размера из совокупности, и изу­ чать влияние размера выборки на изменчивость выборки на личном опыте. Однако нет уверенности, что ож идания могут быть скорректированы таким способом, так как предубеждения, подобные таким, к а к ошибки игрока в казино, сохраняются несмотря на опыт. Даже если нельзя отказаться от стереотипов, студенты могут научиться распознавать их существование и принимать необходимые меры предосто­ рожности. Так к ак в обучении статистике немало предостережений, пре­ дупреждение относительно стереотипности статистической интуиции не может быть неуместным. Очевидная ъ-ера предосторожности это вычисле­ ние. Сторонник закона малых чисел имеет ошибочные убеждения относи­ тельно уровня достоверности, мощности и интервалов доверительности. Уровни значимости обычно вычисляются, и о них сообщается, а мощность и интервалы доверительности - нет. Возможно, они должны быть. Явное вычисление мощности, относящееся к некоторой обоснованной гипотезе, например, малым, большим и средним результатам Дж.Коена (1962, 1969), несомненно, должно быть выполнено до того, к а к проведено исследо­ вание. Такие вычисления ведут к осознанию того, что нет никакого смысла проводить исследование, если, например, размер выборки не увеличить в 4 раза. Мы отказываемся от убеждения, что серьезный исследователь созна­ тельно пойдет на риск 0.50 того, что его обоснованная гипотеза исследова­ ния так и не будет подтверждена. Кроме того, вычисление надежности су­ щественны для интерпретации отрицательных результатов, то есть, если не удалось отказаться от нулевой гипотезы. Поскольку интуитивные оцен­ ки мощности читателями, вероятно, будут неправильными, то, что в дан­ ной книге приводятся подсчитанные значения величин, скорее всего, не будет пустой тратой времени читателей и бумаги. В психологической литературе, изданной ранее, преобладало согласие при представлении отчетов, брать, например, выборку размером в среднем, на­ пример, М ±РЕ, где РЕ - вероятная ошибка (то есть, доверительный интер­ вал 50% относительно средней величины). Это соглашение было позже ос­ тавлено в пользу формулировки проверки гипотез. Доверительный интер­ вал, однако, обеспечивает полезный коэффициент для дисперсии выборки, и именно эту дисперсию мы имеем тенденцию недооценивать. А кцент на уровнях значимости имеет тенденцию уменьшать фундаментальное разли­ чие между размером результата и его статистической значимостью. Н еза­ висимо от размера выборки, результат в одном исследовании является обо­ снованной оценкой результата при повторении. Напротив, оцененный уро­ вень значимости в повторном эксперименте сильно зависит от размера вы ­ борки. Нереалистичные ожидания относительно воспроизводимости уров­ ней значимости могут быть скорректированы, если будет прояснено разли­ чие между размером и значимостью, и если вычисленный размер наблюда­ емых результатов описан к а к положено. С этой точки зрения, по крайней мере, принятие модели проверки гипотез не было долгожданным счастьем для психологии. Ревностный приверженец закона малых чисел совершает множество гре­ хов против логики статистического вывода с самыми честными намерения­ ми. Гипотеза репрезентативности описывает когнитивный стереотип или стереотип чувственного восприятия, который действует независимо от мо­ тивации. Таким образом, в то время к ак поспешный отказ от использова­ н и я нулевой гипотезы является привлекательным, отклонение от взлеле­ янной гипотезы, является ухудшающим, все ж е истинный сторонник зако­ на малых чисел зависит и от того, и от другого. Его интуитивные ожидания подчиняются скорее постоянному неправильному восприятию мира, чем удобному принятию желаемого за действительное. В ответ на замечания ре­ дакторов, он может решить относиться с надлежащим недоверием к своей ста­ тистической интуиции и заменять впечатления вычислением всякий раз, ког­ да это возможно. 3. Субъективная вероятность: оценка репрезентативности* Даниелъ Канеман и Амос Тверски Субъективная вероятность играет важную роль в нашей ж изни. Решения, которые мы принимаем, выводы, к которым мы приходим, и объяснения, которые мы подыскиваем, обычно основаны на наш их суждениях о вероят­ ности неопределенных событий, таких к а к успех на новой работе, результа­ ты выборов или состояние рынка. Действительно, большое количество ли­ тературы по экспериментальным исследованиям было посвящено вопросу, как люди воспринимают, обрабатывают и оценивают вероятность неопре­ деленных событий, в контексте изучения вероятности, интуитивной стати­ стики и принятия реш ения в условиях риска. И хотя никакой системати­ ческой теории в психологии неопределенности не появилось, благодаря этой литературе было сформулировано несколько обобщений. Возможно наибо­ лее общий вывод, полученный из многочисленных исследований заклю ча­ ется в том, что люди не следуют принципам теории вероятности в оценке вероятности неопределенных событий. Вряд ли это заключение можно счи­ тать удивительным, потому что многие из законов случайности не являю т­ ся ни интуитивно очевидными, ни удобными для применения. Менее оче­ видным, однако, является тот ф акт, что отклонения субъективной от объек­ тивной вероятности1 представляются надежными, систематическими, и кажется, что их тяжело устранить. Очевидно, люди заменяют законы слу­ чайности эвристикой, оценки которой иногда бывают разумными, по очень часто — нет. 1Мы используем термин “ субъективная вероятность” для обозначения любой оценки веро­ ятности события, которую дает испытуемый, или которая выводится из его поведения. Не предполагается, что эти оценки, должны удовлетворять каким-либо аксиомам или требова­ ниям последовательности. Мы используем термин “ объективная вероятность “ для обозначе­ ния числовых значений, подсчитанных на основе установленных допущений, согласно зако­ нам вычисления вероятности. Разумеется, эта терминология не совпадает с каким-либо фи­ лософским представлением вероятности. *Эта глава - сокращенная версия статьи, которая появилась в Cognitive Psychology, 1972,3,430454. Авторское право © Academic Press, Inc. 1972. Переиздано в соответствии с разрешением. 50 РЕПРЕЗЕНТАТИВНОСТЬ В настоящей книге мы подробно исследуем одну из таких эвристик, на­ зываемую репрезентативностью. Человек, который следует этой эвристи­ ке, оценивает вероятность неопределенных событий или выборок, степенью, в которой они: (1) подобны в своих существенных свойствах исходной сово­ купности; и (2) отражают существенные особенности процесса, с помощью которого они были созданы. Наш тезис заключается в том, что во многих случаях, событие А оценивается к ак более вероятное, чем событие В вся­ ки й раз, когда оно каж ется более репрезентативным, чем В. Другими сло­ вами, упорядочивание событий по их субъективной вероятности совпадает с упорядочиванием их по репрезентативности. Репрезентативность, к а к подобие при восприятии, легче оценить, чем охарактеризовать. В обоих случаях, отсутствует общее определение, хотя существуют случаи, в которых люди выраж аю т согласие в том, какой из двух стимулов является более похожим на стандарт, или какое из двух со­ бытий более репрезентативно по отношению к данному процессу. В этой книге мы не измеряем репрезентативность с помощью ш калы , хотя это впол­ не выполнимо. Вместо этого, мы рассматриваем случаи, когда упорядочи­ вание событий по их репрезентативности является очевидным, и показыва­ ем, что люди постоянно оценивают более репрезентативное событие к ак бо­ лее вероятное, независимо от того, так это или нет. Хотя репрезентативность может играть важную роль во многих суждениях вероятности, например, в прогнозировании политической ситуации или клиническом диагнозе, су­ ществующий подход ограничен только повторяющимися ситуациями, где объективные вероятности легко можно вычислить. Большинство данных, которые упоминаются в этой части книги, собра­ ны в форме анкетного опроса приблизительно 1. 500 респондентов в И зраи­ ле. Испытуемыми были учащиеся 10,11, и 12 классов средне-образователь­ ных ш кол, готовящ ихся к поступлению в высшее учебное заведение (в воз­ расте 15-18 лет). Чтобы привлечь внимание и мотивировать испытуемых, были приложены специальные усилия. Анкетные опросы были оформле­ ны в виде коротких тестов, проводились в естественной ситуации — в класс­ ной комнате, а имена респондентов были написаны на листах с ответами. К аж ды й респондент отвечал на небольшое число вопросов (обычно 2-4), на каж ды й из которых требовалось максимум 2 мин. Было объявлено, что воп­ росы изучают интуицию людей относительно определения шансов. Испы­ туемым давали стандартные устные инструкции, которые подробно объяс­ няли соответствующий вопрос. Процедура проведения опыта была постро­ ена таким образом, чтобы не вызывать ассоциаций с какой-либо школой или возрастом. Большинство вопросов было предварительно опробовано на сту­ дентах старш их курсов университета (в возрасте 20-25 лет) и результаты, полученные от этих двух совокупностей, были идентичными. Субъективная вероятность 51 Д е т е р м и н а н т ы р е п р е зе н т а т и в н о с т и В этом разделе мы обсудим характеристики выборок или событий, которые делают их репрезентативными, и демонстрируют их влияние на субъектив­ ную вероятность. Сначала, мы опишем некоторые особенности, которые определяют подобие выборки ее исходной совокупности, затем мы присту­ пим к анализу детерминантов очевидной случайности. Подобие выборки и совокупност и Понятие репрезентативности лучше объяснять на особых примерах. Рас­ смотрим следующий пример. Были обследованы все семьи в городе, в которых было шестеро детей. В 72 семьях маль­ чики и девочки рождались в таком порядке Д М Д М М Д. Как вы думаете, в скольких рассмотренных семьях порядок рождения детей был М Д мммм? Две последовательности рождений приблизительно одинаково вероятны, но большинство людей, конечно, согласятся, что они не одинаково репрезен­ тативны. Последовательность с пятью мальчиками и одной девочкой не смо­ жет отразить пропорцию мальчиков и девочек в совокупности. Действитель­ но, 75 из 92 испытуемых оценили, что эта последовательность менее веро­ ятна, чем стандартная последовательность (р < 0.01 согласно тесту знаков). Средняя оценка была 30. Подобные результаты были сообщены Коен и Хенсел (Cohen и Hansel, 1956), а такж е Алберони (Alberoni, 1962). Можно задаваться вопросом, не игнорируют ли просто испытуемые ин­ формацию о порядке появления детей, и ответить на вопрос, оценив частоту появления семей с пятью мальчиками и одной девочкой относительно час­ тоты семей с тремя мальчиками и тремя девочками. Однако, когда мы по­ просили, тех ж е самых испытуемых оценить частоту последовательности М М М Д Д Д, они сочли ее значительно менее вероятной, чем Д М М Д М Д (р < 0.01), предположительно потому, что первая упомянутая последова­ тельность каж ется менее случайной. Таким образом, порядок появления детей не игнорируется. Описанная детерминанта репрезентативности заключается в сохранении в выборке соотношения меньшинства или большинства такого ж е к ак и в совокупности. Мы ожидаем, что выборка, которая сохраняет это соотноше­ ние, будет оценена к ак более вероятная, чем выборка, появление которой (объективно) столь ж е вероятно, но где это отношение нарушено. Этот эф­ фект проиллюстрирован в следующей задаче: Всредней школе имеются две программы. Мальчиков большинство (65%) в программе А и меньшинство (45%) в программе В. В каждой из этих двух программ равное число классов. Вы входите в класс наугад, и видите, что 55% учеников - мальчики. Как вы предпола­ гаете, этот класс относится к программе А или программе В? 52 РЕПРЕЗЕНТАТИВНОСТЬ Т ак к а к больш инство учеников в классе - м альч и ки , этот класс более репрезентативен по отношению к программе А, чем программе В. Соответ­ ственно, 67 из 89 испытуемых предположили, что класс принадлежит про­ грамме А (р < 0.01, по тесту знаков). На самом деле, чуть более вероятно, что класс принадлежит программе В (так к ак дисперсия выборки для р = 0.45 превышает дисперсию для р = 0.65). Выборка, в которой представлены разнообразные возможные результа­ ты, вообще, более репрезентативна, чем сравниваемая с ней выборка, в ко­ торой некоторые из возможных результатов отсутствуют. Например, дан­ ный биноминальный процесс с р = 4 /5 значимое большинство испытуемых оценивают выборку с 10 успехами и 0 неудачами к ак менее вероятную, чем выборку с 6 успехами и 4 неудачами, хотя первая упомянутая выборка на самом деле более вероятна. Влияние стереотипа репрезентативности не сводится только к простым неподготовленным испытуемым. Этот стереотип также встречается (Tversky и K ahneman, 1971,2) в интуитивных суждениях опытных психологов. Ста­ тистическая значимость обычно рассматривается к а к подтверждение науч­ ной истины. Следовательно, реальный результат (в совокупности) к ак ож и­ дается, будет представлен значимым результатом (в выборке), практичес­ ки не принимая во внимание размер выборки. Вследствие этого, исследова­ тели склонны переоценивать вероятность значимого результата всякий раз, когда они полагают, что нулевая гипотеза будет ложной. Например, участникам заседания Группы Математической Психологии и Американской Психологической Ассоциации был предложен следующий вопрос: Предположим, что Вы проводите эксперимент с 20 испытуемыми, и получили значи­ мый результат, который подтверждает Вашу теорию (z= 2.23, р < 0.05, двусторонний критерий). Теперь у Вас есть основание провести эксперимент с дополнительной груп­ пой, состоящей из 10 испытуемых. Как Вы думаете, какова вероятность того, что резуль­ таты будут значимыми в тесте с односторонним критерием, отдельно для этой группы? Реальная оценка желательной вероятности - несколько ниж е 0.50. Сред­ н я я оценка респондентов была 0.85. Эта необоснованная уверенность в вос­ производимости значимости имеет серьезные последствия для проведения исследования: она приводит к нереалистичным ож иданиям относительно значимости и результатам планирования исследований, несовершенных в статистической мощности (см. J . Cohen, 1962). Отражение случайност и Д ля того чтобы неопределенное событие было репрезентативным, не доста­ точно, чтобы оно было подобно своей исходной совокупности. Событие так­ ж е должно отражать свойства неопределенного процесса, породившего его, то есть оно должно казаться случайным. К ак и в случае с подобием выборки Субъективная вероятность 53 и совокупности, специфические особенности, которые определяют очевид­ ную случайность, различаются в зависимости от контекста. Несмотря на это, две общих особенности, беспорядочность и локальная репрезентатив­ ность, каж ется, захватывают интуитивное представление о случайности. Обсудим эти свойства по порядку. Главная характеристика очевидной случайности - отсутствие системати­ ческих образцов. Последовательность выпадений монеты2, например, кото­ рая очевидно упорядочена - не репрезентативна. Таким образом, чередую­ щиеся последовательности орлов и решек, как, например, ОРОРОРОР или РРООРРОО, не смогут отразить случайность процесса. Действительно, испы­ туемые считают такие последовательности относительно невероятными и избегают их в моделировании случайных последовательностей (Time, 1964; W agenaar, 1970). Ожидается некоторая неупорядоченность, не только в появлении резуль­ татов, но такж е и в их распределении, к а к показано в следующей задаче: В каждом туре игры, 20 шариков наугад распределяются среди пятерых детей: Аланом, Беном, Карлом, Дэном и Эдом. Рассмотрите следующие распределения шариков: 1. Алан — 4, Бен — 4, Карл — 5, Дэн — 4, Эд — 3. 2. Алан — 4, Бен — 4, Карл — 4, Дэн — 4, Эд — 4. Если устроить несколько туров игры, какого типа результаты встретятся больше - пер­ вого или второго типа? Однородное распределение ш ариков (II), объективно более вероятно, чем неоднородное распределение (I), но все ж е каж ется слишком упорядочен­ ным, чтобы быть результатом случайного процесса. Распределение первого типа, которое слегка отклоняется от равномерного распределения, являет­ ся более репрезентативным по отношению к случайному распределению. Подавляющее большинство испытуемых (36 из 52, р < 0.01 по тесту знаков) сочли распределение первого типа более вероятным, чем распределение II типа. Присутствие некоторого беспорядка влияет на репрезентативность и, следовательно, на очевидную вероятность неопределенных событий. Испытуемые дают ответы на вышеупомянутую задачу, к а к будто они игнорируют индивидуальный характер этих двух распределений и сравни­ вают, вместо этого, два соответствующих класса распределений, игнорируя каждое отдельное распределение ш ариков детям. Это не означает, что ис­ пытуемые не оценивают различие между классом и его представителями. Что они все-таки не оценивают - это надлежащ ее воздействие этого разли­ чия на оценку относительной частоты. Люди рассматривают шанс к ак непредсказуемый, но по сути справедли­ вый. Таким образом, они ожидают, что в абсолютно случайном распределе­ нии шариков каж ды й ребенок получит приблизительно (хотя и не точно) В этой книге мы рассматриваем только сбалансированные монеты. 54 РЕПРЕЗЕНТАТИВНОСТЬ одинаковое число шариков. Точно так ж е они ожидают, что даже короткие последовательности подбрасываний монеты, будут содержать относитель­ но одинаковое количество «орлов» и «решек». Вообще, репрезентативная выборка - эта та, в которой существенные характеристики исходной сово­ купности представлены в целом не только в полной выборке, но такж е и локально в каждой из ее частей. Выборка, репрезентативная локально, од­ нако, систематически отклоняется от ож иданий шансов: в ней слиш ком много изменений и слиш ком мало группировок. Закон больших чисел гласит, что очень большие выборки высоко репре­ зентативны по отношению к совокупности, из которой они взяты. В другом случае (Tversky и K ahneman, 1971,2), мы охарактеризовали ожидание ло­ кальной репрезентативности к а к приверженность закону малы х чисел, со­ гласно которому “закон больших чисел применим такж е и к малым чис­ лам ”. Эта убеждение, к а к мы предполагаем, леж ит в основе ошибок интуи­ ции относительно случайности, которая представлена в широком разнооб­ разии контекстов. Исследования восприятия случайности (например, Tune, 1964; W agenaar, 1970) показывают, что, когда людей просят смоделировать случайный про­ цесс, такой к а к серии подбрасываний монеты, они создают последователь­ ности, которые являю тся репрезентативными локально, с большим коли­ чеством коротких отрезков. Более того, люди имеют тенденцию рассматри­ вать к а к маловероятные, или отклонять к ак неслучайные последователь­ ности, которые имеют правильное распределение на длине отрезка, возмож­ но, потому что длинные отрезки не репрезентативны локально. Подобные результаты такж е были получены в сотнях исследований, изу­ чаю щ их вероятность и бинарное прогнозирование (Estes, 1964; М. R. Jones, 1971) . Ошибка игрока в казино или эффекта отрицательной новизны яв л я ­ ется проявлением убежденности в локальной репрезентативности. Посколь­ ку, если соотношение этих двух результатов сохраняются на коротких от­ резках, то за длинной последовательностью одного результата для восста­ новления равновесия должен идти другой результат. В мире, где действует локальная репрезентативность, фактически, ошибка игрока в казино боль­ ше не является ошибкой. В своем Введении в Теорию Вероятности, Феллер (1968, р. 160) описы­ вает пример, который иллюстрирует ошибочную веру в локальную репре­ зентативность. Во время интенсивной бомбежки Лондона во Вторую Миро­ вую войну, считалось вообще, что выбор целей бомбежки не может быть слу­ чайным, потому что некоторые районы города были поражены несколько раз, в то время к а к на многие другие бомбы не падали совсем. Таким обра­ зом, рисунок попаданий бомб наруш ил закон локальной репрезентативнос­ ти, и гипотеза случайности попаданий казалась недопустимой. Чтобы про­ верить эту гипотезу, всю территорию Юга Лондона разделили на маленькие области равной площади, и фактическое распределение попаданий в этом районе сравнили с ожидаемым (пуассоновским) распределением согласно Субъективная вероятность 55 предположению о том, что бомбежка велась по случайному принципу. Воп­ реки общим ожиданиям, соответствие между распределениями было очень сильным. “Д ля нетренированного глаза, - замечает Феллер, - случайность каж ется упорядоченностью или тенденцией к группировке”. Большинство студентов удивляются, когда узнают, что в группе, состоя­ щей только из 23 человек, вероятность того, что, по крайней мере, у двух из них день рождения в один и тот ж е самый месяц и день, превышает 0.5. Ясно, что при выборке в 23 человека, ожидаемое количество дней рожде­ ния в один день - меньше чем 1/15. Таким образом, день с двумя днями рож ­ дения, а такж е наличие 343 “пустых” дней, - очень нерепрезентативны, и рассматриваемый случай, поэтому, каж ется маловероятным. Обобщая, мы считаем, что характер многих результатов в теории вероятности, противо­ речащий интуиции, относится к наруш ениям репрезентативности. (Для убедительного прим ера из теории случайны х ш агов, см. F eller, 1968, стр. 84-88.) Репрезентативная выборка, в таком случае, является подобной совокуп­ ности в своих существенных характеристиках, и отражает случайность та­ кой, как ее видят люди; то есть все ее части репрезентативны, и ни одна из них не является слишком упорядоченной. Только немногие из всех возмож­ ных выборок удовлетворяют всем этим ограничениям. Большинство выбо­ рок — нет, и поэтому они не каж утся случайными. Среди 20 возможных последовательностей шести подбрасываний монеты, например, мы риску­ ем столкнуться с тем, что только выборка О Р Р О Р О окаж ется действитель­ но случайной. Подбросив монету 4 раза, мы можем не получить подобной последовательности. Тенденция расценивать некоторые двоичные последовательности к ак более случайные, чем другие, имела драматические последствия для экспе­ римента на радио Зенит3, в котором аудитории было предложено предполо­ жить значения пяти двоичных символов, которые были “телепатированы” им группой радиовещания. Анализ более чем миллиона ответов (Goodfellow, 1938) показал, что число выборов для некоторых последовательностей зна­ чительно превышало их вероятность, а для других было существенно зани­ жено, причем оно в значительной степени зависело от очевидной случайно­ сти входящ их («телепатированных») последовательностей. Значение этих результатов для ESP исследований является очевидным. Последовательности, каж утся случайными, когда словесное описание наиболее длинное. Вообразите, что Вы диктуете длинную последователь­ ность двоичных символов, например, орлов и решек. Вы будете, несомнен­ но, использовать сокращенные выражения типа «четыре решки» или «ОрелРеш ка три раза подряд». Последовательность с большим количеством по­ вторяющихся подряд символов, позволяет использовать сокращ ения пер­ 3Мы благодарим R. Р. Abelsona за предоставление нам своего исследования. 56 РЕПРЕЗЕНТАТИВНОСТЬ вого типа. Структура таких отрезков, похожих на случайные, минимизи­ рует полезность таких сокращений, и, следовательно, не поддается эконо­ мичным описаниям. Очевидная случайность, поэтому, является разновид­ ностью сложности структуры. Детерминанты сложности структуры, такие к а к кодируемость (G arner 1970; G lanzer & Dark, 1963; Vitz и Todd, 1969) такж е принимают вид очевидной случайности. Распределение вы борок Мы предположили, что испытуемые оценивают вероятность события таким образом, чтобы более репрезентативным событиям приписывать более высо­ кие вероятности, а одинаково репрезентативным событиям - равные вероят­ ности. В этом параграфе мы исследуем значение этой гипотезы для изучения субъективных распределений выборок, то есть, вероятность того, что испы­ туемые возьмут выборки данного размера из указанной совокупности. Когда выборка описана в терминах единичной статистики, например, пропорции или среднего, то степень, в которой она репрезентативна сово­ купности, определяется подобием этой статистики соответствующему па­ раметру совокупности. Так к ак размер выборки не отражает никакой спе­ цифической особенности исходной совокупности, он не ассоциируется с реп­ резентативностью. Таким образом, событие, в котором обнаруживается боль­ ше чем 600 мальчиков в выборке из 1. 000 младенцев, например, столь ж е репрезентативно, к ак обнаружение больше чем 60 мальчиков в выборке из 100 младенцев. Поэтому, два эти события, были бы оценены к ак равноверо­ ятные, хотя последнее, на самом деле, значительно более вероятно. Точно так ж е согласно данному анализу, субъективная вероятность того, что сред­ ний рост в выборке людей — между 6 футами 0 дюймами и 6 футов 2 дюйма­ ми будет независима от размера выборки. Чтобы проверять эти прогнозы, девять различных групп испытуемых воспроизвели субъективные распределения выборок для трех размеров вы ­ борки (N = 1 0 ,1 0 0 ,1 . 000) и для каждой из следующих трех совокупностей. Распределение полов. (Биномиальное, р = 0.50) Испытуемым сказали, что каж ды й день рождается приблизительно N младенцев в определенном ре­ гионе. Д ля N = 1. 000, например, вопрос, звучал так: Каков процент дней, в которые число мальчиков среди 1.000 младенцев будет следую­ щим: До 50 мальчиков от 50 до 150 мальчиков от 150 до 250 мальчиков От 850 до 950 мальчиков Больше чем 950 мальчиков Обратите внимание, что эти категории учитывают все возможности, так что сум­ ма процентов в Ваших ответах должна составить в целом приблизительно 100%. Субъективная вероятность 0.24 | 0.22 | °-20 « 0.18 5 0.16 * 0.14 57 яшт N»10 о 0.12 S 0.10 | 0.08 ® 0.06 CL и 0.04 0.02 vP о4* ID ID vO O '" ID CM ID nP \P nP ID CO ID ID ID in <o in in in ID CM CO in sO o4 ID r*» ID ID OO 1 ID C- s? ID CT> ID OO sp О О V ID O) Категории Рис. 1. Распределение полов Д ля N = 100, эти 11 категорий были: до 5, 5-15, и т.д. Д ля N = 10, каж дая категория содержала единичный результат, напри­ мер, 6 мальчиков. Распределение типа сердцебиения. (Биномиальное, р = 0.80) В этом слу­ чае, испытуемым сказали, что каж ды й день в некоторой области рождают­ ся приблизительно N младенцев, и что 80% всех новорожденных имеет серд­ цебиение типа а , а остальные 20% имеют сердцебиение типа ß. Для каждого размера выборки, испытуемые произвели распределения вы ­ борок для количества младенцев, рожденных каж ды й день, с сердцебиени­ ем типа а , используя 11 категорий к а к те, что приведены выше. Распределение роста. Испытуемым сказали, что региональный военко­ мат делает учет среднего роста N количества людей, которых обследуют к а ж ­ дый день. Им также сообщили, что средний рост мужчин в совокупности — между 170-175 см (в Израиле рост измеряется в сантиметрах), и что частота появления различного уровня роста уменьшается по мере удаления от сред­ него. Д ля каждого размера выборки испытуемые воспроизвели распределе­ ние выборки людей среднего роста, в следующих семи категориях: до 160, 160-165,..., больше 185. 58 РЕПРЕЗЕНТАТИВНОСТЬ Категории Рис. 2. Распределение типов сердцебиения Средняя оценка для этих трех совокупностей, соответственно, показана на рисунках 1 ,2 и 3 для всех трех значений N. (Размер группы варьировал­ ся от 45 до 84, со средним - 62.) Очевидно, что размер выборки вообще не оказывает никакого влияния, независимо от субъективных распределений выборок. Независимые группы тестируемых, которые решали задачи, от­ личающ иеся друг от друга только размером выборки, производят совершен­ но одинаковые распределения. Этот результат остается тем ж е и для сово­ купностей, определенных абстрактно, например, биномиальные, такж е к ак для совокупностей, которые известны испытуемым из их ежедневного опы­ та, например, рост людей. Так к а к субъективные распределения выборок независимы от N, сплош­ ные линии на каждом графике, которые соединяют значения средних оце­ нок, могут рассматриваться к а к “универсальные” распределения выборок для соответствующей совокупности. Д ля изображения того, насколько в дей­ ствительности размер выборки влияет на распределение, который испыту­ емые полностью игнорируют, показаны правильные распределения выбо­ рок для р = 0.50 и р = 0.80, вместе с соответствующим “универсальным” распределением выборок, на Рисунках 4 и 5, соответственно. Можно заметить, что “универсальные” кривые даже ровнее, чем правиль­ ные кривы е для N = 10. Д ля р = 0.50, “универсальная” дисперсия (0.048) грубо р ав н а норм альной дисперсии д л я вы борки д ля N = 5 (0.05). Д л я р = 0.80, дисперсия “универсальной” кривой (0.068) находится между нор­ мальной дисперсией выборки для N = 2 и N = 3. Субъективная вероятность 59 Рис. 3. Распределение роста В биномиальных распределениях, средняя величина вообще совпадает с модой. Следовательно, когдар * 0.50, короткий «хвост» должен быть боль­ ше, чем длинный; см., например, правильное распределение для N = 10 на Рисунке 4. Рисунок 4 такж е показывает, что это свойство нарушено “уни­ версальной” кривой для р = 0.80, чье среднее равно только 0.63. Таким об­ разом, хотя мода в субъективном распределении выборок должным обра­ зом расположена в области наиболее репрезентативной величины, средняя величина смещена к длинному «хвосту ». Тот ж е самый результат был полу­ чен и в других исследованиях, например, Cohen и Hansel (1956), P eterson, DuCharme и Edw ards (1968). Таким образом, д ля р = 0 .8 0 “универсальное” выборочное распределение пропорции - вообще не биномиальное! Следующий эксперимент отличается от предыдущих субъективных бино­ минальных распределений (Peterson, DuCharme и Edwards, 1968; W heeler & Beach, 1968). Сначала в более ранней работе описывались размеры выборок, намного меньшие, чем размеры выборок данного исследования. Во-вторых, что является более важным, число событий, для которых были распределе­ ны вероятности, не было одинаковым для различных размеров выборок: для выборки размера N, испытуемые оценивали N + 1 результатов. В данном ис­ следовании, напротив, испытуемые оценивают то ж е самое число категорий для всех размеров выборки. Неизменность субъективного распределения выборки относительно N, которая показана на Рисунках 1, 2 и 3, не может оставаться той ж е самой, когда изменяется число категорий, или когда вы­ борка достаточно маленькая, чтобы шансы можно было задать перечислени­ ем. Д ля больших выборок, задание всех шансов перечислением невозможно, 60 РЕПРЕЗЕНТАТИВНОСТЬ Рис. 4. Распределение выборок р =0.50 и вполне естественно обращение к прямой оценке репрезентативности, на которую влияет среднее выборки, или пропорция выборки. Чтобы далее исследовать прогнозирование репрезентативности относи­ тельно размера выборки, был проведен дополнительный эксперимент. В качестве испытуемых были 97 студентов старших курсов Стэнфорда без какой-либо подготовки в теории вероятности или статистике, собранные в маленькие группы от 5 до 12 человек в каждой. Им были предоставлены, в установленном порядке, три задачи, каж дая из которых определяла собой процесс формирования выборки с указанным средним и критической вели­ чиной, которая была выше этого среднего, и их попросили оценить, являет­ ся ли отдельно взяты й результат выборки более вероятным в большой или в маленькой выборке. Каждому испытуемому заплатили $ 1 за участие в экс­ перименте и еще один дополнительный $ 1, если его ответ на одну из задач (отобранный наугад после завершения задания) был правильным. Чтобы контролировать предубеждения ответа, каж дая задача была пред­ ставлена в двух формах. Половина испытуемых оценивала, для всех трех задач, является ли более вероятным, что исход, который более экстрема­ лен, чем указанная критическая величина, встретится в маленькой или в большой выборке. Правильный ответ, конечно, - то, что экстремальный ис­ ход, более вероятно, встретится в маленькой выборке. Остальные испытуе­ мые оценили, что более вероятно: если результат, который является менее экстремальным, чем указанная критическая величина, встретится в малень­ кой или в большой выборке. Правильный ответ здесь - то, что такой резуль­ тат, более вероятно, встретится в большой выборке. Данные три задачи пред­ ставлены ниже. Указанные числа - количество испытуемых, которые выб- Субъективная вероятность 61 Рис. 5. Распределение выборки р = 0.80 рали каждую категорию ответа, для каждой из двух форм. Правильные от­ веты помечены звездочками. 1. Некий город обслуживается двумя больницами. В большей больнице каждый день рождается приблизительно 45 младенцев, а в меньшей больнице каждый день рожда­ ется приблизительно 15 младенцев. Как Вы знаете, приблизительно 50% всех младен­ цев - мальчики. Точный процент мальчиков-младенцев, однако, изменяется со дня на день. Иногда он может быть выше, чем 50%, иногда понижаться. Больше чем 60 % Меньше чем 60 % Большая больница Маленькая больница 12 10* 9* Примерно поровну (т.е. в пределах 5% разницы) 28 25 11 В течение 1 года каждая больница вела учет дней, в которые (больше / меньше) чем 60% рожденных младенцев были мальчики. Какая больница, как Вы думаете, сделала учет большего количества таких дней? 2. Исследователь, изучающий некоторые свойства языка, взял книгу в мягкой облож­ ке и вычислил среднюю длину слова на каждой странице книги (то есть, количество букв на той странице, поделенное на количество слов). Другой исследователь взял пер­ 62 РЕПРЕЗЕНТАТИВНОСТЬ вую строку на каждой странице и вычислил среднюю длину слова в строке. Средняя длина слова во всей книге - четыре. Однако, не в каждой строке или на странице точно такая же средняя длина слова. В некоторых средняя длина слова может быть больше или меньше. Больше в Меньше в 8 10* Ученый, исследовавший строки 21* 15 Примерно поровну (т.е. в пределах 5% разницы) 20 23 Ученый, исследовавший страницы Первый исследователь сосчитал количество страниц, на которых средняя длина сло­ ва 6 или (больше / меньше), а второй исследователь сосчитал количество строк, в кото­ рых средняя длина слова 6 или (больше / меньше). Какой исследователь, как Вы дума­ ете, сделал запись большего количества таких единиц (страницы для одного, строки для другого)? 3. Проводится медицинское обследование, с целью изучения некоторых факторов, вли­ яющих на коронарные заболевания. Две группы собирают данные. Одна обследует по три человека в день, а другая - одного человека. Эти люди выбраны наугад из совокуп­ ности. Во время осмотра замеряется рост каждого человека. Средний рост взрослого мужчины 5 футов 10 дюймов. Людей, чей рост выше среднего, столько же, сколько и людей, чей рост ниже среднего. Больше 5 футов Меньше 5 футов 11 дюймов 11 дюймов Команда, проверявшая по 3 человека в день 7 14* Команда, проверявшая по одному человеку в день 18* 17 Примерно поровну (т.е. в пределах 5% разницы) 23 17 Группа, проверяющая трех человек в день, оценивает их рост, и отмечает дни, когда средняя величина роста человека была (больше / меньше) чем 5 футов 11 дюймов, дру­ гая группа просто считает дни, когда человек, которого они проверили, был (выше\ниже) 5 футов 11 дюймов. Какая команда, как Вы думаете, насчитала большее количе­ ство таких дней? Если бы у испытуемых было какое-то понимание роли размера выборки, они должны были бы без труда выбрать правильные ответы на эти простые вопросы. С другой стороны, если они считают, что одинаково репрезента­ тивные результаты в равной степени вероятны, они не должны проявлять какого-либо систематического предпочтения правильному ответу. И это ясно видно из примеров. Модальный ответ - “поровну” почти во всех примерах; Субъективная вероятность 63 кроме того, в любой из задач нет никакого существенного предпочтения пра­ вильному ответу. Этот эксперимент подтверждает заклю чения первоначального исследо­ вания, несмотря на некоторые процедурные р азли чия. Здесь, каж ды й субъект прямо оценивает вероятность результата, имея выборки двух раз­ меров при условиях, разработанных, таким образом, чтобы стимулировать его давать правильные ответы. Эта процедура должна увеличить вырази­ тельность такой характеристики выборки, к ак размер. Кроме того, после­ дняя задача сравнивает единичное наблюдение со средней величиной вы ­ борки из трех наблюдений. Как было показано, респонденты не смогли за­ метить даже тот очевидный факт, что средние величины должны быть ме­ нее изменчивыми, чем единичные наблюдения. Понятие, что разнообразие элементов выборки уменьшается с увеличе­ нием количества элементов выборки, очевидно, не является частью интуи­ тивных представлений человека. Действительно, неправильные представ­ ления о роли типового размера часто проявляются в ежедневной ж изни. С одной стороны, люди часто принимают всерьез результат, выраженный в процентах, не заботясь о количестве наблюдений, которое может быть сме­ хотворно маленьким. С другой стороны, люди часто остаются скептически­ ми перед лицом неоспоримого свидетельства из большой выборки. Как в слу­ чае известного политического деятеля, который горько жаловался, что сто­ имость проживания не основана на данных о целом населении, а только на большой выборке, и добавил, “И что еще хуже, на случайной выборке “. Конечно, мы не хотим сказать, что человек не способен понять влияние размера выборки на разнообразие ее элементов. Людей можно научить вер­ ному правилу, возможно даже почти без труда. Дело в том, что люди не следу­ ют этим правилам, когда предоставлены сами себе. Более того, изучение по­ ведения психолога-исследователя (J. Cohen, 62, Tversky и Kahneman, 1971, 2) показывает, что сильная тенденция недооценивать влияние размера вы­ борки не исчезает, несмотря на знание верного правила и обширного обуче­ ния в области статистики. Любого, кто хотел бы рассматривать человека к ак разумного интуитивного статистика, такие результаты обескураживают. Н ормативные модели и дескриптивны е эвристики Существует мнение (см., например, W . Edwards, 1968,25), что человек, во­ обще говоря, следует правилу Байеса, но не в состоянии оценить полное воз­ действие очевидности, и поэтому - консервативен. Петерсон и Бич, напри­ мер, сделали вывод, что нормативная модель обеспечивает хорошее первое приближение к поведению испытуемых, которые находятся “под влияни­ ем определенных переменных и в определенных направлениях” (Peterson и Beach, 1967, с. 43). Это точка зрения не была разделена всеми. В более со­ временном обзоре литературы, Словик и Лихтенштейн (Slovic и Lichtenstein, 1971) доказывали, что выш еупомянутая оценка поведения человека к ак 64 РЕПРЕЗЕНТАТИВНОСТЬ интуитивного статистика “слишком щ едра,”, в то время к ак Пиц, Даунинг и Рейнхольд приш ли к выводу, на основе своих данных, что человеческое поведение в задачах Байеса “неоптимально в более фундаментальном смыс­ ле, чем подразумеваются в обсуждениях консерватизма” (Pitz, Downing и Reinhold, 1967, с. 392). Польза, которую может принести нормативный подход Байеса анализу и моделированию субъективной вероятности зависит, прежде всего, не от точности субъективных оценок, а скорее от того, охватывает ли модель су­ щественные детерминанты процесса суждения. Исследование, которое об­ суждается в этой книге, показывает, что это не так. В частности мы видели, что размер выборки не оказывает влияния на субъективные распределения выборок, что последующие биномиальные оценки определены (по крайней мере, в общем случае) скорее пропорцией выборки, чем разнообразием эле­ ментов выборки, и что они не зависят от пропорции совокупности. В своей оценке очевидности человек - вероятно не консервативный последователь Байеса: он - не последователь Байеса вовсе. Я вляется спорным, что неспособность нормативной модели описать че­ ловеческое поведение свойственна только для неопытных испытуемых, ко­ торые столкнулись с незнакомыми случайными процессами, и что она мог­ ла бы обеспечивать адекватную оценку более знакомых случайных процес­ сов, с которыми люди сталкиваются в повседневной ж изни. Имеется мало подтверждений, однако, которые могли бы засвидетельствовать это мнение. Сначала, было показано (Tversky и K ahnem an, 1971,2), что те ж е самые си­ стематические ошибки, предложенные соображениями репрезентативнос­ ти, могут обнаружиться в интуитивных суж дениях хорошо обученных уче­ ны х. Очевидно, знакомство с теорией вероятности не устраняет все ошибки интуиции относительно законов случая. Во-вторых, в наш ей повседневной ж изни мы сталкиваемся с многочисленными случайными процессами (на­ пример, рождение мальчика или девочки, красный свет светофора на пере­ крестке, набор карт без единой карты червовой масти), которые подчиня­ ются биномиальному закону, например, в высокой степени приближения. Люди, однако, будут не в состоянии извлечь адекватную концепцию бинар­ ного процесса из этого опыта. Очевидно, использование постоянных много­ численных проверок не приводит к оптимальному поведению. В своей ж изни люди задают себе и другим вопросы типа: Какова вероят­ ность того, что этот 12-летний мальчик вырастет и станет ученым? Какова вероятность, что этот кандидат будет принят на службу? Какова вероятность, что эта компания уйдет из бизнеса? Эти проблемы отличаются от тех, кото­ рые обсуждались ранее в этой книге тем, что в силу их уникального харак­ тера, их нельзя решить ни в терминах частоты возникновения в прошлом, ни в терминах некоторого четкого процесса осуществления выборки. В этой книге, мы довольно детально исследовали одну эвристику, соглас­ но которой вероятность события определяется степенью, в которой оно репрезентативно по отношению к главным характеристикам процесса или Субъективная вероятность 65 совокупности, из которой оно взято. Хотя наш и примеры исследований были ограничены четкими процессами осуществления выборки (где объективная вероятность легко вычислима), мы считаем, что точно такая ж е эвристика играет важную роль в оценке неопределенности в уникальны х ситуациях, где никакой “правильный” ответ не доступен. Вероятность того, что отдель­ но взяты й 12-летний мальчик станет ученым, например, может быть опре­ делена степенью, в которой роль ученого репрезентативна по отношению к нашему представлению об этом мальчике. Точно так ж е, когда мы размыш ­ ляем о вероятности того, что компания уйдет из бизнеса, или что полити­ ческого деятеля назначат на должность, у нас в голове есть модель компа­ нии или политической ситуации, и мы оцениваем к а к наиболее вероятные те результаты, которые лучше всего представляют существенные особенно­ сти соответствующей модели.... 4. О психологии прогнозирования* Даниелъ Канеман и Амос Тверски В этой части книги мы рассматриваем правила, которые определяют интуи­ тивные прогнозы и оценки достоверности, и сопоставляем их с норматив­ ны ми принципами статистического прогнозирования. Предлагаются два вида прогнозов: прогнозирование категории и числовое прогнозирование. При прогнозировании категории, предсказание осуществляется в номиналь­ ной форме, например, победитель на выборах, диагноз пациента или буду­ щ ая профессия человека. При числовом прогнозировании, предсказание дается в числовой форме, например, котировка акций или средняя оценка успеваемости студента. При прогнозировании и принятии решений в условиях неопределеннос­ ти, людям не свойственно определять вероятность исхода или прибегать к статистической теории прогнозирования. Вместо этого, они полагаются на ограниченное число эвристик, что иногда приводит к верным суждениям, а иногда влечет за собой серьезные и систематические ошибки (Kahneman & Tversky, 1972b, 3; Tversky & K ahnem an, 1971,2; 1973,11). В этой книге мы рассматриваем роль в интуитивных прогнозах одной из таких эвристик - реп­ резентативности. При наличии определенных данных (например, краткого описания лич­ ности), соответствующие исходы (например, род занятий или уровень дости­ жений) можно определить степенью, в которой они репрезентативны по от­ ношению к этим данным. Мы утверждаем, что люди прогнозируют на основе репрезентативности, то есть выбирают или предсказывают последствия, ана­ лизируя степень, в которой исходы отражают существенные особенности ис­ ходных данных. Во многих ситуациях репрезентативные последствия дей­ ствительно более вероятны, чем другие. Однако это не всегда так, потому что существует ряд факторов (например, априорные вероятности исходов и на­ *Эта глава впервые появилась в Psychological Review, 1973,80,237-251. Авторское право© 1973 О психологии прогнозирования 67 дежность первичных данных), которые влияют на вероятность исходов, а не на их репрезентативность. Поскольку эти факторы люди не принимают во внимание, то их интуитивные предсказания систематически и существенно нарушают статистические правила прогнозирования. Чтобы подтвердить эту гипотезу, мы покажем, что предсказание исхо­ дов н а основе кажущ егося подобия совпадает с их предсказанием на основе репрезентативности, и что априорная вероятность и ожидаемая точность прогноза, по существу, не влияю т на интуитивные предсказания. В первой части мы исследуем прогнозирование категории и демонстри­ руем, что оно подчиняется независимой оценке репрезентативности и по существу не зависит от предшествующих вероятностей исходов. В следую­ щей части мы исследуем числовое прогнозирование и показываем, что оно недостаточно регрессивно и на него существенно не влияют соображения достоверности. Следующие три части описывают, соответственно, методо­ логические проблемы в изучении прогнозирования, источники необоснован­ ной уверенности по поводу прогнозов и некоторые ошибочные прогнозы от­ носительно эффектов регресса. П р о гн о зи р о в а н и е к а т е г о р и и Базовое значение, подобие и вероятность Следующий экспериментальный пример иллюстрирует прогнозирование репрезентативности и ошибки, связанные с этим способом интуитивного прогнозирования. Группе из 69 испытуемых1 (группа базового значения) задали следующий вопрос: “Возьмем всех аспирантов первого курса в США на сегодняшний день. Какой процент студентов, по Вашему мнению, задей­ ствован в каждой из девяти областей специализации? Области специализа­ ции представлены в Таблице 1. Первая колонка этой таблицы представляет средние оценки базового значения для различных областей. Второй группе из 65 испытуемых (группа подобия) предложили следую­ щее краткое описание личности: Том В. обладает высоким интеллектом, но ему не хватает творческого потенциала. Он любит порядок и ясность и нуждается в системе, где каждая мелочь находится на своем месте. Манера письма — однообразная и механическая, иногда оживляется несколько банальными каламбурами и вспышками воображения подобно произведениям науч­ ной фантастики. Имеет сильную тягу к устойчивому материальному положению. Про­ являет мало сочувствия и симпатии к другим людям, не любит взаимодействовать с другими. Будучи эгоцентричным, тем не менее, имеет глубокое чувство морали. 1При отсутствии дополнительных уточнений, под испытуемыми следует понимать оплачи­ ваемых добровольцев, привлеченных через студенческую газету в Университете штата Оре­ гон. Данные были собраны в классах для групповых занятий. 68 РЕПРЕЗЕНТАТИВНОСТЬ Испытуемых попросили проанализировать девять областей науки с точки зрения того, “насколько подобен Том В. типичному аспиранту каж дой из областей науки? “ Во второй колонке Таблицы 1 представлены средние зна­ чения подобия, соответствующие различным областям науки. Наконец, группе прогнозирования, состоящей из 114 аспирантов-психологов трех крупных университетов Соединенных Штатов, было представ­ лено краткое описание личности Тома В. со следующей дополнительной информацией. Предыдущее краткое описание личности Тома В. было составлено психологом на осно­ вании проективного теста, когда Том был старшеклассником средней школы. В насто­ ящее время Том В. - аспирант. Расположите следующие девять областей специализа­ ции аспирантов в порядке вероятности того, что Том В. является теперь аспирантом в одной из этих областей. Таблица 1. Оценки базовых значений для девяти областей специализа­ ции и краткое описание данных подобия и прогнозирования для Тома В. Среднее базовое значение (в %) Средняя величина подобия Средняя величина вероят ност и Управление бизнесом 15 3.9 4.3 Программирование/ информатика 7 2.1 2.5 Технические науки 9 2.9 2.6 Гуманитарные науки и педагогика 20 7.2 7.6 Юриспруденция 9 5.9 5.2 Библиотекарское дело 3 4.2 4.7 Медицина 8 5.9 5.8 Физика и естественные науки 12 4.5 4.3 Социальные науки 17 8.2 8.0 Специализация аспирант а Третья колонка Таблицы 1 отражает средние величины исходов, полу­ ченных испытуемыми в группе прогнозирования. Позже было рассчитано произведение моментов между колонками Таб­ лицы 1 (корреляция Пирсона). Корреляция между вероятностью и подоби­ ем составила - 0.97, в то время к а к корреляция между вероятностью и ба­ О психологии прогнозирования 69 зовым значением2- 0.65. Очевидно, что суждения вероятности по существу совпадают с суждениями подобия и существенно отличаются от суждений базового значения. Полученный результат является прямым подтвержде­ нием гипотезы, что люди делают прогнозы, опираясь на репрезентативность или подобие. Вероятностные суждения аспирантов-психологов грубо нарушают нор­ мативные правила прогнозирования. Более 95% респондентов предположи­ ли, что Том В., вероятнее всего, изучает информатику, чем гуманитарные науки или педагогику, хотя они твердо знали, что в последней области ас­ пирантов намного больше. Согласно оценкам базового значения, отражен­ ным в Таблице 1, исходная разница между гуманитарными науками и ин­ форматикой — приблизительно 1 к 3 (реальная разница намного больше). Согласно правилу Байеса, можно преодолеть первоначальное противо­ речие, позволяющее Тому В. заниматься информатикой, а не гуманитар­ ными дисциплинами и педагогикой, если описание его личности является одновременно и точным, и диагностическим. Однако, аспиранты, приняв­ шие участие в нашем исследовании, не считали, что эти условия были вы­ полнены. После выполнения задачи прогнозирования, респондентов попро­ сили подсчитать процент правильных ответов (то есть, исправить свой пер­ воначальный выбор среди девяти областей специализации), который мож ­ но было бы достичь, при наличии у них нескольких типов информации. Средние значения правильных ответог составили 23% для прогнозов, осно­ ванных на проективных тестах, для сравнения с 53% , для прогнозов, осно­ ванных н а сообщениях старшеклассников средней ш колы касательно их интересов и планов. Очевидно, проведение проективны х испы таний не пользовалось большим доверием. Однако аспиранты полагались на описа­ ние, полученное из таких испытаний, и не принимали во внимание базовые значения. В общем, для статистического прогнозирования важ ны три типа инфор­ мации: (а) первичная или фоновая информация (например, базовые значе­ ния областей специализации выпускников ВУЗов); (б) дополнительная ин­ формация для отдельного взятого случая (например, описание Тома В.); (в) ожидаемая точность прогноза (например, априорная вероятность правиль­ ных ответов). Фундаментальное правило статистического прогнозирования гласит, что ожидаемая точность влияет на удельный вес, приписываемый дополнительной и первичной информации. При уменьшении ожидаемой точности, предсказания должны становиться более регрессивными, то есть близкими к прогнозам, основанным на первичной информации. В случае Тома В., ожидаемая точность была низкой, и испытуемым следовало опи­ раться на априорную вероятность. Вместо этого, они делали прогнозы, на 2 При вычислении этой корреляции, оценки были инвертированы таким образом, чтобы высоко оцененной вероятности соответствовало высокое значение. 70 РЕПРЕЗЕНТАТИВНОСТЬ основе репрезентативности, то есть они прогнозировали исходы по их подо­ бию дополнительной информации, не принимая во внимание априорную вероятность. Испытуемые в группе прогнозирования целиком полагались на краткое описание личности, и, очевидно, не принимали во внимание следующие со­ ображения. Во-первых, учитывая известную неадекватность проективного тестирования личности, вполне вероятно, что Том В. действительно не стра­ дал навязчивыми стремлениями и не был таким равнодушным, как пред­ полагает его описание. Во-вторых, даже если описание соответствовало дей­ ствительности, когда Том В. был учащ имся средней ш колы, оно могло стать ложным при поступлении в аспирантуру. Наконец, даже если описание всетаки достоверно, очевидно, что под него подходит больше студентов, изуча­ ющ их гуманитарные науки и педагогику, чем студентов, изучающих ин­ форматику, просто потому что в первой области студентов намного больше, чем в последней. М а н и п у л я ц и я ожидаемой точностью Гипотезой проведенного нами дополнительного исследования являлось то, что вопреки статистической модели, манипуляция ожидаемой точностью не затрагивает структуру прогнозов. Экспериментальный материал состо­ ял из пяти кратких описаний личности мальчиков-девятиклассников, пред­ положительно составленных консультантом-психологом на основе интер­ вью к ак части лонгитюдного исследования. Описания были построены так­ ж е, к ак и в исследовании с Томом В. Д ля каждого описания, испытуемые первой группы (N - 69) рассмотрели девять областей специализации аспи­ рантов (см. Таблицу 1) относительно соответствия отдельно взятого маль­ чика “образу типичного аспиранта-первокурсника в данной области”. Опи­ раясь на суждения подобия, они оценили частоту базового значения девяти областей специализации аспирантов. Результаты представлены в Таблице 1. Оставшимся испытуемым сообщили, что эти описания были наугад отобра­ ны из числа участников первоначального исследования, которые теперь являю тся аспирантами-первокурсниками. Группе с высокой точностью (N = 55), указали, что “на основе данных описаний, испытуемые студенты делают правильные прогнозы приблизительно в 55% случаев”. Группе с низ­ кой точностью (N = 50) сообщили, что предсказания студентов правильны приблизительно в 27% случаев. Д ля каждого описания, испытуемые оце­ нили эти девять областей согласно “вероятности того, что данный человек является на данный момент аспирантом в этой области”. Они такж е опреде­ лили вероятность правильности первого выбора для каждого описания. М анипуляция ожидаемой точностью имела существенное влияние на суж­ дения о вероятности. Средние оценки были 0.70 и 0.56, для группы с высокой и с низкой точностью соответственно (t = 3.72, р < 0.001). Однако, распреде­ ление девяти исходов, полученных после инструкции о низкой точности, были О психологии прогнозирования 71 незначительно ближе к распределению базового значения, чем распределе­ ние, полученное после инструкции о высокой точности. Для каждого испы­ туемого было вычислено произведение моментов между средней величиной, которую он предписал каждому из этих девяти исходов (по этим пяти описа­ ниям) и базовым значением. С помощью этой корреляции можно измерить степень, в которой прогнозы испытуемого соответствуют распределению ба­ зового значения. Среднее значение индивидуальных корреляций равнялось 0.13 для испытуемых в группе с высокой точностью и 0.1 б для испытуемых в группе с низкой точностью. Эта разница не является значимой (t = 0.42, d f = 103). Данный пример суждения нарушает нормативную теорию прогнозиро­ вания, согласно которой любое уменьшение ожидаемой точности должно со­ провождаться изменением предсказаний в сторону базового значения. Так к а к м анипуляция ожидаемой точностью не оказала влияния на про­ гнозы, две группы прогнозов были объединены. Последующие исследова­ ния были проведены тем ж е образом, что и в исследовании с Томом В. Для каждого описания, было вычислено две корреляции: (а) между средней ве­ личиной вероятности и средней величиной подобия и (Ь) между средним значением вероятности и средней величиной базового значения. Корреля­ ции отражены в Таблице 2, с учетом исхода, оцененного к а к наиболее веро­ ятный для каждого описания. Высокие значения корреляции были полу­ чены между прогнозом и подобием. И наоборот, не обнаружено системати­ ческой связи между базовым значением и прогнозом: значения корреляции широко изменялись в зависимости от того, являю тся ли наиболее репрезен­ тативные исходы для каждого описания частыми или редкими. Таблица 2. Корреляция средней величины вероятности со средним значе­ нием подобия и базовым значениям. П ервое м одальное предсказание Ю рис­ пруден­ ция П рограм м и ­ рование М еди­ цина Библио­ т екарское дело Управ­ ление бизнесом Со средним значением подобия 0.93 0.96 0.92 0.88 0.88 С базовым значением 0.33 -0.35 0.27 -0.03 0.62 Как и в предыдущем случае, обсуждением базового значения здесь такж е пренебрегли. В теории статистики, игнорировать базовое значение можно 72 РЕПРЕЗЕНТАТИВНОСТЬ только в том случае, когда есть уверенность в безошибочности прогноза. Во всех других случаях, должен быть найден соответствующий компромисс между распределением, ожидаемым в соответствии с описанием, и распре­ делением базового значения. Маловероятно, что поверхностное описание че­ тырнадцатилетнего ребенка, основанное на единственном интервью, может служ ить оправданием степени безошибочности, которую ожидали увидеть испытуемые в прогнозах. После пяти описаний личности, перед испытуемыми была поставлена дополнительная задача: О Доне известно только то, что он участвовал в первоначальном исследовании и сейчас является аспирантом первого курса. Укажите вашу оценку, а также сообщите, насколь­ ко Вы уверены в правильности оценки этого случая. Д ля Дона корреляция между средней величиной вероятности и оцененным базовым значением равнялась 0.74. Таким образом, знание базового значе­ ния, которое не учитывалось при наличии описания, использовалось, ког­ да никакой дополнительной информации не было. Д оказат ельст ва, основывающиеся на априорной вероятности либо на информации об индивидууме Следующее исследование представляет собой более тщательную проверку гипотезы, что интуитивные предсказания зависят от репрезентативности и относительно независимы от априорной вероятности. В этом исследовании априорные вероятности были сформулированы так, чтобы сделать их более выразительными и сопоставимыми со способом ответа. Испытуемым зачи­ тали следующий рассказ: Группа психологов проинтервьюировала и провела личностный тест для 30 инженеров и 70 адвокатов, причем все они добились успеха в своих облас­ тях. На основе этой информации, были написаны краткие описания личнос­ ти 30 инженеров и 70 адвокатов. В ваших анкетах Вы найдете пять описаний, выбранные наугад из 100 имеющихся в наличии описаний. Д ля каждого опи­ сания, пожалуйста, укажите вероятность (от 0 до 100) того, что описанный человек является инженером. Та ж е задача была выполнена группой экспертов, которые давали высо­ ко точны е оц ен ки вероятностей д л я р азли ч н ы х описаний. Вам будет вы плачена премия, в зависимости от того насколько близкими Ваши оцен­ ки окаж утся к оценкам группы экспертов. Инструкции были даны группе из 85 испытуемых (группа с малым коли­ чеством инженеров, или L группа). Испытуемые в другой группе (группа с большим количеством инженеров, Н группа; N = 86) получили идентичные инструкции, за исключением априорной вероятности: им указали, что из 100 изученных человек, 70 являются инженерами и 30 адвокатами. Испытуемым обеих групп были выданы одни и те ж е описания. Вот одно из них: О психологии прогнозирования 73 Джек - 45-летний мужчина. Женат, имеет четверых детей. В общем, консервативен, осторожен и честолюбив. Не проявляет интереса к политическим и социальным про­ блемам, тратит большую часть свободного времени на свои многочисленные хобби, та­ кие как столярное дело, плавание и решение математических загадок. Вероятность того, что Джек является одним из 30 инженеров в выборке из 100 человек = _____ %. После пяти описаний, испытуемые столкнулись с пустым описанием: Предположим, что у Вас нет никакой информации относительно человека, выбранного наугад из совокупности. Вероятность того, что этот человек является одним из 30 инженеров в выборке из 100 человек =____ % И в группе с большим количеством инженеров, и в группе с малым коли­ чеством инженеров половину испытуемых просили оценить, для каждого описания, вероятность того, что описанный человек - инженер (как в при­ мере выш е), в то время как другие испытуемые оценивали для каждого опи­ сания вероятность того, что описанный человек - адвокат. Эта манипуля­ ция оказалась неэффективной. Средние вероятности, приписываемые ис­ ходам инженер и адвокат в двух различных формах, в сумме составляли приблизительно 100% для каждого описания. Следовательно, данные для обеих форм были объединены, и результаты представлены с точки зрения исхода инженер. Структура данного эксперимента позволяет вычислить подходящий об­ разец суждений. Вычисления основываются на формуле Байеса, в форме вероятностей. Пусть О обозначает вероятность того, что отдельно взятое опи­ сание принадлежит скорее инженеру, чем адвокату. Согласно правилу Бай­ еса, О = Q х R, где Q обозначает априорную вероятность того, что наугад выбранное описание принадлежит скорее инженеру, чем адвокату; и R отношение вероятности для отдельно взятого описания, то есть отношение вероятности того, что человек, наугад выбранный из совокупности инж ене­ ров, будет описан к ак инженер, к вероятности того, что человек, отобран­ ный наугад из совокупности адвокатов, будет описан как адвокат. Д ля группы с большим количеством инженеров, которой было сказано, что выборка состоит из 70 инженеров и 30 адвокатов, априорное отношение QHравно 70/30. Д ля группы с малым количеством инженеров QLравняется 30/70. Таким образом, для каждого описания, отношение апостериорной вероятности для этих двух групп равно 74 РЕПРЕЗЕНТАТИВНОСТЬ Рис. 1. Оцененная средняя вероятность (дня инженеров) для пяти описа­ ний и для “пустого” описания (квадратный символ) при высоких и низких априорных вероятностях. (Изогнутая линия показывает правильное рас­ пределение согласно правилу Байеса.) Так к а к соотношение вероятностей в этой формуле сокращается, то для всех описаний должно быть получено одинаковое значение 0 H/ 0 L. Следователь­ но, в данном случае, правильный эффект манипуляции априорной вероят­ ности можно вычислить без знания соотношения вероятностей. На Рисунке 1 можно увидеть средние оценки вероятности для каждого опи­ сания, к а к при высокой, так и при низкой априорной вероятности. Д ля к а ж ­ дого описания, средняя оценка вероятности, при высоком априорным соот­ ношении вероятностей (QH= 70/30) соответствует на графике средней оцен­ ке, при низкой априорной вероятности (QL= 30/70). Согласно нормативному уравнению, полученному в предыдущем параграфе, все точки должны лежать на кривой Байеса. В действительности, только пустой квадрат, который соот­ ветствует “пустым” описаниям, лежит на этой линии: при отсутствии описа­ ния, испытуемые решили, что оценка вероятности будет 70% при высокой априорной вероятности и 30% при низкой априорной вероятности. В осталь­ ных ж е пяти случаях, точки лежат недалеко от линии идентификации. Эффект априорной вероятности, хотя и небольшой, является статисти­ чески значимым. Д ля каждого испытуемого средняя оценка вероятности, была вычислена для всех случаев, кроме случая с пустым описанием. Сред­ нее значение величин составило 50% для группы с низкой априорной веро­ ятностью и 55% для группы с высокой априорной вероятностью (t = 3.23, df = 169, р < 0.01). Однако из Рисунка 1 следует, что каж дая точка леж ит ближе к линии идентификации, чем к кривой Байеса. Следовательно, мож ­ О психологии прогнозирования 75 но сделать вывод о том, что м анипуляция априорным распределением ока­ зала минимальное влияние на субъективную вероятность. Как и в преды­ дущем эксперименте, испытуемые применили свои знания о априорной ве­ роятности только тогда, когда им не дали никакого подтверждения. Соглас­ но гипотезе репрезентативности, априорная вероятность не принималась во внимание, когда информация об индивидууме была доступна. Сила этого эффекта демонстрируется ответами на следующее описание: Дик - 30-летний мужчина. Женат, еще не имеет детей. Очень способный и мотивиро­ ванный сотрудник, подает большие надежды. Пользуется признанием коллег. Это описание было построено таким образом, чтобы быть полностью неин­ формативным в отношении профессии Дика. Испытуемые обеих групп при­ шли к согласию: средние оценки составили 50% (см. Рисунок 1). Разница между ответами на это описание и на “пустое” описание разъясняет ситуа­ цию. Очевидно, люди реагируют по-разному, когда не получают никакого описания, и когда дано бесполезное описание. В первом случае, априорная вероятность принимается во внимание; во втором, априорная вероятность игнорируется.3 Существуют ситуации, когда априорная вероятность, играет более суще­ ственную роль. Во всех примерах, рассмотренных до настоящего момента, четко выраженные стереотипы были связаны с альтернативными исходами, и, мы предполагаем, что суждения управлялись, степенью, в которой описа­ ния оказывались репрезентативными по отношению к этим стереотипам. В других задачах исходы естественно рассматривать как части измерения. Пред­ положим, например, что Вас попросили оценить вероятность того, что к аж ­ дый из нескольких студентов получит стипендию. В этой задаче, не существует хорошо обозначенных стереотипов студентов, которые получают или не по­ лучают стипендию. Скорее, естественно рассматривать исход (то есть, полу­ чение стипендии) как некий отрезок на прямой академических достижений или способностей. Априорная вероятность, то есть процент стипендий в опре­ деленной группе, могла использоваться, чтобы устранить пределы. Следова­ тельно, они, вряд ли игнорируются. Кроме того, мы могли бы ожидать, что экстремальные априорные вероятности будут оказывать некоторое воздей­ ствие даже при наличии четких стереотипов исходов. Точная схема условий, при которых первичная информация используется или отвергается, требует дальнейшего исследования. Один из основных принципов статистического прогнозирования гласит, что априорная вероятность, которая суммирует наши знания относительно проблемы до того, к ак мы получили определенное описание, остается умест­ ной даже после того, как такое описание получено. Правило Байеса перево­ дит этот качественный принцип в мультипликативное соотношение между 3 ноем с. 185 76 РЕПРЕЗЕНТАТИВНОСТЬ априорной вероятностью и отношением вероятности. Нашим испытуемым не удалось объединить априорную вероятность и дополнительную информа­ цию. Когда им было предоставлено описание, каким бы неинформативным или недостоверным оно ни было, Тома В. или Д ика (инженер/адвокат), ис­ пытуемые, очевидно, чувствовали, что распределение профессий в его груп­ пе больше не соответствовало действительности. Неспособность оценить роль априорной вероятности, если дано определенное описание - это, возможно, одно из наиболее существенных отклонений интуиции от нормативной тео­ рии прогнозирования. Ч и словое прогн ози рован и е Фундаментальное правило нормативной теории прогнозирования гласит, что изменчивость предсказаний на основании ряда случаев, должна отра­ ж ать точность прогноза. Когда точность прогноза совершенна, человек пред­ сказывает то значение критерия, которое фактически будет получено. Ког­ да неопределенность максимальна, во всех случаях прогнозируется фикси­ рованное значение величины. (При прогнозировании категории, предска­ зывается наиболее частая категория. При числовом прогнозировании пред­ сказывается среднее значение, мода, медиана или некоторая другая вели­ чина в зависимости от функции потерь.) Таким образом, изменчивость про­ гнозов равна изменчивости критерия, когда точность прогноза совершен­ на, и изменчивость прогноза равна нулю, когда точность прогноза нулевая. П ри средней точности прогноза, изменчивость прогноза принимает проме­ жуточное значение, то есть прогнозы регрессивны относительно критерия. Таким образом, чем больше неопределенность, тем меньше изменчивость прогнозов. Прогнозы, сделанные на основании репрезентативности, не сле­ дуют этому правилу. В предыдущей главе мы продемонстрировали, что люди не делали регресс в сторону более частых категорий при уменьшении ож и­ даемой точности предсказаний. Эта глава демонстрирует аналогичную не­ способность в контексте числового прогнозирования. Прогнозирование исходов либо оценка исходных данны х Предположим, Вам сообщают, что консультант-психолог описал студента первого курса к а к умного, уверенного в себе, начитанного, трудолюбивого и любознательного. Рассмотрим два типа вопросов, которые можно было бы задать по этому описанию: (А) Оценка : Какое мнение складывается у Вас относительно способностей к учебе после этого описания? Какой процент описаний первокурсников, по Вашему мнению, произ­ вел бы на Вас большее впечатление? (Б) Прогнозирование: Как Вы думаете, какие сред­ ние оценки получит этот студент? Какой процент первокурсников получит более высо­ кую среднюю оценку? О психологии прогнозирования 77 Между этими двумя вопросами имеется важное различие. В первом слу­ чае Вы оцениваете исходные данные; а во втором, Вы прогнозируете исход. Так как во втором вопросе существует большая неопределенность, чем в йервом, ваше прогнозирование должно быть более регрессивным, чем ваша оценка. То есть процент, который Вы даете в качестве прогноза, должен быть ближе к 50% , чем тот процент, который Вы даете в качестве оценки. Чтобы подчеркнуть различие между этими вопросами, предположим, что описа­ ние является неточным. Это н икак не должно повлиять на вашу оценку: оценка описаний относительно того, какое они производят впечатление, не зависит от их точности. С другой стороны, в прогнозировании вы должны быть регрессивны настолько, чтобы, предположить, что описание неточно или ваше прогнозирование недостоверно. Как бы там ни было, гипотеза репрезентативности гласит, что прогнози­ рование и оценка должны совпадать. Оценивая данное описание, люди вы­ бирают число, которое является наиболее репрезентативным по отношению к описанию. Если люди предсказывают на основе репрезентативности, то в качестве прогноза они такж е выберут самое репрезентативное число. Сле­ довательно, оценка и прогнозирование - это, по сути, одно и то же. Чтобы проверить эту гипотезу, было проведено несколько исследований. В к а ж ­ дом из этих исследований испытуемым давали описательную информацию касательно некоего набора случаев. Группа оценки определяла качество каждого описания относительно данной совокупности, а группа прогнози­ рования предсказывала будущее развитие событий. Суждения этих двух групп сравнивались, чтобы проверить, являю тся ли прогнозы более регрес­ сивными, чем оценки. В двух исследованиях испытуемым предложили описания студентовпервокурсников, составленные на основе интервью при поступлении. В пер­ вом исследовании каждое описание состояло из пяти прилагательных, опи­ сывающих интеллектуальные способности и черты характера, к ак в приве­ денном примере. Во втором исследовании описания представляли собой тек­ сты длиной примерно в абзац, в которых описывались детали биографии студентов, и то, к ак они адаптировались в колледже на настоящий момент. В обоих исследованиях группу оценки попросили рассмотреть каждое из описаний, определив “процент студентов во всем классе, чьи описания сви­ детельствуют о больших способностях”. Группе прогнозирования дали те же самые описания и попросили сделать прогноз относительно того, какую среднюю годовую оценку получит этот студент и его класс по окончанию учебного года в процентилях. Результаты обоих исследований отражены на Рисунке 2, который пока­ зывает для каждого описания среднее значение прогноза среднегодовой ус­ певаемости в процентилях по отношению к средней оценке. Единственное систематическое различие между прогнозами и оценками наблюдалось в ис­ следовании с прилагательны ми, когда предсказания были значительно 78 РЕПРЕЗЕНТАТИВНОСТЬ выше, чем соответствующие оценки. Стандартное отклонение предсказа­ ний или оценок было подсчитано, опираясь на данные каждого испытуемо­ го. Сравнение этих величин не дало значительной разницы изменчивости между группами оценки и прогнозирования в пределах значений исследуе­ мых величин. В исследовании с прилагательными средняя величина стан­ дартного отклонения составила 25.7 для группы оценки (N = 38) и 24.0 для группы прогнозирования (N = 36, t = 1.25, d f = 72, не значимо). При иссле­ довании описаний средняя величина стандартного отклонения составила 22.2 для группы оценки (N=37) и 21.4 для группы прогнозирования (N = 63, t = 0 .7 5 , d f = 9 8 , не значимо). В двух исследованиях и группа оценки, и груп­ па прогнозирования производили одинаково экстремальные суждения, хотя первая группа предсказывала отдаленный объективный критерий на осно­ ве поверхностной информации, полученной из интервью; в то время к ак вто­ рая группа оценивала впечатление, которое н а нее произвело каждое описа­ ние. В статистической теории прогнозирования наблюдаемое равенство меж ­ ду оценками и прогнозами было бы возможно, если точность прогноза со­ вершенна, а в целом, это условие не соблюдалось в исследовании. Оценка Оценка Рисунок 2. Предсказанная процентильная среднегодовая успевае­ мость к а к ф ункция процентильной оценки для исследований с ис­ пользованием прилагательных и сообщений. Еще одно свидетельство равенства оценки и прогноза было получено Бейт (Beyth) в ее докторской диссертации. Она дала трем группам испытуемых семь абзацев текста, каждый их которых описывал поведение студента-практиканта на одном из уроков во время практики. В качестве испытуемых были привлечены изучающ ие статистику студенты университета Hebrew. Им сказали, что описания были получены из картотеки 100 преподавателей н а­ О психологии прогнозирования 79 чальной ш колы , которые, пятью годами ранее, окончили курс обучения. Испытуемых в группе оценки попросили оценить качество урока, описан­ ного в тексте, длинной в абзац, в процентилях относительно данной сово­ купности. Испытуемых в группе прогнозирования попросили сделать про­ гноз (в процентилях) настоящего положения каждого преподавателя, то есть его полную компетентность через 5 лет после составления описания. И груп­ па оценки, и группа прогнозирования выполнили обе задачи. К ак и в иссле­ дованиях, описанных выше, разница между оценкой и прогнозом была не­ существенной. Этот результат оставался тем ж е и при сравнении между ис­ пытуемыми в группе, и при сравнении испытуемым собственных результа­ тов. Х отя испытуемые знали, какая пропасть отделяет один пробный урок и время получения пятилетнего опыта работы, это знание не привело к тому, что их прогнозы стали более регрессивными, чем их оценки. П рогнозирование или т рансляция Предыдущие исследования показали, что прогнозирования переменной не регрессивны при сравнении с оценками исходных данных в терминах этой переменной. В следующем исследовании мы покажем, что существуют си­ туации, в которых прогнозирования значения переменной (успеваемости) не более регрессивны, чем простая трансляция этой переменной из одного масштаба в другой. В качестве результирующей переменной была выбрана среднегодовая оценка, потому что ее корреляции и свойства ее распределе­ ния хорошо известны испытуемым. В эксперименте участвовали три группы испытуемых. Испытуемые во всех группах прогнозировали среднегодовую оценку 10 гипотетических сту­ дентов на основании только процентильной оценки, полученной каж дым из этих студентов. Один и тот же набор процентильных оценок был пред­ ставлен всем группам, но эти три группы получили различные интерпрета­ ции исходной переменной следующим образом: 1. Процентиль среднегодовой оценки. Испытуемым в Группе 1 (N = 32) сказали, что “для каждого из нескольких студентов вам предложат процентильную оценку, представляющую его успеваемость в течение первого года обучения, и Вас просят угадать его среднегодовую оценку в этом году”. Ис­ пытуемым объяснили, что “65 баллов, например, означает, что среднегодо­ вая оценка, полученная этим студентом лучше, чем у 65% студентов его группы, и т.д. ”. 2. Умственная концентрация. Испытуемым Группы 2 (N = 37) сообщили, что “тест на умственную концентрацию измеряет способность концентрироваться и извлекать всю информацию из сложных сообщений. Было обнаружено, что студенты с высокими среднегодовыми оценками склонны успешно проходить тесты на умственную концентрацию и наоборот. Однако выяснилось, что резуль­ таты теста на умственную концентрацию зависят от настроения и психического 80 РЕПРЕЗЕНТАТИВНОСТЬ состояния человека во время прохождения теста. Таким образом, один и тот же человек может получить различные результаты при многократном тестировании, в зависимости от того, хорошо ли он выспался предыдущей ночью или от само­ чувствия в этот день.3 Рис. 3. Предсказания среднегодовой оценки в зависимости от процентильных оценок для трех переменных 3. Чувство юмора. Испытуемым в Группе 3 (N = 35) сообщили, что “тести­ рование чувства юмора измеряет способность людей придумывать остроумные надписи для комиксов и оценивать проявления юмора в различных формах. Было обнаружено, что студенты, показывающие высокие результаты при прохожде­ нии этого теста, как правило, получают более высокие среднегодовые оценки, чем студенты, которые показывают в этом тесте плохие результаты. Однако, не­ возможно предсказать среднегодовые оценки с высокой точностью, основыва­ ясь на чувстве юмора.” В настоящем исследовании, все испытуемые прогнозировали среднегодовые оценки на основе одних и тех же процентильных оценок. Группа 1 просто пере­ вела значения среднегодовой успеваемости в процентиле на шкалу среднегодо­ вых оценок. С другой стороны, Группы 2 и 3 предсказывали среднегодовую оценку на базе более отдаленных исходных данных. Исходя из соображений норматив­ ной теории, прогнозы этих групп должны быть более регрессивными, то есть менее изменчивыми, чем суждения Группы 1. Однако гипотеза репрезентатив­ ности предполагает другие результаты. Группа 2 делала прогнозы на основе потенциально верного, но ненадежного теста на умственную концентрацию, который был представлен как мера успева- О психологии прогнозирования 81 емости. Мы выдвинули гипотезу, что предсказания этой группы были бы менее регрессивными при их сравнении с предсказаниями Группы 1. В общем, мы пред­ полагаем, что балл успеваемости (например, среднегодовая оценка), который лучше всего представляет значение в процентиле, измеряя способности (напри­ мер, умственную концентрацию), это тот, который соответствует тому же само­ му процентилю на шкале успеваемости. Таблица 3. Средняя величина значения индивидуальных прогнозов для трех групп и результаты запланированного сравнения между группами 1 и 2, и между группами 2 и 3 Г руппа Статистика Средняя спрогнозиро­ ванная среднегодо­ вая оценка Ст андарт ное отклонение прогнозов Отклонение регрессии Корреляция г 1. Среднегодо­ вая оценка в процен­ тиле 1и 2 2. Умст вен­ ная концент ра­ ция 2 и3 3. Чувство ю мора 2.27 Не значимо 2.35 0.05 2.46 0.91 Не значимо 0.87 0.01 0.69 0.030 Не значимо Не значимо 0.029 0.01 0.022 0.95 Не значимо 0.94 0.97 Так как ненадежность данных не влияет на репрезентативность, мы предпо­ лагаем, что прогнозы среднегодовой оценки на базе ненадежного теста на ум­ ственную концентрацию будут по существу идентичными предсказаниям сред­ негодовой оценки на базе среднегодовой оценки в процентиле. С другой сторо­ ны. ожидалось, что предсказания Группы 3 будут регрессивными, потому что чувство юмора обычно не рассматривается как мера успеваемости. Средние прогнозы, приходящиеся на 10 баллов в процентиле по трем груп­ пам, показаны на Рисунке 3. Исходя из Рисунка 3, можно сказать, что про­ гнозы Группы 2 не более регрессивны, чем прогнозы Группы 1, в то время как прогнозы Группы 3 оказываются более регрессивными. В пределах данных каждого отдельного испытуемого были вычислены 4 индекса: средняя величина его прогноза, стандартное отклонение его про­ гноза, отклонение регрессии спрогнозированной среднегодовой оценки на 82 РЕПРЕЗЕНТАТИВНОСТЬ исходном множестве, и корреляция между ними. Средние величины трех значений для этих трех групп показаны в Таблице 3. Из таблицы видно, что испытуемые во всех трех группах привели пра­ вильные данные, что проявляется в высоких корреляциях между исходны­ ми данными и прогнозами (средние корреляции были получены за счет пре­ образования индивидуальных значений в z-значения Фишера). Результа­ ты запланированных сравнений между Группами 1 и 2 и между Группами 2 и 3 подтверждают принцип, наблюдаемый на Рисунке 3. Нет существен­ ных различий между прогнозами, сделанными на базе среднегодовой оцен­ ки в процентиле, и прогнозами, сделанными на основе теста на умственную концентрацию. Таким образом, люди не производили регресс при предска­ зании меры успеваемости на базе данных об уровне способностей, даж е и ненадежных. Предсказания, основанные на данных о чувстве юмора, с другой сторо­ ны , являю тся регрессивными, хотя и недостаточно. Отношение между сред­ негодовой оценкой и чувством юмора, выведенное из сравнения линий рег­ рессии приблизительно 0.70. К тому ж е, прогнозы, основанные на данных о чувстве юмора значительно выше, чем прогнозы, основанные на данных об умственной концентрации. Кроме того, у прогнозов на основании данных об умственной концентрации существует тенденция превышать прогнозы, основанные на среднегодовой оценке в процентиле. Мы наблюдали это яв ­ ление во многих исследованиях. Прогнозируя успеваемость человека на основе несовершенной информации, испытуемые проявляют снисходитель­ ность (Guilford, 1954). Вслед за уменьшением надежности, они все больше опираются на спрогнозированный уровень поведения. К ак ожидается, прогнозы будут по существу нерегрессивными, когда исходные переменные, а такж е переменные исхода рассматриваются как проявления той ж е самой черты. Пример таких прогнозов можно найти и в реальных условиях, например, Коллегия по отбору офицеров в израильс­ кой армии. Опытные офицеры, входящие в состав экзаменационной комис­ сии, обычно оценивают кандидатов по семибальной ш кале по окончанию нескольких дней экзаменов и наблюдений. В исследовательских целях для каж дого прошедшего испы тания кандидата им нуж но было предсказать заклю чительный ранг, который он получит в офицерской школе. Из более чем 200 случаев обнаружилось, что предсказанное распределение рангов было практически идентичным фактическому распределению, с одним оче­ видным исключением: прогнозы неудач были менее часты, чем фактичес­ кие неудачи. К ак правило, частоты прогнозов в двух самых высоких кате­ гориях точно соответствовали фактическим частотам. Все испытуемые пре­ красно знали, что исследование указывает на то, что надежность их прогно­ зов была только умеренной (от 0.20 до 0.40). Однако их предсказания были нерегрессивными. О психологии прогнозирования 83 М ето д о л о ги ч еск и е с о о б р а ж е н и я Гипотеза репрезентативности гласит, что прогнозы не отличаются от оце­ нок подобия, хотя нормативная теория статистики подразумевает то, что прогнозы должны быть менее экстремальными, чем оценки. Поэтому тес­ тирование гипотезы репрезентативности требует исследования, в котором прогнозы сравниваются с другим типом суждений. Варианты двух сравни­ тельных анализов использовались в исследованиях, о которых говорится в этой части книги. В одном исследовании, обозначенном A-XY, различные группы испыту­ емых оценивали две переменные (X и Y) на основе одной и той ж е исходной информации (А). В случае Тома В., например, двум различным группам давали одну и ту ж е исходную информацию (А), то есть описание личности. Одна группа оценивала исходы с точки зрения подобия (X), в то время к ак другая оценивала исходы с точки зрения вероятности (Y). Точно так ж е в нескольких исследованиях, посвященных прогнозированию числа, различ­ ным группам давали одну и ту ж е информацию (А), например, список пяти прилагательных, описывающих студента. Одна группа проводила оцени­ вание (X), а другая — прогнозирование (Y). В другом исследовании, обозначенном АВ-Х, две различных группы ис­ пытуемых оценивали одну и ту ж е переменную результата (X) на основе различной исходной информации (А и В). В исследовании “инженер/адвокат”, например, две различных группы проводили одну и ту ж е оценку (X) вероятности того, что отдельно взяты й человек является инженером. Им предоставили краткое описание его личности и различную информацию (А и В) относительно частот базового значения инженеров и адвокатов. В кон­ тексте прогнозирования числа, различные группы прогнозировали средне­ годовую оценку (X) на основе различных переменных - процентная средне­ годовой оценки (А) и умственной концентрации (В). Гипотеза репрезентативности была подтверждена при сравнительном анализе, который показал, что в отличие от нормативной модели, прогнозы не более регрессивны, чем оценки или суждения подобия. Такж е возможно выяснить, являю тся ли интуитивные прогнозы регрессивными по сравне­ нию с фактическими исходами, или с исходными данными, когда входные данные и исходы измеряются по одной и той ж е шкале. Даже, в том случае, когда предсказания не более регрессивны, чем трансляции, мы ожидаем, что они будут слегка регрессивными по сравнению с исходами из-за извест­ ной ошибки тяготеть к центральной тенденции (Jonson, 1972; W oodworth, 1938). В большом разнообразии оценочных задач, вклю чая простую транс­ ляцию исходных данных с одной ш калы на другую, испытуемые имеют тен­ денцию избегать крайних ответов и уменьшать изменчивость своих сужде­ ний (Stevens и Greenbaum, 1966). Из-за этого предубеждения, суждения бу­ дут регрессивны по сравнению с входными данными или с исходами. Ис­ 84 РЕПРЕЗЕНТАТИВНОСТЬ следования, используемые в этой книге, нейтрализуют это влияние, срав­ нивая две оценки, подверженные одному и тому ж е предубеждению. Настоящая серия исследований была посвящена ситуациям, в которых люди делают прогнозы на основе информации, которая доступна им до про­ ведения исследования, в форме стереотипов (например, инженера) и ожида­ ний относительно отношений между переменными. Обратная связь исхода не обеспечивалась, и количество оценок, которые должен был осуществить каж ды й тестируемый, было мало. Напротив, самые ранние исследования прогнозирования касались изучения функциональных или статистических отношений между переменными, с которыми испытуемые не имели никако­ го предшествующего знакомства. Эти исследования обычно стимулируют большое количество попыток и различны х форм обратной связи исхода. (Часть этой литературы была рассмотрена в работах Словика и Лихтенштей­ на, 1971.) В исследовании повторных прогнозов с обратной связью, испытуе­ мые вообще предсказывают, выбирая результаты так, чтобы полная после­ довательность или образец предсказаний были высоко репрезентативными по отношению к распределению исходов. Например, испытуемые в исследо­ ваниях, изучающих вероятность, производят последовательности прогнозов, которые едва соответствуют статистическим характеристикам последователь­ ности исходов. Точно так ж е испытуемые в задачах числового прогнозирова­ ния приблизительно воспроизводят график рассеивания, то есть объединен­ ное распределение входных данных и исходов (см., например Grey, 1968). Для того чтобы это сделать, испытуемые прибегают к смешанной стратегии: для любых исходных данных они производят распределение различных предска­ заний. Эти прогнозы отражают то, что любой набор исходных данных вы зы ­ вает различные исходы при различных испытаниях. Очевидно, правила про­ гнозирования различны в этих двух парадигмах, хотя репрезентативность имеет отношение к обеим. В парадигме обратной связи испытуемые произво­ дят последовательности ответов, представляющие целостные модели связи между исходными данными и исходами. В ситуациях, исследуемых в этой книге, испытуемые выбирают прогноз, который лучше всего представляет их впечатления относительно каждого отдельного случая. Эти два подхода ведут к различным нарушениям нормативного правила: представление нео­ пределенности с помощью смешанной стратегии в парадигме обратной связи и уменьшение неуверенности за счет прогнозирования с помощью оценок в данной парадигме. Д остоверн ость и и лл ю зи я валидности К ак демонстрируется в предшествующих разделах книги, люди прогнози­ руют, вы бирая исход, который является наиболее репрезентативным по отношению к исходным данным. Мы предполагаем, что степень достовер­ ности, которую человек предполагает в предсказании, отражает степень, в которой выбранный исход является более репрезентативным по отношению О психологии прогнозирования 85 к исходным данным, чем другие исходы. Главный показатель репрезента­ тивности в контексте предсказания чисел с мультиатрибутивными исход­ ными данными (например, оценки профилей) — это упорядоченность или взаимосвязанность исходных данных. Чем более упорядочены исходные данные, тем более репрезентативной будет казаться предсказанная величи­ на и тем большей будет достоверность этого прогноза. Например, люди про­ гнозируют среднее значение В с большей достоверностью на основе оценок В в двух разных предварительных испытаниях, чем на основе А и С. Дей­ ствительно, было обнаружено, что внутренняя изменчивость или несогла­ сованность исходных данных уменьшает достоверность прогнозов (Slovic, 1966). Невозможно преодолеть заблуждение, для которого упорядоченные про­ фили позволяют большую прогнозируемость, чем неупорядоченные. Стоит отметить, однако, что это убеждение несовместимо с обычно применяемой многовариантной моделью прогнозирования (то есть, нормальной линейной моделью), в которой ожидаемая точность прогноза не зависит от изменчи­ вости в пределах профиля. С упорядоченными профилями испытуемые обычно сталкиваются, ког­ да прогнозируют на основании высоко коррелированного множества. Не­ упорядоченные профили, наоборот, являю тся более частыми при низких корреляциях. Поскольку достоверность растет с увеличением упорядочен­ ности, достоверность будет высокой, когда исходные переменные высоко коррелированы. К ак бы там ни было, если даны исходные переменные за­ данной валидности, многократная корреляция с критерием обратно пропор­ ционально связана с корреляциями между исходными данными. Таким об­ разом, возникает парадоксальная ситуация, при которой высокие взаимо­ связи между исходными данными увеличивают надежность и уменьшают достоверность. Чтобы продемонстрировать этот эффект, мы попросили испытуемых сде­ лать прогноз среднегодовой оценки на основе двух пар тестов на способнос­ ти. Испытуемым сказали, что одна пара тестов (творческое мышление и спо­ собность к символизации) была высоко коррелированной, в то время к ак другая пара тестов (гибкость ума и систематичность рассуждения) не была коррелированной. Множество, с которым они столкнулись, оправдало эти ожидания. (Для половины испытуемых ярлы ки коррелированные и некор­ релированные для пары тестов были изменены на противоположные). Ис­ пытуемым сообщили, что “все тесты были одинаково действенными в про­ гнозировании успеваемости в колледж е”. Конечно, в этой ситуации, более высокая точность прогнозов может быть достигнута с некоррелированной парой тестов, чем с коррелированной парой. Но, к ак и ожидалось, испыту­ емые были более уверены в прогнозах на базе коррелированных испытаний, для полного диапазона м нож ества прогнозирования (t = 4.80, d f = 129, р < 0.001). То есть, они были более уверены в контексте с более низкой про­ гнозирующей валидностью. 86 РЕПРЕЗЕНТАТИВНОСТЬ Другой вывод, который может быть получен из исследований прогнози­ рования, вклю чая и наш е - это то, что достоверность представляет собой функцию спрогнозированного уровня действия, график которой по форме напоминает букву J (см. Johnson, 1972). Испытуемые прогнозируют высо­ кую успеваемость с большой степенью достоверности, и они проявляют боль­ шую степень достоверности, прогнозируя полную неудачу, чем среднюю ус­ певаемость. К ак мы видели ранее, интуитивные предсказания часто недо­ статочно регрессивны. Поэтому несоответствия между прогнозами и исхо­ дами, являю тся самыми большими в экстремумах. J -образная ф ункция достоверности подразумевает, что испытуемые наиболее уверены в предска­ заниях, которые, скорее всего, ложны. Предшествующий анализ показывает, что факторы, которые увеличи­ вают достоверность, например, упорядоченность и экстремальность, часто отрицательно коррелированны с точностью прогнозов. Таким образом, люди склонны быть слиш ком уверенными в ошибочных суждениях, явление, ко­ торое можно назвать иллюзией валидности . Подобно прочим ошибкам вос­ п риятия и суждения, иллю зия валидности часто сохраняется даж е тогда, когда признан ее иллюзорный характер. Интервьюируя кандидата, напри­ мер, многие из нас испытывают большую уверенность по поводу прогноза его будущей деятельности, несмотря на знание о том, что интервью часто бывают ошибочными. П редстав л ен и я относительно регресса Последствия регресса окружают нас повсюду. В ж изни у самых выдающихся отцов бывают посредственные сыновья, у замечательных ж ен заурядные муж ья, неадаптированные имеют тенденцию приспосабливаться, а от счаст­ ливчиков, в конечном счете, удача отворачивается. Несмотря на эти факто­ ры , люди не приобретают надлежащ ее понятие регресса. Во-первых, они не ожидают проявления регресса во многих ситуациях, где он должен произой­ ти. Во-вторых, что подтвердит любой преподаватель статистики, чрезвы­ чайно трудно приобрести надлежащ ее понятие регресса. В-третьих, когда люди наблюдают регресс, они обычно изобретают для этого явления лож ­ ные динамические объяснения. Что ж е делает понятие регресса противоречащим интуиции, который трудно приобрести и применить? Мы утверждаем, что главный источник трудностей - то, что эффекты регресса обычно нарушают интуицию, кото­ рая говорит нам, что спрогнозированный исход должен быть максимально репрезентативен по отношению к исходной информации.4 4 Ожидание того, что каждый значимый акт поведения высоко репрезентативен по отноше­ нию к исполнителю, может объяснить, почему как обыватели, так и психологи постоянно удивляются незначительным корреляциям среди, как кажется, взаимозаменяемых изме­ рений честности, рискованности, агрессии и зависимости (Mischei, 1968). О психологии прогнозирования 87 Чтобы проиллюстрировать постоянство нерегрессивной интуиции, не­ смотря на то, что она подчиняется статистике, мы представили следующую проблему нашей выборке аспирантов, специализирующихся в психологии: Проблема тестирования. Человек, выбранный наугад, обладает коэффициентом интел­ лекта, равным 140. Предположим, что коэффициент интеллекта представляет собой сумму “истинного” количества очков и случайную ошибку измерения. Пожалуйста, назовите верхние и нижние пределы достоверности 95% для истинного коэффициента интеллекта этого человека. То есть назовите такой верхний предел, при котором Вы уверенны на 95%, что истинный коэффициент интеллекта, фактически, ниже, чем эта цифра, и такой низший предел, что Вы уверенны на 95%, что истинный коэффициент интеллекта фактически выше. В этой задаче, испытуемых попросили считать наблюдаемый коэффици­ ент интеллекта суммой “истинного” показателя интеллекта и компонента ошибки. Так к а к наблюдаемый уровень интеллекта значительно выше сред­ него, более вероятно, что компонент ошибки положителен и что этот чело­ век на последующих тестах получит более низкий результат. Большинство испытуемых (73 из 108), однако, установили интервалы достоверности сим­ метрично относительно 140, не показав никакого ож идания регресса. Из оставшихся 35 испытуемых, 24 задали интервалы регрессивной достовер­ ности, a l l задали контррегрессивные интервалы. Таким образом, большин­ ство испытуемых проигнорировало влияние ненадежности исходных дан­ ных и прогнозировало так, к ак будто величина 140 была истинным показа­ телем интеллекта. В этой части книги неоднократно обращается внимание на тенденцию предсказывать безошибочность исходной информации. Возникновение регресса такж е иногда признается, либо потому что мы обнаруживаем эффект регресса в наш их собственных наблюдениях, либо потому что нам явно говорят, что регресс произошел. Когда эффект регрес­ са обнаружен, он обычно рассматривается к а к систематическое изменение, которое требует независимого объяснения. Действительно, в социальных науках предлагалось много ложных объяснений эффектов регресса5. Исполь­ зовались динамические принципы, чтобы объяснить, почему бизнес, одно время очень успешный, имеет тенденцию к ухудшению впоследствии, и почему обучение интерпретации выражений лица полезно для тех учащ их­ ся, которые показали плохие результаты на предварительных экзаменах, и вредно для тех, кто показал самые хорошие результаты. Некоторые из этих объяснений не были бы предложены, если бы их авторы поняли, что если даны две переменные равной изменчивости, следующие два утверждения логически эквивалентны: (a) Y регрессивен относительно X; (б) корреляция 5Для освещения обсуждений ошибок в исследованиях, связанных с регрессом, см., напри­ мер, Campbell (1969) и Wallis и Roberts (1956). между Y и X - меньше единицы. Поэтому объяснение регресса является равносильным объяснению того, почему корреляция меньше единицы. В качестве заключительной иллюстрации того, насколько трудно распоз­ нать и должным образом интерпретировать регресс, рассмотрим следующий вопрос, который был задан нашей выборке аспирантов. Описанная задача фактически возникла в опыте одного из авторов. Задача обучения. Инструкторы в летной школе использовали политику последователь­ ного положительного поощрения, рекомендуемую психологами. Они устно поощряли каждое успешное выполнение маневра в полете. После некоторого времени примене­ ния этого подхода обучения, инструкторы заявили, чтобы вопреки психологической доктрине, высокая похвала за хорошее выполнение сложных маневров, обычно приво­ дит к ухудшению их выполнения при следующей попытке. Что должен ответить пси­ холог? Регресс неизбежен в летных маневрах, потому что его выполнение не яв л я­ ется абсолютно надежным, и прогресс при их последовательном выполне­ нии идет медленно. Следовательно, пилоты, которые исключительно успеш­ но проявили себя на одном испытании, вероятно, проявят себя хуж е на сле­ дующем, независимо от реакции инструкторов на их изначальный успех. Опытные инструкторы летной ш колы фактически обнаружили регресс, но приписали это вредному влиянию поощрения. Эта история из ж изни иллю­ стрирует печальный аспект человеческого положения. Мы обычно хвалим других, когда они хорошо себя ведут, и наказываем их, когда они ведут себя плохо. Только благодаря регрессу, они будут показывать хорошие резуль­ таты после наказания и плохие после похвалы. Следовательно, перед нами ж изненная схема, согласно которой нас часто хвалят за то, что мы наказы ­ ваем других, и наоборот. Н и один из аспирантов, отвечавших на этот вопрос, не предположил, что регресс мог быть причиной проблемы. Вместо этого, они предложили, что устное поощрение могло быть неэффективным для пилотов, или что оно могло привести к самонадеянности. Некоторые аспиранты даже сомнева­ лись относительно валидности впечатлений инструкторов и обсуждали воз­ можные источники предубеждения в их восприятии ситуации. Эти респон­ денты несомненно были полностью ознакомлены с понятием статистичес­ кого регресса. Однако они не сумели распознать случай регресса, когда он не был изложен в знакомых терминах роста отцов и сыновей. Очевидно, одно лиш ь обучение статистике не меняет фундаментальную интуицию в вопро­ сах неопределенности. 5. Изучение репрезентативности Майя Бар-Хиллер Даниель Канеман и Амос Тверски предположили, что при оценке вероятно­ сти неопределенных событий люди часто обращаются к эвристике или к эм­ пирическим правилам, которые почти не коррелируют (если коррелируют вообще) с переменными, которые фактически определяют вероятность со­ бытия. Одна из таких эвристик — репрезентативность, определяемая как субъективная оценка степени, в которой рассматриваемое событие “явл я­ ется в существенных свойствах подобным своей исходной совокупности” или “ отраж ает существенные особенности процесса, который его породил” (Kahneman & Tversky, 1972b, с. 431, 3). Хотя в некоторых случаях более вероятные события оказываются такж е более репрезентативными (и наобо­ рот), уверенность относительно репрезентативности случая к ак показателя его вероятности может привести к двум видам систематических ошибок в суждении. Во-первых, это может придать чрезмерный вес переменным, ко­ торые влияют на репрезентативность события, а не на его вероятность. Вовторых, это может уменьшать важность переменных, крайне необходимых для определения вероятности события, но не связанных с его репрезента­ тивностью. К онцепция репрезентативности иногда критиковалась к а к слиш ком неопределенная и неуловимая, возможно, потому что в ней не хватает об­ щего определения. Однако мы не утверждаем, что невозможно оценить реп­ резентативность независимо от оценки вероятности, — заключение, кото­ рое^часто подразумевалось критиками. Например, в исследовании “ТомаВ.”, Канеман и Тверски (1973, 4) определяли репрезентативность как подобие некоторого человека, Тома В., “типичному аспиранту в ... (нескольких) об­ ластях специализации” (1973, с. 238) и оценивали ее независимо от вероят­ ности того, что Том В. действительно занимался этими областями науки. В других исследованиях, независимая оценка на основе репрезентативности не применялась только потому, что читатели могли без труда провести ее самостоятельно с помощью мысленного эксперимента. 90 РЕПРЕЗЕНТАТИВНОСТЬ L М R Рис. 1. Характерный стимул, использованный при изучении подобия и вероятности (.Источник : Бар-Хиллер, 1974). П одоби е и в е р о я т н о с т ь Вскоре после того, к ак было введено понятие репрезентативности, я прове­ ла небольшое исследование, в котором репрезентативность оценивалась, как в соответствии с априорными критериями (что будет разъяснено позже в этой главе), так и экспериментально, в соответствии с оценками испытуе­ мых. Затем я сравнила эти оценки с независимо собранными суждениями о вероятности (Bar-Hillel, 1974). Преимуществом изучаемых задач являлась их уникальность, четко определенная вероятность, а такж е простота визу­ ального представления, позволяющая легко делать суждения о видимом по­ добии. В качестве стимулов в этом исследовании были выбраны тройки гистог­ рамм, обозначенные L, М и R для левой, средней и правой гистограммы, соответственно. Пример приведен на Рисунке 1. К аж дая диаграмма состо­ ит из трех полос, которые окрашены, слева направо, в зеленый, ж елты й и красны й цвет. В длину каж дая полоса поделена на 5 частей, а длины этих трех полос в пределах каждой гистограммы, в сумме составляют 100. Все тройки гистограмм (L, М, R), используемые в этом эксперименте об­ ладали следующими свойствами: 1. Каждая полоса в средней гистограмме является средней по длине между соответствующими полосами в гистограммах слева и справа (однако если, средняя длина левой и правой полос не достигала числа, кратного пяти, сред­ н яя полоса округлялась к ближайшему числу, кратному пяти.) Например, на Рисунке 1, длина зеленой полосы в М-гистограмме = 35, что находится между 20 и 50 (соответствующие длины полос в L и R гистограммах). То ж е можно сказать про ж елтые и красные полосы. (Обратите внимание, однако, что длины этих полос округлены: от 42.5 до 40 и от 22.5 до 25.) Изучение репрезентативности 91 2. Порядок длин полос в М-гистограмме совпадает с порядком или в Lили в R -гистограмме, но не с двумя, так к ак L- и R -гистограмма всегда упо­ рядочены по-разному. Например, на Рисунке 1 порядок М и L один и тот же, причем красная полоса - самая короткая, а ж елтая - самая высокая в обеих диаграммах, что отличается от порядка в R диаграмме, где ж елтая по­ лоса самая короткая. Это подчеркивается тонкой линией, соединяющей вер­ шины всех полос в гистограмме, хотя ось X была номинальной переменной. 3. Предположим, что М-гистограмма интерпретируется как описание три­ номиальной совокупности, a L и R -гистограммы интерпретируются как вы­ борки из 20 субъектов, которые выбраны из этой популяции. Тогда выборка, чей порядок совпадает с порядком М-гистограммы, является менее вероятной выборкой. Например, на Рисунке 1, М описывает триномиальную совокупность с параметрами 0.35, 0.40, и 0.025. Вероятность того, что взята выборка R (то есть, 10 зеленых, 3 желтых и 7 красных бусинок), а не выборка L (то есть, 4 зеленых, 14 желтых и 2 красные бусинки) - приблизительно 8 к 5, т. к. P(L 1м ) _ (20!/4il4!2!) x (0.35)4(0.40j4(0.25)2_ Q6U1 P(R IM) (20!/10!3!7!) X(0.35f(0.40/ (0.25)7 Таким образом, R - более вероятная выборка. 4. Предположим, наоборот, что L и R интерпретируются к ак совокупно­ сти, а М к а к выборка. Появление выборки М наименее вероятно из совокуп­ ности, с которой у нее совпадает порядок. Например, на Рисунке 1, М опи­ сывает выборку из 7 зеленых, 8 ж елты х и 5 красных бусинок. Вероятность того, что М скорее взята из совокупности R (то есть, параметры 0 .5 0 ,0 .1 5 , и 0.35), чем из совокупности L (то есть, параметры 0.20, 0.70, и 0.10) - при­ близительно 7 к 5, т.к. Р(М IL) Р(М | R) (20!/7!815!) (0.20)’ (0.70/(0.10)’ (20!/7!8!5!) (0.50)7(0.15Д0.35)5 Таким образом, R - более вероятно совокупность. Двадцать восемь таких троек гистограмм были показаны трем различ­ ным группам испытуемых, которые руководствовались тремя различными наборами инструкций. Одной группе было сказано, что каж дая гистограм­ ма описывает триномиальное распределение, где L и R описывают две сово­ купности, а М описывает выборку, взятую из одной из этих совокупностей. 25 испытуемых в этой группе оценивали вероятность того, взята ли выбор­ ка, отображенная в М, из совокупности L или из совокупности R. Другой группе сказали, что М описывает триномиальную совокупность, в то время как L и R - две триномиальные выборки. 26 испытуемых в этой группе оце­ нивали вероятность того, к а ка я из этих двух выборок взята из данной сово­ 92 РЕПРЕЗЕНТАТИВНОСТЬ купности. Этим группам сначала предоставили большой стеклянный сосуд, заполненный зелеными, желтыми и красными бусинками. Им показали, к а к содержимое сосуда (то есть, совокупность) может быть описано соответ­ ствующей гистограммой. В их присутствии была наугад взята выборка из 20 бусинок, а такж е было продемонстрировано ее представление в виде гис­ тограммы. Испытуемых попросили считать, что L и R являю тся совокупно­ стями, а М представляет выборку 20 бусинок, или ж е L и R — это выборки, а М представляет совокупность, в зависимости от группы, к которой при­ надлеж али испытуемые. В А П одобие L R 2 10 15 1 Вероятность выборки 0 = 0.79 П одобие £ |— Д — “[“ о*— j Вероятность совокупности 0 = 0.75 Рис. 2. Совместное распределение субъективных оценок L и R по подо­ бию в сравнении с вероятностью (A) L и R - выборки из совокупности М или (В) - М выборка из совокупности L или R. (Источник: Бар-Хиллер, 1974.) Третьей и последней группе, состоящей из 25 испытуемых, не было предо­ ставлено интерпретации гистограмм, и их просто просили оценить, какая из этих двух гистограмм, L или R, более походила на среднюю гистограмму М. Стимул рассматривался к а к L или R согласно гистограмме, выбранной большинством испытуемых отдельно для каждого из этих трех критериев ((1) более вероятно, что производит выборку М; (2) более вероятно, что по­ явится из совокупности М; (3) более подобен М). Двумя основными результатами этого исследования были: 1. Эмпирические оценки подобия, представленные испытуемыми, абсо­ лютно совпали с априорным критерием подобия, выраженным в свойстве 2, обозначенном выше. Другими словами, для всех 28 стимулов, более чем 80% испытуемых решили, что М более подобно гистограмме, в которой вы ­ соты цветных полос были упорядочены таким ж е образом. 2. Упорядочение L n R n o признаку вероятности, в качестве выборок, либо в качестве совокупностей, коррелировались с их упорядочением по подо­ бию. Из 17 троек гистограмм, в которых было оценено, что R более подобно М, только двум была присуща м алая вероятность того, что они являются выборками, и четырем, что они являю тся совокупностями. Из этих 11 вы ­ борок, в которых было оценено, что L более подобно М, только одна была оценена ниж е, чем R, в качестве выборки. Таким образом, упорядочение по подобию не совпадало с упорядочением по вероятности в менее чем 13 % сти­ Изучение репрезентативности 93 мулов. Совместное распределение суждений подобия с оценками вероятно­ стей дана на Рисунке 2; где в (A) L и R — выборки, а в (В) - совокупности. Коэффициент корреляции ф между оценками вероятности к ак выборок и ранжированием вероятности к ак совокупности был 0.75, что примерно столь ж е высоко, к ак корреляции ф между оценками по вероятности и ран­ жированием по подобию. Это подтверждает положение о том, что испытуе­ мые в обеих группах, оценивающих вероятность, основывали свои упоря­ дочения в значительной степени на подобии, оценка же была сделана тре­ тьей группой. З а с ч е т к а к и х особен н остей в ы б о р к и в о с п р и н и м а ю т с я р е п р е з е н ­ тативны м и? Олсон (Olson, 197б) указал, что, хотя “понятие суждения, основанное на оцен­ ке репрезентативности, подтверждается в значительной степени, к ак экс­ периментально, так и интроспективно, в большом количестве ситуаций”, этого недостаточно, если мы не можем определить “факторы, которые дела­ ют свойства определенной задачи или проблемы существенными на столько, чтобы относительно них оценивать репрезентативность” (с. 608). В некото­ рых контекстах, таких к ак исследование подобия и вероятности, они были идентифицированы. В качестве еще одного примера, оказывается, что ключ, определяющий репрезентативность вт тборки для неупорядоченных выбо­ рок различного размера, взяты х из некоторого распределения Бернулли, не соответствует пропорции “успехов” в выборке и соответствующему пара­ метру совокупности (Kaheman и Tversky, 1972b, 3). Исследование, которое я сейчас опишу (Bar-Hillel, 1980b), предлагает общую методологию для идентификации особенностей выборок из любой популяции, определяю­ щ их репрезентативность. Это можно пояснить на примере попытки иден­ тифицировать признаки, которые определяют репрезентативность выборок (трех наблюдений) взяты х из функции распределения (например, нормаль­ ного), по форме напоминающей колокол. Основной принцип прост: если мы предполагаем, что суждения репрезен­ тативности и вероятности определены в соответствии с одними и теми ж е су­ щественными свойствами, то эти свойства могут быть обнаружены, за счет опроса, в котором испытуемым предлагается определить вероятности для не­ которого набора выборок. Эта процедура меняет роли вероятности и репре­ зентативности. Другими словами, оценки вероятности используются не для того, чтобы подтвердить репрезентативность, а чтобы ее вывести. Однако если попросить испытуемых оценить выборки непосредственно на основе репре­ зентативности, то это может рассматриваться как спорный вопрос. Они мо­ гут возразить: “Что Вы подразумеваете под репрезентативностью?” Вместо этого, предложенная стратегия заменяет собой ясный, однозначный вопрос (“К акая из этих выборок, более вероятно, взята наугад из этой совокупнос­ ти?”), который, согласно стандартным посылкам, имеет нормативный ответ. 94 РЕПРЕЗЕНТАТИВНОСТЬ Испытуемым предложили подобную задачу: Средний рост студентов американских колледжей -175 см. Из офиса секретаря коллед­ ж а были наугад взяты три файла, принадлежащие Джону, Майку и Бобу. Какой ре­ зультат является более вероятным для роста трех молодых людей? Д ж о н -1 7 8 см Джон - 177 см М а й к -1 7 0 см Б о б -1 7 6 см или Майк - 177 см Боб - 177 см Ф актические данные отличались в различных документах и их можно найти в колонках стимулов Таблицы 1 (вышеупомянутый пример соответ­ ствует строке 1). Систематически изменяя используемые числа, можно было проверить только то, какие особенности выборок, и в каком порядке, опре­ деляли ответы испытуемых. Прежде, чем я предложу вашему вниманию обобщенную картину, вот несколько пояснений чтобы, помочь читателю понять таблицу. 1. Выборка обозначалась как А всегда, когда она воспринималась как более вероятная, чем выборка, с которой она ш ла в паре. В первоначальных формах вопросника, выборки А появлялись справа так ж е часто, к а к и сле­ ва. Точная пропорция испытуемых, которые выбрали А, а не В, приведена в колонках ответов. 2. Выборку, которая является более вероятной с нормативной точки зре­ н ия, можно увидеть в колонке статистических измерений. Выборка А бо­ лее вероятна, чем выборка В тогда и только тогда, когда Р (А) /Р (В) > 1, то есть, когда /(* ■ )« /(* ,) * / ( * ^ f W * f ( Y 2) * f ( Y 3) где А = [Xj, Х 2, Х 3], В = [Yj, Y3, Y3]. Это отношение было вычислено для ф ункции с нормальной плотностью при (л= 175 см, сг=6 см. Так к а к статис­ тически правильный ответ появляется в столбцах А и В одинаково часто, ответы испытуемых четко связаны с этим не более, чем на случайном уров­ не. Возможно наиболее поразительная особенность результатов, сведенных в Таблице 1 - тот ф акт, что не существует никакого признака, на который полагаются испытуемые, упорядочивая выборки. Например, иногда они отбирают выборку, среднее значение которой ближе к среднему значению совокупности (например, строка 1), а иногда они выбирают совершенно про­ тивоположное (например, строка 2). Иногда испытуемые отбирают выбор­ ку, содержащую более крайние наблюдения (например, строка 13), а иног­ да напротив (например, строка 14). Действительно, каж ется, что набор при­ знаков является важным и рассматривается некоторым последовательным способом, к ак изображено на Рисунке 3 (количество идентичных наблюде- §о ф оа оо © ьcd © ^ JT sI Я 5 МЯ Д ft 2гН мw ' cd й а о S'g JS л я р. Ei n 176 176 175 176 170 170 170 170 178 176 178 178 178 | 178 чН СМ со г> 00 os огЧ гН гЧ см гЧ со т*Ч гЧ ю ч-Ч со 1— 1 гЧ ю со 170 170 170 178 178 178 1 177 1175 175 00 см Tt« со СМ ю 0) со 1> ю о см с& О) 00 00 1> см 1> со ь- 0.31 0.31 0.31 0.31 с 0.23 I 0.81 0.60 0.31 0.31 0 .3 0 # 0 .2 0 # 0 .1 7 # о 165 170 169 ь- со ю гН осм 00 см < 1.43 1.14 1.14 * со 181 180 181 ю 0.31 0.36 0 .3 6 # О 176 176 176 177 ЖШ : т п я о 169 ю О> os гН 00 00 со о ю см СМ см СО см см см С О см см Я гЧ СО 179 ю см о гЧ СО г> СО 6 176 О) о со ю ю см со см см см 1.58 0.31 г> со 6 170 1— 1 О) со со см со СО со гЧ гЧ 1> 1Л см 1Л so со ю 1> Tt« О) 1> со ю со 176 177 175 00 00 00 | 173 172 171 0.68 0.56 0.50 0.50 0 .5 0 # 0.63 0 .5 0 # 6 177 178 177 175 178 178 0.31 ◄ < 174 170 170 1.12 PQ 6 179 178 178 176 0.57 0.57 0.91 т п т т PQ со со 178 176 175 170 6.42 1.59 1.59 1.39 1300 о [ 170 174 176 175 175 175 177 175 СО со О 6 170 175 175 175 177 175 1.39 Правиль­ ные ответы Статистика Колмого­ рова-Смир­ нова О тН 176 178 175 175 175 177 175 со 00 гЧ 165 170 180 180 177 ш 177 Майк >— 4/ Й § 181 178 178 178 191 177 176 176 176 189 ф 177 S S3 176 ф 170 со гЧ со 6 со Предпочтителен меньший диапазон S3 Джон а Боб ф со о Предпочтителен больший диапазон W К СО Три различия против двух сходств EH т к 178 О ДЖОН 1 Майк О < Три различия против трех сходств о т ЯГО Щ А Ч Стимулы для выборки В 5И Стимулы для выборки А аcd И W к ю о Ответы Изучение репрезентативности 95 < < СМ со РЕПРЕЗЕНТАТИВНОСТЬ 96 Itх d t—t1t- X ь- X х X ьX X ьхь- tX ьX X о о о о о о о о о d тЧ гЧ О О о о о о о S5|s} я *и СО It- оо тЧ00 ьX tоо оо X о X о X tX ьX о l ч д ◄◄д ◄ на ^а g я« к « gl о о о < < с ьX X д t— см о X см X X X X X гЧ X см X X тЧ о о о о 6 о о хсм хсм схм о X X ь- о ltсо см со X X X X м ссм t- ьссо о см со см 0 t-0 tтЧ со сь-о о t— тЧ о X о tо X X X од tttX X X о X X тЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ сt-м тЧ тЧ X X X ttX X X X тЧX тЧX X тЧ тЧ тЧ тЧ тЧ гЧ тЧ тЧ со t— 14 fc- X X X X t- ltX t—X сt— о tt- ь- tтЧ гЧ гЧ тЧ тЧ тЧ гЧ тЧ тЧ тЧ о tтЧ о о t— t- 0 0 t— гЧ ь- X X X тЧX X tX tX X tX X X тЧ тЧ тЧ тЧ тЧ гЧ гЧ тЧ тЧ тЧ X 0 см X о д сом сi4м ссм м с0м гЧ X X X ьX X X X я о о о о тН тЧ тЧ « 2 Б -«sм Я О дай i| i(Бi ю3 8 & WS 5 гЧ It- д тЧод тЧ о стЧм тЧX X X 0 со оо X ь- X тЧ тЧ tX ь- X X X X X0 ьX X сXм X см X t- X X tX X X X X X тЧ гЧ тЧ тЧ тЧ тЧ тЧ тЧ тЧ It- It- It- It- It- lt- It- It- гЧ гЧ It- X о о ь- X X t- тЧt- Т1< тЧX t- X X гЧ тЧ тЧ тЧ т 4 тЧ тЧ It- It- It- It- и к о О ч 2 п 2Я || о i8 дя Рч. и It- Изучение репрезентативности 97 ний о том, представлены ли обе стороны среднего значения выборки, сред­ нее значение и диапазон). Это усиливает мнение о том, что в независимости от определения, предполагаемое подобие выборки, составляет собственную концепцию . Если бы испытуемые использовали единственный признак, не было бы необходимости назы вать это репрезентативностью. Известно, что оценки испытуемых, каж ется, основаны на сложных соображениях о струк­ туре выборок, представляю щ их основания для вы раж ения (скорее, концеп­ туализации) их эвристического суждения на основе репрезентативности. М ожет ли блок-схема на Рисунке 3 рассматриваться больше, чем просто удобное и емкое резюме результатов Таблицы 1? Н асколько серьезно мож ­ но считать ее процессной моделью фактического рассуждения испытуемых в описанной задаче? С одной стороны, очевидно, что не все особенности мо­ дели будут соответствовать - другим выборкам, другим размерам выбо­ рок, другим распределениям. Я бы, например, не утверж дала, что любая выборка с дисперсией будет всегда оценена как более вероятная., чем лю бая выборка без дисперсии - хотя это и сохраняется для выборок, использован­ ных в моем эксперименте. Упорядоченная модель, таким образом, являет­ ся только приближением фактической когнитивной стратегии людей. Од­ нако, будучи таковой, она обладает весомым психологическим преимущ е­ ством, являясь правдоподобной, так к ак она содержит в себе лиш ь малень­ кое число простых в вычислительном отношении признаков. В этом пункте предлагается интересное наблюдение, которое связывает описанное выш е исследование и настоящ ее. В исследовании гистограмм, два вида упорядочения по вероятности сравнивались с упорядочением по подо­ бию: (а) упорядочение двух выборок по признаку более или менее вероят­ ных исходов некоторой совокупности, обозначенной Р (s/p); (b) упорядоче­ ние двух совокупностей в качестве более или менее вероятных источников некоторой выборки, обозначенной P (p/s) (иногда называемое обратными ве­ роятностями). Эти две задачи, привели к очень близким результатам, со­ гласно которым они обе были сделаны очень похожим образом - действи­ тельно, в соответствии с гипотезой, что они были обе реш ены на основе репрезентативности (то есть, в данном случае, визуального подобия). Суще­ ствует статистическая концепция, которая является аналогичной психоло­ гической концепции репрезентативности - концепции степени соответствия. Измерение степени соответствия типично используется в проверке гипоте­ зы, когда неизвестна совокупность, породивш ая некоторую известную вы ­ борку, при отсутствии информации о предполагаемой вероятности. Таким образом, при оценке совокупностей, репрезентативность, каж ется, более со­ ответствует концепции степени соответствия между выборкой и совокуп­ ностью, чем концепции вероятности совокупности, условной для некото­ рой выборки, Р (p/s). В исследовании распределения роста, однако, была предложена совокуп­ ность, которая являлась источником для выборок. Поэтому, испытуемым не приходилось оценивать ни обратные вероятности, ни степень соответ- 98 РЕПРЕЗЕНТАТИВНОСТЬ Какая из двух выборок имеет 3 идентичных наблюдения? " ” "в ни одна | -------------------------------| обе 7-28 ш ЛL . А ■ и ------------------- — Какая из выборок имеет среднее значение, ближе к \l? Ш4 Ü Ц ß üw ^ Я» г**1 идентичных наблюдения? 7,8,9 ни одна ни одна обе 25-28 1 обе 10-17 ! 1 ----------- r j Какая из выборок иреет среднее значение, ближе к ц? 25-28 К щ ! имеет ( ! 10, 11, 15| 17 .! •к *12 ИНН I 12-14JIK Какая из выборок ир<«ет среднее знамение, ближе кр? 13-14,16 ftК также Обе выборки оценены как одинаково вероятные Рис, 3. Блок-схема, суммирую щ ая признаки и последовательность, в которой они использовались для упорядочения выборок по веро­ ятности. (Источник: Бар-Х иллел, 1980b.) ствия. Однако, интересно, смогут ли их оценки, так или иначе, быть пере­ строены в качестве интуитивной попы тки оценить последнее. Одно из возмож ны х измерений степени соответствия между выборками из трех элементов и нормальным распределением - одно-выборочная, дву­ сторонняя статистика Колмогорова-Смирнова (КС) (см., например, Siegel, 1956, стр. 47-52). Эта статистика интерпретируется так, что чем больше зна­ чение (максимальное расстояние между ф ункциями распределения выбор­ ки и совокупности), тем менее вероятно, что эта выборка взята наугад из совокупности. В последних двух столбцах Таблицы 1 приведена статистика КС для каж дой из исследуемых выборок. В 18 парах, распределение выбо­ рок по статистике КС согласовывалось с их распределением большинством Изучение репрезентативности 99 испытуемых; в 3 парах статистика КС бы ла выровнена (в 1 из которых, стро­ ка 12, испытуемые такж е были ф актически единодушны), а в 7 парах (от­ меченных в Таблице 1 звездочками) распределения различны . Это мало влияет на сравнение степени согласованности между распреде­ лением КС и распределением, произведенным испытуемыми, со степенью согласованности между нормативным распределением и распределением испытуемых (в последнем приш ли к согласию в 13 из 28 стимулов), так как последние цифры - только побочные продукты отдельно взяты х стимулов, которые не были наугад отобраны из всех возможных стимулов. Намного важнее рассмотреть, где модель иерархических особенностей отличается от модели “степени соответствия”. Случаи, где распределение КС было согла­ совано, а распределение испытуемых не было (строки 2 1 ,2 7 , и в небольшой степени 12) могут быть приписаны значениям КС, вычисленным со стан­ дартным отклонением в б см. Это привело к появлению выборки (181,169, 175) (выборка В, строка 17), которая имеет диапазон 12 см, при самом м а­ леньком значении КС, когда “идеальны й” (то есть, наиболее репрезентатив­ ный) диапазон в оценках испытуемых был несколько меньшим - от 8 до 10 см. Так к ак мы никак не можем, на основе имеющ ихся данных, установить стан­ дартное отклонение субъективного распределения роста, становится непо­ нятно, к ак поступить с этим несоответствием. Другой вид несоответствия, к которому относятся строки 4, б, 9, и с 1417, происходит, потому что модель КС, а не иерархическая модель, предус­ матривает компенсацию. Другими словами, если некоторая выборка имеет “недостаток” (как, например, она может состоять из трех идентичны х на­ блюдений, или представлять только половину ф ункции совокупности), ис­ пытуемые считаю т, что она менее репрезентативна, чем любая выборка без недостатка, но модель КС рассматривает такж е факторы , которые находят­ ся ниж е в иерархической модели. К ак я упомянула выш е, иерархический характер предложенной модели процесса должен быть расценен как при­ ближение, поэтому рассматриваемое несоответствие является скорее несо­ ответствием степени, чем вида. Другие измерения степени соответствия вычислены статистиками. То, что они не приш ли к согласию, указы вает, что свойство, которое они наме­ реваю тся изм ерять, не ясно и не точно определено. Х отя у опытного статис­ тика интуиция бсГлее развита, чем у неподготовленного испытуемого, они оба могут пы таться искать одно и то ж е базовое понятие. До настоящ его вре­ мени, даж е усилия статистиков в этом направлении не увенчались большим успехом. Р о л ь р а з м е р а в о ц ен к е в ы б о р к и Некоторые характеристики выборок соответствуют некоторым параметрам совокупности; эти характеристики называю тся статистикой выборки. К ним обычно применялась эвристика репрезентативности, когда репрезентатив­ 100 РЕПРЕЗЕНТАТИВНОСТЬ ность эквивалентна подобию или приближенности статистики выборки к соответствующим параметрам популяции. Я назову это первичным смыс­ лом репрезентативности. Но выборки могут быть описаны в терминах про­ цедуры , посредством которой они такж е были получены. Н апример, выбор­ к а мож ет быть осуществлена с возвращ ением или без; из известной сово­ купности или неизвестной; и т. д . Возможно, к ним такж е могло прим енять­ ся понятие репрезентативности. Таким образом, люди могут (и имеется к у ­ рьезное свидетельство, что это так) оценивать выборку, взятую наугад, как менее репрезентативную , чем стратифицированную выборку, или ж е боль­ ш ую вы борку, к а к более репрезентативную , чем маленькую (B ar-H illel, 1980b). Я назову это вторичным смыслом репрезентативности. Так к ак это касается методов осущ ествления выборки, а не последующей статистики выборок, репрезентативность во вторичном смысле отраж ает ож идания от­ носительно репрезентативности в первичном смысле. Другими словами, чтобы оценить большую выборку к ак более репрезентативную , чем малень­ кую , стоит ож идать, что ее “сущ ественные особенности” или “сущ ествен­ ные свойства” лучш е отразят “существенные особенности” или “существен­ ные свойства” совокупности, до того, к ак будет сказано, каковы они на са­ мом деле. Экспериментальные проблемы, которые я опишу в последней главе, были посвящ ены рассмотрению вторичного смысла репрезентативности, по от­ ношению к размеру выборки. Проблема 1: Две фирмы, специализирующиеся в изучении общественного мнения, про­ водят наблюдение с целью определения пропорции избирателей, намеревающихся про­ голосовать положительно на некоем референдуме. Фирма А рассматривает выборку из 4 0 0 человек. Фирма В рассматривает выборку из 1 .0 0 0 человек. В чьей оценке Вы были бы более уверены? Фирмы А ___ Фирмы В ______ Приблизительно поровну______ Эта задача и два ее варианта (в которы х, соответственно, была добавлена инф орм ация, что полны й размер рассмотренного общ ества был 8. 000 и 50.000 соответственно), была предоставлена 7 2 испытуемым. Более чем 80% из них были больше уверены в достоверности большей выборки, по сравне­ нию только с 4% , отдавш им предпочтение меньш ей выборке. Если просто сделать вывод о том, что чем больш е вы борка, тем более репрезентативной она каж ется (то есть, ож идается, что она будет более точ­ ной или надеж ной), то эти результаты были бы слиш ком тривиальны , что­ бы о них говорить. Вовсе не размер выборки сам по себе определяет ее репре­ зентативность, а скорее что-то более близкое к отношению между размером выборки и размером совокупности. Если рассматриваемые выборки, взяты и з одной и той ж е совокупности, линейно связаны , то они будут одинаково распределены. Если размер совокупности изменяется такж е, как и размер выборки, различие становится очевидным. Рассмотрим следующую задачу: Изучение репрезентативности 101 Задача 2: Две фирмы, специализирующиеся в изучении общественного мнения, прово­ дят наблюдение с целью определения пропорции избирателей, намеревающихся про­ голосовать положительно на некоем референдуме каждая в своем городе. Фирма А работает в городе, где 1 миллион избирателей. Фирма В работает в городе, где 50. 000 избирателей. Обе фирмы формируют выборку, выбирая одного человека из кажды х 1 .0 0 0 избирате­ лей. В чьей оценке Вы были бы более уверены?_______ Здесь, хотя фирма А имеет выборку из 1 .0 0 0 человек, а Ф ирма В только из 50, процент испытуемых, которые вы разили больше уверенности в досто­ верности большей выборки, понизился до 50% , тогда к ак 29% указали рав­ ную уверенность относительно обеих выборок. В другой группе испытуемых, которым сказали, что обе фирмы сделали выборку 1. 000 человек (нежели чем 1 из каж дой 1 .0 0 0 ), 9% проявили одинаковую уверенность в достовер­ ности обеих выборок, по сравнению с 62% , которые были более уверены в выборке людей, голосовавш их в меньш ем городе. П ояснительные тексты, составленные испытуемым, подтвердили то, что они рассматривали пропор­ циональные размеры выборок, к ак и абсолютные размеры. Иногда отношение “выборка-совокупность” является действительно важ ­ ным для оценивания выборки - например, когда формирование выборки сделано без возвращ ения и особенно, когда выборка представляет собой до­ статочно большую часть совокупности. Однако если формирование выбор­ ки сделано с возвращ ением (то есть, совокупность бесконечно велика), или если в выборку берется только м алая часть большой совокупности (которая отраж ает совокупность, для всех прагматических целей), тогда рассмотре­ ние относительного размера теряет смысл наряду с рассмотрением абсолют­ ного размера. Задача 3: Даны два закрытых сосуда. В обоих - смесь красных и зеленых бусинок. Ко­ личество бусинок различно в двух сосудах - в маленьком 10 бусинок, а в большом - 1 0 0 бусинок. Процент красных и зеленых бусинок один и тот же в обоих сосудах. Выборка осуществляется следующим образом: Вы вслепую достаете бусинку из сосуда, запоми­ наете ее цвет и возвращаете на место. Вы перемешиваете бусинки, снова достаете всле­ пую, и снова запоминаете цвет. В общем, Вы тянете бусинку из маленького сосуда 9 раз, а из большого - 1 5 раз. Как Вы думаете, в каком случае у Вас больше возможностей угадать преобладающий цвет? Так к ак процедура формирования выборки, описанная в задаче 3 - с воз­ вращением, то число бусинок в этих двух сосудах с нормативной точки зрения абсолютно не важно. Испытуемые в своих выборах должны были однозначно обратить внимание на большую выборку в 15 бусинок. Вместо этого, 72 из 110 испытуемых выбрали меньшую выборку из 9 бусинок. Это можно объяснить только тем, что отношение размера выборки к размеру совокупности - 90% в последнем случае и только 15% в первом. Другие результаты, к которым при­ ш ла Бар-Х иллел (Bar-Hillel, 1979), подтверждают этот ж е вывод. Таким образом, согласно статистике выборок, если кандидаты на роль “основных свойств“ неизвестны, эту роль может принять на себя размер 102 РЕПРЕЗЕНТАТИВНОСТЬ вы борки. Люди понимают, что размер - важное свойство выборок. Почему ж е они не в состоянии перенести это понимание на первичный смысл репре­ зентативности? Другими словами, если люди полагают, что большие выбор­ ки будут более репрезентативны по отношению к совокупности, из которой они получены, чем меньш ие, почему они не в состоянии оценить некоторые ненормативные результаты (например, пропорция выборки 60% , взятой из популяции, характеризую щ ейся 50% пропорциональностью ) к ак менее вероятны е в больш их, а не в меньш их выборках? Возможно оценка того, что некоторы й результат формирования выбор­ ки является менее вероятным в больш их вы борках, зависит от восприятия его к а к нерепрезентативного. С нормативной точки зрения, только та вы ­ борка является “точной”, среднее значение которой идентично среднему зна­ чению совокупности. Все другие неточны, хотя несколько точнее, чем дру­ гие. С психологической точки зрения, результаты формирования выборок могут быть оценены к ак репрезентативные, даж е если они отклоняю тся по некоторым параметрам от параметров совокупности. Возможно, значение 60% не воспринимается к ак нерепрезентативное и поэтому не вы зывает у испытуемых вторичного чувства репрезентативности. Чтобы проверить эту возможность, я дала испытуемым несколько вари­ антов проблемы рождаемости согласно Канеману и Тверскому (1972b, 3) Некоторый город обслуживается двумя больницами. В большей больнице каждый день рождается приблизительно 45 младенцев, а в меньшей больнице, приблизительно 15 младенцев. Как Вы знаете, приблизительно 50% всех младенцев - мальчики. Точный процент младенцев-мальчиков, однако, изменяется каждый день. Иногда он может быть выше, чем 50% , иногда ниже. В течение 1 года, каждая больница делала учет дней, на которые приходится (больше / меньше) 60% рожденных младенцев-мальчиков. Какая больница, как Вы думаете, сде­ лала запись большего количества таких дней? (1972b, с. 443) В отдельных задачах, выполняемы х отдельными группами, пропорция мальчиков бы ла изменена с 60% до 70% , 80% и 100% . В таблице 2 показа­ но влияние этого изменения на распределение ответов испытуемых. В торая колонка точно повторяет, и в задаче, и в результатах, версию Канем ана и Тверского. Но заметьте, что, к ак только пропорция мальчиков превы ш ает 70% , модальным ответом становится “меньш ая больница”, что является правильны м ответом. А когда сказано, что все младенцы - маль­ чи ки , “м еньш ая больница” является даж е ответом у больш инства. Соглас­ но другому набору задач, пропорция была меньш е чем 60% , 70% или 80% . В этом случае везде был модальный ответ “одинаково”. Эти результаты говорят о том, что, как только результат формирования выборок воспринят к ак нерепрезентативный, размер выборки будет играть надлеж ащ ую роль в оценке выборки лю дьми, возможно, потому что мень­ ш ий размер более совместим с нерепрезентативны ми результатам и, чем больш ий. Однако если результат формирования нельзя назвать нерепрезен­ тативным, люди не принимают во внимание размер выборки. Размеры, боль­ Изучение репрезентативности 103 ше чем 70% , каж ется, закодированы к ак нерепрезентативные. Размеры 50% и вклю чительно - нет. Таблица 2. Пропорция тестируемых, выполнявших задачу о рождаемос­ ти (различные варианты). более 80% " 100% * 1 1 более 70% ь более 60% * большая 24% 20% 25% 26% 19% меньш ая 20% 20% 43% 42% 54% одинаково 56% 60% 60% 32% 27% 50 40 28 27 41 N м енее 60% * м енее 70% 6 м енее 80% ь большая 20% 31% 29% меньш ая 24% 28% 25% одинаково 56% 41% 46% 45 29 28 N аКанеман и Тверски ь ранее неопубликованные данные, Бар-Х иллер сиз Бар-Х иллер (1979). Здесь, больш ая и м аленькая больницы по 15 и 5 м ла­ денцев, соответственно Обсуждение В этой главе представлены выводы о трех исследованиях оценок субъектив­ ной вероятности, которы е рассматриваю т понятие репрезентативности. Однако каж дое и з них касается его в разной мере. Первое исследование - это прям ая демонстрация того, что оценки подобия и вероятности связаны . В отличие от многих других задач, которые проверя­ ли эту гипотезу (см., напр., Kanem an & Tversky, 19726,3; 1973,4), в данном случае испытуемых нельзя обвинить ни в неспособности учитывать другие соображения (или, хотя бы очевидные или простые), ни в том, что они прида­ ют слиш ком большое значение ошибочным или нерелевантным соображени­ ям. Кстати, исклю чая подсчет вероятности, которую их просили оценить, испытуемым ничего не оставалось, к ак использовать ту стратегию, которой они пользовались. Это иногда уменьшает показательную силу. Если учиты­ вать и другие результаты, можно увидеть, насколько непреодолимыми мо­ гут быть соображения подобия - даж е простого визуального типа - при оце­ нивании сложных событий, путем подсчетов или концептуально. До исследования характерны х свойств выборок, тесты репрезентативно­ сти изначально рассматривали совокупности с одним параметром или при­ знаком с одним измерением. Это позволило сформировать непосредствен­ ное и априорное оценивание стимулов по подобию, не вы зы вая необходимо­ сти в независимы х оценках, полученных экспериментальным путем. (Как бы там ни было, некоторые “очевидные” признаки позж е были подвергну­ ты сомнению (см., напр., Olson, 1976)). Но когда стимулы усложняю тся, отнош ения подобия между ним и становятся менее очевидными, так к ак многие признаки влияю т на общую оценку. В этом исследовании использо­ валась установленная к тому времени корреляция между вероятностью и репрезентативностью , чтобы показать, к ак последняя определяется в вы ­ борках, характеризую щ ихся более чем одним признаком. Часто лучш им способом обнаружить, насколько подобны два стимула, является прямо спросить о подобии. Это немного проблематично, если необ­ ходимо узнать, насколько выборка S репрезентативна совокупности Р. Одна­ ко полезно уметь оценить это косвенно, например, спросив, насколько веро­ ятно то, что выборка S взята из совокупности Р. Второе исследование в этой главе показы вает жизнеспособность этого подхода, давая описание того, ка­ кие свойства выборок делают их репрезентативными в некотором контексте. Н аконец, в третьем исследовании подчеркивается важное различие м еж ­ ду репрезентативностью выборки и репрезентативностью результата фор­ мирования выборки. В первичном смысле, репрезентативность - это оцен­ к а , которая приписывается результатам формирования выборки. Другими словами, чтобы оценить, насколько выборка репрезентативна популяции в этом смысле, долж ны быть известны характеристики обеих. Таким обра­ зом, имеет смысл оценивать репрезентативность выборки из 15 новорож­ денны х, 9 из которых м альчики, им ея перед глазами общее распределение пола среди новорожденных (известную пропорцию мальчиков). Нет смыс­ ла оценивать репрезентативность этой выборки, если пропорция мальчи­ ков ни в выборке, ни в популяции не известна. Но существует и другой смысл репрезентативности, который сделает значимой такж е и вторую оценку. В этом смысле, выборки более репрезентативны, если их оцениваю т как бо­ лее вероятные в первом смысле. Другими словами, независимо от средней величины совокупности и до того к ак становится известна средняя величи­ на вы борки, вы борка из 45 новорожденных более репрезентативна (во вто­ ром смысле), чем выборка из 15, потому что она с большей вероятностью будет напоминать популяцию , если станет известна в ней пропорция м аль­ чиков. Следовательно, в выборке из 45 мож ет оказаться 65% м альчиков, а в выборке и з 15 - 53 % . Но если четко различать эти два смы сла, путаницы не возникнет. В третьем исследовании показано, что люди реагирую т на размер выбор­ к и , когда делают вторичные оценки репрезентативности, даж е если они ч а­ сто не видят подтекст, который обычно бывает у первичных и стандартных оценок репрезентативности. 6. Оценки репрезентативности и на основе репрезентативности* Амос Тверски иДаниелъ Канеман Н есколько лет назад, мы представили анализ принятия реш ений в услови­ ях неопределенности, который связал субъективные вероятности и интуи­ тивные прогнозирования по поводу ож иданий и впечатлений о репрезента­ тивности. В эту концепцию вклю чили две различные гипотезы: (i) люди ож и­ дают, что выборки будут подобными своей родительской совокупности, а такж е отобразят случайность процесса формирования выборки (Tversky & K ahnem an, 1971, 2; 1974,1); (ii) люди часто полагаю тся на репрезентатив­ ность к а к на эври сти ку д л я суж дения и прогнозирования (T versky & K ahnem an, 1972b, 3; 1973, 4). П ервая гипотеза была выдвинута для объяснения общего м нения, что случайные процессы самокорректирую тся, то есть наблюдается преувели­ ченная вера в стабильность исходов, наблюдаемых в м алы х выборках, про­ игрыш ей в казино и связанны е с этим предубеждения относительно оценок случайности. Мы предположили, что околонаучная концепция случая сти­ мулирует веру в закон малых чисел, согласно которому даже небольшие выборки являю тся высоко репрезентативными по отношению к их роди­ тельским совокупностям (Tversky & K ahnem an, 1971,2). Подобная гипоте­ за могла такж е объяснить общую тенденцию к преувеличению непротиво­ речивости и прогнозированной ценности черт характера личности (M ischei, 1979) и слиш ком высокому оцениванию корреляции между подобными пе­ ременными (см. Главу 15) и типами поведения (Shweder и D’A ndrad, 1980). Люди, каж ется, верят в голограммоподобную модель личности, в которой лю бой а к т п о в ед е н и я п р е д с т а в л я е т и сти н н ы й х а р а к т е р ч ел о в е к а (K ahnem an,& Tversky 1973, 4). Гипотеза, согласно которой люди ожидаю т, что выборки будут высоко репрезентативны по отношению к их родительской совокупности, концеп­ *Эта работа была поддержана Службой Военно-морских Исследований согласно Контракту N00014-79-C-0077 с Университетом Стэнфорда. туально независима от другой гипотезы , согласно которой люди часто ис­ пользую т эвристику репрезентативности, чтобы предсказывать и оценивать вероятности. То есть они часто оцениваю т вероятность неопределенного со­ бы тия или выборки «степенью, в которой они (i) подобны в существенных свойствах своей родительской совокупности и (ii) отражаю т существенные особенности процесса, который послуж ил основанием для их возникнове­ н и я” (K ahnem an & Tversky, 1972b, с. 431, 3). Эта гипотеза изучалась в не­ скольких контекстах, вклю чая интуитивные статистические оценки и про­ гнозирование выбора профессии (K ahnem an & Tversky, 1972b, 3; 1973,4). Обе гипотезы репрезентативности использовались для объяснения раз­ нообразия наблюдений, таких к ак относительная неэффективность инфор­ мации консенсуса и использования подобия в интерпретации проективных тестов (N isbett и Ross, 1980). Эти гипотезы такж е определили направление поиска существенных наруш ений нормативных правил в интуитивных суж ­ дениях, что дало хорошие результаты. Больш ая часть этого исследования касалась оценок, сделанных на основе репрезентативности, то есть роли реп­ резентативности в прогнозировании и при составлении заклю чений. Отно­ сительно мало работ было посвящено оценкам репрезентативности, то есть характеру этого отнош ения и его показателей, вне контекста случайного осущ ествления выборки (B ar-H illel, 1980b). П ервая глава этой части книги описывает природу репрезентативности, а такж е условия, в которы х кон­ цепция репрезентативности позволяет объяснить интуитивны е прогнозы и оценки вероятности. Во второй главе мы проиллюстрируем различие м еж ­ ду логикой репрезентативности и логикой вероятности в оценке вероятнос­ ти слож ны х событий. Отношение репрезентативности Репрезентативность - это соотношение между процессом или моделью М и некоторым случаем или событием X , связанны м с этой моделью. Репрезен­ тативность, к ак и подобие, может быть определена опытным путем, напри­ мер, если попросить людей оценить, какое из двух событий, Х 1или Х2, яв­ ляется более репрезентативным по отношению к некоторой модели М, или является ли событие X более репрезентативным по отношению к Mt или М2. Рассм атриваемая модель могла относится к человеку, монете или мировой экономике, а соответствующие исходы могли быть описанием, последова­ тельностью вы падения орлов и реш ек или ценой н а золото. Репрезентативность - направленное соотношение: мы говорим, что вы ­ борка более или менее репрезентативна по отношению к отдельно взятой совокупности, и что действие является репрезентативным по отношению к человеку. Мы обычно не говорим, что совокупность репрезентативна по от­ ношению к выборке, или что человек репрезентативен по отношению к дей­ ствию. В некоторых задачах, однако, можно полностью изменить роли мо­ дели и исхода. Н апример, можно оценивать, репрезентативен ли человек Оценки репрезентативности и на основе... 107 стереотипу библиотекаря или репрезентативно ли занятие библиотекаря этому человеку. Мы различаем четыре основных случая, для реш ения которых обычно используется концепция репрезентативности. 1. М — класс, а X — значение переменной, определенной в этом классе. Именно в этом смысле мы говорим о (более или менее) репрезентативных раз­ мерах дохода профессора колледжа или возрасте вступления в брак в какойлибо культуре. Естественно, наиболее репрезентативная величина будет близ­ ка к средней, медиане или способу распределения соответствующей перемен­ ной в классе М. Отношение репрезентативности, главным образом, определе­ но в этом случае так, что испытуемый знает распределение частоты соответ­ ствующей переменной. 2. М — класс, а X — частный случай этого класса. Больш инство чита­ телей, вероятно, согласится, что Джон А пдайк — более репрезентативный американский писатель, чем Норман М айлер (N orm an M ailer). Конечно, та­ кое суждение не основано на частоте; оно отраж ает степень, в которой сти­ ли, темы и идеи этих авторов являю тся центральными в современной аме­ риканской литературе. Подобные соображения определяют репрезентатив­ ность случаев, которые сами скорее являю тся классами, чем частными слу­ чаям и. Например, дрозд считается более типичной птицей, чем курица, хотя он встречается реже (Rosh, 1978; Sm ith, Shoben и R ips, 1974). Таким обра­ зом, событие репрезентативно по отношению к категории, если оно имеет сущ ественные особенности, которыми обладают элементы этой категории, и если у него отсутствуют отличительные черты , которых нет у членов этой категории (Rosh, 1975; Tversky, 1977). Современные разработки в области формирования концепции (Rosh & M ervis, 1975; M ervis & Rosh, 1981), семантической пам яти (B ransford & F ranks, 1971) и распознавания образов (P osner& K eele, 1968) показали, что наиболее репрезентативные, или прототипные, элементы категории лучш е запоминаю тся, легче вспоминаю тся и распознаю тся, чем элементы, кото­ рые являю тся более часты ми, но менее репрезентативными. Кроме того, люди часто допускают ош ибку, “распознавая” прототипный стимул, кото­ рый никогда не демонстрировался. Поэтому репрезентативность может сме­ щ ать пам ять распознавания, а такж е оценки частоты. Надо заметить, что существуют два способа, с помощью которых элемент может быть высоко репрезентативен по отношению к классу. Два смысла репрезентативности близко соответствуют отнош ениям типичности и про­ тотипичности . Элемент высоко репрезентативен по отношению к категории, если он типичен или модален; он может такж е быть репрезентативен, если он является идеальным типом, который воплощ ает сущность категории. Например, Нью-Йорк является прототипом американского города, в то вре­ мя как Ц инциннати можно выбрать как типичный город. Точно так ж е наши понятия о прототипе и типичной француженке различаются. Первая — веро­ 108 РЕПРЕЗЕНТАТИВНОСТЬ ятно молодая, и зящ н ая париж анка, в то время к ак вторая будет полной ж енщ иной средних лет из провинции. 3. М — класс, а X — подкласс М. Больш инство людей, вероятно, согла­ сится, что население Ф лориды менее репрезентативно по отношению к аме­ риканском у населению, чем население ш тата И ллинойс, и что студенты, изучаю щ ие астрономию, являю тся менее репрезентативными по отнош е­ нию ко всему студенчеству, чем студенты, изучаю щ ие психологию. К рите­ рии репрезентативности различны для подкласса и для отдельного события, потому что событие м ож ет давать представление о главной тенденции свойств, в то врем я к ак , подкласс мож ет такж е представлять диапазон и изменчивость. Человек, чей рост, вес, возраст и доход соответствует сред­ ним величинам для американского населения, репрезентативен по отноше­ нию к этой совокупности. Группа из 100 человек с одними и теми ж е харак­ теристиками не смогла бы представлять изменчивость признаков. Если класс М состоит из таких отдельных групп, что изменчивость в пре­ делах каж дой группы является очень маленькой относительно изменчиво­ сти между группами, мы рассматриваем каж дую группу скорее к ак пред­ ставителя категории, чем как подкласс. Таким образом, естественно рас­ сматривать “дрозда” к ак вид птиц или к ак частны й случай категории “пти­ ц а”, хотя множество “дрозды” является подклассом класса птиц. В общем смысле (2) может рассматриваться к ак частны й случай (3), где подкласс X состоит из одного члена. Точно так ж е (1) может расцениваться к ак вариант (2) с одним изм ерением . Три типа репрезентативности различаю тся по слож ности X , где (1) — одноэлементное событие с единственным призна­ ком , (2) — одноэлементное событие с множеством признаков и (3) — много­ элементное событие с одним или более признаком. Особенно важ ны й пример репрезентативности подкласса имеет место, когда X является случайной выборкой из указанной совокупности. Случай­ н ая выборка долж на представлять случайность процесса выбора, а не толь­ ко сущ ественные особенности совокупности, из которой она взята. Когда 100 человек отобраны наугад, например, выборка из 53 муж чин и 47 ж ен ­ щ ин мож ет показаться более репрезентативной, чем выборка из 50 муж чин и 50 ж енщ ин, потому что первая представляет неравномерность формиро­ вания выборки, в то время к ак последняя— нет (Tversky & K ahnem an, 1972b, 3). С татистическая концепция репрезентативной вы борки исследована Крускалом (K ruskal) и М остеллером (M osteller) (1979а, 1979b). 4. М — (причинная) система, а X — (возможное) последствие. Этот случай отличается от предшествующих, тем, что М больше не является клас­ сом объектов или случаев, а скорее системой, которая порождает различ­ ные эффекты . Н апример, М может представлять экономику США, а X — степень инф ляции, или М может представлять человека, а X действие, вы ­ полненное М, например, развод, самоубийство, выбор профессии. Здесь, X репрезентативно по отношению к М, или потому что оно часто связано с М (например, вы сокая температура обычно сопровождает пневмонию) или Оценки репрезентативности и на основе... 109 потому что люди верят, правильно или неправильно, что М — это причина X (например, вы сш ая мера наказания предотвращ ает похищ ения людей). Тверски и Канеман (1980,8) проиллю стрировали и исследовали вклю чение причинных схем в оценки условных вероятностей. Подводя итоги, отношение репрезентативности может быть определено для (1) величины и распределения, (2) события и категории, (3) выборки и совокупности (4) причины и следствия. Во всех четырех случаях, репрезен­ тативность вы раж ает степень соответствия между X и М, но ее показатели не одинаковы в этих четырех случаях. В случае (1) на репрезентативность влияет каж ущ аяся относительная частота или статистическая связь. В слу­ чаях (2) и (3) репрезентативность определена прежде всего подобием, напри­ мер, одного случая другим, или статистик выборок соответствующим пара­ метрам совокупности. Н аконец, в случае (4) репрезентативность определя­ ется в значительной степени причинны ми убеждениями (валидными или нет). Репрезент ат ивност ь и вероятность Использование репрезентативности для объяснения оценок вероятности и интуитивны х прогнозов опирается на предположения о том, что: 1. Отношение “X — (очен ь,..., нисколько не) репрезентативно М” мо­ ж ет осмысленно оцениваться испытуемыми. 2. Эти оценки не должны основываться на впечатлениях от вероятно­ сти или частоты, которые долж ны быть объяснены репрезентативнос­ тью. 3. Отношение репрезентативности имеет собственную логику, которая систематически отклоняется от логики вероятности. Когда эти допущ ения принимаю тся во внимание, становится интересно про­ верить, опосредованы ли оценки вероятности оценками репрезентативнос­ ти. Оценка вероятности неопределенного события или прогноза неизвестно­ го числа — сложный процесс, которы й вклю чает интерпретацию пробле­ мы, поиск необходимой информации и выбор соответствующего ответа. Это можно сравнить с действием гибкой компью терной программы, которая включает множество потенциально полезных подпрограмм. В терминах этой аналогии, эвристика репрезентативности — одна из процедур, которые мо­ гут использоваться, чтобы восстановить, интерпретировать и оценить ин­ формацию. Использование этой эвристики, конечно, не препятствует ис­ пользованию других процедур, так ж е как использование образов к ак эври­ стики для припоминания не препятствует использованию других страте­ гий. Однако уверенность в эвристике приводит к характерны м предубежде­ ниям. Н апример, когда используются образы, чтобы вспомнить людей, при­ сутствовавш их на определенной встрече, ож идается, что легче будет вспом­ 110 РЕПРЕЗЕНТАТИВНОСТЬ нить тех участников, которые находились в непосредственной видимости, чем тех, кого не было хорошо видно. Точно так ж е использование репрезен­ тативности для оценки субъективной вероятности приводит к переоценке одних вероятностей и недооценке других. Ранние исследования дали основание для крайней гипотезы, согласно ко­ торой некоторые оценки вероятности основаны исключительно на репрезен­ тативности. Например, наблюдение, что субъективные выборочные распре­ деления по существу не зависят от размера выборки (Tversky & K ahnem an, 1972b, 3), привело к предположению, что люди оценивают вероятность вы ­ борки по подобию ее статистик соответствующим параметрам совокупности. Больш инство доступных данных, однако, подтверждают более умеренную гипотезу, согласно которой интуитивные прогнозы и оценки вероятности под­ вержены влиянию репрезентативности, хотя полностью от нее не зависят. Таким образом, на субъективные вероятности оказывают существенное вли­ яние (нормативно) незначимые факторы, которые затрагиваю т репрезента­ тивность и они относительно независимы от (нормативно) значимых перемен­ ны х, которые не влияю т на репрезентативность. Важность предубеждений репрезентативности и влияние таких переменных к ак размер выборки, дос­ товерность, и базовое значение зависит от характера задачи, плана экспери­ мента, опыта респондентов и наличия подсказок или других характеристик. Роль этих факторов в исследовании суждения обсуждается далее. Если уверенность в репрезентативности приводит к систематическим ош ибкам, почему люди используют его к ак основание для прогнозов и оце­ нок? Ответ н а этот вопрос можно разделить на три части. Во-первых, репре­ зентативность каж ется легко доступной и легкой для оценки. Современное исследование категоризации (M ervis & R osh, 1981; Rosh, 1978) полагает, что понятия часто организую тся и обрабатываются в терминах прототипов или репрезентативных примеров. Следовательно, нам легче оценить репре­ зентативность события по отношению к классу, чем оценить его условную вероятность. Во-вторых, вероятные события обычно более репрезентатив­ ны , чем менее вероятные. Н апример, выборка, подобная совокупности, бо­ лее вероятна, чем нетипичная выборка того ж е размера. В-третьих, мнение, что выборки вообще репрезентативны по отношению к их родительским со­ вокупностям, приводит к тому, что люди переоценивают корреляцию м еж ­ ду частотой и репрезентативностью или между статистической связью и коннотативным подобием. Таким образом, репрезентативность использует­ ся, потому что (i) она доступна, (ii) она часто связана с вероятностью и (Ш) люди переоцениваю т эту связь. Уверенность в репрезентативности, однако, ведет к предсказуемым ош ибкам суж дения, потому что репрезентативность имеет собственную логику, которая отличается от логики вероятности. Различие меж ду репрезентативностью и вероятностью в большей степе­ ни очевидно (i), когда представлены недостоверные данные или (ii), когда контрольное событие специфично. В случае (i), исход, который является высоко репрезентативным по отношению к наш ей модели, может быть м а­ Оценки репрезентативности и на основе... 111 ловероятным, если наш а мы сленная модель основана на данных ограничен­ ной валидности. Рассмотрим, например, вероятность того, что к а н д и д а т , который произвел превосходное впечатление во время собеседования, пре­ успеет в очень трудной задаче. П оскольку известно, что впечатления от со­ беседования часто ошибочны, а успех или неудача на работе определяется многочисленными ф акторами, которые не возможно предугадать в краткой беседе, успех может быть маловероятен даж е, когда он высоко репрезента­ тивен по отношению к наш ему впечатлению о кандидате. В случае (И) репрезентативный результат может быть маловероятным, потому что он крайне специфичен или детален. Вообще, событие может быть маловероятным либо потому, что оно нетипично, либо потому, что оно очень детализировано. Вес менее 135 фунтов является нетипичным для человека средних лет; а вес 157,625 фунтов является типичным, но слиш ком точно определенным. Действительно, последнее значение более репрезентативно для человека средних лет, хотя первое намного более вероятно. И з этого примера следует, что увеличение определенности вообще не ведет к умень­ шению репрезентативности. Следовательно, сравнение событий, которые отличаю тся по степени точности, часто создает конф ликт между репрезен­ тативностью и вероятностью . Н апример, случайная вы борка из четырех карт, состоящ их из короля червей, туза пик, девятки бубен и четверки треф, каж ется более репрезентативной, чем вы борка, состоящ ая из четы рех карт одной масти, хотя последняя гораздо 5олее вероятна. Таким образом, пре­ дубеждения репрезентативности в суж дениях вероятности долж ны быть наиболее очевидными в оценке событий, которые являю тся репрезентатив­ ными, но крайне специфическими. Такие предубеждения представлены в исследованиях оценок вероятности слож ны х событий, описанных в следу­ ющей главе. Об о ц ен к е сл о ж н ы х со б ы ти й Существенное различие между вероятностью и репрезентативностью воз­ никает при оценке слож ны х событий. П редположим, что нам дали некото­ рую информацию о человеке (например, краткое описание личности) и что мы размы ш ляем о различны х признаках или комбинациях признаков, ко­ торыми этот человек мож ет обладать: род занятий, склонности или полити­ ческие симпатии. Один из основных законов вероятности гласит, что деталь­ ность может только понизить вероятность. Таким образом, вероятность того, что данный человек является и республиканцем и художником одновремен­ но, долж на быть меньш е, чем вероятность того, что человек является ху­ дожником. Это условие основано не только на стандартном исчислении ве­ роятности, но такж е и на ненормативных моделях (например, S hafer, 1976; Zadeh, 1978). Однако, требование, что Р(А и В) < Р(В), которое можно назы вать прави­ лом конъю нкции, не относится к подобию или репрезентативности. Синий 112 РЕПРЕЗЕНТАТИВНОСТЬ квадрат, например, мож ет быть более подобен синему кругу, чем просто кругу, и человек может походить на наш образ республиканца и художни­ к а больш е, чем на наш образ республиканца. П оскольку подобие объекта цели мож ет быть увеличено, если добавить к цели особенности, которыми обладает и объект (см. Tversky, 1977), подобие или репрезентативность мо­ гут быть увеличены путем специф икации цели. Если оценки вероятности опосредованы репрезентативностью или подобием, то возможно строить за­ дачи, где соединение исходов окаж ется более репрезентативным и, следо­ вательно, более вероятным, чем один из его компонентов. Эффект конъюнкции: исследование 1 Этот способ прогнозирования был впервые исследован в эксперименте, про­ веденном в И ерусалиме в 1974. Мы раздали 184 испытуемым четыре крат­ ки х описания личности. Каждое описание соответствовало стереотипу от­ дельно взятой профессии (например, водитель такси) и резко отличалось от стереотипа отдельно взятой политической партии (например, лейбористы), или наоборот. Следовательно, каж дое описание (X) было репрезентативно по отношению к одной цели, обозначенной А, и нетипичным для другой цели, обозначенной В. Каждое описание сопровождалось списком из пяти или ш ести целевы х событий: занятие, политические симпатии или конъ­ ю нкцией событий, например, водитель такси, которы й является членом партии лейбористов. Д ля каж дого описания, половина испытуемых полу­ чила список, где была к ак цель А, так и цель В, в то время к ак другая поло­ вина получила список, вклю чаю щ ий сложную цель (А и В). Оставшиеся четы ре цели были идентичны в двух списках. Половину испытуемых по­ просили оценить цели согласно «степени, в которой X репрезентативен по отношению к соответствующему классу», а другая половина оценивала их согласно «вероятности того, что X является элементом соответствующего класса». С труктура исследован ия п озволи ла провести косвенное сравнение репрезентативности и вероятности для события В и сложного события (А и В) относительно четы рех постоянных альтернатив. Бы ли получены следу­ ющ ие результаты . Во-первых, было оценено, что все четы ре описания более репрезентативны по отношению к сложной цели (А и В), чем только к цели В. Во-вторых, упорядочение репрезентативности и вероятности каж дого набора целей было почти идентично во всех случаях; средняя корреляция меж ду средними значениями бы ла 0.96. В частности, сложной цели (А и В) было приписано значительно более высокое среднее значение в упорядоче­ нии вероятности, чем простой цели В. Очевидно, уверенность в эвристике репрезентативности привела к тому, что испытуемые оценивали конъю нк­ тивное событие к ак более вероятное, чем один из его компонентов, вопреки правилу конъю нкции в теории вероятности. Назовем этот вид оценок эф­ фектом конъю нкции. Оценки репрезентативности и на основе... 113 И сследование 2: Б и л л и Л инда П оскольку стимульный м атериал, используемый в ранних исследованиях, был крайне специфичен для израильской культуры , мы построили англий­ скую версию задач и провели аналогичное исследование с несколькими су­ щественными изменениями. Во-первых, мы сравнили результаты межгруп­ пового плана (в котором каж ды й испытуемый сравнивал либо сложную цель (А и В), либо простую цель В с тем ж е самым набором альтернатив) с резуль­ татами внутригруппового плана, в котором каж ды й респондент сравнивал непосредственно две критических цели. Мы выдвинули гипотезу, что пра­ вило конъю нкции не действует в первом упомянутом исследовании, к ак в нашем исследовании, но мы ож идали, что частота наруш ений значительно уменьш ится в последнем проекте, где участников просили сравнить Р(А) с Р(А и В). Во-вторых, мы ож идали, что даж е ограниченный опыт испытуе­ мых в области статистики не допустит многих наруш ений правила конъ­ ю нкции, по крайней мере, при внутригрупповом плане. Чтобы исследовать эти гипотезы, мы провели прямое и косвенное исследо­ вание с тем ж е самым стимульным материалом. Аналогичные исследования были проведены в трех группах испытуемых, которые обладали различным опытом в области статистики. П ервая группа испытуемых состояла из сту­ дентов старш их курсов Университета Британской Колумбии и Стэндфордского университета, не обладающих подготовкой в теории вероятности или статистике. Промежуточная группа состояла из аспирантов в области психо­ логии и педагогики и студентов-медиков из Стэндфордского университета, которые прошли курсы по статистике и были ознакомлены с основными кон­ цепциями теории вероятности. Третья группа состояла из аспирантов в обла­ сти принятия решений Бизнес-ш колы Стэнфорда, каж ды й из которых про­ шел курсы повышенной сложности по теории вероятности и статистике. Бы ли составлены два кратких описания личности. Каждому участнику был предоставлен один из этих набросков при прямом исследовании, а дру­ гой при косвенном исследовании. В первом тесте, описание личности сопро­ вождалось восьмью возможными исходами, вклю чая репрезентативны й исход, нерепрезентативный исход и конъю нкцию этих двух. При косвен­ ном исследовании список исходов вклю чал либо два отдельных критичес­ ких исхода, либо их конъю нкцию . Образец для этих двух задач при прямом исследовании приведен ниж е. Ч исла в круглы х скобках — средние значе­ ния, приписанные испытуемыми различны м исходам. Биллу 34 года. Он умен, но лишен воображения, обязателен, но в общем скучный. В школе он был силен в математике, но слаб в общественных и гуманитарных дисципли­ нах. Пожалуйста, упорядочите следующие утверждения по их вероятности, присвоив наи­ более вероятному утверждению 1 и наименее вероятному 8. (4.1) Билл — терапевт, хобби которого — игра в покер. (4.8) Билл — архитектор. 114 РЕПРЕЗЕНТАТИВНОСТЬ (1.1) Билл — бухгалтер. (А) (6.2) Хобби Билла — играть дж аз. (J) (5.7) Хобби Билла — серфинг. (5.3) Билл — репортер. (3.6) Билл — бухгалтер, хобби которого — играть дж аз. (A&J) (5.4) Хобби Билла — альпинизм. Линде 31 год, не замужем, искренняя и очень яркая натура. Она увлекается философи­ ей. Будучи студенткой, интересовалась проблемами дискриминации и правосудия, а такж е участвовала в антиядерных демонстрациях. П ожалуйста, упорядочите следующие утверждения по их вероятности, присвоив наи­ более вероятному утверждению 1 и наименее вероятному 8. (5.2) Линда — преподаватель в начальной школе. (3.3) Линда работает в книжном магазине и занимается йогой. (2.1) Линда — активист феминистского движения. (F) (3.1) Линда — психиатр. (5.4) Линды — член Лиги женщин-избирателей. (6.2) Линды — кассир в банке. (Т) (6.4) Линды — страховой агент. (4.1) Линда — кассир в банке и активист феминистского движения. (T&F) К ак читатель, вероятно, догадался, описание Билла было построено таким образом, чтобы быть репрезентативным по отношению к бухгалтеру (А) и нетипичны м по отношению к человеку, чье хобби — дж аз (J). Описание Линды было построено таким образом, чтобы быть репрезентативным по от­ ношению к активной феминистке (F) и нетипичным для кассира в банке (Т). В соответствии с психологическим и принципам и подобия (Tversky, 1977), мы ож идали, что вероятности слож ны х целей, такие как бухгалтер, которы й играет дж аз (В&J ) и кассир в банке, являю щ аяся активисткой ф е­ министского движ ения (T&F), попадали бы между вероятностями соответ­ ствую щ их простых целей. Чтобы проверить этот прогноз, мы попросили первую группу из 88 ис­ пы туемых, упорядочить эти восемь целей «по степени, в которой Билл (Лин­ да) подобен типичному элементу соответствующего класса». Распределения подобия подтвердили наш и гипотезы относительно описаний. Д оля испы ­ туемы х, которые показали прогнозированный порядок для Билла (А > А и J > J ), составила 87% ; процент испы туемы х, показавш их прогнозирован­ ны й порядок для Линды (F > Т и F> Т), был 85% . Все участники получили описание либо Билла, либо Линды в форме, со­ ставленной для внутригруппового плана, и упорядочили эти восемь целей согласно их вероятностям. Полученные данные приведены в верхней части Таблицы 1, где в строке «эффект конъю нкции (% )» приведен процент ис­ пы туемы х в каж дой группе, которые оценили сложную цель к ак более реп­ резентативную , чем простую цель. Строки “А и В” и “В” представляю т, со­ ответственно, средние ранги, приписанные сложной и менее репрезентатив­ ной простой целям . Средний ранг подобия и средний ранг вероятности при внутригрупповом плане отраж ены на Рисунке 1. Оценки репрезентативности и на основе... 115 Таблица 1. Эффект конъюнкции. Группа 1 Группа 2 Группа 3 "Наивные it испытуемые' Испытуемые с промежуточными знаниями в области статистики Опытные в области статистики испытуемые Линда Билл Линда Билл Линда Билл 89 92 90 86 85 83 Средний ранг: А и В 4.2 3.6 3.9 3.5 4.0 3.4 Средний р а н г В 6.3 6.4 6.2 6.4 6.1 5.6 N 88 94 53 56 32 32 Средний р а н г А и В 3.3 2.3 2.9 2.4 3.1 2.5 Средний ранг. В 4.4 4.5 3.9 4.2 4.3 4.6 N 86 88 55 56 32 32 Внутригрупповой план Эф ф ект конъю нкции (% ) М ежгрупповой план П ри межгрупповом плане, две версии каж дой проблемы были построе­ ны путем удаления из списка либо сложной цели, либо двух простых целей. Краткое описание личности, указания и оставш иеся пять целей были точно таким и ж е, к ак для внутригруппового плана. Результаты опроса по м еж ­ групповому плану для всех групп испы туемы х представлены в ниж ней части Таблицы 1. Результаты , сведенные в Таблицу 1, показы ваю т, что слож ная цель была оценена к а к более вероятная, чем простая критическая цель, к ак в проекте 1, так и 2. Этот результат, сохраняется к ак для двух описаний, так и для всех групп. К наш ему удивлению , опыт в статистике имел незначительное влияние н а эффект конъю нкции, что показали более чем 80% испытуемых во всех трех группах. В предыдущ их исследованиях критические цели были представлены в большем количестве возможных исходов, которые могли скры ть отнош е­ ние вклю чения между ними. Поэтому интересно вы яснить, наруш аю т ли люди правило конъю нкции даже тогда, когда логическое соотношение меж ­ ду целям и довольно очевидно. Чтобы проверить эту гипотезу, мы предоста­ вили новой группе испытуемых (не имею щ их опыта в области статистики) описания Б илла и Линды. Каждому испытуемому было дано одно из двух 116 РЕПРЕЗЕНТАТИВНОСТЬ Рис. 1 График средних оценок для восьми результатов, оцененных по вероятности и по подобию для двух описаний. описаний, и его спросили, к а к а я из двух критических целей (то есть, J и (А и J ), или Т и (Т и F)) более вероятна. Эта процедура не уменьш ила эффект конъю нкции: в случае Билла слож ная цель была выбрана 92% испытуе­ мы х (N = 88) и 87% испытуемых (N = 86) в случае Линды. Общее игнорирование правила конъю нкции ставит перед нами интри­ гую щ ий вопрос относительно его нормативной достоверности. Чтобы ис­ следовать этот вопрос, мы опросили 36 аспирантов промежуточной груп­ пы , которы е участвовали в эксперименте. Их спросили, (1) к ак они упоря­ дочили две критических категории, (2) почему они так сделали, и (3) рас­ смотреть утверж дение, что “вероятность того, что Билл одновременно яв ­ ляется бухгалтером и играет дж аз, не мож ет превы ш ать вероятности того, что он играет дж аз, потому что каж ды й член первой категории — всегда является членом последней”. Больш е чем две трети испытуемых (1) сказа­ ли, что они выбрали сложную цель, (2) дали некую версию аргумента подо­ бия или типичности как причины и (3) согласились, после некоторого раз­ м ы ш ления, что их ответ был неправильны м, потому что он расходиться с правилом конъю нкции. Только двое испытуемых утверж дали, что упоря­ дочение вероятности не должно согласовываться с принадлежностью клас­ су, и только один сказал, что он не так понял вопрос. Х отя опрос, склонил испы туемы х в пользу правила конъю нкции, результаты показы ваю т, что испытуемые третьей группы (с опытом в области статистики), по крайней мере, расцениваю т наруш ение этого правила к ак печальную ошибку. И нтерпретируя невыполнение правила конъю нкции, важ но рассмот­ реть, относится ли эффект, полностью либо частично, к лингвистическим конвенциям или диалоговым правилам. Н апример, в раннем исследовании мы предоставили людям следующее описание, “Джон — 27 лет, является неординарной личностью. В колледж е он был выдаю щ имся атлетом, но не Оценки репрезентативности и на основе... 117 демонстрировал способностей или интереса к интеллектуальным вопросам”. Мы обнаружили, что Джон, по оценкам испытуемых, более вероятно, я в ­ ляется “преподавателем гим настики”, чем просто “преподавателем”. Хотя каж ды й преподаватель гимнастики, в некотором смысле, преподаватель, можно поспорить, что термин преподаватель понимается здесь в смысле, который исклю чает значение преподавателя гимнастики или инструктора автош колы. При таком планировании этой проблемы удалось избеж ать, определив критический исход экстенсивно к ак пересечение двух множеств, например, бухгалтеров и дж азовы х музыкантов-лю бителей. Н аруш ения правила конъю нкции такж е наблюдаются и в задачах на последовательность, где цель состоит из последовательности событий. Словик, Ф иш хофф и Лихтенш тейн (Slovic, Fischhoff, L ichtenstein, 1976) пре­ доставили испытуемым краткое описание личности человека, подходящ е­ го под стереотип инж енера, а не ж урналиста. И х испытуемые приписали более низкую вероятность тому, что “Том В. выберет ж урналистику к ак ос­ новную специальность в колледж е”, чем тому, что “Том В. выберет ж урна­ листику к ак основную специальность в колледж е, но скоро разочаруется в своем выборе и переклю чится на технические науки”. Строго говоря, пер­ вый случай вклю чает последний, и выш еупомянутое суждение наруш ает правило конъю нкции. Однако относительно этого примера можно возразить, что, согласно нормативным правилам разговора, утверждение, что Том В. выбрал ж урналистику к ак основную специальность в колледж е, подразу­ мевает, что он такж е остался на этой специальности. И наче, это утверж де­ ние ввело бы в заблуждение. Подобные возраж ения могут такж е возникнуть относительно примеров Билла и Линды. Таким образом, можно поспорить, что испытуемые счита­ ют, например, категорию “кассир в банке” к ак “кассир в банке, не прини­ маю щ ая участия в феминистском движ ении” в отличие от данной катего­ рии “кассир в банке, которая является активисткой в феминистском дви­ ж ении”. Однако, наличие эф ф екта конъю нкции при межгрупповом плане, в котором критические цели не сравниваю тся непосредственно, указы вает, что этот эффект нельзя адекватно объяснить в терминах переформулиров­ ки категорий цели, согласно стандартны м диалоговым импликативны м формам. Скорее, наблюдаемые оценки показы ваю т общую тенденцию оце­ нивать вероятности соответствующих событий степенью, в которой Линда репрезентативна по отношению к типичным или прототипичным членам соответствующих категорий. Кроме того, мы наблюдали эффект конъю нкции в нескольких задачах, в которы х, отсутствовали диалоговые импликативны е формы. Следующие задачи, например, касаю тся прогнозирования будущих событий, где интер­ претация В к ак (В и “не А ”) каж ется невероятной. 118 РЕПРЕЗЕНТАТИВНОСТЬ И сследование 3: П р о гн о зы н а 1 9 8 1 г. Задачи, описанные в этой главе, были предназначены для того, чтобы про­ верить правило конъю нкции в прогнозировании событий реальной ж изни, где испытуемые полагаю тся на свои общие знания. В исследовании этой проблемы в декабре 1980 приним ала участие группа из 93 испытуемых, которы е не имели опы та в области статистики. Группа получила следую­ щ ие инструкции. В этом анкетном опросе Вас просят оценить вероятность различных событий, которые могут произойти в течение 1981 г. Каждая задача включает четыре возможных собы­ тия. Ваша задача состоит в том, чтобы упорядочить эти события по вероятности, при­ своив 1 наиболее вероятному событию, 2 — второму, 3 — третьему и 4 — наименее веро­ ятному событию. А нкетны й опрос вклю чал ш есть вопросов. Д ва вопроса приведены ниж е. Результаты остальны х вопросов оказались подобными. Ч исла в круглы х скобках показы ваю т средние оценки для каж дого случая; мы такж е приво­ дим процент испы туемы х, которые оценили сложную цель к ак более веро­ ятную , чем простую. Теннис в 1981 г. (эффект конъюнкции: 72% ) П редположим, что Бьёрн Борг дойдет до финала в Уимблдоне в 1981. Пожалуйста, упо­ рядочьте следующ ие результаты от наиболее до наименее вероятного. (1.7) Борг выиграет матч. (2.7) Борг проиграет в первом сете. (3.5) Борг выиграет в первом сете, но проиграет матч. (2.2) Борг проиграет в первом сете, но выиграет матч. Политика США в 1981 г. (эффект конъюнкции: 68% ) П ожалуйста, упорядочьте следующие события по вероятности того, что они произой­ дут в 1981. (1.5) Рейган сократит федеральную поддержку местным органам власти. (3.3) Рейган обеспечит федеральную поддержку матерям-одиночкам. (2.7) Рейган увеличит бюджет на оборону меньше, чем на 5%. (2.9) Рейган обеспечит федеральную поддержку матерям-одиночкам и сократит федеральную поддержку местным органам власти. К ак и в предш ествующ их исследованиях, слож ная категория была оце­ нена к ак более вероятная, чем один из ее компонентов. Результат совмес­ тим с понятием репрезентативности, которая скорее касается в этом случае соотнош ения между причинно-следственной системой и ее исходами, чем подобия описания стереотипу. Во второй задаче, например, каж ется нети­ пичны м для президента Рейгана, обеспечить федеральную поддерж ку м а­ терям-одиночкам и весьма репрезентативным для него сократить федераль­ ную поддерж ку для местных органов власти. К онъю нкция этих действий оказы вается промежуточной по репрезентативности, а оценки вероятнос­ ти, очевидно, следуют тому ж е образцу. Оценки репрезентативности и на основе... 119 В первой задаче большинство испытуемых оценили победу Борга на чем­ пионате к ак наиболее вероятное событие, а проигрыш Борга в первом сете как менее вероятное. К онъю нкция этих двух событий, а именно проигрыш Борга в первом сете, но победа в матче, оценивалась к ак менее вероятная, чем первая возможность, но более вероятная, чем вторая. Очевидно, испы ­ туемые объединяли события скорее согласно принципам репрезентативно­ сти или причинно-следственного воздействия, чем согласно законам веро­ ятности. Обсуждение Результаты , о которых сообщалось в предыдущ их исследованиях, прямо подтверждают гипотезу, что люди оцениваю т вероятность событий по сте­ пени, в которой эти события репрезентативны по отношению к соответству­ ющей модели или процессу. П оскольку репрезентативность события мо­ ж ет быть увеличена за счет уточнения, слож ная цель может быть оценена как более вероятная, чем один из ее компонентов. Этот прогноз был подтвер­ жден исследованиями, использую щ ими к ак внутригрупповой, так и м еж ­ групповой план для совокупности испытуемых с различны м уровнем под­ готовки в области статистики. В отличие от других правил вероятности, таких к ак регресс к среднему, который труден для понимания испытуемыми с отсутствием опы та в облас­ ти статистики, правило конъю нкции является и простым, и легко приме­ нимым. Больш инство испытуемых проявило ж елание подтвердить его в аб­ страктной форме, хотя почти все они наруш или его на практике, когда оно находилось в противоречии с интуицией репрезентативности. Полученные результаты противоречат выводам Johnson-L aird и W ason (1977) относитель­ но проверки утверждений “если то” (см. такж е Johnson-L aird, Legrenzi и Sonino-Legrenzi, 1972). Эти исследователи обнаружили, что большинство испытуемых потерпело неудачу в заданиях с абстрактным материалом, а не в конкретны х примерах. С другой стороны, наш и испытуемые подтвер­ дили правило конъю нкции в абстрактной форме, но наруш или его в конк­ ретных примерах (см. Главу 34). Вывод о том, что конъю нкция часто каж ется более вероятной, чем один из ее компонентов, может иметь далеко идущ ие последствия. Н ет причин полагать, что суж дения политических аналитиков, присяж ны х заседате­ лей, судей и врачей независимы от эффекта конъю нкции. Этот эффект, ве­ роятно, особенно негативно проявит себя при попы тках дать прогноз отно­ сительно будущего, оценивая вероятности отдельно взяты х сценариев. Слов­ но смотря в хрустальны й ш ар, политические деятели, футурологи, а такж е обыватели ищ ут образ того будущего, которое лучш е всего представляет их модель развития настоящ его. Этот поиск ведет к построению детальны х сценариев, которы е являю тся внутренне последовательны ми и вы соко репрезентативны ми по отношению к наш ей модели мира. Такие сценарии 120 РЕПРЕЗЕНТАТИВНОСТЬ часто оказы ваю тся менее вероятными, чем менее детальные прогнозы, ко­ торые ф актически являю тся более вероятными. С увеличением детализа­ ции сценария, его вероятность мож ет только устойчиво уменьш аться, но его репрезентативность, и, следовательно, его очевидная вероятность, мо­ ж ет увеличиваться. Уверенность в репрезентативности, по наш ему мнению, является первичной причиной безосновательного предпочтения детальных сценариев и иллюзорного смысла интуиции, который часто обеспечивают такие конструкции. П утаница между суждениями вероятности и подобия имеет место не толь­ ко при прогнозировании неопределенного будущего, но такж е и при рекон­ струкции неопределенного прошлого, например, в истории или крим иналь­ ны х расследованиях. Здесь такж е, перечень прош лы х событий часто объе­ диняется в репрезентативный сценарий, который вклю чает вероятные пред­ полож ения относительно неизвестных событий. Включение таких предпо­ лож ений может только уменьш ать вероятность того, что полный перечень событий является истинным, но это обеспечивает ощущ ение репрезентатив­ ности и последовательности, которое мож ет увеличивать каж ущ ую ся веро­ ятность сценария. Например, гипотеза “обвиняемый покинул место преступ­ лен и я” мож ет казаться менее вероятной, чем гипотеза “обвиняемый, поки­ нул место преступления из страха быть обвинённым в убийстве”, хотя пос­ леднее менее вероятно, чем первое. Хороший рассказ часто менее вероятен, чем посредственный. Н аконец, важ но понять, что эффект конъю нкции — это признак более фундаментальной проблемы. Он просто обнаруживает несогласованность меж ду логикой вероятности и логикой репрезентативности, которая часто обусловливает мнения людей относительно неопределенных событий. Так к ак суждение человека неотделимо от реш ения волную щ их проблем наш ей ж и зни , конф ликт между интуитивной концепцией вероятности и логичес­ кой структурой этой концепции настоятельно требует разреш ения. С одной стороны, мы не можем с готовностью отказаться от эвристики, которую мы используем, для оценки неопределенности, потому что многое из наш их знаний о мире связано к ней. С другой стороны, мы не можем бросить вызов законам вероятности, потому что они определяют важ ны е истины нашего мира. Н равится вам это или нет, А не может быть менее вероятно чем (А и В), и уверенность в противоположном — ошибочна. Н аш а задача состоит в том, чтобы сохранить всё полезное и эффективное в интуитивном суждении при исправлении ошибок и предубеждений, к которым оно склонно. Часть III Причинность и атрибуция 7. Общепринятое положение: информация не обязательно информативна* Ричард Е. Нисбетт, Юджин Борджида, Рик Крендалл, Харви Рид К огнитивная теория, которая в настоящ ее время оказы вает самое большое влияние на социопсихологов — это теория атрибуции, формализованная версия которой бы ла представлена Гарольдом Келли (H arold Kelley) в 1967. Теория формулирует представление человека к ак ученого-лю бителя, кото­ рый делает попы тку вью ести причины явлений, которы е он наблюдает. Причины, которы е он приписывает, определяют взгляд на его социальный мир, а эта точка зрения может определять его поведение. Чрезвычайно ш и­ рокий диапазон явлений, начиная от исследования соответствия А ш а (Asch) и заканчивая работой Ш ахтера (Schächter), посвящ енной эмоциям, может быть описан к ак частный случай процесса каузальной атрибуции в действии. Ф актически, каж ется вполне возможным, что наиболее важ ны м вкладом Келли м ож ет, в конечном счете, считаться создание язы ка или карты до­ рог, с помощью которой можно описывать и искать взаимосвязи между раз­ нообразными социально-психологическими явлениями. В дополнение к своему содействию организации, Келли установил три формальных источника влияния на процесс каузальной атрибуции. В по­ пытке приписать причины событиям типа “Человек реагирует способом X на ситуацию А ”, исполнитель реагирует на три источника информации: отличительность информации (человек реагирует способом X во всех си­ туациях общего типа или только в ситуации А?); постоянство информа­ ции (человек реагирует способом X всегда, при ш ироком разнообразии об­ стоятельств или он реагирует способом X только иногда?); и согласованность информации (большинство людей реагирует способом X или реакция яв л я­ ется нехарактерной). П риписывание причины будет зависеть от ответов на каж ды й из этих вопросов. Таким образом, человек считается первичной 'Это сокращенная версия книги, которая появилась в редакции J. S. Carroll и J. W. Payne., Познание и социальное поведение. Hillsdale, N.J.: Lawrence Erlbaum Assoc., Inc, 1976. Пе­ реиздано в соответствии с разрешением. 124 ПРИЧИННОСТЬ И АТРИБУЦИЯ причиной своей реакции настолько, насколько он реагирует подобным об­ разом во всех ситуациях общего типа и настолько, насколько его реакции не демонстрирую тся другими. Ситуация считается причиной настолько, насколько реакция человека уникальна по отношению к ситуации А и настолько, насколько его реакция типична. А нализ процесса приписывания, проделанный Келли, к ак одобрялся, так и критиковался на том основании, что он банален. Нравится или нет это каче­ ство теории, к удивлению обнаруживается, что одна из ее фундаментальных аксиом не наш ла фактически никакого подтверждения в последующем ис­ следовании. Это положение о том, что люди отвечают на согласованность ин­ формации посредством локализации причины. Несмотря на теорию и здра­ вый смысл, доказано,что знание поведения других людей мало влияет на при­ писывание причин. Знание того, что реакция человека глубоко типична, к а­ ж ется, не приводит к выводу, что, скорее ситуация, чем исполнитель, явля­ ется главным причинным фактором. И наоборот, знание того, что реакция человека является уникальной, не приводит к выводу, что скорее исполни­ тель, чем ситуация является главным причинным фактором. Н иж е мы рассматриваем доказательство того, что точка зрения, согласно которой люди используют согласованность информации при создании при­ писываний, не пользуется особой поддержкой. Это доказательство касается и случаев, где исполнителем является другой человек, а такж е случаев, взя­ тых прежде всего из нашего собственного исследования, где исполнитель — это сам человек. Затем мы демонстрируем сходство между неспособностью согласованности информации повлиять на приписывание и доказательством Канемана и Тверского (1973,4) того, что информация о базовом значении не в состоянии повлиять на прогнозы. Мы предлагаем объяснения двух неудач в терминах относительного влияния абстрактной (согласованность, базовое значение) информации против конкретной (исполнителя или связанной с целью) информации. Наконец, мы используем различие между абстрактной и конкретной информацией при вопросах общения и убеждения. С о гл ас о в а н н о с ть и н ф о р м а ц и и и в о с п р и я т и е д р у ги х л ю д ей Существуют два исследования, которые изучаю т влияние согласованности информации на предсказание поведения других людей. Оба исследования показы ваю т заметную слабость согласованности инф ормации. Первое из них — исследование Л .З . М акАртур (L.Z.M cA rthur) (1972). Ее исследова­ нием было прямое тестирование предположений Келли относительно эффек­ тов влияни я отличительности, постоянства и согласованности на каузаль­ ную атрибуцию. Испытуемым давали короткие описания типа “человек ре­ агирует на стимул способом X ” и дополнительно давалась информация по величинам относительно отличительности, постоянства и согласованности. Н апример, испытуемым могли сказать: “Во время танца Ральф наступал на Общепринятое положение... 125 ноги Д ж оан”, и не указать дополнительно, что Ральф наступает на ноги по­ чти всех девуш ек (или не наступает на ноги девуш кам), или что Ральф по­ чти всегда (или никогда не) наступает н а ноги Д ж оан, и что почти все (или никто) не наступаю т на ноги Джоан. Затем испытуемых спросили, являлся ли случай наступания на ноги ошибкой Ральф а, ошибкой Джоан или вино­ ваты обстоятельства. Испытуемых такж е попросили предсказать обобще­ ние реакции (насколько вероятно, что Ральф должен посоветовать Джоан записаться в танцевальны й клуб?) и обобщения стимула (насколько веро­ ятно, что Ральф наступал н а ноги на ледяном тротуаре?). Отличительность информация составила 10% разницы в причинно-след­ ственном приписывании (подводящем итог по всем причинам) и 63% раз­ ницы в ож иданиях относительно обобщения стимула. Постоянство инфор­ мации составило 20% разницы в причинно-следственных приписы ваниях и 14% разницы в ож иданиях относительно обобщения реакции. Н апротив, согласованность информации Составила меньше 3% разницы в любом из трех видов вывода. Эти результаты наруш аю т не только здравы й смысл те­ ории приписы вания, но и здравый смысл вообще. Х отя испытуемые пола­ гают, что важ но знать, наступает ли Ральф на ноги большинству девуш ек и наступает ли он обычно на ноги Д ж оан, для них совершенно не важ но, на­ ступают ли на ноги Джоан другие люди! Здравый смысл приписы вания или любой другой его разновидности так ­ же наруш ается в другом исследовании, касаю щ имся восприятия других людей. М иллер, Гиллен, Ш енкери Редлав (M iller, G illen, Schenker, Radlove, 1973) попросили студентов колледж а прочитать раздел классического ис­ следования М илграма (M ilgram , 1963), в котором изучается повиновение. Половине испытуемых дали ф актические данные исследования М илграма, показываю щ ие, что практически ко всем испытуемым был применён элек­ трошок значительной силы, а к большинству был применён электрош ок м ак­ симальной силы . Других ж е испытуемых уверили, что такое поведение бу­ дет редким. Затем всех испытуемых попросили оценить двух человек, к которым был применён электрош ок максимальной силы . По 11 признакам с большой нагрузкой на оценочный компонент, например, привлекатель­ ность, доброжелательность, агрессивность. Только на одну из этих 11 оце­ нок согласованность информации имела существенное влияние. Знание того, что применения электрош ока максимальной силы было модальным пове­ дением, ф актически не повлияло на оценки людей, перенесш их максималь­ ный ш ок. Согласованность информации и самовосприятие Согласованность информации такж е имеет небольшое влияние на атрибу­ ции, сделанные относительно самого человека. Бем (Bern, 1967) предложил, а Келли (K elley, 1967) ввел в теорию атрибуции понятие того, что люди про­ изводят причинно-следственный анализ своего собственного поведения в 126 ПРИЧИННОСТЬ И АТРИБУЦИЯ полном соответствии с их приписыванием относительно поведения других людей. Они наблюдают их реакцию , принимая во внимание ситуации, в которы х она протекает, и делают выводы относительно их чувств и моти­ вов. Н апример, испытуемый в классическом эксперименте Ш ахтера и Зин­ гера (S chächter и Singer, 1962), который знает, что ему был введен препа­ рат, который возбуждает эмоции и затем смоделирована ситуация, вы зы ­ ваю щ ая сильны е эмоции, проводит своего рода причинно-следственный анализ. Он чувствует признаки пробуждения эмоций, которые обычно он мож ет приписать эмоциональному воздействию ситуации, но вместо этого приписывает их препарату, который он принял. В результате он проявляет в поведении меньш е признаков эмоций, чем испытуемые, которые не зна­ ли, что им был введен такой препарат, и даж е чем контрольная группа ис­ пы туемых, которым препарат, возбуждаю щ ий эмоции, не был введен вооб­ щ е. Значит, испытуемый воспринимает причину своих автономных реак­ ций к ак “внешнюю” по отношению к себе и ведет себя соответственно. Н есколько лет назад, мы начали программу терапевтических вмеш а­ тельств, основанных на точке зрения, что людей можно заставить искать причину их реакций во внеш ней среде. П редполагалось, что всякий раз, когда человек реагирует неадекватно или патологически, можно добиться определённого результата, убедив человека приписать его реакции чему-то внеш нему по отношению к себе. Первое исследование, единственное успеш ­ ное, было проведено Стормсом и Нисбеттом (Storm s и N isbett, 1970). Иссле­ дуемой патологией бы ла бессонница. Мы попросили студентов, у которых были проблемы с засыпанием, за 15 минут перед сном принимать пилюлю (на самом деле «пустыш ку»), которая, к ак им сказали, ускоряла сердцеби­ ение, делала ды хание быстрым и нерегулярны м, обладала согревающим эффектом и приводила тело в общее состояние тревожности. Это - конечно признаки бессонницы. К ак оказалось, испытуемые, принимавш ие эти пи­ лю ли, к ак сообщалось, засыпали быстрее, в те ночи, когда они их принима­ ли, чем когда не принимали, и быстрее, чем контрольная группа испытуе­ м ы х, которые не принимали никаких пилю ль. Сторме и Нисбетт приш ли к выводу, что один или оба процесса приписы вания могут объяснить резуль­ таты . Бессонница вы звана в значительной степени состоянием эмоциональ­ ного возбуждения в ночное время, за счет любого количества причин, вклю ­ ч ая беспокойство относительно личны х проблем, неудобного реж им а дня или хронического невроза. П оскольку человек леж ит в кровати в состоя­ нии эмоционального возбуждения, его сон вклю чает мысли с эмоциональ­ ным содержанием. Эмоциональное возбуждение может связаться с эмоцио­ нальны м переж иванием и усиливать его. Результирующ ее усиленное эмо­ циональное состояние увеличивает эмоциональное возбуждение и так да­ лее, по замкнутому кругу. Однако этот круг может быть разорван, за счет знания того, что возбуждение является внеш ним. В этом случае человек не делал бы выводов относительно того, к ак он взволнован по поводу экзамена или насколько сердит он был на соседа по комнате и из наблюдения собствен­ Общепринятое положение... 127 ного эмоционального состояния. В те ночи, когда человек принимает пилю ­ ли, эмоциональное возбуждение воспринимается неизбежным и, таким об­ разом, не связанны м с любыми мы слями в голове. Так к ак замкнутый круг усиленного эмоционального возбуждения, таким образом, бы лразорван, сон мог наступить. А льтернативно, или дополнительно, мог бы действовать несколько дру­ гой процесс более общего плана. Н аш и страдающ ие бессонницей испытуе­ мые сообщили, что они были весьма обеспокоены тем фактом, что они стра­ дают бессонницей. Они воспринимали это как свидетельство более общей патологии и к ак нечто, плохо отражаю щ ееся на состоянии психического регулирования. Д ля испытуемого с такими переж иваниями, знание о неиз­ бежном, произведенном извне эмоциональном возбуждении должно оказать благотворное влияние. Испытуемый мог бы рассуж дать, что, по крайней мере, сегодня вечером бессонница не может считаться свидетельством об­ щей психопатологии. П оскольку подобное беспокойство частично являет­ ся причиной бессонницы, сон должен наступать быстрее в ночи, когда при­ менялись пилю ли. П опы т ки управлят ь депрессией Вооруженные этим успехом в ситуации со страдающ ими бессонницей, мы начали попы тки изменений состояния депрессии. М етодикой во всех иссле­ дованиях бы ла м анипуляция согласованности, разработанная таким обра­ зом, чтобы перенести во внешнюю среду причину депрессивного аффекта, убеж дая испы туемы х, что она ш ироко распространена. П оскольку это со­ стояние разделяется другими людьми, само присутствие влияет на челове­ ка менее отрицательно. Должно казаться, что это состояние не определяет индивидуальны е, возможно патологические, реакции испытуемого на от­ дельно взяты е обстоятельства. С уменьш ением волнения и беспокойства относительно способности испытуемого справляться с ж изненны ми ситуа­ циями, депрессия могла бы частично уменьш иться. Исследование 1: Воскресная хандра. Многие студенты испытываю т общее ухудш ения настроения по воскресеньям. Х отя день может начинаться дос­ таточно хорошо с поздним завтраком, кофе и воскресными газетами, ощу­ щение беспокойства часто начинается днем. Необходимо много сделать на предстоящ ую неделю, слиш ком много, чтобы всерьёз подумать о воскрес­ ном пикнике, хотя не достаточно много, чтобы начать работу сию минуту. К концу дня, оказы вается, что не было ни активного отды ха, ни работы, вос­ кресные газеты , причем возможно даж е разделы о финансах и путеш естви­ ях, были тщ ательно изучены , а впереди м аячит длинный вечер утомитель­ ной учебы. К вечеру, если все склады вается плохо, к ак это часто бывает, работа идет с трудом, если идет вообще, и воцаряется хмурое настроение и неуверенность в себе. 128 ПРИЧИННОСТЬ И АТРИБУЦИЯ Мы предполож или, что, если бы это явление было общераспространен­ ны м и люди знали об этом, интенсивность воскресной хандры могла бы уменьш иться. Если бы отдельно взяты й студент знал, что комнаты в обще­ ж итии полны людей в том ж е состоянии, то его собственные отрицательные эмоции долж ны быть несколько смягчены. Вместо того чтобы подумать, что он не создан для студенческой ж изни или что у него никогда не будет серьез­ ны х отнош ений с ж енщ иной, он может просто сказать себе, что люди имеют тенденцию грустить по воскресеньям и оставить это к ак есть. Чтобы проверить это предположение, мы просили большое количество студентов мужского пола старш их курсов в Йельском университете запол­ нить несколько ш кал настроения в 16:00 и 22:00 по воскресеньям. Ш кала­ ми настроения были несколько ш кал Вессмана и Рикса (W essm an и R icks, 1966), с большим акцентом на факторе повы ш ения-сниж ения настроения. Кроме того, испытуемых попросили заполнить анкетны й лист в 22:00, от­ носительно их успеваемости и социальной активности в течение дня и ко­ личества случаев, в которы х они дали выход некоторому аффекту пониж е­ н и я настроения, например, когда они кричали или плакали. Н аконец, ис­ пытуемые брали стопку кассет с мультфильмами и оценивали их по забав­ ности. После предварительны х измерений по воскресеньям испытуемые дели­ лись на три группы , по 18 испытуемых в каж дой. Одной группе, группе кон­ троля, просто говорилось, что исследователи изучали настроение по воскре­ сеньям, и участников просили в следующее воскресенье заполнить тот ж е самый пакет материалов. Д ля другой группы, подробно был описан синд­ ром воскресной хандры , и испытуемым дали (ложную) статистику, чтобы указать, насколько ш ироко она распространена среди студентов. Испытуе­ мым говорили, что 92 % студентов Йельского университета испы ты вали по­ добное явление по крайней мере иногда, в то время к ак 65% испы ты вали его в больш инство воскресений. Третьей группе дали ту ж е самую согласо­ ванную информацию , как и второй группе, и, кроме того, дали теорию, объясняю щ ую это явление. Испытуемым сказали, что оно вызвано “кру­ ш ением эмоционального возбуж дения” по воскресеньям: нормальное эмо­ циональное возбуждение буднего дня обычно сопровождается более высо­ ким эмоциональным возбуждением в субботу; и тогда в воскресенье, наблю­ дается его резкий упадок. Этот недостаток эмоционального возбуждения часто интерпретируется как депрессия или преобразовывается в депрессию. О жидалось, что испытуемые в последних двух экспериментальны х груп­ пах дадут иное толкование своим грустным переж иваниям в воскресенье, менее приним ая их на свой счет и становясь менее подавленными по поводу своей депрессии. Если это так, они долж ны были показать уменьш ение аф ­ ф екта пониж ения настроения по ш кале с первого воскресенья на следую­ щее; уменьш ение поведения, вызванного понижением настроения, такого к ак вспы ш ки гнева или плача; увеличение успеваемости и социальной ак ­ тивности; и более высокую среднюю оценку забавности мультфильмов в те- Общепринятое положение... 129 чение второго воскресенья. Но ничего подобного не произош ло. Настроение испытуемых не улучш илось ни на один показатель по сравнению с испыту­ емыми контрольной группы. Исследование 2: Хроническая депрессия. Не слиш ком разочарованные, мы сделали попы тку подобного вмеш ательства со студентами муж ского пола старш их курсов, которые описали себя к ак имеющ их хроническую депрес­ сию. Д вадцать испытуемых были привлечены посредством рекламы в сту­ денческой газете М ичиганского университета, которая призы вала “студен­ тов муж ского пола старш их курсов, страдаю щ их депрессией, участвовать в исследовании депрессии Институтом социального исследования”. По прибытии в лабораторию, испытуемых наугад разделили на две груп­ пы. Испытуемым из контрольной группы сказали, что разработали новую ш калу настроения и что необходимо, используя ее, получать ежедневные записи настроения людей, описываю щ их себя к ак страдаю щ их от депрес­ сии. Это помогло бы оценить валидность ш калы и ее способность обнаружи­ вать изменения настроения. Испытуемым экспериментальной группы дали ту ж е самую информацию и, кроме того, сказали, что экспериментаторы находились на заклю читель­ ной стадии испы тания теории депрессии на молодых лю дях мужского пола. Теория, основанная на ф актах, по крайней мере, в частны х случаях, гласи­ ла следующее. Испытуемым сообщили, что в течение некоторого времени известно, что изменения настроения у взрослых зависит частично от при­ сутствия гонадальны х гормонов - у муж чин от тестостерона. До недавнего времени считалось парадоксальны м, однако, что дети почти никогда не ис­ пытывают депрессии. Так к ак дети имеют чрезвычайно низкий уровень всех гонад альны х гормонов, это казалось противоречием общему правилу, что гормоны вы зываю т хорошее настроение. Этот парадокс недавно был разре­ шен открытием, что лимбические доли, (эмоциональный центр мозга) в юно­ ш еские годы становится зависимым от гонадального гормона, который ре­ гулирует настроение. У большинства муж чин, переключение рассчитано та­ ким образом, чтобы соответствовать повышению уровня тестостерона, ко­ торый достигает пика приблизительно в 25 лет. У многих молодых людей, однако, переклю чение заверш ается до того, к ак «топливо», если можно так вы разиться, доступно в достаточных количествах, чтобы регулировать и з­ менения настроения. Больш ое значение придавалось тому, что испытуемый и был таким мо­ лодым человеком. Ожидалось, что м анипуляция улучш ит настроение по трем взаимосвязанны м причинам: 1. Д ля депрессии предполагалось временное ограничение. 2. Отрицательное влияние, было смещено «наружу» в смысле, что оно теперь может быть приписано скорее неудачному биологическому ин­ циденту, чем течению собственной ж изни испытуемого и какой-либо патологической неспособности справиться с этим. 130 ПРИЧИННОСТЬ И АТРИБУЦИЯ 3. О трицательный эффект и его причины наблюдались у многих дру­ гих людей, таким образом, подразумевая распространённость проблем испытуемого и его реакции на них. Всех испытуемых просили заполнять анкеты настроения Вессмана и Рикса в конце каж дого дня в течение 2-недельного периода. А нкетны й опрос так­ ж е вклю чил сообщение о том, к ак испытуемый спал в предыдущую ночь, потому что наруш ения сна — частые признаки депрессии. Н аконец, в кон­ це семестра, в котором проходило исследование, были получены средние оценки успеваемости испытуемых. Не имелось никаких различий в сообщениях о настроении испытуемых в экспериментальной группе и в группе контроля в любом пункте в течение 2-недельного периода, такж е не было различий в сообщениях о качестве сна. Не было ф актически и нам ека на какую -либо тенденцию в направлении ги ­ потезы по этим переменным. Испытуемые экспериментальной группы по­ лучили более высокие средние оценки, к ак и было спрогнозировано, но это не имело статистической значимости (0.05 < р < 0.10)... А трибуция и психология прогнозирования Канеман и Тверски продемонстрировали логическую ош ибку, которая по­ хож а на ош ибку, наблюдаемую в исследовании эффектов согласованности информации. В книге под названием “П сихология прогнозирования” (1973, 4) эти исследователи показали, что люди не принимаю т во внимание базо­ вое значение совокупности при прогнозировании категориальной принад­ леж ности целевого элемента совокупности... Если на испытуемых не влияет информация базового значения в их про­ гнозах относительно принадлежности целевого события категории, тогда едва ли вероятно, что на их приписывания, будет влиять согласованность инфор­ мации. Согласованность информации — это то ж е самое, что информация базового значения. Это информация базового значения относительно скорее поведенческих реакций, чем принадлежности категории. Приписывание, кроме того, является более сложным и непрямым выводом, чем прогнозиро­ вание. Канеман и Тверски попросили испытуемых произвести довольно пря­ мую и несложную цепь вывода: «если большинство членов популяции при­ надлеж ат некой категории, то тоже самое можно сказать и о целевых испы ­ туемых». Их испытуемые были не в состоянии сделать такой вывод. В рас­ смотренном исследовании атрибуции, требуется еще более слож ная цепь вы ­ вода: «если большинство элементов совокупности ведут себя некоторым об­ разом, то ситуация должна оказы вать сильное давление на такое поведение, и поэтому не стоит обращаться к личным отличительным особенностям, что­ бы объяснить поведение целевого испытуемого, если оно модально». Остаётся проверить, не ж елаю т ли испытуемые применять поведенчес­ кие базовые значения к прогнозированию целевых случаев. Если нет, то Общепринятое положение... 131 необходимый нам вопрос должен быть изменен от «почему люди не могут изменять свои приписывания в соответствии с согласованной информаци­ ей» на более фундаментальный «почему люди обращ аются с информацией базового значения, к ак будто она неинформативна». Исследование 5: Поведенческие базовые значения, прогнозирование и ат­ рибуция. Чтобы исследовать вопрос о ж елании людей изменять свои про­ гнозы, если им дана поведенческая информация базового значения, испы ­ туемы м бы ли описаны два п сихологических эксперим ента (N isb ett и Borgida, 1975). Студенты университета ш тата М ичиган прочитали деталь­ ные описания (а) эксперимента Нисбетта и Ш ахтера (1966), в котором ис­ пытуемых просили испы тать на себе электрош ок такой силы , какой они могли перенести и (Ь) эксперимента Д арли и Л атане (D arley и Latane, 1968), относительно оказания помощи, в котором во время того, к ак несколько студентов обсуждали проблемы управления колледжем через науш ники в отдельных кабинах, у одного из «испытуемых» начиналось что-то напоми­ нающее приступ. Эти два эксперимента были выбраны, потому что в наш ем опыте обучения, предположения студентов коллед ж а относительно поведен­ ческого базового значения были известны. Несмотря на то, что студенты склонны предполагать, что немногие испытуемые получат сильный элект­ рош ок, модальное поведение — это вытерпеть самый большой разряд, кото­ рый мож ет вы дать аппарат, то есть достаточный для того, чтобы заставить всю руку испытуемого непреднамеренно дергаться. И хотя студенты пред­ полагаю т, что большинство людей быстро покинуло бы свои кабины , чтобы помочь в ситуации приступа, типичный испытуемый никогда ничего не де­ лает, чтобы помочь ж ертве в опыте, проведенном Латаном и Дарли с шес­ тью испытуемыми. П оскольку испытуемые не знали об истинных поведенческих основных значениях, было возможно дать некоторым из испытуемых ф актическое базовое значение этих двух экспериментов, и, таким образом, создать диф­ ференциальные условия базовой информации. Испытуемым со знанием ба­ зовой пропорции (условие согласованности информации) показали краткие видеосъемки интервью со студентами, описанными к ак испытуемые в пер­ воначальны х экспериментах (или в одном варианте условия согласованно­ сти информации, испытуемым показали краткие письменные описания био­ графии и личности студентов). Затем испытуемых из группы согласованно­ сти информации попросили предсказать, к ак целевые субъекты, о которых они просмотрели видеозапись или прочитали, вели бы себя. Поэтому мож ­ но сравнить прогнозы испытуемых группы согласованности информации, как с ф актической информацией базового значения, которой они обладали, так и с предположениями относительно базового значения, сделанными ис­ пытуемыми, при отсутствии согласованности информации. Н а Рисунке 1 показаны результаты эксперимента с электрошоком. Верх­ н яя гистограмма показы вает ф актические данные базового значения, пре­ 132 ПРИЧИННОСТЬ И АТРИБУЦИЯ доставленные испытуемым из группы согласованности информации. Вто­ рая гистограмма даёт оценки базового значения, составленные испытуемы­ ми без знания базового значения. Очевидно, что оценки испытуемых этой группы весьма отличаю тся от ф актических данных. Они приняли получе­ ние умеренного количества электрош ока к ак модальное поведение. Третья гистограмма представляет предположения испытуемых группы согласован­ ности информации относительно поведения целевых субъектов, о которых они просмотрели видеоматериал или прочитали. Х отя испытуемые были полностью осведомлены о базовом значении, может быть замечено, что рас­ пределение даж е отдаленно не походит н а фактическое базовое значение. Вместо этого, распределение подобно распределению базового значения, сделанного группой испытуемых, без знания базового значения. Результа­ ты эксперимента об оказании помощи были полностью подобны. Этот эксперимент дал возможность проверить другую гипотезу, предло­ женную Тверским и Канеманом (1971, 2) в статье под названием «Вера в закон м алы х чисел», где эти авторы доказы вали, что даж е ученые уделяю т мало вним ания размеру выборки и склонны делать необоснованные выво­ ды относительно совокупности исходя из знания о небольшом количестве случаев. Чтобы проверить эту точку зрения в данном контексте, некоторым испытуемым не сообщили о базовых значениях в обоих экспериментах и показали им краткие видеоинтервью с двумя испытуемыми из каж дого эк ­ сперимента. Испытуемым со знанием целевой информации сказали, что испытуемые в обоих экспериментах вели себя наиболее экстремальным об­ разом, то есть, что оба испытуемых в эксперименте с электрош оком приня­ ли максимально возможный удар током, и оба испытуемых в эксперименте об оказании помощ и так и не помогли жертве. Затем испытуемых со знани­ ем целевой информации попросили указать, каково, по их мнению, будет распределение всей совокупности испытуемых в экспериментах. В обоих экспериментах, испытуемые были склонны сделать вывод, что образ дей­ ствий совокупности будет идентичен поведению двух испытуемых, которых они видели. В ниж ней гистограмме на Рисунке 1 можно увидеть, что оцен­ ки базового значения в эксперименте с электрош оком были подобны истин­ ному базовому значению. Оценки не были настолько подобны для экспери­ мента с оказанием помощи, но они были довольно приближ ены к J -образной кривой базовой пропорции. Испытуемые были склонны делать вывод, что образ действия совокуп­ ности был подобен поведению двух рассмотренных ими случаев, и когда процедура формирования выборки была неопределенна, и когда их вним а­ ние неоднократно привлекалось к тому ф акту, что эти два случая были ото­ браны наугад из ш ляпы , содержащ ей имена всех испытуемых. Подведем итог, испытуемые не использовали информацию базового зна­ чения, когда их попросили, сделать прогноз относительно поведения целе­ вы х субъектов. Важно заметить что, помимо вопросов прогнозирования, было задано несколько вопросов по атрибуции, например, влияли ли обсто- Общепринятое положение... 133 Эксперимент с электрошоком Информация базового значения, данная испытуемым при наличии согласованности информации Оценки базового значения, дан­ ные испытуемыми при отсутст­ вии согласованности информации Прогнозы относительно целевых (в) испытуемых, данные испытуемы­ ми при наличии согласованности информации Оценки базового значения, дан(F ) ные испытуемыми при наличии целевой информации 1. Отказались или остановились после применения стандартного разряда 2. Дошли до ощущения пощипыва­ ния в пальцах 3. Дошли до подергивания в руках 4. Дошли до судорожного подерги­ вания предплечья 5. Дошли до разряда, заставивше­ го всю руку подернуться Рис. 1. Базовое значение, оценки базового значения и прогнозы о це­ левы х испытуемых в эксперименте с электрош оком. ятельства или личны е склонности на поведение данного человека. Согласо­ ванность информации не имела существенного влияния на вопросы атри­ буции. П оследняя ош ибка каж ется ф актически неизбежной при наличии предыдущ ей ош ибки. Поэтому, вопрос относительно того, почему люди дол­ ж ны игнорировать согласованность информации в создании атрибуций, дол­ ж ен быть сокращ ен до более фундаментального вопроса относительно того, почему инф ормация базового значения долж на игнорироваться даж е для такого простого вывода к ак прогнозирование. Любой ответ на этот фунда­ ментальны й вопрос относительно неспособности людей, извлечь информа­ цию из информации базового значения в идеале должен одновременно от­ носиться и к другому главному выводу в данном исследовании. Этот вывод состоит в том, что испытуемые, в действительности, “чрезмерно” пресыщ е­ ны информацией целевого случая, они склонны принять то, что эсктремальное поведение является модальным, если говориться, что только два испы ­ туемых вели себя наиболее экстремальным способом. 134 ПРИЧИННОСТЬ И АТРИБУЦИЯ А бстрактная инф орм ация против конкретной информации К анеман и Тверски (1 9 7 3 ,4 ) не разм ы ш ляли о причинах того, почему лю­ дям не удается использовать информацию базового значения. И х основное объяснение сосредотачивается на идее, что люди просто не очень хорошо умеют обращ аться с вероятностными данными. Д аж е в сфере азартны х игр, где люди имею т, по крайней мере, некоторое элементарное представление о том, к а к обращ аться с вероятностями, они могут проявлять примечатель­ ную слепоту и предубеждения. Вне таких ситуаций люди могут быть абсо­ лютно не в состоянии увидеть необходимость такой “простой” вероятност­ ной информации к ак базовое значение. И ли, непонимание того, к ак долж ­ ным образом комбинировать информацию базового значения с информаци­ ей целевого случая, ведет к тому, что люди просто игнорирую т информа­ цию базового значения в целом. И меется, конечно, значительная доля правды в точке зрения, что люди не умеют работать с вероятностной информацией. Ф актически, сущ ествует единственное исключение в литературе приписывания из правила, что люди игнорирую т согласованность информации. Это — ясное свидетельство ис­ пользования базового значения успехов и неудач при создании приписы ва­ ний относительно способностей отдельно взятого человека (W einer и дру­ гие, 1971). Если большинство людей терпит неудачу в отдельно взятой зада­ че, то целью человека воспринимается приобретение больш их способнос­ тей; если люди преуспевают, то целью воспринимается приобретение более н изких способностей. Конечно, на протяж ении всей ж изни мы приобрета­ ем опыт относительно поведения других людей. Способность, ф актически, является по определению выводом, полученным из базового значения. Н ам каж ется, однако, что может такж е действовать другой принцип. По своей природе базовое значение или согласованность информации расплы в­ чата, незначительна и абстрактна. Н апротив, инф ормация целевого случая яр к а, значительна и конкретна. В исследовании депрессии, мы делали по­ пы тку противопоставить воспоминания о довольно сухой, статистической информации и ж ивую , настойчивую реакцию на стимулы реального мира. В изучении дегустации крекера согласованность, абстрагированная от ин­ ф ормации об уровне ж идкости в буты лках, была противопоставлена чув­ ственному впечатлению . В исследовании с электрош оком и об оказании по­ мощ и, данные о частоте были противопоставлены видеосвидетельству или письменному описанию реально существующего человека с родителями, планам и относительно карьеры , увлечениями и индивидуальными особен­ ностями. Н есмотря на логическую уместность информации базового значе­ н и я, она всё-таки не будет значительной для продолж ения познавательного процесса. Эта гипотеза не нова. В 1927 году Бертран Рассел (B ertrand R ussell) пред­ полож ил, что «общ епринятая индукция зависит от эмоционального инте­ реса случаев, но не от их числа» (стр. 269). В экспериментах, проведенных Общепринятое положение... 135 Канеманом и Тверски, а такж е в исследованиях, проведенных нами и дру­ гими относительно эффектов согласованности информации, простое пред­ ставление количества случаев было противопоставлено случаям эмоцио­ нального интереса. Согласуясь с гипотезой Рассела, эмоциональный инте­ рес в каж дом случае брал верх. Мы предполагаем, что конкретная эмоционально интересная информа­ ция обладает большим потенциалом делать выводы из-за подобия «сцена­ риев», вы зываю щ их данную информацию , или схем, вовлекаю щ их подоб­ ную информацию . И вывод далее следует по хорошо изученным строкам предыдущего сценария. А бстрактная информация менее богата потенци­ альными связям и с ассоциативной сетью, посредством которой можно дос­ тичь сценариев. В соответствии с этим предположением, Нисбетт и Боргида (N isbett и B orgida, 1975) обнаружили, что согласованность информации от­ носительно поведения других людей в экспериментах с электрош оком и об оказании помощ и, не только не повлияла на предсказание испытуемых о том, к ак бы они себя вели, находясь в подобных условиях, но и не была ни разу упомянута в последующем опросе, почему они сделали такие предска­ зания. Вместо этого испытуемые заострили внимание на определённых де­ талях экспериментальной ситуации и соотнесли их с похожими ситуация­ ми из своего жизненного опыта. «Уверен, я бы помог парню, потому что у меня был друг, ч ья сестра болела эпилепсией». Гипотеза Рассела имеет несколько вс ж ны х посылок к действию в повсед­ невной ж изни. В качестве иллю страции рассмотрим простой пример. Пред­ положим, Вам необходимо купить новую маш ину, и в целях экономии и долговечности Вы реш или приобрести одну из таких солидных ш ведских маш ин среднего класса, к ак Volvo или Saab. Будучи осторожным покупате­ лем, Вы идёте в службу потребителей, которая сообщает Вам, что по ре­ зультатам экспертны х исследований Volvo превосходит по механическим параметрам, а обыватели отмечают более высокую износоустойчивость. Во­ оружённый информацией, Вы реш аете обратиться к дилеру фирмы Volvo до конца недели. М ежду тем н а одной из вечеринок Вы рассказы ваете зна­ комому о своём намерении, его реакция заставляет Вас задуматься: «Volvo! Должно быть ты ш утиш ь. У моего ш урина бы ла Volvo. Сначала замыслова­ тая компью терная ш тука, обеспечивающ ая заправку топливом, вы ш ла из строя. 250 баксов. Затем у него начались проблемы с задним мостом. При­ ш лось его заменить. Потом трансмиссия и сцепление. Через три года прода­ ли на запчасти». Логический статус этой информации таков, что количе­ ство из нескольких сот обывателей, владею щ их Volvo из службы потреби­ телей, возросло на единицу и что средняя частота осущ ествления ремонта понизилась на йоту по трём или четырём измерениям. Однако, каж ды й, кто утверж дает, что он не примет во внимание мнение случайного собеседника, либо не искренен, либо совершенно себя не знает. 136 ПРИЧИННОСТЬ И АТРИБУЦИЯ Исследование 6. Подверженность влиянию абстрактной информации про­ тив конкретной информации. К аж ется, необходимо воплотить на практи­ к е мы сленны й эксперимент Службы Потребителей (B orgida и N isb ett, 1977). Так к ак наш ими испытуемыми были студенты-психологи Универ­ ситета ш тата М ичиган, мы избрали курсы по психологии в университете в качестве потребительского товара. Бы ли выбраны десять лекционны х кур­ сов высш его уровня по психологии, различаю щ иеся заявленным качеством. Группа студентов младш их курсов, планирую щ их выбрать психологию как свою специализацию , была встречена в кабинете экспериментатором. Он сообщил студентам, что является членом комиссии ф акультета, которая заним ается проблемами долговременного планирования работы отделения. Одна из проблем касается определения того, сколько студентов выберет тот или иной курс в будущем. Д ля того чтобы определить будущее распределе­ ние студентов по курсам, испытуемых просили заполнить эксперименталь­ ное расписание и отразить их планы в области психологии на старш их кур­ сах. Испытуемых контрольной группы контроля просили посмотреть на учеб­ ны й план (в действительности имитацию , состоящую из 27 курсов, исклю ­ ч ая лабораторные занятия, занятия по статистике) и поставить галочку р я­ дом с 5 -1 0 курсами, которые они хотят слуш ать, и обвести круж ком помет­ к и для курсов, на которые они точно запиш утся. Двум экспериментальны м группам сообщили, что с целью облегчения их выбора им дадут дополнительную информацию относительно лекцион­ ны х курсов, которые выбирают большинство студентов. Д ля обеих групп эта инф ормация состояла из детального описания, более понятного, чем ан ­ нотация в учебном плане, содерж ания и структуры каж дого из десяти кур­ сов. Затем для испытуемых одной экспериментальной группы организова­ ли беседу со студентами старш их курсов. Эти студенты коротко охаракте­ ризовали каж ды й из десяти курсов, которы е они прослуш али. От одного до четы рёх, человек обычно два или три, характеризовали каж ды й курс. К аж ­ дая характеристика начиналась с оценки, включающие следующие пять тер­ минов: «отлично», «оченьхорош о», «хорошо», «удовлетворительно», «пло­ хо» . Вот один из примеров: Хотя курс включает большое количество материала, которое нужно пройти, он очень хорошо изложен. Вы имеете представление, о своем положении, что очень полезно при прохождении курса. Это очень обширная и важная область психологии, но причина, по которой я оценил этот курс, как «очень хорошо», а не «отлично» в том, что материал не особенно стимулирует мышление. В другом экспериментальном условии (условие базового значения), ис­ пытуемым было сказано, что они будут читать средние оценки курса, осно­ ванного на ш калах, заполненны х всеми студентами курса в конце предш е­ ствующего семестра. После описания каж дого курса приводилась пятибал­ льн ая ш кала, помеченная от «отлично» до «плохо». Н а каж дой ш кале была Общепринятое положение... 137 Таблица 1. Среднее число выбранных курсов и взвешенная тенденция выбо­ ра Рекомендо­ ванные курсы Нерекомендованные курсы Неупомяну­ тые курсы Коли­ чество Изме­ ренная тен­ денция выбо­ ра Коли­ чест­ во Изме­ ренная тен­ денция выбора Коли­ чест­ во Изме­ ренная тен­ денция выбо­ ра Беседа со старш екурсниками (N =22) 4.73* 8.31*,ь 0.50* 0.77*'ь 3.09*>ь 4.32*,ь Наличие знаний базового значения (N =18) 4.11 6.33ь 0 .94 1.56ь 4.17ь 5.89ь Группа контроля *1=18) 3.33* 5.22* 1.39* 2.17* 5.39*-" 7.17* F (2,55) 6.14* 10.34** 6.59* 6.65* 13.24** 8.19** Условие а означает, что значения в колонке различаются одно от другого на уровне 0.01 по тесту Ньюмена-Келса (Newman- Keuls) ь означает, что значения в колонке различаются одно от другого на уровне 0.05 по тесту Ньюмена-Келса *р < 0.005, **р < 0.001 помещ ена пом етка, показы ваю щ ая среднюю оценку, и было обозначено количество студентов, на мнении которых было основано среднее значение. Эти N располагались по порядку от 26 до 142. Средняя оценка каждого кур­ са указы валась таким образом, чтобы быть идентичной средним оценкам, данным студентами-старш екурсниками, принимавш ими участие в беседе. Структура эксперимента позволяет сравнить эффективность рекоменда­ ций, основанных на информации из первых рук, то есть кратких коммента­ риях двух или трех студентов, которые проходили курс, с эффективностью более устойчивой, глубоко обоснованной информации. В таблице 1 представ­ лено среднее количество рекомендованных (средние оценки 2.50 или луч­ ш е), нерекоммендованных (средние оценки 3.75 или хуже) и неупомяну­ тые курсы , выбранные этими тремя группами. Около каж дой категории приведена оцененная тенденция выбора, индекс, который дает нулевую над­ бавку к курсу, если его не выбрали, 1, если он был помечен «галочкой» и 2, если он был обведен «круж ком». М ожно заметить, что проведение беседы со старш еклассниками имело большее воздействие на выбор курса. Испытуемые этой группы были склон­ ны пройти рекомендованные курсы и менее склонны пройти нерекомендо­ 138 ПРИЧИННОСТЬ И АТРИБУЦИЯ ванны е или неупомянутые курсы , чем испытуемые контрольной группы. Н апротив, метод базового значения повлиял только на выбор неупомяну­ ты х курсов. Можно поспорить, что группа испытуемых, у которых была беседа со стар­ ш екурсникам и, обладала большим количеством информации, чем группа базового значения. Одной из версий для этого аргумента является именно то, что мы хотели предложить. Н аш и студенты вели себя, как будто они и з­ влекли больш е информации из комментариев пары человек в личной бесе­ де, чем из сухих, статистических данных целы х совокупностей. Д ругая вер­ сия этого аргумента, - то, что комментарии, сделанные студентами при лич­ ной беседе, содержат очень ценную информацию, не доступную в условии базового значения, относительно, например, организации курсов, процедур аттестации. Чтобы задействовать последнее возраж ение, мы провели аналогичное исследование с одним важ ны м изменением. Группе базового значения дали дословные письменные комментарии, сделанные студентами-старшекурсникам и, участвующ ими в беседе. Кроме того, эти комментарии были явно описаны к ак репрезентативные взгляды студентов, проходящ их курс, ото­ бранные из общего количества оценок в конце семестра. В этом случае, на испы туемы х, которым были доступны устойчивые средние оценки, осно­ ванны е на больш их и полных совокупностях, с дословными комментария­ ми студентов, и со “знанием”, что они являю тся репрезентативными ком­ м ентариям и, было оказано меньше давления в их выборах, чем на испыту­ емы х, которые просто слы ш али устные комментарии старш екурсников в личной беседе. К ом м уникация, направленная на конкретизацию Не трудно понять выводы теории Бертрана Расселла относительно общепри­ нятой индукции и выш еупомянутой ее иллю страции для общих вопросов общ ения и убеждения. Если на людей не влияю т сухие, статистические дан­ ны е, дорогие для сердец ученых и специалистов, занимаю щ ихся полити­ ческим планированием, то социальный и технологический прогресс должен приостановиться до тех пор, пока не будут найдены эффективные, конкрет­ ны е, эмоционально интересные пути коммуникативны х заклю чений. Мы собрали несколько исследований убеж дения, которые, по наш ему мнению, хорош о понятны в терминах различия между абстрактной и конкретной информацией. Мы представляем их ниж е в надежде, что они могут служ ить источником вдохновения реальной ж изни и руководством для исследова­ н ия вопросов, касаю щ ихся природы информации и ее воздействия. 1. Р ан н яя версия Зеленой Револю ции стала возможной в начале 30-ых годов X X века благодаря прогрессу в методах ведения сельского хозяйства. П равительство долж ны м образом продолж ало информировать фермеров Общепринятое положение... 139 страны об этих методах посредством сельскохозяйственных агентов по ок­ ругам, распространяю щ их статистику и правительственные брошюры, и ж дало сообщений об увеличении урож ая. Таких сообщений не последова­ ло, и скоро стало ясно, что фермеры не приобщ ились к новым методам. П ра­ вительство утвердило программу, предписывающую сельскохозяйственным агентам направляться на выбранные фермы и вы ращ ивать зерновые куль­ туры вместе с фермерами, используя новые методы. Соседние фермеры, н а­ блюдавшие увеличение урож ая, немедленно приобщ ались к новым мето­ дам. 2. Д линны е списки ож идания в клиниках по обнаружению рака растя­ гивались на месяцы , и так было, начиная с осени 1974. Т акая ситуация сло­ ж илась не из-за вы пуска новой статистики главны м хирургом страны , Аме­ риканской медицинской ассоциацией или любой другой организацией. По­ явление длинны х списков ож идания совпадает по времени с мастектомией, которую перенесли госпожа Форд и госпожа Рокфеллер. 3. Тимоти Краус, в своей книге, описывающей освещ ение в прессе пред­ выборной кам пании президента в 1972, под названием Мальчики в Автобу­ се (1974), сообщ ала, что накануне выборов больш ая группа репортеров, ос­ вещ ающ их кампанию М акГоверна, согласилась, что он не может проиграть больше чем на 10 пунктов. Эти люди были репортерами из агентства ново­ стей, телевидения и главны х газет и ж урналов новостей. Они знали, что во всех опросах М акГоверн отставал на 20 пунктов, и они знали, что за преды ­ дущие 24 года ни один опрос не расходился с итогами выборов более чем на 3% . Однако, они видели своими собственными глазам и, к ак восторженные толпы людей приветствуют М акГоверна. 4. The New York Times (K aufm an, 1973) недавно взял интервью у граффитиста метро в Нью-Йорке, который сильно обгорел в пожаре, вызванном ис­ крой, которая подожгла его банки с распыляю щ ейся краской. М альчик, и з­ вестный под псевдонимом “Али”, признавался, что за 2 недели до несчастно­ го случая он читал о мальчике по имени Бернард Браун, которого задавило насмерть, когда он рисовал граффити на поездах. “Возможно, если бы мы знали им я, которое он использовал, например, ‘Джо 146’, это произвело бы впечатление, - сказал он, но я помню, к ак смеялся над этим, думая, что он, наверное, был какой-то пижон, который не знал, что делал... ” Мы полагаем, что настоящ ее исследование и примеры, взяты е из повсед­ невной ж изни показы ваю т, что некоторые виды информации, которую уче­ ные рассматриваю т к ак подходящую и наводящ ую на выводы, обычно иг­ норирую тся людьми. Другие виды информации, которые являю тся логи­ чески слабее, наталкиваю т на разм ы ш ления и приводят к действиям. Мы можем думать о ставш ей бесполезной деятельности психологов, которые больше занимаю тся изучением обработки информации, чем обнаружением того, что их испытуемые расцениваю т к ак информацию , достойную обра­ ботки. 8. Причинные схемы при принятии решений в условиях неопределенности* Амос Тверски и Даниелъ Канеман М ногие реш ения, которые мы принимаем, к ак в незначительны х, так и в важ ны х вопросах, зависят от очевидной вероятности событий, таких к ак выполнение обещ ания, успех предприятия или реакции на действие. Так к ак у нас нет адекватны х формальных моделей для вы числения вероятнос­ ти подобных событий, их оценка обязательно субъективна и интуитивна. То, к ак люди оценивают свидетельства, чтобы оценить вероятности, пробу­ дило больш ой исследовательский интерес в недавние годы, например, В.Эдвардс (W .E dw adrs, 1968, 25); К анеман и Тверский ( K ahnem an T versky, 1979а, 30); Словик (Slovic, 1972а); Словик и Ф ишхофф ( Slovic FishH off) и Л и хн етш тей н (L ic h te n ste in , 1977); Т верски й и К анем ан ((T v ersk y и K ahnem an, 1 9 7 4 ,1 ). Это исследование выделило несколько эвристик при­ н яти я реш ений, которые связаны с характерны ми ош ибками и предубеж­ дениями. Эта часть книги посвящ ена роли причинно-следственного рассуж ­ дения при принятии реш ений в условиях неопределенности и некоторым предубеж дениям, которые связаны с этим способом мы ш ления. С психологической точки зрения банально то, что люди стремятся дос­ тигнуть последовательной интерпретации событий, которые окруж аю т их, и что для достиж ения этой цели служ ит организация событий с помощью схем причинно-следственны х отнош ений. К лассическая работа М ичетта (M ichotte, 1963) ярко продемонстрировала тенденцию воспринимать пос­ ледовательности событий в терминах причинно-следственных отнош ений, даж е когда человек полностью осознает, что отношение между событиями случайно и что приписанная причинно-следственная связь является иллю ­ зорной. Распространенность причинно-следственных схем при восприятии элементарны х социальных связей бы ла выдвинута на первый план в 1958 *Данная глава - первая часть книги, которая появилась в редакции М. Фишбайн, Прогресс в социальной психологии. Hillsdale, N.J.: Lawrence Erlbaum Assoc., Inc, 1980. Переиздано в соответствии с разрешением. Причинные схемы при принятии решений... 141 конструктивной работе Х айдера (H eider), а исследование причинно-след­ ственного приписы вания стало одним из центральны х в современной соци­ альной психологии (Jones и другие, 1971; Ross, 1977). В этой главе описывается роль причинно-следственных схем при приня­ тии реш ений в условиях неопределенности. В частности, мы исследуем оцен­ ки условной вероятности Р (Х/D ) некоторого целевого события X , на основе некоторого свидетельства или данных D. Д ля психологического анализа воз­ действия свидетельства, полезно различать типы отнош ений, которые ис­ пытуемый мож ет увидеть между D и X . Если D воспринимается к ак причи­ на возникновения или невозникновения X , мы считаем D причинно-след­ ственными данны ми. С другой стороны, если X воспринимается к а к воз­ м ож ная причина D, мы рассматриваем D к а к диагностические данные. Например, считается, что описание личности А обеспечивает причинно-след­ ственные данные для прогнозирования его поведения, в то время к ак описа­ ние поведения А обеспечивает диагностическую информацию относитель­ но его личности. Если D не является ни причиной, ни результатом X , но они оба воспринимаю тся к ак последствия другого ф актора, мы считаем D пока­ зательны ми данными. Таким образом, поведение в одной ситуации обеспе­ чивает показательны е данные для поведения в другой ситуации, если обе манеры поведения расценены к ак проявления одной и той ж е черты . Н ако­ нец, если оказы вается, что D и X , не связаны прямой или косвенной при­ чинной связью , мы назы ваем D случайными данными. При нормативном рассмотрении теории условной вероятности, различия между типами отнош ения D к X невещ ественны, и воздействие данных за­ висит исклю чительно от их информативности. Н апротив, мы предполага­ ем, что психологическое воздействие данных зависит от их роли в причин­ но-следственной схеме. В частности, мы выдвигаем гипотезу, что причин­ но-следственные данные имеют большее воздействие, чем другие данные такой ж е информативности; и что в присутствии данны х, порождаю щ их причинно-следственную схему, случайные данные, не соответствующие этой схеме, имеют маленькое значение, или вовсе его не имеют. В этой части книги мы сравниваем влияние причинны х и диагностичес­ ки х данны х и показы ваем, что лю ди приписываю т большее воздействие причинны м, чем диагностическим данным равной информативности. Мы такж е исследуем класс проблем, где отдельно взяты е данны е имеют к ак причинно-следственное, так и диагностическое значение, и демонстриру­ ем, что интуитивны е оценки Р (Х/D ) зависят от прямого причинного воз­ действия D на X без учета диагностических соображ ений.... 142 ПРИЧИННОСТЬ И АТРИБУЦИЯ П р и ч и н н о е и д и агн о с ти ч е с к о е у м о за к л ю ч е н и е Логически выведенные асиммет рии П ричинно-следственная схема носит естественный ход событий; он разви­ вается от причин к следствиям. Мы предполагаем, что легче и более есте­ ственно следовать нормальной последовательности и рассуж дать от причи­ ны к следствию , чем обратить эту последовательность и рассуждать от след­ ствий к причине. Если причинно-следственные выводы действительно бо­ лее легкие и естественные, чем диагностические выводы, то можно ожидать, что люди выведут результаты из причин с большей достоверностью, чем при­ чины из результатов - даж е, если результат и причина ф актически дают одинаковое количество информации относительно друг друга. Мы провери­ ли эту гипотезу, используя две различны е величины: оценки условной ве­ роятности и достоверность точности предсказаний. В одном наборе вопросов мы попросили испытуемых сравнить две услов­ ные вероятности Р (Y/X ) и Р (X /Y ) для пары событий X и Y таких, что (1) X естественно рассматривается к ак причина Y; и (2) Р (X) = Р (Y), то есть пре­ дельны е вероятности двух событий равны . Последнее условие подразуме­ вает что Р (Y /X ) = Р (Х/Y ). Мы сделали прогноз, что большинство испытуе­ мы х сочтет причинно-следственное отношение более сильны м, чем диагно­ стическое, и ошибочно утвердит, что Р (Y/X ) > Р (X /Y ). В другом наборе вопросов мы попросили испытуемых сравнить достовер­ ность прогнозов с использованием двух непрерывных переменных: зависи­ мость от одной бы ла дана, а другую необходимо было спрогнозировать. Как и ранее, задачи построены таким образом, чтобы одна из переменных рас­ сматривалась к ак причинная относительно другой. Если две переменные обладают подобными предельными распределениями, не существует надеж ­ ной статистической причины ож идать различие в точности, с которой одна переменная может быть спрогнозирована исходя из другой. Однако мы выд­ винули гипотезу, согласно которой многие испытуемые посчитают, что про­ гнозирование от причины к результату может быть сделано с большей дос­ товерностью, чем предсказание от результата к причине. Прогнозированная асимметрия между причинными и диагностическими выводами наблюдалась с двумя типами вопросов. Эффект проиллюстрирован следующими задачами, где числа в круглых скобках указывают количество студентов (Университета ш тата Орегон), которые выбрали каж ды й ответ.1 Задача 1 : Какое из следующих событий является более вероятным? (А), что у девочки голубые глаза, если у ее матери голубые глаза. (N = 69) 1В более раннем варианте этой книги была приведена неправильная - низкая пропорция ответов “поровну”, основанных на выборке из Израиля. Мы обязаны Анне М. Б. Гонзалес и Майклу Кубовому за это наблюдение. Настоящие данные, собранные в Университете штата Орегон, совпадают с результатами, полученными Гонзалес в Йельском университете. Причинные схемы при принятии решений... 143 (В), что у матери голубые глаза, если у ее дочери голубые глаза. (N = 21) (-) два события одинаково вероятны. (N =75) Задача 2: При осмотре старшеклассников в некотором городе, рост мальчиков сравни­ ли с ростом их отцов. Какой из прогнозов является более достоверным? (A) прогнозирование роста отца по росту сына. (N = 23) (B) предсказание роста сына по росту отца. (N = 68) (-) равная достоверность. (N = 76) Очевидно, что распределение роста или цвета глаз - по сущ еству одно и то ж е в следующ их друг за другом поколениях. Чтобы проверить восприятие этого ф акта, мы спросили другую группу из 91 испытуемых, является ли пропорция матерей с голубыми глазам и в большой выборке матерей и доче­ рей больш ей (N = 15), равной (N = 64) или меньш ей (N = 12), чем пропорция дочерей с голубыми глазам и. Таким образом, хотя испытуемые оценили предполагаемые вероятности к ак равные, они оценили “причинную” услов­ ную вероятность выш е, чем “диагностическую ”. Строго говоря, рост отца не обуславливает рост его сына. В обиходе, одна­ ко, весьма приемлемо говорить, что мальчик высок, потому что рост его отца б футов 4 дюйма, в то время к ак утверждение, что рост отца - б футов 4 дюйма, потому что его сын вы сок, соверш енно аномально. В общем, мы ожидаем асимметрию вывода относительно двух переменных всякий раз, когда первая объясняет вторую лучш е чем вторая объясняет первую. Д ля иллю страции, рассмотрим следующие задачи, которые были представле­ ны двум различны м группам испытуемых: Задача 3: Какое из следующих утверждений имеет больше смысла? (A) Том тяжелый, потому что он высокий. (N = 63) (B) Том высокий, потому что он тяжелый. (N = 7) Задача 4: Какое из предсказаний более достоверно? (A) прогнозирование роста человека исходя из его веса. (N = 16) (B) прогнозирование веса человека исходя его роста. (N = 78) Х отя рост и вес не считаю тся причинами друг друга, большинство испытуе­ мых посчитало, что вы сокий рост человека лучш е объясняет большой вес, чем наоборот, возможно, потому что прототипичный вы сокий человек об­ ладает больш им весом, в то врем я к а к прототипичный тяж елы й человек не всегда вы сокий. Соответственно, большинство испытуемых вы разило боль­ шую уверенность в прогнозировании веса человека исходя из его роста, чем в прогнозировании роста человека исходя из его веса. Т акая асимметрия, безусловно, не мож ет быть оправдана на статистических основаниях. Задачи 3 и 4 свидетельствуют о том, что асимметрия вывода происходит даже при отсутствии прямой причинной связи между этими двумя перемен­ ными - если одна из них (например, рост) более естественно рассматривается к ак объяснение другой (например, вес). Следующие две задачи иллюстриру­ ют случай, где две переменные рассматриваю тся к ак признаки или проявле­ 144 ПРИЧИННОСТЬ И АТРИБУЦИЯ ния некоторой основной черты. Одна из переменных, однако, обеспечивает более прямое проявление или более надежную меру основной черты. Мы ож и­ даем, что выводы от более сильного к более слабому признаку будут сделаны с большей достоверностью, чем выводы в обратном направлении. Задача 5: Какое из следующих событий является более вероятным? (A) , то, что атлет выиграл десятиборье, если он выиграл первое состязание в де­ сятиборье. (N=21) (B) , то, что атлет выиграл первое состязание в десятиборье, если он выиграл де­ сятиборье. (N = 75) (-) два события одинаково вероятны. (N = 70) Задача 6: Два теста на интеллектуальные способности проводились в большой группе студентов: всестороннее испытание длительностью 1 час и 10-минутная сокращенная версия. Какой прогноз является более достоверным? (A) прогнозирование результата студента в коротком тесте на основании его ре­ зультата во всестороннем тесте. (N = 80) (B) прогнозирование результата студента во всестороннем тесте исходя из его ре­ зультатов в коротком тесте. (N = 47) (-) равная достоверность. (N = 39) Снова, правильны й ответ “поровну” в обеих задачах. В задаче 5, предпола­ гаем ая вероятность того, что атлет победит в десятиборье равна 1/N , где N количество конкурентов. Этому такж е равна априорная вероятность того, что атлет победит в первом состязании. Следовательно, две условные веро­ ятности долж ны быть равны . В задаче 6, стандартное предположение о ли­ нейны х регрессиях влечет за собой точность в предсказании одного испы та­ н и я исходя их другого. Ответы на обе задачи, однако, показы ваю т явное предпочтение одному направлению прогнозирования над другим. В задачах 5 и б речь идет о двух признаках одной и той ж е основной чер­ ты , которы е отличаю тся по выраженности. Победа в десятиборье и победа в отдельном состязании - оба являю тся проявлениями спортивного превос­ ходства, но первое обеспечивает более вы раж енны й признак превосходства, чем последнее. Точно так ж е результаты тестов на уровень интеллекта отра­ ж аю т основную черту интеллекта, и всесторонний тест отраж ает более вы­ сокую степень выраженности этой черты , чем сокращ енная версия. Резуль­ таты подтверждаю т гипотезу, что прогнозирование от более сильного при­ зн ака к более слабому связано с большей достоверностью, чем обратное пред­ сказание. Асимметрии вывода, наблюдаемые в предшествующих задачах, связаны с асимметриями отношений приближенности, которые исследованы в рабо­ тах Тверского (1977). Эмпирические исследования показываю т, что оценен­ ное подобие заметного объекта или прототипа менее заметному объекту или варианту меньшее, чем подобие варианта прототипу. Например, насыщен­ ный красны й менее подобен бледно-красному, чем наоборот (Рош, 1975), “хо­ рош ая” форма менее подобна “плохой” форме, чем наоборот, и подобие зна­ Причинные схемы при принятии решений... 145 менитой страны (например, коммунистический Китай) менее знаменитой стране (например, Северная Корея) меньше, чем обратное подобие (Tversky, 1977). Асимметрии прогнозирования, видимо, следуют тому ж е правилу. Таким образом, мы воспринимаем сына как более подобного своему отцу, чем наоборот, и мы такж е приписываем свойства отца сыну с большей достовер­ ностью, чем наоборот. Тот ж е самый процесс, поэтому, может леж ать в осно­ ве, как асимметрии подобия, так и асимметрии вывода. П ричинная и диагностическая значимость свидетельства В предыдущ ей главе описывалось, что влияние причинно-следственных данных на оцененную вероятность последствия больш е, чем воздействие диагностических данных на оцененную вероятность причины. В настоящ ей главе исследую тся вопросы, в которы х свидетельство имеет, к ак причин­ ное, так и диагностическое значение по отношению к целевому событию. Мы исследуем гипотезу, согласно которой люди склонны сосредотачивать­ ся на причинном воздействии данны х, касаю щ ихся будущего, и имеют тен­ денцию пренебрегать диагностическими выводами, касаю щ имися прошло­ го. Сначала мы обсудим класс задач, в которых преобладание причинных соображений над диагностическими приводит к появлению непоследова­ тельных и парадоксальных оценок вероятности. Следующая пара задач была представлена Туроффом (1972) в обсуждении метода прогнозирования с вза­ имным влиянием фактов. З а д а ч а 7а: Какая из следующ их двух вероятностей выше? (1) вероятность того, что в течение следующих пяти лет Конгресс примет закон о предотвращении ртутного загрязнения, если количество смертельных случаев, приписанных отравлению ртутью, в течение следующих пяти лет превысит 500 человек. (2) вероятность того, что в течение следующих пяти лет Конгресс примет закон о предотвращении ртутного загрязнения, если количество смертельных случаев, приписанных отравлению ртутью, в течение следующих пяти лет не превысит 500 человек. З а д а ч а 7Ъ: Какая из следующ их двух вероятностей выше? (1) вероятность того, что количество смертельных случаев, приписанных отрав­ лению ртутью, в течение следующих пяти лет превысит 500 человек, если Конг­ ресс примет в течение следующих пяти лет закон о предотвращении ртутного загрязнения. (2) вероятность того, что количество смертельных случаев, приписанных отрав­ лению ртутью, в течение следующих пяти лет превысит 500 человек, если Конг­ ресс не примет в течение следующих пяти лет закон о предотвращении ртутного загрязнения. Пусть С - событие, что в течение следующих 5 лет Конгресс примет закон о предотвращ ении ртутного загрязнения, и пусть D - событие, что в течение следующих 5 лет, количество смертельных случаев, приписанны х отравле­ 146 ПРИЧИННОСТЬ И АТРИБУЦИЯ нию ртутью , превысит 500. Пусть С и D обозначают события, противопо­ лож ны е событиям С и D, соответственно. Больш инство испытуемых считаю т, что, скорее всего, Конгресс примет закон, ограничиваю щ ий ртутное загрязнение, если список ж ертв превысит 500 человек, чем если не превысит, то есть P(C /D )>P(C /D ). Больш ое коли­ чество испытуемых такж е оценило к ак менее вероятное событие, что спи­ сок ж ертв достигнет 500 человек, если закон будет принят в течение следу­ ю щ их пяти лет чем, если не будет принят, то есть P(D /C )>P(D /C ). Эти оцен­ ки отражаю т причинные убеждения, что большой список ж ертв повлиял бы на более скорое принятие мер по предотвращению загрязнения, и что такая мера будет эффективной для предотвращ ения ртутного отравления. В выборке из 166 студентов, 140 выбрали модальный ответ на оба вопроса. Этот внеш не верный образец суждений наруш ает наиболее элементарные правила условной вероятности. Ясно, P(C /D )>P(C /D ) подразумевает P(C/D)>P(C). Кроме того, неравен­ ство Р(С /D ) = Р(С & D) P (D ) > Р (С ) сохраняется, тогда и только тогда, когда Р (С & D) > Р (С) Р (D), что верно тогда и только тогда, когда Р(С & D) Р (С )< = P (D /C ) Р (С ) что в свою очередь подразум еваетР(Б/С )>Р(Б/С ), если Р (С) и_Р (D) не рав­ ны н улю . С лед овательн о, п о д р азу м евает P (C /D )> P (C /D ), воп реки P (D /C )> P(D /C ) преобладающему образцу суждений. Л егко построить дополнительные примеры подобного типа, в которых интуиция людей наруш ает вычисление вероятности. Такие примеры состо­ я т из пары событий, А и В, таких, что возникновение В увеличивает вероят­ ность последующ его возникновения А , в то время к ак возникновение А уменьш ает вероятность последующего возникновения В. Н апример, рас­ смотрите следующую задачу. Задача 8: Пусть А - событие, что до окончания следующего года, Питер установит сис­ тему сигнализации в своем доме^Пусть В - событие, что дом Питера будет обокраден до конца следующего года. Пусть А и В события, противоположные событиям А и В, со­ ответственно2. _ Вопрос: Какая из двух условных вероятностей, Р (A/В ) или Р (A/В ), выше? Вопрос: Какая из двух условных вероятностей, Р (В/A ) или Р (В /А ), выше? 2символы А, В, и т.д. введены, чтобы облегчить построение выводов. Испытуемым предла­ гали устные описания событий. Причинные схемы при принятии решений... 147 П од авл яю щ ее б ольш и н ство и сп ы туем ы х (132 и з 161) за я в и л о , что Р (A /В ) > Р (A/В ) и что Р (В/А ) < Р (В /А ), вопреки законам вероятности. Мы интерпретируем этот образец суждений к ак другой признак господства причинны х соображений над диагностическими. Чтобы оценить природу этого эффекта, давайте проанализируем структуру задачи 8. Д ля начала рассмотрим Р (A/В ), условную вероятность того, что Питер установит сигнализацию в своем доме до конца следующего года, учиты ­ вая, что его дом будет обокраден в течение этого периода. С игнальная систе­ ма могла быть установлена либо до, либо после ограбления. И нформация, переданная этим условием, то есть предположением о краж е, имеет при­ чинное значение относительно будущего и диагностическое значение отно­ сительно прош лого. Определенно, краж а является причиной для последу­ ющей установки сигнализации, что, в свою очередь, является диагности­ ческим признаком того, что дом не был оборудован ею во время краж и. Та­ ким образом, причинное воздействие краж и увеличивает вероятность уста­ новления сигнальной системы, в то время как диагностическое воздействие к р аж и ум ен ьш ает эту вероятн ость. П очти единодуш ны е о ц ен ки , что Р (А /В ) > Р (A/В ) указы ваю т, что причинное воздействие В преобладает над его диагностическим воздействием. Такой ж е анализ прим еняется к Р(В/А ): вероятности, что дом П итера будет обокраден до конца следующего года, учиты вая, что он установит сиг­ нализацию в течение этого периода. Н аличие сигнализации причинно вли­ яет на сокращ ение вероятности последующей краж и; это такж е дает нам диагностический признак того, что краж а могла побудить Питера устано­ вить сигнализацию . П ричинное влияние приобретения сигнализации уменьш ает вероятность краж и; диагностическое влияние установки сигнализации увеличивает эту вероятность. В данном случае, распространенность суждения, что Р (В/А) < Р указы вает, что причинное влияние А преобладает над его диагностическим влиянием. Вместо сравнения причинны х и диагностических воздействий свидетельства, лю ди, очевидно, оцениваю т условные вероятности Р (A/В ) и Р (В /А ) преж де всего в терминах прямого причинного эффекта состояния, что приводит к противоречиям в задачах этого типа. Сущ ественная особенность задач Туроффа (T uroff) - неопределенное вре­ менное отнош ение между событием, создающ им условие и целевым собы­ тием. Д аж е при отсутствии временной неопределенности, часто создающее условие событие имеет как причинное, так и диагностическое значение. Про­ деланный анализ приводит к гипотезе, что на оценки условных вероятнос­ тей влияю т причинно-следственные соображения, даж е когда временное отношение между событиями полностью определено. Задача 9: Какая из следующих вероятностей выше? Р (R/H) вероятность того, что в течение 90-ых годов станет необходимым нормирова­ ние топлива для частных потребителей в США, учитывая, что в течение 80-ых произой­ 148 ПРИЧИННОСТЬ И АТРИБУЦИЯ дет значительное увеличение использования солнечной энергии для отопления домов. Р (R /H ). Вероятность того, что в течение 90-ых станет необходимым нормирование топ­ лива для частных потребителей в США, учитывая, что в течение 80-ых не произойдет никакого увеличения использования солнечной энергии для отопления домов. П оучительно рассмотреть нормативный подход (Байеса) к этой проблеме, с точки зрения различия, которое мы наблюдали между причинными и диаг­ ностическими соображениями. Событие Н, что в течение 80-ых произойдет значительное увеличение использования солнечной энергии для отопления домов, имеет, к ак причинное, так и диагностическое значение. Прямое при­ чинное воздействие Н на R является отрицательным. При равном значении других параметров, значительное увеличение в использовании солнечной энергии мож ет только облегчить топливный кризис в более поздние годы. Однако значительное увеличение в использовании солнечной энергии в те­ чение 80-ы х такж е является весомым признаком надвигаю щ егося энерге­ тического кризиса. В частности, это говорит о том, что цены на топливо в 80-ы х достаточно вы соки, чтобы производить инвестиции в использование солнечной энергии для отопления домов, экономичного для большого коли­ чества потребителей. Высокие топливные цены в 80-ых, в свою очередь, пред­ полагаю т нехватку ископаемого топлива, что увеличивает вероятность нор­ м ирования топлива в последую щ ем десятилетии. Таким образом, п р я­ мое причинно-следственное воздействие Н на R уменьш ает вероятность R, приним ая во внимание, что диагностические значения Н косвенно увели­ чиваю т вероятность R. Х отя вопрос относительного значения этих факторов не может быть раз­ реш ен формально, мы утверждаем, что диагностические значения Н могли перевесить его причинное воздействие. Количество топлива, которое может быть сэкономлено путем увеличения использования солнечной энергии для отопления домов, вряд ли, будет достаточно больш им, чтобы предотвратить надвигаю щ ийся кризис. С другой стороны, дефицит топлива, который под­ разумевает событие Н, является явны м показателем предстоящ его энерге­ тического кризиса. Согласно этой линии рассуж дения, Р (R /H ) > Р (R /H ), где Н - событие, противоположное Н. Гипотеза, вы двинутая в этой главе, однако, состояла в том, что люди во­ обще придаю т больше значения прямому причинному влиянию события, создающего условия, в оценках условных вероятностей и не уделяю т доста­ точного вним ания его диагностическому значению . В задаче 9, эта гипотеза предполагает, что увеличение использования солнечной энергии для ото­ пления в 80-ы х должно уменьш ить оцененную вероятность нормирования то п л и в а в 9 0 -ы х . Д ей стви тельн о , 68 и з 83 и сп ы туем ы х за я в и л и , что Р (R /H ) < Р (R /H ).T ot ж е самый образец суждений наблюдается в других задачах этого типа, где косвенные диагностические значения условия про­ тиворечат его прямы м причинным значениям. Х отя этот образец суждений не наруш ает правил вероятности, к ак в задачах Туроффа, он отраж ает, по Причинные схемы при принятии решений... 149 наш ему мнению, общую тенденцию пренебрегать диагностическим значе­ нием события, создающего условия, в оценках условной вероятности. Прогнозы, объяснение и пересмотр В предш ествующ их главах мы представили некоторые ф акты в поддержку гипотезы, что причинные выводы имеют большую эффективность, чем ди­ агностические выводы. Во-первых, мы показали, что выводы от причин к следствиям делаю тся с большей достоверностью, чем выводы от следствий к причинам. Во-вторых, мы показали, что, когда одни и те ж е данные име­ ют, к ак причинное, так и диагностическое значение, первому обычно при­ дают больш е значения, чем последнему в оценках условной вероятности. Мы обратимся теперь к более общему вопросу соотнош ения между обра­ зом, моделью или схемой системы, например, энергетической ситуации или личности человека и некоторого исхода или проявления этой системы, н а­ прим ер, увеличение использование солнечной энергии или проявление враждебности. Модели или схемы обычно использую тся, чтобы спрогнози­ ровать и объяснить исходы, которые в свою очередь служ ат для модифика­ ции или модернизации модели. Таким образом, человек может применять модель, чтобы прогнозировать исход или оценивать его вероятность; он мо­ ж ет такж е использовать модель, чтобы объяснить возникновение опреде­ ленного события или последствия. Н аконец, он может использовать инфор­ мацию: полученную при возникновении определенного события, при ис­ правлении или пересмотре модели. П редсказание и объяснение представляю т собой два различны х типа при­ чинного вывода, в то время к ак пересмотр модели - это пример диагности­ ческого вывода. При прогнозировании испытуемый выбирает тот исход, который наиболее соответствует модели системы. При объяснении, испы ­ туемый определяет те особенности модели, которые, скорее всего, вызовут указанны й исход. С другой стороны, при пересмотре модели, испытуемый исправляет или дополняет элементы модели, которые наименее соответству­ ют данным. Больш инство выводов в повседневной ж изни опираются на модели или схемы, которые являю тся неточными, неполными и иногда неправильными. Люди признаю т это и часто стремятся подтвердить, что их модели систем, такие, как намерения человека или энергетическая ситуация, ошибочны. Присутствие неопределенности в точности модели имеет значение для надле­ жащего прогнозирования, объяснения и пересмотра. Если в модели встреча­ ются ош ибки, то прогнозы, исходящ ие из этой модели должны быть умерен­ ны или регрессивны, то есть они не должны отклоняться от прогнозирования базового значения. Например, следует больше воздерживаться от прогнозов, что человек будет вести себя нехарактерным или необычным образом, если информация об этом человеке исходит из ненадежного источника, чем если та ж е информация взята из более правдоподобного источника. 150 ПРИЧИННОСТЬ И АТРИБУЦИЯ О бъяснения, которые основаны на неопределенных моделях, должны использоваться с осторожностью, так к ак причинны е факторы , которые использую тся в объяснении, могут не сущ ествовать в действительности. Кроме того, объяснение в условиях неопределенности должно всегда осу­ щ ествляться с пересмотром модели. Например, если человек занимается деятельностью , которая каж ется несовместимой с наш им представлением о его личности, мы должны серьезно рассмотреть возможность того, что наш е представление было неправильным, и что оно должно быть пересмотрено в свете новых данных. Чем больше неопределенность модели и чем более уди­ вительно поведение, тем серьезнее долж ен быть пересмотр. А декватное объяснение должно принимать во внимание изменения в модели, которые подразумеваю тся или предложены событием, требующим объяснения. С нормативной точки зрения, объяснение в условиях неопределенности отно­ сительно модели вклю чает к ак диагностические, так и причинные выводы. Предыдущ ее исследование показало, что люди обычно “преувеличенно прогнозирую т” исходя из высоко неопределенных моделей. Например, ис­ пытуемые уверенно прогнозируют профессиональный выбор или академи­ ческую успеваемость человека на основе краткого описания его личности, даж е если это описание взято и з ненадеж ного источника (K ahnem an и Tversky, 1973, 4). Н амерения и черты, выведенные из краткого описания личности, обычно рассматриваю тся к ак причины таких исходов, как про­ фессиональный выбор или успех в учебе. “Преувеличенное прогнозирова­ ние”, которое наблюдается в таких задачах, совместимо с высоким влияни­ ем причинно-следственных данны х, что было проиллюстрировано в преды­ дущ их главах. В контексте объяснения и пересмотра, преобладание причинного и недо­ статок диагностического рассуж дения - очевидны благодаря большой лег­ кости, с которой люди заклады ваю т причинны е основания для исходов, которы е они не могли спрогнозировать, и благодаря трудностям, с которы ­ ми они сталкиваю тся при пересмотре неопределенных моделей для разме­ щ ения новых данны х. О казалось, что легче приспособить новый ф акт к су­ ществующей причинной модели, чем пересмотреть модель в свете этого ф ак­ та. Кроме того, пересмотры, которые сделаны с целью размещ ения новых ф актов, часто минимальны по объему и локальны по характеру. Чтобы проиллю стрировать это предположение, мы обратимся к наблю­ дениям из более раннего исследования интуитивного прогнозирования (K ahnem an и Tversky, 1973, 4), о которы х ранее не сообщалось. В этом ис­ следовании, 114 аспирантам-психологам предоставили описание личности аспиранта Тома В ., предположительно составленное психологом-клиницистом, когда Том был старш еклассником , на основе проективны х тестов. Давалось следующее описание: Том В. обладает высоким интеллектом, но ему не хватает творческого потенциала. Он любит порядок и ясность и нуждается в системе, где каждая мелочь находится на своем Причинные схемы при принятии решений... 151 месте. Манера письма — однообразная и механическая, иногда оживляется несколько банальными каламбурами и вспышками воображения подобно произведениям науч­ ной фантастики. Имеет сильную тягу к устойчивому материальному положению. Про­ являет мало сочувствия и симпатии к другим людям, не любит взаимодействовать с другими. Будучи эгоцентричным, тем не менее, имеет глубокое чувство морали. Испытуемых сначала попросили предсказать область специализации Тома В., оценивая девять возможностей в терминах их вероятности. Больш инство испытуемых приш ло к согласию, что Том, скорее всего, займется информа­ тикой или будет инженером, и менее вероятно, что он будет специализиро­ ваться в общественных дисциплинах и социальной работе или в гуманитар­ ны х науках и педагогике. Ответ на дополнительный вопрос такж е показал единодушие в том, что проективные тесты не являю тся надежным источни­ ком информации для прогнозирования выбора профессии. После заверш е­ ния задачи предсказания, испытуемым задали следующий вопрос. На самом деле, Том В. - аспирант на факультете педагогики, и он зарегистрирован в специальной программе подготовки преподавателей для обучения детей-инвалидов. По­ жалуйста, сформулируйте очень кратко теорию, которая, как Вы полагаете, наиболее вероятно объясняет отношение между личностью Тома В. и его выбором карьеры. К аков надлеж ащ ий подход к этому вопросу? И спытуемых поставили перед очевидным конфликтом между свершенным фактом, выбор карьеры Томом В ., и детальны м, но ненадежным описанием его личности. Достоверность, с которой люди прогнозируют выбор профессии исходя из описания личнос­ ти, подразумевает веру в корреляцию между личностью и выбором профес­ сии. Это мнение, в свою очередь, подразумевает, что выбор профессии диагностичен по отношению к личности. В выш еупомянутом примере, выбор профессии Томом В. маловероятен ввиду описания его личности, и это опи­ сание взято из сомнительного источника. Поэтому разумный диагностичес­ кий вывод должен привести к существенному пересмотру образа Тома В., чтобы привести его в большее соответствие со стереотипом выбранной про­ фессии. Если полагать, что студенты, получающ ие специальное образова­ ние, в целом склонны к состраданию, то выбор профессии Томом В. должен вы звать сомнения относительно того, что он “проявляет мало сочувствия и симпатии к другим лю дям”, к ак заявлено в сообщении психолога. А декват­ ный ответ на задачу должен, по крайней мере, допустить возможность, что личность Тома В. отличается от описания, и что он является на самом деле добрее и гуманнее. Н аш и испытуемые не следовали этому подходу. Только незначительное меньш инство (21% ) упомянуло какие-либо оговорки относительно надеж ­ ности описания. Подавляющее большинство испытуемых, вклю чая скеп­ тиков, реш ило конф ликт либо путем выбора подходящ их аспектов описа­ ния личности Тома В. (например, его глубокое чувство морали), либо путем новой интерпретации психологической значимости его выбора (например, как вы раж ение потребности в господстве). М ожно поспорить, что неспособность наш их испытуемых пересмотреть образ Тома В. просто отраж ает характеристики задачи, которая была им предоставлена, а именно “объяснять отношение между личностью Тома В. и выбором карьеры . ” Согласно этой точке зрения, задача интерпретируется к ак призы в к попы тке соотнести выбор профессии Тома В. с описанием его личности, не подвергая сомнению его валидность. Мы считаем, однако, что распространенная тенденция рассматривать образ Тома В., к ак полностью достоверный, несмотря на серьезные сомнения, иллю стрирует более ш иро­ кое явление: тенденцию объяснять без пересмотра, даж е, если модель, ко­ торая используется в объяснении, высоко неопределенна. По наш ем у представлению , ответы испы туемы х иллю стрирую т, к а к неж елание пересмотреть подробную и последовательную модель, пусть и неопределенную , так и непринужденность, с которой такая модель может использоваться для объяснения новых фактов, пусть и неожиданны х. Нас поразила легкость, с которой наш и испытуемые строили причинные сооб­ раж ения по поводу неожиданного выбора профессии Томом В., и у нас нет причин полагать, что они были бы менее поверхностны в объяснении дру­ гих неож иданны х действий с его стороны. Высоко развиты е навы ки к объяснению способствуют общ еизвестной устойчивости и стабильности впечатлений, моделей, концепций и парадигм при столкновении с неординарным свидетельством (Abelson, 1959; H ovland, 1959; Ja n is, 1972; Jerv is, 1975; K uhn, 1962). Стимул для пересмотра моде­ ли мож ет исходить только из признания несоответствия между этой моде­ лью и некоторым новым свидетельством. Если люди могут объяснять боль­ ш инство явлений к своему собственному удовлетворению при минималь­ ны х изменениях локального характера в своих концепциях, они редко бу­ дут чувствовать потребность в реш ительном пересмотре этих концепций. Таким образом, легкость причинного размы ш ления не допускает процесса диагностического пересмотра.... 9. Недостатки процесса атрибуции: о происхожде­ нии и исправлении ошибочных социальных оценок* Ли Росс и Крег А. Андерсон Введение в теорию атрибуции и ошибки атрибуции Теория ат рибуции и и нт уит ивная психология Теория атрибуции, в самом широком смысле, рассматривает попы тки обыч­ ны х людей понять причины и значения событий, свидетелями которы х они являю тся. Она анализирует их “наивную психологию” к ак способ интер­ претировать собственное поведение и действия других. Таким образом, на­ стоящ ее господство в социальной психологии теории атрибуции является кульминацией длительной борьбы за улучш ение этой дисциплинарной кон­ цепции человека. Не подчиняясь больше закономерности «стим ул-реак­ ция» (S-R) радикального бихевиоризма, вы йдя за границы информацион­ ного процессора и перестав быть искателем когнитивной последовательнос­ ти, человек в психологии получил статус, равны й статусу ученого, который его исследует. С точки зрения теории атрибуции, люди являю тся интуитив­ ными психологами, которые стрем ятся объяснить поведение других и сде­ лать выводы об их социальном окруж ении. Чтобы лучш е понимать восприятие и действия этого интуитивного уче­ ного, мы долж ны исследовать методы, которые он использует. Сначала, подобно ученому-психологу, он руководствуется набором предположений относительно природы человеческого Я и его поведения - например, что стремление получить удовольствие и избеж ать боли - распространенные и сильные мотивы поведения, или что подчинение ж еланиям и ож иданиям других лю дей, более обычно и требует меньш е дальнейш ей интерпретации, *В этой главе многое заимствовано, как по содержанию, так и по структуре, из статьи пер­ вого автора в книге “Advances in Experimental Social Psychology” (1977). Разрешение на использование этих материалов подтверждено. 154 ПРИЧИННОСТЬ И АТРИБУЦИЯ чем неподчинение. Психолог-любитель, подобно профессиональному пси­ хологу, такж е всецело полагается на данные, хотя они редко соответствуют формальным требованиям случайности и репрезентативности. И ногда эти данны е и з первы х рук; чащ е, они являю тся результатом неофициального общения, получены из средств массовой информации или других косвенных источников. Далее интуитивный психолог должен выб­ рать или разработать методы кодирования, хранения и восстановления дан­ ны х. Н аконец, он должен использовать различные стратегии для подведения итогов, анализа и интерпретации данных - то есть он должен использовать правила, эвристики или схемы, которые позволят ему формировать новые выводы. Способность интуитивного ученого исследовать свое социальное ок­ руж ение, соответственно, будет зависеть от точности и адекватности его ги­ потез, доказательств и анализов. Наоборот, любые систематические ошибки в существующих теориях, предубеждения в доступных данных или несоот­ ветствия в методах анализа, влекут за собой серьезные последствия, к ак для психолога-любителя, так и для общества, которое он создает. Эти недостат­ ки , исследуемые с точки зрения современной теории атрибуции, подробно анализирую тся в этой гл а в е.1 Основные принципы теории атрибуции были предлож ены Хайдером (H eider, 1944,1958) и развиты более детально Джонсом и Девисом (Jones & D avis, 1965), К елли (Kelley, 1967,1971, 1973) и их коллегами (см. Jones и другие, 1971; W einer, 1974). В центре внимания этих ученых находились две родственные задачи, с которыми сталкивается ученый-любитель. Пер­ вая - задача причинны х суждений: исследователь стремится определить причину или набор причин, к которым можно приписать отдельно взяты й эффект (то есть, некоторое действие или исход). Вторая - задача социально­ го предполож ения: наблюдатель события делает выводы относительно ат­ рибуции или намерений действующ их лиц, а такж е относительно призна­ ков или свойств ситуаций, н а которые они реагировали. И причинны е оценки, и задачи социального предположения были пред­ метом интенсивного теоретического и эмпирического исследования и , до недавнего времени, ф актически доминировали в теории атрибуции. В пос­ леднее врем я, однако, начала получать некоторое внимание третья задача интуитивного психолога - прогнозирование или оценка исходов и поведе­ ния. И нтуитивны й психолог должен не только искать объяснения и делать выводы о нам ерениях; он должен такж е формировать ож идания и вы ска­ зы вать предполож ения относительно действий и исходов, неизвестных в на­ стоящ ее время или которые произойдут в будущем. Н апример, когда к ан ­ дидат в президенты обещает «облегчить бремя среднестатистического нало­ гоплательщ ика», мы рассматриваем возможные причины для этого заяв­ ления и делаем выводы относительно личны х свойств кандидата. (Возмож­ 1 Для более полного и систематического объяснения параллели обыватель-ученый, совету­ ем читателю обратиться к работе Нисбетта и Росса, 1980. Недостатки процесса атрибуции... 155 но, обещание просто отвечало требованиям политической целесообразнос­ ти? Можем ли мы сделать какие-то выводы об истинны х убеждениях кан ­ дидата?) Но мы такж е, вероятно, будем размы ш лять о последующем пове­ дении этого кандидата и его взглядах, которые касаю тся еще не исследо­ ванны х проблем. (Если его изберут, снизит ли он налог на прибыль с недви­ жимости? Одобряет ли он сокращ ение программ социального обеспечения?) Таким образом, психология интуитивного предсказания является естествен­ ным продолжением теории атрибуции. Три задачи атрибуции взаимозависимы согласно логики и психологии. О бъяснения события и выводы о лю дях, производящ их действия, а такж е объектах, которые вовлечены в действие, глубоко связаны . Все вместе они обеспечивают основание для размы ш ления относительно характера собы­ тий, которые являю тся в настоящ ее время неизвестными или, вероятно, произойдут в будущем. К аж дая задача, однако, предлагает уникальны е воз­ можности (и уникальны е задачи интерпретации и методологии; см. Ross, 1977, стр. 175-179) для раскры тия предположений и стратегий, которые леж ат в основе поведения интуитивного ученого. Стоит отметить, что в на­ стоящее время стало популярным использование оценок и прогнозов как зависимых переменных в исследованиях предположений обывателей. Одна из причин этой увеличивш ейся популярности особенно важ на. Оценки или предсказания новых или неизвестных событий могут часто вы полняться от­ носительно их точности в отличие от причинных оценочных суждений, которые исходят из анализа события. То есть можно сравнивать прогнозы и оценки событий с ф актическими наблюдениями или измерениями. Это по­ зволяет делать оценку к ак относительной адекватности стратегии атрибу­ ции, которую использует интуитивный ученый, так и направления отдель­ но взяты х ошибок и предубеждений. Логические принципы ат рибуции или эгоцентрические предубеж­ дения Современная теория атрибуции преследовала две отличительны х, но взаи­ модополняющих цели. Во-первых, продемонстрировать, что оценки и вы ­ воды человека согласуются с некоторой логической или рациональной мо­ делью. Во-вторых, проиллю стрировать и объяснить источники предубеж­ дений или ош ибки, которые искаж аю т эти, по большому счету, правиль­ ные оценки и выводы. Мы кратко рассмотрим так называемые логические или рациональные правила, используемые интуитивным психологом, а за­ тем остаток главы посвятим источникам ошибок в его попы тках понима­ ния, прогнозирования и управления событиями, которые разворачиваю т­ ся вокруг него. Принципы “ковариации” и “дисконтирования”. Люди должны, в боль­ шинстве случаев, разделять общее понимание социальных действий и исхо­ 156 ПРИЧИННОСТЬ И АТРИБУЦИЯ дов, которы е их затрагиваю т, поскольку без такого согласия, социальное взаимодействие было бы хаотичным, непредсказуемым и неуправляемым. Самоанализ, проведенный теоретиками в области атрибуции, подкрепленный лабораторными доказательствами, привел к утверждению набора “правил”, которые могут использоваться в интерпретации поведения и исходов. Эти пра­ вила “здравого смысла” или схемы аналогичны, в некотором смысле более формальным правилам и процедурам, которым следуют социологи и статис­ тики в своем анализе и интерпретации данных. К елли, Джонс и их помощ ники выделили два случая, в которых могут прим еняться логические правила или схемы. В случае множественного наблю дения приписываю щ ий имеет доступ к поведенческим данным, ко­ торые могли бы быть представлены к ак строки или колонки матрицы отве­ тов: действующий субъект х объект х ситуация (или случай). К ак прави­ ло, в этой области исследований участникам даны скорее заклю чительные утверждения, чем фактические ответы. Таким образом, потенциальный при­ писываю щ ий узнает, что “Больш инству театралов нравится новая пьеса П интера”, или “Мэри очень ж алеет беспризорных ж ивотны х” или “един­ ственная телевизионная программа, которую смотрит Энн - M asterpiece T heatre. ” В случае единичного наблюдения приписываю щ ий должен рас­ сматривать поведение единственного человека в одном случае. Например, он мож ет видеть, что Сэм исполняет просьбу экспериментатора нанести бо­ лезненны й удар другому человеку, или он мож ет узнать, что “Луи поставил все свои деньги в P im lico.” Логические правила или принципы , управляю щ ие атрибуциями в этих двух случаях, довольно различны (K elley, 1967,1971,1973). В случае мно­ жественного наблюдения приписываю щ ий применяет “принцип ковариа­ ц ии ”; то есть он оценивает степень, в которой наблюдаемое может происхо­ дить в отсутствие каж дого рассматриваемого причинного фактора. Соответ­ ственно, приписываю щ ий делает вывод, что новая пьеса П интера - хороша в той степени, что она нравится ш ирокому кругу театралов, вы звала похва­ лу людей, которым нравится мало пьес (например, “критикам ”), и что ей рукоплескали так ж е энергично на девяностый день ее постановки, к ак и на девяты й. В случае единичного наблю дения стратегия оценки приписываю щ его вклю чает применение “принципа дисконтирования”, с помощью которого социальный наблюдатель “обесценивает” роль любого причинного фактора в объяснении события настолько, насколько другие вероятные причины или детерминанты могут быть идентифицированы. Этот принцип атрибуции мож ет быть по-новому сформулирован скорее в терминах социальных вы ­ водов, чем причинны х атрибуций: насколько ситуативные или внеш ние ф акторы предоставляю т “достаточное” объяснение события, настолько это событие приписано ситуации, и логически невозможно сделать никакого вывода (возможно, и опытным путем) относительно поведения человека. Наоборот, в какой степени действие или исход происходит вопреки, а не Недостатки процесса атрибуции... 157 благодаря сопутствующим ситуативным силам, настолько соответствующее событие приписы вается человеку и делается “соответствую щ ий вы вод” (Jones и D avis, 1965), то есть приписываю щ ий выводит существование и влияние некоторой черты , способности, намерения, чувства или другого свойства, которое могло объяснить действие актора или исход. Таким обра­ зом, мы не согласны с выводом, что крайне рискованная азартная игра Л уи в Pim lico настолько отраж ала его устойчивые личны е качества, что необхо­ димо упомянуть такие факторы , к ак хорошие чаевые, глубокий финансо­ вый кризис или то, что до игры он вы пил семь рюмок мартини. С другой стороны, мы сочтем Луи неисправимым азартны м игроком, если узнаем, что он играл, несмотря на угрозу ж ены уйти от него, если он когда-нибудь снова потратит зарплату на скачках, несмотря на то, что он знал, что не смо­ ж ет оплатить ж илье, если проиграет, и, несмотря на подслушанное замеча­ ние эксперта, что фаворит на скачках проявляет себя «даже лучш е, чем со­ гласно предварительным оценкам». Стоит отметить, что применение двух различны х принципов предъявля­ ет различны е требования к интуитивному ученому. П ринцип ковариации требует, чтобы приписываю щ ий применял правила, которые являю тся ло­ гическими или статистическими по своей природе, и не требует никакого дальнейш его понимания характеристик рассматриваемых объектов. П ри­ менение принципа дисконтирования, наоборот, требует значительного по­ ним ания природы человека и таких ситуативных сил, как потребность в деньгах, потребление алкоголя и угроза супруги развестись. В некотором смысле, принцип ковариации может прим еняться простым “статистиком”, в то время к ак принцип дисконтирования требует знаний психологии, что­ бы оценить роль различны х социальных воздействий и ситуативных сил и даже отличать преднамеренные действия и исходы от непреднамеренных (ср. Jones и D avis, 1965). Доказательство систематического использования принципов атрибуции здравого смысла можно обнаружить, преж де всего, в исследовании с при­ менением анкетного опроса, в котором испытуемые читали и интерпрети­ ровали краткие рассказы о реакциях одного или нескольких людей н а не­ которые объекты при указанных обстоятельствах (например, L. Z. M cA rthur, 1972, 1976). Проведенные по этому поводу исследования меньш его масш ­ таба предоставили приписываю щ ему, по-видимому, подлинные ответы , события и исходы (например, Jones, Davis и G ergen, 1961; Jones и DeCharms, 1957; Jones и H arris, 1967; S trickland, 1958; T hibaut и Riecken, 1955). Это исследование показало, что приписываю щ ие могут использовать, по край ­ ней мере, некоторые гипотетические принципы или практические методы. То, что методологии, используемые до настоящ его времени, оставляли без вним ания, так это степень точности обывателей, а такж е величину и на­ правление их ошибок. 158 ПРИЧИННОСТЬ И АТРИБУЦИЯ Эгоцентричные мотивационные предубеждения в атрибуции. В размыш ­ лении относительно возможных искаж ений в другой логической системе атрибуции, теоретики быстро сформулировали предубеждения “эго-защ и­ ты ”, с помощью которого приписываю щ ие сохраняли или усиливали чув­ ство собственного достоинства или положительное мнение о своем поведе­ нии и способностях (H eider, 1958; Jones и D avis, 1965; Kelley, 1967). По­ п ы тки доказать сущ ествование такого мотивационного предубеж дения вклю чало проявление асимметрии в атрибуции положительных и отрица­ тельных исходов, в особенности, тенденция для действующих лиц припи­ сывать “успехи” своим собственным усилиям, способностям или поведению, а “ош ибки” - удаче, трудности задач или другим внеш ним факторам. Зада­ чи на успеваемость (например, D avis и D avis, 1972; F eather, 1969; Fitch, 1970; W olosin, Sherm an и Till, 1973) и обучающее поведение (например, Beckm an, 1970; Freize и W einer, 1971; Johnson, Feigenbaum и W eiby, 1964) предоставили яркое свидетельство этой асимметрии. Такж е было показа­ но, что действующие лица могут больше хвалить себя за успех и меньшее обвинять за неудачи, чем наблюдатель, оценивающий те ж е самые исходы (Beckm an, 1970; G ross, 1966; Polefka, 1965). К ритики, скептически относящ иеся к распространенным мотивацион­ ным предубеждениям, однако, испы тали трудности в экспериментальном подтверждении этого (см. M iller, Ross, 1975, такж е N isbett и Ross, 1980, см. гл. 10, для детального рассмотрения). Наиболее веские аргументы против исследования, показывающ его мотивационные предубеждения - это оче­ видное несоответствие между личным восприятием испытуемых и их выс­ казанны м и оценками. Можно без труда создать ситуации, в которых чело­ век будет публично отрицать ответственность (или заявлять о ней) за слу­ чай, который он на самом деле принимает (или не принимает) к ак свою от­ ветственность. В то время к ак вы сказанны е оценки могут быть эгоцентрич­ ны в смысле сохранения общественного мнения о себе, они не подразумева­ ют действие предубеждений эго-защ иты для сохранения репутации в своих собственных глазах (M iller, 1978). Кроме того, асимметрии в личны х приписываниях успеха и неудачи (не­ зависимо от того, были ли они доступны исследователям) и различия в оцен­ ках самих людей и наблюдателей могут отраж ать другие немотивационные источники предубеждений. К ак отметили некоторые исследователи, успех, по крайней мере, в экспериментальны х ситуациях, ожидается и не проти­ воречит прошлому опыту актора, в то время к ак неудача мож ет быть не­ предвиденной и неожиданной. Точно так ж е успешные исходы преднаме­ ренны и являю тся объектами планов и действий человека, в то время как, неудачи - это случайные события, которые возникаю т, несмотря на планы человека и его усилия. Н аблю датели, кроме того, редко знаю т о прошлом опыте или настоящ их ож иданиях и намерениях акторов, свидетелями чьих результатов они являю тся. Недостатки процесса атрибуции... 159 П опытки опровергнуть существование глубоких предубеждений эго-за­ щ иты , были к ак эмпирическими, так и концептуальны ми. Так, испытуе­ мые в некоторы х исследованиях проявляю т “контрзащ итны е” или умень­ ш аю щ ие оценку, предубеж дения. Н апример, Росс, Бьербрауер и Полли (Ross, Bierbrauer и Polly, 1974), используя достоверную парадигму учитель ученик, обнаруж или, что учителя оценивали свои собственные действия и способности к ак более важ ны е детерминанты скорее неудачи, чем успеха. И наоборот, учителя оценивали усилия и способности своих учеников как более важ ны е детерминанты успеха, чем неудачи. В этом ж е исследовании эти на вид контрзащ итны е тенденции атрибуции признавались больше сре­ ди профессиональных преподавателей, чем среди неопытных студентов стар­ ш их курсов, — результат, который противоречил очевидному выводу из теории эго-защ иты : то, чему непосредственно угрож ает неудача, должно быть более защ ищ енны м. Исследователи, настаивающ ие на существовании эгоцентричных мотива­ ционных предубеждений, могут, конечно, предоставить альтернативные ин­ терпретации исследований, в которых не проявляю тся мотивационные или контрзащ итные предубеждения (ср. Bradley, 1978). Действительно, во мно­ гих отнош ениях споры между сторонниками этой теории и скептиками ста­ ли напоминать более ранние и обширные споры о теории обучения и базового восприятия, в которых бесплодность поиска “решающего” эксперимента, ка­ сающегося мотивационных влияний (т э есть, такого, который не может ин­ терпретироваться “другой стороной”), стала более очевидной, чем во время накопления данных и усиления концептуального анализа. Одной из ответных реакций на такое положение дел должен был стать вре­ менный отказ от мотивационных конструкций и сосредоточение внимания на немотивационных факторах (то есть, информационных и познавательных, а такж е факторах восприятия), которые влияют и потенциально искажают оцен­ ки атрибуции. Помимо существующих концептуальных трудностей, смешан­ ных результатов, полученных опытным путем, и исторических уроков, пре­ пятствующих исследователям, которые искали бы мотивационные предубеж­ дения, существуют две дополнительные причины для изменений в настоящий момент. Во-первых, все возрастает убеждение, что более серьезная оценка не­ мотивационного влияния могла бы привести к пониманию и предвосхищению тех обстоятельств, в которых приписывания ответственности увеличили бы чувство собственного достоинства приписывающего, а такж е обстоятельств, в которых такие приписывания уменьшили бы его (ср. M iller и Ross, 1975). Вовторых, все больше признается тот факт, что точные атрибуции вообще явля­ ются более “эгоцентричными”, чем неточные, то есть, что искаж ения причин­ ного суждения способны приводить организм в состояние, плохо подготовлен­ ное к задаче долгосрочного вы живания, каким и бы благоприятными ни были немедленные последствия неточных восприятия и влияний. О стальная часть этой главы рассматривает ограниченное количество та­ ких немотивационных предубеждений (см. N isbett и Ross, 1980, для более 160 ПРИЧИННОСТЬ И АТРИБУЦИЯ полного обзора). В ней такж е обсуждается явление, которое увеличивает “удельный вес” таких предубеждений - сохранится тенденция ошибочных впечатлений, оценок и даже более обширных теорий, несмотря на наличие логически мощ ных данных, противоречащ их этим убеждениям. Давайте признаем с самого начала, что ошибки и предубеждения, с которыми мы стал­ киваемся вовсе не являю тся необъяснимыми погрешностями со стороны ин­ туитивного ученого. К ак правило, они отражают действие механизмов и стра­ тегий, которые вполне хорошо удовлетворяют потребности организма во мно­ гих обстоятельствах; иначе они не пережили бы историю обучения человека или эволюционную историю вида. Эти ошибки и предубеждения могут спра­ ведливо быть расценены как “определенные сферы” сбоя логически выведен­ ных стратегий и тактик, которые целесообразны (и вероятно, такж е весьма точны) с точки зрения опыта организма в целом. Н е м о ти в а ц и о н н ы е п р ед у б еж д ен и я атр и б у ц и и Ф ундам ент альная ошибка атрибуции И дентифицированное первым (H eider, 1958) и наиболее часто упоминаемое немотивационное предубеждение, которое мы назовем фундаментальной ошибкой атрибуции, — это тенденция наблюдателей недооценивать воздей­ ствие ситуативных факторов и переоценивать роль диспозиционных ф ак­ торов на поведение других. Будучи “ интуитивными ” психологами, мы, вероятно, слиш ком часто оказы ваем ся нативистами или сторонниками ин­ дивидуальны х различий, и слиш ком редко бихевиористами. С большой го­ товностью мы рассуждаем о чертах характера и ожидаем последовательно­ сти в поведении или исходах в совершенно несопоставимых ситуациях и контекстах. Мы делаем поспешные выводы после наблюдения поведения других людей, не замечая воздействия соответствующих сил окружаю щ ей среды и ограничений. Общие факты, свидетельствующие о фундаментальной ошибке атрибуции. Помимо коротких рассказов и обращения к опыту, наиболее часто упоминаемое свидетельство для этого предубеждения (например, Jones и Nisbett, 1971; Kelley, 1971) заключается в очевидной готовности наблюдателей делать “соответствующие” личные выводы от­ носительно участников исследования, реагирующих на явное давление ситуации. На­ пример, Джонс и Харрис (Jones и Harris, 1967) обнаружили, что слушатели находили некоторое соответствие между замечаниями участников дискуссии в поддержку Каст­ ро и их личными установками даже, если слушатели знали, что участники дискуссии повиновались экспериментатору, и у них не было выбора. Более прямое доказательство того, что наблюдатели могут игнорировать или недооценивать давление ситуации, предоставил Бирбрауэр (B ierbrauer, 1973), когда изучал впечатления испытуемых от воздействия в классичес­ ком эксперименте М илграма (1963). В исследовании Бирбрауэра, участни­ ки были свидетелями дословного воспроизведения акта “повиновения” од- Недостатки процесса атрибуции... 161 ного из испытуемых, готового нанести максимальны й разряд электрош ока предполагаемой ж ертве. Независимо от того, почему и насколько произош ­ ла задерж ка в выставлении оценок, независимо от того, обладали они за­ конным правом делать оценки или просто наблюдали, участники исследо­ вания Бирбрауэра допустили фундаментальную ош ибку атрибуции. То есть они последовательно и серьезно недооценивали степень, в которой испыту­ емые уступили бы давлению ситуации, которое вызвало повиновение в экс­ перименте М илграма (см. Рисунок 1). Другими словами, они предполага­ ли, что повиновение отдельно взятого испытуемого выражало скорее его лич­ ные характеристики, чем возможности ситуативных воздействий и огра­ ничений, под влиянием которых оказались все испытуемые. Особый случай преимущества, обусловленного ролью, при самопрезентации. Тенденция социальных наблюдателей недооценивать возможности вли­ ян и я и ограничений ситуации и переоценивать роль индивидуальных черт часто наблюдалась в стратегии, концептуальных исследованиях и даже про­ фессиональных спорах представителей современной социальной психоло­ гии (см. N isbett и Ross, 1980; Ross, 1977). Особые случаи этой фундамен­ тальной ош ибки атрибуции помогают сосредоточить наш е внимание на про­ цессах-посредниках и более специфических ош ибках интуитивного психо­ лога. Важным с этой точки зрения является эксперимент Росса, Эмебайл и Стейнмец (Ross, Am abile и Steinm etz, 1977), в ходе которого анализирова­ лись оценки, сделанные относительно участников, роли которы х (случай­ но назначенные) давали или не давали им преимущ ество. Росс и др. рас­ сматривали роли ведущего и игрока в викторине по выявлению общ их зна­ ний. Роль ведущ его обязы вала испытуемого составить набор вопросов по общим знаниям , излож ить эти вопросы игроку и обеспечивать точную об­ ратную связь после каж дого ответа игрока. Роль игрока была ограничена ответом или попыткой ответить на соответствующие вопросы. От двух уча­ стников (и, в последующем воспроизведении, такж е от наблюдателей) тре­ бовалось оценить общие знания к ак ведущ его, так и игрока. Произвольное назначение и выполнение этих ролей заставило участни­ ков и наблюдателей сталкиваться с очевидно нерепрезентативными или ис­ каж енны м и “выборками” знаний ведущ их и игроков. Роль ведущего спо­ собствовала демонстрации скры ты х знаний и давала возможность избежать ситуаций, показы ваю щ их их невежество; игроки ж е были лиш ены таких преимущ еств в самопрезентации. Действительно, не было сомнения в про­ извольности назначения роли или в различии преимущ еств, связанны х с каж дой ролью, в отличие от ситуаций реальной ж изни, в которых соци­ альны е роли так ж е предоставляют преимущ ества и неудобства в самопре­ зентации. Однако соревнование в неравных условиях между ведущ ими и игроками последовательно вело к предубеждениям и ошибочным впечатле­ ниям. У частники, в некотором смысле, просто не сумели сделать скидку на преимущ ества и неудобства соответствующих ролей, обусловленных ситу- ПРИЧИННОСТЬ И АТРИБУЦИЯ 162 q х ф а Прогнозы, сделанные б ез промедления X А Задерж ка прогнозирования, вызванная смущением ф д Задерж ка прогнозирования без смущения О X X §■ Ф Значения, полученные Милграмом (1963) о а Уровень электрошока Волы Р и с -1. Сравнение спрогнозированных и ф актических значений не­ повиновения ацией. Таким образом, игроки оценили своих ведущ их выш е себя, а неза­ висимые наблюдатели согласились с этим (см- Рисунок 2). Наблюдатели, вооруженные знанием, что ведущие не смогли бы ответить на заданные воп­ росы лучш е, чем игроки, должны были признать, что уровень знаний игро­ ков не был таким уж низким . Вместо этого, они сделали вывод, что ведущие обладали действительно выдаю щ имися знаниями- Интересно, что самих ведущ их не ввела в заблуждение слож ивш аяся ситуация- Этот ф акт смещ а­ ет наш е внимание с сущ ествования фундаментальной ош ибки атрибуции и определенного воздействия социальных ролей к особым “выборкам данных”, на которые полагались различны е участники в своих выводах. Рис. 2. Оценки общих знаний ведущ их и игроков Недостатки процесса атрибуции... 163 В отличие от игроков и наблю дателей, ведущие не были вынуждены пола­ гаться исклю чительно на “искаж енны е” выборки общих знаний. Возмож­ но, они обладали рядом дополнительных доказательств степени и ограни­ ченности собственных общих знаний, а такж е относительно нерепрезентативности той информации, которую они показали в своих вопросах; следо­ вательно, они оценили, и свои знания, и знания игроков к ак “средние”. И социальное, и теоретическое значение эксперимента Росса, Эмебайл и Стейнмец вполне понятно. Он побуждает нас рассматривать бесчисленные социальные контексты , в которы х официальные или неофициальные роли ограничиваю т межличностное взаимодействие и, таким образом, искаж а­ ют впечатления участников настолько, что каж утся оправданными преро­ гативы и ограничения, наложенные выгодными или невыгодными ролями. Он такж е побуждает нас заострить внимание на одной из ошибок интуитив­ ного ученого - его каж ущ ейся нечувствительности к ограниченному значе­ нию искаж енны х выборок данных (см. такж е H am ill, W ilson и N isbett, 1980; N isb e ttn Ross, 1980, Гл. 4). Предубеж дения замет ност и и доступност и Возможно, наиболее исследованная область предубеж дения атрибуции, которая вклю чает эффекты вним ания, а такж е когнитивны х факторов и факторов восприятия, которы е опосредуют внимание. О казы вается, что всякий раз, когда некоторый аспект окружаю щ ей среды становится непро­ порционально сущ ественным или “доступным” для человека, воспринима­ ющего его (cp. Tversky и K ahnem an, 1973,11), этому аспекту придаю тбольше значения в причинно-следственном приписывании. Таким образом, ког­ да участник визуально привлекает на себя внимание из-за особенного расо­ вого или сексуального статуса в пределах большей группы (Taylor и другие, 1976), из-за некоторой поразительной особенности внешнего вида или одеж­ ды (M cA rthur и P ost, 1977; M cA rthur и Solom an, 1978), из-за поставленной учителем задачи (R egan и T otten, 1975), или даж е из-за размещ ения людей на местах или других показателей визуальной перспективы (например, Storm s, 1973; T aylor и Fiske, 1975), то на этого человека налагается непро­ порционально больш ая ответственность за любой результат его действий. (См. T aylor и Fiske, 1978, для более полного обзора.) Действительно, множе­ ство исследований, полученных на основе теории “объективного самосоз­ н ания” (D uval и W icklund, 1972; W icklund, 1975) показали, что навосприятие людьми их собственных причинны х ролей можно такж е повлиять с по­ мощью простых м анипуляций, которые направляю т их внимание на себя как социальны х объектов или наоборот (например, D uval и H ensley, 1976; Ellis и Holmes, 1979). П ризнание и понимание того, к ак факторы заметности или доступности влияю т на процесс атрибуции, могут помочь лучш е понять основы многих знакомы х предубеждений атрибуции, а такж е логически выведенных пре­ 164 ПРИЧИННОСТЬ И АТРИБУЦИЯ дубеждений, возможно даж е отнеся их к особым случаям. Ф ундаменталь­ н ая ош ибка атрибуции, например, может отраж ать тот ф акт, что участни­ ки являю тся просто более заметными, чем условия окружаю щ ей среды и поэтому более вероятно, что они будут первоначально замечены при поиске причинны х факторов. Действительно, когда ситуативные факторы и огра­ ничения становятся непропорционально заметными для наблю дателя, мы можем ож идать ошибок атрибуции, которые каж утся противоположными так называемой фундаментальной ош ибке. Таким образом, инспектор мо­ ж ет ошибочно приписать действительно хорошее выполнение задания ра­ бочим внеш нему фактору, то есть своему наблюдению, когда этот внеш ний фактор становится чрезвычайно существенным (см. S trickland, 1958). Точно такж е, внутренний интерес человека при выполнении данной задачи мо­ ж ет бы ть подорван (например, Deci, 1971; Lepper и G reene, 1975, 1978; Lepper, G reene, и N isbett, 1973), если его внимание сосредотачивается на внеш нем стимуле или ограничении, которое, к ак каж ется, поощ ряет, но не обязательно, выполнение этой задачи. Рассмотрим такж е эмпирическое обобщение Джонса и Нисбетта (Jones & N ibbett, 1971), согласно которому акторы, объясняя свое поведение, больше склонны ссылаться на ситуативные факторы и менее - на факторы, относя­ щ иеся к характеру самого человека, чем наблюдатели такого поведения. Н а­ сколько участники и наблюдатели проявляю т соответствующие различия в том, что находится в их центре внимания, то есть участники проявляю т инте­ рес к соответствующим особенностям окружаю щ ей среды, в то время как наблюдатели сосредотачивают свое внимание непосредственно на участни­ к а х ,- настолько обобщение Джонса и Нисбетта становится особым случаем обобщения внимания/атрибуции. Действительно, экспериментально подтвер­ ждено что, перемещ ая центр внимания акторов и наблюдателей, их тенден­ ции ссы латься на ситуативные или на внутренние причины, могут аналогич­ но меняться (например, Storm s, 1973; Taylor и Fiske, 1975). Н аконец, рассмотрим недостаток, отмеченный проницательным вымыш ­ ленны м детективом-психологом Ш ерлоком Холмсом - тенденцию недооце­ нивать значение не-происшествий (non-occurence). Информативные не-происшествия - это события или действия, которые не произош ли в некотором контексте, но которы е, таким образом, содерж ат потенциально важную информацию (ср. Росс, 1977). Определенная релевантность низкой когни­ тивной доступности не-происш ествий долж на быть очевидна. П ри исследо­ вании или рассмотрении причинных факторов, не-происш ествия вряд ли являю тся высоко заметными или вряд ли им уделяется внимание; соответ­ ственно, невозможно придать им достаточно значения в объяснении наблю­ даемы х действий и исходов. Д ж илл, скорее всего, припиш ет гнев Д ж ека чему-то, что она «соверш ила», чем чему-то, чего она не смогла сделать, про­ сто потому, что первое является более заметным для нее, чем последнее. Дей­ ствительно, приним ая во внимание, что вина упущ ения является менее су­ Недостатки процесса атрибуции... 165 щ ественной, чем вина соверш ения поступка, Д ж ек способен допустить ту ж е самую ош ибку в объяснении причин собственного гнева. Ложный консенсус или эгоцентрическое предубеждение атрибуции Последнее немотивационное или “информационное” предубеждение, рас­ сматриваемое в этой главе, касается оценок человеком социального согла­ сия - каж ущ аяся обычность или необычность различны х реакций, кото­ рые они наблюдают. В отличие от профессионального психолога, который полагается на четкие методы формирования выборки и статистические про­ цедуры для проведения таких оценок, обыватель, долж ен полагаться на интуицию и субъективные впечатления, основанные на соответствующих данны х, доступ к которым у него ограничен. Возможностей для предубеж­ дения в таких оценках и в различны х социальных выводах или приписыва­ ниях, которы е отраж аю т такие оценки, очень много. Определенное преду­ беждение приписы вания, которое мы здесь рассмотрим, касается тенден­ ции людей чувствовать “лож ны й консенсус”, то есть считать свои собствен­ ные поведенческие выборы и оценки к ак относительно обычные и соответ­ ствующие данным обстоятельствам, рассматривая альтернативны е ответы как необычные, ненормативные и несоответствующие. Ссылки на “эгоцентрическую атрибуцию ” (H eider, 1958; Jones и N isbett, 1971), “атрибутивное проектирование” (Holm es, 1968) и на определенные выводы и явления, связанные с предубеждениями ложного консенсуса, слу­ чайно появились в литературе, посвящ енной социальному восприятию и приписыванию (ср. K atz и A llport, 1931; K elley и Stahelski, 1970). Возмож­ но, наиболее веское свидетельство можно найти в ряде исследований Росса, Грина и Х ауса (Ross, G reene & H ouse, 1977). В первом упомянутом исследовании, испытуемые рассматривали описа­ ния гипотетических конфликтны х ситуаций, с которыми они могли бы стол­ кнуться и долж ны были (а), оценить обычность двух возможных альтерна­ тив реакции; (Ь) указать альтернативу, которую они сами бы избрали; (с) оценить черты “типичного” человека, который выбрал бы каж дую из двух указанны х альтернатив. Оценки продемонстрировали эффект “ложного консенсуса”; испытуемые рассудили, что альтернатива, которую они выбрали, будет более обычная, чем невыбранная альтернатива. Очевидное заклю чение к предположению лож ­ ного консенсуса - то, что интуитивный психолог оценивает те реакции, кото­ рые отличаются от его собственных, к ак раскрывающ ие устойчивые черты характера действующего лица в более полном объеме, чем реакции, подоб­ ные его собственным. Данные Росса, Гринаи Хауса (1977) подтверждают этот прогноз; испытуемые делали сравнительно более достоверные и крайние про­ гнозы относительно типичного человека, который осуществил бы невыбранную испытуемым альтернативу, чем относительного того, кто осуществил бы выбранную альтернативу. 166 ПРИЧИННОСТЬ И АТРИБУЦИЯ Термин относительный является критическим в этой формулировке предубеж дения лож ного консенсуса и требует некоторого разъяснения. Очевидно, человек, которы й идет по канату натянутом у меж ду двумя не­ боскребами, устраивает революцию или принимает обет безбрачия, призна­ ет, что немногие люди разделили бы его выбор. Предубеждение ложного кон­ сенсуса, однако, привело бы его к пониманию своего выбора к ак более нор­ мального, чем показалось бы лю дям, которые не стали бы ходить по канату, устраивать революцию или принимать обет безбрачия. Точно так ж е тезис признает, что для некоторых категорий реакции оценки всех оценивающих могут иметь отклонения в равной степени. Случаи жестокого обращ ения с детьми, например, могут быть одинаково недооценены как родителями, ж е­ стоко обращ ающ имися со своими детьми, так и обычными родителями. От­ носительные термины гипотезы ложного консенсуса приводят только к про­ гнозированию того, что родители, жестоко обращ ающ иеся со своими деть­ м и, оценят это явление как более обычное и менее раскрываю щ ее личные качества, чем обычные родители. П ри заклю чительной демонстрации Росса, Грина и Хауса (1977) не ис­ пользовалась гипотетическая методология анкетного опроса, а испытуемые были поставлены в условия реальной и последовательной ситуацию конф ­ ликта. И спытуемых попросили походить по студенческому городку в тече­ ние 30 минут с рекламны м щ итом, на котором было написано «Обедайте в каф е “У Д ж о” ». Экспериментатор пояснил испытуемым, что они могут лег­ ко отказаться от участия в исследовании, но ему бы хотелось, чтобы они участвовали и “помогая научно-исследовательской работе, узнали кое-что интересное”. Затем испытуемых просили принять реш ение относительно участия в исследовании, оценить вероятные реш ения других и сделать вы ­ воды относительно черт характера людей, согласивш ихся или отказавш их­ ся участвовать. Результаты этой “реальной” конфликтной ситуации (Табл. 1) подтвер­ дили выводы более ранних исследований в форме анкетного опроса, касаю ­ щ ихся гипотетических ответов. В целом, испытуемые, согласивш иеся но­ сить рекламны й плакат, оценили, что 62% человек сделает такой ж е вы ­ бор. И спытуемые, которые отказались это делать, оценили, что только 33% лю дей и сп олн и т просьбу эксп ери м ен татора. К роме того, к а к и было спрогнозировано, согласившиеся и не согласившиеся испытуемые резко рас­ ходились в относительной силе выводов, которые они хотели сделать о че­ ловеке, согласивш емся и отказавш емся носить рекламны й плакат. Согла­ сивш иеся испытуемые сделали более уверенные и экстремальные выводы относительно личны х характеристик отказавш егося человека; не согласив­ ш иеся испытуемые сделали более резкие выводы относительно согласив­ ш егося человека. Недостатки процесса атрибуции... 167 Таблица 1. Эффект ложного консенсуса: оценки обычности и выводы от­ носительно черт характера с точки зрения двух альтернатив поведения Оценен­ ная обыч ность согласия (%) Испытуемые, согласившиеся носить плакат Испытуемые, отказавшиеся носить плакат Сила выводов относительно черт характера* ОцененО тестиО тестя­ ная обыч- руемых, руемых, ность отказа согласивотказав(%) шихся носить шихся носить плакат плакат 62 38 120,1 125,3 33 67 139,7 106,8 а) сумма оценок для четы рех черт; большее число обозначает большую уверенность и более крайние выводы Источник: обобщено из Ross, G reene и H ouse (1977). Общие выводы по результатам Росса, Грина и Х ауса (1977) для наш ей кон­ цепции интуитивного психолога очевидны. Оценки отклонения и нормы, и совокупность социальных выводов и межличностных реакций, которые со­ провождаю т такие оценки, являю тся смещ енными в соответствии с соб­ ственными поведенческими выборами обывателей. Очевидно, что анализ приписы вания мож ет быть искаж ен не только ош ибками в анализе соци­ альны х данны х интуитивным психологом, но такж е и более ранними пре­ дубеждениями в формировании выборки или оценке таких данных. Некоторые немотивационные факторы играю т роль в создании явлений ложного консенсуса. Главные среди них: (а) факторы выборочного воздей­ ствия и доступности; (Ь) факторы , имеющие отношение к разреш ению си­ туативной неоднозначности. Ф акторы выборочного воздействия, леж ащ ие в основе ложного консен­ суса, довольно просты. Очевидно, мы знаем и общ аемся с лю дьми, которые разделяю т наш опыт, интересы, ценности и взгляды . Эти люди действитель­ но реагирую т так, к ак отреагировали бы мы в ш ироком разнообразии обсто­ ятельств. Действительно, наш е окруж ение частично определено чувствами общего консенсуса, и мы склонны избегать тех, кто вряд ли разделяет наш и оценки и реакции. Тот ф акт, что мы выступаем перед пристрастной выбор­ кой людей и поведения не требует, чтобы мы допускали ош ибку в наш их оценках относительно соответствующих совокупностей, но оно делает та­ кие ош ибки вероятными. Ф акторы , усиливаю щ ие наш у способность вспо­ 168 ПРИЧИННОСТЬ И АТРИБУЦИЯ м инать, визуализировать или воображать образцовые случаи поведения являю тся более тонкими и когнитивны ми по характеру. В данной ситуа­ ции определенные типы поведения, которые мы выбрали или выбрали бы могут быть с большей легкостью восстановлены из памяти и более легко пред­ ставлены , чем противоположные типы поведения. Согласно Канеману и Тверскому (1973,4) поведенческие выборы, которым мы отдаем предпочте­ ние, могут быть более когнитивно “доступны”, и нас можно ввести в заб­ луж дение этой легкостью или трудностью доступа при оценивании вероят­ ности соответствующ их поведенческих выборов. Второй немотивационный источник эффекта ложного консенсуса явл я­ ется результатом реакции интуитивного психолога на неоднозначность к а к относительно природы и величины ситуативных сил, так и относитель­ но значения и последствий различны х альтернатив реакции. П опытки снять такую неоднозначность включаю т интерпретацию , оценку и догадки, при­ чем все это мож ет оказы вать параллельны й эффект на собственные выборы поведения наблюдателей, а такж е на их прогнозы и выводы относительно выборов других людей. Таким образом, испытуемые, которые ож идали и боялись насмеш ек других людей, потому что на них была табличка «Обе­ дайте в каф е “У ДЖ О” », а такж е те, которые сочли пож елания и ож идания экспериментатора банальны ми, вероятно, откаж утся носить рекламны й щ ит, поддерж ат подобные отказы других людей и сделают соответствую­ щ ие выводы относительно черт характера любого испытуемого, который со­ гласился носить табличку. Противоположные приоритеты, конечно, при­ вели бы к противоположным личным выборам и противоположным соци­ альны м оценкам и выводам. И так, предубеждение ложного консенсуса, к ак отраж ает, так и создает искаж ения в процессе атрибуции. Оно следует из неслучайного формирова­ н ия выборки и поиска свидетельства и от необычного реш ения неоднознач­ ны х ситуативны х факторов и сил. В свою очередь, оно смещ ает оценки от­ носительно нормы и отклоняется и увеличивает расхож дения и ошибки в интерпретации социальных явлений. У сто й ч и в о сть у б еж д ен и й в о п р ек и о п ы ту Различны е недостатки интуитивного психолога, те, которые описаны в этой главе и ряде других работ (см. N isbett и Ross, 1980), могут привести его к тому, что он будет придерж иваться убеждений о себе, других лю дях или даж е природе социального мира, которые являю тся преждевременными и ош ибочными во многих случаях. П ока о них никто не знает и никто на них не влияет, такие убеж дения могут казаться непоследовательными - просто предварительными по сути и адаптивными к новым входным данным. По­ степенно увеличиваю щ ийся объем теории и исследования, однако, может теперь привести к совершенно противоположному выводу. Недостатки процесса атрибуции... 169 О казы вается, что убеж дения, от относительно узких личны х впечатле­ ний до более ш ироких социальных теорий, являю тся очень устойчивыми вопреки опыту, который каж ется логически разруш ительны м. Две пара­ дигмы иллюстрируют эту устойчивость. П ервая включает способность убеж­ дения продолжает сущ ествовать и усиливаться новыми данны ми, которые, с нормативной точки зрения, должны приводить к тому, что убеждения ста­ новятся более умеренными. Вторая вклю чает сохранение убеждений после отрицания их первоначальных оснований. Устойчивость убеждений и поляризация в свете появления новых данны х Люди, общественные организации, группы интересов и даж е нации часто обладают различаю щ имися убеждениями о важ ны х социальных или поли­ тических проблемах. Такие расхож дения во мнениях едва ли являю тся уди­ вительными. У читы вая неофициальное и часто чисто интуитивное основа­ ние, на котором такие мнения базирую тся, а такж е роль, которую соци­ альные коммуникации (часто очень необъективные) играю т в формирова­ нии наш их убеждений, разногласия являю тся неизбежными. Но что про­ исходит, когда сторонникам различны х точек зрения, позволяю т проана­ лизировать определенное свидетельство, особенно, когда оно носит формаль­ ный характер и идентично для всех заинтересованных сторон? Оптимистическое ожидание состоит в том, что соперничающие группиров­ ки наш ли бы компромисс между своими убеждениями. Этот компромисс может вклю чать смещение в сторону позиции, определенной соответствую­ щим свидетельством, если оно последовательно и неоспоримо; с другой сто­ роны, он мог бы состоять из изменения в сторону большей умеренности или взаимной терпимости, если свидетельство неоднозначно или неокончатель­ но. Менее оптимистическое ожидание состоит в том, что соперничающие груп­ пировки остались бы при своих точках зрения; то есть они проигнорировали бы новое свидетельство и устойчиво придерживались бы своих первоначаль­ ных позиций. Недавний эксперимент, проведенный Лордом, Леппером и Рос­ сом (Lord, Lepper & Ross, 1979), приводит к более удручающему выводу (по крайней мере, для тех, кто надеется или ожидает, что объективные данные ученого в области социальных наук урегулируют социальные споры). Лорд и другие (1979) сначала отобрали испытуемых, которые либо под­ держ ивали высшую меру н аказания, считая ее эффективной превентивной мерой (сторонники), либо выступали против высш ей меры наказания и по­ лагали, что она не является сдерживаю щ ей (противники). Испытуемых оз­ накомили с двумя подлинными эмпирическими исследованиями. Одно го­ ворило в поддержку их позиции; другое опровергало их мнение. При чтении этих исследований, две группы дали оценки относительно этих двух исследо­ ваний и изменений в своих собственных отнош ениях и мнениях. Эти оценки ярко показали способность сторонников определенной теории интерпретиро­ 170 ПРИЧИННОСТЬ И АТРИБУЦИЯ вать новое свидетельство так, чтобы усилить и подтвердить свою теорию. Вопервых, к ак сторонники, так и противники высшей меры наказания после­ довательно оценили исследование, поддерживающее их убеждения, к ак “бо­ лее убедительное” и “лучш е проведенное”, чем исследование, которое их оп­ ровергало. Во-вторых, и в отличие от любой нормативной стратегии, кото­ рую можно вообразить для вклю чения нового свидетельства в убеждения че­ ловека, влияние чтения двух исследований должно было еще больше поля­ ризовать убеждения противников и сторонников смертной казни. То, к ак про­ изош ла эта поляризация, было особенно очевидно (см. Рисунок 3). После чте­ ния краткого отчета о результатах, который поддерживал их точку зрения, убеждения испытуемых стали значительно более экстремальными; эти из­ менения поддерживались или увеличивались при рассмотрении подробнос­ тей относительно процедуры и данных. Наоборот, после чтения краткого от­ чета о результатах, который опровергал их собственную точку зрения, мне­ н ия испытуемых стали менее экстремальными; а после чтения соответству­ ющ их подробностей относительно процедур и данных испытуемые возвра­ щ ались к убеждениям, которые у них были до ознакомления с исследовани­ ем. Ф актически, большое количество испытуемых, которые прочитали, как резюме результатов, так и процедурные подробности исследования, опровер­ гающего их мнение, в конечном счете, стали более уверены в правильности этого убеждения! Таких эффектов не наблюдалось, когда те ж е самые резуль­ таты и процедуры были прочитаны испытуемыми, чьи начальные представ­ ления поддерживались. Очевидно, профессиональные ученые часто виновны в той ж е ошибке, что и интуитивны е. Снова и снова каж ды й видит к ак соперничающ ие груп­ пировки, которые вовлечены в академические споры - является ли их те­ мой происхождение Вселенной, эволюция человека или существование пре­ дубеждений атрибуции эго-защ иты - получают поддерж ку для своих раз­ личаю щ ихся мнений из одного и того ж е источника. Далее в этой главе мы подробно рассмотрим процесс, леж ащ ий в основе таких явлений и более конкретно прокомментируем нормативный статус готовности ученого пе­ рерабатывать свидетельство в свете существующих теорий и ожиданий. Сна­ чала необходимо рассмотреть второй общий класс явлений устойчивости. Недостатки процесса атрибуции... Являются сторонниками высшей меры наказания Е ) I сторонники I 171 +3 противники +2 +1 Без изменений О Являются противниками высшей меры наказания Является превентивной Не является превенмерой тивнои мерой ------- 1------------ 1--------------- 1------------ - 1 2 3 4 -1 - ----- 4 Результаты Подробности Результаты Подробности Являются сторонниками высшей меры наказания +2 +1 Без изменений О -1 Являются противниками высшей меры наказания Является превентивной Не является превенмерой тивной мерой 1 2 3 -2 4 Результаты Подробности Результаты Подробности Рис. 3. Верхний рисунок: изменение отнош ения к высш ей мере на­ казан и я, сообщаемое испытуемыми, вовремя эксперимента, кото­ рые сначала рассматривали исследование, подтверждающее эффек­ тивность смертной казни в предотвращ ении преступлений. Н иж ­ ний рисунок: изменение отнош ения к высш ей мере наказания, со­ общаемое испытуемыми, вовремя эксперимента, которые сначала рассматривали исследование, опровергающее эффективность смер­ тной казни в предотвращ ении преступлений 172 ПРИЧИННОСТЬ И АТРИБУЦИЯ Устойчивость убеждений после очевидной дискредитации И ногда, убеждениям угрожаю т не новые данные, а скорее требования при­ вести свидетельство формирования такого убеж дения, то есть прежде всего информацию или анализ, который привел к формированию этого убежде­ н ия. Н а уровне коротких рассказов легко привести такие примеры. Салли терпит неудачу в своих первых попы тках научиться кататься на коньках и затем вы ясняет, что коньки, которые она позаимствовала, были слиш ком больш ие, чтобы обеспечивать ей поддерж ку в области лоды ж ек. Мэри пред­ полагает, что букет цветов Д ж она отраж ает заботу, романтичный характер и следование традициям, но затем узнает, что отец Джона - владелец цве­ точного м агазина. Более ш ирокие теории или убеждения о мире могут оспа­ риваться подобным образом. П риходящ ая няня на основе опыта с единствен­ ным младенцем, который кричал всю ночь, реш ает, что кормление из бу­ ты лки приводит к коликам у младенцев, а затем обнаруживает, что этот ре­ бенок страдал от высокой температуры. И ли ученый обнаруживает, что клас­ сический эксперимент, на основании которого появилась некоторая теория, не является чистым из-за внеш них факторов или прямого мош енничества. Гипотеза устойчивости, в своей общей формулировке, гласит, что люди, о которы х упоминалось выш е, отстаивали бы свои начальные убеждения до степени ничем неоправданной. Но термины такого утверж дения очевидно слиш ком общие и неопределенные, чтобы их можно было проверить. Когда именно мы сможем сделать вывод, что субъект “неуместно” упорствует в своих впечатлениях или убеж дениях, хотя их основание было подорвано? Чтобы исследовать гипотезу устойчивости экспериментально, нам точно потребуется парадигма, которая позволит точно определять степень устой­ чивости и изменений. Одна такая парадигма в форме дилеммы бы ла предложена социальными психологами, которые использовали обман в ходе эксперимента, а затем оп­ раш ивали испытуемых, которые являлись целью такого обмана. Психоло­ ги показы вали надуманный и недостоверный характер предоставленной ин­ формации, предполагая, что подобное рассмотрение эксперимента устранит любое влияние, которое такая инф ормация, могла бы оказать на мнения или убеж дения испытуемых. Многие ученые, однако, вы разили общее бес­ покойство, что такие экспериментальные обманы могут нанести большой вред, который не будет полностью устранен с помощью обычных процедур рассм отрения (наприм ер, K elm an, 1972; A .G . M iller, 1972; O m e, 1972; Silverm an, 1965). Р яд экспериментов, проведенных Леппером, Россом и их коллегами (см. такж е более ранние исследования W alster и других, 1967; V alins, 1974) ис­ пользовали общую парадигму дисконтирования или рассмотрения, с целью исследования явлений устойчивости убеждений при столкновении с очевид­ ной дискредитацией. Мы начнем обсуждение этой работы, выделив пару экспериментов Росса, Леппера и Хаббарда (Ross, Lepper & H ubbard, 1975), Недостатки процесса атрибуции... 173 которые касаю тся впечатлений испытуемых после рассмотрения обмана о своих способностях в некоторой задаче или о способностях других людей. Устойчивость личных впечатлений после их опровержения. Процедура, используемая Россом и другими (1975) бы ла достаточно прямолинейной. Испытуемые сначала получали продолжительную ложную обратную связь вовремя выполнения задачи на проницательность (то есть, отличие подлин­ ных сообщений о самоубийстве от вымыш ленных). В первом эксперименте было сообщено, что целью исследования является анализ того, как испытуе­ мые управляю т восприятием собственного поведения и способностей. Во вто­ ром эксперименте были привлечены наблюдатели, которые формировали со­ циальные впечатления, когда были свидетелями управления ложной обрат­ ной связью. В обоих экспериментах после того, как манипуляция первыми впечатлениями была закончена, экспериментатор полностью дискредитиро­ вал «сведения», на которых были основаны впечатления участников и \и ли наблюдателей. В частности, участник (реплику которого в Эксперименте 2 нечаянно услыш ал наблюдатель), получил стандартное опровержение дан­ ных, благодаря чему он узнал, что предполагаемый исход был предопреде­ лен и что его обратная связь была абсолютно не связанна с фактическим пове­ дением. Прежде чем значения зависимых переменных были представлены, каждого испытуемого подвели к явному подтверждению его понимания ха­ рактера и цели экспериментальной фальсификации. После этой полной дискредитации первоначальной информации, испы­ туемые заполняли анкету с зависимыми переменными, описывающими дей­ ствия людей и их способности. Устойчивость впечатления была очевидна как для участников, так и д ля наблюдателей. Ф актически при каж дом и з­ мерении (то есть, объективные оценки только что произведенного акта по­ ведения участника, оценки поведения относительно будущего набора за­ дач на проницательность и субъективные оценки его способностей) полнос­ тью дискредитированная м анипуляция первичного исхода произвела суще­ ственные “остаточные” эффекты на участников и оценки наблюдателей (см. таб. 2). Последующие эксперименты показали, что разнообразие необоснованных личных впечатлений, когда-то вы званных в соответствии с эксперименталь­ ными процедурами, мож ет сохраниться даж е после дискредитирую щ их процедур. Н апример, Дженнингс, Леппер и Росс (Jennings, Lepper & Ross, 1980) продемонстрировали, что впечатления испытуемых относительно их способности в межличностном убеждении (успех или неудача убедить кон­ федерата стать донором крови) могут сохраняться после того, к ак они узна­ ли, что начальны й исход был полностью недостоверен. Точно так ж е в двух сходных экспериментах Леппер, Росс и Л ау (Lepper, Ross & Lau, 1979) по­ казали, что ошибочные впечатления студентов относительно их “способно­ сти реш ать логические задачи” (и их выборы специализации с последую­ щей оценкой через два месяца) упорно сохранялись даж е после того, к ак ПРИЧИННОСТЬ И АТРИБУЦИЯ 174 Таблица 2. Восприятие поведения и способностей участника после опро­ вержения Л ичное восприят ие участ ника успех неудача t Оцененное первоначаль­ ное кол-во Прогнозирование будущего числа Оцененные способности Восприят ие участ ников наблю дат елям и усп ех н еудача t 18.33 12.83 5,91*** 19.00 12.42 4.43*** 18.33 14.25 4.23*** 19.08 14.50 2.68* 5.00 3.83 2.65* 5.33 4.00 3.36** *р < 0.05. * * р < 0 .0 1 . * * * р < 0.001. Источник: Данные второго эксперимента, проведенного Россом, «Пеп­ пером и Хаббардом (1975). они узнали, что хорошие или плохие методы обучения явились объяснени­ ем успехов или неудач, служ ивш их основанием для таких впечатлений. Устойчивость дискредитированных теорий после опровержения. Недав­ ние эксперименты Андерсена, «Пеппера и Росса (1980) расш ирили область проявлений устойчивости от личны х впечатлений до более обширных убеж­ дений о реальном мире. В исследованиях Андерсена и других сначала со­ здавались, а затем дискредитировались теории испытуемых относительно ф ункциональны х отнош ений меж ду двумя измеряемы ми переменными: адекватностью профессиональных действий пож арны х и количеством оч­ ков, набранных в тесте на предпочтение риска. В одном варианте формиру­ ющ ие сведения состояли из пары определенных случаев, то есть, один со­ стоявш ийся и один несостоявш ийся пож арны й с соответствующим проти­ воречивым количеством очков в тестах на предпочтение риска. Интересно, такие минимальны е данные были достаточными, чтобы породить устойчи­ вые теории, со стороны испытуемых, относительно вероятных связей меж­ ду соответствующ ими измерениями. Более важ ны м был вывод, что такие теории переж или опровержение - рассматриваемые случаи были полнос­ тью ф иктивны м и, и различны е испытуемые, ф актически, получили проти­ воположные пары очков рискованности и результатов работы. Действитель­ но, когда сравнения были сделаны между испытуемыми, с которыми экс­ перимент проанализирован, и теми, с которыми нет, оказалось, что более чем 50% начального эффекта информации в рам ках “случая” осталось пос­ ле опроверж ения. Недостатки процесса атрибуции... 175 И так, ясно, что убеждения могут сохраняться, несмотря на сильные ло­ гические или эмпирические сомнения. Они могут сохраняться и даже уси­ ливаться за счет сведений, которые, к ак согласилось бы большинство нейт­ ральны х наблюдателей, логически должны приводить к некоторому ослаб­ лению таких убеждений. Они могут даж е сохраняться после полного разру­ ш ения их первоначальных основ. Необходимо сделать многое для опреде­ ления точных пределов и исследования неизбежных исклю чений к таким явлениям . Ясно, что издерж ки предубеждений атрибуции обывателей и другие недостатки не подвержены коррекции, но вместе с тем сглаж иваю т­ ся за счет последующего опы та и обсуждений. Вопрос, который необходимо наконец задать -- это как и почему такая устойчивость имеет место? То есть, каки е когнитивны е механизмы леж ат в основе необоснованного постоян­ ства наш их впечатлений, убеждений и более ш ироких социальных теорий? Возможные м еханизмы , лежащие в основе устойчивости убежде­ ний Пристрастный поиск, воспоминание и ассимиляция информации. Не при­ ходится сомневаться, что наш и убеждения влияю т на процессы, с помощью которы х мы ищ ем, храним и интерпретируем соответствующую информа­ цию. Действительно, без предшествующего знания и соответствующих пре­ дубеждений, наш е понимание ежедневного опыта требовало бы значитель­ но большего времени и усилий, и по всей вероятности, в результате снизи­ лось бы понимание. Но неизбежное последствие наш ей готовности обраба­ ты вать сведения в свете наш их априорных убеждений - это тенденция вос­ принимать большее подтверждение для этих убеждений, чем фактически сущ ествует в данны х сведениях. Такие “предубеждения подтверж дения” (см. E inhorn и H ogarth, 1978; H am ilton, 1979; H astie и K um ar, 1979; W ason и Johnson-L aird, 1972) отме­ чались философами на протяж ении продолжительного времени (например, Bacon, 1620/1960). Возможно, наиболее примечательна реакция сторонни­ ка теории на сомнительные или неоднозначные данные. К ак утверждал Лорд и другие (1979), потенциально подтверждающ ие сведения могут быть при­ няты номинально (как таковые), в то время к ак потенциально опровергаю­ щие сведения подлеж ат критическому и скептическому исследованию. Та­ ким образом, существуют два следствия: во-первых, любой образец сведе­ ний, обработанных этим способом, даж е сведения, которое являю тся по су­ ществу случайными имеет тенденцию поддерживать начальные убеждения. Во-вторых, к ак только сведения были обработаны таким способом, они по­ лучают способность усиливать априорные убеждения, когда это убеждение подвергается новому эмпирическому опровержению или нападениям на его первоначальное очевидное основание. 176 ПРИЧИННОСТЬ И АТРИБУЦИЯ Роль предвзятой ассимиляции бы ла убедительно показана для случая, где сторонник теории встречается с новыми данными (т.е. Lord и другие, 1979). Но роль этого механизма в опровержении парадигмы , возможно, ме­ нее очевидна, и мы вынуждены полож иться скорее на предположение, чем на твердые данные. Мы предполагаем, что испытуемый, который формиру­ ет начальное впечатление о себе, другом человеке или некоторых функцио­ нальны х отнош ениях, способен искать дополнительные данные, соответ­ ствующие этому впечатлению , в своей пам яти и в непосредственной ситуа­ ции. Такие данные могут вспоминаться и рассматриваться к ак подходящие или подтверждаю щ ие только настолько, насколько они доказываю т насто­ ящ ее впечатление. Таким образом, испытуемый, который преуспел или по­ терпел неудачу в данной задаче, вспоминает подобные успехи или неудачи в похож их задачах - и принимает реш ения по поводу их релевантности дан­ ному случаю - на основе соответствия исходов. Точно так ж е испытуемый, реш ив, что переменные X и Y функционально связаны , вспомнит и придаст правдоподобность случаям, которые, скорее подтверждают, чем оспарива­ ют это предположение. О пять ж е, такой предвзяты й поиск, вспоминание и ассим иляция не только поддерживают первоначальное убеждение, они так­ ж е создают образец доказательства, который остается доступным для под­ держ ания рассматриваемого убеж дения, когда его первоначальное основа­ ние атаковано или даж е разруш ено. К ритическое предполож ение здесь заклю чается в том, что люди не постоянно совершенствуют или переоцени­ вают сведения, соответствующие их убеждениям. Они обычно не приходят к решению “теперь, когда моя предш ествую щ ая гипотеза была несколько подорвана, я должен возвратиться и переоценить все сведения, которые я когда-либо рассматривал в свете этой гипотезы ”. Формирование причинных объяснений. Люди более чем просто замечают све­ дения, соответствующие их впечатлениям или убеждениям. Они такж е уча­ ствуют в причинном анализе или объяснении (H eider, 1958). То есть они про­ буют объяснить характеристики себя или других людей, или функциональ­ ные отнош ения, в существование которых они верят. Таким образом, испы­ туемая, которая считает, что она лучш е или хуж е отличает сообщения о са­ моубийстве в исследованиях Росса (1975), могла бы найти аспект своей био­ графии, который объяснит наличие или отсутствие такого таланта. Точно так ж е испытуемый, который вынужден верить в положительные или отрица­ тельные отнош ения между способностью к пожарному делу и предпочтени­ ем риска, будет иметь мало трудностей в определении логического основания для любых отношений. Опять ж е, этот процесс не только поддерживает на­ чальное впечатление или убеждение, он такж е способен сохранить это впе­ чатление или убеждение при возникновении сомнений или критике. Свидетельство действия этого механизма устойчивости мы можем найти в двух исследованиях опроверж ения, демонстрирующ их, что, когда испы­ туемым необходимо сформулировать такие объяснения до опровержения, Недостатки процесса атрибуции... 177 величина эффекта устойчивости растет. В исследовании Андерсона и дру­ гих (1980), одну группу испытуемых попросили объяснить положительные или отрицательные связи в двух случаях с пожарными. К ак и было спрог­ нозировано, вмеш ательство сильно усилило эффект устойчивости. Ф акти­ чески, испытуемые, которые объясняли основание для положительных или отрицательны х связей до опроверж ения, были только чуть менее уверены в них, чем испытуемые, которые не получили никакого опровержения. По­ добные результаты были получены Россом, Леппером, Стреком и Стейнмец (1977), обнаруживш ими, что испытуемые, которым было необходимо объяс­ нить дальнейш ую ж изнь пациентов клиники (чьи истории болезни они чи­ тали), продолжили расценивать такие исходы как относительно вероятные даж е, когда они узнали, что события были недостоверны и выдуманы экс­ периментатором. Поведенческое подтверждение или гипотеза “самоисполнения" ( selffulfilment ). Две парадигмы исследования, используемые Россом, Леппером и их коллегами для исследования явления устойчивости испытываю т не­ достаток одного элемента, которы й мож ет быть критическим во многих ежедневных ситуациях. Определенно у испытуемых в этих исследованиях не было возможности воздействовать на свои убеждения. Такие действия важ ны частично, потому что они могут увеличивать психологические затра­ ты или “диссонанс” (F estinger, 1957), связанны й с изменением убеждений (ср. A shm ore и Collins, 1968; Collins и H oyt, 1972;H ovland, Campbell, и Brock, 1957). Кроме того, такие действия создают новые данные, соответствующие этим убеж дениям. Эти новые данные могут быть обработаны предвзято, кроме того, они могут быть смещены в направлении, подтверждающ ем со­ ответствующую гипотезу. Идея гипотезы само-подтверждения или самоисполнения не нова для со­ циологов. И звестные, но спорные исследования, например “эффект П игма­ лиона” (R osenthal и Jacobson, 1968), связанны е с воздействием ожиданий преподавателей относительно “скачка” в способностях и поведении их сту­ дентов, являю тся актуальны ми. Однако, недавние исследования, проведен­ ные Ш найдер (Snyder) и его коллегами, значительно продвинули наш у оцен­ ку и понимание таких явлений, демонстрируя, как ож идания испытуемых или гипотезы , которые они должны проверить, могут порождать их “объек­ тивную поддержку” (например, Snyder и Swann, 1978а, 1978b; Snyder, Tanke и B erscheid, 1977). Заклю чит ельны е замечания: Убеждения меняются! Н аш е предш ествую щ ее обсуж дение явлени й и м еханизм ов не долж но заставить читателя потерять из виду тот ф акт, что убеждения о нас, наш их политических лидерах и даж е наш их научных теориях действительно ме­ няю тся. Частично такое изменение мож ет просто быть результатом грубой силы . Д аж е если логические или эмпирические опровержения имеют мень­ ш е воздействия, чем могли бы гарантировать нормативные стандарты (см. Ross и Lepper, 1980), они все-таки могут подействовать. Частично, такое из­ менение мож ет отраж ать ф акт, что формальные методы тестирования ги­ потезы , иногда преднамеренно использую тся, чтобы защ итить нас от опас­ ностей неофициальных методов. Но мы подозреваем, многое еще предстоит исследовать, так как существует свидетельство того, что предшествующие теории могут иногда изменяться без огромного количества опровержений или убедительных экспериментов. Таким образом, изменения в мировоз­ зрении и убеж дениях, которые могут быть вы званы ярки м , конкретны м, непосредственным опытом (см. N isbett и Ross, 1980) и эффективность групп и лидеров, которые выполняю т серьезные политические или религиозные преобразования, предлагают цели для будущего исследования. 10. Очевидное воздействие базового значения* Амос Тверски иДаниелъ Канеман Во многих ситуациях людям необходимо оценить вероятность некоторого целевого события (например, диагноз пациента или продажи учебника) на основе (а) частоты базового значения целевого исхода в некоторой совокуп­ ности (например, частота различны х диагнозов или распределения продаж учебника), (Ь) определенного доказательства данного случая (например, ре­ акция пациента на диагностические осмотры или оглавление рассматрива­ емого текста). Важность данных базового значения в интуитивны х прогнозах относи­ тельно частны х случаев была изучена Милом и Роузеном (МееЫ и Rosen, 1955), которы е, используя правило Байеса утверж дали, что прогнозирова­ ние редкого исхода (например, самоубийства) на основе ненадеж ны х дан­ ных - это главны й источник ошибок в клиническом прогнозировании. Мил и Роузен не проводили экспериментальны х исследований, но они привели примеры из литературы по клиническому диагнозу, в котором информация базового значения не была принята во внимание. Чтобы получить экспериментальное воздействие данных базового значе­ ния, мы предоставили испытуемым описание аспиранта или специалиста и попросили их спрогнозировать его область специализации или его профес­ сию (K ahnem an и T versky, 1973,4). Эти исследования показали, что после­ дующие оценки вероятности были определены преж де всего степенью, в которой описание было подобно или репрезентативно соответствующему стереотипу специалиста (например, библиотекарям или адвокатам). Часто­ тами базового значения этих категорий, которые были либо известны испы ­ туемым из их ежедневного опы та, либо явно указаны в вопросе, в значи­ тельной степени пренебрегали. (Мы используем термин пренебрегать, что­ бы описать ситуации, в которых базовое значение либо игнорируется, либо крайне недооценивается.) *Эта работа была поддержана Службой военно-морских исследований согласно Контракту N00014-79-C-0077 со Стэндфордским университетом. 180 ПРИЧИННОСТЬ И АТРИБУЦИЯ Прогнозы на основе репрезентативности или подобия не зависят от час­ тот базового значения. Однако явление пренебрежения базовым значением гораздо более распространено, так к ак оно такж е наблюдается в оценках, которые не могут с легкостью интерпретироваться в терминах репрезента­ тивности (H am m erton, 1973). Д ля примера, Касселле, Ш оенбергиГрейбойз (Casscells, Schoenberger, и G rayboys, 1978) задавали 60 студентам и персо­ налу М едицинского факультета в Гарварде следующий вопрос: Если анализ, для обнаружения болезни, распространенность которой == 1 /1 .0 0 0 , имеет ложную положительную пропорцию 5% *, какова вероятность, того, что человек, у ко­ торого обнаружили, положительный результат, фактически болен, если предположить, что вы ничего не знаете о симптомах этого человека? (с.999) Наиболее обычный ответ, который дали почти половина участников, был 95% . Средний ответ был 56% и только 11 участников дали правильны й от­ вет - 2% , предполагая, что анализ правильно вы являет каж дого больного человека. Очевидно даж е высоко образованные респонденты часто не в со­ стоянии оценить важ ность базового значения исхода в относительно про­ сты х формальных задачах (см., например, B ar-H illel, 1980а; Lyon и Slovic, 1976). Осуждение Милом и Роузеном (1955) неспособности оценивать базо­ вое значение не ограничивается клиническими психологами; это такж е свой­ ственно и врачам, и вообще обывателям. У словия, при которых данные базового значения использую тся или ими пренебрегаю т, ш ироко исследовались социальными психологами и учены­ ми, изучаю щ ими производство суждений (см. литературные обзоры Borgida и B rekke (1981) и K assin (1979b)). Н езависимые переменные, рассмотрен­ ные в этих исследованиях, могут быть разделены на два типа: процедурные и доказательны е. Процедурные переменные относятся к свойствам проек­ та, задачи и демонстрации, в то время к ак доказательны е переменные каса­ ю тся характера источника и интерпретации сведений. Н апример, процедурная переменная большой важ ности - обращ ается ли испытуемый с каж дой задачей как с отдельным случаем или участвует в задаче с многократным прогнозированием. Значительные сведения из ис­ следований вероятности и похож их задач показываю т, что люди имеют тен­ денцию уравнивать распределение критерия при многократных предсказа­ н иях, особенно в присутствии обратной связи исхода. П оскольку люди пы­ таю тся создавать образец прогнозов, который является репрезентативным распределению исхода, эксперименты, использующ ие повторные оценки с тем ж е базовым значением производят большие эффекты базового значе­ н и я, чем эксперименты, в которы х с каж дой оценкой обращ аются как с от­ дельной задачей. (См. B ar-H illel и Fischhoff, 1981; M anis и другие, 1980). Д ругая интересую щ ая нас процедурная переменная - это различие меж ­ ду внутригрупповы м и меж групповы ми планами. Н апример, Ф ишхтоф, * Т. е. при положительном диагнозе болезнь отсутствует у 5% людей. Очевидное воздействие базового значения 181 Словик и Лихтенш тейн (Fischhoff, Slovic и L ichtenstein (1979)) показали, что данные базового значения имеют больше воздействия, когда они раз­ личны в разны х задачах, предоставленных каждому испытуемому, чем ког­ да различны е базовые пропорции предоставлены различны м испытуемым. Внутригрупповой план, однако, стимулирует общую тенденцию приписы ­ вать больший вес варьирующемуся признаку, даж е, когда он не соответству­ ет нормативно (Fischhoff и B ar-H illel, 1980). Дальнейш ее обсуждение раз­ личий между внутри- и межгрупповыми планами и их прилож ение для ис­ следования статистических убеждений смотри в гл. 34. Х отя процедурные переменные имеют значительное влияние, данная глава ограничивается обсуждением доказательны х переменных, которые управляю т интерпретацией и воздействием данны х базового значения. Оп­ ределенно, мы обращаем внимание на различия между двумя типами базо­ вы х значений, которые мы назовем причинны ми и случайными. П р и ч и н н ы е и с л у ч а й н ы е б а зо в ы е з н а ч е н и я Базовое значение назы вается причинны м, если оно предполагает существо­ вание причинного ф актора, который объясняет, почему отдельный случай приведет скорее к этому исходу, чем другой. Базовое значение назы вается случайны м, если оно не ведет к такому выводу. Я ркая демонстрация контраста между причинны ми и случайными базо­ выми значениями была представлена Айзеном (A jzen, 1977). В одном экс­ перименте, респонденты оценили вероятность того, что студент, академи­ ческая успеваемость которого бы ла кратко описана, успешно сдал отдельно взяты й экзамен. Причинное базовое значение было представлено следую­ щ им образом: Два года назад сдавался заключительный экзамен в Йельский университет. Приблизи­ тельно 75% студентов потерпели неудачу (успешно сдали) экзамен. Это базовое значение является причинным, потому что оно подразумева­ ет, что экзамен был исключительно труден (если 75% студентов потерпели неудачу) или относительно легкий (если 7 5% студентов сдали его). Выведен­ ная причина (то есть, трудность экзамена) “объясняет” базовое значение и делает менее (более) вероятным то, что каж ды й студент сдаст экзамен. Случайное базовое значение было представлено следующ им образом: Два года назад, в Йельском университете сдавался заключительный экзамен. Психо­ лог-педагог, интересующийся успеваемостью, опросил большое количество студентов, которые прошли курс обучения. Так как он был, прежде всего, заинтересован в реак­ циях на успех (неудачу), он выбирал главным образом студентов, которые успешно сдали (потерпели неудачу) экзамен. В частности, приблизительно 75% студентов в его выбор­ ке успешно сдали (провалили) экзамен. Это базовое значение является случайны м, или не-причинным, потому что пропорция студентов, сдавш их экзамен или нет, в выборке была наугад 182 ПРИЧИННОСТЬ И АТРИБУЦИЯ отобрана исследователем. В отличие от базового значения, она не позволяет сделать вывода относительно трудности экзамена. Исследование А йзена (1977) показало, что причинное базовое значение обладало большим весом, чем случайное, хотя оба типа базового значения оказали существенное влияние. Д ля причинного базового значения, оценен­ н ая вероятность успеха (средний по всем описаниям) бы ла выш е 0.34, при большом значении базового значения успеха, чем при низком. Д ля случай­ ного базового значения соответствующее различие было только 0.12. В тер­ минах данного анализа, легкость или трудность экзам ена - одна из способ­ ствующ их причин, которые затрагиваю т поведение студента, и поэтому свя­ зана с другими причинами, таким и к а к уровень интеллекта и мотивирован­ ность рассматриваемого студента. Базовое значение успеха использовалось в предшествующем исследовании, чтобы определить экзамен к ак легкий или трудный. Во втором исследовании, базовое значение предпочтения использовалось, чтобы определить выборы как более или менее привлекательные (Ajzen, 1977). Испытуемых попросили оце­ нить вероятность, что студенты, чьи краткие описания личности прилагались, выберут в качестве факультативного курса или историю, или экономику. Причинное базовое значение, которое служило для определения относитель­ ной привлекательности одного из этих двух выбора, состояло и з пропорции студентов, зарегистрированных на этих двух курсах(0.70и 0.30). Случайное базовое значение было представлено следующим образом: Чтобы узнать мнение студентов, профессор истории (экономики) недавно опросил 70 студентов, которые проходили его общий курс по истории (экономике), для сравнения, он также опросил 30 студентов, которые прошли курс экономики (истории). Обратите внимание, что, в отличие от причинного базового значения, слу­ чайное не дает информации относительно популярности этих двух курсов. В лияние случайного базового значения не было сущ ественным в этом ис­ следовании, хотя имелось различие вероятности 0.025 в ожидаемом направ­ лении. Н апротив, причинное базовое значение имело сильное влияние: сред­ н яя оцененная вероятность выбора бы ла 0.65 для популярного курса (высо­ кое базовое значение) и 0.36 для непопулярного курса (низкое базовое зна­ чение). Очевидно, привлекательность курсов выведена из базовых значений выборов и объединена с личны ми характеристиками при оценке вероятнос­ ти того, что отдельный студент выберет скорее один курс, чем другой. С нор­ мативной точки зрения, однако, и причинное, и случайное базовое значе­ ние в этих примерах должны иметь едва сопоставимые влияния. Наш следующ ий пример иллю стрирует другой тип причинного базового значения; оно такж е позволяет вы числить правильную апостериорную ве­ роятность согласно некоторым разумны м предполож ениям. Рассмотрим следующую измененную версию задачи про такси, первоначально представ­ ленную Канеманом и Тверским (1972а) и позж е исследованную Бар-Хиллел (1980а), и Тверским и Канеманом (1980,8). Очевидное воздействие базового значения 183 Такси сбило человека и скрылось с места происшествия ночью. Две компании такси, Зеленая и Синяя, работают в городе. Вам дают следующие данные: (A) 85% такси в городе - Зеленые и 15% - Синие. (B) свидетель идентифицировал такси как Синее. Суд проверил надежность свиде­ теля при обстоятельствах, которые существовали в ночь несчастного случая, и зак­ лючил, что свидетель правильно идентифицировал каждый из этих двух цветов в 80% случаев и неправильно в 20% случаев. Какова вероятность того, что такси, сбившее человека было скорее Синим, чем Зеле­ ным? Чтобы получить правильны й ответ, пусть В и G обозначают соответствен­ но гипотезы , что такси, сбившее человека, Синее или Зеленое, и пусть W сообщение свидетеля. В соответствии с правилом Байеса в вероятностной форме, с предш ествующ ей вероятностью 15/85 и отношением вероятности 80/2 0 , Р (В/W ) /Р (G /W ) = Р (W /В ) Р (В) / Р (W /G ) Р (G) = = (0.8) (0 .1 5 )/ (0.2) (0.85) = 1 2 /1 7 и , следовательно Р (В/W ) = 12 / (12 + 17) = 0 .4 1 Поэтому, несмотря на сообщение свидетеля, такси, сбившее человека, будет скорее Зеленое, чем Синее, потому что базовое значение является бо­ лее крайним , чем свидетельское показание вероятным. Большому количеству испытуемых предоставили несколько отличающие­ ся версии этой задачи с очень последовательными результатами. Средний и модальный ответ - 0.80, значение, которое совпадает с достоверностью сви­ детельского показания и , очевидно, не зависит от относительной частоты Синих и Зелены х такси. И нформация базового значения, однако, использовалась в отсутствии целевых данны х. Когда пункт (Ь) был опущен из вопроса, почти все тести­ руемые дали основное значение (0.15) к ак ответ. Кроме того, базовое значе­ ние управляло ожиданием испытуемых относительно свидетельских дан­ ны х. Другой группе испытуемых бы ла предоставлена вы ш еупомянутая за­ дача за исключением того, что предложение “свидетель определил такси, как Синее” было заменено на “свидетель определил цвет такси”. Затем этих испытуемых спросили, “какова вероятность, что свидетель определил так­ си как Синее?” Средний и модальный ответ на этот вопрос был 0.15. Обрати­ те внимание, что правильны й ответ- 0 .2 х 0.85 + 0.8 х 0 .1 5 = 0 .2 9 . Вотсутствии других данны х, знание базового значения использовалось должным образом, чтобы спрогнозировать целевой исход и ненадлежащ им образом, чтобы спрогнозировать сообщение свидетеля. 184 ПРИЧИННОСТЬ И АТРИБУЦИЯ Другой вид суждений наблюдался, когда случайное базовое значение (так­ си) было заменено причинным базовоым значением (несчастных случаев). Это было сделано путем замены пункта (а) на: (а’) Хотя эти две компании приблизительно равны в размере, 85% несчастных случаев с такси в городе произошло с Зелеными такси и 15% — с Синими. Ответы на эту задачу были различны ми, но базовое значение больше не игнорировалось. Средний ответ был 0.60, что находится между достоверно­ стью свидетельского показания (0.80) и правильным ответом (0.41). Базо­ вое значение в случае (а) является причинны м, потому что различие в про­ порциях несчастных случаев между компаниями равного размера легко вы­ являет вывод, что водители Зеленых такси менее осторожны или менее ком­ петентны , чем водители Синих такси. Этот вывод объясняет дифференци­ альны е базовые значения несчастных случаев и подразумевает, что любое Зеленое такси, более вероятно, будет вовлечено в несчастный случай, чем любое Синее такси. Напротив, основное значение в (а) случайно, потому что различие между количеством Синих и Зеленых такси в городе не делает воз­ можным причинны й вывод, которы й делает более вероятным, что любое Зеленое такси, а не любое Синее такси попадет в несчастный случай. Обратите внимание, что согласно данному анализу, последующ ая веро­ ятность, что такси, которое принимало участие в несчастном случае, явл я­ ется, скорее Синим, чем Зеленым - та ж е сам ая и в (а), и в (а’). Однако связь меж ду цветом такси и причастностью к несчастным случаям равняется 0 для случайного базового значения и 0.7 - для причинного! Этот статисти­ ческий ф акт отраж ает различие меж ду двумя базовыми значениями и по­ могает объяснить, почему причинное базовое значение используется, в то время к ак случайное базовое значение игнорируется. Д р у ги е д о к а з а т е л ь н ы е п ер ем ен н ы е П ричинны й или случайны й характер данных базового значения не един­ ственная доказательная переменная, которая влияет на интуитивные оцен­ ки . Д аж е в отсутствии причинной интерпретации, данные базового значе­ н и я не заменяю тся неопределенными, обедненными или непоследователь­ ными данными случая. Например, Бар-Х иллел (1980а) изучала версию пер­ воначальной задачи с такси, в которой информация относительно свидете­ л я (пункт Ь) бы ла заменена сообщением, что сбившее человека такси было оборудовано селекторной связью (переговорными устройствами) и что се­ лекторная связь установлена в 80% Зелены х такси и в 20% Синих такси. В этой задаче, (случайное) базовое значейие не было отвергнуто, и средний ответ был 0.48. Бар-Х иллел предполож ила, что сведения относительно се­ лекторной связи не заменили базовое значение, потому что они менее опре­ деленные, чем идентиф икация свидетелем. Таким образом, данные базово­ го значения объединяю тся с другими сведениями в двух случаях: если пер­ Очевидное воздействие базового значения 185 вые имеют причинную интерпретацию , или если последние не являю тся более определенными, чем базовое значение (B ar-H illel, 1980а). И специф ика, и причинная связь могут помочь объяснить различие м еж ­ ду результатам и Канемана и Тверского (19 7 3 ,4 ), которые обнаружили су­ щественное пренебрежение базовым значением в прогнозировании области специализации студента на основе краткого описания личности и результа­ тами М акКоли и Ститта (McCauley и S titt, 1978). Когда они обнаружили су­ щественную корреляцию между оцененным базовым значением черт харак­ тера и оцененными вероятностями этих черт при указании национально­ сти, например, вероятность, что человек является практичны м, если он не­ мец. Кроме нескольких процедурных различий, последнее исследование отличается от первого в трех важ ны х аспектах. Во-первых, испытуемых просили спрогнозировать скорее относительную частоту (например, пропор­ ция немцев, которые являю тся практичны м и), чем вероятность для инди­ видуального случая. Во-вторых, сведения состояли скорее из принадлеж ­ ности к классу, например, немец, чем детальны х описаний определенного человека. В-третьих, частоту базового значения черт характера легче при­ чинно интерпретировать, чем частоту базового значения профессий. Обы­ вательские теории личности предлагаю т причины , почему больш инство людей лю бят повеселиться, и только некоторые из них мазохисты. Эти при­ чины могут объяснить поведение людей вообще и немцев, в частности, та­ ким образом, обеспечивая причинную интерпретацию базового значения черт характера. Особенно интересно рассмотреть ситуацию , касаю щ ую ся определенных, но недиагностических сведений (например, описание человека, одинаково подобного инж енеру и адвокату). Экспериментальные выводы здесь не пол­ ностью последовательны. Канеман и Тверский (1973, 4) обнаружили пре­ небрежение базовым значением, в то время к ак Джиносар и Троуп (G inosar и Trope, 1980) обнаружили исклю чительную уверенность в данных базово­ го значения при подобных экспериментальны х условиях. Больш инство ис­ следований, однако, получили промежуточные результаты, где базовое зна­ чение не было отвергнуто, а скорее ослаблено недиагностическими сведени­ ями относительно данного случая (см. например, M anis и другие, 1980; W ells и H arvey, 1977). В н утрен н и е и л и вн еш н и е п р и п и с ы в а н и я Несколько задач с базовым значением, представляющ их особый интерес для социальных психологов, возникает, когда сведения и базовое значение от­ носятся соответственно к внутренне-поведенческим и к внеш не-ситуатив­ ным ф акторам, которые влияю т на исход. Успех студента на экзамене, на­ пример, определен к ак трудностью экзам ена, так и талантом студента. Точ­ но так ж е ответ на просьбу пожертвовать деньги в благотворительное пред­ приятие зависит к ак от щ едрости дающ его, так и от характера просьбы. 186 ПРИЧИННОСТЬ И АТРИБУЦИЯ В неш ние ф акторы , таки е к а к трудность экзам ена и ли эф ф ективность просьбы, естественно, выражены соответствующими базовыми значения­ ми (например, 75% студентов провалили экзамен; большинство людей вне­ сло вклад в благотворительное предприятие). Вопрос об относительном воз­ действии ситуативны х и поведенческих факторов в социальном приписы­ вании, таким образом, мож ет быть повторно сформулирован в терминах значения, которое придается соответствующим базовым значениям. Нисбетт и Боргида первыми исследовали связь между использованием информации базового значения в исследовании оценок и относительным весом ситуативных факторов в изучении атрибуции поведения. Они пока­ зали, что в исследовании Д арли-Л атана (D arley-Latane, 1968) знание того, что испытуемые редко оказы вали помощь, не затрагивало прогнозов испы­ туемых относительно поведения отдельного участника исследования, кото­ ры й был показан в кратком интервью, снятом на камеру. Исследование Нисбетта и Боргиды (1975) внесло вклад в пересекаемость когнитивны х и соци­ ально-психологических подходов к изучению оценивания. Это такж е выз­ вало противоречие (B orgida, 1978; W ells и H arvey, 1977,1978) и ряд иссле­ дований роли согласованности информации в прогнозировании поведения (B orgida и Brekke, 1981; K assin, 1979b; N isbett и Ross, 1980; Ross, 1977). В отличие от примеров с экзаменами и такси, в которы х причинные и случайны е базовые значения ясно различим ы , базовые значения во многих исследованиях консенсуса подвержены альтернативным интерпретациям. Чтобы это проиллю стрировать, давайте сравним исследование Нисбетта и Боргиды (1975) с причинным условием базового значения в эксперименте А йзена (A jzen, 1977), где испытуемые оценили вероятность того, что отдель­ но взяты й студент сдаст экзамен, который провалили 75% группы. Фор­ м альная структура двух задач одна и та ж е, но базовым значением в значи­ тельной степени пренебрегали в первом исследовании и использовали в пос­ леднем. К аж ется, что необычному базовому значению давали ситуативную интерпретацию в исследовании А йзена, но оно интерпретировалось к ак слу­ чайное формирование выборки в исследовании Нисбетта-Боргиды. Оценки испытуемых А йзена указы ваю т, что они вывели из низкого ба­ зового значения успеха, что экзамен был труден, хотя они могли использо­ вать те ж е самые сведения, чтобы прийти к выводу, что студенты, которые проходили тест, не были достаточно умными. Н апротив, испытуемые Нис­ бетта и Боргиды , очевидно приш ли к выводу, что участники исследования об оказании помощи были главны м образом бесчувственными и жестокими людьми (W ells и H arvey, 1977). Они не приш ли к правильному заклю че­ нию , что ситуация исследования Д арли-Л атана не располагала к проявле­ нию помощи. П риписано ли экстремальное базовое значение случайному формирова­ нию выборки или ситуативным ф акторам, зависит от контекста проблемы: более вероятно, что необычное распределение результатов тестов возникло из-за сложности (или легкости) экзамена, чем из-за необычного состава груп­ Очевидное воздействие базового значения 187 пы. С другой стороны тяж елее пересмотреть концепцию относительно ус­ ловий, при которы х люди помогают незнакомому человеку, которого хва­ тил удар, чем предположить, что участники исследования об оказании по­ мощи были исклю чительно бессердечными. Очевидное пренебрежение данными базового значения в прогнозах от­ дельных случаев связано с выводом относительно необычных характерис­ тик членов группы. П ричинная интерпретация базового значения становит­ ся более вероятной, если этот вывод блокирован. Эта гипотеза была поддер­ ж ана несколькими исследованиями, которые восстановили эффект вл и я­ ния базового значения, подчеркивая репрезентативность выборки, в кото­ рой наблюдалось необычное поведение (H ansen и Donoghue, 1977; H ansen и Lowe, 1976; W ells и H arvey, 1978). Воздействие данны х базового значения было даж е увеличено в одном исследовании, сообщая испытуемым, что вы ­ борка, для которой давались базовые значения, бы ла большой и поэтому надежной (K assin, 1979а). Главное заклю чение этого и сследован ия-то, что использование или пренебрежение согласованностью информации в отдель­ ном прогнозе критически зависит от интерпретации этой информации. Часть IV Доступность 11. Доступность: эвристика оценки частоты и вероятности* Амос Тверски иДаниель Канеман В вед ен и е Больш инство недавних исследований были посвящ ены проблемам валид­ ности и последовательности оценок вероятности и частоты. Однако извест­ но мало о психологических механизмах, с помощью которых люди оцени­ вают частоту классов или вероятность событий. Мы предполагаем, что при столкновении с трудной задачей оценки веро­ ятности или частоты, люди используют ограниченное количество эвристик, которые сокращ аю т эти оценки до более простых. Ранее мы проанализирова­ ли подробно одну из таких эвристик - репрезентативность. С помощью этой эвристики, событие оценивается к ак вероятное настолько, насколько оно представляет существенные особенности своей родительской совокупности или процесса, породившего его.... При оценке вероятности события с помощью репрезентативности, чело­ век сравнивает существенные особенности события со структурой, из кото­ рой оно исходит. Таким образом, человек оценивает вероятности, оценивая подобие или коннотативное расстояние. С другой стороны, можно оценить вероятность, используя доступность, или ассоциативное расстояние. Из ж и з­ ненного опыта мы знаем, что частные случаи больших классов вспомина­ ются лучш е и быстрее, чем случаи менее часты х классов, что вероятные со­ бытия легче вообразить, чем маловероятные, и что ассоциативные связи уси­ ливаю тся, когда два события часто происходят одновременно. Таким обра­ зом, человек мог оценить численность класса, вероятность события или ча­ стоту взаимосвязанны х появлений событий, оценивая легкость, с которой мож ет быть выполнено соответствующее умственное действие формирова­ ния вы борки, построения или ассоциации. *Эта глава - сокращенная версия работы, которая появилась в Cognitive Psychology, 1973, 4,207-232. Авторское право© 1972 Academic Press, Inc. Переиздано в соответствии с разре­ шением 192 ДОСТУПНОСТЬ Например, можно оценивать пропорцию разводов в данном обществе, вспо­ м иная разводы среди знакомых; можно оценивать вероятность того, что по­ литический деятель проиграет на выборах, рассматривая различные спосо­ бы, с помощью которых он может потерять поддержку; и можно оценивать вероятность того, что жестокий человек “увидит” хищ ных зверей в карточ­ ках Рорш аха, оценивая силу ассоциации между насилием и хищ никами. Во всех этих случаях, оценка частоты класса или вероятности случая опосредо­ вана оценкой доступности1. Считается, что человек использует эвристику доступности всякий раз, когда он оценивает частоту или вероятность за счет легкости, с которой события или ассоциации могут прийти ему в голову. Что­ бы оценить доступность, совсем не обязательно выполнять фактические дей­ ствия формирования выборки или построения. Достаточно оценить легкость, с которой эти действия могли быть выполнены, подобно тому, как трудность загадки или математической задачи может быть оценена без рассмотрения определенных решений. То, что ассоциативные связи усиливаются при повторении - возможно, са­ мы й стары й закон запом инания, известный человеку. Эвристика доступно­ сти использует обратную форму этого закона, то есть она использует силу ассоциации к ак основание для оценки частоты. В этой теории, доступность является, скорее, переменной-посредником, чем зависимой переменной как обычно бывает в исследовании пам яти. Доступность - надеж ны й клю ч для оценки частоты, потому что, часты е события легче вспомнить или вообра­ зить, чем редкие. Однако на доступность такж е воздействуют различные ф акторы , которые не связаны с фактической частотой. Если применяется эвристика доступности, то такие ф акторы повлияю т на воспринятую часто­ ту классов и субъективную вероятность событий. Следовательно, использо­ вание эвристики доступности ведет к систематическим предубеждениям. Эта часть книги исследует эвристику доступности в десяти последователь­ ны х исследованиях.26*Сначала мы показы ваем, что люди могут оценивать доступность с разумной скоростью и точностью. Затем, мы показы ваем, что оцененная частота классов смещ ается за счет доступности их частных слу­ чаев для построения и процесса формирования воспроизведения. Экспери1 Настоящее использование термина “доступность” не совпадает с некоторыми случаями употребления этого термина в литературе по исследованию речи (см., например, Horowitz, Norman и Day, 1966; Tulving и Pearlstone, 1966). 2 Приблизительно 1500 испытуемых участвовали в этих исследованиях. При отсутствии дополнительной информации, исследования проводились в группах из 20-40 испытуемых. Испытуемые в исследованиях 1, 2, 3, 9 и 10 были привлечены рекламными объявлениями в студенческой газете в Университете штата Орегон. Испытуемые в исследовании 8 были подобным образом привлечены в Университете Стэнфорд. Испытуемые в исследованиях 5, 6 и 7 были учащимися в 10-ых и 11-ых классов нескольких среднеобразовательных школколледжей в Израиле. Доступность: эвристика оценки частоты ... 193 ментальные исследования этой части книги касаются оценок частот или вероятностей, которые могут легко уменьшены до относительных частот. Влияние доступности на оцененные вероятности по существу уникальных событий (которые не могут быть уменьшены до относительных частот) об­ суждены в пятой и заключительной главе. О ц ен ки д о сту п н о сти Исследование 1: Построение Испытуемым (N = 42) предоставлен ряд задач на построение слов. К аж дая задача состояла из матрицы 3 x 3 , содержащих девять букв для составле­ ния слов из трех букв или больше. В обучающей стадии исследования, всем испытуемым предоставили шесть задач. На каждую задачу, им давали 7 секунд, чтобы оценить количество слов, которые они могли бы составить за 2 минуты. После каждой оценки, им давали две минуты, чтобы записать (в пронумерованных строках) столько слов, сколько они могли составить из букв в матрице. Данные, полученные в обучающей стадии, были исключе­ ны. В стадии испытания, построение и задачи оценивания были отделены. Каждый испытуемый, оценивал для восьми задач количество слов, которое он мог бы придумать за 2 минуты. Д ля восьми других задач, он составлял слова без предшествующей оценки. Оценивание и задачи построения чере­ довались. Использовались два параллельных стимульных проспекта, что­ бы для каждой задачи половина испытуемых оценивала и половина состав­ ляла слова. Результаты. Среднее количество составленных слов варьировалось от 1.3 (для XUZONLCJM) до 22.4 (для TAPCERHOB), с общим средним 11.9. Сред­ нее оцененное число варьировалось от 4.9 до 16.0 (для тех ж е самых двух задач), с общим средним 10.3. Корреляция между оценкой и продуктивно­ стью по этим шестнадцати задачам составила 0.96. Исследование 2: Воспроизведение Структура и процедура были идентичны исследованию 1, за исключением характера задачи. Здесь, каж дая проблема состояла из категории, напри­ мер, цветы или русские писатели, частные случаи которых необходимо было вспомнить. Испытуемым (N = 28) давали 7 секунд на то, чтобы оце­ нить количество частных случаев, которые они могли вспомнить за 2 мину­ ты, или 2 минуты на то, чтобы фактически вспомнить. Как в исследовании 1, задачи построения и оценивания были объединены в обучающейся стадии и чередовалось в стадии испытаний. 194 ДОСТУПНОСТЬ Результаты. Среднее количество случаев варьировалось от 4.1 (названия городов начинающиеся на букву Ф) до 23.7 (четвероногие животные), с об­ щим средним 11.7. Среднее оцененное число варьировалось от 6.7 до 18.7 (для тех ж е самых двух категорий), с общим средним 10.8. Корреляция между продуктивностью и оцениванием по этим 16 категориям была 0.93. Обсуждение В вышеупомянутых исследованиях, доступность событий могла быть изме­ рена общим количеством выбранных или созданных случаев в любой зада­ че.3Исследования показывают, что люди могут быстро и точно оценивать доступность. К ак такие оценки осуществляются? Один вероятный механизм предложен в работе Боусфилда и Седжевика (Bousfield & Sedgewick, 1944), которые показали, что совокупное воспроизведение случаев является отри­ цательно ускоренной показательной функцией от времени. Испытуемый мог использовать количество случаев, выбранных в короткий промежуток вре­ мени, чтобы оценить количество случаев, которые он мог выбрать в дли­ тельный отрезок времени. С другой стороны, испытуемый может оценивать доступность без явного воспроизведения или построения случаев вообще. Х арт (H art, 1967), например, показал, что люди могут точно оценивать свою способность узнавать предметы, которые они не могут вспомнить в тесте на запоминание парных ассоциаций. Д о с ту п н о с ть д л я п о с т р о е н и я Мы обратимся теперь к ряду проблем, в которых испытуемому дают прави­ ло для построения случаев и просят оценить их общую (или относительную) частоту. В этих задачах - к а к в большинстве задач на оценивание, испыту­ емый не может создать и перечислить все случаи. Вместо этого, мы предпо­ лагаем, он пытается создавать некоторые случаи и оценивает полную часто­ ту степенью доступности, то есть в соответствии с оценкой легкости, с кото­ рой случаи могут прийти в голову. К ак следствие, классы явлений, случаи которых легко создать или вообразить, будут восприниматься к а к более ча­ стые, чем классы того ж е самого размера, которые менее доступны. Этот прогноз проверен на оценке частоты слова и на оценке нескольких комби­ наторных выражений. 3 Проблемы построения слова могут также рассматриваться как проблемы воспроизведе­ ния, потому что слова-ответы существуют в памяти. В этой части книги мы говорим о вос­ произведении, когда тестируемый вспоминает случаи естественной категории, как в иссле­ дованиях 2 и 8. Мы говорим о построении, когда испытуемый производит образцы согласно указанному правилу, как в исследованиях 1 и 4. Доступность: эвристика оценки частоты ... 195 И сследование 3: Оценка частоты слова Предположим, Вы выбрали наугад слово из английского текста. Что более вероятно, что слово начинается на К , или что К - его третья буква? Соглас­ но нашему предположению, люди отвечают на такой вопрос, сравнивая до­ ступность этих двух категорий, то есть, оценивая легкость, с которой слу­ чаи этих двух категорий приходят на ум. Конечно, легче придумать слова, начинающиеся с К, чем слова, где К является третьей буквой. Если оценка частоты опосредована оцененной доступностью, то слова, начинающиеся на К, должны быть оценены как более частые. На самом деле, обычный текст содержит вдвое больше слов, в которых К находится в третьей позиции, чем слов, начинающ ихся на К. Согласно обширному подсчету слов Майцнера и Тресселта (Mayzner и Tresselt, 1965), существует восемь согласных, которые встречаются чаще в третьей, чем в первой позиции. Из них, две согласные (X и Z) относительно редки, а другая (D) часто встречается в третьей позиции только в словах из трех букв. Оставшиеся пять согласных (К, L, N, R, Y) были отобраны для исследования. Испытуемым дали следующие инструкции: Изучалась частота появления букв в английском языке. Был отобран обычный текст, была зарегистрирована относительная частота появления различных букв алфавита в пер­ вой и третьей позициях слов. Слова, состоящие менее, чем из трех букв, были исключе­ ны из подсчета. Вам предложат несколько букв алфавита и попросят оценить, появляются ли эти буквы чаще в первой или в третьей позиции, и оценить отношение частоты, с которой они появ­ ляются в этих позициях. Типичная задача, была следующей: Рассмотрите букву Р. Что более вероятно, что Р появится в - Первой позиции? - Третьей позиции? Моя оценка соотношения этих двух величин : 1. Испытуемых проинструктировали, чтобы они оценили отношение больше­ го класса к меньшему. Д ля половины испытуемых, упорядочение этих двух позиций в вопросе было изменено. Кроме того, использовались три различ­ ных порядка этих пяти букв. Результаты. Среди 152 испытуемых, 105 оценили, что первая позиция бо­ лее вероятна для большинства букв и 47 оценили, что - третья. Предубеж­ дение в пользу первой позиции является существенным (р < 0.001, тест зна­ ков). Кроме того, по оценке большинства испытуемых, каж дая из пяти букв появлялась чаще в первой, чем в третьей позиции. Отношение средней оцен­ ки было 2:1 для каждой из этих пяти букв. Эти результаты были получены, несмотря на тот факт, что все буквы встречались чаще в третьей позиции. 196 ДОСТУПНОСТЬ В других исследованиях мы обнаружили то ж е предубеждение в пользу первой позиции при внутригрупповом плане исследования, где каж ды й ис­ пытуемый оценивал отдельную букву, и при межгрупповом плане, где час­ тоты букв в первой и в третьей позициях были оценены различными испы­ туемыми. Мы такж е наблюдали, что вознаграждение за точность в первом проекте не имело никакого влияния. Так к ак во всех методах был получен сходный характер результатов, мы приводим только результаты, получен­ ные в соответствии с самой простой процедурой. О подобном результате было сообщено Филлипсом (Phillips, 1966) в ис­ следовании вывода Байеса. Шесть редакторов студенческих газет оценива­ ли вероятности, что различные двухбуквенные сочетания (биграммы), ото­ бранные из собственных записей, были взяты с начала или с конца слов. Дополнительный эффект, наблюдаемый в этом исследовании, показал, что все редакторы были предубеждены в пользу гипотезы, согласно которой двух­ буквенные сочетания были взяты с начала слов. Например, редакторы оши­ бочно оценили слова, начинающиеся с “ге”, более частыми, чем слова, закан­ чивающиеся на “ге”. Первые, конечно, являю тся более доступными, чем пос­ ледние. И сследование 4: П ерест ановки Рассмотрим две структуры, А и В, которые показаны ниже. (В ) (А) XX хххххххх XX хххххххх XX хххххххх XX XX XX XX XX XX Дорожка в структуре — это линия, которая соединяет элемент в верхней строке с эле­ ментом в нижней строке, и пересекает только один элемент в каждой строке. В какой из двух структур больше дорожек? Сколько дорожек, по вашему мнению, имеется в каждой структуре? Большинство читателей, вероятно, разделят непосредственное впечатление, что в А больше дорожек, чем в В. Наши испытуемые приш ли к такому же выводу: 46 из 54 испытуемых увидели большее количество дорожек в А, чем в В (р < 0.001, тест знаков). Средние оценки были 40 дорожек в А и 18 в В. Ф актически, количество дорожек - одинаковое в обеих структурах, так к а к 83 = 29 = 5 12. Доступность: эвристика оценки частоты ... 197 Почему люди видят больше дорожек в А, чем в В? Мы предполагаем, что этот результат отражает различную доступность дорожек в двух структурах. Существуют несколько факторов, которые делают дорожки в А более доступ­ ными, чем в В. Во-первых, наиболее доступные дорожки - столбцы структур. В А есть 8 столбцов, а в В только 2. Во-вторых, дорожки, пересекающие столб­ цы в А вообще более различимы и меньше запутаны, чем в В. Две дорожки в А, в среднем, пересекают 1/8 их элементов, в то время как две дорожки в В, в сред­ нем, пересекают половину их элементов. Наконец, дорожки в А короче и, сле­ довательно, легче воспринимаются на глаз, чем дорожки в В. Исследование 5: Комбинации Рассмотрим группу из десяти человек, которые должны сформировать ко­ митеты из г членов, где г - некоторое число между 2 и 8. Сколько различных комитетов из г членов они могут сформировать? Правильный ответ на эту задачу задается биномным коэффициентом (г10), который достигает макси­ мума 252 для г = 5. Ясно, что количество комитетов из г членов равняется числу комитетов из 10 - г членов, потому что любая выбранная группа, ска­ жем, из двух членов определяет единственно возможную невыбранную груп­ пу из восьми членов. Согласно нашему анализу интуитивной оценки, однако, комитеты из двух членов более доступны, чем комитеты из восьми. Во-первых, самая простая схема построения комитетов - разделение группы на непересекающиеся под­ множества. Таким образом, каж ды й с легкостью видит, что существуют целых пять непересекающихся комитетов из двух членов, но не видит и двух непересекающихся комитетов из восьми. Во-вторых, комитеты из восьми членов намного менее различимы, так как их элементы пересекаются; лю­ бые два комитета из восьми имеют, по крайней мере, шесть общих членов. Этот анализ предполагает, что маленькие комитеты более доступны, чем большие комитеты. В соответствии с гипотезой доступности, поэтому, м а­ ленькие комитеты должны казаться более многочисленными. Четыре группы испытуемых (общее количество N = 118) оценили коли­ чество возможных комитетов из г членов, которые могут быть сформирова­ ны из десяти человек. Различные группы, соответственно, оценили следу­ ющие значения г: 1 и 6; 3 и 8; 4 и 7; 5. Средние оценки количества комитетов показаны на Рисунке 1, с правиль­ ными значениями. Как и было спрогнозировано, оцененная численность ко­ митетов уменьшается с их размером. Следующая альтернативная формулировка той ж е самой задачи была изоб­ ретена, чтобы проверить общность результатов: В рисунке, приведенном ниже, имеются десять станций по маршруту между Стартом и Финишем. Рассмотрим автобус, который следует по этому маршруту, останавливаясь точно на г станциях. ДОСТУПНОСТЬ 198 СТАРТ I I I I I I » I I I 1 ФИНИШ Сколько различных вариантов г остановок автобус может делать? Количество различных образцов г остановок снова (г10). Здесь такж е коли­ чество вариантов двух остановок такое ж е, что и количество вариантов вось­ ми остановок, потому что для любого варианта остановок имеется единствен­ но возможный дополнительный вариант не-остановок. Все же, человек ока­ зывается более свободен в построении образцов двух остановок, где “суще­ ствует много станций, из которых можно выбирать”, чем в построении об­ разцов восьми остановок, где “нужно останавливаться почти на каждой ос­ тановке.” Наш предыдущий анализ предполагает, что первые образцы бо­ лее доступны: большее количество таких образцов замечается с первого взгляда, они более отличительны и их легче визуализировать. 250 200 150 X X г X X >о X О * 100 90 80 70 60 50 40 30 20 10 - I— 2 I— 3 I— 4 I— 5 I— 6 I— 7 ^ 8 Размер набора Рис. 1. Правильные величины и средние оценки (на логарифмичес­ кой шкале) для задачи про комитеты и остановки Четыре новых группы испытуемых (общее количество N = 178) ответили на этот вопрос, для г = 2 ,..., 8 по тому ж е образцу, к ак указано выше. Сред­ ние оценки количества остановок показаны на Рисунке 1. К ак и в задаче про комитеты, очевидное количество комбинаций вообще уменьшается с г, в соответствии с прогнозом гипотезы доступности, и в заметном несоответ­ ствии с правильным величинами. Оценки количества комбинаций подоб­ ны в двух задачах. К ак в других комбинаторных задачах, существует явная Доступность: эвристика оценки частоты ... 199 недооценка всех правильных величин, с единственным исключением в наи­ более доступном случае, где г = 2. Недооценка, наблюдаемая в экспериментах 4 и 5 происходит потому, что люди оценивают комбинаторные величины, экстраполируя от начального впечатления. То, что человек видит сразу или в нескольких шагах вычисле­ ния, дает ему неправильную идею относительно неограниченно возрастаю­ щей пропорции роста многих комбинаторных выражений. В таких ситуаци­ ях, экстраполирование от начального впечатления ведет к явной недооцен­ ке. Дело в том, является ли основание для экстраполяции изначальной дос­ тупностью случаев, как в предшествующих двух исследованиях или резуль­ татом изначального вычисления, как в следующем исследовании. И сследование 6: Экст раполяция Мы попросили, испытуемых оценить, в пределах 5 секунд, числовое выра­ жение, которое было написано на доске. Одна группа испытуемых (N = 87) оценивала выражение 8 х 7 х 6 х 5 х 4 х З х 2 х 1 , в т о время к ак другая группа (N = 114) оценила выражение 1 х 2 х З х 4 х 5 х 6 х 7 х 8 . Средняя оценка для убывающей последовательности была 2. 250. Средняя оценка для возраста­ ющей последовательности была 512. Различие между оценками высоко су­ щественно (р < 0.001, тест медианы). Обе оценки далеки от правильного от­ вета 40. 320. И недооценка правильной величины, и различия между двумя оценка­ ми поддерживает гипотезу, согласно которой, люди оценивают 8!, экстра­ полируя от частичного вычисления. Ф акториал, подобно другим комбина­ торным вы ражениям, характеризуется постоянно увеличивающейся про­ порцией роста. Следовательно, человек, который экстраполирует от частич­ ного вычисления, чрезвычайно недооценит факториалы. Поскольку резуль­ таты первых шагов умножения (выполненных слева направо) больше в нис­ ходящей последовательности, чем в возрастающей последовательности, пер­ вое выражение оценено большим, чем последнее. Оценка нисходящей пос­ ледовательности может происходить следующим образом: “8 х 7 - 56 умно­ ж ить на 6 - уж е больше 300, так что, мы имеем дело с достаточно большим числом.” В оценке возрастающей последовательности, с другой стороны, можно рассуждать: “1 x 2 равняется 2, умножить на 3 равняется 6, умно­ жить на 4 - 24, это выражение не очень больш ое.... ” И сследование 7: Бином - доступность или репрезент ат ивност ь Заключительное исследование этой главы исследует роль доступности в оценке биноминальных распределений и иллюстрирует, к а к формулиров­ ка задачи управляет выбором эвристики, которую люди принимают при интуитивной оценке. 200 ДОСТУПНОСТЬ Испытуемым (N - 73) предоставили следующие инструкции: Рассмотрите следующую диаграмму: ХХОХХХ ХХХХОХ ХОХХХХ хххохх хххххо оххххх Дорожка в этой диаграмме - любая нисходящая линия, которая начинается в верхней строке, заканчивается в нижней строке и проходит точно через один символ (X или О) в каждой строке. Как Вы думаете, какой, процент дорожек содержат 6 - X и без - О __% 5 - X и 1 -0 ____ % без -Х и 6 - 0 ____ % Обратите внимание, что они включают все возможные типы дорожек и, следовательно, Ваши оценки должны в сумме составить 100%. • Данные дорожек о Правильное значение 30% . Ö \ , \ X S’ §. 20% \ h ч - 10% + + бх 5х 4х Зх 2х 1х Ох Число X в выборке из 6 Рис. 2. Правильные значения и средние оценки: задача про дорож­ ки Доступность: эвристика оценки частоты ... 201 Ф актическое распределение типа дорож ки биноминально с р= 5 /6 и п —6. Люди, конечно, не могут ни угадать правильные ответы, ни перечис­ лить все соответствующие случаи. Вместо этого, по нашему предположению, испытуемые посмотрят на диаграмму и оценят относительную частоту к а ж ­ дого типа дорожки легкостью, с которой отдельные дорожки этого типа мог­ ли быть построены. Так как, на каждой стадии построения дорожки (то есть, в каж дой строке диаграммы) имеется намного больше X, чем О, легче пост­ роить дорожки, состоящие из шести X, чем дорожки, состоящие, скажем, из пяти X и одного О, хотя последние, фактически, более многочисленны. Соответственно, мы спрогнозировали, что испытуемые будут ошибочно оце­ нивать дорожки из 6 X и без О, как наиболее многочисленные. Средние оценки относительной частоты всех типов дорожек представле­ ны на Рисунке 2, наряду с правильными биноминальными величинами. Результаты подтверждают гипотезу. Из 73 испытуемых, 54 ошибочно оце­ нили, что существует больше дорожек, состоящих из шести X и О, чем до­ рожек, состоящих из пяти X и одного О, и только 13 оценили последние, как более многочисленные, чем вышеупомянутые (р < 0.001, тест знаков). Монотонность субъективного распределения типов дорожек - общее явле­ ние. Мы п олучи ли тот ж е сам ы й результат с разли ч н ы м и величинам и р ( 4/ 5 и 5/6) и л (5, 6 и 10), и различными представлениями пропорций со­ вокупности (например, четыре X и один О или восемь X и два О в каждой строке диаграммы дорожек). Чтобы исследовать устойчивость этого эффекта, мы провели дополнитель­ ное испытание. Пятидесяти студентам старших курсов Стэнфордского уни­ верситета, не имеющим опыта в комбинаторике, предоставили задачу про дорожки. Здесь, испытуемых не просили оценить относительную частоту, а просто решить “имеется ли больше дорожек, содержащих шесть X и О или дорожек, содержащих пять X и О.” Испытуемых опрашивали индивиду­ ально и им обещали поощрение в $ 1 за правильные оценки. Абсолютное большинство испытуемых (38 из 50, р < 0.001, тест знаков) снова выбрало первый упомянутый результат как более частый. Ошибочные интуиции, очевидно, трудно исправляются за счет предоставления денежных вознаг­ раждений. Мы предположили, что, когда биноминальное распределение представ­ лено к а к диаграмма дорожек, люди оценивают относительную частоту раз­ личных исходов, определяя доступность отдельных дорожек каждого типа. Этот способ оценки предложен последовательным характером определения дорожки и иллюстрированным представлением задачи. Рассмотрим альтер­ нативную формулировку этой ж е задачи. Шесть игроков участвуют в карточной игре. В каждом туре игры, каждый игрок полу­ чает одну карту, взятую наугад из хорошо перетасованной колоды. В колоде, 5/6 карт помечены X и оставшиеся 1/6 помечены О. При большом количестве туров, какой про­ цент туров, в которых 202 ДОСТУПНОСТЬ 6 игроков получают Х и н и один игрок не получает О__% 5 игроков получают X, и 1 игрок получает О____% Ни один игрок не получает X и 6 игроков получают О % Обратите внимание, что здесь включены все возможные исходы и, следовательно, ваши оценки должны в сумме составить 100 %. Задача про карты формально идентична задаче про дорожки, но мы намере­ вались выявить другой способ оценивания. В задаче про дорожки, отдельные случаи были выделены путем демонстрации и пропорции совокупности (то есть, пропорция X в каждой строке) не была определена. В задаче про карты, с дру­ гой стороны, пропорция совокупности явно задана, и отсутствует упоминание относительно отдельных случаев. Следовательно, мы выдвигаем гипотезу, что исходы в задаче про карты будут определены степенью, в которой они репре­ зентативны по отношению к составу колоды, чем доступностью отдельных слу­ чаев. В задаче про карты, исход “пять X и один О” является наиболее репрезен­ тативным, потому что он соответствует пропорции совокупности (см. Kahneman nTversky, 1972b, 3). По эвристике репрезентативности, этотисходдолженбыть оценен как более частый, чем исход “шесть X и без О,” вопреки наблюдаемому образцу оценок в задаче про дорожки. Оценки 71 из 82 испытуемых, которые отвечали на задачу про карты, подтвердили этот прогноз. В задаче про дорож­ ки, только 13из 73 испытуемых оценили эти исходы таким же образом; разли­ чие между этими двумя версиями значимо (р < 0.001, тест#2). Число X в выборке из 6 Рис. 3. Правильные значения и средние оценки: задача про карты Доступность: эвристика оценки частоты ... 203 Средние оценки для задачи про карты представлены на Рисунке 3. Раз­ личие между рисунками 2 и 3 поддерживает гипотезу, что различные пред­ ставления одной и той ж е задачи выявляю т различную эвристику. В част­ ности, частота класса, вероятно, будет оценена степенью доступности, если выделены отдельные случаи, и репрезентативностью, если существенными являю тся признаки категории. Д о сту п н о сть в о п р о и зв е д е н и я В этой главе мы обсуждаем несколько исследований, в которых испытуемо­ му сначала предоставляют информацию (например, список имен) и потом просят, оценить частоту объектов данного типа, которые были включены в сообщение. К ак и в задачах, исследуемых в предыдущей главе, испытуе­ мый не может вспомнить и сосчитать все случаи. Мы предполагаем, что вместо этого он пытается вспомнить некоторые случаи и оценивает полную частоту степенью доступности, то есть легкостью с которой случаи прихо­ дят на ум. Как следствие, классы, чьи случаи с легкостью вспоминаются, будут оценены как более многочисленные, чем классы того ж е размера, чьи случаи менее доступны. Этот прогноз сначала был проверен в исследовании оцененной частоты категорий... И сследование 8: И звест ност ь, частота и вспоминание Испытуемым предоставили магнитофонную запись списка имен известных лиц обоих полов. Прослушав список, некоторые испытуемые оценивали, содержал ли он большее количество имен мужчин или ж енщ ин, другие по­ пытались вспомнить имена в списке. Некоторые из имен в списке были очень известны (например, Ричард Никсон, Элизабет Тейлор), другие были менее известны (например, Уильям Фулбрайт, Л ана Турнер). Известные имена легче вспомнить. Следовательно, если оценки частоты опосредованы оце­ ненной доступностью, то класс, состоящий из известных имен, должен быть оценен к а к более многочисленный, чем сравнимый класс, состоящий из менее известных имен. Были подготовлены четыре списка имен: два списка артистов и два спис­ ка общественных деятелей. К аждый список включал 39 имен и был запи­ сан со скоростью одно имя в 2 секунды. Два списка (один общественных де­ ятелей и один артистов) состояли из 19 имен известных ж енщ ин и 20 имен менее известных мужчин. Два других списка состояли из 19 имен извест­ ных муж чин и 20 имен менее известных женщ ин. Следовательно, извест­ ность и частота были обратно связаны во всех списках. Имена всех лиц все­ гда позволяли однозначную идентификацию пола. Испытуемых попросили слуш ать внимательно записанное сообщение. Каждый из четырех списков был представлен двум группам. После прослу­ ш ивания записи, испытуемых в одной группе просили записать столько 204 ДОСТУПНОСТЬ имен, сколько они могли вспомнить из списка. Испытуемых в другой груп­ пе попросили оценить, содержал ли список больше имен мужчин или жен­ щин. Результаты, (а) Вспоминание. В среднем, испытуемые вспомнили 12.3 из 19 известных имен и 8.4 из 20 менее известных имен. Из 86 испытуемых в четырех группах вспоминания, 57 вопроизвели больше известных, чем не­ известных имен, и только 13 вспомнили меньше известных, чем не очень известных имен (р < 0.001, тест знаков). (Ь) Частота. Среди 99 испытуемых, сравнивавш их частоту муж чин и ж енщ ин в списках, 80 ошибочно оценили класс, состоящий из более извес­ тных имен, к ак более частый (р < 0.001, тест знаков).... Воспроизведение и построение сценариев Во всех эмпирических исследованиях, которые были обсуждены в этой час­ ти книги, существовала объективная процедура для перечисления случаев (например, слова, которые начинаются на К или дорожки в диаграмме), и, следовательно, каж дая из задач имела объективно правильный ответ. Дру­ гое дело в случаях из реальной ж изни, в которых оцениваются вероятнос­ ти. К аждый случай экономического спада, успешного медицинского воз­ действия или развод, является по существу уникальным, и его вероятность не может быть оценена простым числом случаев. К ак бы там ни было, эври­ стика доступности может применяться к оценке вероятности таких собы­ тий. В оценке вероятности, что отдельно взятая пара разведется, например, можно полагаться на свою память в поисках пары, которая приходит в го­ лову при упоминании этого вопроса. Развод будет казаться возможным, если разводы распространены среди случаев, которые выбраны таким образом. В другом случае, можно оценивать вероятность, пытаясь создать истории, или сценарии, которые ведут к разводу. Правдоподобие таких сценариев или легкость, с которой они приходят на ум, могут обеспечивать основу для оценки вероятности. В данной главе, мы обсуждаем роль доступности в та­ ки х оценках, размышляем относительно ожидаемых источников предубеж­ дения и предлагаем некоторые направления дальнейших исследований. Мы иллюстрируем предубеждения доступности, рассматривая вообража­ емую ситуацию.4Клинический психолог,услышавший жалобу пациента, что тот утомлен жизнью, задается вопросом, вероятно ли, что этот пациент совер­ шит самоубийство, и может вспомнить подобных пациентов, которых он знал. Иногда только один случай приходит на ум, возможно, потому что он самый 4 Этот пример был выбран из-за его доступности. У нас нет достаточной причины полагать, что интуитивные прогнозы биржевых маклеров, спортивных комментаторов, политичес­ ких аналитиков или психологов-исследователей менее подвержены предубеждениям. Доступность: эвристика оценки частоты ... 205 незабываемый. Здесь, субъективная вероятность может зависеть, прежде все­ го, от подобия между тем событием и рассматриваемым. Если два события похожи, то человек ожидает повторение прошлого опыта. Когда несколько случаев приходят на ум, им придается столько значения, насколько они по­ хожи, в существенных особенностях, исследуемой проблеме. Н асколько уместны отобранные случаи? А нализируя свой прош лый опыт, клинический психолог вспоминает пациентов, которые подходят дан­ ному случаю, - тех, кто предпринимал попытки самоубийства, или тех, кто похож н а данный случай и совершал попытки самоубийства? С актуальной точки зрения, конечно, соответствующий класс - такой класс пациентов, которые подобны, в некотором отношении, данному случаю, и соответству­ ю щ ая статистика - это частота попыток самоубийства в классе. Поиск в памяти может осуществляться по другим правилам. Так к ак попытки самоубийства - драматическое и чрезвычайное событие, пациен­ ты, склонные к самоубийству, вероятно, будут легче запоминаться и вспо­ минаться, чем депрессивные пациенты, которые не предпринимали подоб­ ных попыток. К ак следствие, клинический психолог может вспомнить па­ циентов, склонных к самоубийству, с которыми он сталкивался, и оценить вероятность попытки самоубийства степенью подобия между этими случа­ ями и данным пациентом. Такой подход приводит к серьезным предубеж­ дениям. К линический психолог, замечающий, что почти все пациенты, склонные к самоубийству, которых o r может вспомнить, были угнетены, может прийти к выводу, что пациент, вероятно, совершит самоубийство, если он показывает признаки серьезной депрессии. С другой стороны, к л и ­ нический психолог может сделать вывод, что самоубийство маловероятно, если «этот пациент не напоминает ему ни одного случая самоубийства, с ко­ торым он когда-либо сталкивался». Такое рассуждение игнорирует факт, что только меньшинство депрессивных пациентов совершает попытку са­ моубийства, и возможность, что данный пациент весьма отличен от любого, с которым он когда-либо сталкивался. Наконец, клинический психолог мог бы подумать только о пациентах, которые были к ак депрессивны, так и склонны к самоубийству. Он тогда оценил бы вероятность самоубийства легкостью, с которой такие случаи, приходят на ум или степенью, в которой существующий пациент является репрезентативным этому классу. Это рассуждение, такж е, обладает серьез­ ным недостатком. Тот факт, что существует много депрессивных пациен­ тов, которые предприняли попытку самоубийства, не свидетельствует от­ носительно вероятности, что депрессивный пациент предпримет попытку самоубийства, и все ж е этот способ оценивания обычен. Несколько исследо­ ваний (Jenkins & W ard 1963; Smedslund, 1963; W ard & Jenkins, 1965) пока­ зали, что случайность между двумя бинарными переменными такими, как признак и болезнь оценивается частотой, с которой они происходят взаимо­ связано, практически не принимая во внимание случаи, где либо признак, либо болезнь отсутствовали. 206 ДОСТУПНОСТЬ Некоторые события воспринимаются настолько уникально, что прошлый опыт не каж ется уместным при оценке их вероятности. В размышлении о таких событиях мы часто строим сценарии, то есть, истории, которые ведут от существующей ситуации к целевому событию. Правдоподобие сценари­ ев, которые приходят на ум, или трудность их создания, служ ит ключом к оценке вероятности события. Если обоснованный сценарий не приходит на ум, случай считают невозможным или маловероятным. Если на ум прихо­ дит много сценариев, или если один придуманный сценарий особенно убе­ дителен, рассматриваемый случай каж ется вероятным. Многие из событий, вероятность которых люди желают оценить, зави­ сят от нескольких взаимосвязанных факторов. Все ж е чрезвычайно трудно для человеческого ума прочувствовать последовательности изменений не­ скольких взаимодействующих факторов. Мы предполагаем, что в оценке вероятности сложных событий рассматриваются только самые простые и наиболее доступные сценарии. В частности, люди будут склонны создавать сценарии, по которым большинство факторов вообще не изменяется, при­ сутствуют только наиболее очевидные изменения, и взаимодействующие изменения редки. Из-за упрощенного характера предполагаемых сценари­ ев, исходы компьютерного моделирования процессов взаимодействия час­ то противоречат интуиции (Forrester, 1971). Тенденция рассматривать толь­ ко относительно простые сценарии может иметь особенно существенные эффекты в ситуациях конфликта. В этом случае, собственное настроение и планы более доступны, чем планы другого человека. Н елегко принять мне­ ние противника по шахматной доске или полю битвы, вот почему посред­ ственный игрок обнаруживает так много новых возможностей, когда он меняет сторону в игре. Следовательно, игрок может иметь тенденцию рас­ ценивать стратегию его противника к ак относительно постоянную и не за­ висящ ую от его собственных шагов. Эти соображения говорят, что игрок восприимчив к ошибке инициативы - тенденции приписывать меньше ини­ циативы и воображения своему противнику, чем себе. Эта гипотеза согла­ суется с выводом поиска приписывания (Jones & N isbett, 1971), согласно которому люди склонны воспринимать свое поведение к а к отражение из­ меняю щ ихся потребностей окружающей среды, а поведение других - как отражение черт характера. Создание сценария накладывает отпечаток на дальнейшее мышление. Существует много сведений, показывающих, что к ак только некоторая си­ туация воспринимается или интерпретируется определенным образом, ста­ новится чрезвычайно трудно воспринимать ее по-другому (см, например, B runer & Potter). Таким образом, составление определенного сценария мо­ ж ет препятствовать появлению других сценариев, особенно тех, которые ведут к другим исходам... Возможно, наиболее очевидное проявление доступности в реальной ж из­ ни - это влияние случайной доступности случаев или сценариев. Многие читатели испытали временное увеличение субъективной вероятности несча­ Доступность: эвристика оценки частоты ... 207 стного случая, увидев на обочине перевернутую машину. Подобным обра­ зом, многие замечают усиление субъективной вероятности того, что несчаст­ ный случай или неполадки оборудования спровоцируют начало термоядер­ ной войны после просмотра фильма, ярко описывающего такую возмож­ ность. Сосредоточение внимания на исходе, может увеличить его доступ­ ность, и, следовательно, его каж ущ ую ся вероятность. Люди увлекаются желаемыми исходами, такими как выигрыш в тотализаторе или крайне не­ ж елательными исходами, к ак крушение самолета. Следовательно, доступ­ ность обеспечивает механизм, согласно которому явления крайней полез­ ности (или бесполезности) могут происходить более вероятно, чем на самом деле... 12. Эгоцентрические предубеждения в доступности и атрибуции* Михаелъ Росс и Фьер Сиколи Один пример явления, изученного в настоящем эксперименте, знаком прак­ тически каждому, кто проводил исследование совместно с другими. Рассмот­ рим следующее: Вы работали над совместным проектом с другим челове­ ком и поднимается вопрос, кто является “главным автором” (то есть, кто внес больший вклад в окончательный проект?). Часто каж ется, что вы оба можете претендовать на это звание. И так к а к Вы убеждены, что Ваш кол­ лега разделяет ваше видение реальности (где существует только одна реаль­ ность), Вы предполагаете, что другой человек пытается использовать Вас. Иногда такие разногласия улаживаются или их появление предотвращает­ ся использованием правил условного решения, например, правила “алфа­ витного порядка” - любимая уступка тех, чьи фамилии начинаются с букв, расположенных в верхней части алфавита. Мы предполагаем, что отдельные участники совместного проекта склон­ ны принимать на себя больше ответственности за результат, чем другие уча­ стники приписывают им. Далее мы предположили, что распределение уча­ стниками ответственности за совместный проект является распространен­ ным явлением. Однако, люди, занимающиеся общим делом, не всегда зна­ ют о расхождении их взглядов, так к ак нет необходимости приписывать “авторство”, следовательно, универсальность явления не является очевид­ ной. Цель настоящего исследования - оценить, действительно ли эти эго­ центрические восприятия происходят в различных условиях и исследовать соответствующие психологические процессы. И зучая основы различного восприятия, мы допускаем, что иногда люди намеренно себя возвеличивают. Однако вероятно, что восприятие может не совпадать при отсутствии намеренного обмана. Именно с этой точки зрения мы и исследуем проблему. * Выдержки из работы, появившейся в “The Journal of Personality and Social Psychology”, 1 9 79,37,32-336. Авторское право© 1979 American Psychological Association. Переизданов соответствии с разрешением. Эгоцентрические предубеждения в доступности... 209 Полные благих намерений участники, для распределения ответственно­ сти за объединенные усилия, пытаются вспомнить вклад, который каж ды й из них внес в конечный продукт. Однако некоторые аспекты взаимодействия можно вспомнить легче, или они являю тся более доступными, чем другие. Кроме того, особенности, которые легко вспоминаются, могут не быть слу­ чайным подмножеством целого. В частности, человек может вспомнить боль­ шую долю собственного вклада, чем смогут другие участники. Эгоцентрическое предубеждение в доступности информации в памяти, в свою очередь, может служить причиной необъективного приписывания от­ ветственности за совместный результат. К ак продемонстрировали Тверски и Канеман (Tversky и Kahneman, 1973,11), люди используют доступность (“легкость, с которой соответствующие случаи приходят на ум”) к ак осно­ вание для оценки частоты (1973, стр. 209). Таким образом, если входные данные, воспроизведенные участником самостоятельно, были бы доступны, люди тогда принимали больше ответственности за совместный результат, чем другие участники приписывали им. Существует, по крайней мере, четыре процесса, направленных на увели­ чение доступности собственных вкладов: (а) выборочное кодирование и хра­ нение информации, (Ь) дифференциальная выборка, (с) информационные различия и (d) мотивационные влияния. Выборочное кодирование и хранение По ряду причин, доступность собственных входных данных человека мо­ ж ет быть облегчена дифференциальным кодированием и хранением самоцроизведенных реакций. Во-первых, собственные мысли людей (относитель­ но того, что они собираются сказать, фантазии т.д.) или действия могут от­ влекать их внимание от вкладов других. Во-вторых, люди могут имитиро­ вать или повторять свои идеи или действия; например, они могут обдумы­ вать свою позицию перед тем, к а к ее высказать и защитить. Следовательно, их собственные входные данные получают больше “времени на изучение”, а степень сохранения тесно связана со временем на изучение (Carver, 1972). В-третьих, вклады людей легче встраиваются в их когнитивную схему, то есть в уникальное понимание проблемы, основанное на прошлом опыте, ценностях и так далее. Вклады, которые вписываются в такие существо­ вавшие ранее схемы, сохранятся с большей вероятностью (B artlett, 1932; B runer, 1961). Дифференциальное воспроизведение Предубеждение доступности может такж е являться следствием дифферен­ циального воспроизведения информации из памяти. При распределении ответственности за исход совместной деятельности важ ны й вопрос для к а ж ­ дого участника может звучать так: “Каков мой вклад?” Участники могут 210 ДОСТУПНОСТЬ попытаться вспомнить собственные вклады и неуместно использовать ин­ формацию, полученную таким образом, чтобы оценить их относительные вклады , однако подобная оценка не может быть сделана должным образом без рассмотрения входных данных других людей. Информационные различия Вероятно, существуют различия в доступной для участников информации, что может спровоцировать эгоцентрическое вспоминание. Люди имеют боль­ ш ий доступ к их собственным внутренним состояниям, мыслям и стратеги­ ям , чем наблюдатели. Кроме того, участники общего дела могут отличаться по знанию частоты и значения независимых вкладов друг друга. Например, супервизоры факультета могут знать меньше о количестве времени, усили­ ях или изобретательности, которую студенты вкладывают в выполнение заданий, проведение анализов данных и написание предварительных про­ ектов работы, чем сами студенты. С другой стороны, супервизоры более ос­ ведомлены о количестве и о важности размышлений, чтения и так далее, которые они включают в исследование прежде, чем студенты начнут его выполнять. М от ивационны е вли ян и я Мотивационные факторы могут такж е привести к эгоцентрическому пре­ дубеждению о доступности. Чувство собственного достоинства может уве­ личиться, если сосредотачиваться или придавать больше значения, собствен­ ным вкладам. Точно так же озабоченность собственной оперативностью или контролем может привести людей к тому, чтобы уделить больше внимания собственным вкладам в совместное дело (см. deCharms, 1968; W hite, 1959). Предшествующее обсуждение выделяет множество процессов, которые могут работать на то, чтобы представить собственные вклады более доступ­ ными (и легкими для вспоминания), чем вклады других. Следовательно, трудно опровергнуть гипотезу, согласно которой воспоминания и приписы­ вания являю тся эгоцентрическими. К ак заметил Гринвалд (Greenwald, 1978), эгоцентрический характер памяти “не является неминуемой прав­ дой . Можно предпринять попытку упорядочивания прошлого опыта, напри­ мер, провести сопоставительную работу, такую к ак написание текста по истории или индексирование тезауруса “ (с. 4). Кроме того, нам не удалось найти опубликованные данные, прямо подтверждающие предполагаемое предубеждение доступности. Наконец, недавние явления в литературе, по­ священной участникам и наблюдателям, каж ется, противоречат гипотезе, согласно которой воспоминания и приписывания являю тся эгоцентричес­ кими. Джонс и Нисбетт (Jones и N isbett, 1971) считали, что участники склон­ ны видеть причину своего поведения в окружающей среде, в то время как наблюдатели приписывают то ж е самое поведение устойчивым чертам ха­ Эгоцентрические предубеждения в доступности... 211 рактера, которыми обладают участники. Хотя разнообразие объяснений этого эффекта было предложено к рассмотрению (Jones и N isbett, 1971), не­ давний акцент был поставлен на перцептивной обработке информации (Storm s, 1973; Taylor и Fiske, 1975). Визуальные рецепторы участника на­ целены на окружающую среду; наблюдатель может сосредотачиваться не­ посредственно на нем. Таким образом, различные аспекты ситуации суще­ ственны для участников и для наблюдателей, неравенство, которое отраже­ но в их причинных приписываниях. Это предположение, каж ется, проти­ воречит положению, что участники во взаимодействии с другими людьми в значительной степени погружены в себя. Два исследования предлагают подтверждение существующей гипотезы. Роджерс, К уипери Киркер (Rogers, K uiper, K irker, 1977) показали, что чер­ ты характера, выраженные прилагательными, вспоминались легче, если испытуемых просили соотнести их с собой (т.е. описывала ли каж дая черта их), чем когда их просили о множестве других оценок (например, оценки синонимичности). Эти данные подразумевают, что возможность соотнесе­ ния с собой увеличивает доступность. Однако, Роджерс и др. не противопо­ ставляли вспоминание прилагательных, относящихся к себе с вспомина­ нием прилагательных, относящихся к другим - сравнение, которое было бы более подходящ им для текущего обсуждения. Гринвальд и Альберт (Greenwald, A lbert, 1968) обнаружили, что люди вспоминали, свои собствен­ ные вы сказы вания по определенному е опросу более точно, чем письменные вы сказы вания других испытуемых. Так к ак высказывания самого челове­ ка и других людей отражали всегда противоположные точки зрения, Грин­ вальд и Альберт подтвердили большую осведомленность и лучшее запоми­ нание аргументов, совпадающих с собственной позицией, чем запоминание само-произведенных утверждений, хотя свидетельство для изучения пре­ дубеж дениям сом нительно, нап ри м ер, G reenw ald и S a k u m u ra , 1967; Malpass, 1969. Мы провели экспериментальное исследование, чтобы определить, мож ­ но ли получить подтверждение предполагаемого предубеждения доступно­ сти. Студентов старших курсов, посещающих семинар, попросили оценить, сколько минут каж ды й участник семинара говорил в течение прошедшего занятия. Дополнительно были отобраны 26 испытуемых из групп по два че­ ловека, к которым подходили в кафетериях и залах. Участников в этих груп­ пах попросили оценить процент полного времени, в течение которого к а ж ­ дый человек говорил в течение текущего взаимодействия. Предполагалось, что испытуемые будут основывать свои оценки време­ ни на частях беседы, которые они могли с легкостью вспомнить. Таким об­ разом, если имеется предубеждение в пользу вспоминания собственных ут­ верждений, оценки человеком количества времени, в течение которого он сам говорил, должны превысить среднее время говорения, приписанное ему другими членами группы. 212 ДОСТУПНОСТЬ Результаты подтвердили предположения. Д ля семи из восьми студентов на семинаре старшекурсников, оценки их собственного времени говорения превысили среднюю оценку времени, приписанную им другими участни­ ками (р < 0.05, тест знаков). Точно так ж е оценки собственного времени раз­ говора у 10 из 13 пар превысили оценки времени, данные другими участни­ кам и (р < 0.05, тест знаков). Величина предубеждения была существенной для 13 пар, F (1, 12) = 14.85, р <0.005; в среднем участники оценили, что они говорили 59% времени. Эти данные обеспечивают предварительные, хотя и косвенные, подтверждения предполагаемого предубеждения доступ­ ности в ежедневных ситуациях... Э ксперим ент 1 В этом эксперименте, мы хотели исследовать эгоцентрические предубежде­ ния в естественно складываю щ ихся, длительных отношениях. Ж енатые пары представляли идеальную целевую группу. Супруги участвуют во мно­ гих совместных делах различной важности. Это обстоятельство должно пре­ доставлять возможности для эгоцентрических предубеждений. Соответственно, первый эксперимент проводился (а) чтобы определить, происходят ли эгоцентрические предубеждения в распределениях ответ­ ственности в брачных отношениях; (Ь) чтобы воспроизвести, используя раз­ личную меру зависимости, эгоцентрическое предубеждение доступности, полученное в предварительных испытаниях; и (с) чтобы соотнести преду­ беждение доступности с предубеждением в ответственности. Если предубеж­ дение в ответственности вызвано предубеждением доступности, два набора данных должны быть связаны. М ет од И с п ы т у е м ы е : 37 супруж еских пар, ж ивущ их в студенческих общ ежитиях. Двадцать пар имели детей. Испытуемые были привлечены двумя научными сотрудницами, ко­ торые обходили комнаты общ ежитий и кратко описывали эксперимент. Если пара хо­ тела участвовать, назначалась встреча. Исследование проводилось в квартире пары; каж дой паре было оплачено 5 $ за участие. П р о ц е д у р а . Анкетный опрос был создан на основе обширных предварительных интер­ вью с шестью супружескими парами. В эксперименте, анкетный опрос был выполнен индивидуально мужем и женой; анонимность была гарантирована. На первых страни­ цах анкетного опроса испытуемых просили оценить степень своей ответственности за каж дое из 20 действий, соответствующих супружеским парам, проводя косую линию через 150-миллиметровую прямую линию, концы которой были помечены “прежде всего ж ена” и “прежде всего м уж ”.1Эти двадцать действий были: приготовление завт­ 1В предварительных интервью, мы использовали процентные оценки. Мы обнаружили, что тестируемые были способны помнить проценты, которые они записали и что сравнения постан- Эгоцентрические предубеждения в доступности,.. 213 рака, мытье посуды, уборка, покупки продовольствия, присмотр за детьми, планиро­ вание совместного отдыха, решение, на что должны быть потрачены деньги, решение, где жить, выбор друзей, принятие важных решений, которые затрагивают Вас обоих, инициатор споров м еж ду Вами, разрешение конфликтов, причина беспорядка в доме, стирка, поддерживание контакта с родственниками, проявление привязанности к суп­ ругу (супруге), вынос мусора, раздражение супруга (супруги), ожидание супруга (суп­ руги), принятие решения, иметь ли детей. Испытуемых затем просили делать кратко запись примеров своих вкладов или вкла­ дов супруга (супруги), сделанные в каждый вид деятельности. Их письменные отчеты были впоследствии исследованы, чтобы оценить, были ли собственные входные дан­ ные человека более “доступны”. То есть, имеют ли тенденцию примеры, о которых со­ общили испытуемые, сосредотачиваться больше на их собственном поведении, чем на поведении их супруги (супруга)? Наблюдатель, не принимающий во внимание экспе­ риментальную гипотезу, сделал запись количества различных примеров, в которых испытуемые сообщили о своих собственных вкладах и вкладах супруга (супруги). Д ру­ гой наблюдатель закодировал одну треть данных; надежность (коэффициент корреля­ ции Пирсона) составила 0.81. Р езульт ат ы Ответы обоих супругов на каж ды й из вопросов об ответственности были сум­ мированы так, чтобы общее количество включило то значение, которое жена рассматривала к ак ее вклад, и то количество, которое муж рассматривал как его вклад. Так как ш кала ответа была 150 миллиметров длиной, было размещено 150 “единиц ответственности”. Сумма больше, чем 150 указы ­ вала на эгоцентрическое предубеждение в каж ущ емся вкладе, — то, что, по крайней мере, один из супругов переоценивал свою ответственность за эту деятельность. Чтобы оценить степень пере- или недооценки, которую этот супруг показал для каждого вида деятельности, 150 вычиталось от общей суммы каждой пары. Общий счет был получен для пары в среднем по 20 действиям (или 19, когда у пары не было детей). Дисперсионный анализ, использующий пару как единицу анализа, по­ казал, что общий счет был значительно больше нуля, М = 4.67, F (1, 35) = 12.89, р < 0.001, указы вая эгоцентрическое предубеждение в воспринятых вкладах. Двадцать семь из 37 пар показали некоторую степень переоценки (р < 0.025, тест знаков). Более того, в среднем, переоценка произошла в 16 из этих 20 пунктов в анкетном опросе, вклю чая отрицательные пункты например, причина споров между вами, F (1, 32) = 20.38, р < 0.001. Хотя величина переоценки была относительно маленькой, в среднем, испытуе­ мые имели тенденцию использовать ограниченный диапазон ш калы . Боль­ шинство ответов были слегка выше или слегка ниж е середины ш калы . Ни один пункт не показал существенный эффект недооценки. кетных процентов явились источником конфликтов между супругами. Использование 150миллиметровой шкалы обошло эти трудности; тестируемые не были склонны, преобразовы­ вать свои косые линии в точные проценты, которые могли обсуждаться в дальнейшем. 214 ДОСТУПНОСТЬ Второй набор пунктов в анкетном опросе требовал от испытуемых запи­ сать примеры их собственных вкладов и вкладов их супруга (супруги) в к аж ­ дый вид деятельности. Средний счет различия был получен по этим 20 ви­ дам деятельности (в среднем муж и жена), с количеством примеров вкладов супругов вычтенных из количества примеров собственных вкладов. Тест генеральной средней был существенен, F(l, 35) = 36.0, р < 0.001; к а к и ож и­ далось, испытуемые привели большее количество примеров своих собствен­ ны х вкладов (М = 10.9), чем вкладов супруга(супруги) (М =8.1). Отношение между разницей счета сам-другой и изначальной мерой воспринятой ответ­ ственности была определена. Как было предположено, чем больше тенден­ ц и я вспоминать свое релевантное поведение, тем больше была переоценка воспринятой ответственности, г (35) = 0.50, р < 0.01. Количество слов, содержащ ихся в каждом поведенческом примере, о котором сообщили испытуемые, было такж е оценено, чтобы обеспечить сте­ пень проработки или полноту вспоминания. Среднее количество слов в при­ мере не выделяется как функция того, порождалось ли данное поведение самим собой (М = 10.0) или супругом(супругой) (М = 10.1), F < 1. Далее, эта мера была некоррелирована с мерой воспринятой ответственности, г(35)=-0.15, не значимо. И так, как мера ответственности, так и мера, отраж аю щ ая доступность соответствующего поведения, показала предполагаемые эгоцентрические предубеждения. Кроме того, имеется существенная корреляция между ве­ личиной предубеждения в доступности и величиной предубеждения в от­ ветственности. Этот вывод согласуется с гипотезой, согласно которой эго­ центрические предубеждения в приписываниях ответственности опосредо­ ваны предубеждениями доступности. Наконец, количество воспроизведен­ ных актов поведения было важным фактором, более чем богатство вспомина­ н и я.... Э ксперим ент 2 В эксперименте 2 мы попросили игроков из 12 университетских сборных баскетбольных команд индивидуально заполнить анкетный опрос, в кото­ ром было необходимо вспомнить важ ны й поворотный момент в их после­ дней игре и оценить, почему их команда выиграла или проиграла. Это возможность уйти от сравнений сам-другой, которые мы рассмотре­ ли в предыдущих исследованиях, к сравнению команда - другая команда. Существует, однако, множество причин ожидать, что действия собственной команды должны быть более доступны наблюдателям, чем действия дру­ гой команды: я знаю имена моих товарищей по команде, и поэтому, у меня есть готовые средства для организации хранения и выборки данных, соот­ ветствующих им; наш успех в будущих играх с другими противниками за­ висит больше от наш их собственных наступательных и защитных способ­ ностей, чем от способностей противостоящей команды. Следовательно, я Эгоцентрические предубеждения в доступности... 215 могу внимательнее следить за действиями моих товарищей по команде, что облегчает кодирование и хранение. Также, имеются информационные раз­ личия: стратегии собственной команды более существенны, чем стратегии противостоящей команды (Tversky и Kahneman, 1973,11). Если инициати­ вы собственной команды дифференциально доступны, игроки должны вспомнить поворотный момент в терминах действий своей команды и при­ писать ответственность за исход игры своей команде.... М ет од И с п ы т у е м ы е . В исследовании учавствовали игроки университетских сборных команд по баскетболу: 74 женского пола и 84 мужского пола. С менеджерами команды связа­ лись по телефону; после обсуждений с игроками, они разрешили командам участво­ вать в исследовании. П р о ц е д у р а . Анкетные опросы проводились после шести игр, в которых команды, уча­ ствующие в исследовании, играли друг с другом. Таким образом, для трех выбранных игр с мужскими командами, три из шести м уж ских команд в исследовании играли про­ тив других трех м ужских команд. Точно так ж е три выбранные игры м еж ду женщина­ ми, включали все шесть ж енских команд. Анкетные опросы проводились при первой практике команды, последовавшей за целевой игрой (1 или 2 дня после игры), кроме одного случая, где из-за расписания игр команд, было необходимо собрать данные не­ медленно после игры (две женские команды,. Анкетные опросы были проведены инди­ видуально, и анонимность испытуемых была гарантирована. Следующие вопросы были заданы: 1. Пожалуйста, кратко опишите один важный поворотный момент в прошлой игре и обозначьте, в каком периоде игры он произошел. 2. Наша команда выиграла / проиграла прошлую игру потому что... Ответы на первый вопрос были исследованы, чтобы определить, был ли поворотный момент описан как созданный действиями собственной команды, обеих команд, или другой команды. Ответы на второй вопрос были исследованы, чтобы оценить количе­ ство причин победы или поражения, которые имели отношение либо к собственным действиям, либо к действиям другой команды. Данные были закодированы человеком, не знавшим экспериментальной гипотезы. Второй наблюдатель независимо закодиро­ вал ответы 50% испытуемых. Имелось соответствие 100 % для обоих вопросов. Результ ат ы Не было обнаружено никаких существенных половых различий в двух за­ висимых измерениях, поэтому о результатах сообщается независимо от пола. Так к ак ответы членов команды не могут рассматриваться к ак независи­ мые, было подсчитано среднее значение ответов, и команда, служила как единица анализа. 216 ДОСТУПНОСТЬ Предварительная проверка данных “поворотного момента” показала, что даж е в пределах команды игроки вспоминали весьма различные события. Однако 119 игроков вспомнили поворотный момент, который они описали к а к созданный действиями их собственной команды; 13 игроков вспомни­ ли поворотный момент, который они рассмотрели, к а к вызванный обеими командами; 16 игроков вспомнили, поворотный момент, который, к ак им казалось, инициирован действиями противоположной команды (оставши­ еся 10 игроков не ответили на вопрос). Испытуемые описали такие события к а к сильную защ иту в течение последних 2 минут игры, изменение в насту­ пательны х стратегиях, и так далее. Процент игроков, которые вспомнили поворотный момент, к ак вызван­ ный членами их команды, был получен для каждой команды. Эти 12 мно­ жеств были подвергнуты анализу, в котором они сравнивались со случай­ ным ожиданием 50% . Полученное распределение сильно отличалось от слу­ чайного, F (1,11) =30.25, р < 0.001, со средним 80.25% . К ак и было предпо­ ложено, большинство сообщений выделяли действия собственной коман­ ды. Процент игроков, которые вспомнили поворотный момент, к а к вызван­ ный членами их команды, был исследован относительно игры команды. Средний процент был выше у проигравшей команды, чем у победившей в пяти из шести игр (р < 0.11, тест знаков). Средняя разница между процен­ тами проигравших (М = 88.5) и выигравш их (М =72) команд была незначи­ мой (F <1). Бы ли такж е исследованы объяснения игроков относительно победы или проигрыш а их команды. Из 158 участников, только 14 указали причины, которые вклю чали действия противостоящей команды. В среднем, испы­ туемые сообщили о 1.79 причинах, касающиеся собственной команды и 0.09 п р и ч и н , к а саю щ и х ся п роти воп олож н ой ко м ан д ы , F (1, 11) = 2 7 2 .9 1 , р < 0.001. Наконец, тенденция приписывать больше причин для собствен­ ной команды была незначительно большая после проигрыша (М= 1.73), чем после победы (М= 1.65), F < 1. Обсуждение Ответы н а вопрос о поворотном моменте указывают, что действия товари­ щ ей по команде испытуемых были более доступны, чем действия членов противостоящей команды. Далее, испытуемые приписывали ответствен­ ность за исход игры действиям или бездействию скорее своих товарищей по команде, чем членов противоположной команды. Таким образом, предубеж­ дения в доступности и оценки ответственности могут происходить на уров­ не групп. Ратер и Хесковиц (R ather, Heskowitz ,1977) приводят другой при­ мер группового эгоцентризма: “CBS (новости) стали лидером после запуска на Луну Апполона в 1968. Если Вы - сотрудник CBS, Вы склонны считать, что ваше описание приземления на Луну перевернуло наше воприятие. Если Эгоцентрические предубеждения в доступности... 217 Вы - сотрудник NBC, Вы склонны рассматривать раскол команды ХантлиБринк ли(НшШеу- Brinkley) к ак ключевой фактор “ (с. 307).... Э ксперим ент 3 В эксперименте 3, мы попытались изменить центр внимания человека, что­ бы затронуть доступность. Мы использовали манипуляцию, предназначен­ ную для активизации выборочного исправления информации, непосред­ ственно соответствующей приписываниям ответственности. В нашем первоначальном анализе, мы предположили, что причиной эго­ центрических приписываний ответственности могло быть выборочное вос­ произведение информации из памяти и что на воспроизведение можно по­ влиять с помощью вопросов, которые люди задают самим себе. Эксперимент 3 проводился для проверки этой гипотезы. У испытуемых вызывались раз­ ные виды воспроизведения с помощью изменения формулировок вопросов. Выпускников попросили подумать либо об их собственных вкладах в их дип­ ломы на звание бакалавра гуманитарных наук, либо о вкладах их научных руководителей. Оценивать степень ответственности за научную работу, ко­ торую испытуемые приписали либо себе, либо научным руководителям, было оценено. Предположили, что испытуемые примут меньше ответствен­ ности за исследуемую проблему при условии направленности на научного руководителя, чем при условии направленности на себя. М етод И с п ы т у е м ы е . 17 выпускников факультета психологии женского полай 12 мужского. Большинство закончили 1 или 2 года аспирантуры. Все студенты провели эксперимен­ ты, ставшие основанием для диплома на звание бакалавра гуманитарных наук на пос­ леднем году обучения. П р о ц е д у р а . С испытуемыми общались индивидуально в их офисах и просили заполнить краткий анкетный опрос наотношение студент-научный руководитель. Ни один не отка­ зался участвовать. Две формы анкетного опроса были наугад распределены среди испы­ туемых; анонимность и конфиденциальность были гарантированы. В одной из форм анкетного опроса испытуемых просили указать свой собственный вклад в каждое и з множества действий, связанных с их бакалаврскими дипломами. Вопросы были следующие: (а) “Я п р едл ож и л __ процентов методологии, которая в конечном итоге использовалась в исследовании.” (В) “Я обеспечил _ процентов интерпретации результатов.” (С) “Я был инициатором__ процентов обсуждений, касающихся дипло­ ма, с моим руководителем.” (D) “В течение связанных с дипломом обсуждений я был склонен управлять курсом и содержанием обсуждения__ процентов времени.” (Е) “Учи­ тывал все, я был ответствен з а ___ процентов всех усилий, приложенных к исследова­ нию.” (F) “Как бы Вы оценили Ваш диплом относительно других дипломов, сделанных на факультете? “ Вторая форма анкетного опроса была идентична вышеупомянутой, за исключением 218 ДОСТУПНОСТЬ того, что слово Я (условие направленности на себя) было заменено на м ой р у к о в о д и т е л ь (условие направленности на руководителя) в вопросах 1-5. Испытуемых попросили за­ полнить бланки с ответами на первые пять вопросов и провести косую черту через 150миллиметровую линию, с концами, помеченными “х уж е” и “лучше”, в ответ на вопрос 6. Р езульт ат ы и обсуждения С целью анализа, было принято, что вклад руководителя и студента в к аж ­ дый пункт составляет в целом 100% . Хотя эксперимент был представлен к а к изучение отношения студент-руководитель, возможно, что студенты рассматривали в своих оценках входные данные других людей (например, других студентов). Однако данная процедура обеспечивает умеренное ис­ пытание экспериментальной гипотезы. Например, если тестируемый отве­ чал 20 % на пункт в “Я ”-версии анкетного опроса, считалось, что его или ее руководитель внес вклад 80% . Руководитель, возможно, внес только 60%, а неизвестный человек остальные 20% . Возможно переоценивая вклад ру­ ководителя, однако, мы смещаем данные против экспериментальной гипо­ тезы: “Я”- версия, к а к ожидалось, уменьшит процент ответственности, при­ писываемой руководителю. Ответы испытуемых на первые пять вопросов в “Я”-версии анкетного оп­ роса вычитались из 100 так, чтобы более высокие числа отражали большие вклады руководителя в обоих условиях. Вопрос 5 имел дело с полной ответ­ ственностью за исследование. Как и ожидалось, испытуемые приписали боль­ ше ответственности руководителю при условии направленности на руково­ дителя (М = 33.3 %), чем при условии направленности на себя (М = 16.5 %), F (l, 27) = 9.05, р < 0.01. Первые четыре вопроса касались различных аспек­ тов диплома, и средний ответ показал похожие результаты: направленность на руководителя М = 33.34; направленность на себя М = 21.82; F (1,27) =5.34, р < 0.05. Наконец, испытуемые имели тенденцию оценивать свой диплом бо­ лее положительно при условии направленности на себя, чем при условии на­ правленности на руководителя: 112.6 против 94.6, F (1, 27) = 3.59, р < 0.10. Контрастирующая формулировка вопросов имела ожидаемое воздействие на распределения ответственности. Версия анкетного опроса, касающ аяся руководителя, возможно, заставила испытуемых вспомнить, большую часть вкладов их руководителей, чем “Я”-версия анкетного опроса. Эта диффе­ ренциальная доступность была отражена в распределениях ответственнос­ ти. Обратите внимание, что вопросы не поддавались контролю испытуемых за счет исправлений. Научному руководителю приписывалась только тре­ тья часть ответственности за диплом в условии направленности н а руково­ дителя. В свете существующих данных, приписывания баскетболистов ответ­ ственности за исход игры в эксперименте 2 должны были быть заново ис­ следованы. Вспомните, что игроков просили закончить предложение, “Наша Эгоцентрические предубеждения в доступности... 219 команда выиграла / проиграла последнюю игру потому что... ” Этот вопрос выдал высоко значимое эгоцентрическое предубеждение. Оценивая прошлое испытание, очевидно, что форма вопроса - “Наша ком анда... нашу прошлую игру” — , возможно, побудила испытуемых сосредоточиться на действиях их собственных команд, даже при том, что формулировка не устраняет ссыл­ ки на противоположную команду. Вопрос про “поворотный момент” в экс­ перименте 2 был более нейтрально сформулирован и не может интерпрети­ роваться двояко. Главные вопросы в этих исследованиях исходят из внешнего источника; многие из наших вопросов исправления само-инициированы, однако, и наше вспоминание может вполне быть смещено формой, в которой мы самим себе излагаем вопросы исправления. Например, баскетболисты, скорее всего, будут думать в терминах “Почему мы выигрывали или проигрывали? “ Чем в терминах, сформулированных нейтрально “К акая команда была ответ­ ственной за исход игры?”... Настоящее исследование демонстрирует распространенность центриро­ ванных на себе (self-centered) предубеждений доступности и оценок ответ­ ственности. В повседневной ж изни, эти эгоцентрические тенденции могут не замечаться, когда объединенные усилия не требуют явных распределе­ ний ответственности. Если распределения обозначены отчетливо, однако, появляется повод для разногласия, и люди, вряд ли, поймут, что различия в оценках могут исходить из оценок информации, которая является диффе­ ренциально доступной. 13. Предубеждения доступности в социальном восприятии и взаимодействии* Ш е л л и И . Т ей лор К аж ды й день человек делает многочисленные, сложные социальные оцен­ ки - прогнозирование поведения других людей, приписывание ответствен­ ности, отнесение человека к категории, оценка других людей, оценка влас­ ти, влияния человека или причинную атрибуцию. Главная задача социаль­ ной психологии состоит в том, чтобы определить, к ак субъект делает эти оценки. До недавнего времени, исследование этой темы было отмечено ра­ ционалистичным предубеждением, предположением о том, что оценки де­ л аю тся, и сп ол ьзуя полны е, оп ти м альны е стратеги и (см ., например, Fischhoff, 1976, для обсуждения этой темы). Ошибки в оценках были при­ писаны двум источникам: (а) случайные ошибки из-за проблем с информа­ цией, о которой человек не знал; и (Ъ) ошибки, которые являлись следстви­ ем иррациональных мотивов и потребностей человека. В пределах социальной психологии эта перспектива представлена иссле­ дованием причинной атрибуции. В ранних формулировках атрибуции (на­ пример, Jones & Davis, 1965; Kelley, 1967) человек был охарактеризован как неопытный ученый, который собирал информацию из множества источни­ ков окружающей среды, чтобы делать приписывания относительно причин­ но-следственных отношений. Когда наблюдались отклонения от норматив­ ных моделей, считалось, что они происходят от предубеждений, таких как гедоническая релевантность (Jones & Davis), 1965) или других эгоцентри­ ческих потребностей (см. M iller & Ross, 1975). Однако в течение многих лет, все большее количество данных доказыва­ ло не только то, что оценки и реш ения людей менее закончены и рациональ­ ны, чем считалось, но что не все ошибки могут исходить из мотивационных факторов. Д аж е при отсутствии мотивов, оценки часто делались на основа­ нии скудных данных, которые, по-видимому, были случайно объединены и * Подготовка части книги была поддержана Исследовательским Грантом Национального Научного Фонда № BNS 77-09922 Предубеждение доступности в социальном ... 221 находились под влиянием предвзятых мнений (см., например, Dawes, 1976). Эти выводы привели к пересмотру когнитивной системы. Люди стали рас­ сматриваться к ак обладающие ограниченными возможностями, способны­ ми к оперированию только небольшим количеством данных одновременно. В отличие от “наивного” ученого, который оптимизирует, человек, к а к счи­ тается, “сатисфицирует” (Simon, 1957) и использует сокращ ения, которые приведут к решению и оценке эффективно и точно. Один из наиболее провокационных и влиятельных вкладов в пересмотр процесса оценивания - это работа Канемана и Тверского о когнитивной эв­ ристике (Kahneman и Tversky, 1973, 4; Tversky и Kahneman, 1974, 1). Со­ гласно Тверскому и Канеману (1974,1), эвристика используется в условиях неопределенности, или недоступности, или неоднозначности важной инфор­ мации. В не-социальных оценках неопределенность вытекает, прежде все­ го, из ф акта, что информация, соответствующая отдельно взятой оценке, является почти всегда неполной. Соответствующий фактический материал может быть недоступен, он не может быть собран вовремя, чтобы влиять на решение, или может быть слишком объемным, чтобы быть должным обра­ зом организованным и использоваться в задаче оценки. Эвристика - это вероятные стратегии для создания социальных, а такж е несоциальных оценок по нескольким причинам. Во-первых, различие меж ­ ду социальными и несоциальными оценками условно, фактически любая сущ ественная оценка имеет социальные последствия. Во-вторых, соци­ альные оценки включают те ж е виды неопределенности, которые характе­ ризуют несоциальные оценки. В-третьих, социальные оценки включают новые источники неопределенности. Информация относительно людей бо­ лее неоднозначна, менее надежна и более непостоянна, чем информация от­ носительно предметов или несоциальных событий, так как личные призна­ ки не написаны на лицах людей, к а к у предметов обозначен их цвет, форма или размер. Таким образом, личные признаки скорее должны быть выведе­ ны, чем наблюдаемы непосредственно. У людей есть намерения, не все из которых непосредственно обозначены. Учитывая, что наиболее существен­ ные социальные действия могут совершаться по различным причинам и приведут к различным последствиям, значение социального действия по существу неоднозначно. Хотя предметы сохраняют свои признаки незави­ симо от ситуации и времени, мотивы людей меняются от ситуации к ситуа­ ции, и цели меняются к ак с минуты на минуту, так и в течение жизни; та­ ким образом, даже правильный вывод в одной ситуации может быть беспо­ лезен с точки зрения прогнозов. Отсутствие полной, надежной, прогнози­ рующей информации относительно людей и социальных взаимодействий предполагает, что люди используют эвристики, позволяющие им делать выводы и предсказания, отталкиваясь от тех скудных и ненадежных дан­ ных, которые являю тся доступными. 222 ДОСТУПНОСТЬ Эврист ика доступности Одна из таких эвристик - доступность. “Считается, что человек, использует эвристику доступности всякий раз, когда он оценивает частоту или вероят­ ность посредством легкости, с которой случаи или ассоциации приходят на ум” (Tversky и Kahneman, 1973, с. 208,11). Человек предполагает, что, если примеры приходят на ум быстро, то их должно быть много, или если ассо­ циация проделывается легко, тогда она должна быть точной, так как ассо­ циативные связи приходят с опытом. Кроме того, именно легкость воспо­ минания, построения и ассоциации, обеспечивает оценку частоты или ве­ роятности, а не общая сумма примеров или ассоциаций, которые приходят на ум. Таким образом, важ ная разница между использованием эвристики доступности и использованием более сложного процесса - то, что произво­ дится мало поправок; оценка легкости, с которой этот процесс может быть выполнен, является достаточной к ак основание для вывода. Тверски и Канеман (1973,11) предлагают два общих класса задач, в кото­ ры х предубеждение доступности могло бы заметно фигурировать: построе­ ние случаев и ассоциаций и выборка ассоциаций и случаев. Эти две общие задачи - такж е задачи субъекта. При некоторых обстоятельствах нас могут попросить воспроизвести социальное поведение, к ак в попытке угадать, как друг поведет себя, узнав, что жена от него уходит. В таких случаях каждый конструирует социальную действительность, с которой данный случай мо­ ж ет быть сравнен. В других случаях, человек может основываться на про­ ш лы х примерах поведения, чтобы сделать выводы, например, он может вспомнить случаи, к ак друг справлялся с кризисными ситуациями в про­ шлом, чтобы спрогнозировать, как он справится теперь. В некоторой степени предположения относительно отношения между легкостью воспроизведения и количеством примеров или ассоциаций, точ­ ны, и настолько, насколько они точны, человек, использующий эвристику доступности, придет к правильным выводам или, по крайней мере, к тем, которые будут соответствовать выводам, достигнутым, при использовании более сложных процедур. При других обстоятельствах, однако, эти выводы могут быть неточными, потому что существуют предубеждения в доступ­ ных данных, которые имеют отношение к задаче. Существует, по крайней мере, три способа, с помощью которых предубеждения в доступных данных могут смещать следующие друг за другом социальные процессы. Во-пер­ вых, только существенные данные могут быть более доступны и, следова­ тельно, оказывать непропорциональное влияние на процесс суждения. Вовторых, предубеждения в самом процессе происпроизведения могут выда­ вать нерепрезентативную основу данных. В-третьих, стойкие когнитивные структуры человека, такие к ак убеждения и ценности, способствуют появ­ лению предубеждений, усиливающих доступность определенных свиде­ тельств, таким образом, смещая процесс оценки. Присутствие любого из таких предубеждений может привести к необъективным выводам. Предубеждение доступности в социальном ... 223 Предубеж дения доступности и заметности: пример Предубеждения заметности проявляются в том, что красочные, динамичес­ кие или другие отличающиеся стимулы непропорционально привлекают внимание, и соответственно влияют на оценки. Один из примеров такого предубеждения был назван фундаментальной ошибкой атрибуции (см. Ross, 1977), и он относится к распространяющемуся предубеждению видеть людей к а к причинных агентов в окружающей среде. То есть в социальном окруж ении, где либо человек, либо некоторая ситуативная переменная яв­ ляется вероятным причинным фактором для исхода, существует общее пре­ дубеждение, чтобы видеть людей к а к причинных агентов, особенно их ус­ тойчивые поведенческие признаки. Некоторые люди более заметны, чем другие, и эта дифференциальная за­ метность в пределах социального окружения может такж е смещать процесс оценивания. Исследования, в которых применили гештальт-принципы фи­ гурального акцента к социальному миру (см., например, M cA rthur и Post, 1977; Taylor и Fiske, 1975; Fiske и другие, 1979), показывают, что человек, который ярко освещен, перемещается (как в кресле-качалке), контрастен (с помощью таких тривиальных манипуляций, как цвет рубашки), или нови­ чок привлекает к себе непропорциональное количество внимания. Социальные последствия предубеждения заметности проиллюстрирова­ ны исследованиями, изучающими воздействие статуса соло или символи­ ческой интеграции на впечатления людей о других людях. Когда компания собирается включить членов группы меньшинств, таких, к ак чернокожих, ж енщ ин или инвалидов, часто полной интеграции предшествует промежу­ точный шаг. На этом этапе, один или два члена этой группы, могут быть приняты в то, что иначе было бы группой белых рабочих мужского пола, та­ ким образом, создав примеры статуса соло. Статус соло может возникать по нескольким причинам. Отсутствие квалифицированных претендентов от от­ дельно взятой группы меньшинств; организация желает избежать угрозы большого притока членов группы меньшинства; или статус соло может ис­ пользоваться, чтобы отразить силы конструктивного действия. Независимо от причин для символической интеграции, к символу или человеку-соло час­ то относятся как к представителю его социальной группы. Соответственно, оценки его поведения часто используются, чтобы предсказать, как другие члены этой группы вели бы себя, если бы они такж е были приняты в органи­ зацию. Значение статуса соло - это его новизна. Ж енщ ина выделяется среди мужчин, такж е к ак чернокожий выделяется среди белых людей. Такая от­ четливость способствует предубеждению заметности. В экспериментальном аналоге этой ситуации, испытуемые просмотрели видеофильм о маленькой группе (шесть человек), беседующих в неформаль­ ной обстановке. Некоторым испытуемым показали группу, в которой был один афро-американец, один мужчина или одна женщ ина в среди белокожих, в женской, или мужской компании, соответственно (Taylor и другие, 1976; 224 ДОСТУПНОСТЬ Taylor, Fiske, Etcoff и Ruderman, 1978). Другие испытуемые наблюдали груп­ пы сравнений, где содержание обсуждения в группе было так же, как и в ус­ ловии соло, но пол, или расовый состав группы был уравнен (например, три мужчины, три женщины). Испытуемые наблюдали обсуждение в группе и затем делали запись своих впечатлений о людях в группах. Согласно положению о том, что существует предубеждение значимости, созданное статусом соло или символическим статусом, поведение чернокожего-соло вспоминалось несколько лучше, чем поведение этого же челове­ к а в сопоставимой смешанной группе, и было такж е оценено, что человексоло говорил больше по сравнению с соответствующим человеком в смешан­ ной группе.1 Это предубеждение значимости, в свою очередь, приводит к крайности оценок. Когда человек был соло в группе, его поведение было оценено более экстремально в любом положительном или отрицательном направлении, по сравнению с тем ж е самым поведением в смешанной груп­ пе. Н еприятный человек был воспринят как еще более неприятный в ситу­ ации соло; хороший человек был воспринят к ак более хороший в ситуации соло. Используя эвристику доступности к ак объяснительную структуру, мож­ но вывести, что, когда испытуемых просили оценить человека в группе, они пытались приблизиться к примерам соответствующего поведения или ассо­ циациям с людьми стимула, и легкость, с который такие случаи или ассо­ циации приходили в голову, приводили их к крайним суждениям. В случае с соло, доступно больше примеров соответствующего поведения, потому что имеется большая база данных, ведущая к крайности оценок. Эти результа­ ты предполагают, что выделяю щийся человек, будь то соло, неполноцен­ ный человек, или просто человек, отличающийся от людей, с которыми он взаимодействует, вызовет крайние оценки у окружающих. Значение этих результатов для социального мира, конечно, огромно. Например, если людисоло используются как основание для включения в группу представителей меньшинств, и восприятие соло необъективно, то могут быть приняты не­ правильные решения. Преувеличенно отрицательные оценки человека-соло могут привести к необоснованному завершению десегрегации. Преувели­ ченно положительные оценки могут стать основанием для ложных ожида­ ний относительно поведения других членов группы меньшинства, ожида­ н ия, которые могут не оправдаться. М отивация не может служить объяснением предубеждения в восприя­ тии значимых людей. Хотя некоторые мотивационные процессы могут оп­ ределять отношение к инвалидам или людям-соло, трудно найти их в оцен­ ке человека, который отличается цветом рубашки или движениями. Соот­ ветственно, нужно обратиться к когнитивным факторам, а эвристика дос­ тупности обеспечивает возможное объяснение этих эффектов. 1Не было собрано данных о вспоминании в исследованиях по мужчинам- и женщинам-соло. Предубеждение доступности в социальном ... 225 Дост упност ь и предубеждения воспроизведения: Д ва примера Другой источник предубеждений доступности происходит от того, как ин­ ф ормация хранится или восстанавливается. То есть пам ять имеет специфи­ ческую организацию , которая мож ет облегчить процесс выбора или воспро­ изведения некоторых примеров или выводов и помеш ать появлению дру­ гих. Одним из способов вмеш ательства является простое ограничение ко­ личества информации, которая мож ет храниться в пам яти, что мож ет при­ вести к беспорядку в ассоциативных связях или примерах, которые хра­ нятся в пам яти. Ротбарт и его коллеги (R othbart и другие, 1978) продемонстрировали эту проблему в исследовании признаков социальных групп. Испытуемым пред­ лож или информацию о характерных чертах членов гипотетической группы (например, Ф ил - ленивый) при одном из двух условий. Испытуемые либо видели имена некоторых членов группы (Эд, Ф ил, Фред, Джо) со специфи­ ческой чертой (ленивый), либо они видели, что ту ж е самую пару: характеримя (Ф ил ленивый) одинаковое число раз. Позже испытуемых попросили охарактеризовать группу в целом. Если испытуемые способны точно вспом­ нить, какие имена были соединены с каким и чертами характера, то выводы относительно группы в целом должны быть более сильными, если несколько членов группы имеют некоторую черту, чем если только один член группы имеет эту черту. Если общее количество пар черт характер-имя, которые были предоставлены испы туемы м, было низко, испытуемые показали это пре­ достережение в своих выводах относительно группы. Однако когда общее ко­ личество пар черт характер-имя было высоко, испытуемым было трудно удер­ ж ать в голове, сколько человек имели определенную черту характера, и они начинали вести себя, к ак будто многократные упоминания одних и тех ж е пар черт характер-имя были столь ж е информативны, к ак несколько различ­ ных имен, соединенные с этой чертой характера. Группа характеризовалась как ленивая даж е, когда только несколько членов фактически были ленивы. Социальный мир активен и часто очень информативен, и будучи таковым, он обычно отражает состояние большой загруженности памяти (R othbart и др., 1978) больше, чем состояние малой загруженности памяти. Эти состоя­ ния облегчили бы получение информации о стереотипах группы, отталкива­ ясь от поведения только нескольких человек, чье поведение можно наблю­ дать большое количество раз. К ак отмечают Ротбарт и другие, мы получаем больше информации от отрицательных, чем положительных событий, и со­ ответственно все эти предубеждения могут поддерживать формирование от­ рицательных стереотипов группы, особенно, если членство группы существен­ но при упоминании в средствах информации. Второй пример воздействия предубеждений выборки на социальные оцен­ ки - это эгоцентрическая атрибуция (Ross & Sicoly, 1979, 12). Во многих контекстах человек должен делать оценки относительно того, кто является ответственным за результат. Авторство книги должно быть определено, пла­ 226 ДОСТУПНОСТЬ та за консультацию долж на быть разделена среди сотрудников, или ответ­ ственность на победу группы, или поражение должна быть разделена. Кро­ ме того, что каж ды й человек хранит список своих собственных вкладов и вкладов другого человека (стратегия некоторую отчаявш иеся пострадавшие были вынуждены принять), все стороны должны прийти к компромиссу относительно того кто что делал в совместном предприятии. Эвристика дос­ тупности обеспечивает потенциальную стратегию для этого. Можно пере­ бирать примеры собственных вкладов и вкладов других людей и на основе того, сколько примеров приходит на ум, реш ать, кто сделал больше. Одна­ ко могут присутствовать предубеждения, мешающ ие точно оценивать. Од­ ним из предполагаемых предубеждений является эгоцентрическое вспоми­ нание, способность вспоминать собственные вклады несколько лучш е, чем вклады другого человека. Это предубеждение вспоминания мож ет, в свою очередь, производить предубеждения каж ущ ейся ответственности. Н апри­ мер, если я могу вспомнить ш есть случаев, когда я выносила мусор, и толь­ ко три раза, к ак это делал мой м уж , я могу сделать вывод, что на мне лежит ответственность за вынос мусора. В недавнем исследовании, распределение обязанностей в семье, оказалось особенно полезным, такж е к ак и накален­ ны й контекст, в котором необходимо исследовать предубеждение доступно­ сти (Ross & Socoly, 1979,12). Тридцать семь супружеских пар были опроше­ ны относительно их вкладов в различные действия, которые женатые люди должны исполнять, такие как приготовление завтрака или мытье посуды. Каждого члена пары просили указать, был ли каж ды й вид деятельности вы­ полнен прежде всего мужем или прежде всего женой. Каждый человек так­ ж е указы вал определенные примеры того, что он или супруга влож или в дея­ тельность, измерение, предназначенное, чтобы выявить относительную дос­ тупность собственных вкладов против вкладов супруга(супруги). Результаты ясно показали, что каж ды й супруг (супруга) думал что он влож ил больше в совместные действия, чем другой супруг (супруга). Когда счет ответственности двух партнеров был сложен, он превысил уровень пол­ ной ответственность, которую можно было принять. Количество определен­ ных примеров вкладов, которые каж ды й супруг (супруга) сделал, было так­ ж е подсчитано, и результаты показали, что количество вкладов приписан­ ны х себе, намного превыш ает количество вкладов, приписанных супругу (супруге). К орреляция между запомненными примерами и приписывани­ ем ответственности была высока (+ 0.51), предполагая, что предубеждение вспоминания могло уменьш ить предубеждение ответственности. Одно из возможных объяснений этих эффектов основывается на мотива­ ционных принципах и предполагает, что люди приписывают себе больше, чем им полагается, чтобы сохранить или увеличить положительную самооцен­ ку. Если это правильно, то мы должны обнаружить, что при неудаче совмес­ тного проекта, люди будут отрицать свой вклад в нее и приписывать ответ­ ственность другим. Например, если супружеская пара делает покупку, кото­ рая, оказы вается ненужной, каж ды й может винить другого за решение. Росс Предубеждение доступности в социальном ... 227 и Сиколи (1979,12) исследовали эту возможность и обнаружили, что это толь­ ко слабо способствовало эгоцентрическим приписываниям. Люди так ж е ве­ роятно принимали непропорциональную ответственность за неудачный со­ вместный проект, как и за хороший. Когнитивное объяснение этих эффектов основано на том, к ак воспроиз­ ведение или хранение информации порождают предубеждения каж ущ ей­ ся ответственности. Предубеждение близости может присутствовать, то есть каж ды й наблюдает собственный вклад более близко, чем вклады других, и, реш ая, кто за что отвечает, большее количество собственных вкладов при­ ходит на ум. Например, если оба супруга работают в одно и то ж е время, каж ды й может отвлечься от вкладов другого и более тщ ательно наблюдать свои собственные вклады . С другой стороны, можно знать меньше о вкла­ дах других людей, потому что каж ды й ф изически не присутствует, когда один из супругов делает свою долю работы; соответственно, можно недооце­ нить количество времени и усилия, которые прилож ил супруг или супруга. К тому ж е, предубеждение может присутствовать, если один человек думал о своих вкладах больше, чем о вкладах другого. Это особенно вероятно, ког­ да совместный проект вклю чает много размы ш лений, письма и других ви­ дов длительной по времени работы, таких, как планирование капитального ремонта в доме или организация вечеринки. Третья возможность состоит в том, что собственные вклады подходят личным конструкциям или схемам, то есть способам обработки и кодирования информации. И нформация, ко­ торая удовлетворяет существующей ранее схеме, вспоминается более лег­ ко, и таким образом, увеличенная доступность собственных вкладов может отраж ать предубеждение воспроизведения (см. Taylor & C rocker, 1979b). В итоге, предубеждения относительно того, к ак информация хранится или восстанавливается, могут привести к необъективным социальным оценкам. Один из возможных посредников - использование эвристики доступности. Дост упность и предубеждения, возникающ ие благодаря когнит ив­ ным ст рукт урам Третий способ, за счет которого доступность мож ет смещ ать социальные оценки - использование субъектом испробованных правил, схем или дру­ гих когнитивны х структур. Люди обладают определенными структурами для обработки поступающей информации, которые они часто используют и которые, постепенно, превращ аю тся в познавательные привы чки. Мы пред­ полагаем, например, что люди будут использовать некоторые черты харак­ тера людей к ак способы организации информации о лю дях по другим чер­ там. Н апример, ученые часто различаю т людей по уровню интеллекта, при­ ним ая во внимание, что для спортсменов, скорее спортивный навы к, чем интеллект является отличительным фактором. Этот вид предубеждения в тенденции использовать специфические схемы или конструкции, может такж е искаж ать оценки. Н апример, если кого-нибудь просят описать впе­ 228 ДОСТУПНОСТЬ чатления об отдельно взятом человеке, можно использовать предпочитае­ мые черты (например, интеллект) к ак способ поиска в пам яти и описывать человека не столько в терминах его фактического поведения, а скорее, в тер­ минах предпочитаемых черт характера (см., например, D’A ndrade, 1965). Подобное предубеждение может происходить в воспроизведении социаль­ ного поведения, так как люди такж е используют конструкты и схемы при столкновении с новыми ситуациями или когда их просят сделать прогноз относительно будущего. Н апример, ученый может прогнозировать способ­ ность друга вы йти из тяж елой ситуации на основе того, насколько он умен, в то время к а к , спортсмен мож ет прогнозировать способность того ж е само­ го друга вы йти из ситуации на основе того, как быстро друг бегает. Соответ­ ственно, использование правил, схем и персональных конструктов, может привести к выводам, что человек, который не разделяет те ж е самые когни­ тивны е структуры , не справится. Возможно, наиболее интригую щ ий пример влияния долгосрочных схе­ м атических структур на восприятие данны х обеспечивается явлением сте­ реотипов. О жидание, что человек поведет себя определенным образом, мо­ ж ет вести к выводам, что человек уж е повел себя так. Стереотипы - это осо­ бые виды ож иданий, которые могут работать таким образом, чтобы форми­ ровать действительность, и они могут делать это, по крайней мере, частич­ но, с помощью предубеждения доступности. Гамильтон и Роуз (H am ilton и Rose, 1978), проверяли эту возможность в исследовании стереотипов. В од­ ном исследовании, испытуемым предлож или списки предложений, напри­ мер, “Кэрол, библиотекарь, привлекательна и серьезна.” В каж дом предло­ ж ении представитель профессии был описан к ак обладающ ий двумя черта­ ми. Н екоторые черты носили стереотипную ассоциацию с профессией к ак, например, в случае черты “серьезный”, с профессией “библиотекарь”; в дру­ гих случаях, черты не были стереотипными для этого занятия (как, напри­ мер, “привлекательны й” для библиотекаря), но они были стереотипными для другой профессии (как, например “привлекательны й” для стюардессы). Во всех предлож ениях каж дая черта была соединена с каж дой профессией одинаковое число раз. К аж дая черта бы ла соединена со стереотипной про­ фессией в одной трети случаев и с не-стереотипными профессиями в двух третьих случаев. Однако когда испытуемых просили оценить количество раз, когда каж дая черта описы вала представителя каж дой профессии, они не верно вспоминали пары черта характер-профессия, отдавая предпочте­ н ия стереотипными ассоциациями. Н апример, они с большей вероятностью вспоминали, что библиотекари серьезны чем, что официантки серьезны. Х отя мотивационные ф акторы могут предложить объяснение этих состо­ яний, они, вряд ли, это сделают. Н екоторые стереотипы могут заметно фи­ гурировать в потребностях человека и целях, но стереотипы профессий, та­ ки х к ак оф ициантка или библиотекарь, довольно банальны и вероятно, не фигурирую т. Соответственно, эти результаты лучш е понимаю тся к ак ког­ нитивное явление. Эвристика доступности обеспечивает одно из возможных Предубеждение доступности в социальном ... 229 объяснений, предполагая, что, когда испытуемых спраш иваю т, к ак часто черта характера и профессия соединены, они оценивают частоту, исполь­ зуя силу ассоциации между профессией и чертой; во многих обстоятельствах ассоциации сильнее после многих соединений в пары. Однако, в этом слу­ чае, имеется предубеждение в силе ассоциативной связи на основании сте­ реотипной ассоциации между некоторыми из пар черта характера - профес­ сия. Соответственно, так к ак эти ассоциации более сильные, воспринимаю­ щ ий оценивает, что эти черты характера и профессия более часто объедине­ ны чем, нестереотипные пары черта характера-профессия. Опять ж е, соци­ альные значения этого вида предубеждения огромны. Стереотипы, когдато сформированные, могут искаж ать сбор и хранение информационных и последующ их впечатлений. Последствием является то, что необоснованные выводы относительно социальных групп или людей могут навсегда сохра­ ниться без какого-либо эмпирического основания. В ы вод ы Н есколько прош едш их десятилетий изменили точку зрения на оценки как результаты рационального, логического принятия реш ения, искаж енного случайным присутствием иррациональны х потребностей и мотивов к рас­ смотрению человека к ак пользователя эвристики. Эмпирическая работа над не-социальными оценками показы вает, что субъект использует сокращ е­ ния или эвристику, чтобы освободить место и передавать информацию на­ столько быстро, насколько возможно, и недавние исследования в области социальной психологии предполагает, что эти процессы такж е обращ аются к формированию и использованию социальных оценок. Л егкость, с кото­ рой примеры или ассоциации приходят в голову, обеспечивает оценку по­ добия (то есть, частоту или вероятность), которая в свою очередь обеспечи­ вает основание для создания других социальных оценок, таких к ак оценки другого человека, причинная атрибуция или приписывание ответственнос­ ти, описание признаков другого человека, отнесение других людей к кате­ гории или описание себя. Н аблю дательный критик обратит внимание, что в представленных ис­ следованиях свидетельство для использования эвристики доступности яв ­ ляется скорее логически выведенным, чем прямы м, и можно требовать бо­ лее ясного свидетельства, что именно легкость, с которой примеры или ас­ социации приходят в голову, ф актически опосредует оценки. Имеются не­ сколько причин для неопределенности. Во-первых, в отличие от когнитив­ ного исследования доступности, ни одно из этих социальных исследований не было предназначено для исследования доступности к ак таковой; скорее, каж дое было предназначено, чтобы объяснить некоторое интересное соци­ альное явление, и эвристика доступности применялась к ак одно из несколь­ ких возмож ны х объяснений явления. Во-вторых, не существует пока еще согласованного измерения доступности. Некоторые исследования исполь­ 230 ДОСТУПНОСТЬ зовали скорость, с которой информация восстановливается в пам яти как меру доступности (см. Pryor& K riss, 1977), в то время к ак другие исследова­ н ия рассматривали объем вспомненной информации как коэффициент дос­ тупности информации (см. Ross & Sicoly, 1979,12). Так к ак эти две меры не всегда хоропхо коррелирую т (см. P ryor и K riss, 1977), двусмысленность и з­ мерения препятствовала эмпирическому прогрессу. Часть этой проблемы измерения, однако, является спорной из-за третьей проблемы, а именно, концептуальной двусмысленности, касаю щ ейся ис­ пользования термина доступность. И меется тривиальны й смысл, в кото­ ром весь социальный вывод обусловливается доступностью; оценки всегда основаны на том, что приходит на ум. Это использование термина доступ­ ность должно отличаться от использования эвристики доступности с помо­ щью ясны х критериев для определения, действительно ли эвристика дос­ тупности бы ла задействована и к ак она была задействована, и действитель­ но ли доступность примеров или ассоциации является посредником после­ дующ их оценок. Социальные психологи имели тенденцию сосредотачивать­ ся на том, какая инф ормация является доступной и почему; увеличение масш табов социального объяснения требует перенаправления усилий на то, как эвристика доступности связы вает содержание того, что является дос­ тупным когнитивной обработке. Влияние концепции доступности на социальную психологию, тем не ме­ нее, было большим по нескольким причинам. Во-первых, она вы двигает на первы й план ош ибки в обработке, которые могут быть поняты , не обращ а­ ясь к мотивационным конструкциям . Это не говорит о том, что воздействие мотивов на оценки незначительно, но просто указы вает на то, что главны е ош ибки в познании такж е существуют. Во-вторых, хотя рациональные тео­ рии обеспечили полезные нормативные модели, с которыми ф актические суж дения могут быть сравнены, отклонения от этих моделей настолько обыч­ ны и явны , что необходимы описательные модели. В примерах, приведен­ ны х здесь, такж е к ак во многих других, эвристика доступности обеспечила одно из возмож ны х описаний. При некоторых обстоятельствах, использо­ вание эвристики доступности приводит к уместным заклю чениям; однако, при тех обстоятельствах, где имеется предубеждение относительно того, к а к а я инф ормация является доступной, следуют лож ные выводы. Опреде­ ленно, предубеждения заметности, предубеждения воспроизведения и пре­ дубеж дения, возникаю щ ие из-за познавательны х структур, таких к ак схе­ мы , убеж дения и ценности, могут приводить к повыш енной доступности неправильной или вводящ ей в заблуждение информации в задачах соци­ альны х оценок. У читы вая, что предубеждения доступности могут быть весьма распрост­ ранены , почему ж е используется эвристика доступности? Одна из очевид­ ны х причин - то, что она производит больше правильны х, чем неправиль­ ны х ответов, и в смысле затрат/вы годы , она имеет преимущ ество, экономя время и энергию . Второй ответ - то, что многие ош ибки в выводах, произве­ Предубеждение доступности в социальном ... 231 денных эвристикой доступности, не будут иметь значение. Например, если искаж енны е впечатления не повлияю т на будущее функционирование, к ак при формировании неправильного впечатления о человеке, который встре­ чается только один раз, предубеждение будет иметь мало значения. Преду­ беждение доступности мож ет иметь мало значения, если оно постоянно в течение некоторого времени. Н апример, если Вы расцениваете руководите­ ля к ак грубияна, не имеет значения то, что он грубый только когда, нахо­ дится в этой роли, если это единственное обстоятельство, при котором чело­ век взаимодействует с ним. Третий ответ - то, что многие ошибки могут быть исправлены . Если предубеждение доступности не исчезает само со време­ нем, процесс начнет еамоисправляться с каж ды м новым случаем. Н апри­ мер, если несколько друзей одного человека недавно развелись, оценка про­ порции развода может быть временно преувеличена, но если друзья не про­ должаю т разводиться, оцененная пропорция развода долж на, в конечном итоге, совпасть с объективными данными. Н аконец, в некоторых случаях, ош ибка будет обнаружена по средством общ ения. Н апример, если утверж ­ дение, что человек сделал некоторую часть работы по дому, сталкивается с серьезными возраж ениями со стороны супруга (супруги), то позиция, веро­ ятно, будет изменена. Короче говоря, обычное социальное общение обеспе­ чивает основание для испы тания выводов, и очевидно лож ные заклю чения с далеко идущ ими значениями, вероятно, будут исправлены. Но ошибочное восприятие с серьезными последствиями, при некоторых обстоятельствах могут сохраняться. Н апример, к ак исследования стерео­ типов иллю стрирую т, если имеется предубеждение в формировании суж ­ дения, это может, в свою очередь, привести к предубеждениям в сохране­ нии этой оценки с помощью сформировавш ейся познавательной структуры (в этом данном случае, стереотипа). Эти “сопутствующие” или дополняю­ щ ие друг друга предубеждения могут быть высоко устойчивыми к опровер­ жению . Существуя, они могут иметь разруш ительное влияние к ак на инди­ видуальны е восприятие, так и на социальную политику. Короче говоря, нельзя считать предубеждения доступности несущ ественными, и соответ­ ственно, необходимы стратегии для обнаружения и исправления искаж ен­ ны х выводов. 14. Эвристика моделирования* Даниелъ Канеман и Амос Тверсии Н аш е первоначальное трактование эвристики доступности (T versky и K ahnem an, 1973, 11) описывает два класса умственных действий, относя­ щ ихся к процессу “активизации в пам яти” (bring th ings to m ind): припоми­ нания случаев и конструирования примеров или сценариев. Вспоминание и конструирование - весьма различны е способы “активизации в пам яти”; они использую тся в качестве ответа на различны е вопросы и подчиняю тся различны м правилам. Предыдущее исследование было сосредоточено глав­ ным образом на припоминании, а процессом умственного конструирования пренебрегли. Чтобы способствовать процессу изучения доступности для конструиро­ вани я, мы в общих чертах опишем умственное действие, которое обозна­ чим к ак эвристику моделирования. Мы начнем с обычного самоанализа: каж ется, сущ ествует много ситуаций, в которы х на вопросы о событиях можно ответить с помощью мыслительной операции, которая имеет сход­ ство с имитационной моделью. М оделирование мож ет ограничиваться и управляться несколькими способами: стартовые состояния для “функцио­ нирования” могут оставаться при их реальны х изначальны х значениях или изм еняться так, чтобы принять некоторое непредвиденное значение; исхо­ ды могут не указы ваться, или ж е может быть установлено целевое состоя­ ние, с условием нахож дения способа приближ ения к этому состоянию от первоначальны х условий. М оделирование не обязательно подразумевает наличие единственной истории, которая стартует с начала и заканчивается определенным исходом. Скорее, мы рассматриваем результат моделирова­ н ия к ак оценку легкости, с которой модель мож ет производить различны е * Эта глава взята из лекции Катца и Ньюкомба по социальной психологии “О психологии возможных миров”, Энн Арбор, Мичиган, апрель, 1979. Работа была поддержана Службой Военно-морских исследований согласно Контракту N00014-79-C-0077 со Стэндфордским университетом. Эвристика моделирования 233 исходы , учиты вая ее начальны е состояния и операционные параметры . Таким образом, мы предполагаем, что ментальное моделирование опреде­ ляет меру, в которой чья-либо модель ситуации может генерировать раз­ личные исходы, такж е как возможности статистической модели могут быть оценены методами М онте-Карло. Л егкость, с которой модель системы дос­ тигает определенного состояния, в конечном счете, используется для оцен­ ки способности (реальной) системы произвести это состояние. Мы докажем, что оценки способности и вероятности, выведенные из мен­ тального моделирования, используются в нескольких задачах оценивания, а такж е что они играют существенную роль в некоторых эмоциональных со­ стояниях. Сначала мы перечислим некоторые оценочные действия, в кото­ ры х, по-видимому, используется ментальное моделирование. Затем мы опи­ шем исследование когнитивных правил, которые управляю т умственным аннулированием прош лых событий. И мы кратко обсудим значения этих правил для эмоций, которые возникают, когда реальность сравнивается с аль­ тернативой, которая пользуется одобрением, но которую человек не смог до­ стигнуть, хотя мог легко вообразить, как он это сделает. Мы завершаем крат­ кий набросок по эвристике моделирования замечаниями по сценариям и пре­ дубеждениям, которые, вероятно, возникнут, при использовании этой эври­ стики. 1. Прогнозирование. Вообразите первую встречу двух человек, которых вы хорошо знаете, но которые никогда раньш е не встречались. К ак Вы де­ лаете такие прогнозы, к ак “Они хорошо поладят” или “Они будут раздра­ ж ать друг друга”? 2. Оценка вероятности определенного события. К ак Вы оцениваете ве­ роятность вооруженного вмеш ательства американцев для обеспечения бе­ зопасности на месторождениях нефти в Саудовской А равии в следующем десятилетии? Обратите внимание на различие между этой задачей и преды­ дущ ей. М оделирование в данном случае имеет указанное целевое состоя­ ние, и ее цель состоит в том, чтобы получить меру “легкости”, с которой это целевое состояние может быть произведено в пределах ограничений реали­ стичной модели международной системы. 3. Оценка условных вероятностей. Если граж данская война начнется в Саудовской Аравии, какие будут вероятные последствия? Обратите внима­ ние, что это упражнение моделирования отличается от простого прогнозиро­ вания, потому что оно включает указанное начальное состояние, которое мо­ ж ет отклоняться в большей или меньшей степени от существующей действи­ тельности. Оценка отдаленных последствий, в частности, вызывает интерес­ ную двусмысленность: какие изменения должны быть сделаны в текущ ей модели до “функционирования”? Нужно ли делать только минимальные и з­ менения, которые включают указанное непредвиденное обстоятельство (на­ пример, граж данская война в Саудовской Аравии), подчинись элементарным требованиям последовательности? И ли нужно представлять все изменения, которые становятся вероятными за счет этого условия? В этом случае, напри­ 234 ДОСТУПНОСТЬ мер, модель политической системы была бы сначала установлена таким об­ разом, чтобы граж данская война в Саудовской Аравии стала само собой разу­ меющ ейся, и моделирование будет использовать параметры пересмотренной модели. 4. Оценки, основанные на противоположных фактах. Н асколько уче­ ные Гитлера приблизились к созданию атомной бомбы во время Второй ми­ ровой войны? Если бы они создали ее в феврале 1945, изменился бы резуль­ тат войны? О ценки, основанные на противоположных ф актах, такж е ис­ пользую тся во многих повседневных рассуж дениях, к ак , например, в пред­ лож ении “она могла бы реш ить проблему с работой, если бы ее ребенок не был болен”. 5. Оценки причинной связи. Чтобы проверить породило ли событие А со­ бытие В, мы можем мысленно отменить событие А, и посмотреть, происхо­ дит ли В все еще в модели. М оделирование может такж е использоваться для проверки, увеличило ли событие А вероятность В, возможно даж е сделало В неизбежным. Мы предполагаем, что испытание причинной связи моде­ лированием вклю чено в такие примеры , как “Вы очень хорошо знаете что, они поссорились бы, даже если она не упомянула бы его м ать”. И сследования отмены действий Н аш и первоначальные исследования эвристики моделирования сосредота­ чивались на оценках, основанных на противоположных ф актах. В частно­ сти, нас интересовал процесс, на основании которого люди говорят, что со­ бытие “почти произош ло”. Пространственная метафора убедительна и была принята во многих философских исследованиях: каж ется разумным гово­ рить об отклонении действительности от некоторых некогда возможных, но нереализованны х событиях. Психологическое значение этой оценки от­ клонения между тем, что случилось и что могло случиться, проиллю стри­ ровано в следующем примере: Г-н Крейн и г-н Тис должны покинуть аэропорт по расписанию на различных рейсах в одно и то же время. Они выехали из города в одном и том же лимузине, попали в проб­ ку, и прибыли в аэропорт через 30 минут после намеченного времени вылета их самоле­ тов. Г-ну Крейну сказали, что его самолет улетел вовремя. Г-ну Тису сказали, что его рейс был задержан и вылетел 5 минут назад. Кто больше расстроен? Г-н Крейн Г-н Тисс Н еудивительно, что 96% выборки студентов, которые отвечали на этот воп­ рос, заявили, что г-н Тис будет больше расстроен. Что ж е делает стереотип столь очевидным? Обратите внимание, что объективная ситуация этих двух господ абсолютно идентична, поскольку оба опоздали на свои самолеты. Кроме того, так к ак оба ож идали опоздания, различие между ними не мо­ ж ет быть приписано разочарованию. Вообще, различие между Тисом и Крей­ Эвристика моделирования 235 ном несущественно. Единственная причина для большего расстройства гна Тиса - то, что у него была больш ая “возможность” успеть на свой само­ лет. Мы предполагаем, что стандартный эмоциональный сценарий для этой ситуации - это привлечение двух путеш ественников в упраж нение модели­ рования, в котором они проверяю т, насколько они были близки к тому, что­ бы успеть на самолет. Конструирование, основанное на противоположных ф актах, действует таким ж е образом, как и ожидание. Х отя из истории ясно, что ож идания г-на Тиса и г-на Крейна не могли быть различны ми, г-н Тис теперь больше разочарован, потому что ему легче вообразить, к ак он мог бы прибыть на 5 минут раньш е, чем г-ну Крейну вообразить, к ак этой задерж ­ ки на 30 минут можно было бы избеж ать. Такие примеры напоминаю т А лису в Стране чудес, с их странной смесью ф антазии и действительности. Если г-н Крейн способен вообразить едино­ рогов, а мы думаем, что это так, почему он считает относительно трудным представить, что ему удалось избеж ать 30-минутной задерж ки? Очевидно, имеются ограничения свободы ф антазии, и психологический анализ мен­ тального моделирования состоит, преж де всего, в исследовании этих огра­ ничений. Н аш е знание правил ментального моделирования все еще находится в зачаточной стадии, и мы можем представлять только ранние результаты и предварительные предположения в области, которая каж ется исклю читель­ но богатой и обещающей. Мы получили предварительные наблю дения от­ носительно правил, которые управляю т специальны м классом деятельнос­ ти моделирования - отмена прошлого. Н аш и исследования отмены собы­ тий сосредоточились на ситуации, в которой эта деятельность является осо­ бенно обычной - реакция вы ж ивш их родственников на несчастный случай со смертельным исходом. И опять ж е, к ак в случае г-на Тиса и г-на Крейна, мы хотели исследовать то, что мы назы ваем эмоциональным сценарием си­ туации. Д ля примера, рассмотрим следующую историю: Г-ну Джонсу было 4 7 лет, он отец троих детей и успешный банковский администратор. Его жена оставалась дома из-за болезни в течение нескольких месяцев. В день несчастного случая г-н Джонс уехал из своего офиса в обычное время. Он иног­ да уезжал рано, чтобы заниматься домашними делами по просьбе его жены, но в этом не было необходимости в тот день. Г-н Джонс не поехал домой своим обычным маршру­ том. День был исключительно ясным, и г-н Джонс сказал своим друзьям в офисе, что он поедет вдоль берега и будет наслаждаться видом. Несчастный случай произошел на главном перекрестке. Когда подъехал г-н Джонс, загорелся желтый свет. Свидетели отметили, что он резко затормозил, чтобы остано­ виться на перекрестке, хотя мог легко проехать. Его семья признала, что это было при­ вычной манерой вождения г-на Джонса. Когда он начал пересекать перекресток после изменения света, малотоннажный грузовик влетел на перекресток на высокой скорос­ ти и протаранил автомобиль г-на Джонса слева. Последний умер мгновенно. Позже было установлено, что грузовик вел мальчик-подросток, находящийся в со­ стоянии наркотического опьянения. Как обычно случается в таких ситуациях, семья г-на Джонса и их друзья часто ду­ мали и говорили: “Если бы только... “, в течение нескольких дней, после несчастного 236 ДОСТУПНОСТЬ случая. Как они продолжали эту мысль? Пожалуйста, предложите одно или более про­ должений предложения. Эта версия (обозначенная к ак версия “марш рута”) бы ла дана 62 студен­ там Колумбийского университета. Д ругая группа из 61 студента получила версию “времени”, в которой второй абзац был следующим: В день несчастного случая, Г. Джонс уехал из офиса ранее, чем обычно, чтобы выпол­ нить работу по дому по просьбе его жены. Он ехал домой по своему обычному маршру­ ту. Г-н Джонс иногдаездил вдоль берега, чтобы наслаждаться видом в особо ясные дни, но тот день был совершенно обычным. А нализ данны х, полученных при первом заполнении образца “Если бы только”, дается в табл Л . Бы ли получены четыре категории ответа: (1) отме­ на марш рута; (2) отмена времени отъезда из офиса; (3) пересечение перекре­ стка на ж елты й свет; (4) удаление из сценария м альчика в состоянии нарко­ тического опьянения. Таблица 1.Анализ первого заполнения образца “если бы только” Кат егории от вет а (1) маршрут (2) время (3) пересечение перекрестка (4)мальчик (5) другое Версия "времени” Версия "м арш рут а " 8 16 33 2 19 14 18 1 13 3 Особенно внуш ительная сторона результатов, показанны х в табл. 1 - этс событие, которое не произойдет: ни один испытуемый не упомянул, что, если бы г-н Джонс приехал на перекресток на две или три секунды ранее, он про­ ехал бы благополучно. Типичный вывод: события мысленно не отменяются с помощью произвольных изменений в значениях непрерывных перемен­ ны х. Очевидно, испытуемые не выполняю т задачу отмены событий, устра­ н яя необходимое условие критического события, которое имеет самую низ­ кую предполагаемую вероятность - процедура, которая привела бы их к тому, чтобы сосредоточиться на экстраординарном совпадении того, что эти два автомобиля встретились на перекрестке. Что бы тогда люди не делали, это не связано с априорной вероятностью. И зменения, которые люди вклю чаю т в истории, могут классифициро­ ваться к ак нисходящ ие, восходящ ие или горизонтальны е. Н исходящ ие изменения - те, которые отменяю т неож иданны й аспект истории или ина­ че увеличиваю т ее внутреннюю последовательность. Восходящие измене­ ния - те, которые вносят маловероятные случайности. Горизонтальные из­ м енения - те, в которых произвольное значение переменной заменено дру­ Эвристика моделирования 237 гим произвольным значением, которое не является ни более, ни менее веро­ ятны м , чем первое. Экспериментальная манипуляция заставила изменение марш рута быть нисходящ им в одной версии, восходящ им в другой, с соот­ ветствующим разнообразием в характере изменения времени фатальной по­ ездки г-на Джонса. М анипуляция была успешна: испытуемые прогнозиро­ вали, что несчастный случай не произойдет, восстанавливая нормальное значение переменной, а не проводя исклю чение. Вообще, восходящ ие изме­ нения относительно редки в ответах испытуемых, а горизонтальных изме­ нений не было. П онятие восходящ их и нисходящ их изменений заимствовано из опыта лы ж ника, едущего по пересеченной местности, и предназначено для иллю ­ страции особого характера расстояния, которое мож ет быть определено для возмож ны х состояний системы. Существенная особенность этого отнош е­ ния - то, что оно не симметрично. Д ля лы ж ника, едущего по пересеченной местности, краткий спуск от А до В часто сопровождается длительным и трудоемким подъемом от В до А. В этой метафоре, исклю чительные состоя­ н ия или события - горы, нормальные состояния или события - равнины. Таким образом, мы предполагаем, что психологическое расстояние от ис­ клю чения до нормы, которую оно наруш ает, меньш ее, чем расстояние от нормы до того ж е исклю чения. Предпочтение нисходящ их изменений - это возможно, главное правило, которому подчиняется ментальное моделиро­ вание; оно олицетворяет существенные ограничения, которые придают ре­ ализм ф антазиям , основанным н а противоположных ф актах. И звестный аспект результатов, показанны х в табл. 1 - относительно низ­ к ая пропорция ответов, в которы х несчастный случай отменяется за счет устранения случая, который естественно рассматривается к ак его причи­ на, например, безумное поведение принявш его наркотики мальчика-подростка на перекрестке. Этот вывод иллю стрирует другую особенность мен­ тального моделирования, которое мы назовем правилом фокуса: истории обычно перерабатываю тся за счет изменения некоторого свойства объекта, находящ егося в центре вним ания. В данном случае, конечно, центром вни­ м ания был г-н Джонс, так к а к испытуемых попросили сочувствовать его семье. Чтобы проверить правило ф окуса, новая версия истории несчастного случая была построена таким образом, что последний абзац был заменен сле­ дующей информацией: Как был позже установлено, грузовик вел мальчик-подросток, по имени Том Сирлер. Отец Тома только что обнаружил его дома в состоянии наркотического опьянения. Это было обычное явление, поскольку Том давно и постоянно принимал наркотики. Произошла ссора, в результате которой Том схватил ключи, которые находились на столе в гости­ ной, и поехал на грузовике в бессознательном состоянии. Он был серьезно ранен в резуль­ тате несчастного случая. И спытуемых, которым предоставили эту версию истории, попросили закон­ чить образец “Если бы только...” либо от имени родственников г-на Д ж он­ 238 ДОСТУПНОСТЬ са, либо от имени родственников Тома. Тут тоже, мы рассматриваем пер­ вый ответ, данный испытуемыми. Больш инство испытуемых, которые при­ няли роль родственников Тома (68% ), изменили историю, исклю чив Тома из сцены несчастного случая - наиболее часто, не позволяя фатальным клю ­ чам леж ать на столе. Н апротив, меньш инство (28% ) испытуемых, приняв­ ш их роль родственников г-на Джонса, упомянули Тома в своих ответах. Мы описали это исследование отмены событий достаточно подробно, не­ смотря на его предварительный характер, чтобы проиллю стрировать уди­ вительную точность правил, которые управляю т ментальным моделирова­ нием, и продемонстрировать сущ ествование распространенных норм ф ан­ тазий, основанных на противоположных ф акторах, которые являю тся уме­ стными в некоторых ситуациях. Мы полагаем, что когнитивны е правила, которые управляю т легкостью умственной отмены событий, будут полезны в изучении ряда эмоций, которые могут назы ваться эмоциями, основанны­ ми на противоположных ф актах, из-за их зависимости от сравнения дей­ ствительности с тем, что могло бы или должно было быть: расстройство, со­ ж аление и некоторые случаи негодования, печали и зависти. Общей чертой этих эмоциональных состояний является то, что у человека гедонический уровень адаптации вы ш е, чем его реальность, к ак будто неосуществленные возможности придали значимость уровню адаптации, с помощью веса, со­ ответствующего легкости, с которой эти возможности достигаю тся при мен­ тальном моделировании. Зам етки по сценариям В контексте прогнозирования и планирования в условиях неопределеннос­ ти, нам еренная м анипуляция умственными моделями является достаточ­ но важ ной, чтобы заслуж ить название эвристики характерного моделиро­ вания. Самый яркий пример таких действий - явное воспроизведение сце­ нариев к ак процедуры оценки вероятностей. Что делает сценарий хорошим? В терминах, уже представленных, хоро­ ш ий сценарий - тот, который соединяет промежуток между начальным со­ стоянием и целевым событием с помощью ряда промежуточных событий, с общей нисходящ ей тенденцией и без существенных подъемов. Неофициаль­ ные наблю дения свидетельствую т, что правдоподобие сценария зависит намного больше от правдоподобия его самой слабой связи, чем от числа свя­ зей. Сценарий особенно хорош, когда путь, который ведет от начального к последующему состоянию, не является очевидным, так, чтобы введение про­ меж уточны х стадий ф актически усилило субъективную вероятность целе­ вого события. Любой сценарий - обязательно схематичный и неполный. Поэтому инте­ ресно обнаружить правила, управляю щ ие выбором событий, которые явно определены в сценарии. Мы выдвигаем гипотезу, что “узлы ” сценария - это события, у которых низкая избыточность и высокое причинное значение. Не Эвристика моделирования 239 избыточный случай представляет локальны й минимум в предсказуемости последовательности, точку, в которой существенные альтернативы могли бы возникнуть. Причинно значимый случай - это тот, возникновение которого изменяет величины, которые считаются нормальными для других событий в цепочке, которая, в конечном счете, ведет к цели сценария. Разработка единственного вероятного сценария, который ведет от реа­ листических начальны х состояний к указанному конечному состоянию, часто используется для поддерж ания оценки, что вероятность конечного состояния является высокой. С другой стороны, мы склонны делать вывод, что исход является маловероятным, если он может быть достигнут только с помощью восходящ их предположений о редких событиях и странных со­ впадениях. Таким образом, оценка “соверш енства” сценариев может быть эвристикой для оценки вероятности событий. В контексте планирования, в частности, сценарии часто использую тся для оценки вероятности, что план будет удачным и риска возникновения различны х причин неудачи. Мы предположили, что воспроизведение сценариев используется в каче­ стве эвристики для определения вероятности событий посредством оценки способности некоторой причинной системы породить эти события. Подобно любой другой эвристике, эвристика моделирования должна быть подверже­ на характерны м ошибкам и предубеждениям. Проведено мало исследований в этой области, но появляю тся следующие гипотезы, убеждая, что: (i) поиск не избыточных и причинно значимых “узлов” в построении сценария приве­ дет к предубеждениям для него (и конечных состояний), в котором драмати­ ческие события обозначают причинные переходы; будет наблюдаться тенден­ ция недооценивать вероятность событий, произведенных медленными и воз­ растающ ими изменениями; (ii) использование сценариев для оценки вероят­ ности связано с предубеждением в пользу событий, для которых вероятный сценарий может быть найден, с соответствующим предубеждением против событий, которые могут быть порождены множеством маловероятных спо­ собов. Такое предубеждение может иметь особенно пагубные последствия в контексте планирования, потому что оно производит чрезмерно оптимисти­ ческие оценки вероятности того, что план будет осуществлен. По своему ха­ рактеру, план состоит из цепи вероятных связей. В любой точке цепи, имеет смысл ож идать, что события развернутся, как было запланировано. Однако, совокупная вероятность по крайней мере одной фатальной неудачи может быть чрезвычайно высока даж е, когда вероятность каж дой индивидуальной причины неудачи ничтожно мала. П ланы руш атся из-за сюрпризов, случа­ ев, в которых происходит неожиданное восходящее изменение. Эвристика моделирования, которая искаж ается в пользу нисходящ их изменений, свя­ зана с риском больших и систематических ошибок. Часть V Ковариация и контроль 15. Субъективная оценка ковариации: суждения, основанные на данных против суждений, основан­ ных на теориях* Денис Л. Дженнингс, Тереза М. Эмабайл и Ли Росс Протекание социального опыта часто ставит перед нами задачу узнавания эмпирических ковариаций. Иногда, эти ковариации - просто испытание на­ ш их способностей к наблюдению и не несут никакого непосредственного прак­ тического интереса для нас. С другой стороны, например, когда эти ковариа­ ции включаю т первые признаки проблем и более поздние проявления, или используемые поведенческие стратегии и полученные исходы, или относи­ тельно открытые характеристики людей или ситуаций, а такж е относитель­ но скры ты е - такие способности обнаружения помогают определять наш ус­ пех в приспосабливании к требованиям повседневной социальной ж изни. Во­ обще, обнаружение ковариации будет играть важную роль в наш ей продол­ жительной борьбе как “интуитивных ученых” (см. N isbett и Ross, 1980; Ross, 1977,1978), чтобы оценить и усовершенствовать имеющиеся гипотезы отно­ сительно нас самих, других людей и нашего общества. Очевидный вопрос, поэтому, звучит так: насколько опытны мы как обыватели, при оценке эмпи­ рических ковариаций, представленных в нашем опыте? *Мы хотим поблагодарить профессоров Даниела Канемана, Амоса Тверского и Пола Словика за их полезные комментарии и предложения. Мы также хотели бы отметить большие усилия Риты Френч и Джулии Стейнмец, которые принимали участие в исследовании, о котором сообщается здесь. Исследование было поддержано частично стипендией Нацио­ нальной научной организации первому автору, грантом Национального института психи­ ческого здоровья МН-26736 и грантом Национальной научной организации BNS-78-01211 Ли Россу и Марку Лепперу. Организация и содержание этой главы появились благодаря более раннему исследованию этой же темы Л. Россом и Р. X. Нисбеттом в книге “Предположения людей: Стратегии и недостатки социальных оценок” (Human Inference: Strategies and Shortcomings of Social Judgment), Prentice-Hall, Inc., 1980. +Ковариация - (от англ, covariation) совместная изменчивость, взаимосвязь переменных величин (прим, редактора). 244 КОВАРИАЦИЯ И КОНТРОЛЬ Перед тем, к ак начать обсуждение прошлого или настоящего исследова­ ния, мы должны обратить внимание, что каждодневное наблюдение обеспе­ чивает нас большим количеством данных; и это наводит на мысль, что ответ на вопрос об опыте может быть далеко не простым. С одной стороны, и адап­ тивный характер социального поведения, и гармоничное качество социаль­ ного взаимодействия не оставляет сомнений в том, что представители нашей культуры обладают глубокой проницательностью относительно причин и последствий поведения. Ф актически, современные теоретики атрибуции (на­ пример, Jones и др., 1971; Kelley, 1967, 1971,1973; W einer, 1974), которые интересовались основаниями для такой проницательности, рассматривали способность обнаружить ковариацию и перешли к логическому использова­ нию таких воспринятых ковариаций. С другой стороны, каждодневный опыт такж е предлагает красноречивое доказательство существования необоснован­ ны х предубеждений, разрушительных поведенческих стратегий и других про­ явлений ошибочных причинных или корреляционных теорий. Очевидно, что любое адекватное описание неофициальной оценки ковариации должно зат­ рагивать неоднородность поведения обывателя. Это должно, так или иначе, урегулировать тонкую проницательность относительно некоторых функци­ ональных отношений и невежество или иллю зии о других. Предшествующее исследование оценки ковариации П римечательно, что даже самые верные защ итники способностей обывате­ лей к ак интуитивных ученых (например, Peterson & Beach, 1967) могли мало хорошего сказать относительно того, к ак обыватели справляю тся с двумер­ ными наблюдениями. Мы рассмотрим две линии исследования, которые под­ держиваю т это нелестное описание, сосредотачиваясь в каж дом случае на процедурных аспектах и результатах, которые окаж утся подходящ ими для последующего описания наш его собственного исследования обывательской оценки ковариации. Толкование таблиц сопряженности: проблема “экологической ва­ лидност и “ Одно из важ ны х направлений предшествующего исследования посвящено способности людей понимать функциональные связи, представленные в про­ стых 2x2 таблицах сопряженности. К ак правило, в этих таблицах суммиро­ валось количество случаев присутствия и отсутствия переменной X (напри­ мер, какая-либо болезнь), по сути связанной с наличием и отсутствием пере­ менной Y (например, какой-либо симптом). Так к ак двумерные данные были аккуратно собраны и “рассортированы”, задача испытуемых была очень про­ ста и незамысловата. Однако, экспериментальные данные (например, Jenkins & W ard, 1965; Sm edslund, 1963; W ard & Jen k in s, 1965) показы ваю т, что необученные люди справлялись с такими задачами весьма плохо. Субъктивная оценка ковариации... 245 Оценочные стратегии, игнорирую щ ие одну или более из четырех ячеек, явились причиной большинства трудностей испытуемых. Одна из самых распространенных неудач, например, вклю чает ф актически исклю читель­ ную уверенность о размере ячейки “наличие-наличие” относительно всей совокупности. Таким образом, многие испытуемые, могут сказать, что симп­ том X связан с болезнью А , просто потому, что в таблице сопряженности показано большое количество случаев, где присутствует и болезнь, и при­ знак. И спытуемые, обращающие внимание только на две из этих четырех ячеек, могут ввестись в заблуждение. Заметив, например, что у больш ин­ ства больных людей скорее отсутствует симптом А, испытуемые могут зак­ лю чить, что соответствующие связи - отрицательные; или заметив, боль­ ш инство людей, у которых наблюдается симптом, больны, они могут сделать вывод, что связи - положительные. Без формального статистического обучения, однако, очень немного лю ­ дей оцениваю т ф акт, что правильны е выводы в таких случаях могут быть сделаны только при рассмотрении всех четырех ячеек. Один из удовлетво­ рительны х методов, например, мог бы вклю чать сравнение пропорций (то есть, сравнение пропорции больных людей, проявляю щ их специфический признак, с пропорцией здоровых людей, проявляю щ их этот признак). Фор­ м альная стратегия, продиктованная современными работами по статисти­ ке, конечно, вклю чает рассмотрение всех четырех ячеек. Определенно, мож ­ но было бы потребовать от человека обратить внимание на несоответствия между наблюдаемыми частотами ячейки и теми частотами, которые следу­ ет “ож идать” на основе соответствующих минимальны х частот или вероят­ ностей (таким образом, обеспечивая информацией, используемой для вы ­ числения статистики хи-квадрат). С кептики, склонные отстаивать основания обывателей, могли бы почув­ ствовать соблазн отклонить такие проявления как свидетельство только того, что люди плохо “оперируют” таблицами сопряженности и отстаивать то, что ош ибки испытуемых в таких задачах являю тся, прежде всего, следствием новизны задачи и искусственности. Отношения между лабораторными дей­ ствиями и каждодневной реальностью , то есть проблема “экологической валидности”, являю тся важ ной проблемой, которую нельзя избеж ать в ис­ следовании, о котором говорится в этой главе. Давайте рассмотрим эту про­ блему в надеж де, что это предупредит и вооружит читателя необходимыми сведениями. С начала, уч и ты вая, что задача оперирования таблицам и бесспорно необычна и экологически нетипична, заметим, что логика (и различны е ло­ гические недостатки), показанны е испытуемыми в этих лабораторных за­ дачах, соответствует логике, наблюдаемой в разнообразии каждодневных выводов. Рассмотрим, например, вопрос, “Отвечает ли Бог на молитвы ?” “Д а,” мож ет ответить необученный человек, которы й смотрит только на ячейку “наличие - наличие”, “потому что много раз я просил Бога о чем-то, и Он давал это мне”. Более искуш енны й и скептически настроенный чело­ 246 КОВАРИАЦИЯ И КОНТРОЛЬ век мож ет спросить, “Но как часто Вы просили, Бога о чем-либо и не полу­ чали этого? ” Сравнение двух ячеек, однако, все еще крайне неадекватно для данной задачи на логику. Д аж е дополнение третьей ячейки, благоприятные исходы, которые произош ли в отсутствии молящ егося, оставит проблему нереш енной, поскольку необходимы все четыре ячейки прежде, чем осно­ вательны й вывод мож ет быть сделан. И даже наиболее искуш енный из ин­ туитивны х психологов, вероятно, оставил бы без вним ания предложения, что данные из ячейки “отсутствие - отсутствие” (то есть, благоприятные ис­ ходы , о которых не просили и которые не произош ли) обязательны для оцен­ ки воздействия молитв на мирские исходы. Н а обвинение в нерепрезентавивности можно ответить даже более убеди­ тельно. Если задача с таблицей из четырех ячеек создает некоторые уникаль­ ные проблемы, эта ж е задача такж е удовлетворяет большинство требований испытуемых, которые усложняю т каждодневные оценки ковариации. Эти требования изначально включают припоминание, кодирование, хранение и восстановление соответствующих данных, а затем подготовку их в той фор­ ме, которая позволяет оценить ковариацию. Рассмотрим, например, человек, который реш ается проверить стереотипное понятие, что рыжеволосые люди являю тся вспыльчивыми (или, более точно, что наличие ры ж их волос поло­ жительно коррелирует с наличием вспыльчивого характера). Сначала, он должен реш ить, какие данные должны быть рассмотрены. Попытается ли он сделать выборку или вспомнить случаи вспыльчивых рыжеволосых людей? И ли он должен рассмотреть некоторых рыжеволосых людей и обратить вни­ мание, насколько они вспыльчивы, или рассмотреть некоторых вспыльчи­ вы х людей и обращать внимание, сколько из них рыжеволосые? Очень веро­ ятно, он примет некоторую стратегию или комбинацию стратегий, не рассмат­ ривая возможность, что относительная частота уравновешенных брюнеток могла быть уместной в данной логической задаче. Это положение дел не соот­ ветствует задаче с таблицей из четырех ячеек, которая делает все соответству­ ющие данные одинаково доступными для испытуемого, даж е если не требу­ ется, чтобы их все надлежащ им образом рассмотрели. Предположим, что рассматриваемый человек, так или иначе признает, что тестирование его стереотипа, требует, чтобы он рассмотрел данные во всех четырех ячейках. К ак он должен сформировать соответствующую выборку данных, и з которой он взял бы уместные частоты ячейки? Если он просто рас­ смотрит первое множество людей, которые приходят на ум? М ожет быть, ему следует рассмотреть всех людей, принадлежащ их некоторому ограниченно­ му классу (например, члены его семьи, друзья или арендаторы в его доме)? Или ему следует попытаться использовать некоторый “случайный” метод для построения частных случаев из полной популяции? Потенциальные источ­ ники предубеждения в наиболее неофициальном методе формирования вы­ борки очевидны. Выборка из людей, которые первыми приходят на ум, мо­ ж ет привести к серьезны м предубеж дениям “доступности” (T versky и K ahnem an, 1973,11). А выборки друзей или членов семьи или соседей, веро­ Субъктивная оценка ковариации... 247 ятно, проявят предубеждение, а такж е нарушение требования независимос­ ти (не тривиальная проблема, так как семья, друзья или даже соседи могут разделять поведенческие тенденции, физические характеристики и даже со­ ответствия между ними). “Н овая” процедура с таблицей из четырех ячеек помогает человеку, оценивающему ковариацию , реш ить задачу сопоставле­ н ия этих тупиковых и критических проблем. Задачи кодирования данны х, их хранения и исправления добавляет мно­ жество дополнительных факторов и проблем в ежедневную оценку ковари­ ации. Вероятно, гипотеза, что рыжеволосые люди являю тся вспы льчивы ­ м и, мож ет искаж ать реш ения относительно того, кто является или не я в л я­ ется вспыльчивым, и чьи волосы являю тся или не являю тся ры ж ими. Эта проблема рассматривается ниж е в этой главе. А сейчас давайте просто обра­ тим внимание, что предш ествующ ие ож идания или гипотезы вклю чаю т потенциально искажаю щ ее влияние на каж дую стадию обработки инфор­ мации, влияние, которое устраняется, когда человеку предоставляются дан­ ные, для которы х процессы кодирования, хранения и восстановления уже закончены . Давайте повторим, что такие ж изненны е препятствия к точной оценке ковариации способны оказаться гораздо более устраш аю щ ими, чем любые препятствия являю щ иеся результатом искусственности или неознакомленности с методологией таблицы сопряженности. Ложная корреляция: воздействие предрассудков на восприятие Н асколько успешно люди обращаются с двумерными распределениями, ког­ да соответствующие наблюдения представлены скорее индивидуально, чем перераспределены в форме таблиц сопряженности? Многие из существующих данных взяты из конструктивной работы Чепманов по ложной корреляции. (Для детального рассмотрения этого исследования см. Chapman & Chapman, 1967,1969; такж е см. Главу 17, этого издания). Наш краткий обзор сосредо­ точивается на специфических проблемах и выводах, которые предоставляют пространство для наш их собственных, более современных, исследований. Возможно, самое простое резюме результатов Чепманов и выводы относи­ тельно способности испытуемых обнаружить ковариации между клиничес­ кими признаками и симптомами - это то, что ковариации, о которых было сообщено, отражаю т истинные ковариации гораздо меньш е, чем предубеж­ дения относительно характера отношений, которые “должны” существовать, основанные на теории или на семантике. В то время как эти выводы были впечатляю щ ими, спорными и обладали непосредственной уместностью для практика, то общее, что они сделали относительно эффектов предубеждений по поводу наблюдаемых ассоциаций, было по существу знакомым. К ак отмечал Чепмен в своей первоначальной работе (L .J. Chapm an, 1967), ложные корреляции не ограничены областью клинических суждений. Боль­ ш инство предрассудков - это по сущ еству опытным путем необоснованные убеждения относительно ассоциации меж ду специфическими действиями 248 КОВАРИАЦИЯ И КОНТРОЛЬ или событиями и последующими положительными или отрицательными исходами. Расовые, этнические, региональные, религиозные или профес­ сиональные стереотипы - это такж е убеждения относительно ковариаций, убеж дения, которые настоятельно под держиваются и являю тся стойкими к воздействию опровергающих данных (см. A dorno и др., 1950; A llport, 1954; Р . G oldberg, 1968; J.M . Jones, 1972; Taynor & D eaux, 1973). Исследование относительно “неявной теории личности” мож ет такж е быть приведено в этом контексте. Более пятидесяти лет назад Торндайк (Thorndike) описал так назы ваемы й эффект ореола, при котором воспринимаю щ ий ожидает и сообщ ает об ассоциации всех полож ительны х характеристик личности. Последующие исследователи (например, K oltuv, 1962; N orm an & Goldberg, 1966; P assini & N orm an, 1966) значительно расш ирили эту работу и иссле­ довали концептуальны е схемы и убеждения относительно личности, кото­ ры е располагаю т испытуемых сообщать о последовательных связях между различны ми чертами характера или различными индикаторами одной и той ж е черты , чьи эмпирические связи очень слабы или даж е не существуют. Таким образом, сущ ествует большое количество эмпирических свиде­ тельств, что, в области оценки ковариации противоборство между ожида­ ниям и и сведениями мож ет быть неравным. Такж е к ак в других типах пер­ цептуальны х и когнитивны х оценок (ср. B runer, 1957а, 1957b; B runer, Postm an, & R odrigues, 1951), предубеждения интуитивного ученого отно­ сительно эмпирических связей определяю т, что он обнаруживает, что ему не удается найти, и что он видит такого, чего не сущ ествует. Такие поспеш­ ные выводы о превосходстве теории над данными могут привести нас к тому, что мы не примем во внимание значимую неопределенность - или, нако­ нец, важ ны й нереш енный вопрос - в исследовании Чепманов. К примеру, мы можем установить две отдельные проблемы об интуитивной оценке ко­ вариации, которые, в некотором смысле, смеш аны в этих и последующих исследованиях (например, G olding & R orer, 1972, S tra rr & K atkin, 1969). П ервая проблема касается трудностей, возникаю щ их у людей при обнару­ ж ении ковариации в непосредственно доступных данны х - то есть их спо­ собность узнать и оценить ковариации, когда они “не услож няю тся” теори­ ям и и объяснениями относительно рассматриваемых эмпирических связей. Вторая проблема рассматривает тенденцию интуиции и теорий испытуемых приводить их к тому, что они признаю т существование устойчивых корре­ ляций, где такие предположения опровергаются лучш ими “объективными” сведениями. Разделение этих проблем предполагает необходимость исследовать про­ ведение испытуемыми оценок ковариации в двух разны х заданиях. Первое задание по своей сути “психологическое”, и оно дает сведения об отноше­ нии между субъективными оценками и объективными измерениями. В этом задании испытуемым предлагается множества двумерных наблюдений, по поводу которы х у них не может быть никакой предвзятой теории, а затем их просят оценить силу связи в каж дом множестве. Исследователь затем Субъктивная оценка ковариации... 249 должен попы таться измерить сложность каждого задания (в основном, от­ м ечая степень изменчивости, связанную с отдельными оценками) и опреде­ лить характер “психометрической” функции, соотнеся субъективные оцен­ ки и объективные измерения. Второе задание касается оценок, совершенно противоположных оценкам, которые основаны на данных; оно имеет отношение к оценкам, которые в це­ лом, или почти целиком, основаны на теории. Таким образом, пары перемен­ ных или измерения, которые могут быть связаны с интуицией испытуемых или их теориями, должны быть определены, но исследователь не может пре­ доставлять никаких релевантных двумерных данных. Если испытуемым предлагаются какие-либо данные в таких оценках, то они должны быть взя­ ты из ежедневного опыта или воспоминаний испытуемых; и, будучи таковы­ ми, они подвержены множеству “процессуальных” ошибок и предубеждений, о которых мы упоминали ранее в наш ем обсуждении. С целью оценки и срав­ нения экспериментатор должен обладать средствами оценки точности или природы ошибок, связанных с такими интуитивными оценками. То есть, у него долж на быть некоторая “объективная” мера корреляции для каж дой пары переменных, предоставленной испытуемым. Э к сп ер и м ен тал ьн о е ср ав н е н и е о ц ен ок к о в а р и а ц и и , о сн о в ан н ы х н а данн ы х и на теори ях Недавно мы провели исследование, преследуя выш еупомянутые цели и ис­ пользуя вышеупомянутую базовую стратегию . Д ля задач, основанных на данны х, были использованы три различны х типа двумерного распределе­ ния, которые будут подробно описаны в следующей главе. Д ля оценок, ос­ нованных на теории, были обозначены пары связанны х переменных, но экспериментатор не предоставил н икаких ф актических данны х. Чтобы об­ легчить сравнение между оценками, основанными на данных и на теориях, использовался внутригрупповой план, в котором испытуемые использова­ ли одинаковые ш калы субъективных оценок для обоих заданий (сбаланси­ рованные по порядку представления). В каж дом случае в задачах релевантной оценки корреляции использова­ лись скорее непрерывные, чем дихотомические переменные (в отличие от работы Chapm an & Chapm an, 1967, 1969 и Jenkins & W ard, 1965). Эта осо­ бенность была разработана для того, чтобы лучш е понять природу большин­ ства ежедневных задач оценивания.1 ‘Наше изучение литературы выявило, что оценка ковариации с непрерывными перемен­ ными очень редко использовалась в предыдущих исследованиях. Исключением, обнару­ женным вэтом поиске, было одно исследование, к которому редко обращались (исследова­ ние Erlick, 1966; Erlick & Mills, 1967), которое касалось, в основном, влияния вариаций на воспринятую соотнесенность; лишь немногие данные из этого исследования применимы для настоящего исследования. 250 КОВАРИАЦИЯ И КОНТРОЛЬ Задачи на оценивание В этом эксперименте, организованном для сравнения оценок ковариации, основанных на данны х и на теориях, участвовали в целом 64 студента стар­ ш их курсов Стэндфордского университета, причем ни один из них не окон­ чил курсов по статистике. Д ля обоих типов оценок испытуемые использо­ вали простую ш калу для описания своего субъективного впечатления о на­ правлении и силе связи между парами переменных. И спользуя эту ш калу, испытуемые сначала оценивали, бы ла ли рассматриваемая связь полож и­ тельной или отрицательным. Затем они оценивали силу связи, помещ ая “X ” на 100-бальной ш кале оценок, концы которой были помечены значениями “полная связь” и “отсутствие связи”. Оценки ковариации, основанные на данных. Одна часть эксперимента каса­ лась оценок ковариации, основанных на множествах двумерных наблюде­ ний, предоставленных экспериментатором. Чтобы создать релевантные дву­ мерные распределения было использовано три варианта стимульного мате­ риала. Д ля каж дого типа стимульного м атериала было создано множество двумерных распределений, чтобы показать различны е объективные кова­ риации между двумя переменными. Испытуемых попросили изучить к аж ­ дое распределение и оценить связи, которые оно описывает, используя 100бальную ш калу субъективных оценок. Мы ож идали, что точность оценок испытуемых в этом задании будет ч а­ стично зависеть от трудностей, с которыми они столкнулись при кодирова­ нии, оперировании и запоминании данных. Чтобы проверить это предполо­ ж ение, три типа стимульного материалов сильно различались в требовани­ ях к обработке информации, которые они предъявляли к испытуемым до оценки ковариации, особенно учиты вая необходимость оценки величины стимула и необходимость хранения и выборки информации из пам яти. Та­ ким образом, первы й тип представлял множества из 10 пар простых чисел. Второй тип состоял из рисунков, каж ды й из которых изображ ал группы из 10 человек разного роста, держ ащ их трости разной длины. Заклю читель­ ный тип распределения был представлен в форме аудиокассет, на которых можно было услы ш ать, к ак каж ды й из 10 человек сначала говорил некото­ рую букву, занимающую некоторую порядковую позицию в алфавите (по сути, первую букву своей фамилии) и затем сразу ж е пел музы кальную ноту разной продолжительности. Субъктивная оценка ковариации... 251 Таблица 1. Пары переменных, описанные испытуемыми и их объективные корреляции Приведенные переменные А В С D Б F G Н I J К L Оценки студентами собственного либерализма Оценки студентами деятельности экономических лидеров в прошлом десятилетии Оценки студентами собственной интеллектуальности Оценки студентами деятельности американских президентов в прошлом десятилетии Оценки студентами собственной застенчивости Количество американских штатов, которые посетили студенты Оценки студентами собственного честолюбия Рост студентов Оценки студентами работы ректоров университета в прошлом десятилетии Время, потраченное студентами в неделю на занятия спортом Оценки студентами собственной интеллектуальности Семейный доход студентов Нечестность детей, измерянная в соответствии с ложным сообщением о спортивных достижениях Нечестность детей, измерянная в соответствии со степенью обмана, используемого при решении загадки Семейный доход студентов Оценки студентами действий экономических лидеров в прошлом десятилетии Способность шестиклассников "препятствовать вознаграждению" Способность шестиклассников сопротивляться искушению обмануть Оценки студентами собственной сознательности Оценки сознательности этих студентов, предоставленные их соседями по комнате Оценки студентами собственной интеллектуальности Оценки студентами собственного честолюбия Оценки студентами деятельности Конгресса в прошлом десятилетии Оценки студентами деятельности трудовых лидеров в прошлом десятилетии Объективная корреляция -0.28“ -0.19“ -0.12“ 0.01“ 0.08ь 0.17“ 0.18“ 0.28“ 0.31е 0.35d 0.37“ 0.40“ 252 КОВАРИАЦИЯ И КОНТРОЛЬ Продолжение табл. 1 м N О Р Время, потраченное студентами в неделю на занятия спортом Оценки студентами собственной физической формы Оценки студентами деятельности американских президентов в прошлом десятилетии Оценки студентами деятельности экономических лидеров в прошлом десятилетии Оценки собственного политического консерватизма Объединение оценок пунктов шкалы этноцентричности Рост студентов Вес студентов 0.52* 0.55* 0.57* 0.79* •Корреляция, полученная из исследования студентов (N=295) Стэнфордского университе­ та. ьКорреляция, полученная из работ Гартшорна и Мэя (Hartshorne & May, 1928). 'Корреляция, полученная из работ Мишеля и Гилигана (Mischei & Gilligan, 1964). '‘Корреляция, полученная из работ Бема и Аллена (Bern & Allen, 1974). 'Корреляция, полученная из работ Адорно и др. (Adorno..., 1950). Оценки ковариации, основанные на теории. Д ругая часть эксперимента (порядок представления этих двух частей был сбалансирован) рассматри­ вала оценки ковариации, основанные скорее на априорных ож иданиях ис­ пытуемых или теориях, чем на непосредственно доступных двумерных дан­ ны х. П ары измерений или переменных были определены, и испытуемых по­ просили оценить сначала направление, а затем силу связей для каж дой пары, всегда используя ту ж е простую субъективную 100-бальную ш калу оцен­ к и , к ак было использовано для оценок, основанных на данных. Некоторые из этих пар в этой части эксперимента касались расходящ ихся поведенчес­ к и х измерений личны х черт характера, например, два измерения честнос­ ти, используемые в классическом исследовании Гаршорна и М эя (H artshorne & May 1928) кросс-ситуативной последовательности в моральном поведе­ нии; другие касались личны х отнош ений, привы чек или предпочтений. В каж дом случае, однако, субъективны е оценки ковариации, которы е мы получили, сравнивались с “объективными” корреляциям и, взяты ми из пре­ дыдущ их эмпирических исследований. (Полный список этих пар перемен­ ны х и соответствующ их корреляций представлен в табл. 1) Субъктивная оценка ковариации... 253 Р е зу л ь т а т ы О ценки ковариации, основанные на данны х Н аш е первое исследование вклю чает оценки ковариации, которые испы ту­ емые сделали в ответ на непосредственно доступные двумерные данные. Могут возникнуть два специфических вопроса: во-первых, к ак легко чело­ век может обнаружить ковариации различной величины при отсутствии лю­ бой “теории” о соответствующих распределениях данных? Во-вторых, к а ­ кова бы ла природа “психоф изической ф ункции”, связываю щ ей среднее значение субъективны х оценок и объективное измерение ковариации? П роверка данны х предполагала, что задача оценки была очень трудна. Стандартные отклонения и м еж квартильны е ш ироты , связанны е с полны­ ми оценками группы для каж дого набора данны х были чрезвычайно высо­ ки (см. Рисунок 1). Что является особенно интересным - это трудность, с которой столкнулись многие испытуемые, просто в признании существова­ н ия полож ительны х связей, даж е связей большой величины . Ф актически только, когда объективные корреляции достигают уровня от + 0.6 до + 0.7, м еж квартильны й интервал последовательно исклю чает отрицательны е оценки связей. Нестабильность оценок ковариации систематически не от­ личалась для трех типов двумерных распределений данны х, несмотря на явны е различия в количестве обработанной информации (и, следователь­ но, возможности для случайной или систематической ош ибки), связанной с этими тремя типами. Эта очевидная нечувствительность к увеличению тре­ бований к процессу “обработки информации” может предлож ить реш ения относительно природы оценочной “стратегии” испытуемых - возможность, которую мы будем исследовать несколько позж е в этой главе. Такж е на Рисунке 1 представлены данные, соответствующие второму воп­ росу об оценках, основанных на данны х, вопросу о “функциональной свя­ зи ” между объективными и субъективными показателями ковариации. (Ч и­ татель обратит внимание, что средние величины этих трех областей стиму­ ла объединены в этом представлении результатов. Ни проверка, ни статис­ тические тесты значимости не показали н икаких сущ ественных или после­ довательных тенденций, отличаю щ ие результаты для трех областей стиму­ ла, и результат такого объединения - более однородная и более понятная ф ункция, чем ф ункция, полученная для любой из трех индивидуальных областей.) Д ля удобства читателя мы подогнали кривую к пунктам в наш ем граф ике. Мы долж ны отметить, что эта кри вая, была нарисована позднее; она не была получена из какой-либо “психофизической теории”. Из проверки ясно, что, несмотря на внутригрупповую изменчивость для индивидуальны х оценок, ф ункция, связы ваю щ ая средние субъективные оценки с объективными корреляциям и (корреляция Пирсона) была доволь­ но однородная. Существует резко возрастаю щ ая ф ункция, связываю щ ая эти две переменные. Таким образом, связи в изменениях, с которыми обычно 254 КОВАРИАЦИЯ И КОНТРОЛЬ Объективная корреляция Рис 1. Средние величины и м еж квартильны е изменения для оценок ковариации, основанных на данны х, причем результаты для трех ти­ пов р асп ред ел ен и я объ еди н ен ы . “П си х о ф и зи ч еск ая ф у н к ц и я ” 100(W l - г2) показана пунктирной линией сталкиваю тся психологи, занимаю щ иеся измерениями черт характера лич­ ности или другой кросс-ситуативной устойчивости в социальном поведении (то есть, г - от 0.2 до 0.4), можно обнаружить только, вы давая средние оцен­ ки в диапазоне от 4 до 8 на 100-бальной ш кале. Д аж е связи, рассматривае­ мые таким и психологами к ак очень прочные (то есть, г = от 0.6 до 0.8), за­ канчиваю тся довольно скромными субъективны ми оценками ковариации. Объективные корреляции 0.7, например, произвели среднюю субъектив­ ную оценку 34 - оценка, находящ аяся между пунктами помеченными “до­ вольно слабая” и “умеренная” на субъективной 100-бальной ш кале. Толь­ ко, когда объективные корреляции приблизились к уровню 0.85, среднее значение группы достигло средней точки субъективной ш калы , и только за этой точкой испытуемые последовательно оценили связи к ак крайне поло­ ж ительны е. Более близкое рассмотрение оценок предполагает, что субъективны е оценки связанности или ковариации - не линейная ф ункция г или не г2. Субъктивная оценка ковариации... 255 Скорее, образец объединенной средней оценки каж ется хорошо описанным вы раж ением, (1- /1 - г2). (Читатель может узнать это вы раж ение как “коэф­ фициент отчуж дения”, меру редукции стандартной ош ибки, связанной с прогнозированием переменной Y, основанным на знании к ак переменной X , так и корреляции между X и Y (H untsberger, 1967)). Действительно, по­ добие между фактическими средними оценками и оценками, описанными этим вы раж ением, было поразительно - 95% вариации между средними объясняется функцией, основанной на коэффициенте отчуждения. Мы спе­ ш им напоминать читателям , однако, что они не должны неверно понять значение этого точного соответствия. Степень соответствия, показанная на Рисунке 1, прим еняется только к групповым оценкам; индивидуальные оценки свидетельствовали о трудностях испытуемых в различении разны х уровней ковариации. Очевидно, преждевременно делать какой-либо вывод относительно при­ роды “психофизической” ф ункции, связываю щ ей субъективные ответы и объективные измерения ковариации. Д етали задачи, контекст, и возмож­ но, даж е совокупность оцениваю щ их, несомненно, произвели бы различия в ф ункции, различия, которые могли быть зафиксированы только путем вклю чения соответствующих параметров. Однако, имеющ ихся результатов достаточно, чтобы предположить, что умеренные корреляции подобного вида, о которых так часто сообщают психологи-эксперты (cp. M ischei, 1968, 1969), вероятно, будут слабо обнаруж иваться или произведут только очень слабое впечатление на обывателей, которые сталкиваю тся с таким и кова­ риациям и в отсутствии предубеждений, основанных на теории. Далее стоит перенести внимание на то, что три различные задачи оценок ковариации, основанных на данных, произвели очень похожие результаты, несмотря на различные требования к обработке информации, которые они предъявили испытуемым. Таким образом, “психофизическая” функция, про­ иллю стрированная на Рисунке 1, точно отражает связи между субъективны­ ми оценками и объективными измерениями для каждой из этих трех задач, выполненных испытуемыми. К орреляция между средними значениями ф ак­ тических оценок испытуемых и оценками, спрогнозированными оценкой функции от г = 0.91 для пары нота / буква до г = 0.98 для пары чисел. О ценки, основанные на теориях Ранее мы представили свидетельство того, что необходимо, чтобы относи­ тельно сильная объективная корреляция (г в терминах Пирсона) породила субъективные оценки, даж е незначительно отличные от нуля. Рассмотрен­ н ая отдельно, психофизическая ф ункция для оценок, основанных на дан­ ны х, может просто быть свидетельством того, что субъективные измерения обы вателя осторожны или консервативны по отношению к измерениям, используемы м наиболее формальны ми статистикам и. (Конечно, трудно поспорить, что г2 — более соответствующий индекс соотнесенности, чем г, 256 КОВАРИАЦИЯ И КОНТРОЛЬ т. к. он мож ет быть легче связан с прогнозирующей полезностью или умень­ ш ением неопределенности относительно значения одной переменной, осно­ ванной на знании значения другой, связанной с ней, переменной.) Короче говоря, полученные оценки, основанные на данных, не предполагают к а­ кой-либо систематической ошибки со стороны интуитивного психолога, хотя изменчивость, связанная с такими оценками, не оставляет сомнения отно­ сительно трудностей и неопределенности в задачах оценки. У читы вая эти результаты и возможные интерпретации, мы можем те­ перь перейти к рассмотрению результатов для субъективных оценок кова­ риации относительно связей, перечисленных в табл. 1. Эти оценки были сде­ ланы при отсутствии непосредственно доступных данных; предположитель­ но, они были осуществлены только на основе неофициальных теорий или интуиции оценивающих, без сохранения этих “обработанных” данных, от­ меченных и извлеченных из ежедневного опыта. Рисунок 2 предоставляет первое рассмотрение этих результатов. Ясно, что никакая отдельная линей­ н ая или какая-либо другая ф ункция не охватывает связи между субъектив­ ными оценками и объективными измерениями. Однако существует бесспор­ ная тенденция, согласно которой оценки испытуемых, основанные на теории, показывают приблизительное соответствие объективным сведениям. То есть положительные эмпирические связи были оценены к ак положительные; от­ рицательные связи были оценены как отрицательные; относительно прочные эмпирические связи были оценены как более прочные, чем относительно не­ прочные, и т.д. Рис. 2. Средние значения для оценок ковариации, основанных на тео­ рии. (См. обозначение переменных в табл. 1) Субъктивная оценка ковариации... 257 Возможно, наиболее поразительная особенность оценок, основанных на те­ ории, - это то, что однажды освобожденные от ограничений, наложенных непосредственно доступными данными, испытуемые переставали быть ос­ торожными или консервативными. Они охотно отмечали середину и даже верхние области субъективной 100-бальной ш калы даж е, когда сталкива­ лись с парами переменных, которые объективно были незначительно коррелированы. Иллю страция, приведенная на Рисунке 2, убеждает в этом. Не­ сколько пар переменных, коррелированых на уровнях, которые в случае оценок, основанных на данных, выдали средние субъективные оценки, весь­ ма близкие к 0 (например, г = 0.3), теперь выдали оценки 30, 40 или более на субъективной 100-бальной ш кале. Пары переменных G и I заслуж иваю т особенного вним ания, так к ак они касаю тся основанных на теории оценок кросс-ситуативной поведенческой устойчивости и, таким образом, вы раж аю т проблему, представляющую те­ оретический интерес в настоящ ее время (см. A lker, 1972; A llport, 1966; Bern и A llen, 1974; Bern и Funder, 1978; Bern и Lord, 1979; M ischei, 1968,1969). То, о чем говорят субъективные оценки для этих двух связей, очевидно. При наличии непосредственно доступных объективных данны х, представляю ­ щ их корреляции в диапазоне от г = 0.2 до г = 0.3, испытуемые дали средние оценки между 0 и 10 в оценочной 100-бальной ш кале. Теперь, при отсут­ ствии непосредственно доступных данны х, но касаю щ ихся двумерной об­ ласти, показываю щ ей тот ж е диапазон отг= 0.2 д ог = 0.3, подразумеваемые теории индивидуальности подтолкнули испытуемых к тому, чтобы предло­ ж ить оценки ковариации, которые в среднем находились в диапазоне от 50 до 60. К акая степень ковариации в непосредственно доступных двумерных данных потребовалась бы, чтобы породить подобные оценки при отсутствии “теорий” или предубеждений? Ответ виден на Рисунке 2; только эмпири­ ческие корреляции в диапазоне г = 0.90, могли породить такие оценки. Результаты наш его исследования, таким образом, наш ли отражение в эмпирических обобщениях. 1. Когда непосредственно доступные двумерные данные исследованы при отсутствии каких-либо теорий или предубеждений относительно их связанности, интуитивному психологу труднее обнаружить ковариации величин, которые могут характеризовать широкий диапазон функциональных связей, представленных в ежедневном социаль­ ном опыте. В частности, ковариации в диапазоне величин, с которыми обычно имеют дело психометристы в поиске кросс-ситуативной поведенческой устойчивости, вероят­ но, останутся необнаруженными или будут восприняты как близкие к нулю. 2. Когда объективные доступные в настоящий момент двумерные данные не могут быть исследованы, а предшествующие теории, или предубеждения существуют, интуитив­ ный психолог может ожидать и прогнозировать ковариации значительной величины часто большие, чем те, которые представлены прошлым опытом или будут представле­ ны в будущем. Рассматриваемые вместе, эти обобщения помогают сосредоточить вним а­ ние на контрасте между оценками, основанными на данных и оценках, ос­ 258 КОВАРИАЦИЯ И КОНТРОЛЬ нованны х на теориях. Теории, сторонниками которых мы являем ся, зас­ тавляю т нас ож идать и прогнозировать более прочные эмпирические связи, чем они есть на самом деле; и многие существующие эмпирические связи, даж е большой величины, могут быть обнаружены, только если мы уже ож и­ даем это сделать. П р о и сх о ж д ен и е и ж и зн есп о со б н о сть тео р и й Стратегии оценки ковариации Кроме предлож ения обобщений относительно исходов различны х заданий оценки, важ но начать рассматривать процессы оценки и стратегии, кото­ рые могли бы леж ать в основе таких исходов. Снова различие между оцен­ кам и, основанными на данных и теориях, оказы ваю тся критическими, и снова конструктивны е выводы Чепманов обеспечивают удобный отправной пункт. Данные вместо теории. И з исследований Чепманов стало ясно, что преду­ беждение одержало победу над информацией, предоставленной непосред­ ственно доступными данными. Менее очевидно, однако, к ак это происхо­ дит. “Видели” ли испытуемые на самом деле те связи, о которы х они сооб­ щ али? И ли они просто сообщали об отнош ениях, которые, как они ож ида­ ли , будут присутствовать в данны х, без какого-либо соответствую щ его субъективного впечатления? И ли испытуемые “ш ли на компромисс” м еж ­ ду своим субъективными восприятием и ож иданиями, придавая некоторое значение каж дом у из них? Невозможно дать однозначный ответ на основе сообщенных результатов, хотя имеется определенное свидетельство, как того, что испытуемые, придавали, по крайней мере, некоторое значение сво­ ему непосредственному восприятию данных и что их восприятие полнос­ тью не было определено их ож иданиями. В частности, мы обращаем внима­ ние н а сообщение Чепманов, что повторное воздействие не-отношений (non­ relationships) в конечном счете, уменьш ало количество сообщений об иллю ­ зорной корреляции. Однако было такж е ясно, что данные никогда не могли полностью одерж ать победу над предубеждениями испытуемых, так к ак даж е при увеличении числа раз, когда испытуемые подвергались воздей­ ствию отрицательных связей, не могло полностью устранить сообщения об иллю зорны х положительных корреляциях. Вопросы об интуитивны х стратегиях для оценки ковариации, таким об­ разом, оказы ваю тся в центре вним ания. К ак испытуемые решают, какая степень связи присутствует в данны х? К ак они решают, к акая степень свя­ зи “долж на”, присутствовать в репрезентативном наборе двумерных наблю­ дений, которы е предоставлены в соответствии с их интуитивными теория­ ми или предубеждениями? Когда и как предубеждения преобразовывают субъективны е опыты ковариации? Н ачиная разм ы ш лять над ответами на Субъктивная оценка ковариации... 259 такие вопросы еще раз полезно вначале сосредоточиться на оценках, осно­ ванны х только на данны х и оценках, основанных только (или, по крайней мере, в значительной степени) на теории, и только затем вернуться к слу­ чаю , когда сталкиваю тся непосредственно доступные данные и ожидания, основанные на теории. Стратегии оценок, основанных на данных. Возможно, наш е наиболее по­ разительное откры тие относительно оценок, основанных на данны х, вклю ­ чало ответы испытуемых на двумерные распределения, предлагающ ие ко­ вариации величин, которые встречаю тся в каждодневном опыте и соответ­ ствуют неофициальным социальным теориям, в частности, для испытуе­ мы х трудно обнаружить такие связи. И, в среднем, они оценили ковариа­ ции, к ак весьма близкие к нулю. К акие последствия имеют такие результа­ ты на неофициальные стратегии оценки ковариации, которые могли бы ис­ пользоваться наш ими испытуемыми? Разм ы ш ляя над этой проблемой, важ но помнить, что отдельные испыту­ емые не считали, что объективно слабые корреляции были близки к нолю. Вместо этого, они предлож или довольно ш ирокий диапазон оценок, для которы х только соответствующие средние значения были близки к нулевой отметке. Снова, трудно точно различить, что испытуемые ф актически “ви­ дели” и что они оценили, несмотря на то, что они видели. Поразительно од­ нородная и последовательная “психометрическая” ф ункция, связываю щ ая средние оценки с ф актическими корреляциям и, не оставляет сомнения, что испытуемые использовали характеристики данных, которые были после­ довательно связаны с объективной корреляцией. Величина изменчивости в их оценках, однако, указы вает, что используемые характеристики данных были только приблизительно связаны с объективными измерениями кова­ риации. Мы подозреваем, и самоанализы некоторы х неопытных испытуемых, которые вы полняли это задание, подтверждают это, что впечатления испы ­ туемых о “связанности” не отраж аю т попы тки рассмотреть полную выбор­ ку соответствующ их двумерных наблюдений. Скорее, испытуемые могут полагаться на несколько специальны х, возможно, экстремальны х случаев переменной X или переменной Y. Таким образом, они могут просто наблю­ дать направление и экстремальность величины Y, связанной с экстремаль­ ностью величины X, и наоборот. Ф акторы , влияю щ ие на внимание и па­ м ять, могли бы такж е иметь значение; таким образом, наглядность и конк­ ретность, так ж е к ак новизна представления, могли бы влиять на то, на к а ­ кие моменты данны х полагаю тся. Уверенность в ограниченном количестве специальны х или “тестовых” случаев, в частности, уверенность в крайних множествах, произвела бы по­ следствия, сопоставимые с наш ими результатами: во-первых, манипуля­ ции со стимулами (то есть, числа - рисунков - аудиозаписи), которые были спланированы, чтобы изменять потребность в оценке величины и заломи- 260 КОВАРИАЦИЯ И КОНТРОЛЬ н аяи я до оценки ковариации, должны были оказать мало воздействия, так к ак эти дополнительные требования были восприняты тривиальны ми, если испытуемые просто полагались на очень ограниченное число отдельных слу­ чаев. Во-вторых, в зависимости от того, какие отдельные случаи они прини­ мали во внимание, испытуемые, сталкиваю щ иеся с непрочными связям и, к а к ож идалось, могли оценить их, скорее, к ак умеренно положительные или к ак умеренно отрицательные, чем к ак равные нулю. Наоборот, испы ­ туемые, сталкиваю щ иеся с прочными связям и, могли бы показать вполне последовательные и крайние оценки, так к ак положительные связи допус­ каю т мало вариативности в значениях одной переменной, которая может быть связана с крайним значением другой переменной. Ф орма наш ей пси­ хометрической ф ункции, а такж е сокращ енная вариативность, связанная с оценками самой прочной эмпирической связи, совместимы с теоретичес­ ки допущ енными последствиями того, что люди полагаю тся на экстремаль­ ные случаи, хотя такие сведения не убедительны. Ясно, что более опреде­ ленны е ответы могут быть получены только из исследовательских проек­ тов, в которы х значением экстремальны х (или непропорционально доступ­ ны х) случаев сознательно манипулировали. Стратегия оценок, основанных на теории. Когда мы переклю чаем наш е внимание на оценки, основанные на теории, вопрос, который сразу ж е воз­ никает - это насколько данные могут быть использованы в добавление к чистой теории. В некоторых случаях, вероятно, что ни к каким данным не будут обращ аться. Испытуемые, например, могли полагаться только на интуицию , основанную на теориях или семантике, и ож иданиях; то есть прим еняли критерий репрезентативности (cp. Kahnem am и Tversky, 1973, 4), рассматривая связи между двумя переменными в каж дой паре. Мало кто из читателей будет оспаривать утверждение, что люди придерживаю тся со­ циальны х теорий подобного происхождения (или, по крайней мере, могут без труда создать). И действительно, любой обыватель может создать новые теории или дать прогнозы о ф ункциональны х связях слиш ком быстро, что­ бы такие теории зависели от создания и анализа ф актических случаев. Однако мы не подвергаем сомнению возможность, что некоторые оценки ковариации, основанные на теории, подразумевают обращение к фактичес­ ким сведениям. Опять ж е, однако, мы подозреваем, что обыватель, более ве­ роятно, будет полагаться на специфические тестовые случаи, подверженные многочисленным предубеждениям в кодировании, хранении и вспоминании, чем производить и неформально анализировать некоторую полную выборку двумерных данных. Н екоторые теории или убеждения относительно специфических связей могут, таким образом, частично основываться н а данны х. Другие могут ос­ новы ваться на выводах из более обш ирных убеждений о мире, народной мудрости, семантических ассоциациях или убедительности общ ения с се­ мьей, друзьям и или информации, полученной из средств массовой инфор­ Субъктивная оценка ковариации... 261 мации. Независимо от их происхождения, однако, ясно, что многие убеж­ дения являю тся как ошибочными, так и способными закрепляться и, воз­ можно, даж е усиливаться, несмотря на сведения, которые вызвали бы се­ рьезные сомнения у любого непредубежденного наблюдателя. Конечно, у любого непредубежденного наблю дателя, у которого был бы калькулятор, вводный текст по статистике, и некоторые обычные знания относительно того, к ак их использовать. Поэтому мы закончим эту главу, кратко задав пару близких вопросов о столкновении между интуитивными теориями и ежедневным опытом с эмпирическими ковариациям и, которые “проверя­ ю т” эти теории: во-первых, каковы механизмы , с помощью которых ош и­ бочные или высоко преувеличенные убеждения относительно функциональ­ ны х связей могут закрепляться, несмотря на убедительные логические оп­ роверж ения? Во-вторых, как может наш е описание недостатков обывателя быть приведено в соответствие с очевидной способностью организмов к обуче­ нию (в частности, инструментальное обусловливание и реакционное обуслов­ ливание и с очевидной точностью и адекватностью многих наш их каж дод­ невных убеждений и социальных стратегий?) Этих вопросов можно касаться только здесь, и мы отсылаем заинтересо­ ванного читателя к более всесторонним обсуждениям в Главе 9 этого изда­ н ия и в других публикациях (например, N isbett и Ross, 1980). М еханизм ы устойчивости теории Теории об эмпирических связях, таких к ак впечатления об отдельных лю­ дях, часто показываю т удивительную способность сохраняться сталкива­ ясь с эмпирическим опровержением. Одно из множеств механизмов, кото­ рые объясняю т такую устойчивость, происходит из простого ф акта, что люди обычно действуют в соответствии со своими убеж дениями; эти действия могут варьироваться от простой общественной защ иты до влож ения време­ ни, энергии, богатства или репутации. Такое поведенческое обязательство меш ает субъекту усоверш енствовать свои убеждения в свете новых сведе­ ний (Abelson и другие, 1968; F estinger, 1957, 1964). Действительно, убеж­ дения или ож идания человека могут превратиться в самосбывающиеся пред­ сказани я, посредством чего первоначально необоснованные убеждения зас­ тавляю т его вести себя так, чтобы произвести исходы или данные, которые полностью подтверждают его убеж дения (M erton, 1948; R osenhan, 1973; R o sen th al & Jaco b sen , 1968; S nyder & Sw ann, 1976; S nyder, T anke, & B erscheid, 1977). Недавнее исследование, проведенное Леппером, Россом и их коллегами, проиллю стрировало дополнительные механизмы или процессы, которые могут леж ать в основе устойчивости убеждений. Эти механизмы включают наклонности “наивного” ученого к ак к ассимиляции недавно рассмотрен­ ного отрезка информации к ак ф ункции их соответствия с предшествующи­ ми убеждениями, так и к выходу за пределы ассимиляции данных к разра­ 262 КОВАРИАЦИЯ И КОНТРОЛЬ ботке причинных объяснений того, почему предполагаемое состояние сохра­ няется (см. Главу 9 этого издания A nderson, Lepper, & Ross, 1980; Jennings, Lepper, & Ross, 1980; Lord, Ross, & Lepper, 1979; N isbett & Ross, 1980; Ross, 1977; Ross, Lepper, & H ubbard, 1975; Ross, Lepper, Strack & Steinm etz, 1977). В ы явление ковариации, обусловливание и другие успехи реальной ж изни Н аш е нелестное описание способностей обывателей вы являть и оценивать ковариацию , мож ет с первого взгляда показаться несоответствующим ог­ ромному количеству лабораторных сведений и даж е ещ е более обширной базе ежедневного опыта, иллюстрирующего классическое и инструменталь­ ное обусловливание. К аж дая кры са, которая научилась убегать из мыш е­ ловки, каж ды й ребенок, который оценил преимущество добавления сахара в каш у, каж ды й возлюбленный, который понял, что честность - не всегда хорош ая политика, каж дая мать, у которой на плач ее ребенка возникал рефлекс кормления грудью, является доказательством того, что организмы действительно распознаю т ковариации среди стимулов окружаю щ ей сре­ ды. И разве работа Чепманов, а такж е наш и работы, касаю тся некоторого очень узкого и сокращ енного класса задач оценки ковариации, сталкива­ ясь с которыми, обыватель проявляет однозначные недостатки? Нисбетт и Росс (N isbett & Ross, 1980) обсудили эту проблему и приш ли к выводу, что ответ н а этот вопрос отрицателен. Они заявляю т вместо этого, что именно явления обусловливания, являю тся “исклю чением”, и именно ограничен­ н ая возможность вы явить и оценить ковариацию , описанная в этой главе, иллю стрирует “правило”. Мы не можем подробно рассмотреть соответствующие аргументы, но сущ ­ ность исследования Нисбетта и Росса в том, что классическое и инструмен­ тальное обусловливание получено при строго ограниченны х обстоятель­ ствах, вклю чаю щ их значимость и выраженность стимула, оптимальный ин­ тервал между стимулами и моментами применения стимула, или отсутстви­ ем события, несоответствующего стимулу или рассеивающего стимул. Два дополнительных ф актора, которые они упоминают, заслуживаю т особого вним ания. Во-первых, стоит отметить, что в то время к ак обусловливание мож ет сохраняться с относительно низкой ковариацией между обусловлен­ ным стимулом (ОС) и необусловленным стимулом (НОС) или реакцией и закреплением , оно почти неизбежно может быть получено при условии иде­ альной ковариации, то есть, за ОС или за реакцией неизбежно следует НОС или закрепление, и последнее никогда не наблюдается в отсутствие перво­ го. А симметрия между необходимыми условиями для приобретения обус­ ловленной реакции и сохранением или “устойчивостью” такой реакции, таким образом, иллю стрирует, в некоторой степени, такую ж е асимметрию между оценкой ковариации, основанной на данны х, и оценкой, основанной на теории, которая исследовалась в данной главе. То есть во время поддер­ Субъктивная оценка ковариации... 263 ж ан и я состояния организм может продолжать ож идать, и возможно, даж е чувствовать большую ковариацию между ОС и НОС или между реакцией и закреплением , чем объективно оправдано. О рганизм мож ет приним ать закрепленны й опыт в номинальной стоимости при приписывании не-закрепленного опыта к изменению обстоятельств, влиянию третьих перемен­ ны х или даж е случая. Возможно, самым важ ны м является веское свидетельство, что как инст­ рументальное, так и классическое обусловливание выигрывает от (а в неко­ торых случаях даж е требует) хорошего соответствия между случайностя­ м и, которые необходимо изучить, и предшествующими теориями или ож и­ даниям и, с которыми организм попадает в лабораторию. По крайней мере, ясно, что не все случаи ОС-НОС или реакция-закрепление одинаково усваи­ ваю тся. Возможно, наиболее внуш ительные доказательства этого обеспечил Гарсиа и его коллеги (например, G arcia, McGowan и G reene, 1972). Эти ис­ следователи сообщили, что кры сы могут научиться на единственном испы­ тании, избегать пробовать пищ у, которая вы зывает желудочно-киш ечное расстройство, даж е если интервал между едой и расстройством - целы х 12 часов. И , напротив, у ж ивотного, которое заболевает через несколько часов после потребления пищ и со знакомым вкусом, но новой формы, не наблю­ дается подобной обучаемости. С другой стороны, когда немедленная боль заменяет отсроченную болезнь к ак НОС, получается противоположный ре­ зультат; то есть кры са с готовностью у чится избегать новых форм, а не но­ вы х вкусов, когда такие стимулы немедленно сопровождаются ударом то­ ком. К ак заклю чаю т Нисбетт и Росс (N isbett & Ross, 1980), кры са может характеризоваться к ак обладаю щ ая двумя “теориями”, обе из которых хо­ рошо подходят для ф актических непредвиденных обстоятельств ее эколо­ гии: (а) отличительные вкусовые сигналы , которые сопровождаются более поздним (даж е намного более поздним) расстройством, долж ны рассматри­ ваться к ак подозрительные; (Ь) отличительные осязательны е или простран­ ственные сигналы , которые сопровождаются немедленной телесной болью, долж ны рассматриваться к ак подозрительные. Таким образом, в более общих терминах (ср. Testa, 1974), организмы, как люди, так и кры сы , будут видеть те и только те ковариации, которые их соб­ ственная история или история их вида предполагает видеть. Если не руко­ водствоваться “теориями”, обнаружить ковариации становится очень труд­ но и вероятно, это произойдет только тогда, когда соответствующие корреля­ ции приближаю тся к единице, и /и ли когда условия для обучения оптималь­ ны в терминах самих факторов, которые были объяснены в лабораториях с помощью длинной и выдающейся линии между Хола и Скиннера. Иногда, конечно, каждодневные обстоятельства являются оптимальны­ ми для обучения. Таким образом, в наш ем каждодневном опыте мы изучаем, что делают бесчисленные выклю чатели, рычаги, кнопки и другие механиз­ мы управления, и что обозначает изумительное разнообразие знаков, симво­ лов и сигналов, потому что соответствующие ковариации так близки к совер­ ш енным. Одинаково важным является ф акт, что обыватель, подобно учено­ му, часто мож ет “проверять” новые гипотезы, которые он принимает во вни­ мание. Могут преднамеренно быть созданы выборочные данные, которые го­ раздо лучш е подходят для данной логической задачи, чем выборки, предло­ ж енные случайным опытом и воспоминанием. Действительно, наш е влияние на окружающ ую среду все более и более зависело от наш ей способности заменять относительно формальные инст­ рументы для заклю чений на неформальные. Наш успех отраж ает наследие поколений обычных м уж чин и ж енщ ин, которые тщ ательно отметили и записали результаты и , ещ е раньш е, от поколений бесчисленных учены х, достигш их мастерства в искусстве формального экспериментирования и статистического анализа. 16. Иллюзия контроля* Эллен Й. Лангер В то время к ак большинство людей согласится, что имеется много точек со­ прикосновения между навыком и удачей, все ж е необходимо достичь полно­ го понимания того, насколько неразрывно связаны эти два понятия. В прин­ ципе, различие каж ется ясным. В ситуациях навы ка имеется причинная связь между поведением и исходом. Таким образом, успех в задачах навы ка управляется. Удача, с другой стороны, является случайным событием. Ус­ пех в действиях удачи или случая, очевидно, не поддается контролю. Инте­ ресующая нас проблема - действительно ли это различие признается. Пред­ положение, принятое здесь - то, что нет. В то время как люди признают кон­ цепцию случая, они ведут себя, как если бы случайными событиями можно было управлять. Если это правильно, интересно определить переменные, от­ ветственные за эту путаницу.... Н екоторые наблюдения говорящ ие в пользу утверж дения, что люди об­ ращ аю тся со случайными событиями как с управляемы ми, идут от социо­ логов Гофмана (G offm an, 1967) и Х энслина (H enslin, 1967). При изучении методов игры в казино в Лас-Вегасе, Гоффман отметил, что работники кази ­ но, раздаю щ ие карты , в периоды возникновения неудач, подвергались рис­ ку потери своих рабочих мест. Х энслин изучил игру в кости и отметил, что игроки в кости явно ведут себя так, как-будто они управляю т исходом брос­ ка. Они осторожно бросают кости, если они хотят вы падения низкого числа или бросают их резко для вы соких чисел. Они полагаю т, что усилия и кон­ центрация окупятся. Контроль можно такж е наблюдать и при заклю чении пари; например, всегда держите пари с человеком, который вы глядит так, как-будто у него все под контролем. Это поведение весьма рационально, если человек полагает, что игра требует навы ка. * Выдержки из книги, которая появилась в журнале “Journal of Personality and Social Psychology”, 1975,32,311-328. Авторское право© 1975 принадлежит Американской Пси­ хологической Ассоциации. Переиздано в соответствии с разрешением 266 КОВАРИАЦИЯ И КОНТРОЛЬ Если бы человек попробовал проявить контроль над случайным событи­ ем, можно было бы оказать влияние прежде, чем исход случая определен. С трикленд, Л евики и Кац (S trickland, Lewicki, K atz 1966) проверили это предположение. Испытуемые были привлечены в игру в кости, в которой они вы бирали одно из множества альтернативны х пари либо до того, к ак кости были брошены, либо только после броска, но прежде, чем исход объяв­ лен. Они обнаруж или, что испытуемые ш ли на больший риск, то есть дела­ ли больш ие ставки, когда держ али пари перед броском, чем после броска. Предыдущ ее исследование показы вает, что люди часто не могут реаги­ ровать по-разному на управляемы е и не поддающиеся контролю события. Однако, ф акторы , которые управляю т этим иллю зорным процессом конт­ роля, систематически не изучались. Один способ идентифицировать эти ф ак­ торы состоит в том, чтобы исследовать характеристики ситуаций навы ка. В ситуациях навы ка люди участвуют в различном открытом и тайном пове­ дении, результатом которого является увеличение вероятности успеха: вы ­ бор того, к аки е материалы являю тся соответствующими ситуации и каки е реакции проявлять, ознакомление с этими материалами и реакциям и, тра­ та времени на обдумывание задачи для достиж ения возможных стратегий, которы е могут использоваться, и трата усилий, будучи активно заняты м и в задаче, чтобы увеличить ш анс успеха. Кроме того, ситуации навы ка имеют некоторые характеристики, не обязательно вызванные человеком, чтобы максимизировать вероятность успеха. К онкуренция - один из таких ф ак­ торов. Эти связанны е с навыком факторы могут отвечать за появление иллю зии контроля. И ллю зия контроля определена к ак ожидание, что личная вероят­ ность успеха будет выше, чем гарантировала бы объективная вероятность. Следующие исследования были предназначены для оценки эффективности этих относящихся к навыкам факторов в создании иллюзии контроля. В част­ ности, исследование, которое будет описано, было предназначено, чтобы про­ верить следующую гипотезу: поощ ряя или позволяя участникам случайного события вести себя так, как они себя вели, если бы участвовали в ситуации, требующей навы ка, увеличиваем ли мы вероятность появления ориентации навы ка; то есть стимулируем ли мы иллюзию контроля. Таким образом, нуж ­ но уметь ввести любой из выше упомянутых аспектов ситуации навы ка, выбор, стимул или обычностьреакции, пассивное или активное вмешатель­ ство, конкуренция, - в ситуацию, определяемую случаем, где участники боль­ ш е не влияю т на исход и случайное поведение, более соответствующие собы­ тию, требующему навы ка. Серьезное испы тание этой гипотезы - внедрение этих факторов в ситуа­ ции такие, к ак лотереи, где исходы полностью определены случаем. Если эти ф акторы успешно стимулирую т иллю зию контроля в этих механичес­ ких ситуациях, то их влияние должно быть гораздо большим, когда они пред­ ставлены в ситуации, где уж е имеется элемент контроля.... Иллюзия контроля 267 Э к сп ер и м ен т 1: В л и ян и е к о н к у р ен ц и и н а и л л ю зи ю к о н тр о л я Так к ак люди часто вовлекаю тся в конкуренцию , когда они оценивают свои навы ки, вероятно, что введение этого связанного с навыком фактора в ситу­ ации случая стимулирует иллюзию контроля. Количество контроля, кото­ рое человек фактически проявляет в создании успешного исхода в квали­ фицированном соревновании, изменяется к ак ф ункция способности против­ ника. Если люди реагируют на случайные события, в которых имеется кон­ куренция, к ак будто эти события были определены навыком, тогда иллю ­ зи я контроля долж на такж е измениться к ак ф ункция характеристик про­ тивника. В следующем исследовании испытуемые конкурирую т в случайной за­ даче против либо привлекательного, самоуверенного человека или неуклю ­ ж его и нервного человека. Если на задачу реагирую т, к ак будто исходы не поддается контролю , то факторы , отличные от вероятности победы, играют большую роль во влиянии на ставки испытуемых. При таких обстоятель­ ствах испытуемые, ставят на кон много при конкуренции против уверенно­ го человека либо потому что он, к ак ож идается, поставит много, и испытуе­ мые хотят казаться подобными ему, либо потому что риск ценится в нашем обществе (W allach и W ing, 1968). Испытуемые могут такж е поставить мно­ го при игре против неуклю жего человека, чтобы казаться отличным от него или, опять ж е, потому что риск ценится. Однако они могут такж е поставить меньш е, держ а пари против неуклю ж его человека, потому что он, к ак ож и­ дается, поставит меньш е, и таким образом, испытуемые, рискую т меньше, но все еще считаю тся азартны ми. В любом случае, испытуемые не должны ставить больше против неуклю жего человека, чем против уверенного в себе противника. С другой стороны, если, к ак было спрогнозировано, конкурен­ ц и я стимулирует ориентацию навы ка, то испытуемые будут держ ать пари на основе вероятности победы. Чем менее компетентен противник, тем бо­ лее вероятно, что человек победит, следовательно, испытуемые должны ста­ вить больше при конкуренции против неуклю жего человека, чем при кон­ куренции против уверенного в себе человека. М ет од Испытуемые: 36 студентов старших курсов мужского пола, зарегистрированных на вводном курсе психологии в Йельском университете. Они были привлечены через рек­ ламное объявление, которое предлагало зачет и шанс выиграть деньги за участие в ис­ следовании, посвященном связям между когнитивными и физиологическими реакци­ ями. Они были наугад распределены в одну из двух экспериментальных групп по 18 испытуемых в каждой. Процедура. Когда испытуемый входил в комнату, в которой должен был проходить эксперимент, он находил ожидающего его противника, который был другим испытуе­ мым. Противник, студент-старшекурсник мужского пола, не знающий об эксперимен­ 268 КОВАРИАЦИЯ И КОНТРОЛЬ тальной гипотезе, играл роль либо уверенного, либо неуверенного в себе человека (изоб­ ражающий щеголя или растяпу). Условие - противник щеголь. При этом условии противник был уверенным и общи­ тельным человеком, одетым в хорошо сидящую спортивную куртку. Он представлялся испытуемому и указал на записку, находящуюся в комнате. В записке говорилось, что экспериментатор скоро вернется, а также, чтобы испытуемые заполнили за это время краткую анкету. Чтобы показалось, что исследование касается психологических воп­ росов, в анкетном опросе спрашивалось относительно диеты, болезней в семье и т.п. Испытуемый и противник заполняли анкеты и общались в течение приблизительно 10 минут. Беседа была логически структурирована, но сосредоточена, главным образом, на спортивных событиях. После этого взаимодействия противник беспечно стучал в сте­ ну, которая отделила его и испытуемого от экспериментатора, чтоб дать знак возвра­ щаться в комнату. Условие - противник растяпа . При этом условии противник был довольно застен­ чивым, вел себя неловко, нервно подергивался, и был одет в спортивное пальто, кото­ рое было слишком мало для него. Во всех остальных отношениях события были иден­ тичны условию противник-щеголь. В обоих условиях противник снимал пальто прежде, чем экспериментатор входила в комнату. После того, как были принесены извинения за опоздание, экспериментатор просила испытуемых сесть и не разговаривать, в то время как она подготавливала ма­ териалы для исследования. Используя эти меры, было возможно заставить экспери­ ментатора не принимать во внимание предшествующую экспериментальную манипу­ ляцию. Испытуемый и противник сидели за столом, лицом друг к другу. После того, как экспериментатор положила на стол датчик напряжения, спирт, марлевые губки, электроды, электродный гель и ленту, она дала следующие инструкции: Мы интересуемся влияниями некоторых моторных и когнитивных реакций на психологические реакции. В частности, мы интересуемся изменениями сопро­ тивления кожи как функцией напряженных и не напряженных задач. Исследо­ вание было разработано так, чтобы Вы получили от него удовольствие, в то вре­ мя как я получаю информацию, в которой нуждаюсь. У вас будет возможность, либо выигрывать, либо проиграть деньги, это должно быть весело, но нет ника­ кой гарантии, что вы выйдете отсюда, получив дополнительные деньги. Хоро­ шо, теперь первое, что я попрошу вас сделать, это чтобы вы примотали лентой электроды к вашим рукам. Я хочу поместить ее на руку, которой вы не пишете. Вы правша или левша? Не волнуйтесь, это не причинит вреда. (Экспериментатор приматывает лентой электроды, включает в розетку датчик, и приносит колоду игральных карт.) Первое задание - игра в карты. Правила таковы: вы будете выбирать карту из колоды, и кто выберет более высокую, тот побеждает в этом раунде. Будет 4 ра­ унда, и перед каждым вы запишете, сколько вы ставите на кон. Вы можете ста­ вить где-то от 0 до 25 центов в каждом раунде. Вы покажете ваши ставки мне, но не друг другу. Не смотрите на карту, которую вы выбираете. Таким образом, ваши ставки и исходы не будут влиять на ваши психологические реакции в следую­ щей задаче. Позже я переверну карты и подсчитаю, сколько было выиграно или проиграно, с каждым из Вас индивидуально. Пари заключается только между одним из вас и мной непосредственно, так что если Вы побеждаете, я плачу вам, а если Вы проигрываете, вы платите мне либо в деньгах, либо временем. Вы хо­ тите участвовать? (Противник быстро отвечает “конечно!”) Хорошо, теперь, мы можем начинать. Не записывайте, сколько вы поставили на кон, пока я не ска­ жу, чтобы я могла прочитать базовую линию на аппаратуре. Экспериментатор тогда попросила испытуемых записать ставки и показать их ей. Иллюзия контроля 269 Ставки были записаны, и затем испытуемые, поочередно тянули карту и, по просьбе экспериментатора, одновременно показывали их ей, она записывала исход и затем клала карты рубашкой вверх на ближайший стол. Перед каждым шагом экспериментатор делала запись колебаний сопротивления кожи. Процедура повторялась для четырех попыток. Зависимые измерения и проверка манипуляции. В качестве зависимого измерения вы­ ступало количество денег, которые испытуемые ставили на кон в каждом раунде. После того, как игра в карты была закончена, испытуемым сказали, что следующая задача будет проведена индивидуально, поэтому одному из испытуемых необходимо пройти в другую комнату, где другой экспериментатор даст ему инструкции. Им также сказали, что как только этот эксперимент закончится, этот экспериментатор сообщит другому экспериментатору об исходе карточной игры так, чтобы долги могли быть ула­ жены. Экспериментатор просил противника уйти и попрощаться с испытуемым, так как их объединенное участие было закончено. Каждому испытуемому тогда дали видо­ измененную задачу так, чтобы он выиграл приблизительно $2, независимо от его пре­ дыдущих ставок. Испытуемый исследовал сосуд с бобами и оценивал их количество, в то время как экспериментатор регистрировал колебания сопротивления кожи. Тогда испытуемому предлагали другую анкету, которая была психологической по характе­ ру. После того, как его спросили, имело ли присутствие другого испытуемого какоелибо влияние на его психологические реакции, его попросили оценить другого испыту­ емого по шестибальной шкале в пределах от 1 (не очень компетентный в межличност­ ном взаимодействии) к 6 (очень компетентного в межличностном взаимодействии). Ос­ тавшиеся вопросы были пунктами-наполнителями, которые имели отношение к пси­ хологическим вопросам. После того, как эти измерения были получены, всех испытуе­ мых поблагодарили и попросили позвонить автору в следующем месяце, если они хоте­ ли узнать цель и результаты исследования. Р езульт ат ы Перед исследованием, действительно ли количество поставленных на кон денег варьировалось к ак ф ункция компетентности противника, важ но удо­ стовериться, что противник был действительно воспринят по-разному в двух условиях. Средняя оценка компетентности противника была 4.8, при усло­ вии противник-щ еголь, и 3.17 при условии растяпа. П рактически не было пересечений меж ду двумя условиями. Различие меж ду двумя средними значениями значительно (t = 5.46, р < 0.005). Поэтому, можно сказать, что испытуемые при условии противник-щ еголь видели себя конкурирую щ и­ ми против более компетентного человека, чем испытуемые в условии растя­ па. Давайте вспомним, что испытуемые могли делать ставки в размере от 0 до 25 центов в каж дом из четырех раундов пари. Эти четыре ставки были усреднены, чтобы дать отдельный счет для каждого испытуемого. Средняя ставка для испытуемых при условии противник-щ еголь была 11.04 цента по сравнению с 16.25 центов для испы туемы х в условии растяпы (t = 2.39, р < 0 .0 2 5 ). Различием еж ду этими двумя группами должно быть даже более очевидно, когда мы исследуем первые сделанные ставки, так к ак первый тур пари наиболее близко соответствовал экспериментальной манипуляции. 270 КОВАРИАЦИЯ И КОНТРОЛЬ Средняя первая ставка для условия противник-щ еголь была 9.28, в то вре­ м я к а к средн яя п ервая ставка для условия растяпы бы ла 16.72 (t = 3.16, р < 0.005). Концептуальное испытание манипуляции. Чтобы проверить предположе­ ние, что испытуемые из Йельского университета ожидают, что привлекатель­ ны й противник поставит больше, чем непривлекательный, две анкеты были предъявлены случайным выборкам старш еклассников Йельского универси­ тета. В первой анкете были описаны задача и участники, и испытуемых спро­ сили, кто, к ак они думали, поставит на кон больше. Двенадцать из 16 испы­ туемых предположили, что привлекательный человек поставит на кон боль­ ш е (хг —4, р < 0.05). Во второй анкете описывалась задача, и у людей спроси­ ли, сколько бы они поставили на кон при каждом испытании. Все 15 человек опрошенных испытуемых ответили - максимальную ставку (25 центов). Эксперимент 2: Влияние выбора на иллюзию контроля И снова мы предположили, что, когда случайная ситуация уподобляется ситуации навы ка, люди ведут себя, к ак будто они контролирую т неуправ­ ляемое событие, даж е когда ф акт, что успех или неудача зависят от случая, сущ ественен. Л отерея обеспечивает идеальное средство для исследования иллю зии контроля, потому что, кроме реш ения покупать билет или нет, исход полностью управляется случаем. Если бы человек мог управлять ис­ ходом лотереи, можно было бы увеличить вероятность выбора билета. Этот билет имел бы тогда большую ценность, чем билет, принадлеж ащ ий чело­ веку без этого контроля. И если бы он имел большую ценность, можно было бы требовать большую цену от потенциального покупателя. В следующем исследовании лотерея проводилась чтобы, оценить влия­ ние выбора, - важ ны й ф актор в ситуации навы ка, - на иллю зию контроля. Бы ло спрогнозировано, что испытуемые, которым давали выбрать лотерей­ ный билет, потребуют более высокой цены за него. М ет од Испытуемые. Билеты лотереи были доступны служащим офиса мужского и женского пола, которые работали в одной из двух фирм, расположенных в Лонг-Айленде, стра­ ховом агентстве и производственной компании.1 Так как различные розыгрыши и спортивные фонды были не редкостью в этих офисах, оправдания для проведения дан­ ной лотереи были не нужны. За исключением четырех женщин, все служащие, к кото­ рым подходил агент, распространяющий лотерейные билеты, купили билет. Испытуе­ мых наугад разделили на группы так, что в итоге было 24 мужчины и 3 женщины в условии выбора и 23 мужчины и 3 женщины в условии без выбора. Фирмы пожелали остаться анонимными Иллюзия контроля 271 Материалы . Билеты лотереи были стандартными 4x2 дюйма (10.16 х 5.08 см) футбольными карточками. На каждом билете был изображен известный футболист, его имя и его команда. Карточки были упорядочены по алфавиту сначала по названию ко­ манды, а затем по имени отдельного игрока. Было два одинаковых набора билетов из 227 футбольных карточек. Каждый испытуемый хранил у себя билет из одного набора, атакой же билет из другого набора был отложен в картонную коробку, из которой побе­ дивший билет был бы позже отобран. Процедура . Лотерея проводилась служащим страхового агентства мужского пола и служащим производственной фирмы женского пола за неделю до игры Суперкубка 1973 г. Оба экспериментатора не знали о гипотезе эксперимента. Каждый из них подходил к служащим соответствующего офиса и спрашивал их, не хотят ли они купить лотерей­ ный билет, стоимостью $ 1. Испытуемым сказали, что билеты продавались также в другом офисе (говорилось название другого офиса) и что полный выигрыш, приблизи­ тельно $ 50, уйдет победителю. Испытуемым также сообщили дату розыгрыша. Согла­ сившись участвовать в лотерее, первому испытуемому была дана коробка с билетами, и ему (ей) сказали выбрать билет(ы), какой(ие) ему(ей) больше нравился(ись). Испытуе­ мые называли билет так, чтобы экспериментатор мог выбрать тот же самый билет из второго набора и положить его в закрытую картонную коробку. В это время экспери­ ментатор также записывал имя испытуемого и выбранный им билет. Со вторым испы­ туемым повторили ту же процедуру, за исключением того, что после согласия принять участие в лотерее, ему давали карточку, которая соответствовала выбору предшеству­ ющего испытуемого. Испытуемые были, таким образом, в условии выбора или усло­ вии без выбора. На следующий день после того, как билеты были проданы в одном офи­ се, та же самая процедура была выполнена во втором офисе. Зависимые измерения. Ко всем испытуемым индивидуально подходил экспериментатор, у которого они купили билет, в утро розыгрыша лотереи. Каждому из них сказали: “Один человек в другом офисе хотел принять участие в лотерее, но так как я больше не продаю билеты, он спросил меня, чтобы я выяснил, за сколько Вы бы продали свой билет. Для меня это совершенно не важно, но какую цифру я должен сообщить ему?” Указанная сумма составила зависимое измерение. Если испытуемый говорил, что он не будет прода­ вать билет, экспериментатор был проинструктирован, чтобы подталкивать его, пока он не назовет сумму, и затем делать запись ответа “не продаст” рядом с количеством, кото­ рое он наконец предложил. Р езульт ат ы К ак было спрогнозировано, м анипуляция выбора имела значительное вли­ яние на цену билета лотереи. Среднее количество денег, за которое испы ­ туемы й хотел продать свой билет было $ 8.67 в условии вы бора, и только $ 1.96 в условии без выбора (t = 4.33, р < 0.005). Х отя их спраш ивали, за сколько они продадут свой билет, а не, хотят ли они его продать, 15 испыту­ емых первоначально ответили, что они его не продают. Из них 10 испытуе­ мы х были в условии выбора и 5 - в условии без выбора (р < 0.10). Упомяну­ тое различие не являлось просто функцией сумм, указанны х этими испы ­ туемыми после понуж дения, так к ак их ответы располагались от $ 3 до пол­ ной суммы вы игры ш а в $ 53, причем только 3 испытуемых были в после­ дней категории. 272 КОВАРИАЦИЯ И КОНТРОЛЬ Не будучи особенным образом проверенным до последующего исследо­ вания, один из результатов, полученных в этом исследовании, касается вли­ ян и я осведомленности на иллю зию контроля. Ж енщ ины не столь знакомы ­ ми с игрой в футбол, к ак мужчины. Следовательно, менее вероятно, что они согласятся играть в лотерею, а если они все ж е согласятся, они долж ны тре­ бовать меньш его количества денег, за свой билет. Н ужно вспомнить, что только 4 человека отказались участвовать в лотерее, и что все они были ж ен­ щ инами. И з шести ж енщ ин, которые согласились участвовать в лотерее, четы ре попросили $ 1, и две попросили $ 2 за свои билеты. Таким образом, средняя сумма для ж енщ ин была $ 1.33,посравнению с $ 5.89 для мужчин (t = 2.14, р < 0 .0 5 ).... В ы вод ы и и х зн а ч е н и е д л я п р а к т и к и Н а основе только что предоставленных сведений, каж ется, что испытуемые не отличаю т событий, определенных случаем, от событий, определенных навы кам и так, к ак предложено их определениями. Объективное непредви­ денное обстоятельство не является критической переменной, определяющей поведение испытуемых. Вместо этого, они реагирую т на событие так, к ак будто оно является управляемы м, в значительной степени зависит от ф ак­ торов таких к ак конкуренция, выбор, знакомство с ситуацией и вовлече­ ние, которы е могут быть ортогональными по отношению к ф актическому непредвиденному обстоятельству. К ак было показано, это очень важ но даже в ситуациях, которые управляю тся случаем, таких к ак лотерея.... Почему это происходит? Люди заинтересованы в том, чтобы управлять своей окруж аю щ ей средой. Важность контроля в этом контексте ш ироко обсуждалась как психиатрами, так и исследователями в области социальных наук. Рассматривается ли это к ак потребность в компетентности (W hite, 1959), инстинкт обладания (H endrick, 1943), стремление к превосходству (A d ler, 1930) и ли стрем лен и я к личной причинной обусловленности (deCharm s, 1968), большинство социологов согласны с тем, что человек за­ интересован в том, чтобы управлять своей окружаю щ ей средой, и полная власть вклю чила бы способность “победить случай”, то есть управлять слу­ чайны ми событиями. Чем труднее проблема, тем более компетентным чув­ ствует себя человек в способности реш ить ее. Поэтому самое большое удов­ летворение или чувство компетентности следовали бы из способности уп­ равлять тем, что не поддается контролю .... В дополнение к заинтересованности в управлении, сущ ествует другая причина для отсутствия различения между управляемыми и не поддающи­ м ися контролю событиями. Это то, что навы к и случайные факторы близко связаны в опыте людей. То есть существует не только заинтересованность в том, чтобы не различать их, но и сущ ествует трудность в различении, так к ак в каж дой ситуации навы ка присутствует элемент случая, и элемент навы ка присутствует почти в каж дой ситуации случая. Первое, очевидно и Иллюзия контроля 273 не нуж дается ни в каком дальнейш ем объяснении. Примеры второго - это знание того, какую ставку лучш е сделать в игре в кости (то есть, знание ве­ роятности) или знание, каки е игорные автоматы могут дать самый высо­ кий вы игры ш .... 17. Результаты тестов - такие, какими Вы их себе представляете* Лорен Дж. Чепман и Джин Чепман К аж ды й день психиатры и клинические психологи долж ны приним ать ж изненны е реш ения: Какова его проблема? Нужно ли его поместить в психиатрическую боль­ ницу? Есть ли действительно риск, что он совершит убийство или само­ убийство? Этого пациента уже можно выписывать или он должен остать­ ся? Д ля помощи в этих реш ениях клинические психологи почти всегда ис­ пользую т психологические тесты. Согласно обзору Н ормана Сандберга (N orm an Sundberg), два наиболее ш ироко используемые теста - тест чернильных пятен Рорш аха и тест “Р и ­ сунок человека” (ТРЧ). Оба теста - проективные, основанные на предпосыл­ ке, что человек проектирует часть своей личности, когда он реагирует на неоднозначную, неструктурированную ситуацию . Н апример, так к ак нет н икаких объективных форм в тесте Рорш аха, то, что человек в нем видит, возможно, отраж ает его собственные стимулы, конф ликты и индивидуаль­ ность. Точно так ж е, когда кто-либо рисует человека на чистом листе бума­ ги , он, к ак предполагаю т, проектирует часть себя в свое творение. С о б ств ен н ая л и ч н о с ть Н аш е недавнее исследование говорит, что тесты Рорш аха и ТРЧ могут быть проективны ми более, чем в одном направлении. В интерпретации резуль­ татов этих тестов, среднестатистический клинический психолог может про­ ектировать свои собственные предубеждения и предположения в свое опи­ сание пациента. *Эта книга первоначально появилась в Psychology Today, ноябрь 1971, стр. 18-22,106-110. Авторское право ©. 1971 Ziff-Davis Publishing Со. Переиздано в соответствии с разрешени­ ем. Результаты тестов... 275 Н аш и первые исследования в этой области были с рисуночным тестом, в котором клинический психолог дает испытуемому карандаш и чистый лист бумаги и просит, чтобы он нарисовал человека. К арен М ачовер (K aren M achover) издала этот тест в 1949. Она описала рисунки, обычно нарисо­ ванны е людьми с различны ми эмоциональными проблемами, и объяснила, к ак интерпретировать несколько характеристик рисунков к ак клю чей к индивидуальности. Она сказала, например, что “человек, больной параной­ ей, придает много графического акцента глазам ”, и “человеку того пола, у которого нарисована голова большого размера предоставлена больш ая ин­ теллектуальная и социальная власть”. Руководство к тестам М аховер отмечено далеко идущ ими обобщениями относительно того, какие виды людей рисуют каки е виды рисунков, но она представила очень мало подтверждаю щ их данных. Ч асти тел а Н екоторые клинические психологи не ж елали принимать на веру работу Мачовер; они проверили ее утверж дения экспериментально. Ж ю ль Холзберг (Jules H olzberg) и Мюррей Векслер (M urray W exler), например, пробо­ вали определить, действительно ли люди, больные паранойей, лучш е про­ рисовывают глаза. Они сравнили рисунки 18 пациентов, больных паранои­ дальной ш изофренией и 76 студентов, обучаю щ ихся на медсестер, но не наш ли никакого различия в том, к ак эти две группы рисовали глаза. М ножество подобных исследований проверили прогнозы М аховер отно­ сительно других рисуночных характеристик - головы, уш ей, губ, волос, одежды, рта, и т.д., — но снова и снова признаки ТРЧ не были подтвержде­ ны. Н есколько экспериментаторов обнаружили, что более уравновешенные испытуемые имеют тенденцию рисовать более полные рисунки, но главное заклю чение из данны х исследования - то, что определенное содержание рисунка не валидны й показатель характеристик личности. П р и зн а к Необходимо указать, что этот тип исследования не требует совершенной дискриминации. Если 50 процентов гомосексуалистов рисуют фигуры од­ ним способом, и только 25 процентов других людей рисует фигуры этим ж е способом, характеристика рисунка может все еще рассматриваться как ва­ лидны й диагностический признак, так к ак в конечном счете, он может вне­ сти информацию к диагнозу гомосексуализма. Больш инство клинических психологов знает об исследованиях, показы ­ ваю щ их, что признаки ТРЧ недействительны, все ж е многие ты сячи про­ должаю т использовать тест регулярно, потому что они заявляю т, что при­ знаки работают в их собственной клинической практике. “Я буду скорее доверять своим собственным чувствам, чем некоторой статье из ж урнала”, - 276 КОВАРИАЦИЯ И КОНТРОЛЬ сказал один клинический психолог. “Я знаю , что больные паранойей, к а ­ ж ется, не рисую т большие глаза в исследовательских лабораториях, - ска­ зал другой, - “ но они точно рисуют их в моем кабинете”. И л л ю зи я Некоторые кри тики говорят, что клинические психологи так захвачены своими теориями и традициями, что они не замечают фактов. Мы думаем, что сущ ествует другое объяснение. Клинический психолог, который про­ долж ает доверять ТРЧ, даж е если ему представить очевидные опроверже­ н ия, мож ет испы ты вать ложную корреляцию, явление, которое мы обнару­ ж или несколько лет назад в исследовании относительно словесных ассоци­ аций. Мы обнаружили, что слова, которые тесно связаны друг с другом, замеча­ ются вместе чащ е чем, это действительно бывает. В этих экспериментах ис­ пытуемый сидел на удобном стуле, в то время, к ак мы проектировали раз­ личны е пары слов (например, бекон — тигр) на большой экран перед ним. Пары слов менялись каж ды е две секунды. Слово с левой стороны пары было всегда одно из четырех возможных слов: бекон, лев, бутоны или лодка. К аж ­ дое слово появилось так ж е часто, как любое другое (25% ), но оно оказы ва­ лось всегда на левой стороне экрана. Слово на правой стороне пары было яйца, тигр или тетрадь с равной вероятностью появления. Мы систематизировали пары слов так, чтобы каж дое слово с левой сто­ роной появилось равное количество раз с каж ды м словом с правой сторо­ ной. Н апример, когда слово бекон появлялось на левой стороне, слово яйцо было в паре с ним в одной третьей части испы таний, тигр в другой трети испы таний, а тетрадь — в оставш ейся трети. Но когда мы позж е спросили испытуемых относительно пар слов, они сказали, что, когда слово бекон появлялось слева, слово яйца ш ло с ним в паре 47% от времени, и что, когда лев был слева, тигр был тем словом, которое наиболее часто появлялось справа. Д аж е при том, что каж дая пара слов появлялась так ж е часто, как лю бая другая, испытуемые заявляли , что пары с сильной вербальной ассо­ циацией появлялись более часто, чем другие. Мы назвали тенденцию видеть две вещ и, появляю щ имися вместе более часто, чем они ф актически появляю тся, ложной корреляцией. Видимо, имеется существенное подобие между студентами, которые за­ являю т, что некоторые слова появляю тся вместе чащ е, чем на самом деле, и клиническим и психологами, которые утверждаю т, что видели валидность в признаках теста ТРЧ, когда исследование говорит, что ее нет. И н терп ретац и я П ризнаки ТРЧ и интерпретации могут отличаться сегодня от того, каким и они бы ли, когда М аховер представила тест, более чем 20 лет назад. Поэтому Результаты тестов... 277 мы спросили современных учены х, к ак они используют тест. Мы послали анкетные опросы 110 клиническим психологам, которые являлись лидера­ ми в диагностическом тестировании. Мы написали краткие описания шес­ ти типов пациентов и попросили, чтобы каж ды й психолог сообщил нам, каки е характеристики он видел в рисунках каждого. Эти ш есть описаний были: (1) “он обеспокоен тем, насколько он муж ественный,” (2) “он подо­ зрителен к другим лю дям”, (3) “он обеспокоен тем, насколько он умен”, (4) “он обеспокоен тем, что его корм ят и о нем заботятся другие лю ди”, (5) “у него были проблемы с сексуальной потенцией” и (6) “он очень обеспокоен тем, что люди говорят о нем плохо”. Мы попросили психологов определить в каж дом случае, какой пациент, нарисовал какого человека. Мы получили 44 заполненных анкеты , и было ясно, что психологи со­ глаш ались друг с другом относительно характеристик рисунка, которые они видели в каж дом случае. Например, большинство психологов (91% ) сказа­ ло, что подозрительный пациент будет рисовать большие или необычные глаза. 82% сказали, что человек, обеспокоенный своим интеллектуальны м уровнем, будет иметь тенденцию рисовать большую или выделенную голо­ ву (см. табл. 1). Согласие не было абсолютным, но было внуш ительным. Вообще, психо­ логи согласились по поводу двух или трех характеристик рисунка, которых они будут ож идать от каж дого типа пациента. П ары Больш инство психологов имело кандидатскую степень и в среднем 8,4 лет опыта в психодиагностике. Интересно, каки е признаки ТРЧ обнаружили бы наблю датели, у которы х не было почти никакого опыта. Чтобы выяснять это, мы собрали 45 рисунков мужских фигур - 35, нарисо­ ванных психическими больными в близлежащей государственной больнице и 10 рисунков, выполненные аспирантами в области клинической психологии. Мы измерили размер головы в каждом рисунке, размер глаз и т.д., и попросили не­ зависимых людей оценить рисунки на предмет более субъективных характери­ стик, таких как муже- или женоподобие. К каж дом у рисунку мы прилож или два из ш ести диагнозов, которые мы вы сы лали психологам - например, “человек, который нарисовал это: (1) подозрителен к другим лю дям и (2) имел проблемы с сексуальной потенци­ ей”. Имелось 15 отличных пар, которые могли быть получены из этих ш ес­ ти утверж дений, так что мы использовали каж дую пару на трех различны х картинах. Мы приписывали диагнозы систематически всем типам рисунков. Н апри­ мер, предложение: “он обеспокоен тем, насколько он умен” появлялась так ж е часто на рисунках с маленькими головами, к ак и на рисунках с большими головами. 278 КОВАРИАЦИЯ И КОНТРОЛЬ Затем мы отобрали группу студентов колледж а и выбрали 108 человек, которы е заявили, что они никогда не слыш али о рисуночных тестах и не знаю т ничего относительно того, к ак они интерпретирую тся. Мы опросили студентов в группах. Перед каж ды м опросом мы кратко объяснили суть ТРЧ . Мы сказали, что студент увидит ряд рисунков, н аря­ ду с кратким и утверж дениями относительно диагноза людей, которые на­ рисовали их. Мы сказали, что у многих людей были одинаковые проблемы, и что студенты долж ны тщ ательно исследовать картинки и поискать общие характеристики в рисунках людей с одинаковой проблемой. Студенты про­ смотрели рисунки в заранее спланированном случайном порядке, останав­ ливаясь на каж дом в течение 30 секунд. Подтверждение Х отя мы тщ ательно сбалансировали картинки и диагнозы так, чтобы не было н икаки х объективны х связей между ними, почти каж ды й испытуемый со­ общ ил, что он видел эти связи. И связи, которые студенты обнаружили, были подобны тем, которы е видели психологи в своей еж едневной практике. Имелись некоторые различия, конечно, но студенты имели тенденцию опи­ сы вать обычный рисунок каж дого типа пациента в тех ж е самых терминах, которы е использовали психологи. И в случае студентов, мы знаем, что при­ знаки были иллю зорны, потому что о них не сообщалось в данных. Наш е предыдущее исследование относительно пар слов предлагает объяс­ нение: вспомните, что мы обнаружили, что слова с сильными ассоциатив­ ными связям и имеют тенденцию быть замеченными появляю щ имися вме­ сте. Возможно, тот ж е самый механизм был и у признаков ТРЧ. Мы прове­ ли анкетны й опрос по ассоциации слов, чтобы определить, к ак близко обла­ сти симптома (подозрительность, интеллект, импотенция, и т.д.) связаны с различны ми частями тела (глаза, голова, половые органы, мускулы, и т.д.). Вопросы им ели следующую форму: “Тенденция слова ПОДОЗРИТЕЛЬ­ НОСТЬ ассоциироваться со словом ГОЛОВА (1) очень сильная, (2) сильная, (3) умеренная, (4) м аленькая, (5) очень м аленькая, (6) никакой тенденции нет вообще”. Мы провели анкетны й опрос 45 студентов, которые не участвовали в дру­ гих частях эксперимента. Вербальные ассоциации, о которых они сообщи­ ли, четко совпадали с ложными корреляциям и, которые “наивны е” студен­ ты видели между характеристиками рисунка и симптомами. Устные ассо­ циации даж е более близко совпадали с корреляциям и, о которых сообщали практикую щ ие психологи. О плата В наш ем следующем эксперименте мы опросили 56 человек в течение трех дней подряд, чтобы увидеть, осознают ли они, что нет никакой истинной 13 о 64 18 гН тН СЧ1 СО гН X о 14 25 Cg О cg 55 cg cg 23 Cg тН со ьX о о 21 39 Я О о cg 68 о о cg 32 о 00 СО 55 гН о СО 21 тН тН Я о О 82 О о о cg cg о со С О тН х о X 44 cg Я о тН О) о fc - о 55 18 о о ю о х о 17 Я 00 о о о о тН о О Ч И £& *к в & гЧ g cg я яо ч а> Я 3 я М ю Я m о I Ен со tsi 3л § ю § Рч 3 & я Я SS И 3 ю & о 3 о мо Я 1 8.S X Я Я со о Qi Я »Е4* ё О лЕ* О О О м Я о R я Я2 я Ен 3 о ю Я о о о и 22 52 х 23 26 1 43 о О) 58 Я 00 детскость обеспокоенные имели обеспокоентем, что их проблемы ные тем, кормят и о них с потен- что люди заботятся другие цией говорят о о о 31 1 О х 25 обеспокоенные, насколько они умны a СО 76 обеспокоен- подозрительно ные, наотносятся к сколько они другим людям мужественны a § 3 о 3 зW СО 3 Я Ä от характеристики рисунков Результаты тестов. 279 тН КОВАРИАЦИЯ И КОНТРОЛЬ СО 00 о о о 1—1 о СМ о о о о о со СО см о 27 см м* гН тН ь- см о 23 со 18 280 о о о СО ° О t- о о CÖ со см о о g ^ 00 со см о см «S ° о СМ СО см см см со 00 со см см о 00 о см OS ю s й о Я IgggS в. S Я 81 ö и ^ CM -J о СО f t О тИ о И и О « ю гН ft ф g ® Результаты тестов... 281 корреляции между признаками и рисунками, если предоставить им возмож­ ность увидеть материалы тестирования больше, чем один раз. Корреляции наблюдались так ж е отчетливо в третий день, к ак и в первый. Мы начали понимать, насколько сильной может быть лож ная корреляция, и поинтере­ совались, каки е условия, если таковые вообще имею тся, позволят преодо­ леть ее. Мы опросили еще 41 человека индивидуально и позволили каждому смот­ реть на рисунок, так долго, сколько он хотел. Чтобы поощрить их изучать ри­ сунки тщательнее, мы предложили $ 20 студенту, чьи оценки будут наиболее точными. Это не сработало. Студенты видели лож ные корреляции так ж е настоя­ тельно, к ак всегда. Н аконец мы остановились и дали испытуемым все возможности, кото­ рые могли только придумать, чтобы они могли проверить свое собственное восприятие. Мы предложили каж дому испытуемому все множество рисун­ ков, чтобы он сам их изучил; мы сказали ему, что он может смотреть на них в любом порядке столько времени, сколько он хотел. Он мог расклады вать рисунки в стопки и делать прямы е сравнения. Он мог помесить все рисун­ ки , сделанные подозрительными людьми, в одну стопку и искать подобие в них. Мы дали каж дому испытуемому бумагу для заметок, карандаш и ли­ нейку; мы снова предложили $ 20 человеку, чьи оценки будут наиболее точ­ ны , и мы дали каж дому испытуемому копию заклю чительного анкетного опроса, так что он мог видеть то, на каки е вопросы ему придется отвечать. М у ж ествен н о сть В этих условиях лож ная корреляция понизилась значительно для большин­ ства признаков, но она не исчезла. Н апример, в нормальных условиях 76% студентов видели связи между людьми, волную щ имся о своей мужествен­ ности и тенденцией рисовать мускулисты е фигуры; в новых условиях, 45% все ещ е заявляли, что они видели связи, которых там не было. Л ож ная кор­ реляция сильна и примечательно стойка к любым попы ткам изменить ее. Студенты даж е утверждают, что видели типичные корреляции, когда ри­ сунки были сложены в противоположном направлении. В одном исследова­ нии, например, мы поместили утверждение, “Его волнует его уровень интел­ лекта” только на рисунках с маленькими головами; утверждение относитель­ но подозрительности появлялось исключительно на рисунках с маленькими глазами, и т. д. Это несколько уменьшило иллюзорную корреляцию , но не ус­ транило это. Ш естнадцать процентов все равно заявили, что пациенты, кото­ рых волновал их уровень интеллекта, рисовали фигуры с большой головой, а 50% все еще видели отношения между людьми, волнующимися относитель­ но мужественности, и тенденцией рисовать мускулистые фигуры - даже при том, что истинные связи были противоположными. 282 КОВАРИАЦИЯ И КОНТРОЛЬ И з наш его исследования очевидно, что клинические интерпретации ТРЧ содержат сильны й компонент иллю зорной корреляции. И реш ения, кото­ ры е принимаю т психологи относительно их пациентов, могут быть проек­ цией собственных предвзяты х мнений. П ятн а Интересно, присутствовали ли иллю зорные корреляции в наиболее попу­ лярном испы тании из всех - чернильные пятна Рорш аха - и если так, будут ли они замечены так ж е ясно, к ак и истинные корреляции, те немногие при­ знаки Рорш аха, которые считаю тся валидными индикаторами некоторых характеристик личности. В 50-летней истории теста Рорш аха, многие психологи сообщили, напри­ мер, что определенные ответы даются более часто гомосексуалистами, чем другими людьми. В 1949, Уильям Уилер (W illiam W heeler) суммировал 20 признаков гомосексуализма по Рорш аху. Другие исследователи проверили признаки Уилера, но только 2 из 20 признаков были сочтены валидными бо­ лее, чем одним исследователем. Один из них (номер семь), - реакция на чет­ вертое чернильное пятно, — “человек или животное, искаженное, чудовищ­ ное или угрожаю щ ее.” Другой валидный признак, - восьмой у Уилера, - со­ общение о странной фигуре животного-человека на пятой карте. П р и зн а к и Чтобы исследовать, к ак психологи ф актически используют тест Рорш аха, для диагностики гомосексуализма, мы послали анкету 76 психологам, по­ просив и х, описать две перцепции, которы е гомосексуальные пациенты обычно видят в 10 пятнах Рорш аха. Из психологов, которые возвратили за­ полненные анкетны е опросы, 32 сказали, что они видели протоколы Рор­ ш аха, касаю щ иеся гомосексуалистов. Эти 32 специалиста описали несколь­ ко признаков Рорш аха, но из тех, что они упомянули, наиболее частыми были (1) ягодицы или задний проход, (2) гениталии, (3) ж енская одежда, (4) человеческие фигуры неопределенного пола, без ясны х м уж ских или ж енс­ ки х признаков, и (5) человеческие фигуры, к ак с м уж ским и, так и с ж енс­ ким и признаками. Все это - признаки Уиллера, которые не были подтверж­ дены исследованием. С другой стороны, только два психолога упомянули валидны й признак номер 7 - искаж енная, чудовищ ная фигура, и ни один не упомянул другой валидны й признак, номер 8 — “полу-человеческаяполу-ж ивотная” фигура. Н екоторые психологи видели признаки в тесте Рорш аха, которы х не было, и не могли увидеть признаки, которые там были. И вновь наш е иссле­ дование с вербальными ассоциациями предлагает клю ч к разгадке. Два ва­ лидны х признака не интуитивны: гомосексуализм не ассоциируется ни с ры чащ ими ж ивотны ми, ни с человеко-животными гибридами. Но гомосек­ Результаты тестов... 283 суализм имеет высокую вербальную ассоциацию с пятью признакам и, о ко­ торых клиницисты сообщали наиболее часто. Так или иначе, разумно ож и­ дать, что гомосексуалисты будут склонны видеть ягодицы , женскую одеж­ ду или фигуры неопределенного пола в чернильных пятнах. И деи Мы проверили эти понятия объективно, попросив 34 независимых студен­ тов оценить, к ак сильно слово “гомосексуализм” ассоциирует с различны ­ ми идеями. И х оценки совпадали - популярные, но невалидные признаки имеют более сильную вербальную ассоциацию с гомосексуализмом чем, два непопулярны х, но валидны х признака. Это предполагает, что признаки го­ мосексуализма, которые как утверждают пихологи, они видели в тестах Рор­ ш аха, могли просто отразить их собственные предположения и ож идания. Мы проверили это утверждение с помощью проекта, подобного тому, ко­ торый мы проводили в рисуночном тесте. Мы получили несколько карт Рор­ ш аха, и к каж дой мы прилож или ответ - некоторый образ, который чело­ век, предположительно, заметил на карте. Область карты , которая относи­ лась к ответу, была обведена кругом. Н а некоторых чернильны х пятнах ответ был валидным признаком гомо­ сексуализма (например, “гигант с морщ инистыми рукам и”), на других, от­ вет был невалидным признаком (например, “ш нурованный ж енский кор­ сет”), а на третьих, это был нейтральны й признак (например, “карта Испа­ нии”). Н иже ответа были два описания человека, который проходил тест. Мы выбрали эти описания из всех возможных пар из группы, состоящей из четы­ рех описаний: (1) “он проявляет сексуальное влечение к другим мужчинам”, (2) “он полагает, что другие люди сговорились против него”, (3) “он испыты­ вает грусть и депрессию в течение длительного времени” и (4) “у него силь­ ное чувство собственной неполноценности. ” Мы, конечно, были больше всего заинтересованы первым утверждением. С м еш и в ан и е К ак в исследованиях ТРЧ, мы систематически приписывали утверж дения признака к картам так, чтобы не было н икаких последовательных связей между любым из утверждений и любым признаком. После того, к ак студенты просмотрели несколько карт, мы спросили их, каки е образы увидели пациенты с каж ды м из четы рех типов признаков. Студенты сообщили, что гомосексуалисты более часто видели ягодицы , ге­ ниталии, и т.д ., - то есть, те ж е самые п ять невалидны х признаков, о кото­ ры х сообщили психологи. Ни один из студентов не увидел связи между го­ мосексуализмом и двумя валидны ми признакам и. В более поздней вариации теста мы преднамеренно ввели отрицательную корреляцию в материалы теста, так, чтобы утверждение “Он испытывает 284 КОВАРИАЦИЯ И КОНТРОЛЬ сексуальное влечение к другим муж чинам” никогда не появилось на карте, которая была воспринята к ак ж енская одежда, ягодицы, и т.д. Это не умень­ ш ило ложную корреляцию - студенты видели ее так ж е четко, к ак прежде. С в я зь Эти исследования показываю т насколько легко полагать, что два независи­ мы х события связаны , особенно, когда существует некоторая субъективная вербальная ассоциация между ними. Н аш и испытуемые видели сильные лож ны е корреляции между симптомами и признакам и проективны х тес­ тов в краткой, структурированной задаче. Задача психолога, безусловно, намного сложнее. Проблемы реального пациента многочисленны и неопре­ деленны , - редко когда пациент имеет только два четко определенных при­ зн ака. И реальны е пациенты проявляю т много различны х реакций в про­ ективны х тестах, а не только одну. Такж е вероятно, что в реальной практи­ ке иллю зорные корреляции, которые психолог наблюдает, усиливаю тся со­ общ ениями его коллег-психологов, которые непосредственно подвержены тем ж е самым иллю зиям. Согласие усиливает иллю зии. Н аш им студентам, с другой стороны, не позволяли говорить друг с другом в течение теста, так что каж ды й увидел свои собственные ложные корреляции. Вот почему ве­ роятно, что практикую щ ие психологи имеют дело с лож ными корреляция­ м и, которые являю тся даже более сильны ми, чем те, о которых сообщили наш и испытуемые. Т р у д н о сти Мы не хотим сказать, что клинические психологи некомпетентны или сле­ пы к ф актам , к ак некоторые могли бы заклю чить. Н аш и данные указы ва­ ют не на некомпетентность психолога, а на чрезвычайную трудность его за­ дачи. Психологи подвержены тем ж е иллю зиям , что и другие люди. По ана­ логии, почти все говорят, что две горизонтальны х линии имеют различны е длины , когда они рассматриваю т рисунок М ю ллера-Лайера (M iiller-Lyer): >---------------------------------- ---------------------------------- < <---------------------------------- ---------------------------------- > но никто не назы вает плотника некомпетентным в оценке расстояния про­ сто, потому что он такж е подвержен иллю зии. Психологи должны знать о ложной корреляции, если они хотят избавить­ ся от нее. В идеале, психолог первый, кто должен испытывать такие иллю ­ зии. Н ормальная политика обучения - требовать от каж дого аспиранта в области клинической психологии, побыть наблюдателем в задачах подоб­ ны х тем, которые мы описали. Он мог сам изучать величину и источник лож ­ Результаты тестов... 285 ны х корреляций, которые он испытывает и, таким образом, к ак мы надеем­ ся, научиться принимать меры против таких ошибок в своей клинической практике. Опыт такж е напомнил бы ему, что он склонен ош ибаться, основываясь на чувствах, что его клинические оценки должны постоянно проверяться с помощью объективных измерений, и что его профессиональная задача я в ­ ляется одной из наиболее трудных и сложны х в психологии. 18. Вероятностные рассуждения в клинической медицине: проблемы и возможности* Дэвид М. Эдди В значительной степени, качество и себестоимость здравоохранения опре­ деляю тся реш ениям и, которые принимаю т врачи, чья окончательная цель состоит в том, чтобы разработать и управлять программой лечения для улуч­ ш ения состояние пациента . Больш инство реш ений вклю чаю т много ф акто­ ров, большую неопределенность и трудные вопросы, касаю щ иеся ценнос­ тей. Эта глава рассматривает один из аспектов того, к ак эти реш ения прини­ маю тся, изучая использование вероятностного рассуж дения для анализа специфической проблемы: делать ли биопсию женщ ине, у которой имеется новообразование в груди, которое может быть злокачественным. В частно­ сти, мы изучим, к ак врачи обрабатывают информацию относительно резуль­ татов маммограммы и рентгеновского сним ка для диагностики рака груди. П редоставленные данные показываю т, что врачи не очень хорошо справля­ ю тся с неопределенностью, что многие врачи допускают серьезные ош ибки в вероятностном рассуждении, и что эти ош ибки угрожаю т качеству меди­ цинского обслуж ивания. П р о б л ем а Биопсия груди - не тривиальная процедура. Наиболее обычный вариант (около 80% ) - ампутационная биопсия, при которой подозрительная опу­ холь удалятся хирургическим путем для микроскопической экспертизы и гистологического диагноза патологом. Обычно пациент кладется в больни­ цу и проходит полный набор дооперационных диагностических процедур. Биопсия почти всегда делается под общей анестезией (с вероятностью смер­ ти от анестезии приблизительно в 2 из 10. 000 случаев). Делается малень­ *Подготовка этой книги была поддержана грантом от семейного фонда Генри Дж. Кэйсера. Вероятностные рассуждения... 287 кий (от 1 до 2 дюймов) разрез и удаляется ткань размером от ореха до сливы. Во многих случаях (возможно 1 из 2) потеря ткани практически незаметна; в других - сохраняется небольшое углубление. В редких случаях (возмож­ но 1 из 200) организм подвергается воздействию инф екции, которая может сохраняться в течение нескольких недель. Это стоит приблизительно $700. Эта процедура может быть сделана в амбулаторных условиях и под местной анестезией. К ак альтернативу к ампутационной биопсии, некоторые хирур­ ги предпочитаю т получать образец ткани, используя иглу. Это мож ет быть сделано в амбулаторных условиях, без шрамов или других остаточных эф­ фектов, и гораздо дешевле. Однако по мнению многих врачей, этот опыт яв ­ ляется менее надеж ны м, потому что злокачественное образование может быть пропущ ено. Важный ф актор, который определяет необходимость биопсии - возмож­ ность того, что опухоль в груди - раковая. Чтобы оценить эту возможность, врач может перечислить возможные болезни, оценить частоты, с которыми различны е признаки и симптомы сопутствуют каж дой болезни, сравнить эту информацию с результатами пациентки, оценить вероятность, что у нее есть одна из болезней в списке и провести биопсию, если вероятность рака или другого заболевания достаточно высока. Чтобы помочь врачу, многие учебники описывают, чем доброкачественные болезни отличаю тся от рака. Н апример, следующ ий абзац описы вает одну такую доброкачественную болезнь - мастопатию. Мастопатия часто путается с карциномой груди. Она обычно бывает у рожавших жен­ щин с маленькой грудью. Наиболее часто она встречается в верхнем внешнем квадран­ те, но может находиться в других частях, и, в конечном счете, охватывать всю грудь. Она часто болезненна, особенно в предменструальный период, и обычно сопровождает­ ся менструальными расстройствами. Выделения из сосков, обычно серозные, наблюда­ ются в приблизительно 15% случаев, но отсутствуют какие-либо изменения непосред­ ственно в соске.Новообразование не имеет четко ограниченной формы и не прилегает к коже. Многочисленные кисты плотные, круглой формы и колеблющиеся, а также мо­ гут просвечиваться, если содержат прозрачную жидкость. Большая киста при масто­ патии на ощупь подобна опухоли, но обычно она более гладкая и хорошо ограниченная. Подмышечные лимфоузлы обычно не увеличиваются. При мастопатии редко наблюда­ ются большие синеватые кисты. Чаще наблюдаются многочисленные и маленькие ки­ сты.1(Del Regato, 1970, с. 860-861) Подобные описания существуют для фиброаденомы, жирового некроза, травмы и полдю жины других болезней груди, вплоть до рака. Этот тип вероятностной информации может использоваться, чтобы по­ мочь врачу проанализировать возможные причины новообразования в гру­ ди у пациентки. Рассматривая возможные исходы (например, верно диаг­ ностируя рак, делая ненужную биопсию доброкачественного новообразова­ ния, не делая биопсии и пропуская злокачественные опухоли, и правильно 1В э т и х и последую щ их ц и т а т а х добавлено вы деление курсивом . 288 КОВАРИАЦИЯ И КОНТРОЛЬ реш ая не подвергать биопсии доброкачественные опухоли), врач может оце­ нить вероятность того, что пациентка, с ее специфическими признакам и и симптомами, больна раком, и затем реш ить, к ак действовать дальш е. И спользование маммографии Существуют и другие диагностические процедуры, помогающие врачу оце­ нить вероятность того, что грудное образование отдельно взятой женщ ины является злокачественным. Возможно, наиболее важ ная и обычно исполь­ зуем ая из них - маммография. Суть этого испы тания состоит в том, что ком ­ поненты раковы х клеток поглощают рентгеновские лучи иначе, чем ком­ поненты доброкачественных клеток. И зучая мамограммы, рентгенолог мо­ ж ет увидеть некоторые признаки, которые наблюдаются с различны ми ч а­ стотами в различны х образованиях, и , исходя из этой информации, делает­ ся оценка относительно характера рассматриваемой болезни. К ак правило, результат маммограммы классиф ицируется к ак положительный или отри­ цательны й в отнош ении рака. И ногда используется расш иренная схема классиф икации, такая, например, к ак схема, содерж ащ ая три класса: зло­ качественны й, подозрительный и доброкачественный. Эта диагностическая процедура не соверш енна, так к ак в ней некоторые злокачественные повреждения неправильно классифицирую тся к ак добро­ качественны е, и некоторые доброкачественные опухоли классифицирую т­ ся как злокачественные. Таким образом, один из факторов, который яв л я­ ется очень важ ны м для врача - точность диагностики. Вероятностное рассуждение Давайте рассмотрим это понятие более подробно. Цель диагностической про­ цедуры состоит в том, чтобы обеспечить врача информацией о состоянии пациента. Врач использует ее для пересмотра состояния пациента и опреде­ ления, к ак действовать, исходя из новой оценки. Это мож ет быть решение пройти дальнейш ие диагностические процедуры, или если врач достаточно уверен в состоянии пациента, мож ет быть принято реш ение о терапии. Су­ щественно то, что врач может иметь различны е степени уверенности о со­ стоянии пациента. Врач будет собирать данные, чтобы усилить уверенность в том, что у пациента есть или отсутствует рак, и когда эта уверенность ста­ нет достаточно сильной (в контексте серьезности болезни и изменений в про­ гнозе и лечении), будут предприняты действия. Мы мож ем связы вать вероятность, то есть субъективную вероятность врача, что у пациента рак, с этой степенью уверенности. Результаты раз­ личны х диагностических процедур, таких, к а к , например, маммография, могут сущ ественно изменить уверенность врача или субъективную вероят­ ность того, что у пациента рак. Вероятностные рассуждения... 289 П онятие субъективной вероятности или степени уверенности появляет­ ся в различны х формах в профессиональном медицинском жаргоне. Н апри­ мер, один автор пиш ет, что “так к ак старш ая возрастная группа имеет са­ мую большую пропорцию злокачественных новообразований, в ней повы­ ш енный коэффициент подозрения на рак, по мнению врача, который стал­ кивается с таким пациентом “ (Gold, 1969, с. 162). Другой автор заявляет, что маммограмма мож ет уменьш ить количество биопсий груди “во многих случаях, когда сложившееся мнение осматривающего врача относительно доброкачественной опухоли поддерживается точным маммографическим диагнозом о доброкачественности” (W olfe, 1964, стр. 253). Третий описыва­ ет это так: “Если субъективное впечатление врача дает достаточно причин для подозрения карциномы , он будет вынужден прибегнуть к биопсии, не­ смотря на отрицательный результат маммограммы” (Clark и др., 1965, с. 133). Другие вы сказы вания, которые отражаю т это понятие: “уровень уве­ ренности” (В у т е , 1974, с. 37), “впечатление злокачественности” (W olfe, 1967, с. 138), “более положительный диагноз” (Egan, 1972, с. 392), и т.д. Эти утверж дения не точны, потому что мало врачей формально ознакомле­ ны с понятиями субъективной вероятности и анализа при принятии реше­ ний. Тем не менее, существует вполне достаточное свидетельство того, что понятие степеней уверенности является естественным для врачей и исполь­ зуется ими для определения, к ак поступать дальш е. И нт ерпрет ация точности маммограммы Теперь рассмотрим пациентку с новообразованием в груди, которое врач считает доброкачественным. Пусть эта вероятность будет 99 из 100. Вы мо­ ж ете интерпретировать фразу, что “врач считает, то вероятно (99 из 100) новообразование доброкачественно” следующ им образом. Предположим, что у врача имеется опыт с множеством ж енщ ин, которые, во всех важ ны х аспектах, таких к ак возраст, симптомы, история семьи и результаты ана­ лизов, подобны этой пациентке. И предположим, что врач знает из своего опы та, что частота рака в этой группе, скаж ем, 1 из 100. При отсутствии другой информации, врач припиш ет (возможно, подсознательно) субъек­ тивную вероятность 1% тому, что эта пациентка больна раком. Теперь пусть врач посылает пациентку на маммограмму и получает сооб­ щ ение, что, по мнению рентгенолога, опухоль является злокачественной. Это новая информация, и предпринятые врачом действия будут, очевидно, зависеть от его новой оценки вероятности того, что у пациентки рак. Врач, которы й обратится к литературе, мож ет найти множество полезны х утвер­ ж дений, так и х , к ак : “точность мам м ограф ии - приблизительно 90% ” (W olfe, 1966, с. 214); “(У пациенток с новообразованием в груди) положи­ тельны й результат (маммограммы ) карцином ы вы соко точен” (R osato, Thom as & R osato, 1973, с. 491); и “точность маммограммы при правильном диагностировании злокачественных опухолей груди составляет в среднем 290 КОВАРИАЦИЯ И КОНТРОЛЬ от 80 до 85% ” (Cohn, 1972, с. 98). Если необходимо больше подробностей, врач может обнаружить много утверждений, к ак “результаты показали, что 79,2% от 475 злокачественных новообразований, и 90,4% от 1. 105 добро­ качественны х новообразований были правильно диагностированы, и пол­ н ая точность составила 87% ” (Snyder, 1966, с .217). Н а этом этапе Вы можете понять сложность проблемы врача, самостоя­ тельно оценив новую вероятность того, что у этой пациентки рак: врач ду­ мает, что опухоль доброкачественна с вероятностью (99% ), но рентгеновский диагноз был положителен с точностью, только что указанной. Таблица 1. Точность маммограммы в диагностировании доброкачествен­ ных и злокачественных новообразований Р езульт ат ы рент геновского обследования Злокачест венное новообразование (р а к ) Доброкачест венное новообразование (р а к от сут ст вует ) 0.792 0.208 0.096 0.904 Положительный Отрицательный Источник : числа взяты из работы Снайдера (Snyder, 1966). Д ля оценки вероятности прим еняется формула Байеса. Согласно этой формуле Р (рак | пол) = _______________ Р(пол | рак ) • Р(рак)____________ Р(пол \ рак)Р(рак) + Р{пол jдоброкач )Р (доброкач ) Где Р (рак|пол) - вероятность того, что у пациентки рак, при условии, что у нее положительный результат рентгеновского обследования (апо­ стериорная вероятность) Р (пол|рак) - вероятность того, что если у пациентки рак, рентгено­ лог правильно диагностирует его (истинно полож ительная оценка или чувствительность) Р (рак) - вероятность того, что у пациентки рак (априорная вероят­ ность) Р (доброкач) - априорная вероятность того, что опухоль у пациент­ ки доброкачественная (Р (доброкач) = 1 - Р (рак)) Р (пол|доброкач) - вероятность того, что, если у пациентки доброка­ чественная опухоль, рентгенолог неправильно диагностирует ее как рак (ложно полож ительная оценка) Вероятностные рассуждения... 291 В табл. 1 приводится итог чисел, представленных Снайдером (Snyder). Ц ифры в ячейках - соответствующие вероятности (например, Р (пол|рак) 0.792). И спользуя оценку врача априорной вероятности того, что опухоль яв л я­ ется злокачественной и , принимая во внимание новую информацию, полу­ ченную в результате процедуры, мы имеем TW , ч (0.792 X0.01) п пп п Р (рак пол) = ---------- --------------------------- = 0.077 (0.792 )(0.01) + (0.096 )(0.99) Таким образом, врач должен оценить вероятность того, что у пациентки рак к ак приблизительно 8% . Н еправильное вероятностное рассуждение К сожалению , большинство врачей (приблизительно 95 из 100 в неофици­ альной выборке, сделанной автором) неправильно интерпретирует утверж ­ дения относительно точности анализов и оценивает Р(рак|пол), приблизи­ тельно к а к 75% . Другие исследователи получили похож ие результаты (Casscells, Schoenberger & S; G rayboys, 1978). Когда их спраш ивали, допус­ тивш ие ош ибку врачи обычно отвечали, что они оценили вероятность рака, при условии, что у пациентки положительный результат рентгеновского об­ следования (Р (рак|пол)) приблизительно равна вероятности положитель­ ного результата рентгеновского обследования у пациентки, больной раком (Р (пол|рак)). П оследняя упомянутая вероятность измерена в клинических исследовательских программах и очень известна, но именно первая упомя­ нутая вероятность необходима врачу для принятия реш ения. По-видимо­ му, что многие, если не большинство врачей, путают эти две вероятности. Н а самом деле существует два типа точности для любого анализа, пред­ назначенного, чтобы определить, действительно ли присутствует определен­ н ая болезнь. Ретроспективная точность касается Р (пол|рак) и Р (отр| не рак). (Сокращ ение “не рак” относится к случаю, когда пациентка не больна раком. Это мож ет происходить, потому что у нее либо доброкачественная опухоль, либо она вообще здорова.) Эта точность, н а которую обычно ссыла­ ются в литературе по маммографии, определяется, обращ аясь к рентгено­ вскому диагнозу после того, к ак истинный (гистологический) диагноз стал известен. Д авайте, используем термин спрогнозированная точность, для описания Р (рак|пол) и Р (доброкач|отр), точность, важ ная для врача, у кото­ рого есть рентгеновский снимок пока еще не продиагностированного паци­ ента и которы й хочет сделать прогноз состояния болезни пациента. Путаница между ретроспективной и спрогнозированной точностью. Об­ зор медицинской литературы по маммографии показывает сильную тенден­ 292 КОВАРИАЦИЯ И КОНТРОЛЬ цию приравнивать спрогнозированную точность положительного результата рентгеновского обследования к ретроспективной точности рентгеновского снимка; то есть приравнивать Р(рак|пол) = Р (пол|рак). Существует много причин подозревать, что эта ошибка постоянно соверш ается. Во-первых, формулировки многих утверждений в литературе предполагаю т, что их ав­ торы приравниваю т прогнозирующую точность (Р (рак|пол)) и ретроспек­ тивную точность (Р (пол|рак)), о чем они сообщают в своих исследованиях. Н апример, вст&тьеРентгенологияв 1964 говорилось, что, “полная правиль­ ность диагноза рентгеновского сним ка была 674 из 759, или 89 процентов “ (том. 84, с. 254). Автор статьи в издании “Клиническое акушерство и гине­ кология” (Clinical Obstetrics and Gynecology) в 1966 заявил, “Аш (Asch) об­ наруж ил 90% -ую корреляцию маммографии с патологическими результа­ тами у 500 пациентов” (том. 9, с. 217). “Совпадение между рентгеновским и патологическим диагнозом было 91.6% ” (Egan, 1972, с. 379). Все эти утвер­ ж дения подразумевают, что, если у пациента был положительный диагноз, обследование будет правильным, и у пациента будет рак в 90% случаев. Это не так. Во-вторых, некоторые авторы явно допускают ош ибку. Приведем цита­ ту из вы пуска “Клиническое акушерство и гинекология”(Clinical Obstetrics and Gynecology) 1972 года в статье “М аммография в ее перспективе”, в ко­ торой была предпринята попы тка исправить некоторую путаницу, сущ е­ ствующую в литературе: “Среди ж енщ ин, у которых подтвердилась карци­ нома груди и которым делали маммограмму, не существовало рентгеновско­ го диагноза злокачественной опухоли приблизительно для одной пациент­ ки из обследованных пяти. В таком случае, если на основе отрицательной маммограммы, мы приходим к решению отсрочить биопсию твердого ново­ образования в груди, то, возможно, в одном случае из пяти мы отсрочиваем биопсию злокачественной опухоли” (том. 134, с. 98). Автор неправильно ут­ верждает, что Р (отр|рак)= 0 .2 подразумевает, что Р (рак|отр)= 0 .2 . Его ошиб­ к а становится очень серьезной, когда он заклю чает, что “отсрочить биопсию клинически доброкачественного твердого новообразования груди, которое было показано как доброкачественное на маммографии, значит, сделать ш аг назад в уничтож ении карциномы груди для женского населения”. Вероят­ ность того, что у такой пациентки рак, зависит от априорной вероятности, но она меньш е чем 1 из 100. Его анализ более, чем в 20 раз ошибочен. Ж урнал “Хирургия, гинекология и акушерство”(Surgery, Gynecology and Obstetrics) опубликовал в 1970 (том 131, стр. 93-98) выводы другой иссле­ довательской группы , которая вы числила “корреляцию рентгеновского диагноза с патологическим диагнозом” следующим образом. Они взяли всех пациентов с гистологически подтвержденными диагнозами и разделили их на три группы на основе рентгеновского диагноза - “доброкачественный”, “карцином а” и “подозрение на карциному”. В группе с рентгеновским ди­ агнозом “доброкачественный” (“отрицательны й” в наш ей терминологии), Вероятностные рассуждения... 293 было показано, что у 84% пациентов на самом деле обнаружились доброка­ чественные опухоли. Было такж е отмечено, что 87.5% из группы с диагно­ зом “карцинома” (или “полож ительны й”) имели подтвержденные биопси­ ей злокачественные новообразования. Таким образом, Р(рак|пол)=87.5% и Р (доброкач|отр)=84% . Но авторы приняли эту спрогнозированную точность за ретроспективную точность. Они заявили, что “правильны й диагноз маммограммы был сделан в 84% от случаев с доброкачественными опухолями и в 87.5% от опухолей с карциномой”. Ф актически, истинно положитель­ ная пропорция (Р (пол|рак)) в этом исследовании была равна 66% , а истин­ но отрицательная пропорция (Р (отр|доброкач)) была 54% . В письме к редактору ж урнала “Национальный обозреватель”(National Observer), вы пуск от 11 сентября 1976 врач представил пять “наблюдений и ф актов” в поддержку своего мнения, что “установивш аяся практика мам­ мографии (то есть, проекционная маммография) не отвечает интересам на­ селения в целом в любом возрасте”. Вот первые наблюдения. (1) точность экспертизы маммографии, как сообщают, между 80 и 90%, в зависимости от таких факторов как возраст пациентки, действительно ли она имеет фиброцистическую болезнь, тип рентгеновского оборудования, опыт рентгенолога, и, каково наше определение “точности”... Даже если мы заключаем, что точность - 85% (и я уверен, что не каждый рентгенолог в нашей стране может достигнуть такого значения в соб­ ственной практике), то это означает, что 15% ж е н щ и н , к о т о р ы м с д е л а л и р е н т г е н , о к а ­ ж у т с я с н е п р а в и л ь н ы м и и н т е р п р е т а ц и я м и р е з у л ь т а т о в , и л и более ве р о я т н о , и х м ам м о гр а м м ы п р о с т о н е с м о г у т п о к а з а т ь б о л е зн ь . Э т о о з н а ч а е т , ч т о 15% ж ен щ и н лож ­ н о в н у ш а т ч у в с т в о б е зо п а с н о с т и , ес л и и м с к а ж у т , ч т о и х р е н т г е н о в с к и е с н и м к и н о р ­ м а л ь н ы , ес л и д е й с т в и т е л ь н о о н и уж е б о л ь н ы р а к о м . Трудно оценить вред, причинен­ ный этой группе, поскольку им было бы лучше не получить информацию, чем иметь ошибочную. Если женщине сказать, что ее маммограмма нормальная, и ей не нужно проходить анализы еще в течение года, женщина, больная раком, вполне может проиг­ норировать уплотнение в своей груди, из-за которого иначе она сразу же пошла бы к врачу. Существует несколько ошибок в рассуждении этого автора. Во-первых, “точность” маммографии не может быть вы раж ена к ак единственное чис­ ло. Допустим, автор имеет в виду, что и истинно-положительные, и истин­ но-отрицательные пропорции равны 85% . Во-вторых, эти пропорции (85% ) соблюдаются, если маммография ис­ пользуется, чтобы установить дифференциальный диагноз известных при­ знаков и симптомов. Такие опухоли крупнее, чем опухоли, которые изуча­ ют с помощью рентгена - тот случай, который описывает автор. Более ра­ зумные оценки истинно-положительных и истинно-отрицательных пропор­ ций в рентгеновских снимках - 60% и 98% соответственно. В-третьих, даже используя 85% , мы находим несколько погрешностей в рассуж дении. Рассмотрим второе предложение. Существуют два способа неправильной интерпретации: (а) у пациентки может быть рак и отрица­ тельные анализы , Р(рак,отр); или (Ь) ее анализы могут быть полож итель­ КОВАРИАЦИЯ И КОНТРОЛЬ 294 ны ми, но у нее может не быть рака, Р(не рак, полож ит).2 И з элементарной теории вероятности, мы знаем что Р (рак, отр) = Р (отр | рак)Р(рак) Р (отр|рак) дополняет Р (пол|рак) и поэтому равняется 0.15 в этом случае. Мы не знаем точно Р(рак), но для совокупности прош едш их рентген, мы вполне уверенны, что она меньше чем 0.005. То есть менее 5 из 1. 000 ж ен­ щ ин имеют безсимптомный, но обнаружимый с помощью маммограммы рак груди. Таким образом, Р (рак, отр) <(0.15) от (0.005) = 0.00075 Т акж е, Р (не рак, пол) = Р (пол!не рак)Р(не рак) > (0.15)-(0.995)= 0.14925 П олная вероятность неправильной интерпретации (то есть, Р(рак, отр) + Р (не рак, пол)) - это сумма этих двух чисел, которая составляет 15% , к ак утверж дает автор. Однако это не подразумевает, что “вероятнее, и х маммог­ раммы просто не смогут показать болезнь”. Р (рак, отр) = 0.00075 не боль­ ш е, чем Р (не рак|пол) = 0.14925. Она приблизительно в 200 раз меньше. Д ругая проблема - то, что “точность” 85% не подразумевает, что “15 про­ центам ж енщ ин будет сообщаться ложное чувство безопасности, если им скаж ут, что их рентгеновские снимки нормальны ”. Автор, каж ется, пы та­ ется оценить Р(рак|отр). Теперь по формуле Байеса, Р (рак\отр) = Р(от р Iр а к )Р (р а к ) P(pm p I р а к )Р (р а к ) + Р{рт р I нерак )Р(нерак ) (0.15)(0.005) = ---------- ------ -------- ----------- =0.00089 (0.15X0.005) + (0.85)(0.995) То есть если 1 0 .0 0 0 ж енщ ин, у которы х не обнаружено симптомов, прой­ дут рентген, и если мы используем неверную оценку точности автора, 8.4 5 8 из них покинет клинику с отрицательными диагнозами. Автор считает, что 2Р(А,В) ~ совместная вероятность того, что произойдет как событие А, так и событие В. Вероятностные рассуждения... 295 приблизительно 1. 269 из них будет сообщено ложное чувство безопаснос­ ти. Ф актически, только приблизительно у 9 это будет так. Значение было завыш ено приблизительно в 150 раз. Таблица 2. Наличие рака и результаты рентгена у 1000 женщин, у кото­ рых наблюдались положительные результаты после физического осмот­ ра Женщины с положительными результатами рентгеновского обследования Женщины с отрицательными результатами рентгеновского обследования Общее количество Женщины, больные раком Женщины, не больные раком Общее количество 74 110 184 6 810 816 80 920 1.000 Примечание : истинно-положительная пропорция 0.92 (Р (пол|рак) = 0.92) подразумевает, что из 80 ж енщ ин, больных раком, у 74 будут положитель­ ные результаты рентгеновского обследования, а у б — отрицательные. Из всех ж енщ ин с положительными результатами, 74/184 больны раком или Р (рак|пол) = 74/184 = 0.4 (то есть 40% ). Источник: числа взяты из работы Вульфа (W olfe, 1964). Н аконец, введение ф разы “если действительно они уже больны раком” ис­ к аж ает значение предлож ения. Ф разы “лож ное чувство безопасности” , “ если им сказали, что их анализы рентгена нормальны ”, и “если они уже больны раком ” переводятся символически в Р (рак|отр, рак). Эта вероятность равняется 1, а не 0.15. Важность вероятности Р(рак ). В дополнение к путанице между двумя точностями, многие авторы, каж ется, не понимают, что д л я проверки по­ стоянной ретроспективной точности, значение результатов анализов для врача (прогнозируемая точность) зависит от начального риска рака у паци­ ентки, прошедшей маммограмму. Д аж е если допустить, что истинно-поло­ ж ительны - и истинно-отрицательные пропорции постоянны для всех ис­ следований, надлеж ащ ая интерпретация испытательных результатов - ве­ роятность того, что пациент с положительными (или отрицательными) ре­ зультатам и маммограммы болен раком - будет зависеть от распространен­ 296 КОВАРИАЦИЯ И КОНТРОЛЬ ности рака в совокупности, из которой был выбран пациент, от предвари­ тельной вероятности того, что у пациента рак. Это может быть чрезвычайно важ но, когда мы сравниваем использование обследования в диагностичес­ кой клинике (где у ж енщ ин наблюдаются признаки и симптомы болезни груди) с его использованием в рентгеновской клинике для ж енщ ин, у кото­ ры х нет симптомов. Важность этого доказы вается следующим примером. П редположим, что задача врача - сделать маммограмму ж енщ инам, у которы х “полож итель­ ны е” результаты физического обследования. Частота рака у таких ж енщ ин, к а к было обнаруж ено в одном исследовании, бы ла приблизительно 8% (W olfe, 1964). В одном множестве маммограмм в этой совокупности были получены истинно-положительная пропорция - 92% и истинно-отрицатель­ н ая пропорция - 88% (W olfe, 1964). Пусть врач столкнется с пациенткой, которая, по его мнению, репрезентативна по отношению к этой совокупнос­ ти (то есть, пусть Р(рак) = 8% ). П редположим, что он отправляет ее на мам­ мограмму и получает положительное заклю чение рентгенолога. Его реш е­ ние послать пациентку н а биопсию должно быть основано на новой вероят­ ности, что у пациентки рак. Эту вероятность можно подсчитать, и она будет равна 40% (см. табл. 2). Разве отрицательны й результат исклю чил бы рак? Вероятность того, что эта ж енщ ина больна раком, учиты вая отрицательный результат рентгеновского обследования, - немного меньш е 1% . П равила получения этой оценки показаны в табл. 2. Теперь, предположим, что врач посылает на рентген ж енщ ину с подозре­ нием на рак, у которой нет никаких симптомов и физическое обследование было отрицательны м. Распространенность рака, который мож ет быть об­ наруж ен маммограммой у таких ж енщ ин, - приблизительно 10% (напри­ мер, Shapiro, S trax & V enet, 1967). Д ля этого примера, пусть ретроспектив­ н ая точность рентгена, будет той ж е, то есть в этой совокупности пациентов у нее снова будет истинно-положительная пропорция 92% и истинно-отри­ цательная пропорция (для диагноза доброкачественных опухолей) 88% .3 Л итература приводит данные только касательно ретроспективной точнос­ ти обследования у ж енщ ин, у которых рак и доброкачественные опухоли. В одном исследовании приблизительно 60% этих ж енщ ин вообще были здо­ ровы (W olfe, 1965). Таким образом, в этом случае, Р (рак|пол) = (Р (пол (рак) Р (рак))/ (Р (пол|рак)Р(рак) + Р (пол|доброкач)Р(доброкач)+ + Р (пол|здорова) Р(здорова)) 3Это - неверное предположение, так как “точность” изменяется по мере того, как изменяет­ ся исследуемая совокупность. Например, истинно-положительная пропорция более низкая при использовании обследования в совокупности женщин, у которых не наблюдалось при­ знаков болезни, потому что раковые новообразования имеют тенденцию быть намного мень­ шими, и их тяжелее обнаружить. Это предположение сделано только для того, чтобы про­ демонстрировать важность Р (рак). Вероятностные рассуждения... 297 Р(доброкач), Р(здорова) и Р(пол|здорова) не рассматриваю тся в литературе. Это приводит нас к подозрению, что их важность в анализе этих проблем не понята. В этом примере, мы будем использовать данные, представленные Вульфом (W olfe, 1965) и предполагать, что Р (здорова) - приблизительно 60% , и Р(доброкач) - приблизительно 40% . Мы такж е сделаем предполо­ ж ение в пользу маммографии и позволим Р (пол|здорова) быть 0% . П родолжая использовать этот пример, предположим, рентгенолог сооб­ щ ает, что маммограмма у данной ж енщ ины без симптомов заболевания, полож ительна. У читывая положительный результат маммографии, веро­ ятность того, что у пациента рак (Р (рак|пол) - приблизительно 1 из 49, или приблизительно 2.0% (табл.З). В предыдущем примере, в котором были ж енщ ины с симптомами болезни, Р (рак|пол) была 40% . Таким образом, в зависимости от того, кто исследуется, может существовать приблизительно двадцатикратная разница в вероятности того, что у ж енщ ины с положи­ тельной маммограммой рак. Таблица 3. Наличие рака и результаты рентгеновского обследования у 1000 женщин, у которых не обнаружено никаких симптомов ______________ Женщины с положительным результатом рентгена Женщины с отрицательным результатом рентгена Общее количество Ж енщ ины с Ж енщ ины с Ж енщ ины, Общее раковы м и доброкачестне больные колиновообразовавенны м и раком чество ниями новообразованиям и 1 48 0 49 352 599 951 400 599 1.000 Примечание: истинно-положительная пропорция 0.92 подразумевает, что рентген обнаружит рак у одной ж енщ ины , которая больна. Истинно-отри­ цательная пропорция 0.88 для доброкачественной опухоли подразумевает, что из 400 ж енщ ин с доброкачественными новообразованиями, у 352 будет отрицательны й анализ рентгена, в то время к ак у 48 рентген будет положи­ телен. Таким образом, у 49 ж енщ ин будет положительный рентген, но толь­ ко у одной рак, или Р (рак|пол) - 1/49 = 0.2 (то есть 2% ). 298 КОВАРИАЦИЯ И КОНТРОЛЬ Это поднимает главный вопрос относительно медицинского рассуждения при попытке оценить симптомы пациента, как должен врач использовать информацию относительно основной частоты возможных болезней в этой со­ вокупности в целом? М едики, каж ется, запутались в этой проблеме. С одной стороны, врачи утверждают, что относительная распространенность болезни не должна затронуть оценку вероятности того, что отдельно взяты й пациент болен. Это понятие появляется в нескольких аксиомах, таких, к ак, “каж ды й пациент - особый неповторимый случай” и “статистика - для мертвых”. При обсуждении определенных проблем, эта идея иногда выражается неявно, как в утверждении, “у молодых ж енщ ин, очевидно, меньше злокачественных новообразований, что, однако, не должно влиять на индивидуальный случай” (W olfe, 1967, стр. 138). Это может такж е быть утверждено в явной форме и представлено к ак правило, которому нужно подчиняться. Например, следу­ ющее появилось в учебнике по клиническому диагнозу, когда имеется сле­ дую щ ая рекомдация: “Когда пациент консультируется со своим врачом по поводу недиагностированной еще болезни, ни он, ни доктор не знают редкая ли это болезнь, пока диагноз не поставлен окончательно. Статистические ме­ тоды могут применяться только к многотысячной совокупности. Редкая бо­ лезнь либо есть у человека, либо ее у него нет; возможность наличия двух бо­ лезней полностью не соответствует проблеме постановки диагноза” (DeGowin & DeGowin, 1969, стр. 6). С другой стороны, эти утверждения часто противоречат поведению вра­ чей, которые пытаю тся, использовать эту диагностическую информацию. Посмотрите, какие принципы преподаются в медицинских учебных учреж ­ дениях: “Когда Вы слыш ите цокот копыт, думайте о лош адях, а не о зебрах”, “Обычные вещ и происходят наиболее часто”, “Следуйте закону Саттона (Sutton): идите туда, где есть деньги”, и т.д. Кажется, что многие врачи осоз­ нают ценность информации относительно предшествующей вероятности бо­ лезни, но формальные уроки теории вероятности усвоены плохо. Без формаль­ ной теории, врачи склонны совершать те ж е самые ошибки в вероятностном рассуж дении, которы е наблю дались в других контекстах (K ahnem an и Tversky, 1973,4; Lyon и Slovic, 1976). Выводы: М аммограммы и биопсии Эти проблемы могут иметь важ ны е практические последствия. Например, в упомянуты х примерах два автора основывали свои заклю чения на непра­ вильном вероятностном рассуждении. Один неправильно утверж дал, что ж енщ ина с опухолью в груди, которая каж ется доброкачественной при фи­ зическом обследовании и по результатам рентгеновского снимка все еще име­ ет вероятность 20% того, что у нее рак, и ей стоит порекомендовать пройти биопсию. Другой автор основывал свои рекомендации против рентгена на неверной оценке частоты, с которой ж енщ ины получили бы ложное чув­ ство безопасности (то есть, рак, не обнаруженный маммограммой). Оба ав­ Вероятностные рассуждения... 299 тора, возможно, приш ли бы к тому ж е заклю чению , если бы они рассужда­ ли правильно, но могли бы и не прийти. Ценность диагностической информации. Ценность маммографии у ж ен­ щ ин, которые имеют признаки и симптомы болезни груди, леж ит в ее спо­ собности обеспечить диагностическую информацию , которая повлияет на реш ение врача относительно биопсии. Точнее, исход обследования должен изменить оценку вероятности того, что у пациента рак. К ак пиш ет один ав­ тор: Маммография может помогать врачу в различении доброкачественных и злокачествен­ ных новообразований.... У некоторых новообразований, особенно небольших, может отсутствовать достаточно характеристик, которые дают вроачу высокую степень подо­ зрения, чтобы оправдать биопсию. Именно здесь... маммограмма может обеспечивать дополнительные объективные данные. Таким образом, в случае неопределенной опу­ холи в груди, маммография может помочь врачу в принятии решения, применять ли биопсию (Clark & Robbins, 1965, стр. 125). Чтобы любое диагностическое обследование было полезным, оно должно предоставлять информацию, которая может потенциально изменить реш е­ ние о том, что делать с пациенткой - направить на биопсию тех, кого иначе бы туда не направили, и, мы должны надеяться, не допускать биопсии у некоторы х ж енщ ин, которые иначе были туда направлены . Это понятие развито в статистической теории принятия решений и использовалося для анализа некоторых медицинских проблем в исследовательских условиях *например, Lusted и др., 1977) Многие врачи признаю т, что результаты рентгена несут полезную инфор­ мацию , которая должна помочь при общении с пациентом, но как именно информация должна использоваться, не указы ваю т. О бъяснения, данные большинством авторов, содержат мало определенных направлений. “Мам­ мография не предназначена для предписания лечебных процедур, но она мож ет обеспечивать, в некоторых случаях, только ту частицу более точной инф орм ации, которая помогает избеж ать неж елательны х последствий” (Egan, 1972, с. 3192). “М ам м ограф ия-ценное вспомогательное средство для хирурга при диагностировании и лечении опухолей в молочной ж елезе “ (Lyon, 1975, с. 231). “М аммография мож ет помочь в разъяснении непонят­ ны х результатов, полученных после физического осмотра” (Egan, 1969, р. 146). Она “играет поддерживающую или вспомогательную рол ь...” (Block & R eynolds, 1974, с. 589). Точность и степень поддерж ки обычно оставлены на усмотрение врача. Маммограммы и биопсии: Практика. К аж ется, что роль маммографии в таких слу гаях понята только частично. Чтобы понять это, исследуем воз­ действие, которое, как клинические исследователи предсказывают, маммог­ раф ия будет оказы вать на потребность в биопсии больной груди. В то время к ак утверж дения, приведенные вы ш е, подразумевают, что использование 300 КОВАРИАЦИЯ И КОНТРОЛЬ рентгена должно помочь выбрать пациентов для биопсии, равное число ут­ верж дений говорит, что маммография не мож ет, и на самом деле, не долж ­ на исполнять эту функцию . “Любая ощ утимая опухоль требует проверки хирургическим вмеш ательством и биопсией, независимо от результатов рентгена” (Lesnick, 1966, стр. 2007). “В то время к ак результаты маммогра­ фии обычно однозначны, она не может заменить биопсию” (Egan, 1969, с. 148). “Никоим образом эта процедура не должна умалять важность биопсии. Ф актически, использование установившейся практики маммографии вновь подтверждает важ ность биопсии, так к ак результаты рентгена, говорящ ие о злокачественном новообразовании, требуют биопсии для подтверж де­ н и я .... Это никоим образом не умаляет важность биопсии.... Биопсия так ж е необходима для подтверждения результатов рентгена, к ак и для подтвер­ ж дения ф изических симптомов” (Gershon-Cohen, и B orden, 1964, с. 2753, 2754). “Очевидно, что маммография не может заменить хирургию ” (DeLuca, 1974, с. 318). “Позвольте нам реш ительно заявить, что маммография - не замена биопсии” (McClow и W illiam s, 1973, с. 618). Одно из наиболее точных стратегических утверждений политики того, к ак маммография долж на использоваться для выбора пациентов для био­ псии, появилось в ж урнале “Архивы хирургии”в 1966 (Archives of Surgvery том 93, с.853-856). Тщательное исследование различны х направлений по­ казы вает, что используется только половина потенциала этой диагности­ ческой процедуры. Схема использования маммографии, “ для того чтобы назначить лечение или установить, что делать с пациентом дальш е” вклю ­ чает три категории пациентов: Категория А: “пациентки с ‘уплотнением’ или ‘доминирующей опухо­ лью ’ в груди - прежде всего хирургическая проблема и не должно быть ни­ какой задерж ки для прохождения биопсии. М аммография, в этом случае, является строго дополнительным средством .... Она может показать скры ­ тые опухоли” (стр. 854). Категория В: “у пациенток наблюдаются симптомы, имеющие отнош е­ ние к молочной ж елезе, но никакого различимого уплотнения или ‘домини­ рующ ей опухоли’ н е т .... В этой категории, хирург и врач получит больше всего сведений от маммографии, потому что существует подтверждающая модальность”. Здесь маммограмма даст подтверждение и поддержку, “если впечатление от клинического осмотра — что опухоль доброкачественная. Однако она не долж на изменить предшествующее мнение касательно био­ псии” (с. 855). Категория С: у пациенток отсутствуют признаки или симптомы, отсут­ ствуют клинические признаки для биопсии, и маммограмма может только увеличивать количество биопсий. Таким образом, автор выделил план, который сводит к нулю ценность маммографической информации в отборе пациентов, у которых биопсии можно избеж ать. И спользуется только та часть информации, где подразу­ Вероятностные рассуждения... 301 мевается биопсия. И нформация, которая могла бы воспрепятствовать про­ хождению биопсии, игнорируется. Маммограммы и биопсии: Потенциал. Чтобы оценить, как проблемы в ве­ роятностном рассуждении могут затрагивать процесс медицинского обслу­ ж и вания, давайте исследуем роль, которую маммография могла бы играть в дифференциальном диагнозе и в выборе пациентов для биопсии. К ак опи­ сано выш е, цель процедуры - изменить субъективную оценку человека, при­ нимаю щ его реш ения, относительно вероятности того, что у пациента рак. Если эта вероятность достаточно вы сока (как определено врачом и пациен­ том), рекомендуется биопсия. Назовем эту вероятность, порогом биопсии.11 Теперь рассмотрим влияние процедуры н а управление двумя группами п а­ циентов. П ервая группа состоит из тех пациенток которые, на основе истории бо­ лезни и физического осмотра, как думают врачи, больны раком. Используя данные, опубликованные Фридманом (Friedm an, 1966), пусть предшествую­ щ ая вероятность (частота) рака в этой группе, будет 90% . Если бы маммограмма была выполнена у такого пациента, положительный результат увели­ чил бы вероятность рака (Р (рак|пол)), возможно, до 95% . Отрицательный результат маммограммы все ещ е оставил бы для пациента вероятность нали­ чи я рака 71% . Эта вы сокая вероятность побуждает такие утверждения как: “Если субъективное впечатление врача дает достаточно причин для подозре­ н ия на рак, врач будет вынужден прибегнуть к биопсии” (Clark и др., 1965, с. 133). Вероятность злокачественности 71 % - все еще достаточно вы сокая ве­ роятность для того, что почти каж ды й захотел бы пройти биопсию. Теперь рассмотрим вторую группу пациентов, у которых имеется опу­ холь, злокачественность которой не очевидна. В одном исследовании веро­ ятность, что такая опухоль является злокачественной, была 14% (Friedm an и др., 1966). При отсутствии дальнейш ей информации, клиника проводит биопсию новообразования: “Если опухоль развивается, она долж на быть удалена и тщ ательно исследована” (del R egato, 1970, с. 861). При исполь­ зовании этой установки, давайте предполож им, что порог биопсии паци­ ента - 10% . То есть если, по предположению врача, вероятность, что у его пациента рак выш е 10% , тогда пациент и врач соглаш аю тся, что биопсия долж на быть проведена.4 5И спользуя порог биопсии 10% , мы можем опреде­ 4Любой, кто хочет убедиться в существовании порога биопсии может рассуждать, следую­ щим образом. Вы согласны, что никто не захочет проходить биопсию, если вероятность рака 1 из 30 триллионов? И мы можем согласиться, что фактически каждый хочет подтвердить диагноз и пройти лечение, если эта вероятность - 98 из 100? Если это так, то где-то между 1 из 30 триллионов и 98 из 100 у человека находится порог биопсии. Конечно, если женщина отказывается от биопсии и лечения даже, если вероятность рака велика, тогда у нее нет такого порога. 5Порог биопсии - очень интересное и важное число. Его изменение оказывает большое вли­ яние на количество женщин, подвергающихся биопсии, частоту непродуктивных биопсий, стоимость лечения пациента, а также прогноз о пациенте. Из-за рискованности, а также 302 КОВАРИАЦИЯ И КОНТРОЛЬ лить влияние маммограммы на руководство 1,000 таких пациентов. Без об­ следования, все пациентки должны были бы пройти биопсию, причем 860 из них — непродуктивную. П риблизительная судьба изначальны х 1.000 па­ циенток с новообразованием, при использовании мамограммы, представле­ на на Рисунке I .6 потому, что, они принимают решение за другого человека, врачи, устанавливает порог био­ псии весьма низко. Утверждение “если есть хоть какая-то вероятность, что опухоль злока­ чественна, биопсия должна быть сделана” является типичным. “Если врач полностью не уверен, что новообразование доброкачественно, оно должно быть подвергнуто биопсии без промедления” (Allen, 1965, с. 640). Согласно полученным сведениям, сами женщины вооб­ ще устанавливают порог выше, чем врачи, хотя бывает и наоборот. Например, мы можем исследовать данные, взятые из большого клинического испытания, в котором использовались маммография и физическое обследование молочной железы, что­ бы выявить рак у женщин, у которых не наблюдалось никаких симптомов. (Shapiro, Strax и Venet, 1971). В зависимости от того, как было обнаружено новообразование в молочной железе (т. е. с помощью какой процедуры или комбинации процедур), вероятность того, что болезнь молочной железы у женщины — рак, варьировалась от 15 до 54%. На основе поло­ жительного физического обследования, врачи порекомендовали 545 женщинам с отрица­ тельными результатами маммограммы пройти биопсию. Несмотря нато, что частота рака в этой группе составляла 15% ,31% женщин отказался проходить биопсию. Частота рака у женщин, результаты физического обследования которых были отрицательными, а маммограммы - положительными равна 20%, но 29% таких женщин отказались проходить биопсию. У женщин с положительными результатами, как физического обследования, так и мам­ мограммы вероятность рака 54%, но 5% женщин предпочли не проходить биопсию в реко­ мендованное время. Таким образом, из этой предварительной информации следует, что у более чем 31% женщин порог биопсии выше 15%, у 29% женщин порог биопсии выше 20%, а у 5% женщин порог биопсии превышает 54%. 6 Чтобы показать воздействие маммограммы на этих пациенток (а также пациентов с дру­ гими признаками и симптомами) необходимо большое количество информации, которая непосредственно недоступна в литературе. К счастью, в одном исследовании (Friedman и др., 1966) данные относительно частоты рака и ретроспективной точности маммографии представлены отдельно для трех групп пациенток- с очевидной карциномой, новообразо­ ваниями и пациенток с другими симптомами болезней молочной железы. Опубликованные данные, однако, неполны, и данные относительно частоты сомнительного рентгеновского диагноза доброкачественных и раковых опухолей не включены. Использовались данные, предоставленные в исследовании Фридмана, и для этого примера, были сделаны следую­ щие предположения: (1) опухоли, не подвергнутые биопсии, были на самом деле доброка­ чественными, (2) опухоли, не подвергнутые биопсии, были закодированы как отрицатель­ ные, (3) половина доброкачественных новообразований, которые не были закодированы как отрицательные, были закодированы как положительные (другая половина была закодиро­ вана как неопределенная), и (4) половина злокачественных новообразований, которые не были закодированы как положительные, были закодированы как отрицательные. Первые два предположения - наиболее оптимистическая интерпретация точности маммографии. Третье и четвертое предположения очень важны, и по мере того, как ложно-положительная (или ложно-отрицательная) пропорция стремится к нулю, мощность положительного (от­ рицательного) результата рентгеновского обследования, включающее!исключающее) рак, растет. Аналогично, по мере того, как ложно-положительные или ложно-отрицательные пропорции растут, обследование теряет свою прогнозирующую мощность. Интерпретация данных Фридмана даже усложнилась при представлении ее в терминах молочных желез, а не пациенток. Тем не менее, существует много информации в этом сообщении, и разумно использовать ее в этом примере, при условии, что читатель понимает, что это - иллюстра- Вероятностные рассуждения... 303 П ациенты с положительным результатом маммограммы имеют 53% ве­ роятности наличия рака и, так как мы предположили, что они имеют порог биопсии 10% , они должны были бы пройти биопсию. П оскольку вероят­ ность того, что пациентка с сомнительной маммограммой больна раком равна 34% , эти пациенты такж е должны пройти биопсию. Пациенты с отрица­ тельным результатом маммограммы имеют вероятость 4% наличия рака, и, так к ак это ниж е их принятого порога биопсии (10% ), они не хотели бы подвергнуться биопсии, но предпочтут тщ ательное наблюдение. Общее ко­ личество немедленных биопсий было уменьшено от 1 .0 0 0 до 240. По край ­ ней мере, еще 30 биопсий будут сделаны в конечном счете, потому что 30 из 760 оставш ихся пациенток больны раком. Таким образом, ож идаемая польза от наличия мамограммы (например, сокращ ения вероятности ненужной биопсии от приблизительно 86% до не­ много более 13% ) может быть сравнена с затратами (например, опасностью пораж ения лучевой болезнью и приблизительно $ 75), и небольшим умень­ ш ением в ожидаемом вы ж ивании (сущ ествует 3% вероятность того, что диагноз злокачественного новообразования будет отлож ен на месяц или около того). Если использовалось понятие порога биопсии и некоторая про­ стая теория вероятности, многим пациентам в этой группе, у которых был отрицательны й результат маммограмы, не будет сделана биопсия. П ри от­ сутствии этого типа анализа существует “согласие между хирургами, что все пациенты (в этой группе) должны пройти биопсию, независимо от ре­ зультатов маммограммы” (F riedm ann др., 1966, с. 889) Положительные новообразования 0,14 1,000 пациентов Неопределенные новообразования ОдО 140 100 Рак 0,53 74 Нет рака 0,47 вв Рак 0,34 34 Нет рака вв 0,6в Отрицательные новообразования 0,76 760 Рак 0,04 Нет рака ТЩГ 780 Рис. 1. Вероятность рака у ж енщ ин с доминирующими новообразова­ ниями ция, а не формальный анализ. Формальный анализ этих вопросов требовал бы лучших дан­ ных. Значения для точности, используемой в тексте для оценки пациентов в группе 2 сле­ дующие: Р(пол|рак)= 0.52, Р(неопр|рак) =0.24, Р(отр|рак) = 0.24, Р(пол| доброкач) = 0.075, Р (неопр|доброкач) = 0.075, и Р (отр|доброкач) = 0.85. 304 КОВАРИАЦИЯ И КОНТРОЛЬ Важность порога биопсии в этом примере должна быть подчеркнута. Если врач и его пациент установили порог в 1% - то есть, если бы пациент чувство­ вал, что вероятность 1 из 100 наличия рака достаточна, чтобы применить био­ псию - тогда отрицательный результат мамограммы не устранил бы потреб­ ность в биопсии (вероятность рака 4% превысит этот порог). М амограмма, возможно, дала бы клиницисту некоторую информацию, но эта информация не повлияла бы на решение о биопсии. Использование мамографии в этом случае должно было бы быть оправдано на других основаниях. Пересмотр практики. Этот тип анализа помогает прояснить потенциаль­ ную полезность маммографии при постановке дифференциального диагно­ за различны х опухолей. Это такж е помогает нам оценить следующие утвер­ ж дения: 1. “М аммография оказывает мало влияния на решение относительно кли ­ нически (т.е. физически) ощутимой опухоли молочной ж елезы , которая, на основе своих собственных характеристик, требует биопсии “ (из Archives of Surgery, 1974, том. 108, стр. 589). В обследовании пациентов с новообразо­ ваниям и, биопсия требовалась только на одних лиш ь клинических основа­ н иях. И спользование маммографии разбивает группу на подгруппы с час­ тотами рака в пределах от 53% до 4% . Биопсии можно было бы избеж ать в последней группе, и количество биопсий могло бы быть уменьшено на 73% (от 1. 000 из 1. 000 до 270 из 1.000). 2. “Д ля клинических целей маммография долж на обеспечить приблизи­ тельно 100 процентный уровень точности прежде, чем она одна мож ет опре­ делять лечение” (ш Archives of Surgery, 1 9 7 4 ,том 1 0 8 ,с. 589). В совокупно­ сти, подобной второй группе, которая обсуждалась выш е, могло бы быть весьма рационально позволить маммографии определять пациентов для биопсии. Вспомним, что истинно-положительная пропорция, используемая в том примере, бы ла 52% , и что более точное испытание будет даже более ценно. 3. “М аммография - не замена биопсии” (из Oncology, 1969, том 23, с. 148). Ц ель и маммографии, и биопсии состоит в том, чтобы обеспечить информа­ цию относительно состояния пациента. Некоторые пациенты , при отсут­ ствии маммографии, требуют биопсии. У некоторых из этих пациентов от­ рицательный результат маммограммы устранил бы необходимость биопсию, и в этих случаях, маммограмма заменяет биопсию. 4. “Каждому решению о прохождении биопсии долж на предш ествовать маммограмма” (из Oncology, 1969, том 23, с. 146). Рассмотрим клинически очевидную карциному. Вероятность рака будет превы ш ать порог биопсии каж дого, почти независимо от того, каков результат маммограммы. Пер­ вичное оправдание этой политики, в таком случае, должно леж ать в вероят­ ности того, что клинически очевидная опухоль является доброкачествен­ ной (иначе пациентка бы ла бы должна пройти мастектомию (удаление мо­ лочной ж елезы ), и что имеется скрытое неощутимое злокачественное ново­ Вероятностные рассуждения... 305 образование. Вероятность этого сложного события равна суме вероятностей двух событий, которые являю тся чрезвычайно маленькими (приблизитель­ но 1 из 5.000). 5. “Отсрочить, биопсию клинически доброкачественного новообразова­ н ия груди, которое было определено доброкачественным на маммографии, значит, сделать ш аг назад в уничтожении карциномы груди” (из Surgery, Cynecology and Obstetrics, 1972, том 134, с. 98). Пусть “клиническая добро­ качественность” будет представлена Р (рак) - 5% . После отрицательного результата маммограммы, вероятность, что такой пациент имеет рак - при­ близительно 1 % . И з 100 биопсий, 99 были бы непродуктивны. Я вляется ли отказ от биопсии здесь ш агом назад или вперед? Другой момент - то, что, если бы этой стратегии следовали, все новообразования, начиная от “кл и ­ нически доброкачественных” и заканчивая клинически очевидными кар­ циномами, требовали бы биопсии, независимо от того, каков был исход об­ следования. Это, каж ется, противоречит утверждению автора, что “когда используется в своем надлеж ащ ем виде, маммография является превосход­ ным дополнением для врача в лечении карцином ы груди” (из Surgery, Cynecology and Obstetrics, 1972, том 134, с. 98). 6. “М аммография никогда не долж на использоваться вместо биопсии, когда мы имеем дело с ‘доминирующим новообразованием’ в груди, и ни­ когда не долж на изменить основной хирургический подход в болезнях гру­ ди, то есть, ‘опухоль - это опухоль’ и oi а долж на быть подвергнута биопсии либо путем разреза, либо путем аспирации” {аз Archives of Surgery, 1966, том 93, стр. 854). П ациентки с доминирую щими новообразованиями и по­ рогами биопсии выш е чем 5% не согласились бы с этим утверждением. 7. “В сомнительных случаях полагаться на маммограмму ошибочно. Она необходима после обследования и прощ упы вания молочной ж елезы , чтобы реш ить, будете Вы или нет делать биопсию, если рентген не доступен. Если Вы реш или проводить биопсию - проводите ее. Если Вы уверены, что нет н икаких симптомов для хирургического вмеш ательства или физического обследования, направьте пациентку н а маммограмму. К ак только врач го­ ворит к себе, и особенно, если он говорит пациентке, “Я не совсем уверен, давайте пройдем рентген”, он подсознательно полагается на отрицательный результат маммограммы, когда нужно рассчитывать только на положитель­ ны й. Это - психологическая ловуш ка, в которую все мы склонны попадать, и которая намного серьезней, чем некоторое количество ложно-положитель­ ны х диагнозов, достигнутых при помощи маммографии” (R hoads, 1969, с. 1182). Ни одной биопсии не удастся избежать, применяя эту стратегию. Это позор, ведь сам автор выш еупомянутого утверж дения говорит, что, “суще­ ствует мало областей, в которых требуется так много хирургии, которой можно было бы избеж ать лучш ими методами диагноза, чем в области болез­ ней молочной ж елезы ”. 306 КОВАРИАЦИЯ И КОНТРОЛЬ Мы теперь готовы оценить следующую историю, которая появилась в “Хрониках” в Сан-Ф ранциско (K ushner, 1976). У женщ ины-репортера не­ давно обнаружили опухоль в молочной ж елезе, и она описывает консульта­ цию с врачом. “ Я хотел бы, чтобы Вы прошли ксеромаммограмму. Это новый способ делать маммограммы - снимки молочной ж елезы .” “А она дает точные результаты?” Он пожал плечами, “Вероятно, столь ж е точные, как любой снимок. Вы знаете, - предупредил он, - “даж е, если результат отрицателен - что означает, не злокачественное новообразование - единственный способ убедиться в этом состоит в том, чтобы вырезать опухоль и рассмотреть ее под микроскопом”. Ж енщ ина обсудила эту проблему со своим мужем. “Что сказал доктор?” “Он хочет сделать ксеромаммограмму. Тогда, независимо от результата, опухоль нужно будет вырезать”. “Так, зачем сначала нужно делать рентген?” “Я думаю, потому, что так надо. И наш доктор говорит, что обследование дает правильные результаты приблизительно в 85% случаев.... Так, сначала я записалась на термограмму - она будет либо положительная, либо отрица­ тельная, и если этот результат совпадает со снимками ксеромаммограммы, то статистика говорит, что диагноз был бы на 95% надежный”. Подводя итоги, казалось бы разумно спросить, что, если цель маммографии состоит в том, чтобы помочь врачам отличить доброкачественную от злокачествнной опухоли молочной ж елезы , таким образом не допуская некото­ ры х пациентов на такую более обширную и травмирующую процедуру как биопсия, тогда мы должны позволить обследованию выполнить эту ф унк­ цию . Если с другой стороны, врач всегда должен придерж иваться предш е­ ствующего реш ения о биопсии, и на него не влияет исход маммограммы, мы не долж ны настаивать на том, что цель этого обследования состоит помочь отличить доброкачественную опухоль от злокачественной, так к ак этот вывод будет сделан окончательно исходя из результатов биопсии. Н а­ конец, если цель обследования состоит в том, чтобы искать скры ты й и к л и ­ нически неподозреваемый рак в другой области молочной ж елезы (далеко от прощ упанной опухоли, которая нуж дается в биопсии так или иначе), мы долж ны признать, что вероятность такого события чрезвычайно мала и что использование этого вида обследования равно использованию рентгена. Моя цель не состоит в том, чтобы приводить доводы в пользу политики маммографии или биопсии - чтобы так поступать, нуж ны более качествен­ ные данные и лучш ая оценка ценностей пациентов. Я только хочу предпо­ лож ить, что мы не развили формального способа вероятностного рассужде­ н ия относительно этого типа проблемы, что клинические оценки могут быть неверными, и что текущ ая клиническая стратегия может быть непоследо­ вательна или неправильна. Вероятностные рассуждения... 307 Обсуждение Эти примеры были представлены, чтобы проиллюстрировать сложность при­ няти я реш ения в медицине и продемонстрировать, к ак некоторые врачи уп­ равляю т одним иэ аспектов этой сложности - вероятностями. Случай, кото­ рый мы исследовали - относительно простой, использование единственно­ го диагностического обследования для распределения опухолей на две груп­ пы злокачественные и доброкачественные. Б аза данных для этой проблемы относительно хорош а. Точность и диагностическая ценность процедуры были исследованы и проанализированы во многих учреж дениях в течение многих лет. К ак вы разился один исследователь, “я не знаю ни о какой дру­ гой медицинской процедуре, которая была бы больше проверена и перепро­ верена, чем маммография” (Egan, 1971, с. 1555). Вероятностные методы, обсужденные в этой главе, были известны в те­ чение столетий. В последних двух десятилетиях они применялись все боль­ ш е и больш е для медицинских проблем (например, L usted, 1968), и исполь­ зование систематических методов для управления неопределенностью воз­ растало в учебных планах медицинских факультетов, статьях ж урналов и образовательных программах для аспирантов. В настоящ ее время, однако, применение этих методов было спорадическим и еще не отфильтровалось, чтобы затронуть мыш ление больш инства практикую щ их врачей. К ак про­ иллю стрировано в этом социологическом исследовании, медицинские про­ блемы слож ны , и сила формального вероятностного рассуж дения обеспе­ чивает большие возможности для улучш ения качества и эффективности медицинского обслуживания. 19. Получение знаний из опыта и условно оптимальных правил при принятии решения* Хиллел Дж. Айнхорн Текущ ая работа в исследовании принятия реш ения ясно изменила направ­ ление от описания процессов выбора с помощью нормативных моделей (и их модификации) к постановке акцента на эвристических процессах, раз­ виты х в пределах общей структуры когнитивной психологии и теорий об­ работки инф орм ации (P ayne, 1980; R usso, 1977; Sim on, 1978; Slovic, F ischhoff & L ichnenstein, 1977; Tversky & K ahnem an 1 9 7 4 ,1 ,1 9 8 0 ). Пере­ мещ ение вним ания от вопросов, насколько хорошо люди действуют к тому, к ак они действуют, безусловно, важ но (например, H ogarth, 1975). Однако, полезность изучения двух вопросов одновременно нигде так не очевидна, к ак в исследовании эвристических правил и стратегий. П ричина для этого то, что сравнение эвристических и нормативных правил позволяет исследо­ вать несоответствия между ф актическим и оптимальным поведением, ко­ торое поднимает вопросы, почему такие несоответствия существуют. В этой главе, я концентрирую внимание на том, к ак человек формирует оба типа правил из своего опыта. Интерес к изучению с помощью экспериментов ста­ вит множество проблем, которым не было уделено достаточно внимания; например, при каки х условиях изучаю тся эвристики? К ак они проверяю т­ ся и поддерживаю тся в данном эксперименте? При каки х условиях мы не сможем узнать о предубеж дениях, которые могут следовать из их использо­ вания? Важность изучения для понимания эвристик и выбора поведения может бы ть обнаруж ена, приним ая во внимание следующее: *Это - сокращенная версия книги, которая появилась в редакции Т. S. W allsten. Когнитив­ ные процессы при поведении выбора и принятии решений. Hillsdale, N. J.rLawrence Eribaum Assoc., Inc. Переиздано в соответствии с разрешением. Это исследование было поддержано грантом от Отделения психического здоровья и задер­ жек в развитии штата Иллинойс, Исследования и Развитие № 740-02. Я хотел бы поблаго­ дарить Робина Хогарта за его комментарии по поводу более ранней версии этой книги. Получение знаний из опыта... 309 1. Способность делать прогноз о том, в каких условиях будет использоваться отдельное правило, в настоящ ее время неадекватна (W allsten, 1980). Однако интерес к тому, к ак и при каких условиях правило усваивается, должен уве­ личить способность человека делать прогноз того, когда оно, используется. Например, если правило усвоено в ситуациях, где дано мало времени на то, чтобы сделать выбор, прогнозирование использования такого правила уве­ личено знанием о давлении времени, используемом в задании. 2. Сопутствующее обстоятельство (1) - это то, что должно возможно вли­ ять на то, к ак люди делают оценки и принимаю т реш ения, разрабаты вая ситуации, в которы х задачи вклю чаю т или подобны начальным условиям изучения. Значение этого к ак для помощи, так и для управления людьми, огромно (F ischhoff, Slovic и L ichtenstein, 1978; 1980). 3. И зучение сосредотачивается на переменны х окруж аю щ ей среды и структуре задачи. Поэтому, переменные, такие как количество подкрепле­ ний, план подкрепления, количество испытаний (= колличество проб), и т.д ., долж ны рассматриваться применительно к пониманию способов оценива­ ния и принятия реш ений (см. E stes, 197б). Х отя важность задачи для пони­ м ания поведения непрерывно подчеркивалась (B runsw ik, 1943; C astellan, 1977; Cronbach, 1975; Dawes, 1975b; W .E dw ards, 1971; E inhorn & H ogarth, 1978; Sim on & Newell, 1971), психологи, по-видимому, так ж е склонны к тому, что Росс (Ross, 1977) назы вает фундаментальной ошибкой атрибуции, как и все люди (недооценка факторов окружаю щ ей среды при приписыва­ нии причин). 4. Главная переменная в понимании эвристик - обратная связь исхода. Так к ак обратная связь исхода - главны й источник информации для оцен­ ки качества наш их правил принятия решений /оценивания, знание того, как переменные задачи влияю т к ак на исходы, так и на способ, которым резуль­ таты закодированы и хранятся в пам яти, становится чрезвычайно важ ны м в объяснении того, к ак эвристика изучается и используется. 5. Область изучения представляет собой фокусную точку для рассмотре­ ния относительных достоинств психологических, а не практических объяс­ нений поведения выбора. Некоторые экономисты спорили, что, хотя чело­ век не действует “рационально” все время, он осваивает оптимальное пра­ вило посредством взаимодействия с окружаю щ ей средой. В поддержку это­ го аргумента предоставляю тся неопределенные утверж дения относительно равновесия, эффективности и эволюционных концепций. Поэтому, иссле­ дование, к ак (и насколько хорошо) люди учатся из своего опыта, важ но в освещ ении относительных достоинств психологических и практических теорий выбора. П о л у ч ен и е зн а н и й и з о п ы та: К ак ? Очевидно, что принятие реш ения ориентировано на действие; каж ды й дол­ ж ен вы брать, какое действие соверш ить, чтобы удовлетворить основные 310 КОВАРИАЦИЯ И КОНТРОЛЬ потребности и нуж ды . Поэтому, для любого организма важ но изучить сте­ пень, в которой действия будут вести к ж елательны м или нежелательным результатам. Это означает, что получение знаний из опыта, главны м обра­ зом, должно вклю чать в себя изучение связей действие-исход. Кроме того, так к ак действия и исходы следуют друг за другом, люди склонны видеть связи меж ду ним и к а к вы раж ение причинно-следственны х отнош ений (M ichotte, 1963). Поэтому, сильная тенденция видеть причинные отнош е­ н ия может рассматриваться к ак следствие потребности принимать меры для удовлетворения основных потребностей. Кроме того, к ак показали Канеман и Тверски (K ahnem an и Tversky, 1979b), изучение причинных отношений и организация событий в причинные “схемы” позволяет людям достигать свя­ занной интерпретации их опыта. Наконец, изучение связей действие-исход важ но для понимания того, к ак люди изучают собственные вкусы или по­ требности. Например, рассмотрим ребенка, который выбирает некий овощ, ест его, испытывает неприятный вкус, и , таким образом, учится связывать отрицательную полезность с этим продуктом. Обратите внимание, что имен­ но путем выбора испытываются последствия и усваивается полезность. По­ этому, усвоение связей действие-исход и усвоение полезности тесно связано. Х отя мы получаем знания из опы та, предпринимая действие, к ак чело­ век первоначально учится выбору альтернатив? Несомненно, больш ая часть первоначального изучения происходит методом проб и ошибок; то есть люди беспорядочно делают выбор и наблюдают исходы (ср. Campbell, 1960). Про­ цесс, с помощью которого обучение путем проб и ошибок ведет к развитиюм стратегий или правил, не известен (cp. Siegler, 1979). Однако можно пред­ полож ить, что и подкрепления из эмпирического опы та, и обобщения (как по стимулам, так и по реакциям) играю т важную роль (Staddon и Sim melhag, 1971). В любом случае, правила, которые мы разрабатываем, каж ется, не­ посредственно связаны с получением знаний того, какие исходы будут вы ­ текать из определенных действий. К ак описано выш е, получение знаний из опы та в основном индуктивно по характеру, то есть человек попадает в не­ которые ситуации или случаи, и разрабаты вает эвристику, чтобы обеспе­ чить некоторый общий способ справиться с ними. И ндуктивный характер получения знаний из опы та имеет несколько значений относительно эврис­ тики: 1. Специфика правил. Если получение знаний происходит индуктивно с помощью определенных случаев, то эвристические правила должны силь­ но зависеть от контекста. Большое количество сведений говорит о том, что это действительно так (G rether и P lo tt, 1979, L ichtenstein и Slovic, 1971; Sim on и H ayes, 1976; Tversky и K ahnem an 1980). Способ, которым проблема сформулирована или показана, или ож идается определенная реакция, все это, каж ется, имеет огромное значение для того, к ак обрабатывается инфор­ м ация и порождаю тся ответы. Я ркий пример этой специфики можно обна­ руж ить в работе Саймона и Хайеса (Simon & Hayes, 1976), посвященной “про­ блемным изоморфам” (problem isom orphe). Они показали, что различны е Получение знаний из опыта... 311 поверхностные формулировки идентичных по структуре проблем (то есть, проблем, которые могут быть реш ены, используя идентичные принципы) сильно изменяю т то, к ак люди представляю т проблему в пам яти и , следова­ тельно, реш аю т ее. Важное значение этого результата заклю чается в следу­ ющем: чтобы сделать эвристические модели более прогнозирую щ ими, че­ ловек долж ен столкнуться с задачей, к ак она была ему предоставлена, и не обязательно с ее структурой, к ак видит ее экспериментатор. Особенно яр ­ ким примером важности этого явления при прогнозировании поведения яв­ ляется наблюдение, что поведение зависит от того, представлено ли сокра­ щ ение налогов к ак выгода или к а к меньш ий убыток (K ahnem an и Tversky, 1979b). 2. Общность правил. Если эвристики - это правила, изученные с помо­ щью индукции, необходимо сгруппировать задачи по подобию, иначе было бы столько правил, сколько и ситуаций. Так к ак последняя возможность недопустима, эвристика долж на иметь некоторую общность по задачам. Од­ нако это заклю чение противоречит тому, что было сказано выш е относи­ тельно зависимости от контекста и специфичности правил. Этот парадокс мож ет быть реш ен, если рассмотреть диапазон задач, к которым правило мож ет прим еняться. Н апример, рассмотрим правило “Н икогда не заказы ­ вайте рыбу в ресторане, специализирую щ емся на м ясе.” В то время к ак та­ кое правило является общим относительно некоторого типа ресторанов, оно, безусловно, более определенно, чем правило “О ценивайте вероятность, с которой событие В происходит из процесса А их степенью подобия” (Tversky и K ahnem an, 1974,1). Очевидно, последняя эвристика имеет намного более вы сокий уровень общности. Ф актически, эвристики, такие к ак репрезента­ тивность, доступность, привязка, и регулировка - “метаэвристики,” то есть они - правила о том, к ак производить правила. Поэтому, когда человек стал­ кивается с задачам и, с которыми он не встречался прежде (подобно оценке вероятности событий), или задачам, специф ика которых заставляет их к а ­ заться новыми, метаэвристика определяет способ, с помощью которого оп­ ределенные правила могут быть сформулированы для реш ения проблемы. И дея о метаэвристиках позволяет сохранить общность, которую любое пра­ вило обязательно подразумевает, и в то ж е время учитывает важ ны е эффек­ ты контекста, формулировки, способа ответа, и так далее. Чтобы проиллю­ стрировать это, рассмотрим исследование Словика, Ф ишхоффа и Л ихтен­ ш тейна (Slovic, Fischhoff и L ichtenstein, 1976; см. такж е Главу 33), в кото­ ром людей просили оценить относительные вероятности смерти от необыч­ ны х причин. Например, что более вероятно: быть убитым молнией или уме­ реть от эмфиземы*? Когда люди сталкиваю тся с таким вопросом, сущ еству­ ет много способов попы таться ответить. Одно из правил, которое могло бы использоваться, гласит: “Вспомнить знакомы х мне людей, которые умерли от двух причин, и выбрать ту, из-за которой умерло больше людей”. В моем *Эмфизема - заболевание легких ( п рим , р е д а к т о р а ) . 312 КОВАРИАЦИЯ И КОНТРОЛЬ собственном случае, я выбрал бы эмфизему (что имеет более высокую веро­ ятность, хотя большинство людей выбирает удар молнии). Однако, я мог бы такж е легко разработать правило, которое приведет к противоположному ответу; например, “Вспомнить о всех случаях смерти от удара молнии и от эмфиземы, о которы х я когда-либо слышал (газеты , телевидение, и т.д .)”. Если бы это было моим правилом, я выбрал бы удар молнии к ак более веро­ ятны й. Обратите внимание, что в обоих случаях я использовал эвристику доступности. Ясно, что способ, которым вопрос был сформулирован, мог сти­ мулировать определенные правила, что привело бы к различны м результа­ там, и все ж е эти определенные правила могли бы быть систематизированы под отдельную , более общую стратегию или метаэвристику (такж е см ., E inhorn, K leinm untz и K leinm untz, 1979). 3. Сила эвристики. Если эвристика усваивается индуктивно, то усвое­ ние происходит в течение многих испы таний с многократным закреплени­ ем. Мы увидим, благодаря способу, которым осуществляется обратная связь, и благодаря методам, которые мы используем, для проверки правила опы­ том, положительное закрепление может происходить даж е для неправиль­ ны х правил (W ason, I960). Кроме того, в дополнение к большому количе­ ству закрепления, которое мы испы ты ваем, размер или интенсивность зак­ репления мож ет быть такж е большим. Например, получая значительную сумму денег после использования некоторого правила в выборе акций, мы долж ны испы ты вать значительны й эффект закрепления. Поэтому, в отли­ чие от лабораторных исследований процессов обучения, где этические сооб­ раж ения предотвращ аю т получение большого положительного и отрица­ тельного подкрепления, наш собственный опыт не ставит никаких подоб­ ны х ограничений. П о л у ч ен и е зн а н и й и з о п ы та: Н а с к о л ь к о хорош о? Вопрос, насколько хорошо мы получаем знания из опыта, переклю чает вни­ м ание на сравнение эвристических правил с оптимальны ми правилам и. Поэтому, возникает вопрос, к ак последние изучаю тся и каковы их значе­ н ия для применения в наш ем собственном опыте? Оптимальные правила, такие к ак теорема Байеса, оптимизация, и т.д ., изучаю тся дедуктивным путем. Ф актически, многое из того, что мож ет назы ваться формальным изучением, имеет дедуктивный характер, то есть нам преподают научные законы , логические принципы , математические и статистические прави­ л а, и т.д. Такие правила по своей природе очень абстрактны и не зависят от контекста. Кроме того, когда контекст может влиять на форму правила, нам часто говорят, что правило сохраняется, “при прочих равны х условиях”. Конечно, в наш ем собственном опыте “прочие условия” редко равны , что делает изучение оптимальных правил с помощью индукции столь трудным. (П ервоначальны е исследователи или изобретатели оптимальны х правил преодолели эти трудности; однако, это отличает их от остальной части нас.) Получение знаний из опыта... 313 А бстрактны й характер дедуктивны х правил имеет большое значение относительно трудностей, с которыми сталкиваю тся люди при применении оптимальны х методов в определенных ситуациях. Эта трудность сосредо­ тачивается вокруг способности различать структуру задач, встроенную в большое количество подробностей. Поэтому, когда перед нами стоит опре­ деленная проблема, богатая на детали, и в которой детали могут быть несо­ ответствующими или избыточными, внимание к специфическим особенно­ стям, вероятно, отвлечет внимание от общей структуры проблемы. Ф акти­ чески, именно абстрактность дедуктивно изучаемы х оптимальных правил не позволяет им восстанавливаться из пам яти (см. N isbett и др., 1976, см. г л. 7). А бстрактные правила, поэтому, могут быть “не доступны” в опреде­ ленны х случаях. Однако спорный вопрос не реш ен, так к ак важ но знать, почему эти правила не доступны. Рассмотрим способ, которым комбинации действие-исход, вероятно, орга­ низованы и сохранены в памяти. В частности, рассмотрим, будет ли такая информация организована и сохранена в памяти по содержанию или по струк­ туре задачи. К аж ется более легким и “естественным” организовать комбина­ ции действие-исход скорее по теме, чем по структуре; например, опыт со ш ко­ лой, родителями, людьми противоположного пола и т.д ., чем задачи Байеса, ситуации выбора, проблемы оптимизации и так далее. Ф акт, что содержание может отличиться, в то время к ак структура остается той ж е, весьма трудно увидеть (Einhorn и др., 1979; K ahnem an & Tversky, 1979b; Simon & Hayes, 1976). Поэтому, я думаю, вряд ли большинство людей организует свои опы­ ты по структуре задачи. Я не говорю, что человек не может научиться дей­ ствовать таким образом. Ф актически, большая часть профессионального обу­ чения именно такова; например, человека обучают обращаться с проблема­ ми к ак принадлежащ ими к некоему классу проблем, имеющих данную струк­ туру и (иногда) известное решение. Оптимальные правила, таким образом, могут быть “доступны” с помощью обширного обучения. Конечно, существу­ ет опасность, что такие правила будут чересчур легко доступны; то есть про­ блемы вынуждены складываться в несоответствующую структуру, потому что реш ение существует в пределах этой структуры. Банально, что при стол­ кновении с проблемой, профессионалы рассматривают ее в пределах струк­ тур, видеть которые они были обучены. Поэтому, хотя обучение профессио­ нала действительно включает структуры, такое обучение находится в преде­ лах узко определенной содержательной области. Дальнейшие сведения, иллюстрирующие потребность в группировании про­ блем скорее по содержанию, чем по структуре, приводятся при рассмотрении способа, с помощью которого организовано и изучается знание людей о мире. Например, специализированное образование, профессиональное обучение, каталогизация информации в библиотеках и энциклопедиях, и так далее, ил­ люстрирует организацию информации скорее по содержанию, чем по структу­ ре. В то время как существуют большие преимущества в организации знания таким образом, имеются также и недостатки. Трудность применения оптималь­ 314 КОВАРИАЦИЯ И КОНТРОЛЬ ны х правил, разработанных в одной содержательной области, для подобных по структуре проблем в других содержательных областях может быть одним таким недостатком. Однако на уровне отдельного ученика рассматриваются другие трудности, которые могут иметь еще большие недостатки. Х отя структуру задачи трудно различить, а исходы - легко, они четко видимы , доступны и часто однозначны. Рассмотрение закрепления с помо­ щью обратной связи исхода необходимо в понимании того, к ак эвристика сохраняется, несмотря на опыт. Кроме того, если исходы - в значительной степени ф ункция структуры задачи, и у человека, принимающего реш ения, недостаточно знания такой структуры , то правила, которые являю тся несо­ ответствующими или даж е недостаточными, могут все еще укрепляться по­ лож ительной обратной связью исхода. (Например, “суеверное” поведение ж ивотны х при обучении; см. Staddon и Sim m elhag, 1971.) П редставлены два примера, где нормативно неподходящ ая эвристика мож ет привести к хорошим исходам и где может отсутствовать понимание плохого качества правила. Рассмотрим человека, который в магазине под­ ходит к банкам с соком со следую щ ими ценами и качеством (взято из Tversky, 1969): Качество Торговая м арка Ц ена Высокое X 60 центов Среднее Y 55 центов 50 центов Z Н изкое Предположим, что я использую следующее правило, чтобы выбрать одну и з трех марок: если различие в цене - пять центов или меньше, то я выбираю марку с более высоким качеством; если различие в цене больше, чем пять цен­ тов, я выбираю согласно цене. Такое простое правило (которое является лекси­ кограф ическим полу-упорядочиванием) подразумевает: Х > Y, Y> Z, но Z > X. Поэтому, это правило ведет к нетранзитивным выборам, которые я в ­ ляю тся иррациональными. Однако, обратите внимание, что после того, как я выбираю X, а не Y, то я устраняю Y из оставшегося множества и сравниваю X с Z. Поэтому, я останавливаюсь на Z, который может оказаться весьма при­ емлемым после того, к ак я попробую сок. Затем я поздравляю сам себя с тем, что я такой хороший покупатель - я сэкономил деньги и сделал хорошую по­ купку. Важный пункт, на который стоит обратить внимание - то, что не де­ лается сравнения Y с Z, и я не сознаю, что мое правило приводит к нетранзи­ тивному выбору. Все, что я знаю - то, что я сделал выбор с минимальной суе­ той и напряж ением, и исход был удовлетворителен. Положительная обрат­ н ая связь исхода, таким образом, укрепляет нормативно неподходящее пра­ вило, и отсутствует понимание, что что-то неправильно. Второй пример - вероятностный (cp. Schum, 1980). Вообразите, что Вы военный генерал в политически напряженной области, и Вы обеспокоены тем, что Ваши враги вторгнутся в Вашу страну. Кроме того, из прошлого опыта Вам известно, что, когда вражеские отряды подходят к границе, вероятность Получение знаний из опыта... 315 вторж ения - 0.75. Однако у Вас нет прямого доступа к информации относи­ тельно враж еских отрядов, и Вы вынуждены полагаться на сообщение ва­ ш их развед чиков о таких действиях. К ак оказывается, каж ды й раз ваш и ис­ точники разведки сообщают, что отряды сосредотачиваются и что они - дей­ ствительно там. Предположим, что Вы теперь получили сообщение из ваш их источников, что враж еские отряды - на границе. Какова вероятность втор­ ж ения? Более формально, пусть Н = гипотеза, что будет вторжение D = отряды , сосредотачивающиеся н а границе D* = сообщение об отрядах, сосредотачивающихся на границе В задаче дано, что р (H|D) = 0.75 и р (D|D*) = 1.0 и спраш ивается относи­ тельно р (H|D*). Если Вы подобны большинству людей, Вы, вероятно, отве­ тите 0.75. Однако, данной информации не достаточно, чтобы ответить на этот вопрос нормативно правильным способом. Ф актически, возможно, что в выш еупомянутой задаче р (H|D *) = 0. Так к ак большинство людей счита­ ет, что в это трудно поверить, рассмотрим Рисунок 1, в котором эта задача проиллюстрирована посредством диаграммы Венна. Обратите внимание, что пересечение Н с D* пустое, так, что условная вероятность, р (H|D*), нуле­ вая. П ричина, по которой люди считают этот результат таким неожидан­ ным, состоит в том, что они сделали логическую ошибку: если D* =>D , тог­ да D => D*. Х отя D происходит всякий раз, когда дано D*, наоборот проис­ ходит не всегда. Ф актически, интуитивны й способ видения проблемы со­ стоит в том, чтобы думать, что враг настолько хитер, что ваш а разведка ви­ дит их отряды только тогда, когда не планируется никакого вторж ения. Однако когда вторжение запланировано, и отряды на границе, они скрыты настолько хорошо, что ваш и источники не сообщают о них. Рис. 1. Д иаграмма Венна, показы ваю щ ая отнош ения между гипоте­ зой (Н), данной величиной (D) и сообщением о данной величине (D *) 316 КОВАРИАЦИЯ И КОНТРОЛЬ Этот пример иллю стрирует трудность применения оптимальных правил (в этом случае, правил формальной логики) к определенной задаче. В то вре­ м я к а к очень мало людей сделали бы логическую ош ибку, когда она пред­ ставлена в очевидной форме, важность примера - показать, к ак определен­ ны е особенности задачи скрываю т ее реальную структуру так, чтобы опти­ мальны е правила были легко наруш ены (см. TVersky и K ahnem an, 1980). В отнош ении этого примера такж е можно сказать о следующем. П редположим, что генерал делает логическую ошибку и оценивает веро­ ятность войны к ак 0.75. Тогда он посылает свои войска к границе, таким образом, вы зы вая враж еское вторж ение. Следовательно, неправильное рассуждение генерала подкреплено обратной связью исхода: “В конце кон­ цов, - он мог бы сказать, - они напали на нас, к ак мы раньш е и предполага­ л и ”. Эти два примера иллю стрирую т основной момент этой главы: без знания структуры задачи, обратная связь исхода может быть несоответствующей или даж е вредной для исправления неправильной эвристики. Кроме того, полож ительная обратная связь исхода без знания задачи не дает понять, что наш и правила являю тся неподходящ ими, так как нет ж елания задавать воп­ рос, к ак был достигнут успех. Условия, при которых обратная связь исхода не играет исправляю щ ей роли в отношении эвристики и стратегий, обозна­ чен ы к а к н есоответствую щ и е исходу структуры п о л у ч ен и я зн ан и й (НИСПЗ). Такие структуры могут быть намного более распространены, чем мы думаем. Перед тем, к ак исследовать одну из таких структур подробно, рассмотрим вероятностные оценки в пределах структуры НИСПЗ, так как многие работы по эвристике непосредственно рассматриваю т эти типы оце­ нок. Предположим, что Вы оцениваете вероятность некоторого события, как 0.70. Пусть событие не происходит. Что этот исход говорит вам о качестве правил, использованных для оценивания? Можно поспорить, что любого единственного исхода недостаточно, чтобы оценить “совершенство” (то есть, степень калибровки) вероятностных оценок. Поэтому, в важном смысле, не­ посредственная информация исхода не подходит для исправления непод­ ходящ ей эвристики. Только в том случае, если Вы ведете “таблицу” относи­ тельной частоты исходов при оценке события с данной вероятностью, мож ­ но получить значительную обратную связь от исходов. Однако это является необходимым, но не достаточным условием для создания соверш енных оце­ нок. Во-первых, какой период времени человек рассматривает таблицу пе­ ред тем, к ак реш ить, является ли оценка откалиброванной или нет? Кроме того, насколько близким является “достаточно близко”, чтобы говорить, что оценка точна (в смысле хорошо калибрована)? Обратите внимание, что весь этот способ оценки исходов вклю чает подкрепление, которое отсрочено на длительны й период времени. Таким образом, ясно, что такая обратная связь не произведет значительны й эффект само-исправления. Во-вторых, чтобы научиться определять совершенство правил для оценки вероятности, таб­ лица долж на вклю чать не только оценки и конечные исходы, но такж е и Получение знаний из опыта... 317 правила для получения этих оценок. Н апример, если я хранил записи исхо­ дов для 100 случаев, в которы х я дал оценки 0.7, что даст мне информация о том, что 53 из этих событий произош ли, относительно качества правил, ко­ торые я использовал? Так как вероятно, что много различны х правил могло использоваться, чтобы оценить вероятности в 100 различны х ситуациях, информация исхода нерелевантна, и обратная связь исхода не значительна, если только человек не знает правил и не хранит запись об их использова­ нии (см. N isbett и W ilson, 1977, о том, знаем ли мы наш и собственные ког­ нитивные процессы). Я не подразумеваю, что невозможно научиться делать совершенные оцен­ ки вероятности. Если человек делает много оценок вероятности в одной и той же ситуации, к ак , например, синоптики или те, кто пы тается пред­ сказать исходы конны х скачек, и обратная связь исхода быстро получена, такие условия не могут быть нерелевантными исходу, и обратная связь мо­ жет иметь само-исправляю щ ий характер. Однако такие условия были бы скорее исклю чением, чем правилом для больш инства из нас. Х отя вероятностные оценки типично происходят в НИСПЗ, к ак ж е на­ счет не вероятностных оценок? Конечно, если человек делает прогноз, он может проверить и увидеть, является ли прогноз правильным или нет. По­ этому, казалось бы, исходы должны быть релевантными для обеспечения само-исправ ляю щ ейся обратной связи. Оставш аяся часть этой главы обсуж­ дает эту проблему в пределах контекста одной общей и распространенной структуры задачи, хотя определенное содержание таких задач может быть весьма различно. Задача вы бора 1 Рассмотрим общую задачу, вовлекающую не вероятностные оценки, так как информация исхода каж ется к ак доступной, так и уместной в обеспечении само-исправляющейся обратной связи. Задача, которую нужно рассмотреть та, в которой оценки сделаны с целью выбора между альтернативными дей­ ствиями. Н апример, рассмотрим ситуацию с двумя возможными действия­ ми, А и В. Обозначим за х целое, оценочное суждением которое может само быть ф ункцией различны х типов и количества информации. Кроме того, пусть хс такой предел, что Если х > х с, соверш аем действие А; если х < хс, соверш аем действие В Хоть оно и упрощ ено, уравнение 1 прим еняется ко многим ситуациям, а такж е ситуациям оценки/реш ения, например: трудоустройство, продвиже­ ние по служ бе, поступление в ш колу, предоставление кредита, назначение на коррекционны е программы, участие в социальных программах, приня1 Многое из этой главы взято из Айнхорн и Хогарт (Einhorn и Hogarth , 1978) 318 КОВАРИАЦИЯ И КОНТРОЛЬ Y (поведение) Рис. 2. Комбинации действие-исход, которые следуют из использова­ н и я оценок для реш ения относительно принятия-отклонения тие статьи в ж урнал, предоставление гранта, и т.д. В этих случаях оценка степени “достойности” обычно определяет, какое действие должно быть со­ верш ено, так как предпочтительное действие не может быть применено ко всем.Чтобы сравнить оценку со стандартом, существует критерий, обозна­ ченны й у, и служ ащ ий основанием для определения точности оценки. В то время к ак практические трудности обнаружения и развития адекватных критериев огромны, в данном случае вним ания сосредотачивается на тео­ ретических: концепция критерия - то, что необходимо для этого анализа. Чтобы быть совместимым с формулировкой оценки, далее допускается, что критерий имеет предел (ус) такой, что у > уси у < усслуж ат основанием для определения исходов оценки. Таким образом, поскольку мы рассматрива­ ем учение об оценках, представление исходов в пам яти имеет часто катего­ риальную форму, то есть успехи и неудачи (см. E stes, 1976). Очень важ но обратить внимание, что структура задачи - та, в которой оценки (прогнозы) приводят к различны м действиям и что исходы исполь­ зую тся к ак обратная связь для определения точности прогнозов. Ф ормаль­ н ая структура может быть замечена при рассмотрении регрессии у от х, а такж е четы рех секторов, которые следуют из пересечения хс и ус как пока­ зано на Рисунке 2. Обозначим правильны е прогнозы к ак положительные и отрицательные попадания и два типа ошибок как ложные позитивы (у < у(.| х > хг)к лож ны е негативы (у > ус | х <хс). Чтобы оценить отнош ения между х н у (то Получение знаний из опыта... 319 есть, корреляцию между х и у , рху) необходимо иметь информацию относи­ тельно каждой комбинации оценка-исход. Предположим сначала, что та­ к ая и нф орм ац ия становится доступной через какое-то врем я (то есть, последовательно), и рассмотрим экспериментальные сведения относитель­ но получения знаний об отношениях между х н у при таких обстоятельствах. Исследование способности оценивать случайности между х н у , исходя из информации в таблице 2 x 2 (Jenkins и W ard, 1965; Sm edslund, 1963; 1966; W ard и Jen k in s, 1965) указы вает, что люди судят о силе связей с помощью частоты полож ительны х попаданий (в терминологии рис.2), игнорируя ин­ формацию в трех других ячейках. Эти результаты чрезвычайно важ ны , так как они говорят, что даже если вся соответствующ ая информация исхода доступна, люди не используют ее. Это означает, что в лабораторных иссле­ дованиях, которые имеют релевантные относительно исхода структуры изу­ чения, люди преобразовали их в нерелевантные для исхода структуры изу­ чения. Чем это мож ет объясняться? Приведем объяснение: наш опыт в задачах реальной ж изни является та­ ким, что мы развиваем правила и методы, которые, к ак каж ется, вполне хорошо “работаю т”. Однако эти правила могут быть весьма неправильны ­ ми, и наш е понимание их несоответствия глубоко. Этот недостаток понима­ ния сущ ествует, потому что полож ительная обратная связь исхода может происходить, скорее, несмотря, чем благодаря наш ей прогнозирующей спо­ собности. Чтобы проиллю стрировать это, рассмотрим исследование Басона (W ason, I960), в котором он предоставлял испытуемым последовательность с тремя числам и, например: 2 ,4 ,6 . Испытуемых просили обнаружить пра­ вило, которому эти три числа подчинялись (правило, расположения по воз­ растанию). Чтобы обнаруж ить правило, им разреш али создавать наборы трех чисел, которые экспериментатор классифицировал к ак подходящ ие или не подходящ ие под это правило. В любой момент испытуемые могли остановиться, когда они думали, что они обнаружили правило. Правильное решение этой задачи должно вклю чать поиск опровергающего свидетель­ ства, а не накопление подтверждаю щ их. Например, если кто-то предпола­ гал, что правило имеет некоторое отношение к четным числам, это могло быть проверено только, перебирая последовательность, включающую нечет­ ные числа (то есть, накапливание большого количества подтверждающ их примеров последовательностей четных не будет вести к правилу). То, что только 6 из 29 испытуемых наш ли верное правило с первого раза, иллю ст­ рируют опасность индукции простым перечислением. К ак указы вает Б а­ сон (W ason, 1960), реш ение этой задачи должно вклю чать “готовность пы ­ таться фальсифицировать гипотезы, и таким образом, проверять те интуи­ тивные идеи, которые так часто придают чувство уверенности “ (с. 139, нами добавлено выделение курсивом). Важно подчеркнуть, что в эксперименте Басона, где не было действий, возможен поиск опровергающего свидетельства. Однако когда действия ос­ нованы на оценке, изучение, основанное на опровергающем примере, ста­ 320 КОВАРИАЦИЯ И КОНТРОЛЬ новится более трудным. Рассмотрим, к ак можно было ошибочно усвоить неверное правило для оценивания, и рассмотрим гипотетическую ситуацию с менеджером, изучающ им свою прогнозирующую способность относитель­ но “потенциала” кандидатов на работу. Важный фактор здесь - то, что дей­ ствия (например, принимать / не принимать) - зависят от оценок. В следу­ ю щ ий раз менедж ер может только экзаменовать принятых кандидатов, чтобы проверить, сколько из них “успеш ны”. Если успехов много, что веро­ ятно, тогда все эти случаи подтверждают правило. Действительно, важ ны й момент - то, что было бы трудно опровергнуть правило, даж е при том, что оно могло быть ошибочным. Одним из способов, которым менеджер может проверить правило, будет принять несколько человек, которые, к ак он оце­ нивал, имели низкий потенциал и затем понаблюдать за их успехами. Если бы их успехи были столь ж е вы соки, к ак и у кандидатов с оцененным высо­ ким потенциалом, правило было бы опровергнуто. Однако систематический поиск опровергающ их свидетельств редок, и против него можно было бы возраж ать на прагматических и даж е этических основаниях, то есть чело­ век был бы должен отказать в предпочтительном действии тем, кого он оце­ нил к ак более достойных, и передать его тем, которые были оценены как наименее достойные. Поэтому, прагматические и /и л и этические соображе­ н ия могут препятствовать даж е мыслям о возможности сбора опровергаю­ щ ей информации. Обратите внимание, что тенденция не проверять гипоте­ зы контрпримерами - прямое следствие структуры задачи, в которой дей­ ствия приняты на основе оценок. Васон (W ason, 1960) указы вает, “В реаль­ ной ж изни нет силы , позволяю щ ей делать оценку на основании выводов: выводы могут только быть проверены данны ми” (с. 139). В результате, мно­ го положительной обратной связи мож ет привести к укреплению невалид­ ного правила. Х отя влияние исходов на несовершенное действие может не рассматри­ ваться, возможно, что человек будет исследовать количество полож итель­ ны х попаданий и лож ны х положительных к ак способ проверить точность прогнозов. Поэтому, в то время как такая информация неполна для точной оценки отнош ений между прогнозами и исходами, такая информация - то, что доступно большинству людей. Поэтому важ но рассмотреть факторы , ко­ торые затрагиваю т эти переменные. Ф а к т о р ы , в о зд ей ств у ю щ и е н а п о л о ж и те л ь н ы е п о п а д а н и я и л о ж ­ н ы е п о л о ж и те л ь н ы е Рассмотрим Рисунок 2 снова и обратим внимание, что существуют три ф ак­ тора, которые затрагиваю т пропорции положительных попаданий и лож ­ ны х позитивов; местоположение хс, ус, и “наклон” эллипса (который я в л я­ ется корреляцией между х и у). Например, если хссмещен направо, а значе­ н и я хс и рхупостоянны, имеется точка, в которой не будет никаких лож ных позитивов. Конечно, будет соответствующее увеличение лож ны х негативов. Получение знаний из опыта... 321 Однако если у человека нет информации относительно этих случаев (как ситуации вообще), опыт успеха может убеждать, что качество оценивания высоко. Поэтому, когда критерий для предоставления предпочтительного действия поднят (увеличивая хс), вероятность того, что р (х > хс) (такж е на­ зываемое отношением выбора, <р), уменьш ится, и это приведет к высокому положительному попаданию и низким пропорциям ложных позитивов. Дру­ гой ф актор, ус, очевидно влияет на исходы, так к ак уровень ус определяет успех и неудачу. Обратите внимание, что когда значение ус пониж ается, вероятность, что р (у > ус) (такж е назы ваем ая базовым значением, Ьг, уве­ личивается, и опыт успехов мож ет быть высок независимо от способности к оцениванию; то есть если бы вы наугад назначили людей для выполнения различны х действий, вы бы получили пропорцию успеха, равную р (у > ус). Поэтому, чтобы оценить способность к прогнозированию , должно быть про­ ведено сравнение пропорции положительного попадания с р (у >уе), и спо­ собность к оценке определена при незначительном увеличении в успехе. Тре­ тий ф актор, р „ . прямо пропорционален исходам; то есть, чем больше pv . тем больше процентное отношение полож ительны х попаданий. Влияние этих трех факторов на процентное отношение положительных попаданий хорошо известно. Тейлор и Расселл (Taylor & R ussell, 1939), на­ пример, показали, что можно повысить процентное отношение положитель­ ны х попаданий, для любых данны х рху и базового значения, путем умень­ ш ения отнош ения выбора (<р), то есть, предоставляя предпочтительное дей­ ствие меньш ему проценту людей (допустим, р v„ * 0). Таким образом, даж е если р ху низкое, возможно получить высокое процентное отношение поло­ ж ительны х попаданий, зависящ ее от величин (р и Ьг. Тейлор и Расселл (1939) приводят таблицы процентных отнош ений положительных попаданий для большого разнообразия значений р , <р и Ьг. Исследование этих таблиц по­ казы вает, что н изкая корреляция между оценками и критериям и вполне совместима с большим процентным отношением положительных попада­ ний. В дополнение к трем уж е упомянутым факторам необходимо рассмотреть и четверты й ф актор. Он может быть проиллю стрирован с помощью следую­ щего воображаемого эксперимента. Пусть о некоторых лю дях сделано не­ которое множество оценок. Половину из тех, которые были оценены выш е хс, наугад назначаем вы полнять действие А , а вторую половину - действие В. Подобным образом поступаем с теми, чья оценка не превысила хс. Через некоторое врем я измеряем поведение и подсчитываем пропорцию людей с у > усв каж дой клетке (каж дому человеку приписано 1 или 0, чтобы обозна­ чить, ниж е он или выш е предела у - пропорция, больш ая усв таком случае просто среднее клетки). Это факторны й план 2x2, причем один фактор - это “оценка”, а другой “тип действия”. Заметьте, что так как критерий не мо­ ж ет быть измерен непосредственно перед решением (и действительно, если это было бы так, то в оценке не было бы необходимости), люди, получающ ие действия А и В, такж е получили различное экспериментальное воздействие. 322 КОВАРИАЦИЯ И КОНТРОЛЬ Если бы этот эксперимент был проведен, можно было бы протестировать ос­ новное влияние оценки (что измеряет его точность); основное влияние на действие, то есть, влияет ли само получение А или В на поведение; и взаимо­ действие между оценкой и действием. Обратите внимание, что преимущ е­ ство эксперимента состоит в том, что он позволяет нам узнать точность оцен­ ки из влияния отнош ения действия. К ак бы там ни было, такой экспери­ мент редко проводится, даж е умозрительно, и, конечно ж е, он не проводит­ ся лю дьми, не прош едш ими углубленное обучение планированию экспери­ ментов. Таким образом, точность оценок всегда будет связана с возможным влиянием отнош ения, обусловленного действием. Более того, ссы лаясь на более раннее обсуждение, можно сказать, что этот эксперимент позволяет проверить опровергающую информацию. В отличие от больш инства реаль­ ны х оценочных задач, он позволил бы опровергнуть гипотезу точности оцен­ к и , также как и оценить любое влияние отнош ения, обусловленного дей­ ствием. П ример влияния отнош ения показан на Н исунке 3. Эллипс, изображен­ ны й пунктиром, тот ж е, что и был наН исунке 2, и он показы вает “истин­ ное” взаимоотнош ение между оценками и исходами. Заш трихованная об­ ласть обозначает наблюдаемые исходы; таким образом, показаны только зна­ чения, для которы х х > хс. В лияние отнош ения проявляется в том, что ис­ ходы (т.е. поведение) всех людей, которым было дано действие А , увеличе­ ны на некоторую константную величину, так что количество полож итель­ ны х попаданий больше, чем если бы она была при отсутствии эффекта отно­ ш ения. С психологической точки зрения главны й аспект на Рис. 3 - это то, характер обратной связи искаж ен, количество полож ительны х попада­ ний резко увеличилось, а количество лож ных позитивов резко сократилось. Y (поведение) Рис. 3 Влияние отнош ения на пропорцию наблюдаемых полож итель­ ны х попаданий Получение знаний из опыта... 323 Чтобы измерить влияние четырех выш еупомянутых факторов на пропор­ цию полож ительны х попаданий, Айнхорн и Х огарт (Einhorm & H ogarth, 1978) смоделировали эксперимент, в котором различные уровни воздейству­ ющих факторов отнош ения выбора, базового значения и способности к про­ гнозированию изменялись по факторному плану. Зависимой переменной было процентное отношение положительных попаданий. Результаты этого эксперимента могут быть представлены следующим образом: (а) в общем, пропорция полож ительны х попаданий больше, чем 0.50. Если существует влияние отнош ения, то процентное отношение положительных попаданий может быть высоко даж е при рху= 0; (Ъ) когда (р < Ьг, процентное отноше­ ние полож ительны х особенно высоко. Кроме того, пропорция полож итель­ ных попаданий зависит от влияния отнош ения при низких значениях р . Это означает, при ситуациях выбора плохая способность к прогнозирова­ нию, закрепится положительной обратной связью исхода, (с) При <р > Ьг, отношение полож ительны х попаданий - наименьш ее. Однако, малые воз­ действия факторов имеют существенное влияние на увелечение процентно­ го отнош ения положительных попаданий в этих ситуациях. Результаты смоделированного эксперимента показывают, что положитель­ ная обратная связь может существовать, если способность к прогнозирова­ нию крайне м ала, и что осознание этого обычно мало из-за неудачи соответ­ ственно понять структуру задачи. Поэтому, хотя можно было предположить, что не вероятностные оценки сделаны в уместной исходу структуре изуче­ ния, когда оценки делаются с целью реш ения, какое действие предпринять, информация исхода может быть нерелевантной для обеспечения само-исправляющ ейся обратной связи. Заклю чен и е 2 Основной темой этой главы было, что информация исхода, без знания струк­ туры задачи, может быть несоответствующей для обеспечения само-исправляю щ ейся обратной связи относительно неподходящ ей эвристики. Такж е обсуждалось, что знание структуры задачи трудно достичь из-за индуктив­ ного способа, которым мы получаем знания из опыта (см. Ham m ond, 1978, Галилейевский способ мы ш ления против Аристотелевского). Эти выводы поднимают две проблемы, которые будут кратко обсуждены. М ожет быть, что даже со знанием структуры задачи, человек действует таким способом, который меш ает получению знаний. Например, рассмот­ рим официанта в ш умном ресторане. П оскольку у него нет времени, чтобы обеспечить хорошее обслуживание всем клиентам, он делает прогноз, отно­ сительно того, каки е клиенты оставят хорошие или плохие чаевые. Хоро­ 2Я бы хотел поблагодарить J. Е. R. Staddon за поднятие проблем, обсужденных в этой гла­ ве. 324 КОВАРИАЦИЯ И КОНТРОЛЬ ш ее или плохое обслуживание распределяется в зависимости от прогноза. Если качество обслуживания оказы вает влияние на размер чаевых, исходы “подтверждают” первоначальные прогнозы. Обратите внимание, что офици­ ант мог бы провести эксперимент, чтобы не допускать зависимости качества обслуживания от своих предсказаний, если бы он знал структуру задачи; то есть он мог бы предоставлять плохое обслуживание некоторым лю дям, кото­ рые, к ак он судил, оставят хорошие чаевые, и хорошее обслуживание тем лю­ дям, которые, к ак он оценил, оставят плохие чаевые. Однако обратите вни­ мание, что официант должен захотеть рискнуть возможной потерей дохода, если его суждение точно, взамен на знание, что его оценка является непра­ вильной. Последняя информация может принести ему отдаленную выгоду, так к ак она может побудить его делать прогнозы лучш е или, если это невоз­ можно, использовать стратегию предоставления хорошего или плохого об­ служ ивания наугад, таким образом, экономя много умственных усилий. В принятии решений в организациях, отдаленные выгоды от знания точности прогнозов могли быть существенны. Например, если отборочные собеседова­ ния не прогнозируют выполнение работы (независимо от влияния отноше­ ния), зачем тратить деньги и время, используя их? Поэтому, затраты и выго­ ды от короткосрочных стратегий для действия по сравнению с отдаленными стратегиями получения знаний должны быть более тщ ательно исследованы. Вторая проблема возникает при рассмотрении следующего вопроса: и зу­ чаю т ли люди, и продолжают ли они использовать несоответствующие пра­ вила, и не противоречит ли это эволюционной концепции вы ж ивания силь­ нейш их? Под этим вопросом я подразумеваю, что те, кто используют не­ адекватны е правила, менее вероятно, должны вы ж ить, чем те, кто исполь­ зуют лучш ие правила (они - сильнее). Однако, использование лучш их пра­ вил все еще весьма далеко от использования оптимальны х правил. Концеп­ ц и я наибольш его “соответствия” вклю чает относительное упорядочение, в то время как оптимальность подразумевает некоторый абсолютный уровень. Следовательно, тот ф акт, что условно оптимальные правила сохраняю тся, несмотря на опыт, не противоречит теории Дарвина. Возможно, наиболее краткий способ вы разить это процитировать Эразма: “В стране слепы х, и одноглазый человек - король.” 3 3 Смысл этой цитаты состоит в том, чтобы указать, что о т н оси т ельн ы е преимущества в отношении окружающей среды важны. Мы не оскорбляем слепых людей. Том Воллстейн сделал следующий комментарий, “В стране слепых, одноглазый человек может выжить, только закрыв свой глаз, так как окружающая среда будет устроена так, что он будет пола­ гаться на другие чувства”. Хотя это - очаровательный комментарий, я не соглашаюсь с ним, потому что одноглазый человек имел бы другие чувства в дополнение к преимуществу зре­ ния. П о л уч ен и е зн а н и й из оп ы т а... 325 Часть VI Чрезмерная уверенность 20. Чрезмерная уверенность в суждениях, основанных на конкретных примерах* Стюарт Оскамп Это обычное явление в клинической практике: когда психолог накапливает исследовательский материал относительно человека, он начинает думать, что хорошо знает его. Следовательно, рано или поздно в процессе сбора ин ­ формации психолог чувствует себя достаточно уверенным, чтобы делать ди­ агностические заклю чения, описывать главную динамику клиента, и воз­ можно даж е, чтобы отваж иться сделать прогноз его будущего поведения. Х отя заклю чения психолога могут остаться предварительными, усиление уверенности от времени первого столкновения с пациентом ко времени на­ писания своего сообщения обычно очень заметно. Это исследование рассматривает, оправдано ли это увеличение уверенно­ сти соответствующим увеличением точности заклю чений. Х отя уверенность психолога в его заклю чениях часто упоминалась к ак важ ны й предмет на­ учного исследования (M eehl, 1957), она редко интенсивно исследовалась. Кроме того, когда она исследовалась, часто получались довольно удивитель­ ные результаты . Н апример, Л .Р . Голберг и Оскамп (L. R . G oldberg, 1959 и Oskam p, 1962) показали, что диагностическая достоверность опытных пси­ хологов меньше, чем у менее опытных людей. Те ж е самые исследования и многие другие показали, что профессиональные психологи являю тся не луч­ ш ими экспертами в межличностных отнош ениях, а иногда и худш ими, чем необученные люди (T aft, 1955). Другим редко исследуемым фактором, который может обеспечить хоро­ ш ий показатель опытности эксперта, является отношение между уровнем его достоверности и уровнем точности. Эта величина показы вает, например, является ли судья самонадеянным при принятии реш ений или, наоборот, ' Эта глава первоначально появилась в Журнале консультационной психологии (The Journal of Consulting Psycohology), 1965, 29, 261-265. Авторское право © 1965 принадлежит Аме­ риканской Психологической Ассоциации. Переиздано в соответствии с разрешением. 330 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ он не слиш ком уверен в себе. Относительно этой величины, которая может быть названа правомерностью достоверности, было обнаружено, что опыт­ ные “оценщ ики”, превосходят неопытных (Oskamp, 1962). Многие исследования (Hamlin, 1954; H athaw ay, 1956; K ostlan, 1954 ; Soskin, 1954; W inch & More, 1956) рассматривали влияние различного ко­ личества информации стимула на клиническое принятие решений. В н а­ стоящем эксперименте этот фактор изучался путем предоставления каж до­ му испытуемому четырех множеств кумулятивно увеличивающегося коли­ чества информации, как основания для принятия им решений. Таким об­ разом, было смоделировано постепенное наращивание информации при ра­ боте психолога над типичным случаем. Исследовательские гипотезы были следующие: 1. После некоторого момента в процессе сбора информации, точность про­ гнозирования достигает максимума. 2. Однако, уверенность в решениях продолжает устойчиво расти, посколь­ ку получено большее количество информации. 3. Таким образом, к концу процесса сбора информации, большинство испытуемых самонадеянны относительно своих оценок. П роцедура Так как было желательно, смоделировать обычную клиническую ситуацию настоль­ ко точно, насколько возможно, в качестве информации, которая предложена ис­ пытуемым, было выбрано реальное исследование. В конечном итоге, случай был выбран из-за его обширности, из-за того, что он охватывал многие подходящие ж изненны е случаи, и потому, что он описывал относительно нормального челове­ ка (то есть случай неадаптированности молодого человека, который никогда не помещался в психиатрическую лечебницу). Это был случай Джозефа Кидда (Joseph Kidd), о котором сообщил Уайт (W hite, 1952) в своей книге “Ж изни в развитии” (Lives in P rogress).1 Материалы относительно этого случая были организованы в хронологические наборы информации, которые были представлены испытуемых в четыре последо­ вательных этапа. Этап 1 содержал только следующую краткую демографическую информацию относительно этого случая, чтобы проверить спрогнозированную точ­ ность на уровень “психологической вероятности” (Patterson, 1955): Д ж озеф у Кидду (псевдоним) - 29 лет. Он белый, не состоит в браке, явля­ ется ветераном Второй Мировой Войны. Он - выпускник колледжа, рабо­ тает бизнес-ассистентом в студии цветочной декорации. На этапе 2 было добавлено полторы страницы материала, напечатанных через один интервал, относительно детства Кидда до 12 лет. Этап 3 (2 страницы) рассмат­ 1Использование этого случая имело один недостаток. Несколько испытуемых помнили, что они читали этот материал во время их обучения, но все кроме одного, сообщили, что их более раннее знакомство никак не помогло им в этом исследовании. Так как их точность, подтвердила это впечатление, их результаты были сохранены в анализе данных. Чрезмерная уверенность в суждениях... 331 ривал его годы, проведенные в школе и колледже, а этап 4 ( 1 7 дстраницы) охваты­ вали его службу в армии и более поздние действия до возраста в 29 лет. И сследование на конкретном примере Чтобы иметь основание для определения точности испытуемых, было пост­ роено испы тание множественного выбора, используя метод, подобный ме­ тоду Соскина (Soskin, 1 9 5 4 ). П ункты опросника описывали обычные образ­ цы поведения Кидда, отнош ения, интересы и типичные реакции на собы­ тия ж изни. Примеры некоторых этих пунктов даю тся в табл. 1. Таблица 1. Примеры пунктов опросника 5. Будучи учащимся колледжа, когда Кидд был в знакомой и благоприятной социальной ситуации, он часто: a. Пытался направить группу и навязать ей свои желания. b . Оставался в стороне, отдельно от группы. c. Его не волновало то, как люди реагировали на него. d. Принимал активное участие в группе, но тихим и скром­ ным способом. e. Вел себя, как клоун и хвасталсяа 10. П озж е во время службы в армии, будучи офицером и коман­ дующим отделением, отношение Кидда к наказаниям было: a. Он очень тревожился об этом, потому что предпочитал быть на одном уровне с другими людьми, а не выше и х а b . Он не любил этого, потому что он никогда не мог принять решение относительно того, что делать. C. Он избегал этого настолько полно, насколько возможно, по­ тому что чувствовал, что неправильно наказывать людей, неза­ висимо от того, что они сделали. D. Он был счастлив, потому что это давало ему шанс контро­ лировать ситуацию и быть выше других. E. Он испытывал садистское наслаждение, наказывая других, в качестве компенсации за то время, когда наказывали его. 15. Настоящее отношение Кидда к своей матери: a. Любовь и уважение к ее идеалам. b . Нежная терпимость к ее недостаткам. c. Как уважение, так и негодование3. d. Отвержение ее и всех ее убеждений. e. Почтительная, но формальная привязанность. 20. В беседах с мужчинами, Кидд: a. Предпочитает располагать их говорить о работе и опы теа. b . Предпочитает говорить, главным образом, о знакомых вещах. c. Предпочитает спорить с ними о религии или их философии ж изни. 332 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ d. Любит хвастать относительно своей службы в армии или учебы в колледже. f. Говорит главным образом о спорте, сексе и отпускает гряз­ ные шутки. 25. Отношение Кидда к ж изни как бизнес-ассистента вызвано его недавним решением: a. Остаться на этой работе, по крайней мере, еще несколько лет. b . Расширить бизнес, построив другой магазин в близлежа­ щем городе. c. Оставить работу и открыть собственный цветочный мага­ зин. d. Подать заявления о приеме на работу в несколько более крупных компаний в сфере деятельности, подобной его настоя­ щей работы. e. Совсем уволиться и найти работу другого р одаа_________ аПравильный ответ. Варианты ответов были построены только там, где имелись довольно объек­ тивные информационные критерии, представленные в случае, ф актические данные или хорошо зафиксированные выводы. Четыре неправильны х аль­ тернативы в каж дом пункте были составлены аспирантами по психологии посредством дополнения предложений к основе пункта. Они были построе­ ны таким образом, чтобы быть явно неправильны ми, основанными на опуб­ ликованном материале случая, но быть убедительными и “привлекатель­ ны м и” альтернативами. Ни один из пунктов не содержал ответ, который можно было обнаружить в полученном вводном материале случая. Испы­ туемые долж ны были следовать обычной процедуре в клиническом приня­ тии реш ений (С. M cA rthur, 1954), формируя картину индивидуальности Кидда из представленного материала и затем прогнозируя его отнош ения и типичны е действия, основываясь на картине его личности. Эксперты Эксперты были взяты из трех групп с разны м опытом в психологии: (а) 8 психологов, работаю щ их в государственной больнице ш тата К алифорния, причем у каж дого было несколько лет опыта терапии, и 5 имели кандидатс­ кую степень; 2(Ь) 18 аспирантов в области психологии;3и (с) б студентов стар­ 2Еще один психолог участвовал в тестировании, но его результаты пришлось аннулировать, так как он не понял инструкций и не смог им следовать. Эта проблема не случилась ни с одним студентом. 3 Приблизительно половина этих аспирантов имела некоторый опыт терапии или консуль­ тирования, и один или два из них, возможно, по уровню опыта в психологии равнялись психологам Чрезмерная уверенность в суждениях... 333 ш их курсов, занимаю щ ихся исследованием личности. Ни один из испытуе­ мы х не был знаком с гипотезами исследования. Испытуемые принимали участие в эксперименте в маленьких группах размерами от четырех до девяти человек, но каж ды й работал своим собствен­ ным индивидуальным темпом и с собственной пачкой материалов. После чтения материалов каждого этапа случая, испытемый отвечал на все 2 5 воп­ росов случая, прежде чем перейти к следующему этапу. В дополнение к от­ вету на вопросы, испытемый такж е указы вал в каж дом пункте, насколько он был уверен в том, что его ответ был правильны й. О ценки уверенност и Оценки уверенности были сделаны , используя ш калу, изобретенную Адам­ сом (Adam s, 1957), которая определяет уверенность в терминах ожидаемо­ го процента правильны х реш ений. Так к ак было пять альтернатив для к аж ­ дого пункта теста, ш кала начиналась с 20% (что представляло полностью случайный уровень достоверности) и заверш алась 100% (что указы вало на абсолютную уверенность в правильности). В дополнение к обеспечению по­ нятного объективного значения уверенности, эта ш кала имеет большое пре­ имущ ество, т.к . позволяет напрямую сравнить уровень точности и уровень уверенности. Таким образом, например, если у испытемого 28% пунктов правильны е, а средний уровень уверенности 43% , он, безусловно, самоуве­ рен. Р е зу л ь т а т ы Эта задача оценки, оказалась достаточно трудной, по крайней мере, для этого материала о случае. Ни один испытемый не достиг точности 50% , и средняя результирую щ ая точность была меньш е 28 % , со случайностью 20% (незна­ чительное различие). Однако этот низкий уровень точности служ ит для того, чтобы обеспечить еще более серьезное испытание гипотез исследования. Бы л выполнен предварительный анализ, чтобы сравнить оценки трех групп испытуемых, хотя не было сформулировано гипотез об их относитель­ ны х результатах. Эти результаты ясно указали, что не было никаких сущ е­ ственных различий между тремя группами испытуемых ни в точности, ни в уверенности, ни в общем количестве измененных ответов. Полученные ре­ зультаты уверенности на этапе 4 сравнивались с результатами предыдущих исследований (Goldberg, 1959; Oskamp, 1962), показы вая, что более опы т­ ные испытуемые, менее уверенны, чем менее опытные испытуемые, но в этом исследовании эти результаты не приближ ались к значимым. 334 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Таблица 2. Результаты 32 испытуемых в исследовании конкретного слу­ чая по 25 пунктам . Средние оценки Этап 1 Эт ап 2 Этап 3 Этап 4 F Р Точность (%) 26,0 23,0 28,4 27,8 5,02 0,01 Уверенность (%) 33,2 29,2 46,0 52,8 36,06 0,001 13,2 11,4 8,1 21,56 0,001 И зм ерение Количество измененных ответов ‘ Главные результаты исследования показаны в Таблице 2, где следующие друг за другом столбцы показы ваю т средние результаты испытуемых, по мере того, к ак они получали последовательно увеличиваю щ ееся количество информации. В результате предыдущ их статистических тестов, результа­ ты для всех 32 испытуемых объединены в этой таблице. П ервая строка в Таблице 2 показы вает, что колебание в точности по че­ ты рем этапам было сущ ественно. О днако, статисти ческий тест Д ун ка­ н а (А . Е. Edw ards, 1960, с. 136) показал, что это разница возникла прежде всего благодаря снижению точности на этапе 2. При сравнении точности на этапе 1 с точностью на этапе 4 не было обнаружено никаких сущ ественных изменений (t= 1.13, d f = 31). Таким образом, первая гипотеза относительно максимум а точности была не только поддержана, но в этом эксперименте не было никакого существенного увеличения в точности с увеличением ин­ формации! Гипотеза 2 проверена во второй строке табл. 2. Там мы видим, к ак и было спрогнозировано, резкое и очень существенное увеличение достоверности с 33% на Этапе 1 до 53% на этапе 4. Н аконец, результаты гипотезы 3 обозначены сравнением первых и вто­ ры х строк таблицы. Н а этапе 1 средняя величина самоуверенности была 7 пунктов; на этапе 4 она была 25 пунктов, различие, существенное далеко за пределами уровня 0.001 (t = 5.14, d f = 31). И ногда средние величины группы сущ ественны, но они могут вводить в заблуж дение, потому что они могут скры вать ответы отдельных испытуе­ м ы х, которы е противоречат прогнозам. То, что дело здесь было не в этом, ясно показано следующ ими числами для отдельных испытуемых. Из 32 испы туемы х, 14 увеличили точность ответов от этапа 1 к этапу 4, в то время к ак для 6 точность осталась той ж е, и для 12 уменьш илась - полностью слу­ чайны й результат. Наоборот, все испытуемые, кроме 2, увеличили уверен­ Чрезмерная уверенность в суждениях... 335 ность, и большинство — зам етно4. Н а этапе 1 почти половина испытуемых (13 и з 32) не были самоуверенными; к этапу 4 осталось только 2 испытуе­ мы х, которые были не очень уверены в себе - высоко значимое изменение (X2 = 9.1, р < 0.01). Другой интересный результат исследования содержится в последней стро­ ке Таблицы 2, в которой показано среднее число пунктов, на которы х испы ­ туемые изменили свои ответы на каж дом этапе случая. Эта величина пока­ зы вает, что, поскольку представлялось большее количество информации, число измененны х ответов уменьшилось заметно и существенно. Это зак ­ лючение говорит о том, что испытуемые часто формировали довольно твер­ дые стереотипные выводы и з первого отрезка информации и затем неохот­ но м еняли свои выводы, когда они получали новую информацию. Во вся­ ком случае, заклю чительны й этап информации, служ ит скорее для того, чтобы подтвердить предыдущие впечатления испытуемых, чем побудить их обновить полную картину личности Кидда. О б суж д ен и е Необходимо избегать небрежного обобщения этих результатов. Имеются три главны х ф актора относительно этого исследования, которые могли бы ог­ раничить общность результатов, (а) случай может быть не похож на те, с которыми большинство психологов привы кло работать. (Ь) П ункты теста не могут представлять те виды поведения, которые психологи привы кли про­ гнозировать. (с) Испытуемые, возможно, не были типичными представите­ лями людей, принимаю щ их психологические реш ения. В ответе на эти воз­ можные возраж ения должно быть указано, что случай, пункты теста и ис­ пытуемые-психологи - все были выбраны с намерением приблизиться к си­ туациям , встречаю щ имся в фактической психологической практике. Д аж е если эти возможные возраж ения могут быть предоставлены, неко­ торые четкие заклю чения могут быть сделаны. Независимо от того, к аза­ лась ли задача странной или материалы случая нетипичными, оценки уве­ ренности испытуемых показы ваю т, что они убедились в увеличении своего понимания случая. П оскольку они получили большее количество инфор­ мации, их уверенность резко возросла. Более того, их уверенность относи­ тельно собственных реш ений стала обратно пропорциональна фактической правильности этих реш ений. Таким образом, хотя этот результат не может повторяться для каж дого психолога и каж дого типа реш ений, можно четко заклю чить, что усили­ 4Один из двух испытуемых, у которых уменьшилась уверенность, старшекурсник, позже заявил, что обычно у него увеличилась бы уверенность, но он только что участвовал в науч­ но-исследовательской работе с компьютерами, в которой компьютер неоднократно давал неправильные результаты, причем настолько, что он полностью потерял свою уверенность даже в компьютерах. ваю щ ееся чувство уверенности психолога во время прорабатывания ситуа­ ции - не надеж ны й признак увеличения точности его заклю чений. Так н а­ зы ваем ая клиническая надежность, основанная на личны х чувствах уве­ ренности клинициста, не является адекватным свидетельством валиднос­ ти оценки в диагностировании или прогнозировании человеческого поведе­ н ия. 21. Сообщение о процессе обучения оцениванию вероятности* Марк Алпертп и Ховард Раиффа В исследованиях принятия реш ений в условиях неопределенности, людей, принимаю щ их реш ения и их квалиф ицированны х консультантов часто просят оценить распределения вероятности величин, значения которых им неизвестны. Эта глава рассматривает некоторые эмпирические результаты, касаю щ иеся таких вопросов к ак: Н асколько хорошо могут необученные люди давать подобные оценки? П роявляю т ли они некоторые повторяю щ и­ еся предубеждения? К ак можно калибровать людей, делающ их оценки? К ак их можно научить оценивать лучш е? Эта глава рассматривает только оценки неопределенных величин, кото­ рые могут принимать континуум возможных значений. Следовательно, мы будем работать исклю чительно с одновариантными ф ункциями плотности и их кумулятивны м и ф ункциями распределения. Существует несколько различны х процедур для оценки распределений вероятности непрерывных, одновариантных случайных переменных, но мы рассмотрим только одну специфическую процедуру, которую мы и наш и коллеги часто использова­ ли на практике. Она назы вается методом прямой оценки квантиля. П р о ц ед у р а п р ям о й о ц ен к и к в а н т и л я Пусть х* - истинное, целевое значение некоторой переменной, и предполо­ ж им, что оно неизвестно оценивающему, i f -тый оценочный квантиль х* (для к в интервале от 0 до 1) - это число хк, которое означает, что оценочная веро­ ятность того, что он припиш ет событию {х* < хк}равна k; в терминах вероят­ ности, Р {х* < хк}= к. Н а числа х0 50, х025 и х075будут ссы латься как на оце­ ночную медиану, ниж ний квартиль и верхний квартиль, соответственно. * Эта глава первоначально появилась в 1969 как неопубликованное сообщение. Она была пересмотрена специально для этой книги. 338 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Чтобы получить х0 ж, испытуемый долж ен представить такую величину, которая настолько ж е вероятна, что х* к ак ниж е х0 ^ так и выш е - х050. Таким образом, х0 50делит континуум на два оценочных, одинаково вероят­ ны х интервала. Более низкий квартиль, х025, делит интервал (-°°, х 50) на два оценочных одинаково вероятных интервала; и верхний квартиль, х0 75, делит интервал (х0 50, + оо) на два оценочных интервала с одинаковой вероят­ ностью. Д ля каж дой неопределенной величины , наш их участников экспе­ римента попросили определить их оценочную медиану и квартили. После­ довательность (или “когерентность”, к ак предпочитают писать некоторые авторы) требует, чтобы испытуемый считал, (а) что каж ды й из этих четы ­ рех интервалов ( 0 0 ’ Х 0.25^’ ( Х 0 .2 5 ’ Х 0 .5 о )’ ( Х 0.50’ Х 0.75 ) ’ O w +со) с равной вероятностью, будет содержать истинное значение х*, и (Ь) вероят­ ность того, что истинное значение х* не будет содерж аться в интервале (х0 2б, х0 75). В будущем, мы будем назы вать интервал (х0 25, х0 75) оценочным, м еж квартильны м диапазоном. Испытуемых, которые участвовали в наш их упраж нениях, обучили проверять эти требования последовательности и их проинструктировали, что в случаях непоследовательности необходимо за­ ново оценить свои оценки квантиля, чтобы ее достичь. В дополнение к оценочной медиане и двум квартилям , испытуемых про­ сили оценить различны е квантили на нижнем и верхнем пределе их распре­ делений. Об этом мы расскаж ем дальш е. К ак только оцениваю щ ий опреде­ лил несколько (хк, к) пунктов в своем совокупном, левостороннем оценоч­ ном распределении вероятности, он может использовать прямой, произволь­ ный процесс для того чтобы “подогнать” остататок кривой. В этой главе, однако, мы будем касаться только непосредственно оцененных (хк, к) пунк­ тов, а не полной кривой. В о зм о ж н о сть вн еш н ей в а л и д и за ц и и Если все, что мы имеем от данного испытуемого, это одно распределение ве­ роятности для единственной неопределенной величины , было бы бессмыс­ ленно говорить, что его распределение “неправильно”. Мы могли бы наде­ яться, что наш испытуемый более хорошо осведомлен о рассматриваемой величине, но его распределение вероятности только формальное вы раж е­ ние того, что он знает или не знает об этой величине. Мы не можем сказать, например, что его распределение “слиш ком компактное”, или “слиш ком сво­ бодное, “ или “слиш ком смещено вправо”. Но, в отличие от этого случая, допустим, что наш испытуемый дает нам ты сячу распределений ты сячи раз­ личны х неопределенных величин. Если каж дое из ф актических истинных значений должно попадать либо ниж е его соответствующего 0.01 кванти­ л я, либо выш е его 0.99 квантиля, то мы сможем сказать, что он внеш не не Сообщение о процессе обучения оцениванию... 339 ограничен, что его распределения имеют тенденцию быть слиш ком ком пак­ тными. И ли, напротив, если бы было так, что каж ды й из его оцененных меж квартильны х диапазонов содержал бы истинную величину, то это обо­ значало бы его тенденцию быть слиш ком разреж енны м. Допустим, что это экстремальны е случаи, но они устанавливаю т то, что возможно и уместно говорить о внеш ней валидизации множества распределений вероятности. Ц ели у п р аж н е н и й и со став гр у п п и сп ы ту ем ы х Не вдаваясь в подробности, позвольте нам предоставить краткий обзор того, что мы сделали. Посредством ряда анкет мы опросили большое количество ис­ пытуемых (приблизительно тысячу) и записали их оценочные квантили для нескольких величин, неизвестных им во время оценки. Затем мы сравнили их оценки с фактическими истинными значениями; идентифицировали некото­ рые постоянные предубеждения; исследовали формальные процедуры для из­ менения их оценочных входных данных; проинформировали каждого испы­ туемого о качестве ответов группы и его собственного специфического набора ответов; и, наконец, мы предложили способы, которыми кажды й испытуемый мог получить информацию о прошлых индивидуальных особенностях и, та­ ким образом, изменить свой последующий набор оценок. Мы провели четыре отдельных, но связанны х упраж нения в течение ака­ демического года 1968-1969, и для идентификации, перечислим их: Группа 1: 139 студентов факультативного курса “Модели плани­ рования в условиях неопределенности”, второй курс программы на степень магистра бизнес-управления (МБУ) Гарвардского универси­ тета. Группа 2 :8 0 0 студентов, вклю чаю щ ая всех первокурсников про­ граммы МБУ Гарварда. Группа 3 : 67 “добровольцев” с углубленного курса менеджмента на бизнес-факультете Гарварда. Группа 4: 60 студентов, проходящ их курс анализа принятия ре­ ш ений, который осущ ествлялся в аспирантуре точных и гумани­ тарны х наук в Гарварде. Это были студенты различны х ф акульте­ тов в Гарварде и Технологическом институте ш тата Массачусетс и изучали экономику, статистику, инженерию , математику, юрисп­ руденцию, управление, дизайн, общественные отнош ения, опера­ ционный анализ. До принятия участия в этом исследовании, все испытуемые в этих четы ­ рех группах изучали основные принципы анализа принятия решений: по­ строение и анализ схем принятия реш ений, предшествующие и последую­ щ ие распределения вероятности, теорию полезности (или предпочтений) и величину информации. 340 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Н а группе 1 проводилось пилотажное исследование. От каж дого студен­ та требовалось независимо оценить распределения для 20 неопределенных величин. Д ля этой группы мы изменяли наш и инструкции о вероятности “хвоста” распределения; это обсуждается позже в этой главе. Все 20 оценок были проведены за одно испытание без обратной связи. С группами 2, 3 и 4 было проведено нечто подобное. В первом испытании каж дом у испытуемому предлагали оценить 10 неопределенных величин. Затем испытуемых информировали относительно результатов всей группы и их собственных результатов. Затем осущ ествлялось следующее испы та­ ние с 10 различны ми неопределенными величинами. Д ействия группы 1 и групп 2, 3 и 4 в первых испы таниях были в значи­ тельной мере сходны. Действия групп 2, 3 и 4 во втором испы тании, после информирования и обратной связи, были снова чрезвычайно подобны; но заметные улучш ения были отмечены между их первыми и вторыми испы­ таниям и. И з-за подобия действий всех групп мы обсудим и сделаем замеча­ ния по детальным результатам самой большой из этих групп. У п р а ж н е н и е и р е зу л ь т а т ы , п о л у ч ен н ы е до о б р атн о й с в я зи Мы воспроизводим инструкции, которые были предоставлены половине уча­ щ ихся курса МБУ (группа 2). Эта подгруппа получила то, что мы назвали фор­ мой В; другая половина получила форму А, которая была идентична по содер­ жанию , но в которой были приведены другие неопределенные величины. Инструкции: форма В Цель этого упражнения состоит в том, чтобы увидеть, насколько хорошо Вы как представитель группы и группа в целом можете оценивать распределения вероят­ ности для неопределенных величин (НВ). Мы приведем ниж е 10 НВ, и Вас попро­ сят оценить медиану, 0.25 квантиль, 0.75 квантиль и значения экстремума каж ­ дой НВ. (Для вашего удобства краткие определения этих терминов даются ниж е.) Благодаря типу используемой НВ, Вы сможете сравнить Ваши оценки с истинны­ ми значениями. Таким образом, Вы сможете увидеть, склонны ли Вы делать рас­ пределение “слишком плотным”, “слиш комразреженным” или смещенным вверх или вниз в определенных типах вопросов. П озж е Вас попросят повторить это уп­ ражнение с другими НВ. Для этого упражнения Вы должны независимо ответить на вопросы, не просматривая исходные материалы, хотя для некоторых вопросов желательно произвести простые вычисления. На интересует Ваше знание незави­ симо от того, насколько оно неопределенно или насколько неудобно Вы себя чув­ ствуете. Определения квантилей... Н иж е приведено 10 величин, которые, как мы надеемся, для Вас являются неопределенными. Вы должны записать Вашу оценку на каждом бланке ответа. Заполните каждый пункт настолько хорошо, насколько Вы можете с нынешними знаниями, но не ищите дальнейшую информацию и не обсуждайте вопросы о соот­ ветствии со своими партнерами даж е после того, как Вы сдадите свои ответы. Вам необходимо сдать один бланк ответов перед занятиями завтра, а второй оставьте Сообщение о процессе обучения оцениванию... 341 себе так, чтобы у Вас была запись Ваших ответов. (Студенты использовали сохра­ ненный экземпляр, чтобы оценить себя. Это будет описано позж е.) Значения некоторых из переменных будут определены с помощью ответов студентовпервокурсников на следующие вопросы: Вопросы A. Вы предпочитаете бурбон или скотч? B. Вы одобряете отсрочки от армии для всех аспирантов независимо от области деятельности? C. Приняли бы Вы участие в азартной *игре “50 на 50”, где Вы могли бы либо проиграть $ 50 или выиграть $ 100? Список неопределенных величин 1. Процент ответов первокурсников (исключая тех, которые вообще не пьют), предпочитающих бурбон скотчу. 2. Процент ответов первокурсников, которые одобряют отсрочку от армии для всех аспирантов независимо от области деятельности. 3. Процент ответов первокурсников, которые сыграли бы в азартную игру в воп­ росе С, приведенном выше. 4. Процент респондентов, которые принимали участие в Опросе общественного мнения института Гэллапа в июле 1968 (рассматривающем репрезентативную вы­ борку взрослых американцев) и выразили мнение, что если начнется полномасш­ табная война на Ближнем Востоке, США должны послать вооруженные формиро­ вания для помощи Израилю. 5. Процент респондентов, участвовавших в опросе общественного мнения в мар­ те 1968 (рассматривающем репрезентативную выборку взрослых американцев), которые ответили, что учителям государственных школ нужно разрешить вступать в профсоюзы. 6. Количество терапевтов и хирургов, перечисленных в телефонном справочни­ ке “Ж елтые страницы” Бостона и его окрестностей в 1968. 7. Общее количество студентов, которые в настоящее время зарегистрировалось в докторской программе бизнес-факультета Гарварда. 8. Полное производство яиц (в млн штук) в США в 1965. 9. Количество иностранных автомобилей, импортированных в США в 1967, выраженное в тысячах. 10. Пошлина, собранная на Панамском канале в 1967 году, выраженная в мил­ лионах долларов. (Новая страница) Форма В (бланк, который нужно сохранить) Секция____ Номер студента______ П ожалуйста, выберите один ответ для каждого из вопросов А , В и С: A . Напиток бурбон (1) Скотч (2) Не пью вообще (3) B. Отсрочка от армии одобряю (1), выступаю против (2) C. Азартная игра 50-50 принимаю__ (1), отклоняю__ (2) 342 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ П ожалуйста, оцените все 5 величин для каждой из этих 10 переменных, приве­ денных ниж е. Заметьте, что самое высокое число в каждой строке находится спра­ ва. (Десятичные дроби в ответах допускаются. Если необходимо указать процент, ответы должны иметь форму 97.2 для 97.2% , а не 0 .972.) Неопределенная величина Квантиль 1. Бурбон (% )...............................(0.01) (0.25) (0.50) (0.75) (0 .9 9 ). Информационное сообщение об обратной связи Приблизительно через неделю после того, как студенты заполнили форму В, сту­ дентам был предложена следующее информационное сообщение. Оно обсуждалось в группе до того, как студентам дали для заполнения форму А. Цель этого информационного сообщения: 1. Описать в совокупности поведение людей, заполнивших форму В, 2. Указать систематические предубеждения в ответах, 3. Позволить Вам проверить себя прежде, чем Вы повторите это упражнение в форме А. Таблица 1. Ответы на вопросы в форме В Н ом ер 1 2 3 4 5 6 7 8 9 10 Н азвание Бурбон Отсрочка от армии Азартная игра "50 на 50" Израиль Профсоюз учителей Список докторов Докторанты Произведенные яйца (миллионы) Импортированные автомобили (тысячи) Доход с Панамского канала (миллионы) И ст инное значение 42.5 65.5 55.2 10.4 63.5 2.600 235 64.558 697 82.3 Как вы помните, для каждого вопроса, Вы оценили пять квантилей: 0 .0 1 ,0 .2 5 , 0 .5 0 , 0 .7 5 , 0 .99. Эти квантили делят интервал линии на шесть категорий: Категория 1: Все числа ниж е квантиля 0.01 2: Все числа меж ду 0.01 и 0.25 квантилями 3: Все числа меж ду 0.25 и 0.50 квантилями 4: Все числа меж ду 0.50 и 0.75 квантилями 5: Все числа меж ду 0.75 и 0.99 квантилями 6: Все числа выше 0.99 квантиля. Сообщение о процессе обучения оцениванию... 343 Для любого из этих десяти вопросов, как только Вы определяете Ваши пять кван­ тилей (или, что то ж е самое, как только Вы определяете эти шесть категорий) следу­ ет указать, в какую категорию попадает фактическая истинная величина. Напри­ мер, студент Джон Доу определил следующие квантили для вопроса о скотче и бур­ боне: (0.01) (0 .2 5 ) (0 .5 0 ) (0 .7 5 ) (0 .9 9 ) Оценка: 5 15 30 40 45 Фактический процент студентов, одобряющих бурбон, как оказалось, был 42.5; следовательно, в этом вопросе ответ г-на Доу попадает в категорию 5. Теперь преж де, чем мы дальше будем обсуждать, как хорошо (или плохо) груп­ па выполнила это упражнение, пожалуйста, обратитесь к вашему бланку ответов и для каждого вопроса отметьте, какая из ваших шести категорий содержит истин­ ную величину. В Таблице 1 мы перечислили истинные ответы. Анализ межквартпилъных диапазонов Давайте сначала рассмотрим колонки 3 и 4 в Таблице 2. Д ля любого вопроса Вы долж ны были выбрать 0.25, 0.50, 0.75 квантили так, что, по вашему мнению, настолько ж е вероятно, что истинный ответ попадет в диапазон от 0.25 до 0.75 (то есть, в категории 3 и 4), к ак если бы он в него не попал. В общем количестве 1.000 вопросов (100 х 10) мы получили бы (математичес­ кое) ож идание 500 ответов в категориях 3 и 4. Мы получили только 334 та­ ких ответов. Неплохо. Это несоответствие могло быть статистическим от­ клонением, но мы в этом сомневаемся. Н апример, подобный анкетны й оп­ рос нескольких недель назад был предоставлен многочисленной группе вто­ рокурсников МБУ - они ответили на 20 вместо 10 вопросов - и 33% их отве­ тов попали в категории 3 и 4. Мы не хотим сказать, что 33% “универсаль­ ная полуконстанта”, но это довольно поразительное совпадение, которое стоит учиты вать. (Соответствующий процент для первого заполнения фор­ мы А был 33% ; студенты, занимаю щ иеся углубленным изучением менед­ ж мента (группа 3) такж е выдали число 33% , но студенты ф акультета точ­ ных и гуманитарны х наук (группа 4) предоставили ответ 36% .) В совокупности, интервалы от 0.25 квантиля до 0 .75 были слиш ком плот­ ными. Столько истинных значений должно было попасть за пределы диапа­ зонов интерквартилей (от 0.25 до 0.75 диапазона), сколько и попасть в них, но ф актически вдвое больше попало за его пределы, чем внутрь. Но нам это­ го ещ е не достаточно, чтобы говорить, “расш ирьте диапазон интеркварти­ лей”, потому что существует больш ая изменчивость в зависимости от воп­ роса и человека. Сравним вопросы 1 и 10. В вопросе 1 Вы могли почувствовать, что много знаете о том, каки е напитки предпочитаю т Ваши одногруппники, по край ­ ней мере, весьма много по сравнению с тем, что Вы знаете относительно до­ ходов от П анамского канала. Поэтому, Вы могли бы почувствовать, что у Вас есть больш ий ш анс (ожидаемый) захватить в ваш ем интерквартильном 344 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Таблица 2. Распределение ответов испытуемых в форме В по категориям. Номер 1 2 3 4 5 6 7 8 9 10 Всего Ожидае­ мая частота Н азвание Бурбон Отсрочка от армии Азартная игра 50-50 Израиль Профсоюз учителей Список докторов Докторанты Производство яиц Импортирован­ ные машины Доход с канала Ниже 0.01 0.01 до 0 .2 5 0.25 до 0.50 0 .5 0 до 0.75 0.7 5 до 0.99 Выше 0 .9 9 всего 3 16 20 40 11 10 100 15 12 35 19 10 9 100 11 8 28 29 13 11 100 51 41 6 1 1 0 100 1 1 13 28 29 28 100 24 1 14 3 12 11 13 9 10 15 27 61 100 100 9 2 13 10 8 58 100 25 15 18 9 7 26 100 18 158 8 120 8 164 12 170 16 120 38 268 100 1.000 10 240 250 250 240 10 1.000 диапазоне истинную пропорцию бурбона, чем истинные доходы от П анамс­ кого канала. Но разве так вы должны думать? Если Вы это ож идали, Вы долж ны были увеличить Ваш м еж квартильны й диапазон для доходов от П анамского канала. При заполнении формы А убедитесь, что Вы чувствуе­ те, независимо от ваш ей информированности, что: a. Д ля любого вопроса одинаково вероятно, что истинное значение попа­ дет к ак в м еж квартильны е пределы, так и вне их; b . Одинаково вероятно, что истинное значение попадет в Ваш м еж квар­ тильны й диапазон д ля вопроса, о котором Вы знаете много и для вопроса, о котором Вы знаете мало. (Этот последний пункт относительно вопросов 1 и 10 мы необдуманно об­ судили со студентами ф акультета точных и гуманитарны х наук скорее до, чем после того, к ак они закончили свой первый круг оценок. Это могло бы объяснить несоответствие между 33 % и 36% . Мы увидим намного более зна­ чительное изменение, когда посмотрим на вероятности размещ ения “хвос­ та” распределения.) Н екоторые из Вас действительно производят слиш ком плотные распре­ деления. Н апример, 13 из 100 респондентов охватили только 1 или ни одно­ Сообщение о процессе обучения оцениванию... 345 го истинного значения в своих 10 меж квартильны х диапазонах. Д ля каж ­ дого человека, пусть его межквартпилъное множество будет числом попа­ даний истинны х значений в его меж квартильны е диапазоны. М ножество, близкое к 0, подразумевает, что человек “слиш ком напряж ен”; множество близкое к 10 предполагает, что человек “слиш ком свободен”; а множество около 5 подразумевает, что он - “почти прав”. Распределение множества приводится в табл.З. В третьей колонке таблице мы перечислили ож идае­ мое количество респондентов, которые бы предоставили любое данное межквартильное множество при упрощающем предположении, что существует вероятность 0.33, что любой меж квартильны й диапазон содержит истин­ ное значение, и что эти дихотомические ответы являю тся независимыми для разны х вопросов. Убедитесь, что у вас есть свое меж квартильное мно­ жество. Таблица 3. Распределение межквартильного множества для формы В М ежеквартальное множество Ф актическое количест во человек Ожидаемое количест во человек, использующ их р —0 3 3 0 1 2 3 4 5 6 7 8 9 10 Всего 3 10 22 20 23 11 9 2 0 0 0 100 1.9 9.0 19.9 26.1 22.5 13.3 5.5 1.5 0.3 0.0 0.0 100.0 А нализ экстремумов Возможно, Вы устанавливаете Ваши квантили 0.01 и 0.99 так, чтобы Вы были “удивлены ” действительно низким ответом (ответ категории 1) и дей­ ствительно высоким ответом (ответ категории б). В 1.000 вопросах мы дол­ ж ны были “ож идать” в общем 20 таких сюрпризов, 10 слева и 10 справа (см. табл. 2). Было в общем 426 сюрпризов! Это должно не просто удивить нас, а ш окировать! Вы можете немного успокоиться, хотя бы потому, что Вы не столь плохи к ак группа второкурсников (группа 1), о которой мы упомина­ 346 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ ли. П риблизительно 35 студентов попросили, к ак и Вас, перечислить кван ­ тили 0.01 и 0.99 для 20 вопросов. Они записали 46% сюрпризов - немного хуж е, чем ваш и 42,6% . Других 35 студентов попросили записать 0.001 и 0.999 квантили и вместо “ож идаемы х” 0,2% сюрпризов они записали 40% . Д ругих 35 попросили в довольно неопределенных терминах, перечислить “миним альны е” и “максимальны е” значения - мы действительно не знаем, что это означает - и они сделали запись 47% сюрпризов. Н аконец других 35 попросили дать “удивительно низкие” и “удивительно высокие” значения, и они отметили 38% сюрпризов. Очевидно, “удивительнонизко”, ниж е, чем “минимум”. Ради Бога, Расширьте свои экстремумные квартилиХ Будьте честными с самим собой! П ризнайте то, что Вы не знаете! Рассмотрим 6-й вопрос 2 .6 0 0 докторов в области медицины перечислены в телефонном справочнике Бостона и его окрестностей. Половина из Вас была удивлена этим результатом. Некоторые были удивлены тем, что это такая больш ая цифра, другие, что - маленькая. П ятьдесят восемь процентов были удивлены фантастически большим количеством произведенных яиц - но всетаки 9% были одинаково удивлены фантастически маленьким количеством. Таблица 4. Распределение индексов неожиданности для формы В И ндекс неож иданности Ф актическое количест во человек Ожидаемое число человек, использующ их р = ОАЭ 0 1 2 3 4 5 6 7 8 9 10 Всего 1 9 15 13 17 15 16 4 9 1 0 100 0.4 2.7 9.3 18.7 24.6 22.3 14.0 6.0 1.7 0.3 0.0 100.0 Давайте определим для каж дого человека индекс неожиданности, кото­ ры й показы вает количество раз (из 10), когда он делает запись ответа кате­ Сообщение о процессе обучения оцениванию... 347 гории 1 или 6. В среднем по поводу многих различны х, независимых вопро­ сов Вы должны быть удивлены 1 раз из 50. Индексы неожиданности 0 или 1 то, что мы хотели бы видеть, и появляется причина для беспокойства, если индекс неожиданности достигает 3 или больше. Распределение индексов неожиданности дается в табл. 4. В третьей колонке таблицы мы перечисли­ ли ожидаемое количество испытуемых, которые бы зарегистрировали дан­ ные индексы неожиданности при упрощенном предположении, что суще­ ствует вероятность удивления 0.43 в каж дом вопросе, и вопросы друг на друга не влияю т. Сорок пять (45) человек были удивлены по крайней мере в половине из этих десяти вопросов! Д ля типичной неопределенной величины, мы предположим, что боль­ ш инство из Вас хочет оценить унимодальную кривую плотности (или, что то ж е самое, совокупное распределение с левым хвостом в форме буквы S), где сам ая вы сокая точка на кривой плотности (или сам ая крутая часть сово­ купной S-кривой) находится где-то в интервале ваш их квантилей от 0.2 5 до 0.75. Многие из Вас, к ак мы неосторожно полагаем, сделали запись бимо­ дальны х кривы х. Это случилось бы, если длина ваш его интервала катего­ рии 2 меньш е, чем ваш интервал категории 3, а длина вашего интервала категории 5 - меньш е, чем длина интервала категории 41. Давайте рассмот­ рим следующ ий набор оценок квантиля: К ван ти л ь:. Оценка: Д лина категории 0.01 0.25 0.50 0.75 0.99 40 15 1 5. 10 5 10 Таблица 5. Сравнение результатов в испытаниях 1 и 2 _______ форма А______________ форма В_______ Испытание Испытание Испытание Испытание __________________________________ 1__________ 2__________ 1__________ 2 Значения, попадающие внутрь межквартильных 32.9 40.3 33.4 46.4 диапазонов (%) Значения, не попадающие в диапазоны от 0.01 до 0.99 38.8 24.9 22.2 42.6 (% ) 1 Пусть 1. определяет длину категории 1. Мы имели бы бимодальность, если бы 12; и 15, каж­ дый был бы меньше, чем (13 + 14) /2 . 348 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Таблица 6. Сравнения результатов испытаний 1 и 2 ______ Группа 3_____________ Группа 4______ Испытание Испытание Испытание Испытание __________________________________ 1__________ 2__________ 1__________ 2 Значения, попадающие внутрь межквартильных 33.4 44.8 35.6 42.5 диапазонов (%) Значения, не попадающие в диапазоны от 0.01 до 0.99 35.6 22.8 20.8 8.7 (%) В выш еупомянутой иллю страции отношение длин вероятностного интер­ вала 0.98 (от квантилей 0.01 до 0.99) к вероятностному интервалу 0.50 (от квантилей 0.25 до 0.75) равняется (45-5) / (40-15) или 1.6. Это слиш ком м а­ ленькое число для унимодальной кривой. Например, для нормальной пара­ болы это отнош ение - приблизительно 3.5. Отношения от 2.25 до 4.5 могут служ ить к а к схем атическая директива, но директивы долж ны наруш аться время от времени. Помните: расш иряйте свои распределения! Р е з у л ь т а т ы , п о л у ч ен н ы е п о сл е о б р атн о й с в я зи После обсуждения в группе докладной записки об обратной связи, мы поме­ няли формы и повторили упражнение. После анализа ответов, мы раздали следующее информационное сообщение: Информационное сообщение № 2 К аж ды й из Вас уж е принимал участие в следующем: a. (испытание I): Вам давали одну из двух форм (А или В) и Вы представи­ ли квантиль оценки для десяти неопределенных величин; b . (обратная связь): Вам дали истинные значения этих десяти квартилей и попросили записать два фактора: (1) сколько из Ваш их ответов попали в ваш и интерквартильны е диапазоны , и (2) сколько Ваш их ответов не попа­ ли в ваш и диапазоны 0.01 и 0.99. Вы были такж е информированы об общем вы полнении работы группой: П риблизительно вдвое больше ответов не по­ пали в интерквартильны е диапазоны , чем попали, и было действительно ш окирую щ ее число сюрпризов - около 40% ответов попало вне диапазонов 0.01 и 0.99. c. (И спытание 2): Вам дали другую форму и попросили представить оцен­ к и квантилям . Мы вы числили Ваши ответы для части (с) и готовы прокомментировать Вашу совокупную работу. Но, прежде всего, мы перечислим истинные значе­ ния неопределенных величин так, чтобы Вы могли проверить себя (таблица, представляю щ ая эту информацию, была показана в докладной записке). Сообщение о процессе обучения оцениванию... 349 Таблица 7. Пропорция неожиданностей для различных интерпретаций “низко" и “высоко” И нтерпретация "низко" И нт ерпрет а­ ция "вы соко " 0.01 квантилями 0.99 квантилями 0.001 квантилями 0.999 квантилями Минимальное Максимальное значение значение Удивительно Удивительно высоко низко Р азм ер выборки Пропорция неожидан­ ностей 44 25 0.46 0.40 35 0.47 35 0.38 Н асколько хорошо группа справилась с этим заданием в целом? Помогла ли обратная связь? Она помогла, отчасти, но не настолько, насколько мы на­ деялись. Больш инство ваш их распределений слиш ком плотно. В Таблице 5 приведены результаты. Если мы объединяем формы А и В, то процент попадания истинных ве­ личин в интерквартильны е диапазоны , возрос от 33% до 4 3 % . Намечено направление изменения, но нам все ж е хотелось бы получить 50% . Процент непопадания истинных значений в экстремумы значения (то есть, 0.01 и 0.99 диапазонов) снизился от ш окирую щ его 4 1% к угнетающим 2 3 % . Это далеко от наш ей цели 2 % . Что-то необходимо сделать с “хвостами” распре­ деления! Мы нуж даемся в другой сессии обратной связи и третьем круге практики; но, к сожалению , это не выполнимо. Мы предлагаем начать экс­ перименты с другими группами, чтобы получить более реалистические оцен­ ки вероятностей “хвоста” распределения. (С целью сравнения в табл. 6 показаны действия группы студентов, углуб­ ленно изучающ их менеджмент (группа 3) до и после выполнения, а такж е поведение студентов факультета точных и гуманитарных наук (группа 4) Е щ е н ес к о л ь к о сл о в об эк с тр е м у м н ы х “ х в о с т а х ” В экспериментальном исследовании (группа 1) мы изменили инструкции относительно экстремумных “хвостов”, чтобы увидеть, какое влияние это будет иметь на статистические распределения ответов. Всех наш их субъек­ тов, однако, попросили дать медиану оценки и два квартиля. Н аш и резуль­ таты собраны в табл. 7 и 8, которые мы объясним по очереди. И з 139 испытуемых, сорок четы рех попросили дать 0.01 и 0.99 кванти­ ли, и эта подгруппа зарегистрировала 46% неожиданностей (а не 2% ); 25 попросили дать 0.001 и 0.999 квантили, и эта подгруппа зарегистрировала 40% неожиданностей (а не 0.2% ). Тридцать пять испытуемых попросили дать “минимальное значение” и “максимальное значение”, и когда некото­ рые испытуемые попросили разъяснить, что эти термины означают, мы ук­ лончиво заметили, что “конечно, это неопределенные термины, но попытай­ тесь ответить на вопросы так или иначе”. Мы дали тот ж е самый неоднознач­ ный совет оставшимся 35 испытуемым, которых спросили относительно “уди­ вительно низких” и “удивительно высоких” значений. Последние две груп­ пы зарегистрировали 47% и 38% соответственно. Различны е инструкции имели определенное влияние, но, как Вы видите, не очень сильное. Таблица 8. Распределение “высоких” оценок для вопроса 10 Очки для победит еля от <29 29-35 36-42 43-49 50-56 57-63 64-70 Всего 8 15 10 2 7 2 0 44 И нт ерпрет ация "высоких оценок " Удивительно 0М 9 М аксим ум высоко в 2 1 6 7 в 7 11 5 6 3 0 4 25 5 8 2 0 35 4 7 4 1 35 Другим способом исследования влияния этих четырех инструкций на экстремумы является подробное изучение Таблице 8, которая дает распре­ деление ответов на “высокие” значения для следующей величины: количе­ ство очков победившей команды в следующем футбольном матче Гарвард Дартмаут. (Опрос проводили за неделю до игры .) Например, из 25 человек, которы х попросили дать 0.999 квантиль, 1 сделал запись счета меньш е, чем 2 9 ,6 человек зарегистрировали счет между 29 и 35, 5 человек - между 36 и 42, и так далее. К аж ется, к ак будто неопределенный термин “максимум” интерпретируется к ак 0.99 квантиль, а неопределенный термин “удивитель­ но высоко “ интерпретируется к ак 0.999 квантиль. Мы не повторяли в точности эти инструкции относительно экстремумны х значений для групп 2, 3 и 4; а, мы последовательно спросили этих ис­ пы туемы х о 0.01 и 0.99 квантилях. 22. Калибровка вероятностей: положение дел к 1980г.* * Сара Лихтенштейн, Барух Фишхофф и Лоренс Д. Филлипс С субъективистской точки зрения (de F in etti, 1937/1964), вероятность - сте­ пень веры в утверждение. Она вы раж ает только внутреннее состояние; нет никакой “правильной”, “верной” или “объективной” вероятности, существу­ ющей где-нибудь “в реальности”, с которой степень веры мож ет быть срав­ нена. Во многих обстоятельствах, однако, возможно проверить правильность или ошибочность предположения, к которому вероятность бы ла примене­ на. Сегодня, человек оценивает вероятность предполож ения “завтра будет дождь”. Завтра, смотрит на прибор для измерения осадков, чтобы увидеть действительно ли ш ел дождь. Если есть возможность, такая проверка мо­ ж ет использоваться для определения адекватности оценок вероятности. У инклер и Мерфи (W inkler и M urphy, 1968b) идентифицировали два вида “качественности” оценок вероятности: нормативная качественность, кото­ рое отраж ает степень, в которой оценки вы раж аю т истинные убеждения эк ­ спертов и соответствуют аксиомам теории вероятности, и действительная качественность, которое отраж ает знания объема темы , представленное в оценках. В этой главе рассматривается литература о другом аспекте каче­ ственности, называемой калибровкой. Если человек оценивает вероятность, того что предположение истинно на 0.7, а позж е обнаруживает, что предположение лож но, это само по себе не лиш ает оценку валидности. Однако если оцениваю щ ий приписывает ве­ роятность 0.7 на 10.000 независимы х событий, только 25 из которы х впос­ ледствии оказы ваю тся истинны ми, тогда что-то не так с этими оценками. То, чего им не хватает — калибровки (проверки); другими словами реализ­ ма (Browm и Shuford, 1973), внеш ней валидности, (Brown и Shuford, 1973), * Это - пересмотренная версия статьи, которая первоначально появилась под редакцией Н. Jungermann и G. DeZeeuw. Принятие решения и изменения занятий людей. DordrechtHolland: D.Reidel Publishing , Co., 1977. Переиздано в соответствии с разрешением. * Калибровка - (тех.) это процесс или результат настройки технического устройства для повышения точности его работы. 352 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ реали зм а уверенности (Adam s и A dam s, 1961), уместности уверенности (Oskam p, 1962), вторичной валидности (M urphy и W inkler, 1971) и надеж ­ ности (M urphy, 1973). Ф ормально, оцениваю щ ий “проверен”, если, по мно­ гим испы таниям , для всех предположений с заданной вероятностью ,оце­ ненная вероятность равна заданной. К алибровка экспертов может быть оп­ ределена опытным путем, наблю дая их оценки вероятности, проверяя вза­ имосвязанны е предположения, а затем наблю дая пропорцию, истинную в каж дой категории ответа. Э кспериментальная литература по калибровке людей, экспертов по ве­ роятности дискретны х предположений, рассмотрена в первом разделе этой главы . Второй раздел описывает калибровку функций плотности вероятно­ сти, проведенную для неопределенных числовых величин. Х отя калибров­ к а - по сущ еству свойство человека, большинство исследований, рассмот­ ренны х здесь, представляет данны е, сгруппированные по экспертам для обеспечения большего количества данны х, необходимых для устойчивых оценок калибровки. Д и с к р е т н ы е п р ед п о л о ж ен и я Д искретны е предполож ения могут быть охарактеризованы согласно коли­ честву альтернатив, которые они предлагают: Безальтернативные: “Что такое абсент?” Эксперт дает ответ, и за­ тем оценивает вероятность того, что данный ответ является правиль­ ны м. Возможен полный диапазон ответов вероятности, от 0 до 1. Одна альтернатива: “Абсент - это драгоценный кам ень. К акова вероятность, что это утверж дение является истинны м?” О пять ж е, возможен диапазон ш калы вероятности - от 0 до 1. Две альтернативы: “ Абсент - (а) драгоценный камень; (Ь) спирт­ ное”. И спользуя метод неполного диапазона, оцениваю щ ий сначала выбирает более вероятную альтернативу, а затем заявляет вероятность (> 0 .5 ) того, что этот выбор является правильны м. И спользуя метод полного диапазона, оцениваю щ ий определяет вероятность (от 0 до 1), что данная альтернатива правильна. Три или больше альтернативы: “Абсент - (а) драгоценный камень; (Ь) спиртной напиток; (с) карибский остров; ( d ) ...” Могут использо­ ваться две разновидности этой задачи: (1) оцениваю щ ий вы бирает единственную наиболее вероятную альтернативу и заявляет вероят­ ность, что она является правильной, используя ответ 1 / к для k аль­ тернатив или (2) оцениваю щий назначает вероятности для всех аль­ тернатив, используя диапазон от 0 до 1. Д ля всех этих разновидностей, калибровка может быть изображена посред­ ством калибровочной кривой. Т акая кри вая получена следующим образом: Калибровка вероятностей... 353 1. Собирается множество оценок вероятности для пунктов, правиль­ ный ответ по которым известен или будет вскоре известен эксперимен­ татору. 2. Группируются сходные оценки, обычно в пределах диапазонов (на­ пример, все оценки между 0.60 и 0.69 помещены в одну категорию ). 3. В пределах каж дой категории, вы числяется доля правильны х от­ ветов, (то есть, доля пунктов, для которы х предположение истинно, или альтернатива правильна). 4. Д ля каж дой категории, среднего ответа (по абсциссе) с долей пра­ вильны х ответов (по ординате). Проведенную калибровку можно показать всеми точкам и, попадающими на линию идентификации. Д ля задач с половиной диапазона, плохо калиброванные оценки могут быть либо самонадеянными, за счет чего исправленные пропорции - мень­ ше, чем оцененные вероятности, и калибровочная кри вая попадает ниж е линии идентификации, либо неуверенные, за счет чего исправленные про­ порции - больш е, чем оцененные вероятности, и кривая калибровки попа­ дает выш е линии идентификации. Для задач с полным диапазоном без альтернатив или одной альтернативой, самонадеянность имеет два возможных значения. Эксперты могли быть само­ надеянными в истинности ответа; такая самонадеянность была бы обозна­ чена кривой калибровки, попадающей всегда ниже линии идентификации. С другой стороны, эксперты могут быть самонадеянными в их способности отли­ чить истинные предположения от ложных. Такая самонадеянность была бы показана кривой калибровки ниже линии идентификации в области более чем 0.5 и выше линии идентификации в области ниж е 0.5. Было предложено несколько числовы х измерений калибровки. Мерфи (M urphy, 1973) исследовал общий случай пунктов с к альтернативам и, на­ чиная с оценки Байера (B rier, 1950), общее измерения полной качественно­ сти или вероятности оценки, такой, что чем меньш е оценка, тем лучш е. Оценка Байера (B rier) для N пунктов: 1 N В = Т7 L (.ri-CiKn-Ci) ™ i= l Где г. является вектором оцененных вероятностей для k альтернатив пунк­ та i, г , равн яется (г1;..... r ki), а , я в л я е тся связан н ы м вектором исхода, с., = (с..........с....... ,с..), где с., равняется единице для истинной альтернативы и нулю в другом случае, а ш трих (‘), обозначает вектор-столбец. Мерфи по­ казал, что оценка Байера может быть разделенана три составные части. Что­ бы это сделать, распределим N векторов ответа на Т подгрупп так, чтобы все векторы ответа г в подмножестве t являю тся идентичными. Пусть nt, будет 354 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ количество ответов в подмножестве t, и пусть Ct будет вектор исправления пропорции для подмножества t: »t Ct = <сй,......Cjt, .......c h ), где c jt = % c jt / n t П усть с - вектор доли правильны х ответов для всех, с - ( с 1>...... c j> ....... с к )* Cj j* Н аконец, пусть и будет вектор единства (the u n ity vector), вектор строки, чьи к элементы - все единицы. Тогда разделение Мерфи оценки Байера: - ' \ т — — ' \ т — - — В = с(и - с) + — X nt(rt - ctXrt - ct ) - — £ nt(ct - c \c t - c) N t=i N t=i Первое слагаемое - не ф ункция оценок вероятности; скорее, оно отраж ает относительную частоту истинных событий для к альтернатив. Н апример, предположим, что все оцениваемые пункты имели одни и те ж е две альтер­ нативы : (дождь, нет дождя). Тогда первое слагаемое - ф ункция базового значения дож дя для N пунктов (или дней). Если бы всегда (или никогда) ш ел дож дь, это слагаемое было бы нулевы м. Его максимальное значение, (к-1)/к, указало бы на максимальную неопределенность относительно воз­ никновения дождя. Второе слагаемое - мера калибровки, оцененное сред­ нее число взятой в квадрат разности между ответами в категории и исправ­ лением пропорции для этой категории. Третье слагаемое, называемое ре­ ш ением, отраж ает способность оценивающего сортировать события в под­ категории, для которых исправление пропорции отличается от полного ис­ правления пропорции. Разделение Мерфи было предназначено для повторного прогнозирования того ж е самого набора событий (например, “дождь” вместо “нет дож дя”). Когда альтернативы не имеют никакого общего значения для всех пунктов (например, в вопросах с множественным выбором), тогда все, на что указы ­ вает первое слагаемое, это степень, в которой правильны й ответ появляется одинаково часто как и первая, вторая, и т.д ., альтернатива. Когда записан только один ответ для одного пункта, разделение Мерфи (M urphy, 1972) сокращ ается до: Калибровка вероятностей... - В' = с ([- - l J T — 2 1 — - 355 2 с ) + — 1 я ( ( г . - с , ) ------ 2 ) л . ( с , - с ) jV <“1 N t=* Где с - полная доля правильны х ответов и ct - доля правильны х ответов в подкатегории t. Когда записанные ответы - это ответы, которые больше или равняю тся 0.5 (как с задачей с двумя альтернативами неполного диапазо­ на), первое слагаемое отраж ает способность субъекта выбрать правильную альтернативу и , таким образом, могло бы назы ваться знанием. К ак преж ­ де, второе слагаемое измеряет калибровку, а третье - решение. Подобные измерения калибровки были предложены Адамсами и Оскампом (Adams и A dam s, 1961, Oskamp, 1962). Ни одно из этих измерений к а ­ либровки не различает самонадеянности и неуверенности в себе. Свойства выборки этих мер не известны. М етеорологическое исследование В 1906, В. Эрнест К ук, правительственный астроном в Западной А встра­ лии, вы сказал точку зрения, что каж ды й метеорологический прогноз дол­ жен сопровождаться единственным числом, которое “указы вало бы, при­ близительно, степень вероятности, которую сам метеоролог приписывает этому предсказанию ” (Cooke, 1906b, с. 274). Он сообщил о результатах 1.951 предсказаний (Cooke, 1906а, 1906b). И з тех, которым он приписал самую высокую степень вероятности (“почти уверен, что правильно”), 0.985 были правильны. Д ля средней степени вероятности (“средняя вероятность”), 0.938 были правильны ми, в то время к ак для самой низкой степени вероятности (“сомнительный”), 0.787 были правильны . В 1951, У ильямс (W illiam s) попросил восемь профессиональных метео­ рологов в Солт-Лейк-Сити оценить вероятность выпадения осадков для к аж ­ дого из 1 0 9 5 12-часовых прогнозов, используя одно из чисел 0 ,0 .2 ,0 .4 ,0 .6 , 0.8 и 1.0. Почти по всему диапазону, доля дней с осадками бы ла ниж е, чем приписанная вероятность. Это могло бы отраж ать довольно естественную форму перестраховки в публичных утверж дениях. Лю ди, намного более вероятно, будут критиковать прогноз погоды, который оставит их в дождь без зонтика, чем прогноз, прислуш авш ись к которому они носили зонтик в дни без осадков. Подобные результаты показало исследование Мерфи и У инклера (M urphy и W inkler, 1974). Их метеорологи дваж ды оценили вероятность вы падения осадков на следующий день, к ак до, так и после наблю дения результатов компью теризированной системы предсказания погоды (PEATMOS). Эти 7.188 оценок (как до, так и после PEATMOS) показали ту ж е самую пере­ оценку вероятности дож дя, обнаруженную Уильямсом (W illiam s). Сандерс (Sanders, 1958) собрал 12.635 прогнозов, используя 11 ответов 0, 0 .1 ,..., 0 .9 ,1 .0 , для следующих дихотомизированных событий: направление 356 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ ветра, скорость ветра, порывы, температуры, облачность, высота облачнос­ ти, видимость, выпадение осадков, тип осадков и гроза. Эти данные показали только небольшую тенденцию оценок вероятности синоптиками превыш ать пропорцию погодных событий, которые произош ли.1 Рут (Root, 1962) сооб­ щ ил о симметричности калибровки 4.138 прогнозов осадков: приписанные вероятности были слиш ком низки в низком диапазоне и слиш ком высоки в высоком, относительно наблюдаемых частот. У инклер и Мерфи (W inkler и M urphy, 1968а) сообщили о калибровоч­ ны х кривы х за год прогнозов осадков в Хартфорде, ш тат Коннектикут. К аж ­ ды й прогноз был либо для 6-часового, либо 12-часового периода времени, с временем подготовки от 5 до 44 часов. К сожалению , было неясно, вклю чи­ ли ли синоптики “признаки осадков” (меньше чем 0.01 дюйма) в свои пред­ сказания. Данные были проанализированы дважды, предполагая, что “осад­ к и ” вклю чаю т или не вклю чаю т признаки. Вклю чение или исклю чение признаков имело существенное влияние на калибровку, к ак и временной период. 6-часовые прогнозы с признакам и и 12-часовые прогнозы, и без при­ знаков, показали превосходную калибровку. К ривая калибровки для 12часовы х прогнозов с признакам и располагается выш е линии идентифика­ ции; кри вая для 6-часовых прогнозов, без признаков, леж ит значительно ниж е ее. Разница во времени подготовки не затрагивала калибровку. Рис. 1. Данные калибровки для прогнозов осадков. Количество про­ гнозов показано для каж дой точки. ( Источник : M urphy и W inkler, 1977а.) 1 Ссылки на Кук (Cooke ,1906), Вилльямс (Williams, 1951) и Сандерс (Sanders, 1958) были предоставлены нашему вниманию Раиффом (1969). Калибровка вероятностей... 357 Н ациональная метеорологическая служ ба вы раж ает свои прогнозы воз­ никновения осадков в вероятностных терминах, начиная с 1965. Бы ла опуб­ ликована калибровка для некоторых частей этой массивной базы данных (M urphy и W inkler, 1977а; А мериканское метеорологическое бюро, 1969). За эти годы калибровка улучш илась. Рисунок 1 показы вает калибровку для 24.859 прогнозов осадков, сделанных в Ч икаго в течение четы рех лет, за­ канчивая июнем 1976. Он показы вает очень хорошую калибровку; Мерфи (M urphy, 1980) утверждает, что данные, полученныев течение недавних лет, даже лучше! Он приписывает лучш ее выполнение работы опыту в оценке вероятности, которы й синоптики приобрели за эти годы, а такж е тому ф ак­ ту, что эти данные были собраны на реальной ситуации на рабочем месте. Ранние лабораторные исследования В 1957 Адамс (Adams) сообщил о калибровке испытуемых, которые исполь­ зовали 11-ти бальную ш калу уверенности: испытуемых “попросили вы ра­ зить свою уверенность в терминах процента ответов, сделанных на опреде­ ленном уровне уверенности, которые, к ак они ожидаю т, будут правильны ­ ми. ... И з ответов, сделанных с уверенностью р, приблизительно р% долж ­ ны быть правильны ми” (с. 432-433). В задаче А дамса, каж дое из 40 слов было представлено с помощью тахистоскопа 10 испытуемым 10 раз подряд, каж ды й раз с более ярким освещ е­ нием. После каж дого показа каж ды й испытуемый записы вал, что по его мнению, он видел и давал оценку уверенности. Результирую щ ая кривая калибровки показала, что пропорции, которые были правильны ми, значи­ тельно превы ш али оценки уверенности по полному диапазону ответов (кро­ ме ответов 100). И нтерпретация этих данны х долж на производится очень осторожно: поскольку каж дое слово показы вали 10 раз, ответы сильно вза­ имозависимы. Неизвестно, какое влияние такая взаимозависимость оказы ­ вает на калибровку. Испытуемые, возможно, хотели “сдерж аться” при пер­ вых показах слова, не ж елая давать вы соких ответов, когда они знали, что это ж е слово будет представлено ещ е несколько раз. В следующем году, Адамс и Адамс (Adams и A dam s, 1958) сообщили об обучающем эксперименте, используя ту ж е ш калу ответов, но новую, трех­ альтернативную задачу с единственным ответом: Д ля каж дой из 156 пар слов запоказ, испытуемых спраш ивали, были ли слова антонимами, синони­ мами или несвязанны ми._Средние калибровочные оценки (основанные на абсолютной разности [rt- c ]), у 14 испытуемых экспериментальной груп­ пы, которым были показаны числа и кривы е калибровки после каж дого из пяти показов, уменьш илась на 48% от первого серии к последней. Ш есть испытуемых контрольной группы , единственной обратной связью которых был список их не засчитанных ответов, показали среднее увеличение на 36 % в оценках несоответствия. 358 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Адамс и Адамс (Adams и A dam s, 1961) обсуждали много аспектов калиб­ ровки (используя термин: реализм уверенности), предвосхищ ая много р а­ боты, сделанной другими, в недавние годы, и представили большее количе­ ство сведений, вклю чая чрезвычайно самонадеянную кривую калибровки ш изоф реника, который полагал, что он Иисус Христос. В задаче изучения бессмысленных слогов они обнаружили большую самоуверенность в пер­ вом испы тании и улучш ение после 16 испытаний. Они такж е кратко описа­ ли процедуру эксперимента: в первый день испытуемые приняли 108 реш е­ ний по поводу процента синих точек в последовательности синих и красны х точек. Н а второй и четверты й день испытуемые определяли истинность или лож ность 250 утверж дений на общеобразовательные темы. На третий день они с завязанны м и глазам и поднимали предметы, чтобы определить их вес. Н а пяты й день они приняли 256 реш ений по поводу отнош ения между п а­ рами слов (синонимия, антонимия или отсутствие отнош ения). Восемь ис­ пытуемых экспериментальной группы, которым предлагали обратную связь калибровки по истечению каж дого из первы х четы рех дней, на пяты й день показы вали среднее абсолютное значение несоответствия, которое было зна­ чимо ниж е, чем у 8 испытуемых контрольной группы (без обратной связи), предполагаю щ ее некоторый трансфер обучения. Н аконец, авторы сообщи­ ли, что для 56 испы туемы х, сдаю щ их экзамен по элементарной психологии с множественным выбором, более плохая калибровка была связана с боль­ ш им страхом неудачи (г=0.36). К страху неудачи не имели отнош ения ни наличие знаний, ни самонадеянность. Оскамп (1962) предъявлял испытуемым 2 0 0 профилей MMPI2в качестве стимула. Половина этих профилей принадлеж ала лю дям, приняты х в боль­ ницу управления ветеранов с психическими болезнями; остальные попали туда по чисто медицинским причинам. Задачей испытуемых было опреде­ лить, для каж дого профиля, имел ли пациент психическое или медицинс­ кое заболевание, и указать вероятность того, что их реш ение было правиль­ ны м. К аж ды й профиль был охарактеризован к ак трудный (61), средний (88) или легкий (51) на основе статистически полученной классиф икации, кото­ р ая различала 57% , 69% и 92% трудны х, средних и легких профилей, со­ ответственно. Все 2 0 0 профилей были оценены тремя группами испытуемых: 28 старш е­ курсников, специализирую щ ихся в психологии, 23 стажера-психолога в кли­ нике и 21 опытный клинический психолог. 28 неопытных испытуемых были позж е разбиты на две согласованные группы, и им снова дали те ж е самые 200 профилей. Половину и з них обучили в течение второго испы тания, как улучш ить точность; остальных обучили, как улучш ить калибровку. Оскамп (Oskamp) использовал три измерения вы полнения работы испы ­ туемы х: точность (исправление пропорции), уверенность (средний ответ 2Профиль MMPI (Minnesota Multiphasic Personality Inventory) - представленные в виде гра­ фика данные обследования по Миннесотскому Многофакторному Личностному опросни­ ку. Калибровка вероятностей... 359 вероятности), и правильность уверенности (счет калибровки): ^ y L nt \ rt ~ ct 1. Все три группы имели тенденцию быть самонадеянными, особенно старш е­ курсники в первом испы тании (точность 70% , уверенность 0.78). Однако все три группы были неуверенными в себе в легких профилях (точность 87% , уверенность 0.83). Испытуемые, обученные улучшению точности, увеличили свою точность от 67% до 73% , приближивш ись к их уровню уверенности 0.78, который не изменился в результате обучения.3 Субъекты, обученные калибровке, пони­ зили свою уверенность от 0.78 до 0.74, приблизив ее к своей точности 68% , которая осталась неизменной. К ак и ожидалось от этих изменений, оценка калибровки обеих групп улучш илась. И сследование обнаруж ения сигнала На ранних стадиях исследования обнаруж ения сигнала, исследователи изу­ чили возможность использования скорее оценок уверенности, чем ответов да-нет, чтобы уменьш ить количество данны х, требуемых для определения стабильных кривы х операционных характеристик приемника (ОХП). Свит, Таннер и Бедсалл (Sw ets, Tanner, и B irdsall, 1961) попросили, чтобы четыре наблю дателя указали свою уверенность в том, что они слыш али сигнал плюс ш ум, а не просто ш ум, для каждого из 1.200 испы таний. Х отя трое из четы ­ рех испытуемых были сильно калиброваны , все кривы е очень различались. Один испытуемый показал серьезную тенденцию назначать слиш ком м а­ ленькие вероятности (например, сигнал присутствовал более, чем в 70% раз, когда этот субъект использовал категорию ответа “ 0.05-0.19”). К ларк (C larke, 1960) предъявил одно из пяти различны х слов, смеш ан­ ны х с ш умом, слуш ателям через науш ники. Слуш атели выбрали слово, которое, к ак они думали, они слыш али и затем оценивали свою уверенность, указы вая одну из 5 категорий, которые разделяли ш калу вероятности на пять диапазонов. После каж дого из 12 практических испы таний 75 пунк­ тов, слуш атели записы вали свои собственные результаты и отмечали про­ цент правильны х идентификаций в каж дой категории оценки, таким обра­ зом, они могли менять стратегию на следующем испы тании. К ларк (Clarke) обнаружил, что, хотя все пять слуш ателей оказались хорошо калиброван­ ными, когда данные были усреднены по пяти словам стимула, анализ от­ дельных слов показал, что слуш атели имели тенденцию быть самонадеян­ 3Любители MMPI могли бы обратить внимание, что с этим минимальным обучением стар­ шекурсники показали столь же высокую точность как лучшие эксперты или лучшие систе­ мы прогнозирования. 360 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ ными для плохо понятных слов и неуверенными для хорошо понятных слов. П оллак и Декер (Pollack и Decker, 1958) использовали устно определен­ ную 6-ти бальную ш калу уверенности, от “Я уверен, что я получил сообще­ ние правильно” до “Я уверен, что я получил сообщение неправильно. ” С этой ш калой оценки невозможно определить, хорошо ли калиброван индивиду­ ум, но возможно увидеть изменения в калибровке во всех условиях. Кривые калибровки для легких слов обычно леж ат выше кривы х калибровки для трудных слов, независимо от отношения “сигнал-пгум”, и кривы е для высо­ ких значений отношения “сигнал-ш ум” леж ат выше кривы х для низких зна­ чений отнош ения “сигнал-ш ум”, независимо от трудности слова. В больш инстве этих исследований, калибровка мало интересовала иссле­ дователей; важ ны м вопросом было то, не дадут ли оценки уверенности те ж е самые кривы е ОХП что процедуры “да-нет”. К 1966, Грин и Свите (Green & Sw ets) заклю чили, что ш калы оценок и процедуры “да-нет” дают почти идентичны е кривы е ОХП. С тех пор, исследования калибровки исчезли из литературы по обнаружению сигнала. Н едавнее лабораторное исследование Чрезмерная уверенность. Наиболее важ ное откры тие в недавнем исследо­ вании - то, что люди являю тся самонадеянными в общеобразовательных вопросах умеренной или повыш енной трудности. Некоторые типичны е ре­ зультаты , показы ваю щ ие самонадеянность представлены на рис. 2. Х азард и Петерсон (H azard & P eterson, 1973) попросили 40 служ ащ их вооружен­ ны х сил, обучаю щ ихся в Ш коле внеш ней разведки, определить вероятность или ш ансы д л я 50 вопросов по общей осведомленности, имеющим две аль­ тернативы (например, “Какой ж урнал имел самый большой тираж в 1970, Плейбой или Тайм?”). Л ихтенш тейн (L ichtenstein, неопубликовано) полу­ чил подобные результаты , используя те ж е самые пункты , но только для 19 служ ащ их научно-исследовательского института ш тата Орегон, такж е, к ак Ф иллипс и Райт (P hillips, W rig h t, 1977) с различны ми пунктам и, исполь­ зуя Британских старш екурсников в качестве испытуемых. Другие многочисленные исследования, использующ ие вопросы на общие тем ы , п о к а за л и ту ж е сам ую сам о н ад еян н о сть (F isc h h o ff, S lovic и L ich ten stein , 1977; K o riat, L ichtenstein и Fischhoff, 1980; L ichtenstein и F ischhoff, 1 9 7 7 ,1980а, 1980b; N ickerson и M cGoldrick, 1965). Кембридж и Ш рекенгост (Cam bridge, Shreckengost, 1978) обнаружили самонадеянность у аналитиков Ц ентральной спецслужбы. Ф ишхофф и Словик (Fischhoff и Slovic, 1980) обнаруж или серьезную самонадеянность, используя множе­ ство невозмож ны х или почти невозможных задач (например, прогнозиро­ вание победителя в скачках на полтора километра или диагноз злокачествен­ ности опухоли). П итц (P itz, 1974) сообщил о самонадеянности, используя метод полного диапазона. Калибровка вероятностей... 361 Рис. 2. К алибровка для половины диапазона для пунктов на общее знание Фишхофф, Словик и Лихтенш тейн (Fischhoff, Slovic и L ichtenstein, 1977) сосредоточились на правильности вы раж ения уверенности. И спользуя раз­ нообразные методы (без альтернатив, одна альтернатива и две альтернати­ вы для половины диапазона и с полным диапазоном), они обнаружили, что только от 72% до 83% пунктов, на которые были даны ответы 1.0, были правильными. В задачах с полным диапазоном, пункты , которым был при­ писан другой экстремальный ответ, нуль, были правильными от 20% до 30% раз. И спользование вероятностного ответа не исправляло самонадеянность. Ответы, которым назначили вероятность 1.000:1 в том, что они правиль­ ные, только от 81% до 88% были правильными; для вероятности 1.000.000:1 правильная альтернатива была выбрана только от 90% до 96% раз. И спы­ туемые охотно использовали экстремумную вероятность; в одном из экспе­ риментов почти четвертая часть ответов бы ла 1.000:1 или больше. Далее ис­ следования показали, что чрезвы чайная самонадеянность распространялась не только на нескольких испытуемых или несколько пунктов. Влияние трудности. Самонадеянность наибольш ая в задачах большой трудности (Clarke, 1960; N ickerson и M cGoldrick, 1965; P itz, 1974). При рас­ смотрении невозможных задач (различить европейский и ам ериканский профиль, рисунки азиатских и европейских детей, рост и падение цен на 362 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ акции) кривы е калибровки не повыш ались вообще; для всех оцененных ве­ роятностей, доля правильно вы бранны х альтернатив бы ла близка к 0.5 (L ichtenstein и Fischhoff, 1977). Испытуемые не отказывались использовать вы сокие вероятности в этих задачах; от 70% до80% всех ответов были боль­ ш е 0.5. По мере того, к а к задачи становятся легче, самонадеянность уменьш ает­ ся. Л ихтенш тейн и Фишхофф (L ichtenstein и Fischhoff, 1977) позволили одной группе испытуемых в задаче различения профиля изучить правиль­ но помеченный набор типовых стимулов перед оцениванием вероятности. Этот опыт сделал задачу намного более легкой (71% , правильны х ответов против 51% для контрольной группы) и экспериментальная группа была лиш ь немного самонадеянна. Л ихтенш тейн и Ф ишхофф (1977) выполнили последующий анализ влияния трудности на калибровку, используя две боль­ ш ие совокупности данны х и з двуальтернативны х задач для половины диа­ пазона на общие темы. Они отделили легкие пункты (для которых большин­ ство испытуемых выбрало правильную альтернативу) от трудных, и хоро­ ш о осведомленных испытуемых (тех, которые выбрали наиболее правиль­ ные альтернативы ) от менее осведомленных. Они обнаружили системати­ ческое уменьш ение самонадеянности с увеличением процента правильны х ответов. Действительно, хорошо осведомленные испытуемые при ответе на самые легкие пункты были неуверены в себе (например, 90% правильны х ответов при ответе с вероятностью 0.80). А находка бы ла повторно обнару­ ж ена с двумя новыми группами испытуемых, которым были предложены наборы вопросов, выбранных, к ак трудные или легкие на основе ответов предыдущ ихгрупп. Результирую щ ие кривы е калибровки показаны на Ри­ сунке 3, наряду с соответствующими кривы м и калибровки последующего анализа. В упомянутом исследовании трудность была определена н а основе отве­ тов испытуемых (Clarke, I960; L ichtenstein и Fischhoff, 1977). Ранее, Лихненш тейн и Фишхофф (L ichtenstein и F ischhoff, 1980а), после О скампа (Oskam p, 1962), разработали набор из 500 двух-альтернативны х вопросов на общ ие темы , трудность которы х м огла бы ть определена независимо. Имелось три типа вопросов: какой из двух городов, ш татов, стран или кон­ тинентов является более густонаселенным (например, Лас Вегас или М айа­ ми), какой из двух городов находится дальш е на расстоянии от третьего го­ рода (например, “Н аходится ли М ельбурн дальш е от Рим а или от Токио?”), и какое историческое событие произош ло первым (например, подписание В еликой хартии вольностей или рождение М ухаммеда). Таким образом, каж ды й вопрос связы вал два числа (население, расстояние или прошедшее время с настоящ ем). Отношение большего к меньшему из этих чисел было принято как мера трудности: 250 вопросов с самыми больш ими отношени­ ям и были обозначены к ак легкие", оставш иеся — к ак трудные. Эта априор­ н ая классиф икация была весьма успеш на; для более чем 35 испытуемых, процент правильны х ответов составил 81 для легких вопросов и 58 - для Калибровка вероятностей... 363 трудных. Эти результаты , такж е, показали самонадеянность для трудных вопросов и неуверенность испытуемых для легких. Влияние легкости или трудности, каж ется, является результатом неспо­ собности экспертов понять, насколько вопрос трудный или легкий. Ф иллипс и Ч у (P hillips, Chew, не опубликовано) не обнаружили корре­ ляции между процентом правильны х ответов и оценками трудности по 11ти бальной ш кале. Однако испытуемые дают различны е распределения от­ ветов д л я различны х задач; Л ихтенш тейн и Ф иш хофф (L ich ten stein и Fischhoff, 1977) отметили корреляцию в 0.91 между процентом правиль­ ных ответов и средним ответом для 16 различны х наборов данных. Но раз­ ница в распределении ответов - меньш е чем, она долж на быть: по тем те ж е 16 наборам данных, доля правильны х ответов варьировалась от 0.43 до 0.92, в то время к ак средний ответ, варьировался только от 0.65 до 0.86. Ответы испытуемых Рис. 3. Калибровка для трудных и легких тестов и для трудных и легких заданий тестов 364 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Ф еррелл и МакГоу (Ferrell и McGoey, 1980) недавно разработали модель для калибровки дискретных оценок вероятности, которая учитывает эффект лег­ кости - трудности. Модель, основанная на теории обнаружения сигнала, пред­ полагает, что эксперты преобразовывают свое чувство субъективной неопреде­ ленности в переменную решения, X , которая разделена на секции с границами { x j. Оценивающий сообщает о вероятности г , всякий раз, когда X находится между хи и х . Феррелл и МакГоу (Ferrell и McGoey) предполагают, что, при отсутствии обратной связи о действии калибровки, оценивающий не будет из­ менять набор значений пределов, {х.}, по мере того, как изменяется трудность задачи. Это предположение ведет к прогнозированию самонадеянности в труд­ ны х вопросах и неуверенности в легких. Применение модели к большому ко­ личеству данных из работ Лихтенш тейна и Фишхоффа (1977) показало соот­ ветствие к ак по кривым калибровки, так и по распределению ответов согласно предположению, что значения пределов остались постоянными по мере изме­ нения трудности. Таким образом, влияние трудности или легкости рассматри­ вается как неспособность изменить пределы, вовлеченные в преобразование от чувства определенности к вероятностным ответам. Влияние базового значения. Одно-альтернативные (истина-ложь) задачи мо­ гут быть охарактеризованы долей истинны х утверждений в наборе вопро­ сов. Чтобы быть хорош о калиброванны м на некотором наборе вопросов, нуж но принимать во внимание информацию базового значения. Модель об­ наруж ения сигнала Ф еррелла и М акГоу (F errell и McGoey, 1980) предпола­ гает, что на калибровку воздействуют независимо (а) доля истинны х утвер­ ж дений и (Ь) способность оценивающего различать истинные утверж дения от лож ны х. Д опуская, что значения границ {х4}, остаются постоянными, мо­ дель прогнозирует различны е воздействия на калибровку в зависимости от изменения доли истинных утверждений (оставив различимость постоянной) в отличие от изменения различимости (оставляя постоянной пропорцию ис­ тинны х утверж дений). Ф еррелл и М акГоу (F errell и McGoey) представили данны е, подтверждаю щ ие их модель. Студенты на трех курсах, изучаю щ ие технические науки оценили вероятность, что ответы, которые они написа­ ли на экзам енах, будут оценены экзаменатором к ак правильны е. Последу­ ющ ий анализ, распределяю щ ий испытуемых на четы ре группы (высокий или низкий процент правильны х ответов, вы сокая или н и зкая различи­ м ость), п о к азал р азл и ч и я к али б ровки , спрогнозированны е моделью . Н еопубликованные данные, собранные Фишхоффом и Лихтенш тейном, по­ казанны е на Рисунке 4, такж е подтверждают правильность модели. Ч еты ­ ре группы испытуемых получили 25 одно-альтернативных вопросов на об­ щ ие темы (например, “Н аписана ли Энеида Гомером?”), различаю щ иеся по количеству истинны х утверждений: 8% , 20% , 50% и 71% . Группы показа­ ли сильно различаю щ ие кривы е калибровки, приблизительно той ж е фор­ мы к ак спрогнозировали Ф еррелл и МакГоу для изменения базового значе­ н и я, при постоянной различимости. Калибровка вероятностей... 365 Ответы испытуемых Рис. 4. Влияние на калибровку изменений в проценте истинных ут­ верждений (.Источник: Fischhoff и L ichtenstein, неопубликовано) Индивидуальные различия . Н еквалифицированны е утверж дения, что один человек лучш е калиброван, чем другой, трудно сделать по двум при­ чинам. Во-первых, необходимо, по крайней мере, несколько сотен ответов, чтобы получить стабильное измерение калибровки. Во-вторых, оказы вает­ ся, что калибровка сильно зависит от задачи, особенно от ее трудности. Дей­ ствительно, Лихтенш тейн и Ф ишхофф (1980а) предполагали, что для к аж ­ дого человека мож ет существовать “идеальная” задача (то есть, задача, уро­ вень трудности которой не приводит ни к самонадеянности, ни к неуверен­ ности в себе, и таким образом, задача, в которой человек будет наилучш им образом калиброван). Однако, уровень трудности “идеальной” задачи мо­ жет быть разны м для разны х людей. Таким образом, даж е, когда один че­ ловек лучш е, чем другой в некотором наборе вопросов, для более трудного или легкого набора мож ет быть истинным обратное. Сравнения между различны ми группами субъектов показали мало раз­ личий, когда трудность управлялась. Аспиранты-психологи, которые, пред­ положительно, более осведомлены, чем обычные испытуемые (старш екур­ сники, которые ответили на объявление в газете колледж а), не показали ни­ какой разницы в калибровке (L ichtenstein и Fischhoff, 1977). И при этом мы не обнаружили различия в калибровке или самонадеянности между муж ­ чинами и ж енщ инами (L ichtenstein и Fischhoff, 1981). Райт и Ф иллипс (1976) исследовали отношения среди нескольких измере­ ний качеств личности (авторитаризм, консерватизм, догматизм и нетерпи­ 366 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ мость к двусмысленности), вербальные выражения неопределенности (напри­ мер, количество слов таких, к ак маловероятно, использованных в коротких письменных ответах на 45 вопросов), и несколько измерений калибровки. Единственные связи, которые они обнаружили между шестью ш калами лич­ ности и семью измерениями калибровки, были две скромные корреляции (0.41 и 0.34) со ш калой авторитаризма. Калибровка ответов определенности (то есть, ответы 1.0) не коррелировала с калибровкой ответов неопределенно­ сти (< 1.0). И змерения вербальной неопределенности были некоррелированы с любым из числовых измерений калибровки. Авторы заклю чили, что ве­ роятностное мыш ление не является ни единственным фактором, ни сильно связанным с индивидуальными различиями качеств личности. Райт и другие (1978) исследовали межкультурные различия в калибров­ ке. Калибровка их британской выборки показана на рис. 2 (обозначенная как Phillips и W right, 1977). Их другими выборками были студенты из Гонконга, Индонезии и М алайзии. Азиатские группы показали по существу плоские кривы е калибровки. Авторы реш или, что азиатские философы, интересую­ щ иеся вопросами судьбы, могли бы объяснить эти различия. Попытки коррекции. Фишхофф и Словик (Fischhoff и Slovic, 1980) про­ бовали предотвратить появление самонадеянности на задаче различения ри­ сунков азиатских от европейских детей, используя явно обескураживающие инструкции: Все рисунки были взяты из Детской художественной коллекции доктора Роды Келлогг (Rhoda Kellogg), главного сторонника теории, что рисунки детей из разных стран и куль­ тур очень похожи.... Помните, что может быть совершенно невозможно различить эти рисунки. Сделайте все, что в ваших силах. Но если, в крайнем случае, Вы чувствуете полную неопределенность относительно происхождения этих рисунков, не смущайтесь отвечать0.5 для каждого из них. (с. 792) Эти инструкции понизили средний ответ примерно до 0.05, но тем не менее была обнаружена существенная самонадеянность. Улучшит ли калибровку усиление мотивации? Сибер (Sieber, 1974) сравнил калибровку двух групп студентов на связанных с курсом набором вопросов с че­ тырьмя альтернативами. Одной группе сказали, что они сдают экзамен в конце семестра. Другой группе было представлено не как экзамен в конце семестра, а как подготовка к нему. Эти две группы не отличались по числу выбранных пра­ вильных альтернатив, но предположительно более мотивированная группа (та, в которой ответы определяют их уровень) показала значимо худшую калибров­ ку (большую самонадеянность). Обученные эксперты, с обратной связью о калибровке, показали смешанные результаты. Как упомянуто, Адамс и Адамс (1958) обнаружили незначительное улучш ения к ачес тва калибровки после пяти сессий обучения и , в более позднем исследовании (1961) наблюдалась некоторая генерализация обучения. Чу (Choo, 1976), используя только одну сессию обучения с 75 двух-альтернативными воп­ росами на общие темы, обнаружил малое улучшение и никакой генерализации. Калибровка вероятностей... 367 Лихтенш тейн и Фишхофф (1980b) обучили две группы испытуемых пу­ тем предоставления обширной, персонифицированной обратной связи калиб­ ровки после каж дой 2-й или 10-й серии вопросов, составленных из 200 двух­ альтернативных вопросов на общие темы. Они обнаружили заметное улуч­ ш ение калибровки, которая произош ла между первой и второй сериями. Скромная генерализация произош ла для задач с различными уровнями труд­ ности, содержанием и способом ответа (четыре, а не две альтернативы), не было обнаружено никакого улучш ения для задачи оценки квантиля (опи­ санной в следующей главе) или различения европейского от американского образцов профиля. Другой подход к улучшению калибровки - это реструктурировать задачу таким способом, который препятствует появлению самонадеянности. В ис­ следовании Кориата, Л ихтенш тейна и Ф иш хоффа (K oriat, L ichtenstein и Fischhoff, 1980), испытуемые сначала отвечали на 30 двух-альтернативных вопросов на общие темы обычным способом. Затем они получили 10 дополни­ тельных вопросов. Д ля каждого вопроса они записали все причины, которые они могли придумать, в поддержку или опровержение каждому из двух воз­ можных ответов, а затем сделали обычный выбор и оценки вероятности. Эта процедура значительно улучш ила их калибровку. Дополнительное исследо­ вание помогло точно определить эффективный компонент этого метода. Пос­ ле ответа на начальный набор из 30 вопросов, испытуемым предлагали еще 30 вопросов. Д ля каждого, они сначала выбрали предпочтительный ответ, затем писали (а) причину, поддерживающую их выбранный ответ, (Ь) причи­ ну, противоречащую выбранному ответу или (с) две причины, одну в поддер­ ж ку и одну в опровержение. Затем они оценили вероятность, что выбранный ответ был правилен. Только та группа, которую попросили написать опро­ верж ения, показала улучшенную калибровку. Этот результат, такж е как исследования корреляции, основываясь на данных от первого исследования, говорит о том, что эффективным средством от самонадеянности является по­ иск причины, почему человек не прав. Экспертиза. Студенты, изучающ ие в колледже определенный предмет, являю тся экспертами, по крайней мере, временно, в материале темы предме­ та. Сибер (Sieber, 1974) сообщил о превосходной калибровке у студентов, сда­ ющих пробный экзамен (то есть, у группы студентов, которым сказали, что это не экзамен). Более чем 98% их ответов с вероятностью 1.0 и только 0.5% из их ответов с вероятностью 0 были правильными. П иц (P itz, 1974) попро­ сил студентов сделать прогноз своих оценок на его курсе; они такж е были хорошо калиброваны. Бы ли ли бы эти испытуемые так ж е калиброваны на вопросах эквивален­ тной трудности, которые не были в их области изучения? Лихтенш тейн и Фишхофф (1977) попросили аспирантов-психологов ответить на 50 двух-альтернативных вопросов на общие темы и на 50 вопросов, охватывающих зна­ ния по психологии (например, “тест И ш ихара - это (а) перцептивный тест, 368 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ (Ь) тест социального беспокойства”). Два субтеста имели равную трудность, и калибровка была одинаковой для этих двух задач. Кристенсен-Сзалански и Бушихед (Christensen-Szalanski и Bushyhead, 1981) сообщили об оценках вероятности пневмонии девяти врачей для 1.531 пациен­ тов, которые были обследованы из-за жалоб на каш ель. Их калибровка была уж асна; кривая повышалась настолько медленно, что для самого высокого уровня уверенности (приблизительно 0.88) доля пациентов, фактически боль­ ных пневмонией, была меньше чем 0.20. О подобных результатах было сооб­ щено Ластедом (Lusted, 1977) для диагнозов перелома черепа и пневмонии, и ДеСметом, Фрайбеком и Торнбери и для диагнозов перелома черепа (DeSmet, Fryback, и Thom bury, 1979). Результаты этих полевых исследований с врача­ ми четко противоречат превосходной калибровке прогнозов погоды метеоро­ логами. Мы считаем, что несколько факторов благоприятствуют синоптикам. Во-первых, они делают вероятностные прогнозы в течение многих лет. Во-вто­ рых, задача постоянно повторяется; вопрос, на который нужно ответить (Бу­ дет ли дождь?) - всегда тот ж е самый. Напротив, лечащий врач постоянно рас­ сматривает множество возможностей (Действительно ли это перелом черепа? У нее фарингит? Он нуждается в дальнейшей госпитализации?). Наконец, об­ ратная связь исхода для синоптиков хорошо определена и быстро получена. Это не всегда так для врачей; пациенты могут не возвращаться или обратиться в другое место, или диагнозы остаются неопределенными. Люди, которые держат пари или устанавливают вероятность на скачках, могли бы такж е считаться экспертами. При тотализаторном методе, оконча­ тельная вероятность определена количеством денег, поставленных на каж ­ дую лош адь, что позволяет вычислить своего рода кривую калибровки. Та­ кие кривы е (Fabricand, 1965; Hoerl и Fallin, 1974) показывают превосходную калибровку людей, с небольшой тенденцией ставить на кон слиш ком много на длинных дистанциях. Однако такие данные только теоретически связаны с оценкой вероятности. Более уместные результаты калибровки, сообщенные Дауи (Dowie, 1976), который изучал предполагаемые ставки, напечатанные ежедневно в спортивной газете в Британии. Эти прогнозы, в форме вероятно­ стей, сделаны одним человеком для всех лошадей в данной скачке; прибли­ зительно восемь человек делали прогнозы в течение исследуемого года. К а­ либровка прогнозов для 29.307 лошадей показала небольшую неуверенность для вероятностей большее чем 0.4 и превосходную калибровку для вероятно­ стей меньше чем 0.4 (что включило 98% данных). Развиваю щ ееся исследование относительно калибровки привело к разви­ тию нового вида экспертизы: эксперты калибровки, которые знают об общих ош ибках, которые люди делают в оценке вероятностей. Лихтенш тейн и Фишхофф (1980а) сравнили калибровку 8 таких экспертов с 12 неопытными испы туемы мии 15 испытуемыми, которые предварительно были обучены, что­ бы быть хорошо калиброванными. Нормативные эксперты не только преодо­ лели самонадеянность, типично показанную неопытными испытуемыми, но и очевидно чрезмерно ее компенсировали, поскольку они были неуверенны­ Калибровка вероятностей... 369 ми в себе. Эксперты были более чувствительны к трудности вопросов, чем две другие группы. Будущие события. Райт и Виш худха (W right & W ishudha, 1979) предпо­ ложили, что калибровка для будущих событий может отличаться от калиб­ ровки для вопросов на выявление уровня общих знаний. Если это верно, это ограничило бы экстраполяцию от исследования с вопросами по общей осве­ домленности к прогнозированию будущих событий. К сожалению, вопросы Райта и Виш удха на общие темы были более трудными, чем их будущие со­ бытия, что может объяснить лучшую калибровку последних. Фишхофф и Бейт (Fischhoff и Beyth, 1975) попросил 150 израильских сту­ дентов оценить вероятность 15 будущих событий, возможные исходы широ­ ко освещенной в средствах массовой информации поездки Президента Н ик­ сона в К итай и Россию (например, “Президент Никсон встретится с Мао, по крайней мере, один раз”). Результирую щ ая кривая калибровки была весьма близка к линии идентификации. Однако, Фишхофф и Лихтенш тейн (не опуб­ ликовано) недавно обнаружили, что калибровка будущих событий показала ту же высокую самонадеянность, как и для вопросов на общие темы сопоста­ вимой трудности. Ф иллипс и Чу (не опубликовано) получили кривые калиб­ ровки для трех наборов вопросов: общие темы, будущие и прошлые события (например, “авиалайнер-гигант потерпел круш ение, и погибло более 100 че­ ловек за прошедший месяц”). Все три кривы е показали самонадеянность. Калибровка для будущих и прошлых событий была идентична, и несколько лучше, чем для вопросов на общие темы. Уровни трудностей трех наборов вопросов не могли объяснить эти результаты. Дж ек Доуи (Dowie) и его коллеги теперь собирают данные калибровки в Заочном университете в Милтоне Кейнесе, А нглия, от нескольких сотен сту­ дентов на курсах по изучению риска, используя вопросы, связанные с кур­ сом, на общие темы и о событиях будущего. Студенты получили общее пред­ ставление о концепции калибровки, и им предложили обратную связь отно­ сительно их результатов и калибровки. Предварительные результаты (Dowie, 1980) говорят, что они были умеренно самонадеянны. Калибровка была луч­ шая в вопросах на общие темы и сам ая плохая в вопросах, связанны х кур­ сом, но значимость и происхождение этих различий еще нужно исследовать. Н еп р ер ы в н ы е п р ед п о л о ж ен и я : н ео п р ед ел ен н ы е в е л и ч и н ы Метод к ва н т и ля Неопределенность значения неопределенной непрерывной величины (на­ пример, к ак ая доля студентов предпочитает скотч бурбону? Каково самое короткое расстояние от А нглии до А встралии?) может быть вы раж ена к ак ф ункция плотности вероятности для возможных значений этой величины. Однако экспертов обычно не просят строить всю функцию . Вместо этого, 370 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ обы чная процедура - некоторая разновидность метода кван ти ля. В этом методе оцениваю щ ий задает значения неопределенной величины , которые связаны с м аленьким количеством предопределенных квантилей распреде­ ления. Д ля медианы или квантиля 0.50, например, оцениваю щ ий задает такое значение величины , что истинное значение, с равной вероятностью будет попадать выш е или ниж е заданного значения; квантиль 0 .0 1 - это та­ кое значение, что существует только 1 шанс из 100, что истинное значение является меньш им, чем заданное. Обычно оцениваю тся три или пять кван­ тилей, вклю чая медиану. В варианте под названием метод тертилей, оце­ ниваю щ ий задает две величины (0.33 и 0.67 квантили) такие, что полный диапазон разделен на три одинаково вероятных секции. Обычно регистрирую тся два измерения калибровки. Межквартилъный индекс - процент вопросов, для которых истинное значение попадает в межквартильны й диапазон (то есть, между квантилям и 0.25 и 0.75). Полнос­ тью калиброванны й человек будет, в конечном счете, иметь меж квартильный индекс 0.50. Индекс неожиданности - это процент истинны х значе­ ний, которы е не попадают в крайние оцененные квантили. Когда наиболее крайние квантили оценены к ак 0.01 и 0.99, полностью калиброванный че­ ловек будет обладать индексом неожиданности 2. Больш ой индекс неож и­ данности показы вает, что границы уверенности экспертов были слиш ком узким и, чтобы охватить достаточно истинны х значений, и таким образом, указы вает на самонадеянность (или гиперточность; P itz, 1974). Неуверен­ ность будет обозначена меж квартильны м индексом больше 50 и низким ин­ дексом неожиданности; ни о каки х подобных данны х не сообщалось в лите­ ратуре. Импульс для исследования калибровки ф ункций плотности вероятнос­ ти появился в 1969 в книге А льперта и Рейфа (A lpert и R aiffa, 1969, 21). А льперт и Рейфф а работали со студентами бизнес ф акультета Гарварда, к о­ торые были знакомы с анализом принятия реш ений. В группе 1, все испы ­ туемые оценивали пять квантилей, три из которы х были 0.25, 0.50 и 0.75. Крайние квантили различались для четы рех подгрупп; 0.01 и 0.99 (группа А); 0.001 и 0.999 (группа В); “м иним альная возмож ная величина” и “м ак­ сим альная возмож ная величина” (группа С); и “удивительно н и зкая вели­ чин а” и “удивительно вы сокая величина” (группа D). М еж квартильны е ин­ дексы и индексы неожиданности для этих четы рех подгрупп показаны в табл. 1. Разочарованные большим количеством случаев неожиданности, А ль­ перт и Рейффа провели эксперимент с тремя дополнительными группами (2, 3 и 4) которые, после оценки 10 неопределенных величин, получили обрат­ ную связь в форме расширенного сообщения и объяснения результатов, н а­ ряду с призывом “Расш ирьте ваш и крайние квантили!” Затем испытуемые ответили на 10 новых неопределенных величин. Результаты до и после полу­ чения обратной связи показаны в табл. 1. Результаты улучш ились, но испы­ туемые все ещ е показы вали значительную самонадеянность. Калибровка вероятностей... 371 Хессиан и М акКарти (Hession и M cCarthy, 1974) собрали данные, сопоста­ вимые с первым экспериментом Альперта и Рейффы, используя 55 неопреде­ ленных величин и 36 аспирантов в качестве испытуемых. Их инструкции вынудили испытуемых убедиться, что интервал между квантилем 0.25 и кван­ тилем 0.75 действительно захватывает половину вероятности. “Более позднее обсуждение с отдельными испытуемыми прояснило, что эта проверка после­ довательности закончилась в большинстве случаев реорганизацией, умень­ ш ая первоначально оцененный межквартильны й диапазон” (с. 7) таким об­ разом, все только ухудшилось! Этот акцент на обучение, не используемый Альпертом и Рейффом, может объяснять, почему испытуемые Хессиан и М ак­ Карти были так плохо калиброваны , к ак показано в Таблице 1. Таблица 1. Резюме калибровки для непрерывных вопросов: Процент истин­ ных значений, попадающих в межквартильный диапазон и не попадающих в экстремумные квантили N Н аблю даем ы е м еж кварт ильны е и н дексы .• И н д е к с н еож и дан н ост и наблю даем ы й и д е а л ьн ы й 46 2 Алъпертп и Р е й ф ф а (1 9 6 9 ) Группа 1-А (0.01,0.99) 880 Группа 1- В (0.001, 0.999) 500 40 0.2 Группа 1-С ("мин” и "макс") Группа 1-D ("удивительно высокая/низкая величина") Группы 2 ,3 и 4 700 47 ? 700 38 ? 33 До обучения 2.270 34 34 2 После обучения 2.270 44 19 2 Х е с с и а н и М акКарт и (1 9 7 4 ) 2.035 25 47 2 Пять квантилей 400 56 10 2 Семь квантилей (вкл. 0.1 и 0.9) 520 50 7 2 Три квантиля 120 - 27 2 Пять квантилей 145 32 42 2 210 - 38 2 С ел в и ж д ( S e lv id g e , 1 9 7 5 ) М осковит пц и Б у л л е р с ( M o s k o w itz & B u lle rs, 1 9 7 8 ) Пропорции Доу-Джонс (Dow-Jones) Три квантиля 372 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Продолжение табл. 1 П и к х а р т и В о л л е й с ( P ic k h a r d t & W a lla c e , 1 9 7 4 ) Группа 1 Первое испытание Пятое испытание Группа 2 Первое испытание Шестое испытание Т. А . Б р а у н (Т .А . B r o w n ,1 9 7 3 ) ? ? 39 49 32 20 2 2 ? ? 30 45 46 24 2 414 29 42 2 924 924 32 37 41 40 2 2 160 42 34 160 180 180 140 53 57 47 31 24 5 5 20 2 2 2 2 2 396 396 23 38 39 12 2 396 16 50 2 396 48 6 2 42 ? 5 ? 2 Л и х т е н ш т е й н и Ф иш хоф ф (L ic h te n s te in & F isc h h o ff, 1980b) До испытания После испытания С и вер, ф он В и н т е р ф е л ь д т и Э д в а р д з (S e a v e r , v o n W in te r f e ld t & E d w a r d s , 1 9 7 8 ) Квантили Вероятностные квантили Вероятности Шансы Протокол шансов Ш еф ер и Б о р ч е р д и н г (S c h a e fe r и B o rc h e rd in g , 1 9 7 3 ) Первый день, квантили Четвертый день, квантили Первый день, гипотетическая выборка Четвертый день, гипотетическая выборка 2 Л а р со н и Р и н а н (L arson & R eenan, 1 9 7 9 ) "Вполне уверен" 450 П р е т т (P r a tt, 1 9 7 5 ) "Удивительно высокие/ низкие" значения 175 37 Калибровка вероятностей... 373 Продолжение табл. 1 М ер ф и и В и н к л е р (M u r p h y и W in k le r , 1 9 7 4 ) Экстремумы 0.125 и 0.875 132 45 27 25 432 54 21 25 1,269 27 М ер ф и и В и н к л е р (M u r p h y и W in k ie r , 1 9 7 7 b ) Экстремумы 0.125 и 0.875 Штаел фон Хольстен (Stael von Holstern, 1971а) 30 2 Примечание: N - общее количество оцененных распределений. аИ деальный процент событий, попадаю щ их в пределы меж квартильного диапазона 50, для всех экспериментов кроме Брауна (1973). Он вы являл квантили 0.30 и 0.70, так что идеал - 40 % . Хессиан и М акКарти такж е предлож или испытуемым множество инди­ видуальны х черт характера: авторитаризм, догматизм, ж есткость, ш кала ш ирины категории Петтигрю и интеллект. К орреляции экзаменационны х отм еток испы туем ы х с их м еж кварти льн ы м и индексам и и индексам и неожиданности были весьма низким и, хотя ш кала авторитаризма соотно­ силась к ак -0 .3 1 с м еж квартильной оценкой и + 0.47 с оценкой неож идан­ ности (N = 28). Это соответствует выводу Райта и Ф иллипса (1976), что авто­ ритаризм был мало связан с калибровкой. Селвидж (Selvidge, 1975) расш ирил исследование Альперта и Рейффы, сна­ чала задав испытуемым четыре вопроса относительно их самих (например, “Вы предпочитаете скотч или бурбон?”). И х ответы определили истинный ответ для долей, произведенных группой (например, к акая доля испытуемых, ответивш их на анкетный опрос, предпочитала скотч бурбону?). Одна группа дала пять квантилей, 0 .0 1 ,0 .2 5 ,0 .5 0 ,0.75 и 0 .9 9 . Другая группа дала эти ж е пять плюс два других: 0.1 и 0.9. К ак показано в Таблице 1, группа с семью квантилями показала немного лучш ие результаты. Результаты с пятью кван­ тилями не столь отличны от результатов А льперта и Рейффы, как каж ется. Три неопределенные величины А льперта и Рейффы были долями, произве­ денными группой, подобно вопросам Селвиджа. В этих трех вопросах, АльпертиРейф ф а обнаружили 57% в межквартильном диапазоне и 20% неожи­ данностей. Наконец, для одного из вопросов, половину испытуемых в ipynne с пятью квантилями просили сначала дать 0.25, 0.50 и 0.75, а затем 0.01 и 0.99, в то время к ак другую половину попросили сначала оценить экстрему­ мы. Селвидж обнаружил меньше случаев неожиданности для прежнего по­ рядка (8% ), чем для последнего (16% ). М осковитци Буллерс (Moskowitz и B ullers, 1978) такж е использовали про­ порции, произведенные группой, но обнаружили намного больше случаев 374 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ неожиданности, чем Селвидж. Одна группа дала те ж е самые пять кванти­ лей, которые использовал Селвидж (в порядке 0 .5 ,0 .2 5 ,0 .7 5 ,0 .0 1 ,0 .9 9 ). Дру­ гую группу попросили сделать только три оценки (способ распределения и квантили 0.01 и 0.99). Перед оцениванием, группе с тремя квантилями пред­ ставили некоторые типичные базовые события (например, “Рассмотрим ло­ терею, в которой участвуют 100 человек. Ваш шанс получить выигрыш ный билет равняется 1 из 100”), чтобы обеспечить лучшее понимание вероятнос­ ти 0.01. К ак показано в Таблице 1, у группы с тремя квантилями было мень­ шее количество случаев неожиданности, чем у группы с пятью квантилями. В другом эксперименте, использующем те ж е самые два метода, М осковиц и Буллерс попросили 44 старш екурсника, специализирую щ ихся в коммерции, оценить среднее значение индустриального индекса Доу-Джонса (Dow-Jones) за 1977,1974,1965, I960 и 1950 годы. Каждый испытуемый дал оценки дои после участия в обсуждениях с тремя людьми. Так как никаких системати­ ческих различий из-за участия в обсуждении не было обнаружено, данные были объединены в Таблице 1. Опять ж е, группа с тремя квантилями (в кото­ рой испытуемые получили представление о значении 0.01) имела меньшее количество случаев неожиданности, чем группа с пятью квантилями. Резуль­ таты группы с пятью квантилями были чрезвычайно плохими. П икхарт и Воллейс (P ickhardt и W allace, 1974) повторил работу Альперта и Рейффы с изменениями. Д ля нескольких групп они сообщили об обна­ руж ении от 38% до 48% случаев неожиданностей до получения обратной связи и не меньше, чем 30% неожиданностей после получения обратной свя­ зи. Две разновидности, используя или не используя зачет по предмету как награду за хорошую калибровку и используя или не используя расчетные правила обратной связи, не привели к каким-либо различиям в количестве случаев неожиданностей. П икхарт и Воллейс такж е изучали влияние рас­ ш иренного обучения: две группы из 18 и 30 испы туем ы х (о количестве неопределенных величин не сообщается) прош ли пять и ш есть серий испы ­ таний с калибровочной обратной связью после каж дого испы тания. Было обнаружено небольшое лучш ение, к ак показано в табл. 1. Н аконец, П икхарт и Воллейс (1974) изучали влияние увеличиваю щ его­ ся знания н а калибровку в контексте игры моделирования производства PROSIM. Тридцать два аспиранта произвели 51 оценку в течение смодели­ рованны х 17 “дней” планирования производства. К аж дая оценка касалась события, которое произойдет через 1, 2 или 3 “дн я”. Чем ближ е время оце­ нивания ко времени события, тем больше испытуемый знал о событии. Са­ монадеянность уменьш илась с увеличением информации: оказалось 32% неожиданностей с 3-дневными задерж кам и, 24% с 2-дневными задерж ка­ ми, и 7% с 1-дневными задерж ками. У лучш ения не наблюдалось в течение 17 “дней” стимуляции. Т.А . Браун (1973) попросил 31 испытуемого оценить семь квантилей (0.01, 0.10, 0.30, 0.50, 0.70, 0.90, 0.99) для 14 неопределенных величин. Результаты , показанны е в табл.1, являю тся особенно обескураживаю щ и­ Калибровка вероятностей... 375 м и, потому что каж ды й вопрос сопровождался обширными историческими данными (например, для вопроса “Н а какой отметке будет находиться ин­ декс потребительских цен в декабре 1970?” испытуемым предлагали индек­ сы потребительских цен в течение каж дого квартала между мартом 1962 и июнем 1970). Д ля 11 вопросов, независимо от того, дал ли испытуемый ис­ торический минимум к ак квантиль 0.01 и исторический максимум к ак квантиль 0.99, у них не было неожиданностей вообще. Другие 3 вопроса показали строгое увеличение или строгое уменьш ение историй, и истинная величина бы ла близка к простому приближению исторической тенденции. Испытуемые, должно быть, сильно полагались н а свои собственные ош и­ бочные знания, чтобы дать распределения, настолько плотные, чтобы пока­ зать 42% случаев неожиданности. Л ихтенш тейн и Фишхофф (1980b) вы явили пять квантилей (0.01, 0.25, 0 . 5 .0 .7 5 .0 .9 9 ) от 12 испытуемых на 77 неопределенных величинах, к ак до, так и после того, к ак испытуемые получили обширное обучение калибров­ ке на дискретны х двух-альтернативны х вопросах. К ак показано в Таблице 1, испытуемые не улучш или значимо калибровку по неопределенным ве­ личинам. Д ругие методы Сивер, фон Винтерфельдти Эдвардз (Server, von W in terfeld tи Edw ards, 1978) изучали влияние пяти различны х способов ответа на калибровку. Две груп­ пы использовали метод одного квантиля, либо пяти квантилей (0 .0 1 ,0 .2 5 , 0.50, 0.75, 0.99), либо эквиваленты вероятности этих квантилей (1 :9 9 ,1 :3 , 1:1, 3:1, 99:1). Три других группы отвечали вероятностями, ш ансами или заполняли протоколы шансов н а одно-альтернативные вопросы, которые определяли некоторое значение неопределенной величины (например, “К а­ кова вероятность того, что население Канады в 1973 превысило 25 милли­ онов?”). П ять таких установленных значений давались для каж дой неопре­ деленной величины , и, исходя из ответов, экспериментаторы оценивали м еж квартильны е индексы и индексы неожиданности. Д ля каж дого мето­ да, семь из девяти студентов отвечали н а 20 неопределенных величин. Как показано в Таблице 1, группы, дающие вероятностные ответы и ответы ш ан­ сов, показали лучш ие индексы неожиданности, чем испытуемые, исполь­ зующ ие метод квантиля. Н еясно, появляется ли это превосходство из-за ин­ ф орм ации, сообщенной значениям и, которы е вы брал экспериментатор. Способ ответа на протоколы ш ансов не функционировал должным образом. Ш ефер и Борчердинг (Schaefer и B orcherding, 1973) попросили 22 сту­ дентов оценить 18 пропорций, сделанных группой, в каж дом из четырех ис­ пы таний. К аж ды й испытуемый использовал два метода оценки: (а) метод квантиля (0.01, 0 .1 2 5 ,0 .2 5 ,0 .5 ,0 .7 5 ,0 .8 7 5 ,0 .9 9 ), и (Ь) метод гипотетичес­ ки х выборок. В последнем методе, оцениваю щ ий задает размер, п, и число успехов, г, гипотетической выборки, которая лучш е всего отраж ает знание 376 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ экспертов неопределенной величины (то есть, я чувствую себя столь ж е уве­ ренны м относительно истинного значения пропорции, к ак я чувствовал бы себя, если бы я наблюдал выборку из п событий с г успехами). Больш ие зна­ чения п отраж аю т большую уверенность относительно истинного значения пропорции. Отношение r/п отраж ает среднее значение функции плотности вероятности. Испытуемые испы ты вали большие трудности в этом методе, несмотря на инструкции, которые вклю чили примеры бета распределений, леж ащ их в основе этого метода. После каждого испытания, испытуемым пред­ лагали обширную обратную связь, с акцентом на их собственной калибровке и калибровке группы. Результаты первого и последнего испы тания показа­ ны в табл. 1. Улучш ение было обнаружено для обоих методов. Результаты ме­ тода гипотетических выборок, в начале давал результаты хуж е (50% неожи­ данностей и только 16% в межквартильном диапазоне), а в конце лучш е (6% неожиданностей и 48% в межквартильном диапазоне), чем метод квантиля. Б арклей и Петерсон (B arclay и P eterson, 1973) сравнили метод тертилей (то есть, квантили 0.33 и 0.67) с “точечным” методом, в котором оцениваю­ щ его просят дать модальное значение неопределенной величины , а затем два значения, одно выш е и одно ниж е моды, каж дое из которых может про­ изойти такж е вероятно, к ак и модальное значение (то есть, точки, для кото­ ры х ф ункция плотности вероятности является наполовину настолько ж е вы сока, как и в моде). П ри использовании 10 вопросов к ак неопределенных величин и 70 студентов Ф акультета внеш ней разведки в межгрупповом про­ екте, для метода тертилей они обнаруж или, что 29% (а не 33% ) истинных ответов попадают в центральны й интервал. Д ля точечного метода, только 39% попадаю т между двумя равновероятными точками, принимая во вни­ мание, что, для больш инства распределений, приблизительно 75% плотно­ сти попадает между этими точками. П итц (P itz , 1974) сообщил о нескольких результатах, использую щ их ме­ тод тертилей. Д ля 19 испытуемых, экспертов населения 23 стран, он обна­ руж ил только 16% истинны х значений, попадающ их в центральную треть распределений. В другом эксперименте он изменил вопросы согласно глу­ бине и богатству знаний, которыми, по его предположению, обладали ис­ пытуемые. Д ля населения стран (низкое знание) он обнаружил 23% истин­ ны х значений в центральной трети; для высот известных зданий (посред­ ственное знание) 27% ; а для возрастов известных людей (высокое знание) 47% , причем последнее означение было намного больше ож идаемы х 33% . В другом исследовании, он попросил 6 испытуемых оценить тертили и не­ скольким и днями позж е, сделать выбор среди ставок, основанных на их соб­ ственны х значениях тертилей. Он обнаружил сильное предпочтение став­ кам , из центральной области, к ак раз противоположное к чему должно было привести плотное расположение интервалов. Испытуемые Ларсона и Ринана (Larson и Reenan, 1979) сначала угадывали истинный ответ (то есть, моду) и затем еще два значения, которые определяли интервал, в пределах которого, они были “вполне уверены”, находился пра­ Калибровка вероятностей... 377 вильный ответ. Сорок два процента истинных значений, леж али вне этой обла­ сти. Обратите внимание, насколько похож этот индекс неожиданности на ин­ дексы испытуемых Альперта и Рейффы, которым дали вербальные формули­ ровки “минимум / максимум” (47% ) и “удивительно высоко / низко” (38%). Реальные задачи с эксперт ами Претт (1975) попросил некоторого эксперта дать прогноз посещаемости для 175 кинофильмов или двойных сеансов, показанны х в двух местных кино­ театрах в течение более, чем одного года. Эксперт оценил медиану, кварти­ ли “удивительно высокие” и “удивительно низкие” значения. К ак показа­ но в табл. 1, меж квартильны й диапазон имел тенденцию быть слиш ком ма­ леньким. Д аж е притом, что эксперт получал обратную связь исхода в тече­ ние эксперимента, единственное свидетельство улучш ения калибровки че­ рез какое-то время приш ло в первые несколько дней. Три эксперимента использовали синоптиков в качестве испытуемых. В двух экспериментах Мерфи и Винклер (M urphy и W inkler, 1 9 7 4 ,1977b) про­ сил синоптиков давать пять квантилей (0.125, 0.25, 0 .5 ,0 .7 5 ,0 .8 7 5 ) для вы ­ сокой температуры завтра. Результаты, показанные в табл. 1, указываю т пре­ восходную калибровку. Эти испытуемые имели меньшее количество случаев неожиданности в экстремуме распределения 25 % чем, большинство испыту­ емых А льперта и Рейффы на экстремуме 2%! Мерфи и Винклер обнаружи­ ли, что пять испытуемых в двух экспериментах, которые использовали ме­ тод квантиля, были лучше калиброваны, чем четыре других испытуемых, которые использовали метод фиксированного диапазона (fixed-w idth metod). Для метода фиксированного диапазона, синоптики сначала оценили темпе­ ратуру медианы (то есть, высокой температуры, для которой, к ак они пола­ гали, существует вероятность 0.5, того, что она будет превышена). Затем они задали вероятность, что температура будет падать с интервалами 5Т и 9°F со­ средоточенными в медиане. Эти синоптики были самонадеянные; вероят­ ность, связанная с температурой, попадающей в интервал, имела тенденцию быть слиш ком большой. Превосходство метода квантиля над методом ф ик­ сированного диапазона в отличие от вывода Сивера, фон Винтерфельдта, и Эдвардза, о предпочтительности методов фиксированных значений, возмож­ но, обусловлено тем, что установленные интервалы, используемые Мерфи и Винклером (5 F и 9°F) были неинформативны. Ш таел фон Хольстен (Stael von H olstein, 1971а) использовал три задачи фиксированных оценок: (а) средняя температура на завтра и на следующий день (с разделением полного диапазона ответа на восемь категорий), (Ь) сред­ н яя температура через 4 и 5 дней (восемь категорий), и (с) общ ая количество осадков в следующ ие 5 дней (четыре категории). От каж дого набора ответов (четыре или восемь вероятностей, в сумме дающие 1.0) он оценил основную совокупную функцию плотности. Затем он объединил 1.269 ф ункций, дан­ ные 28 участниками. Исходя из групповой совокупной ф ункции плотное- 378 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ ти, показанной в его статье, мы оценили индексы неожиданности и межквартильны е индексы (см. табл. 1). В отличие от других синоптиков, эти ис­ пытуемые были весьма плохо калиброваны , возможно, потому что задачи были менее знакомы . Резюме о калибровке с неопределенными величинам и П одавляю щ ее большинство свидетельств из исследования, использующ его квантили для оценки неопределенных величин, говорит о том, что распре­ деления вероятности имеют тенденцию быть слиш ком плотными. Оценка крайних квантилей особенно склонна смещ аться. Обучение несколько улуч­ ш ает калибровку. Результаты экспертов иногда высоки (M urphy и W inkler, 1974, 1977b), иногда нет (P ra tt, 1975; Stael von H olstein, 1971a). Имеется некоторое свидетельство, что трудность связана с калибровкой для непре­ ры вны х предполжений. П итц, Ларсон и Ринан (P itz, 1974 и Larson и Reenan, 1979) обнаруж или это влияние, П икхарт и Воллейс (P ickhardt и W allace, 1974) обнаруж или, что 1-дневные задерж ки приводили к меньш ему коли­ честву неожиданностей, чем 3-дневные задерж ки в их игре моделирования. Н есколько исследований (например, B arclay и P eterson, 1973; M urphy и W inkler, 1974) сообщили о корреляции между распространением оценен­ ного распределения и абсолютной разностью между оцененной медианой и истинным ответом, указы вая, что испытуемые частично чувствительны к тому, насколько, сколько они знаю т или не знаю т. Эта находка проводит параллель с корреляцией между процентом правильны х ответов и средним ответом с дискретны ми предлож ениями. О б суж д ен и е Зачем нуж на хорошая калибровка? Почему оцениваю щ ий вероятность должен волноваться относительно того, хорошо ли он калибровали? Фон Винтерфельдт и Эдвардз (1973) показали, что в больш инстве ж изненны х проблем принятия реш ения с непрерывны­ ми выборами реш ения (например, влож ите X долларов) довольно серьез­ ные ош ибки оценки имеют относительно небольшое значение для ож идае­ мого результата. Однако некоторые соображения приводят доводы против этой точки зрения. Во-первых, в двух-альтернативной ситуации, ф ункция вознаграж дения может быть весьма крута в критической области. Предпо­ лож им , что ваш доктор должен оценить вероятность, что Вы имеете состоя­ ние А , и долж ны получить лечение А, против того, что у Вас состояние В и лечение В. П редположим, что ситуация такова, что лечение А является луч­ ш е, если вероятность, что Вы имеете состояние А больш ая или равна 0.4; иначе, лучш е лечение В. Если доктор оценивает вероятность, что Вы имеете А к а к р (А) = 0.45, но плохо калиброван, так, что соответствующ ая вероят­ Калибровка вероятностей... 379 ность 0.25, тогда доктор использовал бы скорее лечение А, чем лечение В, и Вы будете терять много ожидаемой полезности. Реш ение функции полезно­ сти реальной ж изни именно этого типа показаны Фрайбеком (Fryback, 1974). Кроме того, когда вознаграж дения очень большие, когда ош ибки очень большие, или когда эти ош ибки сложные, ожидаемые потери каж утся боль­ ш ими. Н апример, в исследовании радиоактивной безопасности (А мерикан­ ская Комиссия по Атомному Регулированию , 1975) “накаж дом уровне ана­ лиза нормальное логарифмическое распределение данных пропорции неуда­ чи было принято с определенными процента:льными пределами 5 и 95 ” (W eatherw ax, 1975, с. 31). Исследование, приведенное здесь, показы вает, что распределения, построенные из оценок квантилей 0.05 и 0.95 могут быть чрезвычайно смещ ены. Если такие оценки сделаны на нескольких уровнях анализа, с каж ды м оцененным распределением, являю щ имся слиш ком уз­ ким, ош ибки не будут отменять друг друга, а будут дополнять. И потому что цена сбоя на атомной электростанции велика, ож идаемая потеря от таких ошибок м огла быть огромна. Если хорош ая калибровка важ на, к ак ее достичь? Кокс (Сох, 1958) счи­ тал, что мож но внеш не рекалибровать оценки лю дей, подгоняя модель к набору оценок для вопросов с известны ми ответами. Тогда модель исполь­ зуется, чтобы исправлять или регулировать ответы , данны е экспертом. Технические трудности, возникаю щ ие перед внеш ней перекалибровкой сущ ественны . П ри вы явлении оценок, которы е будут смоделированы , нуж но быть осторож ными, чтобы не дать оцениваю щ ему больш е обрат­ ной связи , чем они обычно получаю т, из страха того, что они изм енят свою калибровку, когда она изм еряется. К ак указал Сэвадж (Savage, 1971), “Вы могли бы обнаруж ить на опы те, что ваш эксперт в некотором отнош ении оптимистичен или пессимистичен, и поэтому см ягчать его суж дения. Если он заподозрит Вас в этом, однако, и Вы, и он вполне мож ете приблизиться к гибели” (с. 796). Т ак к ак исследование показало, что тип наблюдаемого расбаланса калибровки зависит от уровня трудности задачи, возмож но, приш лось бы такж е полагать, что будущее будет соответствовать трудно­ сти событий, используемы х для перекалибровки. Теоретические возраж ения внеш ней перекалибровке могут быть даж е более серьезны , чем практические. Ч исла, произведенные процессом пе­ рекалибровки не будут следовать аксиомам теории вероятности (напри­ мер, числа, связанны е со взаимно исклю чаю щ ими и исчерпываю щ ими со­ бы тиями будут не всегда в сумме давать единицу, и при этом вообще не будет истинно что Р(А)*Р (В) = Р (А, В) для независимы х событий); следо­ вательно, эта новые числа не могут назы ваться вероятностями. Более плодотворный подход состоял бы в том, чтобы обучить экспертов самокалибровке. При каки х условиях можно ожидать, что эксперты достиг­ нут этой цели? Н ельзя ожидать, что эксперты будут хорошо калиброваны, если явн ая или неявная награда для оценок не мотивирует их быть честными в их оценках. К ак крайний пример можно рассмотреть оценивающего, нахо­ 380 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ дящ егося под угрозой казни, если произойдет событие, вероятность которого была оценена в < 0.25, который будет иметь серьезное основание не быть хо­ рошо калиброванным с оценками 0.20. Хотя этот пример каж ется абсурдным, более тонкие давления такие как “не выглядеть глупо” или “произвести впе­ чатление на босса” могли бы такж е обеспечивать сильные стимулы для пло­ хой калибровки. Любое вознаграждение либо за размы ш ления, либо за опро­ вержение могло бы такж е смещать оценки. П ри получении обратной связи исхода после каж дой оценки - лучш ее условие для успешного обучения. Дейвид (Dawid) показал, что при таких условиях эксперты , которы е являю тся честны ми и последовательны ми субъективистами, будут хорошо калиброваны независимо от взаимозави­ симости среди оцениваемых вопросов. Н апротив, Кадан (K adane, 1980) по­ казал , что в отсутствии обратной связи исхода “испы тание за испытанием”, честны й, последовательный субъективист будет, к ак ож идается, хорошо калиброван, только тогда, когда все оцениваемые вопросы независимы . Эта теорема наклады вает сильные ограничения на ситуации, при которых было бы разумно ож идать, что эксперты будут учиться быть хорошо калиброван­ ны ми. Д аж е если процесс обучения мог проводиться с использованием толь­ ко событий, которые, к ак считали эксперты , независимы, мож ет иметься серьезное основание, чтобы сомневаться относительно независимости задач реальной ж изни, к которым эксперты применили бы их обучение. Важные будущие события могут быть взаимозависимыми либо потому что они нахо­ дятся под влиянием общей основной причины , либо потому что оцениваю ­ щ ий рассматривает их к ак идущ ие из основного запаса знаний. В таких об­ стоятельствах, можно не хотеть или не ож идать хорош ей калибровки. Возможность, что предубеждения людей изменяю тся к ак ф ункция труд­ ности задачи, препятствует обучению калибровке при отсутствии немедлен­ ной обратной связи исхода. Уровень трудности будущих задач мож ет быть невозможно предсказы вать, таким образом, делая обучение неэффектив­ ны м. Калибровка ка к когнит ивная психология Эксперименты по калибровке могут использоваться, чтобы понять, как люди думают. Д аж е если непосредственное практическое значение каж дого ис­ следования ограничено, оно может все-таки обеспечить понимание того, к ак люди развиваю т и вы раж аю т чувства определенности и неопределенности. Однако, поразительны й аспект литературы , рассмотренный здесь - ее “су­ хой эм пиризм”. П сихологическая теория часто отсутствует, либо к ак по­ буж дение для исследования, либо к ак объяснение результатов. Не все авторы избеж али теоретизирования. Словик (Slovic, 1972а)иТверски и К анеман (Tversky и K ahnem an, 1974, 1) считали, что, в результате ограниченны х способностей обработки информации, люди принимаю т уп­ рощ енные правила или эвристики. Х отя в целом полезные, эти эвристики Калибровка вероятностей... 381 могут приводить к серьезным и систематическим ош ибкам. Например, тен­ денция людей, давать плотные распределения при оценке неопределенных величин могла отраж ать эвристику, называемую “привязка и регулирова­ н и е.” Когда людей спраш иваю т относительно неопределенной величины, они естественно думают сначала о точечной оценке, такой к ак медиана. Это значение тогда служ ит к ак привязка. Чтобы давать 25-ый или 75-ый про­ цен тиль, человек регулируется вниз или вверх от значения привязки. Но закрепитель имеет такое доминирующее влияние, что регулирование я в л я­ ется недостаточным; следовательно, квантили находятся слиш ком близко вместе, вы давая самонадеянность. П итц (P itz, 1974) такж е допустил, что способность людей в обработке ин­ формации и вместимость рабочей пам яти ограничены. Он предполагал, что люди занимаю тся сложными проблемами последовательно, прорабатывая часть за частью . Чтобы уменьш ить когнитивное напряж ение, люди игно­ рирую т неопределенность в своих реш ениях ранних частей проблемы, что­ бы уменьш ить сложность вычислений в более поздних частях. Это может привести такж е к слиш ком плотным распределениям и самонадеянности. П иц такж е предполагал, что один путь, которым люди оцениваю т свою соб­ ственную неуверенность, - это увидеть, сколько существует различны х пу­ тей, которыми они могут достигнуть ответа, то есть сколько различны х пос­ ледовательных реш ений они могут построить. Если найдено много путей, люди признаю т собственную неопределенность; если найдено мало, они не признаю т. Чем богаче база знаний, из которы х можно строить альтернатив­ ные структуры , тем меньше тенденции к самонадеянности. Ф иллипс и Райт (1977) представили последовательную модель с тремя стадиям и. И х модель разделяет людей, которые естественно склонны ду­ мать о неопределенности вероятностным способом, от тех, которые выбира­ ют из двух альтернатив. Их работа о культурны х и индивидуальны х разли­ чиях (W right и P hillips, 1976, W rig h t и другие, 1978) была попы ткой, с ча­ стичным успехом, идентифицировать различны е когнитивные стили в об­ работке этого типа информации. Кориат и другие (K oriat, 1980) такж е принимали подход обработки ин­ формации. Они обсуждали три стадии оценки вероятностей. Сначала чело­ век ищ ет в пам яти соответствующее свидетельство. Затем он оценивает это свидетельство, чтобы придти к чувству определенности или сомнения. Н а­ конец, он переводит чувство определенности в число. М анипуляции, исполь­ зуемые Кориатом и другими, были предназначены, чтобы изменить первые две стадии, вы нуж дая людей искать и обращ ать внимание на противореча­ щее свидетельство, пониж ая свою уверенность. Модель Ф еррелла и М акГои (F errell & McGoey, 1980), с другой стороны, имеет дело полностью с третьей стадией, переводом чувства определеннос­ ти в числовые ответы. Допуская то, что без обратной связи люди не могут изменить свои стратегии перевода по мере того, к ак либо трудность вопро­ са, либо основное значение событий изм еняется, модель обеспечивает силь­ ные прогнозы, которые получили подтверждение от данны х калибровки. Н ачинаю т появляться теории структуры и процесса оценки вероятнос­ ти; и мы надеемся, что дальнейш ее развитие таких теорий будет служ ить, чтобы объединить это довольно специализированное поле деятельности в более ш ирокую область когнитивной психологии. 23. Обреченным необходимо изучать прошлое: эвристики и предубеждения в ретроспективе* Барух Фишхофф Бенсон (Benson, 1972) идентифицировал четыре причины для изучения про­ шлого: развлекать, создавать групповую (или национальную) идентичность, показать степень человеческих возможностей и развивать систематическое знание относительно наш его мира, знание, которое мож ет, в конечном сче­ те, улучш ить наш у способность прогнозировать и управлять. Н а сознатель­ ном уровне, по крайней мере, мы, ученые-бихевиористы, ограничиваемся последним мотивом. П реследуя его, мы исследуем случаи, оцениваем про­ граммы и делаем литературны е обзоры. Мы даж е проводим эксперименты, создавая искусственны е истории, на которы х мы можем проверить свои предполож ения. Три основных вопроса, по-видимому, возникаю т в наш их размы ш лени­ ях о прош лом: (а) существуют ли модели, на которые мы можем опираться, чтобы в будущем стать мудрее? (в) существуют ли случаи непредусмотри­ тельности, в которых мы можем увидеть ош ибки, которых следует избегать; (с) мы действительно обречены повторять прошлое, если мы не изучаем его; то есть действительно ли мы приобретаем опыт, огляды ваясь назад. Н еважно, какой вопрос мы задаем, предполагается, что прошлое с готов­ ностью подскаж ет ответы. С точки зрения ретроспективы и дальновиднос­ ти, последнее оказы вается неприятной перспективой. М ожно объяснить и понять любое событие прошлого, если применить соответствующее усилие. Прогнозирование считается более сложным. Данное эссе исследует это пред­ положение, рассм атривая некоторы е первоначальны е попы тки вы явить прошлое. Возможно, наиболее общее заклю чение - то, что мы долж ны уде­ лять больш е вним ания прош лому, если мы пы таемся вы явить его тайны . И *Это - пересмотренная версия книги '‘Обреченным необходимо изучать прошлое: размыш­ ления об исторических оценках,” в книге под редакцией R. A. Shweder и D. W . Fiske. Новые направления в методологии науки поведения: ошибочные суждения в исследовании пове­ дения. Сан-Франциско: Jossey-Bass, 1980. Переиздано в соответствии с разрешением. 384 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ хотя прош лое развлекает, облагораживает и легко расш иряется, оно про­ свещ ает только с помощью тонких уговоров. В п о и с к а х м уд рости Х отя прошлое никогда точно не повторяется, в нем часто можно обнаружить повторяю щ иеся элементы. Люди принимаю т одинаковые реш ения, реш а­ ют одинаковые задачи и терпят одинаковые неудачи достаточно часто, что­ бы ученые-бихевиористы могли полагать, что они могут обнаружить повто­ ряю щ иеся образцы поведения. Такое убеждение заставляет психометристов изучать диагностические тайны клинических психологов-асов, клиницистов-и скать корелляты ненормального поведения, брокеров — замечать признаки роста цен, а диктаторов — обдумывать революционные ситуации. И х поиск обычно имеет логику, параллельную логике многократного рег­ ресса или корреляции. Собран набор соответствующих случаев, и каж ды й член характеризован с помощью разнообразных измерений. В получивш ей­ ся матрице ищ ут существенные связи, которые могли бы помогать нам в прогнозировании будущ его.... Формальное моделирование Ежедневный бланк бегов (Daily Racing), например, предлагает серьезному игроку приблизительно 100 отрезков информации относительно каж дой лош ади в любом забеге. И грок, склонны й к обработке данны х, мог бы ввес­ ти в пам ять компью тера содержание одного издания и пробовать получить формулу, предсказываю щ ую скорость к ак оцененную сумму множ ества в различны х измерениях. Например: у = Ъ]ХХ+ Ь2х 2 + 63jc3 (1) где у — наш а оценка скорости лош ади, x t, является процентом ее побед в преды дущ их гонках, х2- процент побед в гонках ее ж окея, и х 3- вес, кото­ ры й ей предстоит нести в данной гонке. Предположив, что использую тся стандартизированны е записи результатов1, оценки (Ь), отражаю т важность различны х факторов. Если 61=2Ь2, то данное изменение в проценте побед лош ади воздействует на наш е прогнозирование скорости вдвое больше, чем эквивалентное изменение в проценте побед ж окея, потому что прош лые дей­ ствия оказались вдвое более чувствительными к х 1, чем к х2. 1Чтобы стандартизировать значения определенной переменной, нужно вычесть среднее из каждого значения и затем разделить на стандартное отклонение. Результат - это набор оч­ ков со средним, равным 0 и стандартным отклонением, равным 1. Обреченным необходимо изучать прошлое... 385 Звучит просто, но здесь кроится ты сяча ловуш ек. Одна из них появляет­ ся, когда прогнозирую щие (х.), являю тся коррелированными, что может происходить (и ф актически происходит), когда из вы игры ш а лошадей сле­ дует выигрыш ж окея (или наоборот). В таких случаях мультиколлинеар­ ности, к аж д ая перем енная имеет некоторую независимую способность объяснять прошлое, а у двух есть некоторая общ ая особенность. Когда оцен­ ки определены, эта общ ая объяснительная способность, будет так или ина­ че разделена между этими двумя переменными. К ак правило, это разделе­ ние порождает (Ь;), не поддающееся толкованию с любой степенью точнос­ ти. Таким образом, уравнение регрессии нельзя рассматривать к ак теорию скачек, показы вая важ ность различны х факторов. Более скромная теоретическая цель состояла бы в том, чтобы определить, какие ф акторы важ ны , а каки е - нет, на основе того, насколько каж ды й из них помогает нам понять у. Здесь прим еняется логика пошаговой регрес­ сии, в уравнение добавляю тся дополнительные переменные, пока они чтолибо добавляют к его прогнозирующей (или объясняющей) способности. Все ж е даж е эта миним алистская стратегия может привести к путанице муль­ тиколлинеарности. Если отраж ения некоторого фактора (например, различ­ ные аспекты воспитания) вклю чены , то их общая объяснительная способ­ ность может быть разделена на такие маленькие части, что ни один аспект не внесет “значимого” вклада. Конечно, эти нюансы могут мало интересовать игроков на скачках, пока формула работает достаточно хорошо, чтобы приносить им вы игрыш . Мы ж е, ученые, хотим не только эффективных методик, но и мудрости. Нам тяж ело не интерпретировать оценки. Регрессивные процедуры не только вы раж аю т, но и порождают понимание (или, по крайней мере, результаты) механистическим, повторяю щ имся образом. Не удивительно, что им упор­ но следовали, несмотря на их ограничения. Один из лучш их документаль­ но подтвержденных примеров был обнаружен в исследовании оценивания в клинике. Оценивающим был рентгенолог, который сортирует рентгено­ вские снимки опухолей на “доброкачественные” и “злокачественные”, кад­ ровый работник, который отбирает подходящ их кандидатов из списка, или сотрудник кризисной служ бы , который реш ает, звонки каки х людей, гро­ зящ их покончить с собой, серьезны. В каж дом из этих примеров диагноз вклю чает принятие реш ения на основе некоторых признаков. Когда, к ак в этих примерах, принятие реш ений повторяется, и все случаи могут быть охарактеризованы тем ж е набором признаков, можно статистически смо­ делировать стратегию принятия реш ений оценивающего. Человек собира­ ет набор случаев, для которы х эксперт делает суммарную оценку (напри­ мер, доброкачественное, серьезное), а затем выводит уравнение регрессии, такое к ак Уравнение 1, оценки которого показывают важность, которую оце­ ниваю щ ий придал каж дом у признаку. В течение двух десятилетий изучение такой стратегии постоянно приво­ дило к двум беспокоящ им выводам: (а) простые линейные модели, исполь­ 386 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ зую щ ие оцененную сумму признаков, отлично прогнозируют реш ения ис­ пы туемы х, хотя (Ь) оцениваю щ ие заявили, что они использовали гораздо более слож ны е стратегии (Goldberg, 1969,1970; Slovic & L ichtenstein, 1971). О бщ епринятая форма сложности назы вается конфигуральной оценкой, в которой диагностическое значение признака зависит от значения других признаков (например “интонация его голоса не каж ется мне характерной для человека, реш ивш его покончить ж изнь самоубийством, если звонок не происходит рано утром”). Две причины для конф ликта между измеренным и сообщенным суж де­ нием возникли из последующего исследования, и каж дая обладает негатив­ ными последствиями относительно полезности регрессивного моделирова­ н и я для “черпания” мудрости реш ений прошлого. Одной из них было рас­ тущ ее понимание того, что комбинирование огромного количества инфор­ мации в голове, к ак того требуют такие формулы, превыш ает вы числитель­ ную способность любого человека, кроме человека, проявляю щ его незау­ рядны е способности в узкой области знаний. Оценивающий, который пы ­ тается применить сложную стратегию , просто не сможет сделать этого пос­ ледовательно. Действительно, очень трудно вы учить и использовать даж е неконфигуральное правило принятия реш ений с оцененной суммой, когда сущ ествует много признаков или необычных отношений меж ду признака­ ми и прогнозируемыми переменными (Slovic, 1974). В торая вещ ь, которая была осознана с помощью исследования случаев из клинической практики (см. гл. 28) это то, что простые линейные модели дают очень сильные прогнозы. П ростая субстантивная теория, показы ваю ­ щ ая, на каки е переменные люди обращают внимание при принятии реш е­ ний, - это, мож ет быть, все, что нуж но человеку для создания верного про­ гноза и х поведения. Если некоторые признаки говорят в пользу некоторого реш ения, а другие - против него, то простое сопоставление количества одоб­ ряю щ их и опровергаю щ их признаков даст возможность точного прогноза поведения человека. К ак бы там ни было, результатом будет более скром­ н ая теория, чем теория, которую человек мож ет вывести путем яркого мо­ делирования регрессии (Fischhoff, G oitein & Shapira, в печати). Таким об­ разом , в то врем я к а к каж ется, что мы вот-вот поймем прош лое, наш и стан­ дартны е статистические процедуры не всегда говорят нам то, что мы хотим узнать. И если неверно их использовать, они могут завести нас не в ту сторо­ ну, сделав нас ещ е менее мудрыми, чем мы были в самом начале. Мы хотим охватить крайне сложные теории во всей их полноте, не понимая, что их сила исходит из очень простых основополагающих понятий, а не из пони­ м ания сущ ности прошлого. Обреченным необходимо изучать прошлое... 387 Изучение недальновидности В центре вним ания неудача Поиск мудрости в исторических событиях требует веры - вера в существова­ ние повторения, ожидающего, чтобы его обнаружили. Поиск мудрости в по­ ведении исторических личностей требует несколько другого рода веры - уве­ ренности, что наш и предшественники знали вещи, которых мы не знаем. Пер­ вая из этих вер основана на философии; она отличает тех, кто рассматривает историю к ак социальную науку, а не идеографическое исследование непов­ торимых событий. Вторая вера основана на милосердии и скромности. Она отличает тех, кто надеется видеть дальш е, стоя на плечах у предш ественни­ ков от тех, кто удовлетворен тем, что стоит на собственных ногах. Афориз­ мов к ак - “те, кто не изучают прошлое, обречены повторить его”, - наличие таких предпологает, что вера в мудрость наш их предшественников относи­ тельно редка. Активное исследование недальновидности, конечно, имеет свои преиму­ щества. Людям, у которых не все получается, приходится много объяснять, но такие объяснения очень важны для получения знаний из опыта. Осознав, по­ чему дела пошли не так, как надо, мы надеемся заставить их улучшиться в будущем. Поиск причин неудач, чтобы объяснить их совсем не труден. Детек­ тив, журналист и историк все вовлечены в хаос. Поездка на машине в магазин без несчастного случая, или правление без войн, депрессий, или землетрясе­ ний каж ется им небогатыми на события. Х отя концентрация на неудаче имеет приемлемые цели, она, вероятно, введет нас в заблуждение, создав искаж енное представление о распростра­ ненности неудачи. К аж ущ аяся вероятность событий частично определена легкостью , с которой, они приходят на ум и вспоминаю тся (T versky и K ahnem an, 1973,11). Часто повторяющиеся неудачи должны, поэтому, не­ пропорционально увеличить воспринятую частоту в прошлом (и возможно будущем). Это, такж е, вероятно продвинет несбалансированную оценку поведения наш их предш ественников. Охотника до сенсаций, живущ его в каж дом из нас, тянет к историям благосостоятельных ж уликов или “сверх-регулированию ” некоторых возможностей окружаю щ ей среды, (как например, пе­ чально известный стандарт на проект сиденья унитаза для производствен­ ны х помещ ений, разработанный М инистерством Здравоохранения и Охра­ ны труда. Мы склонны забывать, тем не менее, что любая ош ибочная, но не дьявольская, система принятия реш ения производит ош ибки обоих видов. Д ля каждого мош енника, получающего незаслуженные выгоды, существует одна или несколько ж ертв, которым н екая несоверш енная система отказа­ ла в правах. Ф актически, два ошибочных определения связаны отчасти не­ интуитивным образом, зависящ им от точности оценки и всех доступных ре­ сурсов, например, процент бедноты, имеющей права, или риски, которое 388 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ можно принимать (Einhorn, 1978). Перед тем, как начать критиковать систе­ му обеспечения за то, что она позволяет существование нескольких мошен­ ников, мы должны рассмотреть, много ли существует страшных историй этого типа, учиты вая отношение ошибок исполнения к ошибкам неисполнения. Вообще, имеется больш ая вероятность того, что человек будет введен в заблуж дение, если мы исследуем в изоляции реш ения, которые “выраба­ ты ваю тся” только на процентном основании. В чем же проблема? Существуют другие контексты , в которы х ош ибки в малом могут вы гля­ деть другими, когда рассматривается более ш ирокий контекст. Н апример, нас учат, что научные теории долж ны опровергаться, если представлено некое противоречащ ее им доказательство. В результате, мы быстро осуж­ даем учены х, которые упорствуют в своих теориях, несмотря на то, что их неправильность бы ла доказана. Кун (K uhn, 1962), однако, утверж дает, что такая локальная недальновидность мож ет быть совместимой с более гло­ б ал ьн о й м удростью в п о и ск е н ауч н ого зн ан и я . Д руги е (н ап р и м ер , Feyerabend, 1975; L akatos, 1970), ф актически, превознесли роль дисципли­ нированной анархии в росте понимания и сомневались относительно воз­ можности появления мудрости из организованной приверженности к лю­ бому одобренному методу исследования. Они доказываю т, что неж елание принимать во внимание противоречащ ие данные или отказаться от очевид­ но опровергнутых теорий часто необходимо для научного прогресса. Ш траф в 125 миллионов долларов, налож енны й на автомобильную Ком­ панию “Ф орд” в случае с моделью “Пинто” (P into), сделал реш ение компа­ нии сэкономить несколько долларов на дизайне топливного бака автомоби­ л я очень недальновидным. Все ж е в чисто экономических терминах, гаран­ тируемая экономия, скаж ем , 15 долларов на каж дом из 10 миллионов “П ин­ то” делает риск нескольких больших исков похожим на более разумную азар­ тную игру. Так к ак в приговоре в этом хорошо освещенном в средствах мас­ совой информации иске сумма была уменьш ена до 6 миллионов долларов после аппеляции, ком пания ф актически вы гадала в строгих экономичес­ ки х терминах, несмотря на то, что ситуация ухудш илась. В чем был промах ком пании, так это в рассмотрении одного контекста (количество автомоби­ лей, на которы х можно было сэкономить деньги), а не другого (неэкономи­ ческие последствия ее реш ения). К омпания, видимо, не поняла влияния, которое неблагоприятное общественное мнение оказало бы на образ “Фор­ да” к ак производителя автомобилей, заботящ егося о надежности, или на цены за используемый “П инто” (хотя эту цену “П инто” платил владелец, а не производитель). Если осуждение - это название игры , ош ибка - это ош ибка. Все ж е, если вы заинтересованы в получении знаний из опыта других, важ но определить то, какую проблему вы пы тались реш ить. После осторожной проверки, мно- Обреченным необходимо изучать прошлое... 389 гае очевидные ош ибки, оказы вается, представляю т свежее решение непра­ вильной проблемы. Например, если это может критиковаться вообще, ком­ пания Форд могла бы быть объявлена виновной в тактической мудрости и стратегической недальновидности (или возможно в предпочтении здоровья социальному благосостоянию). Это различие важно не только для оценки прошлого, но такж е и для знания, какие корректирующие меры должны быть приняты в будущем. Обычно, так­ тические ошибки легче исправить, чем стратегические недоразумения. Как только мы должным образом охарактеризовали ситуацию, мы можем завести “книгу”, в которую будем записывать обычную мудрость как накопленную с эмпирическим опытом, или, по крайней мере, формулы для оптимального объе­ динения информации, имеющейся в нашем распоряжении (H exter, 1971). Ме­ неджеры в бейсболе либо знают, что лучше заменить отбивающего бегуном на первой игре и не заменять в игре на равных, либо применят статистику, чтобы вычислить, как “получить проценты”. Эти руководящие принципы, однако, бесполезны или вводят в заблуждение, если реальная проблема, которая долж­ на быть решена - это утверждение морали (бегун имеет шанс вести лигу на за­ няты х базах) или помощь билетной кассе (болельщики должны видеть некото­ рую интригу). Исследования неожиданных нападений в международных от­ ношениях показывают, что нации, которых заставали врасплох, часто хорошо играли по своей книге, но неправильно определяли поле, на котором они игра­ ли (BenZvi, 1976; Lanir, 1978). В некотором смысле, они читали неправильную книгу; чем лучше они читали, тем быстрее они проигрывали. Одна причина для трудности, поставленной стратегическими проблемами то, что их нужно “продумывать” аналитически, не используя преимуществ со­ вокупного (статистического) опыта. Второе ограничение - это то, что неправиль­ ные представления часто широко разделяются в пределах принимающей ре­ ш ения группы или сообщества. С человеком консультируются относительно решения только после того, как он закончил отвечать на вопросы в книге. Реко­ мендуемые советы для учреждений, заинтересованных в избегании неожидан­ ностей : (а) основывайте несколько отдельных аналитических групп, чтобы обес­ печить многократные, независимые взгляды на проблему, или (Ь) назначьте человека, который служил бы “адвокатом дьявола” для непопулярных точек зрения (Janis, 1972). Практически, первая стратегия может потерпеть неуда­ чу, потому что распространенные неправильные представления делают груп­ пы очень похожими друг на друга, создавая скорее избыточность, чем плюра­ лизм (Chan, 1979). Второй пункт терпит неудачу, потому что адвокаты либо склоняю тся под давлением группы, либо подвергаются гонениям, если они принимают свои непопулярные позиции всерьез, даже, когда эти “крайние” позиции радикально не противоречат мнениям группы. Неспособность отличить тактические решения от стратегических могут так­ ж е создать неоправданную иллюзию мудрости. Банки и страховые компании обычно считаются чрезвычайно рациональными и ловкими в процессах при­ нятия решений. Все ж е более пристальное рассмотрение показывает, что эта 390 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ репутация происходит из их успеха в создании часто повторяющихся, такти­ ческих решений, в которых они почти не могут проигрывать. Ссуды под залог недвижимости и страхование ж изни рассматриваются на основе консерватив­ ны х интерпретаций статистических таблиц, приобретенных и отрегулирован­ ны х с помощью массивного опыта проб и ошибок. Попытки этих учреждений принимать спекулятивные решения, требующие аналитических, стратегичес­ ких решений, говорят о том, что они - не умнее, чем все мы. Коммерческие банки потеряли большие суммы денег в 60-ых, благодаря необдуманным инве­ стициям в тресты недвижимости; подобный небольшой процент их всех реше­ ний в 70-ых приковал экономику США к будущему полукредитоспособных стран Третьего мира, которым были сделаны большие займы (более $ 60 мил­ лиардов). (Хотя эта связь может быть оправдана пользой для всего человече­ ства, которая вовсе не была проблемой, которую решали банки.) Медленный и беспорядочный ответ страховых компаний на изменения в экономике страхо­ вания несчастных случаев; и их почти случайные, неаналитические методы для многих необычных рисков должны заставить нас почувствовать себя не такими недальновидными по сравнению с этими превозносимыми учрежде­ ниями. Ретроспектива: Размышление над прошлым? Если мы знаем то, что случилось и какую проблему человек пробовал решать, мы должны применить мудрость наш ей собственной ретроспективы в объяс­ нении и оценке его поведения. После более тщательной экспертизы, однако, преимущества знания того, как идут дела, могут быть переоценены (Fischhoff, 1975). В ретроспективе, люди последовательно преувеличивают то, что могло ожидаться в будущем. Они не только имеют тенденцию рассматривать то, что случилось как неизбежное, но такж е и рассматривать это как оказавшееся “от­ носительно неизбежным” прежде, чем это случалось. Люди полагают, что дру­ гие должны прогнозировать события намного лучше, чем это есть на самом деле. Они даже неправильно запоминают свои собственные прогнозы, чтобы преуве­ личивать в ретроспективе, что они знали заранее (Fischhoff и Beyth, 1975). К ак описано историком Георгесом Флоровским (Georges Florovsky, 1969): Тенденция к детерминизму, так или иначе, подразумевается в самом методе ретроспекти­ вы. Ретроспективно, мы, кажется, чувствуем логику событий, которые разворачиваются регулярным или линейным образом согласно распознаваемому образцу с предполагаемой внутренней потребностью. Так, чтобы мы получили впечатление, что это событие действи­ тельно не могло произойти по-другому, (стр. 369) Подходящим названием для этой тенденции рассматривать исходы, о которых было сообщено, как об относительно неизбежных, могло бы быть “пресмыкаю­ щийся детерминизм”, в отличие от философского детерминизма, сознатель­ ного убеждения, что все, что происходит, должно случиться. Обреченным необходимо изучать прошлое... 391 Одна из тенденций - сократить пропорцию исторических процессов, уве­ личивая скорость, с которой “неизбеж ны е” изм енения осущ ествляю тся (Fischer, 1970). Например, люди способны указать на момент, когда ж ители Латифундии были обречены, не понимая, что им потребовалось два с полови­ ной столетия, чтобы исчезнуть. Д ругая тенденция состоит в том, чтобы по­ мнить людей, более похожими на себя настоящ их, чем фактически это было так (Y arrow, Campbell, и B urton, 1970). Третья тенденция может быть заме­ чена в критическом анализе историографии идеологических корней нациз­ ма Барраклау ( B arraclough, 1972). Оглядываясь назад от времен Третьего Рейха, можно проследить его корни в работах многих авторов, из чьих произ­ ведений нельзя было вывести нацизм. Четвертая тенденция - это думать, что участники исторической ситуации полностью осознавали ее возможную важ ­ ность (“Дорогой дневник, сегодня началась Столетняя война”, Fischer, 1970). П ятая тенденция - это миф критического эксперимента, недвусмысленно ре­ шающего конфликт между двумя теориями или устанавливая валидность одной. Ф актически, “критический эксперимент считается критическим толь­ ко десятилетия спустя. Теории не отменяются просто так, так как несколько аномалий всегда позволяю тся. Действительно, очень трудно опровергнуть программу исследования, которую поддерживают талантливые ученые с раз­ витым воображением” (Lakatos, 1970, с. 157-158). Неспособность игнорировать знание исхода имеет существенные выго­ ды. Весьма лестно считать, или заставлять других полагать, что мы знали бы все, что мы могли бы только знать со знанием исхода, то есть, что мы обладаем ретроспективным предвидением. В конечном счете, однако, необ­ наруж енны й пресмы каю щ ийся детерминизм мож ет серьезно повредить наш ей способности оценивать прош лое или получать из него знания. Рассмотрим людей принимаю щ их реш ения, которые оказались негото­ выми к некоторому повороту событий и которые пробуют увидеть, где они повели себя не так, к ак надо, воссоздавая состояние знания пред-исхода. Если ретроспективно событие каж ется относительно вероятным, они не сде­ лаю т ничего, кроме к ак , будут ругать себя за то, что они не соверш или дей­ ствия, которое их знание, каж ется, диктовало. Они могли бы добавить со­ ж аление об ущербе, причиненном самим событием. Когда прошлое пере­ сматривается наблюдателем, их неудача каж ется проявлением некомпетен­ тности, недальновидности, или ещ е хуж е. В ситуациях, когда информация ограничена и неопределенна, случай­ ные неожиданности и конечные неудачи неизбежны. Н аказы вать людей принимающ их реш ения, которые допустили ошибку в подверженным ошиб­ кам системах, не признавая этого и ничего не делая, чтобы улучш ить систе­ му, является несправедливым и пагубным. Согласно историку Роберте Вольш теттер (R oberta W o h lstetter, 1962), урок, который получен из неож идан­ ного нападения в Перл Х арборе-то, что мы должны “принять ф акт неопре­ деленности и учиться ж ить с ним. Так как никакое волшебство не обеспе­ чит определенность, наш и планы должны работать без нее” (с. 401). 392 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ Когда мы пы таемся понимать прош лые события, мы неявно проверяем гипотезы или правила, которые мы используем, чтобы интерпретировать и понимать мир вокруг нас. Если, в ретроспективе, мы систематически недо­ оцениваем случаи неожиданности, которые были и есть у прошлого для нас, мы подвергаем эти гипотезы очень слабым тестам и, возможно, находим мало причин изменить их. Таким образом, само знание исхода, которое дает нам чувство того, что мы понимаем то, что прошлое хотело нам сообщить, мо­ ж ет помеш ать нам действительно вынести и з него какой-либо урок. Защ ита от этого предубеждения требует некоторого понимания психоло­ гических процессов, задействованных в его создании. К аж ется, что когда мы получаем знание исхода, мы немедленно понимаем его, интегрируя в то, что мы уж е знаем о предмете. После такой переинтерпретации, сообщенный ис­ ход каж ется более или менее неизбежным продуктом переинтерпретирован­ ной ситуации. “Понимание” того, что нам говорят о прошлом, в свою очередь, настолько естественно, что мы можем не знать, что знание исхода оказывало какое-либо влияние на нас. Д аж е если мы знаем, что влияние было, мы мо­ жем все еще точно не сознавать, каким оно было. В попытке восстановить наш е ретроспективное состояние, мы остаемся закрепленными в наш ей рет­ роспективе, оставляя рассматриваемый исход слиш ком вероятным. В результате, просто предупреждение людей относительно опасностей предубеждения ретроспективы не имеет влияния (Fischhoff, 1977b). Более эф ф ективная манипуляция долж на вынудить человека приводить доводы против неизбежности сообщенных исходов, то есть попы таться убедить, что это могло бы получиться иначе. Вопрос о валидности причин, которые вам потребовались для объяснения его неизбеж ности, мог бы бы ть хорошим началом (K oriat, L ichtenstein, и Fischhoff, 1980; Slovic и Fischhoff, 1977). Так к ак даж е этот необычный ш аг, каж ется не полностью адекватным, м ож ­ но было далее пробовать проследить часть неопределенности, окружаю щ ей прош лые события в их первоначальной форме. Существуют ли расш ифров­ ки стенограммы командованию П ерл Харбора до 7 часов утра 7 декабря? Существует ли записная кн иж ка, показы ваю щ ая акции, которые Вы рас­ смотрели до покупки акций Волтем Индастриз? Существуют ли дневники, показы ваю щ ие взгляд Чемберлена на Гитлера в 1939? Интересным вариан­ том было намерение Д угласа Ф римана не знать ничего о последующих со­ бы тиях на любом отрезке времени при его работе над биографией Роберта Е . Л и. Х отя это и замечательно, эта стратегия все-таки требует некоторых пред­ полож ений о распространенности знания относительно того, кто сдался в Аппоматоксе. Обреченным необходимо изучать прошлое... 393 Взгляд на все сразу Зачем вообще смотреть? Изучение прошлого основано на убеждении, что, если мы смотрим, мы бу­ дем способны разглядеть некоторые поддающиеся интерпретации модели. Обширное исследование полагает, что это убеждение хорошо обосновано. Люди, каж ется, имеют замечательную способность находить некоторый по­ рядок или значение даж е в случайно произведенных данных. Один из наи­ более знакомы х примеров - ош ибка игрока в казино. Мы считаем, что при подбрасывании монеты, четыре последовательных “орла” будут сопровож­ даться “реш кой” (Lindm an и Edw ards, 1961). Таким образом, в наш их умах даже случайные процессы вынуждены иметь внутренние свойства. Канеман и Тверски (1972b, 3) предположили, что из 32 возможных последова­ тельностей ш ести бинарных событий только 1 практически рассматривает­ ся к ак “случайная”. Х отя ош ибка игрока в казино обычно упоминается в контексте пикант­ ны х, но тривиальны х примеров, она может такж е быть найдена в более се­ рьезных попы тках объяснить исторические события. Н апример, после от­ четливой демонстрации того, что вакансии в Верховном Суде распределя­ ются более или менее случайно (согласно процессу Пуассона), с вероятнос­ тью 0.39, по крайней мере, одной вакансии в год, Моррисон (M orrison, 1977) потребовал, чтобы (Президент) Рузвельт объявил свой план созыва Суда в феврале 1937, вскоре после на­ чала своего пятого года правления в Белом доме. 1937 был также годом, в котором он сделал свое первое назначение в Суд. То, что он имел эту возможность в 1937, не должно было бы показаться удивительным, потому что вероятность, что он в течение пяти лет не назначал бы одного или более судей, была всего лишь 0.08, или один к двенадцати. Другими словами, когда Рузвельт решил изменить Суд, создав дополнительные места, вероятность была уже одиннадцать к одному в его пользу, что он сможет назвать одного или более судей традиционным способом именно в этом году. (с. 143-144) Однако, если вакансии появляю тся наугад, то это рассуждение неправиль­ но. Оно предполагает, что вероятностный процесс, создающ ий вакансии, подобно монете, имеет пам ять и чувство справедливости, как будто он зна­ ет, что он переходит в пяты й год правления президента Рузвельта и что он “долж ен” Ф .Д .Рузвельту вакансию . Однако, 1 января 1937 прош лые четы ­ ре года были историей, и вероятность, по крайней мере, одной вакансии в наступающ ем году была все еще 0.39 (Fischhoff, 1978). Ф еллер (Feller, 1968) предложил следующий рассказ, вовлекающ ий даже более вы сокие ставки: ж ители Лондона в течение бомбардировок потратили значительны е усилия на интерпретации зон немецкой бомбежки, развитие слож ны х теорий того, куда немцы целились (и когда снимать маскировку). Однако, когда Лондон был разделен на маленькие, смежные географичес­ кие области, распределение частоты попаданий бомб в область было почти 394 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ точным приближ ением к пуассоновскому распределению . Кейтс (K ates, 1962) предполагает, что природные бедствия составили другую категорию важ ны х событий, где (напуганные) обыватели, видят порядок, когда экс­ перты видят случайность. Одна загадка устойчивости таких убеждений - неспособность продолжать использовать достаточно полные записи, чтобы противостоять ош ибкам. Ис­ торики подтверждаю т, что роль отсутствующего свидетельства в облегче­ нии объяснений с комментариями, таким и, к ак “история Викторианской Эпохи никогда не будет написана. Мы знаем слиш ком много относительно ее. Т ак к ак невежество - первая необходимая вещ ь для историка - невеж е­ ство, которое упрощ ает и разъясняет, которое выбирает и пренебрегает, со спокойны м соверш енством, недосягаемы м самым вы соким искусством” (Strachey, 1918, предисловие). Д аж е, если записи доступны и неизбеж ны , мы, каж ется, имеем необыч­ ную способность объяснять или обеспечивать причинную интерпретацию для всего, что мы видим. Когда события обусловлены вероятностными про­ цессами с неосязаемыми свойствами, случайное изменение не мож ет даж е казаться нам потенциальной гипотезой. Н апример, тот ф акт, что атлеты , наказы ваем ы е за плохое выступление, имеют тенденцию добиваться боль­ ш его успеха в следующ ий раз, удовлетворяет наш им наивным теориям о поощ рении и наказании. Это удобное объяснение ослепляет нас по отноше­ нию к вероятности того, что улучш ение наоборот, происходит благодаря рег­ рессу к среднему в выступлении атлетов (Furby, 1973; K ahnem anи T versky, 1973,4). Ф ама (Fam a, 1965) действительно считал, что колебания цен на фондо­ вой бирже лучш ие поняты к ак отраж ение случайного процесса. Случайный процесс, однако, имеет даже более неинтуитивные свойства, чем двоичный процесс, с которым он формально связан (C arlsson, 1972). В результате, мы обнаруж иваем, что рыночные аналитики имеют объяснение каж дого изме­ нения в цене, преследующее некоторую цель или нет. Некоторые объясне­ н и я, подобно показанны м на рис.1, являю тся противоречивыми2; другие, каж ется, отрицаю т возможность случайного компонента, например, пол­ ностью выдуманный фактор “техническое регулирование.” Псевдовласть наш их объяснений может быть проиллюстрирована по ана­ логии с анализом регресса. Учитывая набор событий и достаточно большой или богатый набор возможных объясняющих факторов, можно всегда получать постдикции или объяснения для любой желаемой степени плотности. В терми­ нах регресса, расш иряя набор независимых переменных можно всегда найти нескольких прогнозирующих с любой желаемой корреляцией с независимой переменной. Цена, которую приходится платить за чрезмерную совместимость, 2Один из моих любимых контрастов - это, когда рыночные цены повышаются после хоро­ ших экономических новостей, то это считается ответом на новости; если же они падают, это объясняется, тем, что хорошие новости уже были обесценены. Обреченным необходимо изучать прошлое... 395 конечно, сокращение, неспособность полученного правила работать на новой выборке событий. Частота и сила методологических предупреждений против чрезмерной совместимости предполагают, что корреляционное применение избыточной мощности - это предубеждение, которое является весьма стойким даже к расширенному профессиональному обучению (для ссылок, см. Fischhoff и Slovic, 1980). Теория чрезмерной совместимости подобна костюму, скроенному точно для одного человека в одной специфической позе, который не подойдет кому-либо еще или даже, тому же самому человеку в будущем или даже в настоящем, если у него происходит некоторое заметное изменение (например, если он делает выдох, чтобы показать живот). Историк, который построил гермети- L Уровень накопления КАК ФОРМИРУЮТСЯ СОПРОТИВЛЕНИЯ А КАК ФОРМИРУЕТСЯ ПОДДЕРЖКА Рис. 1. Два примера признаков, используемых в выделении пред­ ш ественников прош лы х изменений в ценах акций: формирование сопротивления и формирование поддержки. Однако можно видеть, что до серьезных изменений, эти два образца были по существу иден­ тичны . В этом свете, волнообразный отрезок ни прогнозирует, ни объясняет ничего в этих данны х 396 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ ческий случай, объясняющий все доступные свидетельства, как могли бы по­ бедившие большевики оказаться в грустном положении, если бы СССР рассек­ ретил документы, показывающие, что меньшевики были более серьезные про­ тивники, чем думали раньше. Цена, которую инвестиционные аналитики пла­ тят за чрезмерное совпадение - их неспособность в конце концов предсказать ничего лучш е, чем средние рыночные числа (Dreman, 1979) - хотя циник мог бы сказать что они фактически выживают через поколение надежды (и комис­ сии). 3 Чрезмерное совпадение происходит из-за капитализации на случайны х колебаниях. Если измерение достаточно точное, два случая, отличаю щ ие­ ся одной переменной, такж е будут отличаться любой другой переменной, которую мы хотим назвать. В результате, можно вы числить отличную от н уля (ф актически, в этом случае, совершенную) корреляцию меж ду этими двум я переменными и получить “интересную ” самостоятельную теорию. Процессы, аналогичны е этому двух-размерному случаю, работают с любы­ ми т наблю дениями в п-мерном пространстве, определенном наш им набо­ ром возмож ны х объясняю щ их концепций. В этих прим ерах, данные заданы и бесспорны, в то время к ак набор воз­ мож ны х объяснений относительно неограничен; человек ищ ет до тех пор, пока не находит объяснение, которое его удовлетворяет. Д ругая популяр­ н ая форма капитализации на случае оставляет набор установленных объяс­ нений (обычно для одного кандидата) и перебирает данные до тех пор, пока подтверждаю щ ее свидетельство не найдено. Х отя более грубая форма этой процедуры хорошо известна, другие формы являю тся более тонкими и даж е несколько неоднозначными в своей характеристике. Н апример, Вы прово­ дите эксперимент и не получаете ожидаемы й результат. Д умая об этом, Вы обращ аете внимание на элемент ваш ей процедуры, который мог уменьш ить влияние зависимой переменной. Вы исправляете это; снова нет результата, снова возникает возмож ная проблема. Н аконец, Вы (или ваш и испытуемые) получаете все, к ак надо, и ожидаемый эффект получен. Теперь, правильно ли вы полнить ваш е статистическое испы тание на этой энной выборке (для которой оно значимо) или на всех выборках? Если бы Вы сделали правиль­ ный эксперимент сначала, вопрос даж е не будет возникать. И ли, к ак токси­ колог, Вы “уверены”, что воздействие химического вещ ества X является вредным для здоровья, так что Вы сравниваете рабочих, которые работают и не работают с ним на некотором заводе на наличие рака мочевого пузы ря, но все ещ е не получаете никакого результата. Так что Вы проверяете их на рак киш ечника, эмфизему, головокруж ение, и так далее, пока Вы наконец не получаете существенное различие в наличие рака кож и. Это различие 3Мой друг однажды проходил курс по чтению форм диаграмм в сфере маклерства. Каждое занятие включало обучение 10-12 новым признакам. Когда курс закончился, через пять занятий и 57 признаков, у преподавателя осталось еще много в запасе. Обреченным необходимо изучать прошлое... 397 значимое? Конечно, способ проверить эти объяснения или теории - испы та­ ние с новыми выборками. Этот ш аг, к сожалению , редко предпринимается и часто не возможен по техническим или этическим причинам (Tukey, 1977). Связанные ослож нения могут возникать даж е с установленными теори­ ями и наборами данных. Диаконис (D iaconis, 1978, с. 132) отмечает труд­ ность оценки количества неожиданностей в результатах экстрасенсорного восприятия, даж е в редких случаях, в которы х они были получены в конт­ ролируемой обстановке, потому что определения нужного события продол­ ж аю т изм еняться. “Главный клю ч к успеху Б.Д . было то, что он не опреде­ лял заранее результат, который нуж но рассматривать к ак неожиданный. Разногласия против некоторого совпадения существенно меньш е, чем про­ тив любого заранее определенного совпадения”.4 Туфт и Сан (T ufte и Sun, 1975) обнаруж или, что существование или от­ сутствие пределов зависит от творческого потенциала и гибкости, допуска­ емой в определении события (для какого офиса? на каки х выборах? насколь­ ко хорошо? пределы, которые отсутствуют, должны быть вклю чены?). Они, как полагаю т, существуют, потому что мы имеем удивительную способность обнаружить сигнал даж е в полном ш уме. М ы уже достаточно увидели? У читы вая, что мы почти уверены относительно обнаруж ения чего-то под­ дающ егося толкованию , когда мы смотрим на прош лое, наш следующий вопрос такой, “П оняли мы его?” Исследование ретроспективы, описанное ранее, предполагает, что мы не только быстро находим порядок, но такж е и чувствуем, что мы знали это все некоторым способом или были бы способны спрогнозировать результат, если нас вовремя попросили бы. Действитель­ но, легкость, с которой мы обесцениваем информативность того, что нам говорят, делает удивительным то, что мы когда-либо задаем прош лому, или любому другому источнику, много вопросов. Эта тенденция усугубляется за счет (а) не понимания того, к ак мало мы знаем или того, что нам говорят, оставляя нас не сознающ ими то, каки е вопросы мы долж ны задать в поиске неож иданны х ответов (F ischhoff, Slovic и L ichtenstein, 1977,1978) и (b) по­ рож дения далеко идущ их заклю чений даж е из малого количества ненадеж ­ ны х данны х (K ahnem an и Tversky, 1973 ,4 ; Tversky и K ahnem an, 1971,2). Любая склонность не смотреть дальше поощряется нормой сообщения ис­ тории, к ак хорошей истории, со всеми уместными подробностями, аккуратно объясненными и неопределенностью, окружающей событие до его завершения, 4Диаконис продолжает, “Чтобы далее усложнить любой анализ, несколько таких неточно определенных экспериментов часто проводились одновременно, взаимодействуя друг с дру­ гом. Молодой исполнитель держал аудиторию в напряжении. Его часто полностью невер­ ные предположения вообще расценивались скорее с симпатией, чем сомнением; и для боль­ шинства наблюдателей они, казалось, только подтверждали наличие сверхъестественных способностей у Б.Д.” 398 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ наряду с любым сметением, который автор, возможно, чувствовал (Gallie, 1964; N ow ell-Sm ith, 1970). Только одна из тайн этого явлен и я раскры та Тауни (Tawney, 1961); “Историки приписывают появление неизбежности существу­ ющему порядку, выдвигая на первый план силы, которые одержали победу и отодвигая на задний план те, которые они проглотили”(с. 177).5 Х отя это и интуитивно привлекательная цель, построение последователь­ ны х рассказов подвергает читателя некоторым интересным предубеждени­ ям . Законченны й рассказ состоит из ряда независимы х звеньев, каж дое довольно хорошо определено. П равда рассказа зависит от правды звеньев. Вообще, чем большее количество звеньев появляется, и большее количество деталей находится в каж дом звене, тем менее вероятно, что история долж ­ на быть правильной в ее полноте. Однако Словик, Ф ишхофф и Л ихтенш ­ тейн (Slovic, Fischhoff и L ichtenstein, 1976)наш ли,что добавление д етали к описанию события может увеличивать его каж ущ ую ся вероятность возник­ новения, очевидно, увеличив его тематическое единство. Бар-Х иллел (ВагH illel, 1973) обнаруж ила, что люди последовательно преувеличиваю т веро­ ятность конъю нкции ряда вероятны х событий. Н апример, ее испытуемые вообще предпочитали ситуацию , в которой они получат приз, если семь не­ зависимы х событий, каж дое с вероятностью 0.90 долж ны произойти, ситу­ ации, в которой они получат тот ж е самый приз, если при подбрасывании монеты вы пал “орел”. Вероятность сложного события меньш е чем 0.50, при­ ним ая во внимание, что вероятность единственного события - 0.50. Други­ ми словами, неопределенность, каж ется, нарастает в медленном темпе. Что случается, если последовательность вклю чает одно или несколько слабы х или маловероятны х звеньев? Вероятность его самого слабого звена долж на установить верхний предел вероятности полного рассказа. После­ довательные суж дения, однако, могут быть компенсационными, с последо­ вательностью сильны х звеньев “выравниваю щ их” бессвязность слабых свя­ зей. Этот эффект используется адвокатами, которые помещают самое сла­ бое звено в их аргументах рядом с началом их выводов и заканчиваю т пото­ ком убедительных, неоспоримых аргументов. Коулс (Coles, 1973) предоставил восхитительный пример полной последо­ вательности истории, скрывающей неправдоподобность ее звеньев: наиболее серьезная попы тка Ф рейда в психоистории была составить биографию Лео­ нардо да Винчи. В течение многих лет, Фрейд искал тайну, позволяющую понять Леонардо, чье детство и юность были в основном неизвестны. Н ако­ нец, он обнаружил ссылку Леонардо на воспоминание о стервятнике, касаю ­ щ емся его губ, в то время к ак он был в колыбели. Отмечая идентичность еги­ петских иероглифов для “стервятника” и “матери” и другого свидетельства, Ф рейд продолжал строить внуш ительный и последовательный анализ Лео­ 5Такие стратегии могут затрагивать дух, также как и разум, субъективно увеличивая силу и стабильность статуса-кво и сокращая его очевидную способность к изменению (Markovic, 1970). Обреченным необходимо изучать прошлое... 399 нардо. При составлении окончательного издания работ Фрейда, однако, ре­ дактор обнаружил, что немецкий перевод воспоминания Леонардо (первона­ чально по-итальянски) который использовал Фрейд, был ошибочным, и что это был бумажный змей, а не стервятник, который гладил его губы. Несмот­ ря на наличие клю ча к разрушению анализа Ф рейда, редакторы реш или, что остающийся каркас был достаточно прочен, чтобы выстоять это. К ак Хекстер заметил (H exter, 1971, с. 59), “Частично, потому что написать плохую историю довольно легко, хорошие истории пиш утся очень редко”. Заклю чен и е К акие общие уроки мы можем извлечь из изучения прошлого, за исклю че­ нием ф акта, что понимание является более неуловимым, чем это может быть часто подтверждено? П резент изм(приверж енност ь наст оящ ему) Неизбежно, мы все пленники наш ей существующей личной перспективы. Мы знаем вещ и, которые наш и предш ественники не знали. Мы используем аналитические категории (например, феодализм, Столетняя война), кото­ рые являю тся значимыми только ретроспективно (Е. A. R. Brown, 1974). Мы обладаем собственными точками зрения при интерпретации прошлого, чтобы доказать, что оно является неоднозначным, чтобы избеж ать налож е­ ния наш ей идеологической перспективы (D egler, 1976). И сторики действи­ тельно “использую т новые ф окусы на м ертвы х в каж дом поколении” (Becker, 1935). Не существует никакого доказанного противоядия для презентизма. Не­ которые частичны е средства могут быть обобщены из обсуждения того, как избеж ать предубеждения ретроспективы при пересмотре прошлого. Другие появляю тся в почти любом тексте, посвящ енном обучению историков. Воз­ можно, наиболее общими выводами, являю тся, (а), знание нас самих и на­ стоящ его настолько хорошо, насколько возможно; “историк, который боль­ ш е всего ощ ущ ает собственную ситуацию , такж е наиболее способен к ее трансцендированию ” (B enedetto Croce, цитируемый C arr, 1961, с. 44); и (Ь) быть настолько благож елательны ми, насколько возможно, по отношению к наш им предш ественникам; “историк - не судья, ещ е меньш е вешающий судья” (Knowles, цитируемый M arw ick, 1970, с. 101). П едант ичност ь В дополнение к неизбежному заклю чению в рам ках наш его времени, мы часто ещ е больше ограничиваем наш у перспективу, добровольно надевая ш оры, которые сопровождают строгую приверженность единственному н а­ учному методу. Д аж е когда он используется рассудительно, ни один метод 400 ЧРЕЗМЕРНАЯ УВЕРЕННОСТЬ не является адекватным для ответа на многие вопросы, которые мы задаем прош лому. Каждый сообщает нам что-либо и несколько вводит в заблуж де­ ние. Когда мы не знаем, к ак получить правильны й ответ на вопрос, необхо­ дим а альтернатива эпистемологии: используйте по возможности ш ирокий диапазон методов или перспектив, каж ды й из которых позволяет вам избе­ ж ать некоторых видов ош ибок. Это означает своего рода меж дисциплинар­ ное сотрудничество и отношение, отличное от того, с которым люди сталки­ ваю тся в большинстве попыток смеш ать два подхода. Совпадения или не совпадения, подобно психоистории, слиш ком часто предпринимаю тся за­ щ и тн и кам и, нечувствительны м и к ловуш кам в их приняты х областях (F ischhoff, в печати - Ь). Х екстер (H exter, 1971, с. 110) описывает истори­ ков, вовлеченных в некоторые такие приклю чения к ак “кры сы , прыгаю ­ щ ие с борта интеллектуально тонущего корабля” . Обсуждение Возвращ аясь к Бенсону (Benson, 1972), если мы хотим, чтобы прошлое слу­ ж ило будущему, мы не можем обращ аться с ним в изоляции. П равила, кото­ ры е мы используем, чтобы объяснить прошлое, должны такж е быть теми, которые мы используем, чтобы прогнозировать будущее. Мы должны нако­ пить опыт, обращ ая внимание на все уместные испытания наш их гипотез. Один аспект выполнения этого компилирует отчеты, которые могут быть под­ вергнуты систематическому статистическому анализу; второй - хранит след обсуждения, предшествующего наш им собственным решениям, понимая, что настоящ ее будет скоро прошлым и что хорошо сохраненное описание являет­ ся лучш им средством предотвращ ения предубеждения ретроспективы; тре­ тий делает прогнозы, которые могут быть оценены; один тревожащ ий урок из ядерной катастрофы на острове Три Майлс - то, что не в полне ясно, что этот якобы диагностический случай показал нам относительно валидности Исследования атомной безопасности (А мериканская Комиссия по атомному урегулированию, 1975), которое попыталось оценить угрозы ядерной энер­ гии: четвертый аспект получает лучш ую идею относительно валидности н а­ ш их собственных чувств достоверности, поскольку уверенность в существу­ ющем знании управляет наш ей ж аж дой новой информации и интерпрета­ ций (Fischhoff, Slovic и Lichtenstein, 1977). Таким образом, мы должны струк­ турировать наш у ж изнь, чтобы облегчить обучение. Н еопределенност ь В конце, тем не менее, не может быть н икаких ответов на многие из вопро­ сов, которы е мы излагаем. Н екоторые плохо сформулированы. Н а другие н ельзя ответить с помощью сущ ествую щ их или возможных инструментов. Столько, сколько мы хотели бы знать “к ак профессионалы делают это”, не сущ ествует статистического способа смоделировать образ суж дения экспер­ Обреченным необходимо изучать прошлое... 401 тов до желательной степени точности с реальными стимулами. Наши теории часто “настолько сложные, что никакая отдельная количественная работа не могла даже начать проверять их валидность” (O’Leary и другие, 1974, с. 228). Когда группы, которые мы хотим сравнить по одной переменной, такж е от­ личаю тся по другой, не существует логической процедуры для приравнива­ ния их на этой мешающей переменной (МееЫ, 1970). Когда мы попробовали применить много возможных объяснений к одному набору данных, не суще­ ствует твердого способа узнать, сколько степеней свободы мы использовали, и как мы капитализировали случайности (Champbell, 1975). Когда мы исполь­ зуем множественные подходы, знание, которое они производят, никогда точ­ но не конвергирует. В конце концов, можно попытаться применить философ­ скую перспективу Тревельяна, что “несколько несовершенных подходов к истории - это лучш е, чем ни одного” (по М арвик, 1970, стр. 57). Часть VII Многоступенчатая оценка 24. Оценка составных вероятностей в последовательном выборе* Джон Коэн, Е. Я. Чесник иД. Харан Часто бывают ситуации, в которых успеш ный исход зависит от человека, делающего правильны й выбор на каж дой из нескольких более или менее независимых стадий. В качестве примера можно привести выбор транспор­ та на различны х стадиях соверш ения поездки. Похожие затруднительные моменты встречаю тся в профессиональной, административной, политичес­ кой, военной ж изни и в коммуникационны х сетях вообще. Временной по­ рядок этих нескольких выборов - не всегда жизненно важ ны й ф актор. Кро­ ме того, ситуация в целом может иметь стохастический характер, где веро­ ятность правильного выбора мож ет изм еняться от стадии к стадии. Мы опиш ем эксперимент, моделирую щ ий этот общий тип ситуации, ко­ торая ясно требует, для успешного исхода, умнож ения вероятностей. И с­ следования предпочтения определения местонахождения цели в матрице т х п, или в дисплее, разделенном на концентрические зоны, указы ваю т, что ячейки в матрице или концентрических зонах субъективно не равнове­ роятны к ак местоположения для цели (Cohen, Boyle и Chesnick, 1969). И с­ пытуемые, каж ется, не наугад определяю т неизвестное местоположение цели. И х стратегия поиска скорее имеет характер “предсказания”, где экс­ периментатор скры л цель, или располож ил там, где они ож идали ее уви­ деть. Другие эксперименты (Cohen и H ansel, 1958) предполагаю т, что мно­ гие люди при столкновении с ситуацией, вовлекаю щ ей сложные вероятно­ сти, склонны склады вать, а не умнож ать, возможности на различны х ста­ диях. Мы можем соответственно спрогнозировать, что в матрице т хп, с неиз­ вестной целью в каж дом из т рядов, оценка испытуемого его вероятности угадать все цели будет правильно преувеличена, как оцененная сложной *Эта глава первоначально появилась в Nature, 1971, 32, 414-416. Авторское право ® 1971 Macmillan Journals, Ltd. Переиздано в соответствии с разрешением. 406 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА вероятностью , n'm, расположения цели. Наш эксперимент предназначен для проверки этого прогноза и объяснения явлений, которые возникнут в ситу­ ации. Таблица 1. Психологические вероятности (гр\ основанные на выборе в ло­ терее Количест во альт ернат ив в ст адии 2 3 4 5 8 М Количест во ст адий в м ассиве 2 0.45 0.41 0.31 0.30 0.07 0.31 3 0.51 0.21 0.23 0.22 0.16 0.27 4 0.36 0.21 0.21 0.17 0.11 0.21 5 0.38 0.21 0.12 0.18 0.13 0.20 8 0.37 0.17 0.11 0.08 0.05 0.16 М 0.41 0.24 0.19 0.19 0.11 Примечание: П ункты в таблице представляю т собой средние величины де­ сяти наблюдений. А ппарат состоял из доски, на которой был набор из т рядов, каж ды й из которых содержал п гнезд, где тт&п принимали значение 2 ,3 ,4 , 5 или 8. Все гнезда были пустыми кроме одного в каж дом ряду, в который помещ ался билет. Количество отдельных стадий поэтому было от 2 до 8, с вероятностью правильно угадать в каж дой стадии в пределах от 2Лдо 2'3. И спытуемыми были 50 учащ ихся средней ш колы в возрасте 14-15 лет, «интеллект» которых был, по крайней мере, столь ж е хорошим к ак у сред­ него взрослого. Испытуемому объяснили, что для того, чтобы вы играть приз, он долж ен был угадать правильное местоположение билета в каж дом ряду, и позволили делать только одно предположение на 1 ряд. Его задача состоя­ ла в том, чтобы приравнять то, что он считал вероятностью вы игры ш а при­ за, с одним из наборов лотереи. Всего проводилось четы рнадцать лотерей. Десять из них имели 100 би­ летов каж дая, а вероятность вы тянуть выигрыш ный билет, основанный на количестве выигрыш ных билетов в данной лотерее, бы ло0.01,0 .1 ,0 .2 ,0 .3 ..., 0.9. О ставш иеся четы ре лотереи имели 5 0 0 ,1 .0 0 0 ,5 . ОООи 10.000 билетов, с соответствующим шансом вы тянуть счастливый билет 0.002,0.001,0.0002 и 0.0001. Диапазон значений, принимаемых рядам и, и диапазон значений гнезд учиты вал двадцать пять различны х ситуаций. К аж ды й из пятидесяти ис­ пы туемы х был приписан наугад одной из пяти ситуаций посредством слу­ чайны х латинских квадратов. Д есять испытуемых, таким образом, оцени­ вали тхп ситуаций каж ды й. Оценка составных вероятностей... 407 Количество информации, которая фактически требовалась, чтобы определять местонахождение цели - mlog.2n “бит”, где т - количество рядов, которые мы теперь назовем “стадиями”, и п количество гнезд, которые будут определяться как “альтернативы”. Вероятность вытянуть выигрышный билет в лотерее, выб­ ранной испытуемым, мы будем рассматривать как косвенную оценку его психо­ логической вероятности ip —получения приза. Результаты , представленные в Таблице 1, показываю т что все значения ^ -я в л я ю тся оцененными слиш ком высоко, при оценке сложными вероят­ ностями, р, таким образом, подтверж дая наш прогноз. Величина переоцен­ ки обозначена отнош ениями гр к р в табл. 2, что предполагает, что реализм оценок наруш ает очевидная тенденция меньш е принимать во внимание ко­ личество стадий, чем количество альтернатив в стадии, хотя дисперсион­ ный анализ показы вает, что относительно остаточной дисперсии, как дис­ персия между стадиям и, так и меж ду альтернативами - значимо различа­ ю тся (Р <0.01). Таблица 2. Отношения ip/р психологической и сложной вероятности Количест во альт ернат ив в Количест во ст адий в м ат рице Г " /•т л л ш / 2 3 4 5 8 2 1,8 4,0 5,7 12,2 95,0 3 3,8 5,9 17,8 53,2 103 4 4,9 14,8 54,0 118,0 7*10* 5 7,5 27,8 106,0 563,0 ЗхЮ4 8 4,3 82,4 465,0 4хЮ3 9x10® Этот отличительный эффект становится ясны м , если мы составим, как на Рисунке 1, логарифм относительной переоценки, log 1Qip /p , против количе­ ства информации в битах, mlog2n, необходимые для определения местона­ хож дения цели. Отношение - линейное и задается уравнением: log10ip / р = 0.26 mlog2n - 0.31 (1) Оно мож ет быть переписано как: Ц) j р = g (0 .8 6 rnlogen -0 .7 2 ) (2 ) из которого следует, что если мы оставляем количество стадий постоянным, хр/р прямо пропорционально показателю степени количества альтернатив в 408 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА стадии, и , если мы оставляем количество альтернатив постоянным, гр / р изм еняется по экспоненте с количеством стадий. Если у нас есть т и п , мы можем предсказать среднее значение гр- пото­ му что р=пт (3) С лож ная вероятность р получена путем умнож ения соответствующей веро­ ятности правильного угады вания в каж дой из т стадий, и каж дая из этих вероятностей, равна 1/п. Поэтому, из (2) мы получаем, что гр —е'0,72 п‘° 14т (е 0.72 = 0 4 9 ) (4) В основном, поэтому относительная переоценка гр/р следует из объективно­ го ослабления мультипликативного ф актора т количества стадий. Его ос­ лабление имеет порядок шести седьмых от количества стадий, в пределах наш их экспериментальны х ограничений. Это приводит к тому, что мы вы ­ водим то, что мультипликативны й элемент в сложной вероятности являет­ ся далеким от того, чтобы быть “простым” или интуитивны м, что может помочь объяснить особые трудности, с которыми люди сталкиваю тся в изу­ чении статистики. Рисунок 1. П ереоценка, относящ аяся к логарифму, против коли­ чества битов (log10 (гр /р ) против т log2 п ) .р - слож ная вероятность; т - количество стадий; п - количество альтернатив Оценка составных вероятностей... 409 Н аш а интерпретация поддерживается подобными экспериментами с испы ­ туемыми в возрасте 9+ и 10+ лет, у которы х, кроме относительной пере­ оценки у - никакие тенденции не являю тся заметными с вариациями в зна­ чениях т и п . Это такж е предполагает, что мультипликативны й элемент не примитивен. Метод, который мы использовали, вовлекает косвенную оценку хр. Бо­ лее п рям ая оценка м ож ет бы ть получена, если попросить испы туемого вы брать между различны ми типами матриц. Полезность выбора, однако, могла бы тогда стать важ ны м фактором. Этот эксперимент объясняет очевидную тенденцию для принимающего реш ения, в разнообразии ситуаций многоступенчатого выбора недооцени­ вать вероятность его успеха, и поэтому использовать несоответствующую стратегию , о которой он будет позж е сожалеть. С исторической точки зрения интерес представляет тот ф акт, что самые искуш енные мыслители древней Греции, хотя они и очень интересовались идеей возможного, особенно в стоической философии, никогда не применя­ ли комбинаторный анализ, который появился только в шестнадцатом сто­ летии. Сам А ристотель, очевидно, недооценивал п оняти я вероятности. Лю бая интуиция испытуемого, которая бы ла у него и у других, бы ла нагру­ ж ена долгими приняты ми привы чками мы ш ления. О тносительная переоценка составных сложны х вероятностей, которую показал эксперимент, мож ет быть проявлением значительной общности в принятии реш ений и выборе. Если так, это заслуж ивает специального обо­ значения. Мы предлагаем назвать это “инерционным хр - эффектом”. 25. Консерватизм в процессе обработки информации человеком* Вард Эдвардс ...Большое количество исследований показало, что люди являю тся консер­ вативны ми в обработке неверной информации. Такие эксперименты срав­ ниваю т человеческое поведение с результатами теоремы Байеса, формаль­ но оптимального правила о том, к ак мнения (то есть вероятности) должны быть пересмотрены на основе новой информации. О казы вается, что измене­ ние мнения обычно упорядочено прямо пропорционально числам , получен­ ным из теоремы Байеса - но их недостаточно. Первое близкое приближение к данным показало бы, что требуется где-то от двух до пяти наблюдений, чтобы сделать одно наблюдение стоящ им работы для побуждения испытуе­ мого изменить свое мнение. М ножество экспериментов было нацелено на объяснение этого явления. Они показы ваю т, что одна из главны х, а вероят­ но, и главная причина консерватизма - неверное накопление данны х у лю ­ дей. То есть люди точно чувствуют каж дую данную величину и хорошо зна­ ют о ее индивидуальном диагностическом значении, но неспособны хорошо скомбинировать ее диагностическое значение с диагностическим значени­ ем других данны х при пересмотре м нений.... Вероятности определяют степень неопределенности. Вероятность, к ак со­ гласно Байесу, так и наш ей интуиции, составляет просто число между нулем и тем, что представляет степень, для которой несколько идеализированный человек считает, что утверждение верно. П ричина, по которой человек не­ сколько идеализирован, состоит в том, что сумма его вероятностей для двух взаимно исклю чаю щ их событий должна равняться его вероятности того, что произойдет любое из этих событий. Свойство аддитивности имеет такие по­ следствия, что мало реальных людей могут соответствовать им всем. Так как * Выдержки из статьи, которая появилась в В. Kleinmuntz (Ed)., F o rm a l re p re se n ta tio n o f H u m a n J u d g e m e n t. Нью-Йорк: John W iley and Sons, Inc, 1968. Переиздано в соответствии с разрешением. Консерватизм в процессе обработки... 411 такие вероятности описывают человека, который поддерживает мнение боль­ ш е, чем событие, о котором это мнение, их называют индивидуальными ве­ роятностями (см. Savage, 1954). Теорема Байеса - это тривиальное последствие свойства аддитивности, бесспорное и согласованное для всех сторонников вероятностей, к ак Байе­ са, так и других. Один их способов написать это следующий. Если Р (Нд | D) последую щ ая вероятность того, что гипотеза А была после того, к ак данная величина D наблю далась, Р (Нд>) - его априорная вероятность до того, как наблю далась данная величина D, Р (D | Нд) - вероятность того, что данная величина D будет наблю даться, если верно НА, а Р (D) - безусловная вероят­ ность данной величины D, то Р (H a |D )= p (d I h ^ pcha) P(D ) ( 1) P(D) лучш е всего рассматривать к ак нормализующ ую константу, заставля­ ющую апостериорные вероятности составить в целом единицу по исчерпы­ вающему набору взаимно исклю чаю щ их гипотез, которые рассматриваю т­ ся. Если ее необходимо подсчитать, она может быть такой: P (D ) = Z P ( D | H /) P ( H i) i Но более часто Р (D) устраняется, а не подсчитывается. Удобный способ устранять ее состоит в том, чтобы преобразовать теорему Байеса в форму отнош ения вероятность-ш ансы. Рассмотрим другую гипотезу, Нв, взаимно исключающую Нд, и изменим мнение о ней на основе той ж е самой данной величины , которая изменила ваш е мнение о Нд. Теорема Байеса говорит, что Р(Нв, п ) = 1 < М в т в ) P(D) ( 2) Теперь разделим Уравнение 1 на Уравнение 2; результат будет таким: Р(НА \Р) _ Р ( Р \ Н А) шР(НА) Р(НВ | Р) Р ( Р \ Н В) Р(Нв ) или где Qj со став л яет апостери орны е ш ан сы в п ол ьзу Нд ч ерез HB,Q0апри­ орные ш ансы , a L - количество, знакомое статистикам к ак отношение веро­ ятности. У равнение 3 - это такая ж е соответствующ ая версия теоремы Б ай ­ еса как и Уравнение 1, и часто значительно более полезная особенно для эк ­ спериментов, с участием гипотез. 412 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА Сторонники Байеса утверждаю т, что теорема Байеса - формально опти­ мальное правило о том, как пересматривать мнения в свете новых данных. Этот пересмотр мнения в свете данны х составляет именно тем, из чего со­ стоит статистический вывод, и поэтому он должен быть структурирован вокруг теоремы Байеса - со многими последовательными отличиями от клас­ сической статистической практики. Д ля элементарной демонстрации этих идей, н ап исанны х для психологов - эксперим ентаторов (см. E dw ards, Lindm an и Savage, 1963). Но мы - не статистики, или, во всяком случае, ни один из нас сегодня не носит «дурацкий колпак» статистика. Вместо этого, к ак психологи, мы интересуемся сравнением идеального поведения, опре­ деленного теоремой Байеса, с ф актическим поведением людей. Чтобы дать Вам некоторое представление о том, что это означает, давайте попробуем провести эксперимент с Вами как с испытуемым. Эта сумка со­ держ ит 1. 000 покерных фиш ек. У м еня две такие сумки, причем в одной 700 красны х и 300 синих фиш ек, а в другой 300 красны х и 700 синих. Я подбросил монету, чтобы определить, какую использовать. Таким образом, если наш и м нения совпадают, ваш а вероятность в настоящ ее время, что вы ­ падет - сум ка, в которой больше красны х фиш ек - 0.5. Теперь, Вы наугад составляете выборку с возвращ ением после каж дой ф иш ки. В 12 выборках, Вы получаете 8 красны х и 4 синих. Теперь, н а основе всего, что Вы знаете, какова вероятность того, что вы пала сум ка, где больше красны х? Ясно, что она выш е, чем 0.5. П ож алуйста, не продолжайте читать, пока Вы не запи­ сали ваш у оценку. Если Вы похож и на типичного испытуемого, ваш а оценка попала в диа­ пазон от 0.7 до 0.8 - хотя утверждение, которое часто делалось в предыду­ щ их параграф ах, что люди консервативны в обработке информации, воз­ мож но, сместило ваш ответ вверх. Если бы мы проделали соответствующее вы числение, тем не менее, ответ был бы 0.97. Действительно очень редко человек, которому предварительно не продемонстрировали влияние консер­ ватизм а, приходит к такой высокой оценке, даж е если он был относительно знаком с теоремой Байеса. Где-то в 1960 У ильям Л. Хейс, аспирант по имени Лоренс Д . Ф иллипс и я заинтересовались обнаружением несоответствий между человеческим по­ ведением и поведением, указанны м теоремой Байеса. Простой пример пре­ дыдущ его параграф а не приходил нам на ум; вместо этого мы были уве­ рены , что мы долж ны будем использовать довольно сложную ситуацию , чтобы получить не Байесовское поведение. Так что, мы использовали гипо­ тетическую компью теризированную радарную систему. Бы ло 12 возмож­ ны х наблюдений, 4 возможные гипотезы и испытуемые должны были по­ нять и использовать демонстрацию 48 различны х значений Р (D|H). И спы­ туемые вы полняли задание при двух условиях. В одной, испытуемый ви­ дел единственный стимул, точку в секторе дисплея радара; затем он пере­ сматривал свои априорные вероятности по этим четырем гипотезам на ос­ нове данной величины , «урегулировав» четыре «рычага» к своим следую- Консерватизм в процессе обработки... 413 хцим оценкам вероятности, затем повторно «устанавливал рычаги» в пози­ цию 0 в подготовке к следующему стимулу. Второй стимул состоял из ста­ рой точки плюс новой; испытуемый «устанавливает ры чаги», чтобы сооб­ щ ить о совокупном воздействии обеих точек. И так далее, пока не накопи­ лись 15 точек. Во втором условии, стимулы были перетасованы, и испытуе­ мы й, в действительности начинал заново с каж ды м новым стимулом. К удив­ лению экспериментаторов предсказание теоремы Байеса, что это различие в условиях не должно произвести никакого различия для поведения, было подтверждено. Кроме того, было еще одно условие, в котором каж дая новая точка была показана одна, но испытуемым позволяли сохранять оценки от одного стимула до следующего вместо того, чтобы повторно «регулировать рычаги» к нулевой позиции после каж дой оценки. И опять, изменение в условиях произвело мало различий в поведении. П олож ительны х результатов эксперим ента Ф иллипса-Х эйза-Эвардса было три. Во-первых, испытуемые были очень консервативны. Во-вторых, они были наименее консервативны на первой точке, становясь более кон­ сервативными с увеличением их количества. Н аконец, суммы их оценок вероятности, которые не были ограничены, вообще составили в целом боль­ ше чем 1, и увеличивались, по мере прохож дения испытуемых через после­ довательные стимулы в упорядоченной последовательности. Очевидно, для испытуемых было легче определить, к ак ая гипотеза была одобрена стиму­ лом, и таким образом усилить вероятность этой гипотезы, чем реш ать, от какой другой гипотезы долж на получаться вероятность для того, чтобы при­ дать ей легитимность. Мы сильно медлили с публикацией этого первоначального эксперимен­ та по консерватизму. Х отя данные были полными уж е к 1962, книга Филлипса-Хэйза-Эвардса не выходила в печать до 1966 (Phillips и другие, 1966). М асштаб и устойчивость проявления консерватизма поразили нас. К а­ залось уместным попробовать намного более простые задачи. Так, без боль­ шой веры , Ф иллипс и я пробовали предварительное испытание, подобное по характеру примеру с сумкой и покерными ф иш ками, который Вы рас­ сматривали выше. К наш ему удивлению , это сработало очень хорошо. Боль­ ш ая часть текущ его исследования, сравниваю щ его человеческое поведение с теоремой Байеса, может быть прослежено к этому предварительному ис­ пытанию и последующему эксперименту. Если доля красны х ф иш ек в сумке - р, то вероятность получения г крас­ ны х фиш ек и (п - г) синих в п выборках с возвращ ением в некотором по­ рядке -р ' ( 1-р )пг. Так, в типичном эксперименте с сумкой и покерными фиш ­ кам и, если НАозначает, что доля красны х ф иш ек составляет рАи Н в - озна­ чает, что доля составляет рв, тогда отношение вероятности L _ Р а <Х-Р аГ - Р в )” (4) 414 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА Обратите внимание, что, в то время к ак Уравнение 4 было получено из рассмотрения ф актической последовательности красны х и синих в выбор­ ке, оно, возможно, одинаково могло быть получено из рассмотрения г крас­ ны х и ( л - г) синих в любом порядке; двучленный коэффициент, который представляет число различны х способов, с помощью которы х можно полу­ чить г красны х в п испы таниях, появляется и в числителе, и в знаменателе, и , таким образом, сокращ ает отнош ения вероятности. Это иллю страция принципа вероятности статистики Байеса (см. Edw ards, Lindm an и Sevage, 1963), который в действительности говорит, при применении формулы Б ай ­ еса необходимо учиты вать только вероятность фактического наблю дения, а, не вероятности других наблюдений, которые он, возможно, сделал бы, но не сделал. Этот принцип имеет ш ирокое воздействие на все статистические и нестатистические применения теоремы Байеса; это самый важ ны й техни­ ческий инструмент размы ш ления Байеса. В особом случае, в котором рА= 1 - р в (симметрический двучленный слу­ чай), отнош ение вероятности сокращ ается до 2г-п Обратите внимание, что 2 г - п = г - ( п - г ) - различие меж ду количеством красны х и синих в выборке; только это различие, а не общее количество наблю дений, составляет релевантным выводу в этом симметрическом слу­ чае. С татистическая традиция отмечает, что успехи различия (difference successes) минус неудачи, или s - f; это обычная независимая переменная экспериментов с сумкой и покерными фиш ками. Чтобы понимать объясне­ ние для обычных зависимых переменных, замените Уравнение 5 на У рав­ нение 3, возьмите логарифмы и перестройте термины. Результат logL =(2r - n)log - = logQ 1 - log По \~Ра Если испытуемый действует по Байесу, отношение вероятности логариф­ ма, которое может быть выведено, вы читанием логарифма априорных ш ан­ сов из логарифма апостериорных шансов, должно быть пропорционально s - f , независимой переменной. Уместно начертить выведенное отношение лога­ рифма вероятности испытуемого, таким образом подсчитанное из его апос­ териорны х ш ансов (которые в свою очередь были рассчитаны из его апосте­ риорны х вероятностей, если он оценивал вероятности) и объективно соот­ ветствую щ ие априорные ш ансы , против s Больш инство экспериментов с сумкой и ф иш ками в М ичиганской лабо­ ратории использовало генеральную совокупность из 48 пронумерованных пультов, состоящ их из кнопки, красной и зеленой лампочек. Когда кнопка Консерватизм в процессе обработки... 415 на пульте наж ата, одна из лампочек гаснет и снова загорается; испытуемым говорят, что это эквивалентно выборке с возвращ ением ф иш ки соответству­ ющего цвета. Испытуемым говорят, что программа, которая управляет лам­ почкам и, бы ла написана, путем осущ ествления выборок из сумки. Ф акти­ чески, для больш инства экспериментов, программа скорее тщ ательно раз­ работана так, чтобы показанная последовательность бы ла репрезентативна выборке из сумки, и в особенности так, чтобы в каж дом эксперименте вы ­ борки размера п одобряли несоответствующую гипотезу, часто используя значение рА, для всех значений п. Ф иллипс и я (1966) исследовали влияние рА, используя последовательно­ сти 20 ф иш ек и рАзначений 0.55, 0.7 и 0.85. Тестируемые оценили следую­ щ ие вероятности, распределяя 100 белых деревянны х дисков в два сосуда. Типичные результаты таких экспериментов представлены на рис. 1 для 0.7 меш ков с различны ми априорными вероятностями. Три результата, про­ иллю стрированные на Рисунке 1, были обнаружены для всех испытуемых. Во-первых, выведенные отнош ения логарифма вероятности были прибли­ зительно прямо пропорциональны s Во-вторых, априорные вероятности использовались соответственно; то есть лучш ая подходящ ая линия для всех Рис. 1. Оценки отдельного испытуемого для рА0.7 вы раж енны е во внеш кальном логарифме вероятностных отношений к ак функции различия между количеством успехов и количеством неудач в вы ­ борке 416 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА точек данны х проходит через изначальную . В-третьих, испытуемые были консервативны ; лучш ая подходящ ая линия была, более ровной, чем линия, представляю щ ая оптимальную формулу Байеса. Обнаружение почти линей­ ности выведенных коэффициентов логарифма вероятности для s - f (или, что эквивалентно, с коэффициентами логарифма вероятности Байеса) предла­ гает еще одну зависимую переменную: отношение наклона лучш е всего со­ ответствующей линии для всех оценок испытуемых к наклону линии Байе­ са. Петерсон, Ш найдер и М иллер (P eterson, Schneider и M iller, 1965) назва­ ли это отношение отношением точности; они такж е обнаружили, что оно более или менее постоянно для s - f . Рисунок 2 показы вает соотнош ения точности данных Ф иллипса-Эвардса для трех значений рА. Д ля наименее диагностической информации, ис­ пытуемые показали более экстремумные результаты , чем теорема Байеса. (Dale обнаруж ил то ж е самое; см. W . Edw ards, 1965.) Но для информации, имеющ ей разумно высокое диагностическое значение, испытуемые были консервативны , и соотношение точности было очень постоянным для s-f. Обратите внимание, что с увеличением диагностичности, консерватизм так­ ж е увеличивается. Это стандартный вывод в таких экспериментах; любая процедура, которая увеличивает диагностичность индивидуального наблю­ дения (одной ф иш ки или нескольких) такж е увеличивает консерватизм. (См. например P eterson, Schneider и M iller, 1965.) -2 0 2 4 6 В 10 12 14 16 18 s —f Рис. 2. Отношение точности для трех значений рАдля различны х составов выборок Консерватизм в процессе обработки... 417 Ф иллипс и я , после получения этих результатов, приш ли к выводу, что одна причина для консерватизма могла бы состоять в том, что испытуемые, зная, что ш кала вероятности ограничена и, зам ечая, что доказательство могло продолжать подниматься, заниж али свои оценки. Очевидное сред­ ство, в таком случае, должно использовать неограниченный способ ответов, таких к ак ш ансы. Так что мы провели исследование с четы рьмя группами. Контрольная группа оценила вероятности, распределяя 100 дисков в два сосуда, к ак прежде. Группа, оцениваю щ ая ш ансы вербально, просто сдела­ ла устные оценки шансов; мы всегда принимаем ш ансы, к ак числа, равня­ ю щ иеся единице или больше, и поэтому всегда сопровождаем утверж дения ш ансов утверж дениям и, гипотезы которы х поддерж иваю тся ш ансами. Группа, оцениваю щ ая ш ансы с помощью логарифмических ш кал, сделала оценки, перемещ ая указатель по ш кале ш ансов, которая содержала четыре ц икла логарифма, так, что могли быть, оценены ш ансы от 1:1 до 10.000:1. Ч етвертая группа такж е использовала ш ансы на логарифмической ш кале, но числа, введенные напротив маркировки ш калы , были скорее вероятнос­ тям и, чем ш ансами (таким образом, 0.5, а не 1:1, 0.67, а не 2:1, 0.80, а не 4:1, и т.д.). Это назвали вероятностью на группе логарифмической ш калы ш ансов. Бы ло обнаружено, что все группы были весьма консервативны. Вероятностная группа бы ла самой консервативной, группа на логарифми­ ческой ш кале шансов была еще хуж е, а две группы ш ансов были приблизи­ тельно сопоставимы, а ш ансы на логарифмическом масштабе были немно­ го большими. Это открытие просто подчеркивает ф акт, который стал все более и более ясным в ходе наш ей работы Байеса. Вероятность - довольно плохое измере­ ние неопределенности, кроме к ак в ситуациях, в которых перераспределе­ ние или другое прямое использование свойства аддитивности являю тся не­ обходимыми. Что лучш е ш ансы или логарифм шансов? Ш ансы наиболее интуитивно понятны для неопытных испытуемых, и могут наиболее легко быть связанны ми с простыми действиями (например, выбор среди ставок); тот ф акт, что сфера азартны х игр структурирует свои утверж дения и имеет дело с ш ансами, а не с вероятностями, является и признанием, и возможно причиной большей интуитивной значимости ш ансов. Логарифм ш ансов, уникальны й среди более или менее общей метрики неопределенности, име­ ет такое свойство, которое в этом метрическом свидетельстве является ад­ дитивным. Если мнение измерено с помощью логарифма шансов, количе­ ство изменений во мнении, произведенных частью свидетельства, незави­ симо от того, с чего мнение должно было начинаться. Это изящ ное свойство делает логарифм шансов уникально удобными для экспериментов Байеса. Данные Ф иллипса-Эвардса могут быть пригодны за счет простой моди­ ф икации теоремы Байеса: Qj=Lc • Q0 418 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА Константа С, степень, в которую каж дое отношение вероятности возводит­ ся до обработки ее посредством теоремы Байеса, составляет отношением точ­ ности. К сож алению , она зависит от важ ны х независимы х переменны х, вклю чая диагностичность данных и ответную метрику. Однако, то, что та­ к а я простая н аглядная модель так хорошо вписы вается, можно объяснить в соответствии с любой теорией консерватизм а.... ... Вероятностная система обработки информации, или ВСОИ ( или с англ. PIP)... - это идея о том, как проектировать человеко-маш инные системы, которые долж ны обрабатывать информацию для достиж ения заклю чения о том, в каком состоянии находится мир. Примеры ситуаций, в которые та­ к а я обработка информации долж на быть сделана, вклю чаю т медицинский диагноз, военное командование (в котором командую щ ий, возможно, дол­ ж ен определить, действительно ли он находится под угрозой нападения, и если так, каков план его противника), и управление бизнесом (например, в случае бизнесмена, решающего, необходимо ли производить новое изделие). И дея относительно ВСОИ слиш ком слож ная, чтобы объяснять ее подробно здесь (см. Edw ards, Lindm an и P hillips 1965, или W . Edw ards, 1966). Сущ­ ность ВСОИ в том, что задача диагностической обработки информации мо­ ж ет быть разделена на два класса подзадач. Один класс подзадач состоит из оценки диагностического воздействия индивидуальной данной величины на отдельную гипотезу или пару гипотез. Д ля вербальных, качественных видов данны х и для гипотез, которые характеризую т многие реальные ди­ агностические установки, это, каж ется, задача, которая обязательно долж ­ на вы полняться человеком с большим опытом. Но второй класс подзадач это соединение этих отдельных диагностических воздействий для всех дан­ ны х и гипотез в картину того, к ак все гипотезы в настоящ ее время пред­ ставлены в свете всех доступных данных. Эта задача соединения может быть легко механизирована посредством теоремы Байеса, если диагностические воздействия индивидуальных данных оценены в форме значений Р (D\H) или отнош ения вероятности. (В большинстве ситуаций, хотя не во всех, оцен­ ки отнош ений вероятности явно предпочтительны, по формальным причи­ нам , для оценки Р (D\H).) Мне и приблизительно пятнадцати сотрудникам было интересно, рабо­ тает ВСОИ или н е т . Мы разработали придуманный, но сложный мир 1975. В этом мире мы перечислили ш есть гипотез, которые тестируемые должны были рассмотреть, определяющ ие три источника данны х (Система дальне­ го обнаруж ения баллистических ракет, система спутникового зондирова­ н ия и система разведки), которые обеспечивали данные, опираю щ иеся на эти гипотезы , и разработали четыре системы для обработки данны х. Эти четы ре системы назы вали P IP , POP, PEP и PU P. В P IP , тестируемые оцени­ вали п ять отношений вероятности для данной переменной. Одна из этих ш е­ сти гипотез была “Будет продолж аться мир”, а другие пять были вероятно­ стью различны х войн; пять конъю нкций войны с миром определяли пять отнош ений вероятности, которые будут оценены. Другие три системы обра­ Консерватизм в процессе обработки... 419 ботки информации, которые Есе подразумевали, что испытуемый оценивал апостериорные ш ансы или вероятности или подобные апостериорные вели­ чины ; таким образом, в P IP компьютер соединил данные посредством тео­ ремы Байеса, в то время к ак во всех трех других сис темах испытуемые долясны были объединить данные в уме. Чтобы помочь им это сделать, тестиру­ емые в POP, PEP и PU P производили оценивание, после того, к ак им стано­ вилась доступна n -ная данная величина, когда они рассматривали (п+1) данную величину, так что им приходилось только модифицировать оцен­ к и , на которые повлияли данные величины. 1:1000 1:500 1:100 1:5 1:2 1:1 2:1 5:1 10:1 Финальные шансы для PIP (по логарифмической шкале) Рис. 3. Ф инальные ш ансы в пользу войны для POP в сравнении с PIP по логарифмической ш кале Было всего 18 сценариев с 60 условиями данных в каждом сценарии. Все условия кроме информации о системе дальнего обнаружения баллистических ракет были представлены в форме коротких абзацев. 34 испытуемых были обу­ чены характеристикам мира, гипотезам, этим трем источникам данных и сис­ теме обработки информации, которую каж ды й должен был использовать. Так к ак P IP была явно лучш ей, a POP была следующей, я представлю только сравнение между ними. (PU P была третьей, а РЕР, самый близкий результат, к тому способу, которым обработка информации происходит сей­ час, бы ла худш ей.) Рис.З показы вает заклю чительные ш ансы, после 60-го условия данны х в каж дом сценарии, в пользу каж дой войны по сравнению с миром для P IP и для POP. Две самые важ ны е вещ и, которые нужно заме - 420 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА тить на граф ике - это то, что эти две группы очень хорошо согласуются к а­ чественно (корреляция между ними - 0.895), но они не согласуются коли­ чественно. P IP намного более подвержена влиянию данны х, чем POP; тот ж е самый сценарий, который приведет PIP к тому, что он будет очень уве­ ренным относительно мира или войны, приведет POP, к намного меньшей уверенности. Иными словами, P IP - менее консервативна, чем POP, воз­ можно , потому что в POP, субъекты должны объединить данные, в то время к ак в P IP , испытуемые оцениваю т диагностическое воздействие каж дой данной величины отдельно, и теорема Байеса делает их соединение. Вы долж ны такж е обратить внимание, что обе оси на рис. 3 логарифми­ чески разделены . Если Вы переводите различие в эффективности обратно в ш ансы , различие между P IP и POP становится очевидным. Н апример, вы ­ числение, исходя из линии регресса, привел ли сценарий P IP к тому, чтобы дать 99:1 ш ансы в пользу войны над миром, POP дал бы только 4:1 (шансы) в пользу этой войны , а не мира. ------- начальная последовательность -------конечная последовательность • действительные шансы ▲ ELR, - шансы ■ ELRj - шансы х оцененные шансы Количество испытаний Рис. 4. М едианные апостериорные ш ансы для всех испытуемых в пользу начального множ ества к ак ф ункции количества испытаний Консерватизм в процессе обработки... 421 Гипотеза неправильного восприятия не может объяснить это несоответствие между P IP и POP, в P IP испытуемые оцениваю т диагностическое воздей­ ствие каж дой данной величины отдельно; в POP испытуемые должны объе­ динить в уме - и сделать это весьма консервативно. Так к ак никакая мо­ дель процесса порождающего данные не доступна, невозможно сказать к а­ ковы правильные апостериорные шансы. Но различие между PIP и POP явно вызвано различием в процессе агрегации. Лэрри Ф иллипс, один из сотрудников в этом эксперименте, был заинтере­ сован тем, что никакая модель процесса порождающего данные не была дос­ тупна и, так что нельзя было сказать с уверенностью, был ли PIP или POP более правилен. Так в своей докторской диссертации он сравнил P IP с POP в ситуации, в которой модель процесса порождающего данные была доступна, имело смысл спросить сотношение вероятности для отдельной данной вели­ чины , и процедура POP произвела консервативные оценки. Его испытуемые были редакторами студенческой газеты М ичиганского Университета. Он взял статьи каждого редактора в течение семестра, посчитал две первые и после­ дние буквы в каждом слове каж дой статьи, и таким образом, для каждого редактора подготовил множество начальных биграмм и множество конечных биграмм. Д ля задачи PIP , он взял определенные биграммы, и попросил ре­ дактора оценить (только для его собственного множества) отношение вероят­ ности, взятое с гипотезой множества начальных биграмм в числителе и ги­ потезой множ ества конечных биграмм в знаменателе, связанное с каж дой биграммой. Д ля задачи POP, он подготовил последовательность биграмм, выб­ ранных из одного из множеств, и спросил редактора, когда он прорабатывал последовательность, оценить апостериорные шансы, что это было начальное, а не конечное множество. Много усилий было потрачено на предварительное обучение редакторов, и оценки отношения вероятности были собраны дваж ­ ды, один раз до и один раз после апостериорных оценок шансов. В анализе данны х возникла проблема, потому что все оценки, и для PIP, и для POP, были смещены в пользу начального множества. Это вероятно, потому что намного легче, например, думать о словах, которые начинаю тся на ге, чем о словах, которые заканчиваю тся на ге, даж е при том, что ге ско­ рее встречается к ак окончание, чем к а к начало слова; мы приучены к м ар­ кировке слов по их началам, а не окончаниям, когда мы, например, ищем их в словаре. Однако, возможно исправить такие предубеждения. Рисунок 4 показы вает результаты после такого исправления. Действительные ш ан­ сы, подсчитанные из фактического счета биграмм, являю тся наиболее экстремумными. Затем идут ш ансы , подсчитанные из второго набора оценок отнош ения вероятности. Затем идут ш ансы , подсчитанные из первого набо­ ра оценок отнош ения вероятности. И, наиболее близкими к середине и по­ этому наиболее консервативными, являю тся непосредственно оцененные апостериорные ш ансы. Если мы верим этим данным (а я верю), хотя PIP значительно менее консервативен, чем POP, он все-таки слиш ком консер­ вативен, но оценки P IP улучш аю тся с практикой. 26. Гипотеза угадывания в многоступенчатом выводе* Чарльз Ф.Джеттис, Клинтон Келли III и Камерон Р. Петерсон М ногоступенчатый вывод состоит из ряда одноступенчатых выводов, где результат каж дой предыдущ ей стадии становится входными данными к следующ ей стадии. В выводах с единственной стадией рассуждаю т, исходя из данны х или однозначно наблюдаемого свидетельства к набору гипотез. М ногоступенчатый вывод начинается с тех ж е самых однозначных данных или свидетельства в первой стадии; однако, входные данные для следую­ щ ей стадии - это результат предыдущ ей стадии. Следующая стадия вывода поэтому базируется на вероятностях событий, а не на определенном знании, что некоторы й случай является верным (G ettys и W ilike, 1969). Например, предположим, что Вы хотели предсказать успех или неудачу большой вечеринки в саду. Предположим, что вечеринка, менее вероятно, будет успешной, если собравшиеся будут толпиться в закрытом помещении из-за дождя. Ваш а переменная - присутствие темного облака на горизонте. П ервая стадия вывода связала бы темное облако с наличием или отсутствием дож дя в течение вечеринки. Предположим, что Вы оценили, что вероятность дож дя была 0.70. Эта оценка стала бы входными данными к следующей ста­ дии вывода. Если бы Вы знали с уверенностью, что будет дождь, то Вы могли бы вывести вероятность того, что вечеринка будет иметь успех. Но Вы полно­ стью не уверены, что будет дождь; данные, которые Вы имеете, указываю т на дождь с вероятностью 0.70, так что, что вам теперь делать? М одифицированная теорема Байеса (МТБ) обеспечивает оптимальную мо­ дель для таких многоступенчатых выводов (Dodson, 1961; G ettys и W ilike, 1969). М ножество исследований показало, что интуитивная работа в много­ ступенчатой задаче заканчивается большей определенностью, извлекаемой из данны х, чем предсказано моделью МТБ. Н апример, в задаче оценки ш ан­ * Эта глава первоначально появилась в Organizational Behavior and Human Performance, 1973, 10, 364-373. Авторское право © 1973 Academic Press, Inc. Переиздано в соответствии с разрешением. Гипотеза угадывания в многоступенчатом выводе 423 сов ш ансы испытуемых типично больше, чем рассчитанные МТБ. Этот ре­ зультат весьма удивителен, потому что свидетельство указы вает, что пове­ дение людей в задаче вывода единственной стадии почти всегда консерва­ тивно; то есть, люди извлекаю т меньше определенности, чем гарантируют данные (например, W . Edw ards, 1966). Парадокс, конечно, в том, что много­ ступенчатый вывод является совокупностью выводов. Если люди извлека­ ют меньш е определенности, чем гарантирую т данные в одноступенчатых выводах, то в многоступенчатой ситуации можно было ожидать, что они ста­ нут все более консервативными с каж дой последующей стадией, так к ак их отклонения от не оптимальности долж ны накапливаться от стадии к ста­ дии. Ф актически это изменение верно; они более уверены в конце двух ста­ дий вывода, чем гарантировано оптимальной моделью МТБ. Из этого следу­ ет, что некоторый процесс происходит в “интерфейсе” одноступенчатого вы ­ вода, который является настолько экстремумным, что любой консерватизм побежден. Задача вывода единственной стадии всегда базируется на данных, кото­ рые известны. Однако, даж е при том, что многоступенчатая задача начина­ ется с определенных данных, апостериорные стадии вывода имеют дело с неопределенными данными. Н есколько моделей были сформулированы для объяснения, к ак необходимость иметь дело с вероятностями данны х, а не с определенными данными могла бы создать чрезмерную определенность в многоступенчатом выводе. Одна неопт:ш альная модель, имею щ ая свойство предсказания чрезмерной определенности - модель “К ак будто” (G ettys и W illke, 1969; Howell, G ettys, и M artin, 1971). Этамодель, разработанная для ситуаций, в которых люди имеют выбор, чтобы собрать больше данных, если они чувствую т, что они нуж ны , предполагает, что сбор данны х продолжа­ ется в первой стадии вывода, пока человек принимаю щ ий реш ения не дос­ таточно уверен в состоянии мира. К ак только его уверенность превыш ает некоторое пороговое значение, он переходит к следующей стадии вывода, действуя “к ак будто” он полностью уверен относительно данных следую­ щ ей стадии. Чтобы возвратиться к примеру вечеринки в саду, принимаю ­ щ ий реш ение, увидев темное облако, мог бы получить текущ ее сообщение прогноза погоды. Предположим, в прогнозе погоды был предсказан серьез­ ный ш торм. Уверенность в вероятности дож дя теперь превысила бы его по­ роговое значение, и он переходит ко второй стадии вывода, “к ак будто” он уверен в том, что будет дождь. Результат второй стадии вывода был бы его оценкой вероятности успеха или неудачи, основанной на его "как будто" предположении о дожде. Его оцененная вероятность для неудачи должна теперь превысить фактическую вероятность ( МТБ) неудачи, потому что, делая "как будто" предположение о дожде, он игнорирует вероят­ ность, что этого дождя может не быть. Если, ф актически, его, "как буд­ то" предположение неправильно, и дождь не идет, то вечеринка, вероятно, будет иметь успех. О птимальная модель рассматривает обе возможности, дождь и отсутствие дож дя, в приписывании вероятности к успеху или не­ 424 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА удаче. М одель "как будто" рассматривает только возможность дождя» и по этой причине ведет к чрезмерной уверенности, что вечеринка не удастся. К ак человек мог бы вести себя, если бы его уверенность о входных дан­ ны х ко второй стадии вывода бы ла меньш е, чем пороговое значение, требу­ емое для "как будто" предположения, и не было никакой надежды относи­ тельно увеличения его уверенности с получением дополнительных данных? Одна возм ож ная гипотеза, которая является совместимой с возрастающ ей уверенностью, обнаруженной в предыдущ их исследованиях - то, что он бу­ дет сначала делать предположение "как будто", которое является в лучш ем случае угады ванием. Эта модель, названная “У гады вания” действует как усоверш енствованная "как будто" модель и разделяет с ней идею того, что принимаю щ ий реш ения будет либо игнорировать, либо иметь тенденцию игнорировать значения других менее вероятных событий во второй стадии вывода, концентрируясь почти исклю чительно на наиболее вероятном со­ бытии. Д ля примера, если единственная информация, которую Вы имеете - темное облако н а горизонте, Вы не захотите сделать дисквалифицирован­ ное "как будто" предположение, но Вы могли бы сначала предположить, что будет дождь и достигнуть субъективных шансов для успеха, основанно­ го на этом предположении. Тогда, так к ак Вы не полностью уверены, что будет дож дь, Вы могли бы несколько уменьш ить ваш и субъективные ш ан­ сы, чтобы принять это во внимание. Эти субъективные ш ансы могли бы от­ личаться от рассчитанных с помощью МТБ, прежде всего потому,что Вы явно не рассмотрели вероятность того, что не будет никакого дож дя. Сэппер и Ф райбек (Snapper & Fryback, 1971) представили результаты , которы е являю тся совместимыми с выш еупомянутым объяснением в экс­ перименте, касаю щ емся надежности данны х. Однако, их процедура не по­ зволяла проводить прямое испытание модели "У гады вания"; что является целью следующего эксперимента. М етод Ц ель эксперимента требовала, по крайней мере, трех уровней переменных, построенных таким образом, что промежуточный уровень переменной со­ держ ит более двух событий. Далее требуется управление распределением вероятности для всех событий, кроме наиболее вероятного из промежуточ­ ны х - управление, которое будет иметь результирующ ее воздействие на ве­ личину пересмотра оптимальной вероятности на верхнем уровне как резуль­ тат возникновения события на более низком уровне. Следовательно, три уровня приняли следующую форму. Переменная верх­ него уровня состояла из двух меш очков, помеченных I и II, соответственно. К аж ды й меш очек был заполнен маленькими контейнерами, которые пред­ ставляли собой события промежуточного уровня. К примеру, каж ды й ме­ ш очек содерж ал 18 м аленьких коробочек (коробочки от 35-милиметровой пленки) и каж дая из них была помечена А, В, С или D. Н аконец, в каж дой Гипотеза угадывания в многоступенчатом выводе 425 коробочке было 100 маленьких цветны х картонны х круж очков; каж ды й из которы х был одного из четы рех цветов: красны й, ж елты й, зелены й, си­ ний. Состав каж дого контейнера описан в Таблице 1. Часть А таблицы описы­ вает состав меш очка относительно коробочек, и Часть В - относительно кру­ ж очков. Н апример, 8 коробочек, помеченных А , находятся в меш очке I, тогда к ак только I коробочка, помеченная А, находится в меш очке II. К ак показано в части В, 80 круж очков находятся в коробочке А, 1 - в коробочке В, 1 - в коробочке С и 18 - в коробочке D. Таблица 1. Числовой состав мешочков и коробочек из-под пленки А . Состав меш очка Б ук ва на коробочке изпод пленки А В С D М еш очек 1 М еш очек 2 8 3 6 1 1 6 3 8 В. Состав коробочки из-под пленки круж очка 1$>асный Зеленый Желтый Синий К°Р°6очка А Коробочка В Коробочка С Коробочка D 80 1 18 1 1 80 1 18 1 18 80 1 18 1 1 80 Эксперимент проходил следующим образом. Выбирались наугад: один из двух меш очков, одна коробочка из этого меш очка, один круж очек из этой коробочки. Таким образом, выбор красного круж очка обеспечивает доказа­ тельство в пользу коробочки А, что в свою очередь обеспечивает доказатель­ ство в пользу меш очка 1. Заметьте, что, это только событие первого уровня, круж очек, которы й наблюдается непосредственно. Это наблюдение обеспе­ чивает только частичное доказательство с учетом события промежуточного уровня, коробочка, которая, в свою очередь, обеспечивают частичное дока­ зательство, о том, какое событие верхнего уровня было выбрано. Таким об­ разом, первая стадия вывода имеет отношение к цвету круж очка, к букве на коробочке, а вторая стадия вывода имеет отношение, к букве на коробоч­ ке и номеру меш очка. С тратегия действия, к ак будто наиболее вероятное событие верно на од­ ном уровне, приведет к распределениям вероятности, которые являю тся экстремумными на следующем более высоком уровне. Таким образом, эта 426 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА стратегия совместима с эмпирическим результатом, согласно которому люди чрезмерно пересматриваю т вероятности верхнего уровня в многоступенча­ той задаче. Существует другая тестируемая гипотеза, которая может быть получена из стратегии "У гады вания". Если человек действует, к ак будто наиболее вероятное событие верно на любом промежуточном уровне, тогда он игно­ рирует распределение вероятности для всех других событий на этом уров­ не. Его пересмотр вероятности на верхнем уровне должно быть поэтому не­ чувствителен к изменениям в распределении вероятностей для всех собы­ тий, кроме наиболее вероятного на промежуточном уровне. Данный экспе­ римент был предназначен для проверки этой гипотезы. П л а н эксперимент а Бы ли разработаны три задачи по типу представленных в Таблице 1. Часто­ ты , показанны е в части А, использовались во всех трех задачах. М атрица, показанная в части В, использовалась в одной задаче; в других двух задачах значение 80 в более низкой матрице было изменено или на 70, или 90, а зна­ чение 18 было изменено или на 28, или на 8, соответственно. Д ля последую­ щ его обсуждения эти три задачи будут определяться к ак задачи 70-28, 8018,90-8. Во всех трех задачах испытуемые оценили ш ансы меш очков, учи­ ты вая цвет одного круж очка, взятого из коробочки. Рисунок 1. Модели “угады вания”, “к ак будто” и МТБ к ак показа­ тели поведения “незнаю щ их” испытуемых Гипотеза угадывания в многоступенчатом выводе 427 И спы т уем ы е 25 испы туемы х были студентами М ичиганского университета, которые ра­ нее принимали участие в эксперименте с многоступенчатым выводом, про­ должительностью около двух часов. В предыдущем эксперименте испытуе­ мые были обучены необходимому способу ответа и произвели ряд оценок ш ансов в задаче с многоступенчатым выводом. Однако никогда не обсужда­ лась оптимальная модель, и никогда не использовалась обратная связь. И н ст р укц и и испытуемым И нструкции были кратким и из-за предыдущего эксперимента. Испытуе­ мым объяснили детали задачи. Их попросили представить, что мешочек был выбран наугад на основании подбрасывания монеты, что коробочка была наугад вы брана из меш очка, и что картонны й круж очек был наугад выбран из коробочки. И х попросили предположить, что круж очек определенного цвета был выбран таким образом и оценить ш ансы мешочков на основании цвета этого круж очка. Процедура П олучив инструкции, испытуемые оценили ш ансы мешочков в трех зада­ чах. М атрицы, подобные указанны м в Таблице 1, использовались, чтобы показать испытуемым относительные частоты коробочек и круж очков. За­ дачи были представлены в случайном порядке для каж дой группы, состоя­ щ ей от 4 до б человек. В каж дой задаче четыре возможных цвета использо­ вались в случайном порядке. Испытуемые оценивали ш ансы меш очков для всех возмож ны х цветов перед тем, к а к приступить к следующей задаче. После 12 оценок (4 цвета в задаче х З задачи) три задачи были повторены, используя другие случайные порядки для всех 24 оценок, по две для к аж ­ дого цвета в каж дой задаче. Р е з у л ь т а т ы и об суж д ен и е Обзор данны х показал чрезвычайную бимодальность в оценках шансов. Д ля некоторы х испытуемых теоретическое различие между синими и красны ­ ми круж очкам и и между зелеными и ж елты ми круж очками не вы зывало различия в оценках шансов. Другие испытуемые были более крайними в оценках ш ансов с синим круж очком, неж ели с красны м и более крайним и с ж елты м круж очком , неж ели с зеленым. Последние соответствовали МТБ, по крайней мере, в порядковом смысле. О казалось, что некоторые испытуе­ мые "не знали" о разнице синий-красны й и ж елты й-зелены й, в то время, к ак другие испытуемые "знали" в той степени, что они отвечали, по край ­ ней мере, в правильном отнош ении. П ринимая это во внимание, все испы ­ 428 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА туемые, которы е отвечали, по крайней мере, с одной оценкой шансов для синего, которая была на 2 % больше, чем зеленого или оценка для желтого, на 2% выш е, чем зеленого, были названы "знаю щ ими". Эти испытуемые были, по крайней мере, минимально "знаю щ ими", т.к . для одного или нескольких оцениваний их оценки шансов изменялись в паре синий-красный и паре ж ел­ тый-зеленый в направлении, которое определяла МТБ. 10 из 25 испытуемых были названы "знающ ими" с помощью этого консервативного критерия. Остальные 15 "незнаю щ их" испытуемых, были не склонны отвечать поразному на изменение в вероятностях менее вероятных событий. Они бук­ вально игнорировали выводы менее вероятных коробок. И х ответы соответ­ ствуют крайней форме модели "угады вания". М едианы ответов "незнаю ­ щ их" испытуемых показаны на рис.1. П оскольку меш очек, по которому ш ансы предпочтительны иррелевантны , данные нанесены на ш калу абсо­ лютного логариф ма ш ансов. Средние ответы логарифма шансов на красны е и синие круж очки соединены сплош ной линией в верхней части рисунка для трех уровней неопределенности данны х, медианы для ж елты х и зеле­ ны х круж очков такж е помечены в ниж ней части рисунка. Н а рис. 1 такж е обозначены прогнозы для МТБ (линия на диагонали), предсказания для мо­ дели "к ак будто" (две горизонтальные линии) и предсказания для версии модели угады вания, обозначенной на рисунке к ак модель I. П редсказания модели I получены путем умнож ения вероятности наибо­ лее вероятного события на апостериорные ш ансы, полученные, если собы­ тие было верным. Предположим, в задаче 80-18 был выбран красны й кру­ ж очек. Вероятность коробочки А - 0.80, ш ансы 8:1, если действительно круж очек вы нимался из А. П редсказания модели I будут 0 .8 8 /1 = 6 .4 или ш ансы 6.4:1. Модель "как будто" прогнозирует шансы 8:1 для синих и крас­ ны х круж очков и 6:3 для ж елты х и зелены х, при условии, что пороговая уверенность в типе коробочки преодолена. Д ля МТБ оптимальные ш ансы для красного круж очка - 2.86:1 и могут быть вычислены в соответствии со следующ ей формулой для апостериорных шансов (изменено из формулы 5 в G ettys & W illke, 1969): n, _ 7 . ч _7Ч Р\С1 \цвет) _ Р\С1) Р(СП \цвет) Р(СН) %Р(цвет | коробкаi)Р(коробка j | ) г ^Р(цвет \коробка{)Р(коробка^М11) где М - меш очек, и другие данные посчитаны из условных вероятностей, к а к показано в Таблице 1. Д анны е на Рисунке 1 не подходят ни к прогнозам "как будто", ни к МТБ. Ответы испы туемы х менее крайние, чем прогнозы "как будто" для верхних пар синий-красны й, где прогноз "как будто" - 8:1 ш ансов, и такж е менее крайний, чем прогноз 6:3 ш ансов в ниж ней части рисунка. Однако крайние версии модели угады вания и модели I, соответствуют медианам Рисунок 1. Гипотеза угадывания в многоступенчатом выводе 429 Горизонтальные пунктирны е линии на Рисунке 1 - прогнозы модели I. Д ля всех задач прогнозы модели I расположены правее диагонали МТБ для ж ел­ ты х круж очков в ниж ней части Рисунка 1. Модель "как будто" и модель I не обязательно прогнозирую т оценки ш ансов, которы е являю тся более крайним и, чем шансы МТБ. Эти вопросы поднимаются, например, в задаче 80-8, когда коробочка С является наиболее вероятной (Р = 0.80), а коробочка А (Р=0.18) наименее вероятной. Наиболее вероятное событие дает шансы 6:3 для меш очка I, если оно верно и наименее вероятное событие дает ш ан­ сы 8:1 для меш очка I. В этом случае, лю бая модель, которая игнорирует отношение 8:1, данное менее вероятным событием, будет консервативной по отношению к МТБ. Если допустить это, испытуемые не приняли бы неоптимальную модель, если она бы ла получена из субъективного чувства уверенности, и , возмож­ но, важ ны й результат - то, что они использовали модель I , потому что ду­ м али, что она правильная. Бы ла определена величина оценки шансов моде­ лью I, но в другой ситуации они могли использовать другое правило комби­ нации. Тот ф акт, что прогнозы модели I действительно соответствуют дан­ ны м, предполагает, что испытуемые склонны сосредотачиваться на наибо­ лее вероятной альтернативе и игнорировать выводы менее вероятной аль­ тернативы . Данные для 10 "знаю щ их" испытуемых представлены на Рисунок 2. К ак и на Рисунок 1, прогнозы модели "как будто" и модели МТБ показаны на рисунке, но прогнозы Модели I опущ ены, потому что они явно не соответ­ ствуют данным. Шансы абсолютного логарифма МТБ Рис. 2. Результаты “знаю щ их” испытуемых в сравнении с прогно­ зами моделей МТБ и модели “к ак будто” В общ ем, "знаю щ ие" испытуемые отвечали на те ж е переменные, что и М ТБ, но количественное соответствие модели МТБ скромное. К ак и МТБ, испытуемые менее уверены, чем подразумевалось моделью "как будто" для синих и красны х круж очков. Такж е, к ак и в М ТБ, их оценки желтому кру­ ж очку превосходят прогнозы "как будто". Это происходит, потому что наи­ более вероятное событие имеет ш ансы 6:3 и менее вероятное событие имеет ш ансы 8:1. Если испытуемые осознают нюансы многоступенчатых ситуа­ ц и й , они долж ны понимать, что ш ансы долж ны бы ть больш е, чем 6:3. Единственное исключение к этой общей картине - это расположение данных 80-18 для ж елты х и зеленых круж очков. Апостериорные ш ансы, основан­ ные на ж елтом цвете, должны увеличиться в то время, к ак вероятность наи­ более вероятного события уменьш ается, а ш ансы , основанные на зеленом, долж ны уменьш ится с увеличением вероятности. Ответы в условии 80-18 не следуют этой модели. В общем, "знаю щ ие" испытуемые используют пра­ вило комбинации, которое подобно МТБ, но оно несколько избыточно по от­ ношению к МТБ. Гипотеза тенденции угады вания в многоступенчатом выводе явно под­ держ ана "незнаю щ ими" испытуемыми. Очевидно, из-за сложности ситуа­ ции некоторые испытуемые были склонны сосредотачиваться почти полно­ стью на наиболее вероятном событии в последующих стадиях вывода. Эф­ ф ект угады вания в многоступенчатом выводе, к ак и консерватизм в выводе с одной стадией (W .Edw ards, 1966), по-видимому, является другим приме­ ром общей неспособности сочетать сложную информацию. Так к ак больш ая часть процесса обработки информации людей является многоступенчатой и вероятностной по характеру, дальнейш им ш агом в применении теоремы Байеса явл яется нахож дение способов, к а к помеш ать лю дям соверш ать ош ибки, игнорируя все, кроме наиболее вероятных событий промежуточ­ ного уровня. 27. Заключения о личных характеристиках на основе информации, восстановленной из памяти* Яков Троуп Социальные оценки часто основываются на неточном вспоминании поведе­ ния других людей. Нас часто просят сделать выводы относительно харак­ терных черт других людей, даж е когда мы не уверены, что можем вспом­ нить, к ак они в действительности вели себя. П ри таких обстоятельствах нам приходится основывать наш у атрибуцию на неопределенном поведенческом доказательстве. Н астоящ ее исследование посвящ ено изучению того, дей­ ствительно ли люди вклю чаю т этот источник неопределенности в их оцен­ ки других людей и к ак они это делаю т.... М одель Б а й е с а д л я в ы в о д о в и з за п о м н е н н о го п о в ед ен и я В настоящ ем исследовании испытуемые оценивали вероятности того, что некоторые субъекты обладают определенными признакам и, на основе соб­ ственной ненадежной выборки поведения субъектов. Чтобы проверить ги­ потезу, что эти субъективные вероятности будут несправедливо высокими и недостаточно чувствительными к надежности, их сравнили с оптималь­ ными вероятностями. Последние были получены из модели Байеса, кото­ рая бы ла разработана исследователями многоступенчатого вывода вероятности(см. P eterson, 1973). Н ачинаясь с одноступенчатого вывода от действи­ тельного поведения В. до характеристик личности А., теорема Байеса при­ нимает следующую привычную форму Р(А ; / В;) = Р(А)Р(В. / А ) / P(R ) (1) где (А / В;) - апостериорная вероятность А , учиты вая В^ Р(А;) - априорная вероятность А4, Р(В ) - полная вероятность Bj( P(Bj / А4) - условная вероят­ ность В., при условии А.. П оследняя вероятность представляет диагности­ ческое значение поведения, принимая во внимание характерны е признаки актора. А постериорная вероятность Р(А; / В}) может быть получена для к аж ­ *Данные впервые появились в The Journal of Personality and Social Psychology, 1978, 36, 93-106. Авторское право © 1978 принадлежит Американской психологической ассоциации. Перепечатано в соответствии с разрешением. 432 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА дого акта поведения, который может выбрать актор. Наблюдатели не зна­ ют, какой акт поведения был выбран в действительности. Они могут только вывести вероятности поведения из того, что они действительно помнят, В*. У читы вая это заклю чение, теорема Байеса принимает вид Р(В] / В*) = P(Bj)P(B* / В.) / Р(В*) (2) Где Р(В. / В*) - апостериорная вероятность действительного поведения В., учиты вая, что В* было вспомнено; Р(В.) - априорная вероятность В., Р(В*) полная вероятность того, что запомнили В*, учиты вая, что действительное поведение человека - В.. Р(В. / В*) отраж ает достоверность - чем выш е ве­ роятность того, что выбрано действительное поведение, тем выш е достовер­ ность. М одель Байеса двухступенчатого вывода сочетает значения P(AS/ В^, полученные для каждого действительного акта поведения через Уравнение 1, в оцененное среднее, с апостериорной вероятностью каж дого акта поведе­ н и я, P(Bj / В*), полученного из У равнения 2, служащ его как оценка. Таким образом, апостериорная вероятность характерного признака, учиты вая, что было выбрано определенное поведение P(Bj / В*), может быть сформулиро­ вано: P ß i / B * ) = ^ lP ( A i / B j) P ( ß jl В*) (3) j У равнение 3 вы раж ает количественно нормативные соображения, которые были обсуждены ранее. Так к ак P(At / В.) является возрастающ ей ф ункци­ ей Р(В. / А.) (диагностичность) и Р(В. / В*) является возрастающ ей ф ункци­ ей Р(В* / В ) (достоверность), P(Aj / В*) долж на возрастать, к ак с достовер­ ностью, так и с диагностичностью , и эффект одной переменной долж ен за­ висеть от уровня другой. Рассмотренное в терминах теории информацион­ ной интеграции А ндерсена (1974), каж дое выбранное поведение имеет оп­ ределенный вес в оценивании вероятностей признаков. В свою очередь, вес рассматривается к ак мультипликативная ф ункция диагностичности пове­ дения и достоверности выборки. П равило интеграции, приписанное Урав­ нением 3, мож ет быть применено к ак к одноступенчатому оптимальному выводу (т.е. значения P(A t / Bj) и Р(В; / В*), полученные из У равнения 1 и 2, соответственно), так и к субъективному одноступенчатому выводу (т.е. соб­ ственные оценки испытуемых Р(А; / В.) и P(Bj / В*)). В первом случае и од­ ноступенчатые выводы, и их интеграция являю тся оптимальными (т.е. Б ай ­ еса), а во втором случае оптимальна только интеграция. Настоящ ее иссле­ дование сравнивает наблюдаемые вероятности с двумя видами спрогнози­ рованны х вероятностей. Испытуемые делали выводы о зачислении студен­ тов в аспирантуру и о политических взглядах студентов. Первые выводы Заключения о личных характеристиках на основе... 433 были основаны на вспоминании оценок студентов, а вторые - н а вспомина­ нии поведения студентов. Э к сп ер и м ен т 1 М ет од Введение. Сначала испытуемым предложили оценки студентов на старш ем курсе. Позднее им приш лось вспоминать оценки и оценивать вероятность того, что каж ды й студент был зачислен в аспирантуру ш колы бизнес-уп­ равления. Эта задача подразумевает 2 логических ш ага: (а) от вспомненной оценки (G*) к реальной оценке студента (G); (Ь) от реальной оценки к тому, был ли студент зачислен или нет в аспирантуру (А). Неопределенностью последнего ш ага управляли посредством изменения диагностического зна­ чения оценок, принимая во внимание зачисление в ш колу бизнес-управле­ ния. Оценки низкой диагностичности были выпускными оценками по пред­ мету «Введение в антропологию », а оценки высокой диагностичности были выпускны ми оценками по предмету «Введение в экономику». Надежность воспоминаний управлялась за счет изменения числа студентов, чьи оценки необходимо было вспомнить. Процедура. Испытуемым сказали, что в определенный год было принято 50% претендентов на поступление в ш колу бизнес-управления. Таким об­ разом, априорная вероятность быть приняты м и не быть приняты м , Р(Ау) и Р(Ап) бы ла 0.50. Испытуемым сказали, что они будут оценивать вероятность зачисления для студентов, выбранных наугад. Им такж е сообщ или, что оценки будут основаны на том, были ли оценки студента в данном предмете ниж е 75 (Gj) или выш е 75 (Gh) по ш кале от 0 до 100. Манипуляции с диагностическим значением. Два распределения веро­ ятностей (каж дое представлено в виде столбчатой диаграммы) соотнесли оценки и зачисление. Одна диаграмма показы вала доли зачисленны х сту­ дентов, которы е получили Gj или Gh. Эти доли представляли условные ве­ роятности P(G j/A y) и P(Gh/A y). Д ругая диаграмма показы вала пропорцию не зачисленны х студентов, которые получили эти оценки, то есть P(G j/A n) и P(Gh/A n). Д иаграмма для оценок высокой диагностичности (курс по эко­ номике) показы вала следующие доли: P(G1/A n) = P(Gh/A y) = 0.85 и P(G1/A y) = P(Gh/A n) = 0.15. Диаграмма для оценок низкой диагностичности (курс по антропологии) показы вала следующие доли: P(G1/A n) = P(Gh/A y) = 0.55 и P(G j/A y) = P(Gh/A n) = 0.45. Каждый испытуемый оценивал две выборки сту­ дентов, для одной были предложены оценки высокой диагностичности, а для другой — оценки низкой диагностичности. П орядок представления был сбалансирован среди испытуемых. Манипуляции с достоверностью. Обширное предварительное испытание показало, что определенный уровень достоверности может быть получен, 434 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА за счет изменения количества студентов, чьи оценки необходимо вспомнить. Испытуемым сообщили, что половина выборки получила низкие оценки, а другая половина - высокие, и что им предложат список студентов, полу­ чивш их высокие оценки. Д ля того чтобы сделать минимальным различие между пунктами этого списка стимула, студенты были обозначены двузнач­ ными числами. Ч исла произносились магнитофоном со скоростью одно чис­ ло в секунду. Высокий тон означал конец каж дого списка стимула. Двумя секундами позж е список испы тания представлялся с помощью магнитофо­ на. Список испы тания состоял из 8 двузначных чисел, 4 из которых встре­ чались в списке стимулов (т.е. числа Gh) и 4 не встречались в списке (т.е. числа Gj). Четы ре числа Gh в списке испы тания были взяты из полного ряда серийны х позиций в списке стимула. П орядок чисел Gt и Gh был случайно определен для каж дого списка испы тания. К аждые 10 секунд проходило одно испытание. В промеж утках испытуемым было необходимо указать, является ли оценка студента G1или Gh и оценить вероятность того, что сту­ дент был зачислен в аспирантуру Р(А у / G*), и вероятность, что он не был зачислен P(An / G*). Предварительное испытание показало, что 10-секунд­ ного промеж утка вполне достаточно, чтобы сделать оценки. И спользовались три вида списков: из 4, 7 и 14 пунктов. Данные, полу­ ченные из предварительного испы тания, показываю т что процент правиль­ ны х опознаваний варьировался от 60% в длинном списке (условие низкой достоверности), 75% в среднем списке (условие средней достоверности) до 90% в коротком списке (условие высокой надежности). Каждый испытуе­ мый отвечал на список высокой и низкой диагностичности. Наборы чисел е этих списках были уравновешены с диагносточностью. Двадцать испытуе­ мых были распределены к каж дому из трех условий надежности. Условие полной достоверности. В этом условии одноступенчатого вывода группа из 46 испытуемых оценивала вероятность зачисления, исходя из оценок, которые были точно известны, Р(А у /G ) и P(An /G ). Испытуемым предлож или буклет с диаграммами (т.е. информацию диагностичности) и оценки студентов. После ознакомления с оценками студентов, испытуемые отмечали оценки вероятности. Каждый испытуемый оценивал студентов с оценками низкой и высокой диагностичности. Д ля половины испытуемых оценки были низким и, а для другой половины - высокими. Испытуемые. Всего в эксперименте принимало участие 106 человек (42 м уж чины и 64 ж енщ ины ), проходивш их вводный курс по психологии в Еврейском университете в Иерусалиме. Участие в эксперименте было час­ тичны м выполнением требований курса. Р езульт ат ы и обсуждение Доли верно опознанны х низких оценок, P(G*j / G j), и вы соких оценок, P(G*h/ Gh), служ или мерами достоверности каждого испытуемого. Средние Заключения о личных характеристиках на основе... 435 величины P(G*, / G,) и P(G*h / Gh) показали ближайш ий случайный уро­ вень вы полнения в условиях низкой достоверности (список из 14 пунктов) (М = 0.54 и 0.60 соответственно), хорошее выполнение в условиях высокой достоверности (список из 4 пунктов) (М = 0.93 и 0.89, соответственно), и сред­ нее вы полнение в условиях средней достоверности (список из 7 пунктов) (М = 0.73 и 0.77, соответственно). А нализ изменения (Достоверность х Диагностичность) этих долей вы явил высоко значимые эффекты достовернос­ ти, F(2,57) = 37.06, р < 0.001, и F(2,57) = 20.17, р < 0.001 на P(G* / G,) и P(G*h / Gh), соответственно. Другие источники изменений не были значи­ мы. Данные, полученные из условия полной достоверности, ясно показы ва­ ют эффект влияния манипуляции с диагностичностью на одноступенчатый вывод и з оценок, которы е точно известны , до вероятности зачисления, P(A /G ). Испытуемые вывели более высокие P(An/G ,) и P(Ay/G h) из оценок высокой диагностичности (М = 0.81 и 0.78, соответственно), чем из оценок низкой диагностичности (М = 0.57 и 0.55, соответственно), различие было значимы м, как для P(An/G 1), так и для P(Ay/G h), t(22) = 8.08, р < 0.001 и t(22) = 8.59, р < 0.001, соответственно. Теперь обратимся к оптимальной апостериорной вероятности зачисления, учиты вая вспомненную оценку, P(A/G*). Эти вероятности были определе­ ны для каж дого испытуемого, объединив вероятности действительных оце­ нок, учиты вая вспомненные оценки, P(G/G*) и вероятность зачисления, учиты вая действительные оценки, P(A /G ), в соответствии с Уравнением 3. Значения P(G/G*) были подсчитаны для каж дого испытуемого с помощью Уравнения 2 из собственной достоверности при вспоминании оценок P(G*/G). Значения P(A /G ) были средними значениями оценок, полученных в усло­ виях полной достоверности. Таким образом, оптимальная апостериорная вероятность зачисления, учиты вая вспомненные оценки, P(A /G *), основы­ валась на субъективном одноступенчатом выводе от действительных оце­ нок до вероятности зачисления, и на оптимальном одноступенчатом выводе (Уравнение 2) от вспомненных оценок к действительным оценкам. П унк­ тирны е линии в левой части Рисунке 1 представляю т средние значения P(An/G *1), оптимальную вероятность того, что студент не был зачислен, учи­ ты вая, что его оценка была вспомнена к ак низкая; пунктирные линии в пра­ вой части Рисунке 1 представляю т средние значения P(Ay/G *h), оптималь­ ную вероятность того, что студент зачислен, учиты вая, что его оценка была вспомнена к ак вы сокая.1Ясно, что согласно модели Байеса, эти вероятнос­ ти возрастут вместе с достоверностью и диагностичностью, и что эффект до­ стоверности будет виден при высокой диагностичности, а не при низкой. 1 Другой набор оптимальных значений P(A/G*) был подсчитан, исходя из оптимальных значений P(A/G), полученных из Уравнения 1. Эти вероятности не рассматриваются от­ дельно, так как они были близки к оптимальным значениям P(A/G*), полученным из субъек­ тивных оценок P(A/G). Высокая степень Рис. 1. Наблюдаемая и оптимальная вероятности (P fA /G ,*) и P(Ay/G, *)) к ак ф ункция до­ стоверности и диагностичности (Эксперимент 1) Низкая степень 436 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА Заключения о личных характеристиках на основе... 437 Два наблюдаемых значения были определены для каждого испытуемо­ го: первое - среднее значение P(An/G *j), которое он оценил для студентов, которые, к ак он помнит, имели высокие оценки. Сплошные линии на Ри­ сунке 1 показываю т, что эта вероятность отличается к ак качественно, так и количественно от оптимальной вероятности. Диагностическое значение дей­ ствительной оценки является единственным фактором, который имел по­ стоянное влияние на наблюдаемые P(An/G 1*) и P(Ay/G h*), F (l,5 7 ) = 96.97, pcO.OOl h F(1,57) = 114,82, p < 0.001, соответственно. Чем выш е диагности­ ческое значение действительных оценок, принимая во внимание зачисле­ ние, тем более крайними являю тся апостериорные вероятности. Достовер­ ность, с которой были узнаны действительные оценки, имела очень малень­ кое и непоследовательное влияние на выводы (F < 1). Д аж е выводы на двух крайних уровнях достоверности в пределах каж дого уровня диагностичности значительно не отличались. Другими словами, выводы не были менее крайним и, когда степень правильны х узнаваний была близка к случайно­ му уровню, а не когда она была почти совершенной. Выводы испытуемых такж е не показы вали взаимодействия Диагностичность - Достоверность, спрогнозированную моделью Байеса. Влияние диагностичности действи­ тельных оценок не уменьш алось с уменьшением достоверности. Согласо­ ванное влияние этих переменных было проверено на уровне выводов о сту­ дентах. Нормативно, изменение в уверенности в оценках различны х сту­ дентов должно повлиять в большей степени на выводы об их зачислении, когда оценки обладают высоким диагностическим значением, чем когда их диагностическое значение - низкое. Следовательно, выводы о студентах, внесенных в список высокой диагностичности, должны больше различать­ ся, чем выводы о студентах, внесенных в список низкой диагностичности. Изменение P(A/G*) для 8 студентов в пределах каж дого из двух списков, было подсчитано для каж дого испытуемого. В отличие от модели Байеса, эти изменения значимо не различались, t(59) = 1.63. Рисунке 1 такж е показы вает, что наблюдаемые вероятности были более крайним и, чем оптимальные вероятности. Среднее различие между наблю­ даемы ми и оптимальны ми вероятностями было сущ ественным к ак для PCAyGj*), так и для P(Ay/G * ,), F (l,5 7 ) = 33.38, р < 0.001, и F (l,5 7 ) = 84.67, р<0.001, соответственно. Д ля испытуемых были подсчитаны коэффициен­ ты корреляции между оптимальными и наблюдаемыми вероятностями в пределах каж дого из 6 условий. Корреляции были незначительными и не­ последовательными, 5 корреляций были положительными и 7 — отрица­ тельными. Две корреляции были значимыми, но отрицательными (г= - 0.50, р < 0.05 и г = -0 .5 5 , р < 0.01 для P(A n/G 1*) и P(Ay/G h*), соответственно, в условиях низкой и высокой диагностичности). Эти результаты показываю т, что испытуемые не смогли учесть сообра­ ж ения достоверности в своих выводах вероятности. Испытуемые основы­ вали свои выводы только на диагностическом значении действительных оценок. Вероятности, выведенные в экспериментальны х условиях, были 438 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА несколько ниж е, чем вероятности, выведенные в условии полной достовер­ ности, показы вая, что испытуемые не полностью усвоили стратегию “к ак будто” (т.е. делать выводы, как будто действительные оценки были точно известны). Однако уменьш ение уверенности было маленьким и постоянно не изменялось с изменением достоверности. К ак результат, в сравнении с вероятностями Байеса, выводы испытуемых были крайними. Заметим, что это было не так при одноступенчатом выводе от действительных оценок до зачисления, P(A/G). Вероятности, выведенные при условии полной достовер­ ности, были близки к оптимальным вероятностям, выведенным из модели одноступенчатого вывода Байеса (Уравнение 1). Этот результат предполага­ ет, что неоптимальность (или самонадеянность) в условии двухступенчатого вывода, появилась благодаря введению дополнительного источника неопре­ деленности - несовершенному вспоминанию действительных оценок... Э к сп ер и м ен т 4 М ет од В этом эксперименте испытуемые оценивали вероятности того, что студен­ ты муж ского пола выступают за (Ар) или против (Ап) возвращ ения Западно­ го берега (территории, занятой И зраилем в войне 1967года) арабам. Голосо­ вание за лейбористскую партию (относительно миролюбивую партию) или за партию Л икуд (Likud) (достаточно воинственную партию) служило как инф ормация низкой диагностичности. П редварительный эксперимент по­ казал , что короткие волосы и голосование за партию Л икуд (Вп) подразуме­ вало отрицательное отношение к возвращ ению Западного берега, а длин­ ные волосы и голосование за лейбористов (Вр) являлось показателем поло­ ж ительного отнош ения. П редварительный эксперимент такж е показал, что голосование студентов является более показательны м, чем длина волос. Задача на вспоминание и другие аспекты проекта и процедуры были таки­ ми, как и в Эксперименте 1. 20 испытуемых были распределены по каждому из трех условий достоверности. Дополнительная группа, состоящая из 57 испытуемых, была распределена по условию полной достоверности. При этом условии испытуемые точно знали длину волос студентов или партию, за которую они голосовали. Каждый испы­ туемый оценивал вероятности отношения, исходя из ношения коротких во­ лос, длинных волос, голосования за лейбористов и голосования за партию Ли­ куд. В общей сложности в эксперименте 4 приняло участие 117 испытуемых (51 мужчина и б б женщ ин), которые проходили вводный курс по психологии в Еврейском университете в Иерусалиме. ти и диагностичности (Эксперимент 4) Наблюдаемая низкая диагностичность Наблюдаемая высокая диагностичность Оптимальная низкая диагностичность Заключения о личных характеристиках на основе 439 440 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА Р езульт ат ы и обсуждение М анипуляция с достоверностью имела сильное влияние на степень верных узнаваний к ак Вп(т.е. короткие волосы или голосование за партию Л икуд), та к и В р(т.е. длинные волосы и голосование за лейбористов), F(2,57) = 55.45, р < 0.001 и F(2,57) = 22.04, р < 0.001, соответственно. Средние значения Р(Вр*/В р) б ы л и 0 .6 1 ,0 .8 2 и 0 .9 1 . Эффект диагностичности и его взаимодей­ ствие с достоверностью были незначимыми. К ак и ожидалось, значения Р(А /В ), выведенные испытуемыми в услови­ ях полной достоверности показываю т, что субъективное диагностическое значение голосования было больш им, чем длина волос. Таким образом, ве­ роятности отнош ений Р(Ап/В п), выведенных из того ф акта, что студенты, голосовавш ие за партию Л икуд, (М = 0.78) были более крайними, чем те, которые были выведены из того ф акта, что студенты носили короткие воло­ сы (М = 0.52), t(56) = 13.61, р < 0.001. Подобным образом, вероятность от­ нош ения Р(А /В р), выведенная из ф акта, что студенты голосовали за лейбо­ ристов (М = & 75) была более крайней, чем те, которые были выведены из ф акта, что студенты носили длинные волосы (V= 0.53), t(56) = 9.89, р < 0.001. Оптимальные и наблюдаемые вероятности показаны на рис.2. Первые были получены от каждого испытуемого через Уравнение 3 от значений Р(В/В*) (рассчитанные через Уравнение 1 от достоверности испытуемого в опреде­ лении поведения студентов, Р(В*/В)) и из средних значений Р(А /В ), полу­ ченны х в условиях полной достоверности. Можно видеть, что только диагностичность поведения учитывалась и обеспечивала выводы вероятностей отношения F(1,57) = 68.94, р < 0.001, и F(1,57)= 90.40, р < 0.001 для Р(Ап/В п*) и Р(Ар/В р*), соответственно.2 При наруш ении модели Байеса основное вли­ яние достоверности и её взаимодействие с диагностичностью были незначи­ мы. Кроме того изменения наблюдаемых вероятностей в пределах списков высокой диагностичности были не больше, чем изменения в пределах спис­ ков низкой диагностичности, t(59) =0.59. К ак и в предыдущ их эксперимен­ тах, наблюдаемые вероятности были более крайними, чем оптимальные ве­ роятности F (l,5 7 ) = 5.68, р < 0.05 и F (l,5 7 ) = 27.63, р < 0.001 для Р(Ап/В п*) и Р(Ар/Вр*), соответственно. Н аконец, из двенадцати корреляций для ис­ пы туемых при условиях между наблюдаемыми и оптимальными вероятно­ стям и восемь были положительными, но только две были значимыми: г = 0.436, р < 0.05 для Р(Ап/В п*) при условии высокой диагностичности и высо­ 2 Необходимо отметить, что эти результаты не могут быть приписаны к тому факту, что диагностичностью управляли как внутригрупповой переменной, а достоверностью как меж­ групповой переменной. Был проведен дисперсионный анализ по выводам первого списка студентов, чьё поведение обладало низким диагностическим значением для половины ис­ пытуемых в каждом условии достоверности и высоким диагностическим значением для другой половины. В этом анализе диагностичность рассматривалась как межгрупповой фактор. Эти анализы показали значимое влияние диагностичности и незначимое влияние достоверности и обоих факторов вместе (диагностичность х достоверность). Дисперсионный анализ данных предыдущих трёх экспериментов показал похожие результаты. Заключения о личных характеристиках на основе... 441 кой достоверности и г = 0.402, р < 0.05 для Р(Ар/В р*) при условии низкой диагностичности и высокой достоверности. Эксперимент 4 обеспечивает дополнительную поддержку для обобщения наш их выводов. Он показы вает, что смещ ения, наблюдаемые в предыду­ щ их экспериментах, такж е влияю т на выводы о характеристиках личнос­ ти за счет вспомненного поведения. Диагностичность действительного по­ ведения субъектов являлась единственным фактором, определяющ им вы ­ воды даж е когда диагностичность долж на основываться на собственных убеж дениях испытуемых без получения свидетельства извне. О бщ ее об суж д ен и е Выводы, которые наш и испытуемые сделали исходя из собственных нена­ дёж ны х воспоминаний, систематически наруш али нормативные правила вывода вероятности. Испытуемые были склонны полагаться на диагностич­ ность информации, не принимая во внимание достоверность, не смотря на тот ф акт, что они знали о недостоверности своих воспоминаний. Действительно, сравнения между выводами, исходя из верно вспомнен­ ной информации (например, выводы исходя из оценок, которые были вспом­ нены к ак низкие и которые действительно были низкими) и выводы, исхо­ дя из неверно вспомненной информации (например, выводы исходя из оце­ нок, которые были вспомнены к ак низкие, но которые в действительности были высокими), показали незначительные различия во всех четырёх экс­ периментах. То есть последние выводы вероятности были не менее крайни­ ми, чем первые. Эти результаты соответствуют точки зрения, что люди склонны уменьш ать сложность задач, используя простые правила эвристи­ ки . Недооценивание информации достоверности может отраж ать исполь­ зование одной такой эвристики суж дения — эвристики репрезентативнос­ ти (K ahnem an & Tversky, 1973, 4). Например, вспоминая партию , за кото­ рую голосовал субъект, испытуемые оценивали вероятность того, что он является сторонником возвращ ения западного берега арабам, по степени, в которой голосование за такую партию репрезентативно стереотипу субъек­ та, поддерживающ его подобное мнение. Субъект, голосующий за милитаристскую партию, олицетворяет больше черт этого стереотипа, чем субъект, который носит длинные волосы. (И в пер­ вых трёх экспериментах вы сокая оценка по экономике является более репре­ зентативной для студентов, зачисленных в ш колу управления бизнесом, чем вы сокая оценка по антропологии.) Положительное отношение к возвраще­ нию территории было выведено с большей уверенностью в первом случае. Точность воспоминания не влияла на эти вероятности, потому что она не зат­ рагивала оцененную репрезентативность вспомненного поведения. П ринимая это во внимание, достоверность доклада сравнима с соображе­ ниям и размера выборки и базовыми значениями. Размер выборки, на кото­ рой основывается свидетельство и базовое значение выведенного отноше­ 442 МНОГОСТУПЕНЧАТАЯ ОЦЕНКА н и я не влияю т на подобие меж ду свидетельством и признаком . П онятие репрезентативности предполагает, и исследование показало, что люди не об­ ращают внимания на эти соображения, делая выводы (N isbett & Borgida, 1975, Tversky & K ahnem an, 1974,1). На основании этого можно ожидать, что дос­ товерность будет приниматься во внимание в тех случаях, когда она влияет на репрезентативность доклада. Таким образом, неверное воспоминание ре­ альны х поведенческих особенностей (благодаря таким факторам, как проме­ ж уток времени, с которого особенность была зарегистрирована), которые де­ тализированы больше, чем простые бинарные события, включённые в насто­ ящ ее исследование, вероятно, будет влиять на ясность, полноту и яркость вспоминаемой информации. Т акая неясная информация может быть менее репрезентативна рассматриваемому признаку, и соответственно, производит более регрессивные и более умеренные оценки вероятности... З а к л ю ч ен и я о ли чн ы х хар а к тер и сти к ах на осн о в е... 443 Часть VIII Коррективные процедуры 28. Устойчивая привлекательность ошибочных линейных моделей при принятии решений* Р оби н М . Д а у э с К нига П оля М ила (Paul Meehl) Клиническое прогнозирование в сравнении со статистическим: теоретический анализ и обзор доказательств (Clinical V ersus S tatistical P rediction: a T heoretical A nalyses and a review of the Evidence) появилась 25 лет назад. В ней рассматриваю тся доказатель­ ства того, что числовые критериальны е переменные психологической на­ правленности (например, рейтинги способностей аспирантов, которые по­ лучили докторскую степень) от числовых предсказываю щ их переменных (например, оценки на выпускном экзамене, уровень средних оценок, рей­ тинг рекомендательных писем) лучш е осущ ествляю тся посредством верных линейны х моделей, чем клинической интуицией людей, имеющ их опыт в таких предсказаниях. Основная идея зтой статьи — это рассмотреть дока­ зательства того, что даж е лож ные линейны е модели могут превосходить клинические предсказания. Верная линейная модель - это та, в которой веса, приписанные предска­ зываю щ им переменным, выбраны таким образом, чтобы оптимизировать отнош ение меж ду предсказанием и критерием. Простой регрессионный анализ - это наиболее обычный пример верной линейной модели; предска­ зывающие переменные взвеш иваю тся таким образом, чтобы максимизиро­ вать корреляцию между результатом по формуле и действительным значе­ нием критерия. Дискриминантный анализ - это другой пример верной ли ­ нейной модели, веса приписываются предсказывающ им переменным таким образом, чтобы результирующие линейные формулы максимизировали раз­ личия меж ду двумя или более группами. Регрессионный анализ гребня (D arlington, 1978, M arquardt & Snee, 1975), другой пример, попытки при­ писать веса таким образом, что итоговые значения максимально коррели­ руют с реальны м позателем в новом наборе данных. Таким образом, существует множество типов верных линейных моделей, и они использую тся в различны х контекстах. Один пример (Dawes, 1971) рассматривает прогнозирование ф акультетских рейтингов аспирантов. Все *Этот раздел впервые появился в American Psychologist, 1978,34,571-582 Авторское право © 1979 принадлежит Американской психологической ассоциации. Перепечатано в соот­ ветствии с разрешением. 448 КОРРЕКТИВНЫЕ ПРОЦЕДУРЫ аспиранты отделения психологии У ниверситета ш тата Орегон, которые были приняты в период с осени 1964 по осень 1967 - и те, кто выбыл из про­ граммы по неакадемическим причинам (например, психическое заболева­ ние или вступление в брак) - были оценены весной 1969 года; сотрудники ф акультета оценили только тех студентов, в ком они были уверены. Исполь­ зовалась следую щ ая оценочная ш кала: 5 - выдаю щ ийся, 4 - выше средне­ го, 3 - средний, 2 - ниж е среднего, 1 - выбывш ий из программы по акаде­ мическим трудностям. Такие оценивания являю тся психологически инте­ ресными критериям и, потому что субъективные впечатления сотрудников ф акультета являю тся главными детерминантами работы (если он идет ра­ ботать), которую студент получает после окончания аспирантуры. В каче­ стве выборки выступили 111 студентов, количество сотрудников ф акульте­ та, оцениваю щ их каж дого из этих студентов, варьировалось от 1 до 20, со средним - 5.67 и медианой - 5. Оценки были надежными. (Чтобы опреде­ лить надеж ность, оценки были подвергнуты однофакторному дисперсион­ ному анализу, при котором каж ды й оцениваемый студент принимался за единицу анализа. Результирующ ее отношение межгрупповых дисперсий (п2) было 0.67, и находилось ниж е уровня значимости 0.001). Эти ф акуль­ тетские рейтинги прогнозировались по проверенной линейной модели, ос­ нованной на оценках вы пускны х экзаменов, средних оценок на старш их курсах и меры избирательности студентами образовательных курсов.12Под­ тверж денная перекрестными исследованиями множественная корреляция между факультетским рейтингом и предсказывающ ими переменными была 0.38. В соответствии с результатами М ила, корреляция последних ф акуль­ тетских рейтингов со средними оценками сотрудников приемной комиссии, которая отбирала студентов составила 0 ,192, то есть она объясняла одну7чет­ вертую общей дисперсии. Этот пример типичен для психологических ис­ следований в данной области: (а) корреляция с предсказаниям и модели вы ш е, чем корреляция с клиническим прогнозом, но (Ь) обе корреляции низкие. Подобные характеристики часто приводят психологов к следующей интерпретации вывода: в то время, к ак н изкая корреляция модели показы ­ вает, что линейное моделирование является несостоятельным к ак метод, низкие корреляции экспертов означаю т лиш ь то, что использовались пло­ хие эксперты . 1 Этот индекс основывался на оценке избирательности Cass & Birnbaum (1968), в их книге «Сравнительное руководство к американским колледжам» (Comparative Guide to American Colleges). Этим устным категориям избирательности приписали численные значения, в со­ ответствии со следующим правилом: наиболее избирательные - 6, сильно избирательные 5, очень избирательные(+) - 4, очень избирательные - 3, избирательные - 2, не упомянутые - 1. 2 К сожалению, только 23 из 111 студентов можно использовать в этом сравнении, потому что оценочная шкала, используемая комиссией, слегка изменялась от одного года к друго­ му. Устойчивая привлекательность ошибочных ... 449 Л ож н ая л и н ей н ая модель — эта та, в которой веса вы браны неким неоптимальным методом. Они могут быть выбраны с условием равенства, они могут быть выбраны, основываясь на интуиции человека, делающего прогноз, или они могут быть выбраны случайным образом. Тем не менее, ложные модели могут быть очень полезными. Когда, например, стандарти­ зированные оценки выпускных экзаменов, средние оценки на старш их кур­ сах и индексы избирательности в предыдущем примере были равно оцене­ ны, итоговый результат коррелировал к ак 0.48 с последним факультетским рейтингом. К орреляция была не только выш е, чем при клиническом оце­ нивании комиссии (0.19), но она такж е была выш е, чем полученная на ос­ нове значений, в