Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Институт развития образования Магистерская программа «Измерения в психологии и образовании» ДИПЛОМНАЯ РАБОТА (ВКР) на тему «Сравнительный анализ валидности психологических моделей личности в практике оценки персонала (Comparative analysis of the validity of psychological models of personality in the practice of personnel assessment)» Студент второго курса (группа 701): Алтухов Виталий Владиславович Научный руководитель: к.п.н., ст. преп. Орёл Екатерина Алексеевна 2014 год 1 ВВЕДЕНИЕ Проблематика исследования. В практике оценки персонала используется достаточно большое количество различных инструментов оценки личности (личностных конструктов, качеств, типов и т.п.), большинство из которых базируется на какой-то своей определенной модели (теории) личности и ее организации. Само по себе сравнение критериальной (конкурентной валидности) инструментов является важной задачей для определения степени границ точности и прогностической возможности данных методов для оценки. Однако в данном исследовании мы предполагаем сосредоточится на решении теоретически более концептуальной задачи сравнении валидности самих моделей личности в решении практических задач. Практическая значимость любой теории (модели) заключается не только в ее способности описать окружающую действительность (в данном случае, действительность личности) и обладать качеством содержательной валидности, но и давать достаточно точные и полезные прогнозы, иными словами - иметь прогностическую ценность как способность прогнозировать, или в минимальном случае, быть связанной с успешностью человека в работе. Таким образом, в исследовании мы ставим задачу исследование прогностической ценности моделей в практике оценки персонала и тех факторов, от которых эта ценность может зависеть. Цель исследования: Изучение конкурентной (критериальной) валидности применяемых в практике оценки персонала моделей личности. Предмет исследования: Валидность моделей личности в практике оценки. Объект исследования: Модели личности, разработанные разными авторами в рамках разных подходов. 2 В соответствии с поставленной целью можно выделить следующие задачи исследования: Теоретические задачи: обзор и анализ моделей личности; классификация инструментов оценки личности по моделям и подходам; определение ключевых понятий исследования. Методические задачи: операционализация понятий валидности моделей в практике оценки; определение критериев включения имеющихся данных в мета-анализ. Эмпирические задачи работа с литературой (сбор данных по валидности); мета-аналитическое сравнение мощности моделей (величины эффекта валидности относительно эффективности выполнения работы); выделение наиболее валидных моделей и определение факторов, влияющих на валидность; описание полученных результатов. 3 ТЕОРЕТИЧЕСКАЯ ЧАСТЬ: Модели личности и их применение в практике оценки персонала Содержание. 1. Обзор проблематики моделей (теорий) личности и их диагностики 2. Модели личностных черт и соответствующие им инструменты (методики) 3. Обзор проблематики оценки персонала и успешности выполнения работы, прогностичности инструментов оценки 4. Существующие аналитические обзоры по валидности моделей и инструментов 5. Мета-анализ: технология проведения Обзор проблематики моделей (теорий) личности Изучение проблематики личности и дифференциальных различий между людьми началось задолго до возникновения психологии как науки. Множество мыслителей древности задавались этими вопросами, и создавали свои теории относительно таких понятий, как личность, характер, темперамент, а порой и формировали сами эти понятия. Так, философ Теофраст в трактате «Характеры» выделил около 30 характеров, которые могут быть присущи людям. Он же сформулировал один из базовых вопросов дифференциальной психологии - «почему люди, живущие в одной местности и в схожих условиях, так сильно отличаются между собой?». Известнейшие произведения поэтов и сказателей Древней Греции, которые принято объединять в «Мифы Древней Греции», также сами по себе содержат описания ряда характеров или личностных типов (например. греческие боги), на основании которых современные исследователи продолжают изучать и описывать тенденции, характерные для ныне живущих людей (например, теория архетипов в аналитической психологии). Другой известный ученый, Гиппократ, и в последствии его продолжатель Гален, создали теорию темпераментов, в которой не просто пытались классифицировать людей на типы, но и показать причины, по которым эти темпераменты могут возникать (с отсылкой к биологическим факторам). 4 На рубеже 19-20 века, с формирование психологии как науки, множество исследователей начинают заниматься проблемой личности с опорой на научные методы познания, и возникают разнообразные теории и модели личности, ее структурной организации и развития. Во многом каждая модель и теория зависит от той школы, в рамках которой она создавалась, и является следствием более широкого понимания психики, которая была характерна для той или иной парадигмы. При этом, ставился еще один концептуальный вопрос, который мог повлиять на весь ход изучения этого понятия - «а возможно ли в принципе изучать индивидуальные различия»? В общем виде это был и остается спор между представителями идеографического подхода (Г. Олпорт) и номотетическго подхода (Р. Кеттел, Г. Айзенг). В конечном счете, не смотря на сильные аргументы со стороны первого подхода, были разработаны и сформулированы (а затем эмпирически изучены) ряд моделей, которые позволили стандартизировать и выделить закономерности между людьми, которые с одной стороны, отличали их как индивидов друг от друга, но при этом были общими для ряда индивидов. В рамках этого подхода было сформулировано ряд теорий и моделей личности, а также инструментов, позволяющих проводить их диагностику и оценку, которые затем стали применяться для решения практических задач, в том числе для оценки эффективности профессиональной деятельности и предсказания этой эффективности. Данные модели и являются основным объектом анализа в рамках нашей работы. Что касается определения самого понятия «личности», то тут существует множество трактовок. Личность может пониматься как «совокупность общественных отношений, реализующихся в многообразных деятельностях» (А.Н. Леонтьев), «субъект общественного поведения и коммуникации» (Б.Г. Ананьев), «носитель сознания» (К.К. Платонов) и т.п. данные определения характеризуют личность как составную часть и даже производную общественных отношений. Тем не менее, если описывать структуру личности, то туда неизменно будут входить разные уровни организации психики человека, начиная от темпераментальных характеристик, характера, чет и индивидуальных особенностей, мотивации, ряда когнитивных способностей, ценностей и Я-концепции, и заканчивая сознанием, социальными ролями и экзистенциальными сущностями. Таким образом, понятие личности является достаточно интегральным конструктом, что не могло не отразиться на тех теориях, которые стремились его описать. 5 Классификация теорий (концепций) личности может иметь множество разных оснований, в зависимости от истории возникновения, научной школы, динамических или структурных подходов и т.п. Так, выделяют следующие концепции: психодинамическая концепция (Фрейд), аналитическая психология (Юнг), психосоциальная теория (Эриксон), теория черт личности (Олпорт, Кеттел), типы личности (Айзенг), бихевиористическая теория (Скиннер), социальное научение (Роттер), когнитивная теория (Келли), гуманистическая теория (Маслоу), феноменологическая теория (Роджер) и т.п. (Хьелл и Зиглер, 1997). В каждой теории личность рассматривается и операционализируется совершенно по-разному, где то выступая в качестве более общего и теоретического конструкта (что характерно для работ Фрейда и Юнга), где-то как фактор когнитивной деятельности (Келли), где-то как промежуточное звено между потребностью и поведением, а где-то как самостоятельная структура, имеющая свою организацию и черты, существующие независимо от конкретного индивида, но при этом проявляющиеся в каждом из нам и определяющие поведение, мысли и ценности. В данном случае такой подход последовательно воплощался в теориях личностных черт, в рамках которой возникло ряд моделей личности, которые мы и собираемся рассматривать в своем исследовании (Дружинин, 2003). Большинство из этих подходов опирались на набирающие популярность в психологии методы статистического анализа данных и психометрику, в рамках которой исследователи старались использовать естественнонаучные методы для описания психологических феноменов. Данные методы позволяли проводить измерения и давать возможность статистически проверять наличие тех или иных психологических закономерностей, которые описывались в рамах теоретических предположений. При этом, само развитие этих методов происходило не независимо, а зачастую в ответ на запросы конкретных исследовательских задач, что определяло и специфику движения научного познания в камках данной проблематики. Основные модели личностных черт Теории личностных черт и типов завоевали достаточно серьезные позиции в практике оценки персонала за счет своей структурированности, проработанности практических аспектов, наличия мощной диагностической и эмпирически верифицируемой базы. Немаловажным обстоятельством стал и тот факт, что в данных моделях позиционировалась одна очень простая, но прогностическая причинная связь между определенными чертами 6 (или их сочетаниями) и желаемым профессиональным поведением. Тем не менее, можно выделить ряд достаточно разных подходов и моделей, которые были созданы в рамках этой теории и ее принципов. Каждый подход основан на своей логике поиска универсальных факторов – в какой то парадигме исследователи шли от эмпирических данных, создавая модели на основе статистических процедур (например, факторного анализа), в других парадигмах они могли идти от теории и пытаться воссоздать ее модель на практике. Таблица 1. Подходы и принципы создания моделей личности. Подходы Принципы построение моделей личности Лексикографический Эмпирический Диспозициональный Теоретико-эмпирический Лексикографический и диспозициональный Эмпирический Типологический Теоритический Клинический Теоретико-эмпирический Професссиональный Теоретико-эмпирический Лексикографический (психографический) подход Одной из первых моделей, в последствии ставшей достаточно популярной в научной и практической деятельности, стала 16-факторная модель (16 PF), предложенная Р. Кеттелом. Исходный набор личностных черт был получен путем анализа слов английского языка, что стало воплощением идеи Ф. Гальтона о том, что наиболее значимые различия между людьми закреплены в структуре натурального языка. В своей работе Кеттел опирался на список из 4500 слов, составленный Олпортом и Одбертом (Allport & Odbert, 1936), в последствии сократив его до 171 слова. Помимо этого, он предложил разделить исходные данные на три основных типа: L - данные (real-life ratings), Q - данные (questionnaire data) T данные (objective test data). Первый типа базировался на наблюдении экспертов, второй - на данных опросников, третий - на измерении объективных данных об испытуемых. В результате факторизации L и Q - данных им было выделено 16 факторов первого порядка, которые легли в основу модели 16 PF. В дальнейшем были выделены факторы второго порядка (8 факторов), и факторы третьего порядка (5 факторов), которые выделялись в результате следующих факторизаций данных. 7 В дальнейшем множество исследований было посвящено попыткам воспроизведения результатов Кеттела, но не во всех их них удавалось подвердить первичную 16-факторную модель. Ряд исследований показывали схожие результаты (Krug, Jones, 1986), ряд могли получать во многом не совпадающие результаты, например, получать 12 факторов (Matthews, 1989). Таким образом, на разных выборках могла показываться разная степень воспроизводимости модели первичных факторов, хотя модель второго и третьего порядка могли быть более устойчивыми. Диспозициональный подход Данный подход во многом ориентирован на изучение биологических предикторов и оснований личностных черт и различий, и в основном строится на изучении темпераментальных черт, которые, тем не менее, могут обуславливать и социальное поведение (Русалов, 2003). Одной из самых известный моделей личности, появившейся в рамках данного подхода, является EPI (трехфакторная модель Г. Айзенга и М. Айзенга). В ней личность рассматривается как структура, в рамках которой функционируют три этих базовых свойства темперамента и когнитивный фактор (Eysenck & Eysenck, 1985). Во многом эта модель перекликается с теориями темперамента, которые появились еще в допсихологический период, затрагивает учение Павлова и типах нервной системы. Помимо проработки структурного содержания модели Г. Айзенг во многом стал методологом большого количества исследований в области психологии личности и выдвинул критерии, которые, с одной стороны, могли отличать научные теории от чисто теоретических, с другой стороны, обозначали требования, которым должна удовлетворять действительно комплексная модель личности (Eysenck, 1991). Также, помимо моделей Айзенга в рамках данного подхода можно выделить модель Цуккермана, которая основана на пяти основных факторах личности (Zuckerman, 1990). Лексикографический и диспозициональный подход Направления исследований, которые были заложены Кеттелом и Айзенгом, в дальшейшем привели к поиску новых факторных моделей, которые могли бы описать специфику и разнообразие личностных черт, с одной стороны, с другой стороны, были бы достаточно стабильны и воспроизводимы в исследованиях. Данная модель была получена в ряде 8 исследований, выполненных в 1960-е годы (Borgatta, 1964; Norman, 1963; Tupes & Christal, 1961), и получила название BigFive. Впервые названия для пяти факторов были даны Норманом (1963), и звучали как экстраверсия, доброжелательность, добросовестность, эмоциональная стабильность и культура (или открытость новому опыту (Costa & McCrae, 1992). Само название же модели было дано Голдбергом (Goldberg, 1981). С 1960 по 1980 пальма первенства, тем не менее, принадлежала моделям Айзенка и Кэттела. Так, если в середине 1980-х индекс цитирования BigFive уступал совокупному индексу цитирования моделей Айзенка и Кэттела более чем в 100 раз, то к середине 1990-х две группы моделей сравнялись по частоте цитирования, а к 2009 году уже частота цитирования Большой Пятерки превзошла использование моделей Айзенка и Кэттела вместе взятых более чем в 50 раз (John et al., 2008). Данная модель, как и 16PF, основана на изучении списков прилагательных, но при этом аппелирует к допущению в том, что ее факторы являются образованием надкультурным, в сущности, не зависимым от языка. Однако вероятность существования специфических, культурно обусловленных, факторов весьма велика. Большим преимуществом модели является ее глубокая эмпирическая проработка. В течение 1990-х годов был проведен целый ряд «региональных» исследований Большой Пятерки. Модель получила свою эмпирическую поддержку на китайской (Yang & Bond, 1990), чешской (Hrebickova & Ostendorf, 1995), греческой (Saucier, Georgiades, Tsouasis, & Goldberg, 2005), израильской (Almagor et al., 1995), венгерской (Szirmak & De Raad, 1994), польской (Szarota, 1995), испанской (Benet-Martinez & Waller, 1997), филиппинской (напр., Church & Katigbak, 1989; Church et al., 1997), турецкой (Somer & Goldberg, 1999) выборках. Была получена эмпирическая верификация Большой Пятерки и в России (Shmelyov & Pokhil’ko, 1993). В целом, результаты этих исследований показывают, что во многих языках получаются структуры, похожие на Большую Пятерку, хотя иногда образуются 2 «местных» фактора, согласующихся с одним из традиционных факторов. Больше всего проблем возникает с 5 фактором, который варьируется от чистого интеллекта (на немецких выборках) до неконвенциональности и непокорности в голландских и итальянских группах. Существует ряд диагностических инструментов, которые используется при измерении факторов BigFive. Среди них можно выделить вопросник NEO-PI-R (Costa& McCrae, 1992), полная версия которого содержит 240 пунктов, BFI (Big Five Inventory; John,Danahue, & Kentle, 1991) и т.д. 9 Типологический подход В рамках данного подхода личность рассматривается не как совокупность некоторого количества факторов, имеющих распределение признака в рамках одной переменной, а как дискретные типы, имеющие бимодальное распределение по дихотомической шкале. Во многом данный подход также продолжает традиции до-психологического понимания структуры организации психики человека, заложенного в традициях ранней философии. Наиболее известной типологической моделью личности является модель MBTI, построенная на теории К.Г. Юнга (который считается родоначальником такого понятия «интроверсия экстраверсия» - как одной из самых наиболее используемых черт личности). Она возникла в 40-х годах 20 века и получила широкое распространение в США и Европе. Типология Майерс-Бриггс изначально разрабатывалась Изабель Майерс-Бриггс и её матерью Кэтрин Бриггс на основе работы Юнга «Психологические типы». Первая версия теста МайерсБриггс (Myers-Briggs Type Indicator, MBTI) появилась в 1942 году. В 1972 году был создан Center for Applications of Psychological Type (CAPT), ведущий исследовательскую деятельность и осуществляющий подготовку специалистов по применению MBTI. В 1972 году был создан Center for Applications of Psychological Type (CAPT), ведущий исследовательскую деятельность и осуществляющий подготовку специалистов по применению MBTI. Значительная часть исследований по типологии Майерс-Бриггс публикуется в журнале The Journal of Psychological Type. Особенности данной модели являются и одним из самых критикуемых ее недостатков. Типологический подход предполагает наличие ярких «типов», в то время как в исследованиях распределение ответов тяготеет к нормальному с центром в равновесии для всех 4-х бинарных признаков (мышление-чувство, экстраверсия - интроверсия, и др.) Таким образом, большое количество людей будет отнесено к существенно разным типам при наличии незначительной разницы в измеренных тестом значениях. Такая ситуация также повышает вероятность ошибки измерения. Помимо MBTI в практике тестирования также используются методики Д.Кейрси (Keirsey Temperament Sorter), DISC, Tomas и другие. Клинический подход 10 Данный подход во многом кардинально отличается от рассмотренных выше по нескольким основаниям. Во-первых, модели личности в рамках него строятся не на основании факторной обработки данных, а, во-вторых, имеют в своей основе либо психодинамические, либо клинические предпосылки (личностные черты определяются как те или иные нарушения, акцентуации, клинические характеры). За счет этого данные модели чаще используются в практике клинической работы, но могут и применяться в ситуациях для ситуаций оценки в профессиональной деятельности. Одной из наиболее известных моделей и методик данного подхода является Миннесотский многоаспектный личностный опросник или MMPI (Minnesota Multiphasic Personality Inventory), разработанный в конце 30 — начале 40 годов в Университете Миннесоты С. Хатуейем и Д. МакКанли. В 1989 году выпущен рестандартизированный вариант методики — «MMPI-2». В классическом варианте содержит 10 факторов плюс 4 показателя достоверности ответов. В РФ известны адаптации этого опросника под названиями ММИЛ (Ф. Березин) и СМИЛ (Л.Н. Собчик). Другим также достаточно известным опросником и моделью организации личности является CPI (California psychological inventory), который был разработан Х. Гуфом (Gough, 1957). В нем выделяется до 20 переменных личности, сгруппированных в четыре группы шкал. Критика моделей в рамках данного подхода строится в основном на отсутствии серьезной психометрической проработки опросников и высокой гомогенности (связанности) между шкалами (Reynolds & Nichols, 1977). Профессиональный (компетентностный) подход Данный подход можно выделить не с точки зрения отличия по критериям отнесения к той или иной психологической школе, или методу работы с данными, который может лежать в его основе, а скорее в силу его практической направленности. В рамках данного подхода могут создаваться модели личности, которые отражают специфику поведения человека в деловых и профессиональных ситуациях. Таким образом, данных подход не всегда может претендовать на всестороннее описание личности, но может быть более продуктивен с точки зрения предсказания эффективности профессиональной деятельности. Примером такой модели и опросника может быть OPQ, созданный в начале 80-х годов. Авторами опросника являются П.Сэвил (P. Saville) и Р. Холдсуорто (R. Holdsworth). Опросник 11 специально разработан для оценки типичного или предпочитаемого стиля поведения человека в профессиональной деятельности. Опросник OPQ дает возможность получить подробную информацию относительно того, насколько кандидаты подходят к конкретной рабочей среде, как они будут работать с окружающими. Кроме того, результаты OPQ позволяют сопоставить личностный потенциал сотрудника и требования к рабочему поведению сотрудника в рамках компетенций. Еще одним примером может служить опросник HPI - The Hogan Personality Inventory. Разработан R. Hogan, Curphy, and J. Hogan, содержит 7 интегральных показателей. Описывающих поведение человека, и 41 подфактор (HICs). Также содержит шкалы, прогнощирующие эффективность в ряде профессиональных направлений (управление, продажи, сервис и т.п.). Другими примерами подобных моделей могут быть опросник Wave – 36 показателей (P. Saville), Dimensions (R. Holdsworth) и т.д. По итогам анализа можно составить сводную таблицу, характеризующую базовые моменты каждого из подходов и моделей. Таблица 2. Сравнительные характеристики моделей. Модель Подход Автор Кол-во показателей 16PF Лексикографический Р. Кеттел 16 EPI Диспозициональный Г. Айзенг 3 Лексикографический и Голдберг 5 Майерс-Бриггс 4 Хатуей -МакКанли 10 Гуф 20 Сэвил - Холдсуорто 32 Сэвил 36 Hogan 7 BigFive (NEO-PI-R & BFI диспозициональный MBTI (Кейрси, DISC) MMPI (ММИЛ, СМИЛ) CPI OPQ Типологический Клинический Профессиональный Wave HPI Рассмотренные нами примеры подходов к структурированию и организации личностных характеристик и реализуемых в рамках этих подходов моделей наглядно показывают многообразие, с которым сталкивается любая практическая задача, требующая измерения и диагностики личности. Сфера оценки персонала (подбор и отбор), прогноза 12 профессиональной успешности не является исключением, что еще раз показывает актуальность исследования прогностичности моделей личности для данных целей. Применение моделей личности в практике оценки персонала. В практике работы с персоналом используются достаточно большое количество инструментов диагностики личности, большинство которых отражает свою модель личностных конструктов и черт. К примеру, отчет компании Birkman International содержит ссылки на 7 различных инструментов личностной диагностики, наиболее популярных в практике оценки персонала (Birkman International, 2007). В качестве таких инструментов упоминаются Myers-Briggs Type Indicator (MBTI), Insights Discovery System, Profiles XT Assessment, The Hogan Personality Inventory (HPI), The DiSC Assessment, 16PF (Pearson Assessments), The Birkman Method. Естественно, данный обзор нельзя считать строго научным, а представленные инструменты - отражающими различные модели личности. В обзоре не затронуты данные по «клиническим» тестам личности (например, MMPI). Другой обзор методов оценки персонала и роли личностных моделей в оценке, а также сочетания различных предикторов успешности работы друг с другом содержаться в работе Ones & Viswesvaran, 2004. В качестве используемых моделей и инструментов упоминаются The Hogan Personality Inventory (HPI), the California Psychological Inventory (CPI), the NEO Personality Inventory–Revised (NEO PI-R), and the Personal Characteristics Inventory (PCI), The Minnesota Multiphasic Personality Inventory (MMPI). Ряд исследований посвящены мета-аналитическому изучению валидности личностных моделей в практике оценки персонала и прогнозирования успешности профессиональной деятельности. Так, в работе Scroggins, Thomas & Morris (2009) анализируется целый пул таких исследований, как в контексте валидности личностных моделей (в основном на примере Big Five), так и в их сравнении с их с моделями общих и специальных способностей. Известнейшая мета-аналитическая работа Hunter & Hunter (1984) также посвящена изучению сравнительной валидности различных предикторов успешности работы, в том числе моделей личности. Данная работа считается классической в плане построения метааналитического исследования, а также сравнения вклада эффективности различных методов 13 оценки в прогноз профессиональной успешности. При этом, в ней не рассматриваются модели личности в отдельности как таковые, а выделяется лишь подраздел тестов личности, который сравнивается с другими методами оценки (тесты способностей, интервью, биографический метод, оценки наблюдателей и даже графология). Тем не менее, данную работу можно считать некоторым модельным образцом и для нашего исследования. Тем более что в ней обосновывается существенная роль тестирования личности при отборе и оценке. В дальнейшем авторы продолжили работу в этом направлении и опубликовали исследование по уточненным данным сравнительной валидности различных инструментов (Schmidt & Hunter, 1998). Исследование Dakin & Armstrong (1989) раскрывает проблему соотношение данных метааналитических обзоров по валидности методов оценки и мнения экспертов в области оценки персонала относительно валидности. Приводятся ссылки на мета-аналитические работы и данные по соотношению полученных эмпирических закономерностей с мнениями экспертов - практиков. В целом работы по анализу валидности личностных моделей продолжают публиковаться, как в контексте мета-аналитических исследований (например, способность личности объяснять лидерское поведение, эмоциональное выгорание, стрессы на работе, девиантное поведение), так и в контексте конкретных исследований. Большая часть таких исследований, тем не менее, провидится на примере модели Big Five. Аналитические обзоры по валидности моделей и инструментов в практике оценки Проблематика прогностической валидности достаточно часто затрагивается в работах, посвященных изучению соотношения личностных качеств и будущей профессиональной успешности. Это и не удивительно, ведь практика постоянно требует подтверждения эффективности используемых инструментов. Само по себе понятие прогностической валидности метода связано с его способностью предсказывать будущую успешность. Под прогностической валидностью понимают информация о том, с какой степенью точности и обоснованности методика (тест) позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Она отражает временной интервал, 14 на который распространяется обоснование такого суждения. Сведения о такой валидности имеют самое непосредственное отношение к раскрытию предсказательной силы методики, выяснению степени обоснованности сформулированного на ее основе ближайшего и более отдаленного прогноза, анализу значимости получаемых в показателей с точки зрения экстраполирования результатов на будущее. Принято различать прогностическую и текущую валидность в зависимости от временной связи между критерием и тестом. При этом обе они относятся к критериальной валидности. Иногда употребляется термин предсказательной валидности. Термин «предсказание», по мнению А. Анастази (1982), может использоваться как в широком смысле, означая прогноз на основе данных тестирования поведения испытуемого в реальной (критериальной) ситуации, так и в более узком смысле, указывая лишь на временной интервал. В качестве валидизации критерия могут выступать не только показатели актуального поведения, но и ожидаемые результаты деятельности, обучения и т. д. Процедура определения прогностической валидности опирается на анализ корреляции между оценками по измерениям и предсказанными результатами деятельности, формирующимися свойствами личности и т. п. Вместе с тем различие двух видов критериальной валидности связано не только с временными пределами критериальных сопоставлений. Валидность текущая и прогностическая отражают разные цели применения методики: текущий диагноз, оценка настоящего положения, с одной стороны, и прогнозирование развития качества или успеха в деятельности — с другой. В рассматриваемых работах могут затрагиваться оба аспекта критериальной валидности. Естественно, за счет больших трудозатрат на получение информации о будущем поведении, многие исследования опираются на выявление текущей валидности (сравнение с теми внешними показателями, которые можно собрать одновременно с измерениями по конкретной модели личности). Поэтому в нашей работе также предстоит определить, насколько богато поле данных по прогностической валидности, или же данную работу невозможно провести, не привлекая данные по текущей валидности. Другой вопрос, который так или иначе связан с имеющимися исследованиями валидности моделей личности, упирается в проблематику внешних критериев. Как правило, можно выделить три группы критериев, с которыми исследователи проводят сравнение при 15 определение валидности модели. Первая группа затрагивает общие показатели успешности профессиональной деятельности. Как правило, они связаны с качеством выполнения работы в целом, и могут базироваться на производственных данных, рейтингах и оценках руководителей и коллег. Вторая группа связаны с выполнением конкретных рабочих операций или видов деятельности (например, аналитическая работа, управленческая деятельность, продажи и коммуникации). Третья группа может быть связана с изучением успешности в определенных профессиональных областях, с прогнозированием карьерного развития. Несмотря на взаимную связанность этих критериев, данное разнообразие может существенно усложнять сравнение данных по моделям, когда для одной из них будут данные по определенной профессиональной области, а по другой - нет. В научной литературе содержится достаточно большое количество статей, базирующихся либо на мета-аналитических, либо частных исследованиях, посвященных валидности той или иной модели в практике оценки и прогнозированию успешности. Например, обзорная статья, которая, тем не менее, дает общее представление о валидности моделей в практике отбора и оценки, а также затрагивает ключевой вопрос исследования - сравнение моделей друг с другом, на примере противопоставления модели Big Five и более специальных моделей (Rothstein & Goffin, 2006). Также в статье рассматриваются интересные эффекты, которые могут влиять на валидность инструментов и моделей. В отдельную группу можно вынести мета-аналитические исследования валидности Big Five относительно успешности профессиональной деятельности. Этой теме посвящено достаточно большое количество статей, к примеру Ones, Dilchert, Viswesvaran & Judge (2007) в своем мета-аналитическом исследовании опираются еще как минимум на 10 подобных работ, анализируя общую валидность модели Big Five, валидность относительно различных типов работ (простая, одиночная, лидерская деятельность и т.п.), а также видов профессиональной деятельности (профессий: менеджеры, специалисты по продажам, полицейские и т.п.). Помимо этой работы можно отметить мета-анализы по этоц модели таких авторов, как Hurtz & Donovan, 2000, Barrick & Mount, 1991. Некоторые исследователи делают попытки доработки популярной модели Big Five, выделяя более интегральные факторы и изучая их валидность относительно успешности работы (Linden, Nijenhuis & Bakker, 2010), либо выявляя стабильность лишь ряда факторов из 16 классического пятифакторного набора (Saggino, 2000), что в обоих случаях создает новую модель личностных качеств и может быть использовано для соотнесения по показателям валидности в практике оценки. К примеру, отдельное мета-аналитическое исследование, которое посвященно проблеме критериальной валидности интегральных факторов Стабильности и Пластичности модели Big Five (Alessandri & Vecchione, 2012). В работе Schmidt & Hunter, 1998 аторы также приводят данные, что наибольшей валидностью может обладать не сама модель Big Five, а отдельные ее факторы (например, сознательность и самоконтроль). Некоторые исследователи, напротив, расширяют модель Big Five, добавляя значимые черты и изучая их предсказательную силу для прогнозирования успешности работы (Johnson, Rowatt & Petrini, 2011). В статье речь идет о черте Честности-Смирение (Honesty–Humility) как 6 показатели модели, который может служить хорошим предиктором для ряда рабочих навыков по сравнению с классическими 5 факторами. Ряд исследований связано с изучением валидности 16PF относительно успешности работы. В статье Jenkins & Griffith (2004) приводятся данные мета-анализа взаимосвязи между факторами данной модели и общими показателями успешности профессиональной деятельности. Исследованию валидности MBTI в литературе уделено гораздо меньше внимания. Есть отдельные исследования, посвященные изучению валидности методики в конкретных областях (например, Furnham & Stringfield (1993) изучали валидность модели для предсказания успешности в управленческой деятельности). Также ряд статей посвящено изучению соотношения модели MBTI с 16PF, EPQ и Big Five (The location of the Myers-Briggs type indicator in personality factor space). Тоже справедливо относительно ряда других моделей, которые затрагиваются в нашем исследовании. Помимо научных данных существует еще целый пул данных, которые предоставляют сами разработчики инструментов, опирающихся на те или иные модели. Эти данные содержаться в руководствах к методикам (manual & handbooks), публикациях на сайтах и конференциях и т.д. В них можно найти данные как по взаимной взаимосвязи моделей друг с другом 17 (например, MBTI FormM MANUAL SUPPLEMENT), так и сравнительных исследованиях критериальной валидности в конретных исследованиях (например, P. Saville, How Valid Is Your Questionnaire?). Поиск и обработка такого типа данных также является задачей нашего исследования. В завершении приведем исследование, которое можно назвать модельным относительно нашей работы (исследование, которое можно принять за образец текущему исследованию) В работе Morey et al. (2007) рассматривается исследование, которое посвящено изучению валидности нескольких моделей психологических расстройств (PD). В работе изучаются модели «Большой Пятерки» (FFM), «Перечень неадаптивных и адаптивных личностей (SNAP) и DSM-IV (CLPS). Авторами рассматриваются различные виды валидности и способности моделей прогнозировать проявления личностных расстройств на практике. В частности, изучаются показатели конструктной валидности, стабильности моделей, а также прогностической валидности. В исследовании проводится сравнительный анализ моделей по данным показателям. Отличительной особенностью данного исследование является метод сбора данных непосредственное - не проведение с помощью конкуретного мета-анализа других исследования с исследований, помощью а методик, измеряющих показатели моделей. Тем не менее, ряд приемов и подходов, задействованных в исследовании Morey et al. представляется возможным использовать и в нашем исследовании. В заключении можно сказать, что большинство мета-анализов на текущий день ставило целью определение валидности личностных моделей в практике оценки только на примере одной модели - Big Five. Другие модели либо приводились к Big Five, либо не рассматривались по отдельности. Сравнительный анализ валидности моделей мог провидится только в конкретных исследований, но редко в каких модели сравнивались в количестве большем, чем несколько штук. Проведенный обзор литературы лишь подтверждает актуально и новизну нашего исследования, основная цель которого – сравнительный анализ валидности моделей личности методом мета-анализа. Мета-анализ: технология применения 18 Возникновение мета-анализа как метода было связано с необходимостью обобщения результатов нескольких исследований, которые ставили перед собой один и тот же исследовательский вопрос, с тем, чтобы получить более общее знание. Например, метаанализ часто использовался, чтобы обобщить результаты, полученные на разных выборках. Существуют целые руководства или обзорные статьи, касающиеся того, как проводить метааналитические исследования (Field & Gillett, 2010). Использование мета-анализа позволяет оценить и исследовать следующие показатели: 1. Среднее и дисперсию исследуемого эффекта или явления в популяции. На основании этих параметров распределения возможно построить доверительные интервалы какого-либо явления в популяции. 2. Вариацию размера исследуемого явления в различных исследованиях (гомогенность эффекта в различных исследовательских ситуациях). По сути, разные явления могут быть в разной степени гетерогенны, и выбирать на основе мета-анализа метод, дающий наибольший эффект неправильно. Однако, в этой связи мета-анализ позволяет оценить распределение значений изучаемого явления. На основании этих данных исследователь может оценить ориентировочный интервал значений и оценить адекватность полученных им данных. 3. Возможные явления-модераторы. Во многих случаях вариация размера эффекта может быть связана со взаимодействием с каким-либо третьим параметром – модератором. Анализ проведённых исследований на предмет модерации позволяет делать более глубокие выводы относительно природы исследуемого явления. Мета-аналитическая работа включает в себя несколько этапов: Обзор исследований, Решение о включении некоторых критериев в мета-анализ и их применение, Расчет размера эффекта для каждого из исследований, которые будут включены в анализ, Непосредственно количественный анализ изучаемого явления, Дополнительный анализ, который включает в себя рассмотрение ошибок (bias) проведённых исследований, а также изучение переменных-модераторов, Подведение итогов. 19 Обзор исследований При поиске исследований для включения в мета-анализ нужно обращать особое внимание на исследовательские вопросы, которые ставят авторы и следить, чтобы они в точности совпадали с нашими исследовательскими вопросами. Поиск с помощью электронных ресурсов ВШЭ даёт ряд преимуществ, по сравнению с обычным поиском в сети: электронные базы публикаций позволяют делать довольно сложные поисковые вопросы и таким образом находить, например, все работы одного автора (авторы часто имеют больше одной публикации на одну тему), или просматривать статьи, которые цитируют то или иное исследование. Не стоит забывать, что во многих журналах (если не во всех) имеется тенденция публиковать только значимые результаты, избегая незначимые данные (Dickersin, Min, & Meinert, 1992; Hedges, 1984). Coursol & Wagner (1986) показали, что исследования с положительным результатом публикуются в 7 раз чаще, чем исследования, в которых принимается нулевая гипотеза (то есть показывается независимость событий, отсутствие взаимодействия и т.д.). В другом исследовании говорится о том, что 97% публикаций в психологических журналах описываются только значимые результаты (Sterling, 1959). Поэтому при поиске литературы для мета-анализа нужно не забывать об этом, и искать источники не только в опубликованных материалах, но и в неопубликованных, а также в материалах подходящих конференций, рабочих докладах, а в нашем случае - методических материалах и handbooks (руководствах к методикам). Часть информации может содержаться не только в научных публикациях, но и в коммерческих отчетах, которые используются только в практических целях, но не доходят до публикации в научной периодике. Если же использовать только опубликованные в журналах результаты, можно переоценить или недооценить эффект явления. Ещё один способ поиска литературы – непосредственное обращение к видным авторам в исследуемой области (например, Кеттел, Айзенг, МакКрей и Коста и др). Критерии и их применение Для того чтобы решить, включать или нет то или иное исследование в свой мета-анализ, нужно разработать критерий, по которому можно было бы точно и достоверно судить о 20 качестве исследования. В качестве критерия можно использовать определение основного понятия, которое используется в исследовании (например, понятие текущей или прогностической валидности и его наличие в исследовании, понятия job performance и т.п.). Также следует обратить внимание на методологический аспект исследований: описывают ли они валидность и надёжность применяемых методик? Используют ли контрольную группу, и т.д. Расчет размера эффекта После подбора статей встает вопрос о том, как же их оценить? Для этого и нужен расчет размера эффекта. Под размером эффекта обычно подразумевается стандартизированное измерение величины наблюдаемого явления (Clark-Carter, 2003; Field, 2005c). Существует множество способов расчета величины эффекта, но обычно используются три показателя: Коэффициент корреляции Пирсона, Коэффициент Кохена (Cohen), Отношение шансов (odds ratio). Коэффициент корреляции Пирсона является стандартизированной мерой ковариации между двумя непрерывными (интервальными) переменными. Однако, часто этот показатель используется для измерения экспериментального эффекта. Как известно, коэффициент корреляции колеблется от -1 до 1, -1 говорит о наличии сильной линейной отрицательной корреляции, 1 – о сильной положительной линейной корреляции. Cohen (1988, 1992) предложил следующую градацию коэффициента корреляции: o Если r примерно равен 0,1 по модулю, то такой эффект можно считать слабым, он объясняет всего 1% дисперсии. o Если r примерно равен 0,3 по модулю, то такой эффект можно считать средним, он объясняет порядка 9% дисперсии. o Если r примерно равен 0,5, то такой эффект можно считать сильным, поскольку он объясняет около 25% дисперсии зависимой переменной. Стоит отметить, что такие рекомендации не следует воспринимать буквально, всегда следует учитывать контекст того исследовательского поля, в котором мы работаем. 21 Итак, после выбора подходящей метрики нужно рассчитать размер эффекта для всех отобранных статей. Даже если в статьях используются другие показатели эффекта, они зачастую переводимы друг в друга, поскольку основываются на среднем значении и дисперсии. Например, коэффициент корреляции Пирсона можно рассчитать, если имеются данные по t, z, F или хи-квадрат статистикам. Основной мета-анализ Как указывалось ранее, основная задача мета-анализа состоит в том, чтобы оценить какойлибо эффект в популяции на основе знаний об эффекте из различных статей. Оценка эффекта в популяции достигается за счет усреднения всех эффектов из выбранных статей. Но такое усреднение должно быть взвешенным, поскольку в анализе участвуют статьи с разными выборками, больший вес следует назначать тем статьям, выборки которых многочисленны и репрезентативны. Это делается для того, чтобы уменьшить влияние побочных факторов, которые могут привнести результаты исследований со слишком специфичными выборками. После расчета основного эффекта следует рассчитать доверительный интервал для этого значения. Необходимость этого продиктована тем, что отобранные исследования могут не полностью отражать исследовательский вопрос, в результате чего ошибка измерения увеличится. Чтобы учесть эту ошибку и нужен доверительный интервал. По сути, есть два способа концептуализировать мета-анализ: использование моделей с фиксированными эффектами, или использование моделей со случайными эффектами (fixedand random-effects models) (Hedges, 1992; Hedges&Vevea, 1998; Hunter&Schmidt, 2000). Модель с фиксированными эффектами предполагает, что выбранные исследования отобраны из одной генеральной совокупности, в которой существует среднее значение эффекта, которое может быть предсказано с помощью нескольких основных предикторов. Из такой концептуальной схемы можно заключить, что все эффекты в выбранных исследованиях должны быть примерно одинаковыми, поскольку репрезентируют одну генеральную совокупность. Другое предположение (модель со случайными эффектами) подразумевает, что во всех выбранных исследованиях средний размер эффекта колеблется случайным образом, поскольку все исследования репрезентируют разные совокупности с разными средними эффектами. И чтобы создать одну генеральную совокупность нужно сначала обобщить данные выборок на небольшие генеральные совокупности (по одной на каждое исследование) и затем обобщить их в одну генеральную совокупность. 22 В зависимости от того, какой подход выбран, мы определяем, какой метод мета-анализа следует применять. Основное отличие моделей с фиксированными эффектами от моделей со случайными эффектами заключается в том, откуда берётся ошибка. В моделях с фиксированными эффектами существует ошибка репрезентации выборок относительно генеральной совокупности. В моделях со случайными эффектами также содержится ошибка репрезентации выборок относительной генеральной совокупности. Но поскольку здесь предполагается, что генеральная совокупность в каждом исследовании своя, то сюда прибавляется ошибка репрезентации выделенных генеральных совокупностей относительно одной большой совокупности, эффект которой мы и стремимся оценить. Основными методами, которые используются при расчете величин эффекта, являются Hunter–Schmidt method (Hunter & Schmidt, 2004) и Hedges and colleagues’ method (Hedges & Olkin, 1985; Hedges & Vevea, 1998). В обоих методах используются алгоритмы подсчета величины эффектов и стандартизации данных в зависимости от размеров выборок и т.д. Помимо расчета и сравнения величин эффекта при проведении мета-анализа может быть проведен дополнительный анализ, который включает в себя рассмотрение ошибок (bias) в рассматриваемых исследованиях, а также изучение переменных-модераторов, которые могут опросредовать наблюдаемые эффекты. В итоге следует отметить, что существуют определенные правила, которые необходимо учитывать при публикации мета-аналитических исследований (Rosenthal, 1995). Во-первых, необходимо четкое изложение позиции авторов относительно целей анализа, критериев поиска и включения тех или иных исследований. Во-вторых, необходимо обосновывать, почему к данных применяются те или иные методы мета-анализа. Необходимо сообщать статистические данные, касающиеся изменчивости величины эффекта (в них необходимо включать оценку фактической изменчивости, а также статистических испытаний на изменчивость), и оценку связанного с ним доверительного интервала. Также необходимо предоставлять информацию о систематической ошибке измерения. Таким образом, мы описали основные принципы метаанализа, которыми стоит руководствоваться при проведении подобного рода исследований. 23 ЭМПИРИЧЕСКАЯ ЧАСТЬ Содержание: 1. Основные положение анализа 2. Процедура и методика исследования 3. Результаты исследования 4. Обсуждение результатов 5. Выводы Мета-анализ валидности моделей личности в практике оценки В теоретической части мы рассмотрели основные модели личности и соответствующие им инструменты диагностики. Были выделены основные понятия исследования, а также рассмотрены основные источники данных для исследования. Виды исследуемой валидности На теоретическом этапе может рассматриваться содержательная или конструктная валидность (как показатель соотнесения модели и инструмента). На эмпирическом этапе критериальная валидность (текущая и прогностическая) как показатель валидности в практике оценки персонала. В соответствии с целью исследования могут быть рассмотрены следующие исследовательские вопросы: «Какая модель личности наиболее валидна в практике оценки персонала (интегрально) и почему?» • разная ли валидность у моделей, разработанных в рамках различных подходов; • зависит ли валидность от количества факторов в модели; • разные ли валидности у моделей в зависимости от уровня позиции (синие воротнички, белые воротнички, руководители, предприниматели); 24 • зависит ли валидность от типа инструмента (например, опросники, выявляющие именно рабочее поведение и черты (сформулированные как поведение на работе) более валидными, чем опросники общего типа). Для решения этих вопросов необходимо выполнить ряд описанных ниже задач. Эмпирические задачи работа с литературой (сбор данных по валидности) определение критериев включения имеющихся данных в мета-анализ мета-аналитическое сравнение мощности моделей (величины эффекта валидности относительно эффективности выполнения работы) рассмотрение дополнительных факторов, которые могут влиять на показатели валидности. План (дизайн) исследования: разработка критериев включения данных в мета-анализ (выделение ключевых показателей валидности и сфер ее применения), отбор литературы согласно этим критериям (сбор данных для мета-анализа), выбор типа и метода метаанализа, расчет данных и их обработка, интерпретация результатов, описание выводов Процедура и методика исследования Первичным этапом любого мета-аналитического исследования является сбор литературы, выбор метода мета-анализа и критерия (показателя), по которому он может проводится. Для нашего исследования был выбран метод, разработанный Hunter & Schmidt (2004). Данный метод активно применяется в мета-аналитических исследованиях схожего типа (расчета мощности валидности различных инструментов прогнозирования успешности в работе), позволяет работать с таким показателем валидности, как коэффициент корреляции (r), и также позволяет учитывать ошибки измерения, которые заложены как в самих инструментах (тестах), так и в критериях эффективности (показателей успешности работы). Сбор данных проводился по четырем основным источникам (см. Таблицу 3), которые включали в себя поиск научных статей с исследованиями валидности, так и технических отчетов по методикам, не опубликованным в научных журналах. 25 Таблица 3. Источники поиска статей (данных) для исследования. Основания Критериальная валидность : • Текущая • Прогностическая Инструменты (ресурсы) поиска Источники Публикации в научных журналах Technical reports ScienceDirect APA JStor Google Google scholar Поиск статей или публикаций поводился по единой технологии. В начале в поисковую строку любого источника вводилось лишь наименование модели (например, «MBTI»), после чего экспертно анализировались абстракты статей или сами статьи на предмет соответствия теме исследования (то есть наличия исследования на тему валидности относительно успешности в работе в любом формате и на любой должности, а также в успешности в подготовке к работе (тренинги) и пр.). После анализа списка дополнительно в поисковые строки вводились такие уточняющие слова, как «validity» и «job performance», и полученный список заново отсматривался на предмет появления новых статей. В большинстве случаев первичный поиск позволял получить до 90-95% статей, которые после выводились с уточняющим поиском. Следует сразу оговорится, что поиск статей в классическом мета-анализе проводится в более расширенном виде, анализируются списки литературы в статьях, которые встречаются в первичном поиске, проводится поиск по базам диссертаций и неопубликованным работам, рассылаются письма авторам, чьи работы не содержат нужных данных с просьбой их уточнить и т.п. Все это позволяет получить больше данных, в том числе отрицательных, которые обычно не публикуются, но являются очень важными для мета-анализа. В нашем исследовании мы ограничились лишь первичным поиском в силу характера работы и ограниченности ресурсов на полномасштабное исследование. После сбора первичных данных на предмет соответствия теме необходимо было выбрать статистический критерий (показатель) включения статей в исследования. Классическим показателем для мета-анализа Hunter & Schmidt является коэффициент корреляции (r), 26 который встречался и в большинстве наших данных, поэтому этот коэффициент был выбран нами для проведения мета-анализа. Стоит отметить, что определенный процент статей мог вообще не содержать данных по корреляции модели с показателем успешности (в таком случае статью приходилось исключать из выборки), часть статей (особенно 60-80 годов) содержало данные по сравнению средних (t- или F- коэффициенты), которые по специальным формулам могли быть переведены в переведены в показатели r (подробнее о переводе см. Student Handout - Meta-Analysis.pdf). Часть статей по ряду моделей была включена в анализ из других мета-анализов, которые могли содержать либо сырые данные (непосредственные показатели r, например Tett, Jackson & Rothstein, 1991), либо уже подсчитанные по аналогичной технологии мета-аналические показатели (для модели Big Five, Hurtz & Donovan, 2000). В итоге был получен финальный список из 86 статей и технических отчетов, который был закодирован в матрицу сырых данных со следующими показателями: Авторы (указание авторов публикации) Название публикации Год публикации Модель (16 PF, MMPI, MBTI & etc.) Надежность модели (тип – альфа кронбаха, тест-ретест или оба типа) Надежность модели (коэффициент) Выборка исследования (размер) Тип исследования (Научная статья или технический отчет) Вид критерия успешности (Job performance (O), Job ratings (S), Training (T), Персональные данные (P)) Надежность критерия (коэффициент) Тип профессии (Manager, Sales, White collar, Blue collar, Service, Other) Статус профессии (гражданская или военная) Указание профессии (наименование, если есть) R mean (абсолютная усредненная корреляция модели с критерием) № R mean (кол-во корреляций) R significant (абсолютная усредненная значимая корреляция модели с критерием) № R significant (кол-во значимых корреляций) 27 В кодировании матрицы участвовал один эксперт, стаж работы в области оценки персонала – 8 лет. Частично данные матрицы приведены в приложении №1. Далее стоит остановится на двух таких важных моментах, как расчет R mean и R significant, и данных по надежности моделей и критериям. Расчет R mean производился по технологии, описанной Tett, Jackson & Rothstein, 1991, которая стоится на расчете абсолютной средней корреляции факторов модели с критерием. В данном исследовании мы отдельно ввели понятие R significant как абсолютная усредненная значимая корреляция модели с критерием. Так как мы сравниваем модели друг с другом по мощности объяснительной способности, нам было важно не только понять, насколько модель способна быть связанной с критерием успешности, но и в какой степени она способна производить значимые корреляции в исследованиях. Приведем пример. Возьмём данные вымышленного исследования, например показатели корреляции между факторами модели Big Five и успешностью в управлении: Таблица 4. Данные исследования (для примера). Факторы Big Five Экстраверсия Согласие Самоконтроль Стабильность Открытость новому Связь с успешностью в управлении (сравнение с объективными показателями эффективности), r 0,17 -0,13 0,25* -0,03 0,31* *P<0,05 Для расчета R mean нам достаточно взять каждый показатель r по модулю, и получить среднее значение. В данном случае оно будет равно 0,18. Для расчета R significant мы берем только значимые корреляции по модулю, и усредняем их – получая уже 0,28. Таким образом, в данном исследовании модель Big Five имеет среднюю мощность в полтора раза меньшую, чем значимую. Но в практике зачастую для использования модели отбираются именно значимые корреляции, таким образом их также важно учитывать в исследовании. Вторым важным моментом является учет показателей надежности моделей и критериев успешности, которые позволяют скорректированный коэффициент мощности P mean (Hunter & Schmidt , 2004). Надежность модели фактически равна коэффициенту альфа –кронбаха или данным тест-ретеста (или их среднему), надежность критерия зависит от его типа (например, это объективный показатель успешности, рейтинг со стороны коллег или супервизоров и 28 т.п.). Идеальной ситуацией является та, где в исследовании авторы перепроверяют как надежность модели, и надежность критерия, и приводят эти показатели (хотя таких исследований в нашей выборке оказалось не больше 15%). В остальных случаях приходится брать те показатели надежности моделей, которые приводятся в технических отчетах по методикам, и данные из других мета-анализов, где приводятся показатели средней надежности критериев в зависимости от их типа. Таблица 5. Надежность моделей и ее источники. Авторы Название публикации H. J. Eysenck & Eysenck The manual of the EPI Heather E.P. Cattell and Alan D. Mead CPP Research Department Sophie Grigoriadis, G.Cynthia Fekken Schaubhut The sixteen personality factor questionnaire (16pf) R. Hogan & J. Hogan Manual 1995 SHL Saville Consulting Wave Opq32 technical manual Professional styles handbook 2009 Technical Brief for the CPI INSTRUMENT Person reliability on the Minnesota multiphasic personality inventory MBTI formM MANUAL SUPPLEMENT Год публика ции 1964 Мод ель Надежность (тип) EPI 2005 16PF Среднее (альфа и тестретест) Среднее (альфа и тестретест) Альфа CPI 1992 2009 MMPI Среднее (альфа и тестретест) MBTI Среднее (альфа и тестретест) HPI Среднее (альфа и тестретест) OPQ Альфа Wave Среднее (альфа и тестретест) Надежн ость (Коэф) 0,86 0,75 0,75 0,62 0,80 0,75 0,81 0,805 Как видно из таблицы, границы надежности моделей находятся в рекомендованном в психометрике диапазоне от 0,75 и в среднем достаточно близки друг к другу. Только модель MMPI имеет более низкую надежность, отчасти на чем и строится классическая критика этой модели. Тем не менее, нужно понимать, что чем ниже показатель надежности модели, тем в большей степени она будет скомпенсирована показателем P mean в мета-аналитическом исследовании. 29 Вид критерия Job performance (O) Job ratings (S) Training (T) Персональные данные (P) Таблица 6. Надежность критериев валидности (показателей эффективности работы). Надежность критерия 0.92, SD =0.05 0.60, SD =0.19 0.56, SD =0.1 нет показателя Данные получены из сравнительных мета-аналитических исследований (Tett, Jackson & Rothstein, 1991, Barrick & Mount, 1991). Наибольшей надежностью (стабильностью) обладают объективные показатели работы, но часто в ввиду сложности сбора данных их заменяют рейтингами и субъективными оценками, которые имеют более низкую надежность и большой разброс значений (от 0,4 до 0,8 с одним ст.откл). Также могут использоваться исследования, где люди либо учатся, либо имитируют работу (тренинги). Также есть прием измерения эффективности через сравнения с персональными данными (например, принадлежность к профессии, рост дохода или статуса в профессии). В случае работы с этими данными поправка на надежность критерия не производилась ввиду отсутствия по ним данных о надежности. Таким образом, в нашем примере для получения P mean коэффициенты R mean и R significant нужно было бы скорректировать на показатели надежности модели и критерия, и дальше произвести все необходимые расчеты (Hunter & Schmidt, 2004). Все расчеты выполнялись в программе MS Excel по формулам авторов. В дальнейшем результаты расчетов были частично проверены с использованием синтаксиса SPSS, написанным специально для этого метода (Field & Gillett, 2010), и показали полное совпадение результатов. В качестве промежуточных выводов в описании методики и процедуры хотелось бы отметить пожелания для стандартов научных публикаций – включать матрицы сырых корреляций моделей (или иных предикторов успешности) и критериев в публикации. Данная информация поможет существенно упростить технологию проведения мета-анализа и увеличит возможности для его качественного проведения. 30 Результаты исследования В результате обработки данных нами было выделено 86 статей (выборка наблюдений – порядка 15000), которые были включены в мета-анализ. Большинство статей было получено из научных публикаций (89%), и часть – из технических отчетов к методикам, не опубликованных в научных изданиях (11%). Таблица 7. Выборка исследования. Модель EPI 16PF CPI MMPI MBTI HPI OPQ Wave Total Кол-во статей 7 23 15 16 9 7 6 3 86 Размер выборки 1134 2849 1943 1761 1428 1266 3261 1247 14889 По каждой из моделей были получены примерно схожие размеры выборок (от 1134 до 3261), хотя распределение статей отличалось большим разбросом – от 3 до 23. Данные по модели Wave включали в себя только 3 технических отчета и ни одной научной публикации. Данные по модели Big Five были взяты из уже существующих мета-аналитических исследований (Hurtz & Donovan, 2000). Кстати, предыдущее исследование по валидности Big Five давало схожие результаты (Barrick & Mount, 1991). Рисунок 1. Распределение исследований по годам. 31 Публикация исследований (годы) 30 25 Wave 20 OPQ HPI MBTI 15 MMPI CPI 10 16PF EPI 5 0 50-60e 60-70e 70-80e 80-90e 90-2000e 2000-2010e 2010e По нашим данным, большинство исследований валидности моделей проводились в период 80-х – 2000-х годов. После этого стали публиковаться результаты мета-аналитических исследований валидности психологических моделей (прежде всего по Big Five), что возможно “поумерило пыл” исследователей в этой теме. По показателям популярности исследований в начале можно было отметить MMPI (50-70 гг.), затем проявился интерес к CPI (60-80 гг.), затем 16PF, EPI и MBTI (70-2000 гг.), затем OPQ и HPI (2000-2010гг.). Наиболее современные исследования посвящены прежде всего моделям, возникшим в рамках профессионального подхода (OPQ, HPI, Wave). 32 Сравнение моделей по абсолютной усредненной корреляции Таблица 8. Результаты по средней сравнительной мощности моделей. Модель EPI 16PF CPI MMPI MBTI HPI OPQ Wave B5 N K 1134 2601 1717 1583 1304 1152 1620 1247 22 365 217 250 50 71 62 108 r mean 0,09 0,10 0,13 0,11 0,09 0,11 0,10 0,19 0,08 P mean 0,11 0,13 0,18 0,16 0,11 0,15 0,13 0,27 0,12 SDr SDp MEr 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,01 0,00 0,01 0,01 0,00 0,00 0,00 0,01 0,01 0,01 0,01 0,01 0,01 0,00 0,00 95% lower 0,08 0,08 0,11 0,09 0,07 0,10 0,09 0,18 95% upper 0,10 0,11 0,14 0,13 0,10 0,12 0,10 0,19 All 12358 1145 0,111 0,153 0,002 0,003 0,01 0,10 0,12 N – объем выборки, K – кол-во корреляций (напрямую зависит от кол-ва факторов в модели), r mean – взвешенный показатель мощности модели, P-mean - взвешенный показатель мощности, скорректированный на надежность модели и критерия, SDr – отклонение r mean, SDp – отклонение P-mean, MEr – ошибка измерения r mean, 95% lower и 95% upper – доверительный интервал для r mean. Средние показатели r-mean и P-mean в нашем исследовании составили 0,11 и 0,15 соответственно, что выше, чем в более мощном исследовании только по модели Big Five – 0,08 и 0,12 (Hurtz & Donovan, 2000), но ниже, чем в также мощном мета-анализе по многим моделям личности, в том числе малоизвестным от Tett, Jackson & Rothstein, 1991, где они составляли 0,16 и 0,23. Таким образом, сравнивая эти исследования, мы можем сделать вывод о том, что наше исследование дает результаты, близкие к данным более мощным и признанным мета-анализам (оно сравнимо с ними), и то что включение большего круга моделей дает более высокие коэффициенты, чем просто анализ по Big Five. Также можно предположить, что включение иных моделей может дать более высокие коэффициенты и в нашем сравнительном исследовании. Таблица 9. Рисунок 2-3. Сравнение подходов по абсолютной средней валидности. Подход Диспозициональный Лексикографический Клинический Типологический Модель EPI 16PF CPI/MMPI MBTI r mean 0,09 0,10 0,12 0,09 P mean 0,11 0,13 0,17 0,11 33 Профессиональный HPI/OPQ Лексикографический и диспозициональный BigFive Сравнение средних показателей мощности моделей 0,10 0,08 показывает, 0,14 0,12 что наиболее продуктивными подходами оказываются клинический (CPI/MMPI) и профессиональный (HPI/OPQ). Стоит отметить, что модель Wave исключалась из данного типа анализа по двум причинам – 1) данные по ней присутствовали только по 3 техническим отчетам и в наличие не было научных публикаций 2) данные по валидности по своему типу отличались от данных по другим исследованиям (во всех других исследованиях все факторы модели сравнивались 34 с одним критерием успешности, по данным Wave – каждый фактор сравнивался со своим критерием, что могло вносить артефакты в усредненные данные по всей модели). Таблица 10. Рисунок 4-5. Сравнение моделей по абсолютной средней валидности. Модель EPI 16PF CPI MMPI MBTI HPI OPQ BigFive Кол-во показателей 3 16 18 10 4 7 32 5 Корреляция кол-ва показателей и мощности модели r mean 0,09 0,10 0,13 0,11 0,09 0,11 0,10 0,08 P mean 0,11 0,13 0,18 0,16 0,11 0,15 0,13 0,12 0,35 0,37 35 Сравнение средних показателей мощности моделей показывает, что наиболее продуктивными из них по обоим показателям (r-mean и P-mean) оказываются CPI, MMPI и HPI. Стоит отметить, что модель Wave исключалась из данного типа анализа по причинам, описанным выше в анализе подходов. Также стоит отметить, что модель MMPI имела наименьший показатель надежности, что могло повлиять на ее высокое положение в рейтинге, но только в случае с показателем Pmean. Но и по показателю r-mean она оказалась на втором месте. Данные позволяют проверить и гипотезу относительно валидности и размерности модели. В данном случае гипотеза подтвердилась лишь на уровне тенденции, но средняя положительная корреляция кол-ва факторов в модели и показателей валидности (0,35 и 0,37) позволяет утверждать ее правомерность – чем больше факторов у модели, тем выше может быть ее объяснительная способность. 36 Сравнение моделей по абсолютной значимой корреляции Таблица 11. Результаты по значимой сравнительной мощности моделей. Модель EPI 16PF CPI MMPI MBTI HPI OPQ Wave N 585 1457 1429 810 822 1266 1641 1247 K 4 18 26 11 8 43 37 97 All 9257 244 r mean P mean 0,18 0,22 0,17 0,21 0,27 0,37 0,17 0,23 0,19 0,25 0,18 0,24 0,23 0,33 0,20 0,29 0,204 0,277 SDr 0,00 0,00 0,00 0,00 0,01 0,00 0,00 0,00 SDp 0,00 0,01 0,01 0,01 0,01 0,00 0,00 0,00 MEr 0,01 0,02 0,01 0,02 0,01 0,01 0,00 0,00 0,003 0,006 0,00 95% lower 95%upper 0,15 0,20 0,14 0,20 0,25 0,29 0,14 0,21 0,17 0,21 0,17 0,19 0,23 0,24 0,20 0,21 0,20 0,21 N – объем выборки, K – кол-во значимых корреляций (напрямую зависит от кол-ва факторов в модели), r mean – взвешенный показатель значимой мощности модели, P-mean взвешенный показатель значимой мощности, скорректированный на надежность модели и критерия, SDr – отклонение r mean, SDp – отклонение P-mean, MEr – ошибка измерения r mean, 95% lower и 95% upper – доверительный интервал для r mean. Средние показатели r-mean и P-mean по значимым корреляциям составили 0,20 и 0,28 соответственно, что даже выше, чем приводимом выше мета-анализе по многим моделям личности от Tett, Jackson & Rothstein, 1991, где они составляли 0,16 и 0,23. Таким образом, показатель значимости, введенный в нашем исследовании, может обосновывать большую практическую и теоретическую пользу для применения моделей личности в практике прогноза эффективности работы. В данном типе анализа мы не смогли включить такую модель, как Big Five, так как данные нужного нам типа отсутствовали в исходных мета-анализах и не собирались нами в конкретных исследованиях. При этом, мы смогли включить модель Wave, так как для анализа значимых корреляций с критерием нам подходили исходные данные по ней, и вероятность искажений была меньше. Таблица 12. Рисунок 6-7. Сравнение подходов по абсолютной значимой валидности. Подход Диспозициональный Лексикографический Клинический Типологический Модель EPI 16PF CPI/MMPI MBTI r mean 0,18 0,17 0,22 0,19 P mean 0,22 0,21 0,30 0,25 37 Профессиональный Сравнение HPI/OPQ/Wave значимых продуктивными показателей подходами мощности вновь 0,20 моделей оказываются показывает, клинический 0,29 что наиболее (CPI/MMPI) и профессиональный (HPI/OPQ/Wave). Причем в значимых показателях они почти сравнялись друг с другом, а клинический подход лидирует только за счет CPI. 38 Таблица 12. Рисунок 8-9. Сравнение моделей по абсолютной значимой валидности. Модель EPI 16PF CPI MMPI MBTI HPI OPQ Wave Кол-во показателей 3 16 18 10 4 7 32 36 Корреляция кол-ва показателей и мощности модели r mean 0,18 0,17 0,27 0,17 0,19 0,18 0,23 0,20 0,50 P mean 0,22 0,21 0,37 0,23 0,25 0,24 0,33 0,29 0,60* *P=0,12 39 Сравнение значимых показателей мощности моделей показывает, что наиболее продуктивными из них по обоим показателям (r-mean и P-mean) оказываются CPI, OPQ и Wave. Модель CPI становится лидером по итогам двух сравнений, а по показателям значимых корреляций представители профессионального подхода - OPQ и Wave, занимают второе и третье места. MMPI – один из лидеров по средним показателям, существенно отстает по значимым, вновь хорошими показателями обладает HPI, а типологический подход и MBTI здесь выходят ближе в верхушке рейтинга. Гипотеза относительно валидности и размерности моделей по значимым корреляциям подтвердилась еще в большей степени, положительная корреляция кол-ва факторов в модели и показателей валидности стала высокой и близкой к значимой (0,50 и 0,60), что еще больше позволяет утверждать ее правомерность – чем больше факторов у модели, тем выше может быть ее объяснительная способность. Обсуждение результатов В нашем исследовании нам удалось ответить на главный вопрос – какая модель личности наиболее валидна в практике оценки персонала и измерения эффективности работы. Этой моделью оказалась CPI - California Psychological Inventory. Данная модель была разработана как определенный аналог MMPI, но для практики работы не в клинических случаях, а для выборок людей без психиатрических отклонений. Наиболее распространенная в исследованиях версия опросника включает в себя 434 пункта, некоторая часть которых напрямую позаимствована из MMPI (Gough, 1987). Методика построена по нормативному типу, и достаточно длительна по времени. Попробуем проанализировать содержание методики. В ней выделяется 18 показателей (факторов), сгруппированных в 4 типа: 1) измерение уравновешенности, властности, уверенности в себе и межличностной адекватности; (2) измерение социализации, ответственности, внутриличностных ценностей, и характера; (3) измерение потенциала к достижениям и интеллектуальной эффективности; (4) измерение типов интеллектуальной активности и интересов (Gough & Bradley, 1996). Три фактора из 18 выполняют роль служебных показателей. Также существует так называемая Folk Concept Scales для этой 40 модели, где выделяется коммуникабельность, ответственность, самочувствие, 20 факторов: социальность, социализация, толерантность, доминантность, принятие самоконтроль, конформность, себя, потребность независимость, чувствительность, склонность в статусе, эмпатия, общественность, к достижениям, интеллектуальность, открытость, гибкость, маскулинность (в оригинале - Dominance, Capacity for Status, Sociability, Social Presence, Self-acceptance, Independence, Empathy, Responsibility, Socialization, Self-control, Good Impression, Communality, Well-being, Tolerance, Achievement via Conformance, Achievement via Independence, Intellectual Efficiency, Psychologicalmindedness, Flexibility, and Femininity/Masculinity). Модель слабо представлена в РФ, особенно с сфере работы с персоналом. Исходя из содержания модели сложно выдвинуть предположения, почему именно она оказалась наиболее связанной с показатели эффективности работы. Можно лишь рекомендовать ее более глубокое изучение в рамках этих задач. Тем не менее, она содержательно отличается от других моделей, и в этом может быть ее преимущество. Стоит сказать, что в ответе на основной вопрос исследования нам было важнее разработать технологию сравнения моделей и апробировать ее на практике, чем построить окончательный рейтинг и выделить лучшие модели. Любые новые данные могут существенно повлиять на рейтинг и изменить положение моделей в нем, но нам важнее было показать, что модели можно и важно сравнивать друг с другом, в том числе чтобы отбирать наиболее применимые для практики. Следующие вопросы, которые нас интересовали, касались причин различия в валидности между моделями. Нам удалось найти несколько причин и оснований, которые могут влиять на валидность моделей. Первое основание – это подходы, в рамках которого модель может быть разработана. Наиболее продуктивными оказались клинический и профессиональные подходы. Возможно, первый подход позволяет выделять хорошо дифференцирующие людей качества в поведении (так как в основе своей имеет классификацию симптомов), второй изначально нацелен на диагностику успешности (поэтому также концентрируется на качествах, важных именно в работе). 41 Вторая причина, и на наш взгляд более существенная, заключается в дробности моделей и наличии узких, специфических качеств, которые позволяют модели лучше «цепляться» за столь же специфические критерии успешности и условия, в которых она проявляется. Более интегральные модели (такие как Big Five, EPI и MBTI) показывают худшие показатели валидности по этой же причине (что показано практически статистически значимо). Все это позволяет рекомендовать использовать в практике более специализированные и дробные модели личности. Стоит заметить, что многие модели имеют подфакторы (практически любые из перечисленных нами в исследовании моделей). Однако во многих исследованиях взаимосвязи ищутся на уровне интегральных факторов, что делает такую модель менее конкурентоспособной. Можно предположить, что широко распространенная в исследовательской практике модель Big Five была бы более валидна, если бы исследователи пытались отслеживать валидность не на уровне пяти интегральных факторов (в «угоду» содержательной валидности), а на уровне подфакторов (ориентируясь на критериальную валидность). К сожалению, нам не удалось ответить на другие вопросы исследования, которые касались валидности моделей и уровня позиции, типа инструмента и так далее, в связи с ограниченным объемом данных по этим критериям. Тем не менее, нам удалось найти несколько исследований, которые раскрывают ответы на некоторые вопросы, и здесь также хотелось бы их обсудить, в контексте общего вопроса – что же позволяет увеличить валидность модели личности? В первую очередь можно отметить исследование Tett Et al. 2003, в котором сравнивалась валидность интегральных показателей модели HPI (7 факторов), и так называемых HICs подфакторов (41). В результате исследования было показано, что подфакторы в гораздо большей степени объясняют вариативность критерия успешности, чем интегральные показатели модели. Во многом на этом в модели HPI и других строятся дополнительные показатели, прогнозирующие успешность в той или иной деятельности. Для нас же важно, что данной исследование показывает, как специфические факторы оказываются продуктивнее интегральных. Мета-анализ, который мы уже не раз упоминали в своей работе (Tett, Jackson & Rothstein, 1991) также дает ответы на некоторые вопросы, а именно – более высокие показатели 42 валидности моделей достигаются в исследованиях, в которых применяется предварительная процедура анализа работ (job analysis), и которые строятся по конфирматорному типу. То есть в тех исследованиях, где заранее анализируется работа и под нее подбирается модель или хотя бы гипотезы (какие качества будут нужны в работе), показатели валидности могут в разы превышать те, которые получаются в исследованиях обратного типа – без анализа работы и со случайной моделью. Таком образом, предварительное изучение работы и тех черт, которые могут влиять на эффективность позволяет подобрать лучшие модели, или как минимум – черты, и получить в итоге большую валидность для искомой ситуации. Подтверждают предыдущие оба предположения исследователи в статье Jenkins & Griffith, 2004. Любопытные данные были получены в исследовании Jackson & Corr, 1998. В ряде исследований авторы замеряли связь между показателями по личностным моделям и критериям успешности. На индивидуальном уровне данные связи были не велики с сравнимы со многими, которые были получены в нашем исследовании. Но как только исследователи выходили на группой уровень (например, сравнивали общей уровень экстраверсии у группы успешных и неэффективных), то показатели связи становились в разы больше. Данное направление тоже может быть весьма интересным для применения относительно моделей личности. Также в ряде исследований было показано, что валидность зависит не только от модели личности, но и от того, насколько сам инструмент, ее измеряющий, релевантен поведению именно на работе (Heller et al., 2009; Hunthausen et al., 2003). Исследования показывают, что методики, описывающие именно рабочее поведение в рамках модели имеют большие показатели валидности относительно эффективности на работе, чем просто те же черты в общих жизненных ситуациях. Таким образом, ряд наших предположений имеют косвенное подтверждение в исследованиях, но не относительно каждой из моделей, а относительно общей ситуации с моделями личности (обычно на примере модели Big Five). 43 Стоит рассмотреть и ограничения нашего исследования, которые безусловно могут влиять на полученные результаты. В первую очередь, нужно выделить проблему выборки. В нашем исследовании использовался первичный поиск данных, не были включены диссертации, внутренний поиск по литературе, письма авторам и т.п. Безусловно, расширение выборки может дать иные данные для исследования и результатов. Во вторую очередь, стоит упомянуть проблему кодирования данных, в которой участвовал один эксперт (в классическом мета-аналитическом исследовании привлекается группа экспертов и замеряется согласованность). В конце следует сказать о том, что не все модели личности были включены в этот анализ, и данные по некоторым также могли бы повлиять на общие результаты. В завершении хотелось бы обсудить два практических вопроса – что дает применение моделей личности на практике, что означает рейтинг моделей для решения практических задач. Ведь зачастую именно практика ставит запросы на точное и надежное прогнозирование в области изучения человеческих ресурсов, и стремится к максимальным показателям. Что касается применения моделей личности на практике, то в научной среде отчасти устоялось определенное двуполярное мнение. С одной стороны, диагностика личностных качеств не позволяет получить высокий уровень объясняемой дисперсии успешности в работе, с другой – так называемые integrity tests могут давать достаточно высокие показатели валидности (Schmidt & Hunter, 1998). На примере наших данных мы также попытались рассчитать эффективность от применения моделей личности на практике. Таблица 13. Отдача от личностных тестов на практике. Показатели по всем моделям (P mean) Абсолютная валидность Значимая валидность Дисперсия (low) как объяснение критерия эффективности 2% 8% Тейлор – Рассел (high) как точность отбора 58% 64% 44 Если брать средние значения по моделям, то процент объясненной дисперсии успешности (как самый строгий показатель) действительно будет достаточно низким – в самом лучшем случае всего 8%. Но если учитывать предположения Тейлора – Рассела о сложности работы и жесткости отбора на ту или иную должность, то в среднем точность отбора с применением модели личности может вырасти до 64% (Шмелев, 2013). Что касается применимости полученного рейтинга на практике, то мы склонны полагать, что модели из верхушки рейтинга (например, CPI), действительно могут оказаться более продуктивными с точки зрения валидности в общих универсальных ситуациях (с учетом специфики выборки и позиций, на которых были собраны данные). Но в целом любая модель может дать хорошие показатели валидности, если она 1) содержит много специфических факторов; 2) применяется вместе с анализом работы по конфиматорному типу; 3) специализирована относительно поведения на работе. Выводы По итогам исследования нами была разработана технология сравнения моделей личности друг с другом относительно валидности в практике оценки персонала, с применением метаанализа. Был построен рейтинг валидности моделей, наиболее валидная модель – CPI. В исследовании было показано, что чем больше показателей (факторов модели), тем выше ее валидность как способность измерять эффективность работы. Наиболее валидные модели личности были разработаны в рамках клинических и профессиональных подходов. По итогам исследования даны теоретические и практические рекомендации по применению результатов. 45 СПИСОК ЛИТЕРАТУРЫ 1. Alessandri, G., Vecchione, M. (2012). The higher-order factors of the Big Five as predictors of job performance. Personality and Individual Differences, 53, 779–784 2. Barrick, M. R., & Mount, M. K. (1991). The Big Five personality dimensions and job performance: A meta-analysis. Personnel Psychology, 44, 1-26. 3. Birkman International. (2007). Trends in Personality Assessments and Applications 4. Dakin, S., Armstrong, J.S. (1989). Predicting job performance: A comparison of expert opinion and research findings. International Journal of Forecasting, 5, 187-194 5. Field, A., Gillett, R. (2010). How to do a meta-analysis. British Journal of Mathematical and Statistical Psychology, 63, 665–694 6. Furnham, A., Stringfield, P. (1993). Personality and work perfomance: myers-briggs type indicator correlates of managerial performance in two cultures. Person. Individ. Dif Vol. 14, No. I, p. 145- 153 7. Gough, H.G. (1987) California Psychological Inventory Administrator's Guide. Palo Alto, CA: Consulting Psychologists Press, Inc. 8. Gough,H.G. & Bradley, P. (1996). "CPI Manual." Ed.3. Palo Alto, CA: Consulting Psychologists Press 9. Heller, D., Ferris, D. L., Brown, D., & Watson, D. (2009). The influence of work personality on job satisfaction: Incremental validity and mediation effects. Journal of Personality, 77, 1051–1084. 10. Hunter, J. E., & Hunter, R. F. (1984). Validity and utility of alternative predictors of job performance. Psychological Bulletin, 96, 72-98 11. Hunter, J. E., & Schmidt, F. L. (2004). Methods of meta-analysis: Correcting error and bias in research findings (2nd ed.). Newbury Park, CA: Sage 12. Hunthausen, J. M., Truxillo, D. M., Bauer, T. B., & Hammer, B. L. (2003). A field study of frame-of-reference effect on personality test validity. Journal of Applied Psychology, 88, 545–551. 13. Hurtz, G.M., & Donovan, J. J. (2000). Personality and Job Performance: The Big Five Revisited. Journal of Applied Psychology, Vol. 85, No. 6, 869-879 14. Jackson, C. J., Corr, P. J. (1998) Personality-performance correlations at work: Individual and aggregate levels of analyses. Personality and Individual Differences. Volume 24, Issue 6, Pages 815–820 46 15. Jenkins, M. & Griffith, R. (2004) Using Personality Constructs to Predict Performance: Narrow or Broad Bandwidth. Journal of Business and Psychology, Volume 19, Issue 2, pp 255-269 16. Jenkins, M., Griffith, R. (2004). Using personality constructs to predict performance: narrow or broad bandwidth. Journal of Business and Psychology, Vol. 19, No. 2 17. Johnson, M., Rowatt, W., Petrini, L. (2011). A new trait on the market: Honesty–Humility as a unique predictor of job performance ratings. Personality and Individual Differences, 50, 857–862 18. Linden, D., Nijenhuis, J., Bakker, A. (2010). The General Factor of Personality: A metaanalysis of Big Five intercorrelations and a criterion-related validity study. Journal of Research in Personality, 44, 315–327 19. Morey, L., Hopwood, C., Gunderson, J., Skodol, A., Shea, M., Yen, S., Stout, R., Zanarini, M., Grilo, C., Sanislow, C., Mcglashan, T.(2007). Comparison of alternative models for personality disorders. Psychological Medicine, 37, 983–994 20. Ones, D., Dilchert, S., Viswesvaran, C., Judge, T. (2007). In support of personality assessment in organizational settings. Personnel psychology, 60, 995–1027 21. Ones, D., Viswesvaran, C. (2004). Personnel Selection. Encyclopedia of Applied Psychology, V 3, 35-43 22. Rothstein, M.G., Goffin, R.D. (2006). The use of personality measures in personnel selection: What does current research support? Human Resource Management Review, 16, 155–180 23. Saggino, A. (2000). The Big Three or the Big Five? A replication study. Personality and Individual Differences, 28, 879-886 24. Schmidt, F. L., Hunter, J. E. (1998) The validity and utility of selection methods in personnel psychology: Practical and theoretical implications of 85 years of research findings. Psychological Bulletin, Vol 124(2), 262-274 25. Scroggins, W., Thomas, S., Morris, J. (2009). Public Personnel Management, Volume 38 No. 1 26. StudentHandout-Meta-Analysis.pdf. http://maamodt.asp.radford.edu/PSYC%20651/Student%20Handout%20-%20MetaAnalysis.pdf 47 27. Tett, R. P. Et al. (2003) Broad and Narrow Measures on Both Sides of the Personality-Job Performance Relationship. Journal of Organizational Behavior, Vol. 24, No. 3, pp. 335-356 28. Tett, R. P., Jackson, D. N., & Rothstein, M. (1991). Personality measures as predictors of job performance: A meta-analytic review. Personnel Psychology, 44, 703-742. 29. Дружинин В.Н (2003). Психология 21 века: Учебник для Вузов. ПЕР СЭ, 600-611 30. Хьелл, Л., Зиглер, Д. (1998). Теории личности. СпБ: Питер Ком, 575-602 31. Шмелев А.Г. (2013). Практическая тестология. Москва. 48 ПРИЛОЖЕНИЕ №1 Список публикаций, вошедших в исследование в качестве источника данных. № Авторы Название публикации 1 Furnham A. 2 Sager J. 3 Drew J. 4 Csoka L. Personality and occupational success-16PF correlates of cabin crew performance Personality and Salesforce Selection in the Pharmaceutical Industry Predicting turnover of police officers using the sixteen personality factor questionnaire Psychological profiles for predicting leader performance Selecting Successful Salespersons with the 16P 5 Stephen J. Guastello, Ph.D. 6 Stephen J. Guastello, Ph.D. 7 Stephen J. Guastello, Ph.D. 8 Stephen J. Guastello, Ph.D. 9 Stephen J. Guastello, Ph.D. 10 D. Bartram 11 D. Bartram 12 Jenkins M. 13 Super J. 14 Cooper & Green 15 Ferris 16 Lono 17 McMillan 18 Middleman Год публикации 1991 Модель 1986 16PF 2008 16PF 1993 16PF 1993 16PF Selecting Successful Salespersons with the 16P 1993 16PF Selecting Successful Salespersons with the 16P 1993 16PF Selecting Successful Salespersons with the 16P 1993 16PF Selecting Successful Salespersons with the 16P 1993 16PF The predictive validity of the EPI and 16PF for military flying training The predictive validity of the EPI and 16PF for military flying training Using Personality Constructs to Predict Performance: Narrow or Broad Bandwidth Using psychological tests to discriminate between “best” and “least best” correctional officers Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job 1995 16PF 1995 16PF 2004 16PF 1993 16PF 1976 16PF 1988 16PF 1976 16PF 1974 16PF 1988 16PF 16PF 49 19 Muecke-Gardner 20 Schuerger 21 Sormin 22 Toole 23 Whisman 24 Alker 25 Dozier 26 Geraghty 27 Glaskinos & Brennon 28 Hiatt & Hargrave 29 Hogan 30 Lafer 31 Mills & Bohhanon 32 Pugh 33 Gough & Hall 34 Gough & Hall 35 Kegel-Flom 36 Hall & McKinnon 37 Cook 38 Blake 39 D. Bartram Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Prediction of performance in medical school from the California Psychological Inventory Prediction of performance in medical school from the California Psychological Inventory Personality Traits in Effective Clinical Teachers Personality inventory correlates of creativity among architects Personality and Self-Rated Work Performance Validation of the Structural Scales of the CPI for Predicting the Performance of Junior Officers in the U. S. Coast Guard The predictive validity of the EPI and 16PF for 1987 16PF 1982 16PF 1984 16PF 1972 16PF 1978 16PF 1973 CPI 1980 CPI 1986 CPI 1971 CPI 1988 CPI 1971 CPI 1989 CPI 1980 CPI 1985 CPI 1964 CPI 1964 CPI 1983 1969 CPI CPI 2000 CPI 1993 CPI 1995 EPI 50 40 D. Bartram 41 Freixanet 42 Jackson 43 Jackson 44 Jackson 45 Burbeck & Furnham 46 Tett 47 Luther 48 Hayes 49 Hogan & Kaiser 50 Hogan 51 Hogan 52 Muchinsky 53 Foker 54 Ornstein 55 Sauls 56 Hall & McKinnon 57 McIntyre 58 Furnham A. military flying training The predictive validity of the EPI and 16PF for military flying training Personality profile of subjects engaged in high physical risk sports Personality-performance correlations at work Benefits of All Work and No Play: The Relationship Between Neuroticism and Performance as a Function of Resource Allocation Comparison between Eysenck's and Gray's models of personality in the prediction of motivational work criteria Personality and police selection- Trait differences in successful and non-successful applicants to the metropolitan police Broad and Narrow Measures on Both Sides of the Personality-Job Performance Relationship Integrity Testing and Job Performance within High Performance Work Teams: A Short Note Personality Correlates of Success in Total Quality Manufacturing Personality, leader behavior, and overdoing it Validation of a Personality Measure of Managerial Performance Validation of a Sales Representative Selection Inventory Validation of Personality Constructs for the Selection of Insurance Industry Employees Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality inventory correlates of creativity among architects Cognitive Style as an Antecedent to Adaptiveness, Customer Orientation, and SelfPerceived Selling Performance Personality and work performance- Myers- 1995 EPI 1991 EPI 1998 2006 EPI EPI 2000 EPI 1984 EPI 2003 HPI 2000 HPI 2000 HPI 2011 1992 HPI HPI 1992 HPI 1993 HPI 1988 MBTI 1988 MBTI 1987 MBTI 1969 MBTI 2000 MBTI 1993 MBTI 51 59 Furnham A. 60 Biderman 61 Roberts 62 Super J. 63 Arvey 64 Burke & Hall 65 Dicken 66 Gerton 67 Hiatt & Hargrave 68 Hoover 69 Mass 70 Matyas 71 McClelland & Rhodes 72 McClelland & Rhodes 73 McGraw 74 Walter 75 Hall & McKinnon 76 Bartol 77 Downey & Signori Briggs type indicator correlates of managerial performance in two cultures Personality and work performance- MyersBriggs type indicator correlates of managerial performance in two cultures Criterion-related validity of three personality questionnaires The personality and motivations of technological entrepreneurs Using psychological tests to discriminate between “best” and “least best” correctional officers Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality Measures as Predictors of Job Performance: A Meta-Analytic Review Personality inventory correlates of creativity among architects Predictive validation of the MMPI for smalltown police officers who fail The Selection of Prison Guards 1993 MBTI 2012 MBTI 1989 MBTI 1993 MMPI 1972 MMPI 1986 MMPI 1969 MMPI 1982 MMPI 1988 MMPI 1971 MMPI 1979 MMPI 1980 MMPI 1969 MMPI 1970 MMPI 1969 MMPI 1979 MMPI 1969 MMPI 1991 MMPI 1958 MMPI 52 78 Saville 79 Saville 80 Perkins & Corr 81 Warr 82 SHL 83 Whetzel 84 Saville Consulting Wave 85 Saville Consulting Wave 86 Saville Consulting Wave A Demonstration of the Validity of the Occupational Personality Questionnaire (OPQ) in the Measurement of Job Competencies Across Time and in Separate Organisations A Demonstration of the Validity of the Occupational Personality Questionnaire (OPQ) in the Measurement of Job Competencies Across Time and in Separate Organisations Can worriers be winners? The association between worrying and job performance Indirect Processes in Criterion-Related Validity Opq32 technical manual Linearity of Personality–Performance Relationships: A large-scale examination Professional styles handbook 1996 OPQ 1996 OPQ 2004 OPQ 2000 2009 2010 OPQ OPQ OPQ 2011 Wave Professional styles handbook 2011 Wave Professional styles handbook 2011 Wave 53