ЛЕКЦИЯ 4. ЭМПИРИЧЕСКАЯ ОЦЕНКА НАДЕЖНОСТИ Курс лекций проф. А. А. Алексеева по психометрике α Lee Joseph Cronbach 22 April 1916 – 1 October 2001 ТРИ МЕТОДА ОЦЕНКИ НАДЕЖНОСТИ 1. Надежность альтернативных форм 2. Тест-ретестовая надежность 3. Надежность как внутренняя согласованность ПРИМЕР ВЛИЯНИЯ ЭФФЕКТА ПЕРЕНОСА НА ОЦЕНКУ НАДЕЖНОСТИ С ПОМОЩЬЮ АЛЬТЕРНАТИВНЫХ ФОРМ ТЕСТА Форма 1 Форма 2 Исп. 𝑿𝑶𝟏 = 𝑿𝒕𝟏 + 𝑿𝒆𝟏 𝑿𝑶𝟐 = 𝑿𝒕𝟐 + 𝑿𝒆𝟐 1 14 = 15 + -1 13 = 15 + -2 2 17 = 14 + +3 17 = 14 + +3 3 11 = 13 + -2 12 = 13 + -1 4 10 = 12 + -2 11 = 12 + -1 5 14 = 11 + +3 14 = 11 + +3 6 9 = 10 + -1 8 = 10 + -2 𝑿 12,5 12,5 0 12,5 12,5 0 𝒔𝟐𝒙 7,58 2,92 4,67 7,58 2,92 4,67 𝑹𝑿𝑿 = 𝟐, 𝟗𝟐 = 𝟎, 𝟑𝟖 𝟕, 𝟓𝟖 𝑹𝑿𝑿 = 𝟐, 𝟗𝟐 = 𝟎, 𝟑𝟖 𝟕, 𝟓𝟖 𝒓𝒕𝟏𝒆𝟏 = 𝟎; 𝒓𝒕𝟐𝒆𝟐 = 𝟎; 𝒓𝒕𝟐𝒆𝟏 = 𝟎; 𝒓𝒕𝟏𝒆𝟐 = 𝟎; 𝒓𝒆𝟏𝒆𝟐 = 𝟎, 𝟗𝟑; 𝒓𝑶𝟏𝑶𝟐 = 𝟎, 𝟗𝟔 ФАКТОРЫ, ВЛИЯЮЩИЕ НА СТАБИЛЬНОСТЬ ИСТИННЫХ БАЛЛОВ Устойчивость психологических конструктов испытуемого Продолжительность периода между тестом и ретестом Отрезок жизни испытуемого, на который попадает период между тестом и ретестом ФАКТОРЫ, ВЛИЯЮЩИЕ НА НАДЕЖНОСТЬ КАК ВНУТРЕННЮЮ СОГЛАСОВАННОСТЬ Согласованность теста Длина теста между частями ФОРМУЛЫ ДЛЯ ОЦЕНКИ НАДЕЖНОСТИ МЕТОДОМ РАСЩЕПЛЕНИЯ ПОПОЛАМ где Формула Спирмэна-Брауна 𝟐𝒓𝒉𝒉 𝑹𝑿𝑿 = , 𝟏+𝒓𝒉𝒉 𝒓𝒉𝒉 - корреляция расщепления. Формула Рюлона 𝑹𝑿𝑿 где =𝟏− 𝒔𝟐𝑫 , 𝟐 𝒔𝒙 D – разность оценок по половинам теста; 𝒔𝟐𝑫 - дисперсия D (используемая в качестве приближенной оценки 𝒔𝟐𝒆 ); 𝒔𝟐𝒙 - дисперсия наблюдаемых баллов. ПРИМЕР ОЦЕНКИ ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ РАСЩЕПЛЕНИЕМ ПОПОЛАМ Расщепление 1 Исп. Пункты Расщепление 2 Общий балл Нечетный субтест Четный субтест Субтест 1и 4 Субтест 2 и3 1 2 3 4 1 4 4 5 4 17 9 8 8 9 2 5 2 4 2 13 9 4 7 6 3 5 4 2 2 13 7 6 7 6 4 2 3 1 2 8 3 5 4 4 𝑿 4 3,25 3 2,50 12,75 7 5,75 6,50 6,25 𝒔𝟐𝒙 1,50 0,69 2,50 0,75 10,19 6 2,19 2,25 3,19 Для расщепления 1: 𝒓𝒉𝒉 = 𝟎, 𝟐𝟖; 𝟐𝒓𝒉𝒉 𝟐 𝟎, 𝟐𝟖 𝟎, 𝟓𝟔 𝑹𝑿𝑿 = = = = 𝟎, 𝟒𝟒 𝟏 + 𝒓𝒉𝒉 𝟏 + 𝟎, 𝟐𝟖 𝟏, 𝟐𝟖 Для расщепления 2: 𝒓𝒉𝒉 = 𝟎, 𝟖𝟗; 𝑹𝑿𝑿 = 𝟐 𝟎, 𝟖𝟗 𝟏, 𝟕𝟖 = = 𝟎, 𝟗𝟒 𝟏 + 𝟎, 𝟖𝟗 𝟏, 𝟖𝟗 Субтест A Задания Исп. 1 2 3 4 5 Субтест B Σ D Задания 6 1-3-5 2-4-6 1 0 0 0 0 0 0 0 0 0 0 2 0 0 0 0 1 0 1 0 1 1 3 1 0 1 1 1 0 3 1 4 2 4 1 1 1 1 1 1 3 3 6 0 5 1 1 1 1 1 1 3 3 6 0 6 0 0 1 0 0 0 1 0 1 1 7 0 0 1 1 1 0 2 1 3 1 8 0 0 0 1 0 0 0 1 1 -1 9 1 0 1 1 1 0 3 1 4 2 10 0 1 0 1 0 1 0 3 3 -3 𝑿 1,6 1,3 2,9 𝒔𝟐𝒙 1,28 1,19 2,02 𝒓𝒉𝒉 = 𝟎, 𝟑𝟒; 𝑹𝑿𝑿 = 𝟐 𝟎,𝟑𝟒 𝟏+𝟎,𝟑𝟒 Формула Рюлона: 𝑹𝑿𝑿 = 𝟏 − 𝟎,𝟔𝟖 = 𝟏,𝟑𝟒 = 𝟎, 𝟓𝟏 𝒔𝟐𝑫 𝒔𝟐𝒙 𝟐,𝟐𝟒 = 𝟒,𝟎𝟖 = 𝟎, 𝟓𝟒 КОВАРИАЦИОННАЯ МАТРИЦА ДЛЯ ПРИМЕРА ОЦЕНКИ НАДЕЖНОСТИ КАК ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ Пункт 1 Пункт 2 Пункт 3 Пункт 4 Пункт 1 * 0,00 1,00 0,00 Пункт 2 0,00 * 0,00 0,38 Пункт 3 1,00 0,00 * 1,00 Пункт 4 0,00 0,38 1,00 * РАСЧЕТ КОЭФФИЦИЕНТА АЛЬФА КРОНБАХА ДЛЯ СЫРЫХ ДАННЫХ 𝜶 𝒄𝒊𝒊′ 𝒔𝟐𝒙 , где k – число заданий в тесте, 𝒄𝒊𝒊′ – сумма ковариаций, 𝒔𝟐𝒙 – дисперсия общего балла. 𝜶= 𝟒 𝟒,𝟕𝟔 𝟒−𝟏 𝟏𝟎,𝟏𝟗 𝜶 = 𝒌 𝒌−𝟏 = = 𝟏, 𝟑𝟑𝟑 × 𝟎, 𝟒𝟔𝟕 = 𝟎, 𝟔𝟐 𝒌 𝒌−𝟏 𝟏− 𝒔𝟐𝒊 𝒔𝟐𝒙 , где 𝒔𝟐𝒊 – дисперсия пунктов. 𝜶 = 𝟒 𝟒−𝟏 𝟏− 𝟓,𝟒𝟒 𝟏𝟎,𝟏𝟗 = 𝟏, 𝟑𝟑𝟑 × 𝟏 − 𝟎, 𝟓𝟑𝟑 = 𝟎, 𝟔𝟐. СТАНДАРТИЗОВАННЫЙ КОЭФФИЦИЕНТ АЛЬФА (ОБОБЩЕННАЯ ФОРМУЛА СПИРМЭНА-БРАУНА ) Пара пунктов 1и2 1и3 1и4 2и3 2и4 3и4 Корреляция 0,00 0,52 0,00 0,00 0,52 0,73 𝑹𝒙𝒙 𝒌𝒓𝒊𝒊′ = 𝟏 + 𝒌 − 𝟏 𝒓𝒊𝒊′ где k – количество пунктов в тесте, 𝒓𝒊𝒊′ – средняя межпунктовая корреляция. 𝑹𝒙𝒙 𝟒 × 𝟎, 𝟐𝟗𝟓 = = 𝟎, 𝟔𝟑 𝟏 + 𝟑 × 𝟎, 𝟐𝟗𝟓 СЫРАЯ АЛЬФА ДЛЯ БИНАРНЫХ ПУНКТОВ: KR20 (ФОРМУЛА КЬЮДЕРА-РИЧАРДСОНА 20) Испытуемый Пункт 1 2 3 4 Общий балл 1 1 1 1 1 4 2 1 0 1 0 2 3 1 1 0 0 2 4 0 1 0 0 1 Сумма 3 3 2 1 9 Среднее 0,75 075 0,50 0,25 2,25 Дисперсия 0,1875 0,1875 0,25 0,1875 1,1875 p 0,75 0,75 0,50 0,25 q 0,25 0,25 0,50 0,75 pq 0,1875 0,1875 0,25 0,1875 𝒌 𝒑𝒒 𝟒 𝟎, 𝟖𝟏𝟐𝟓 𝜶= 𝟏− 𝟐 = 𝟏− = 𝟎, 𝟒𝟐. 𝒌−𝟏 𝒔𝒙 𝟒−𝟏 𝟏, 𝟏𝟖𝟕𝟓 ИТОГОВАЯ ТАБЛИЦА ДЛЯ ДИСПЕРСИОННОГО АНАЛИЗА ХОЙТА ОТВЕТОВ К ЗАДАНИЯМ (СЛАЙД 8) 𝑹𝑿𝑿 𝑴𝑺испыт. − 𝑴𝑺остат. = 𝑴𝑺испыт. Источник дисперсии Суммы квадратов df Средние квадраты (MS) Испытуемые Задания Остаток 6,817 1,483 6,683 9 5 45 0,7574 0,2967 0,1485 𝑹𝑿𝑿 = 𝟎, 𝟕𝟓𝟕𝟒 − 𝟎, 𝟏𝟒𝟖𝟓 𝟎, 𝟕𝟓𝟕𝟒 = 0,8039 𝑹𝑿𝑿 𝒔𝟐𝒐 − 𝒔𝟐𝒆 𝒔𝟐𝒕 = = 𝟐 𝟐 𝒔𝒐 𝒔𝒆 ВЛИЯНИЕ ДЛИНЫ ТЕСТА НА ДИСПЕРСИЮ ИСТИННЫХ БАЛЛОВ 𝒔𝟐𝒕𝟏 – дисперсия истинных баллов первой части теста. 𝒔𝟐𝒕𝟐 – дисперсия истинных баллов второй части теста. 𝟐 𝒔𝒕−удвоен. = 𝒔𝟐𝒕𝟏 + 𝒔𝟐𝒕𝟐 + 𝟐𝒓𝒕𝟏𝒕𝟐 𝒔𝒕𝟏 𝒔𝒕𝟐 По условию параллельности тестов: 𝒓𝒕𝟏𝒕𝟐 =1; 𝒔𝒕𝟏 𝟐 тогда 𝒔𝒕𝟏 = 𝒔𝒕𝟐 = 𝒔𝒕−одна часть. 𝟐 𝟐 𝟐 𝒔𝒕−удвоен. = 𝟐𝒔𝒕−одна часть. +2𝒔𝒕−одна часть. 𝟐 𝟐 𝒔𝒕−удвоен. = 𝟒𝒔𝒕−одна часть. = 𝒔𝒕𝟐 , ВЛИЯНИЕ ДЛИНЫ ТЕСТА НА ДИСПЕРСИЮ ОШИБКИ 𝟐 𝒔𝒆𝟏 - дисперсия ошибки первой части теста 𝟐 𝒔𝒆𝟐 - дисперсия ошибки второй части теста 𝟐 𝒔𝒆−удвоен. = 𝒔𝟐𝒆𝟏 + 𝒔𝟐𝒆𝟐 + 𝟐𝒓𝒆𝟏𝒆𝟐 𝒔𝒆𝟏 𝒔𝒆𝟐 . = 0, то 𝒔𝟐𝒆−удвоен. = 𝒔𝟐𝒆𝟏 + 𝒔𝟐𝒆𝟐 . Так как 𝒓𝒆𝟏𝒆𝟐 𝟐 По условию параллельности тестов: 𝒔𝒆𝟏 𝟐 тогда 𝒔𝒆𝟏 𝟐 𝒔𝒆−удвоен. = 𝒔𝟐𝒆𝟐 = 𝒔𝟐𝒆−одна часть. = 2𝒔𝟐𝒆−одна часть. = 𝒔𝟐𝒆𝟐 , ВЛИЯНИЕ УДЛИНЕНИЯ ТЕСТА НА НАДЕЖНОСТЬ 𝑹𝒙𝒙−исход 𝑹𝒙𝒙−удвоен = = 𝒔𝟐𝒕−одна_часть 𝒔𝟐𝒕−одна_часть +𝒔𝟐𝒆−одна_часть 𝟒𝒔𝟐𝒕−одна_часть 𝟒𝒔𝟐𝒕−одна_часть +𝟐𝒔𝟐𝒆−одна_часть 𝑹𝒙𝒙−удвоен = 𝟐𝑹𝒙𝒙−исход 𝟏+𝑹𝒙𝒙−исход ФОРМУЛА ПРЕДСКАЗАНИЯ СПИРМЭНА-БРАУНА 𝑹𝒙𝒙−перераб = 𝒏𝑹𝒙𝒙−исход , 𝟏+ 𝒏−𝟏 𝑹𝒙𝒙−исход где 𝑹𝒙𝒙−перераб - оценка надежности переработанного теста, 𝒏 – коэффициент удлинения (укорочения) теста, 𝑹𝒙𝒙−исход оценка надежности исходной версии теста. 𝑹𝒙𝒙 𝒌𝒓𝒊𝒊′ = 𝟏 + 𝒌 − 𝟏 𝒓𝒊𝒊′ СВЯЗЬ МЕЖДУ ПУНКТАМИ ТЕСТА И НАДЕЖНОСТЬЮ (ПРИ СРЕДНЕЙ МЕЖПУНКТОВОЙ КОРРЕЛЯЦИИ = 0,30) ОЦЕНКА НАДЕЖНОСТИ БАЛЛОВ РАЗЛИЧИЯ (РАЗНОСТИ БАЛЛОВ) 𝑹𝒅 = 𝟎,𝟓 𝑹𝒙𝒙 +𝑹𝒚𝒚 −𝒓𝒙𝒚 , 𝟏−𝒓𝒙𝒚 где 𝑹𝒅 - надежность баллов различия, и 𝑹𝒚𝒚 - надежности двух наборов тестовых баллов, используемых для расчета баллов различия, 𝑹𝒙𝒙 - корреляция между баллами по двум тестовым ситуациям. 𝒓𝒙𝒚 ЗАВИСИМОСТЬ НАДЕЖНОСТИ БАЛЛОВ РАЗЛИЧИЯ ОТ НАДЕЖНОСТИ ТЕСТОВ И КОРРЕЛЯЦИИ МЕЖДУ НИМИ ВЛИЯНИЕ КОРРЕЛЯЦИИ ТЕСТОВ НА НАДЕЖНОСТЬ БАЛЛОВ РАЗЛИЧИЯ (ДЛЯ ПАРЫ ТЕСТОВ СО СРЕДНЕЙ НАДЕЖНОСТЬЮ 0,80)