α Л 4. Э

advertisement
ЛЕКЦИЯ 4.
ЭМПИРИЧЕСКАЯ ОЦЕНКА НАДЕЖНОСТИ
Курс лекций проф. А. А. Алексеева
по психометрике
α
Lee Joseph Cronbach
22 April 1916 – 1 October 2001
ТРИ МЕТОДА ОЦЕНКИ НАДЕЖНОСТИ

1. Надежность альтернативных форм

2. Тест-ретестовая надежность

3. Надежность как внутренняя
согласованность
ПРИМЕР ВЛИЯНИЯ ЭФФЕКТА ПЕРЕНОСА НА ОЦЕНКУ
НАДЕЖНОСТИ С ПОМОЩЬЮ АЛЬТЕРНАТИВНЫХ ФОРМ ТЕСТА
Форма 1
Форма 2
Исп.
𝑿𝑶𝟏
=
𝑿𝒕𝟏
+
𝑿𝒆𝟏
𝑿𝑶𝟐
=
𝑿𝒕𝟐
+
𝑿𝒆𝟐
1
14
=
15
+
-1
13
=
15
+
-2
2
17
=
14
+
+3
17
=
14
+
+3
3
11
=
13
+
-2
12
=
13
+
-1
4
10
=
12
+
-2
11
=
12
+
-1
5
14
=
11
+
+3
14
=
11
+
+3
6
9
=
10
+
-1
8
=
10
+
-2
𝑿
12,5
12,5
0
12,5
12,5
0
𝒔𝟐𝒙
7,58
2,92
4,67 7,58
2,92
4,67
𝑹𝑿𝑿 =
𝟐, 𝟗𝟐
= 𝟎, 𝟑𝟖
𝟕, 𝟓𝟖
𝑹𝑿𝑿 =
𝟐, 𝟗𝟐
= 𝟎, 𝟑𝟖
𝟕, 𝟓𝟖
𝒓𝒕𝟏𝒆𝟏 = 𝟎; 𝒓𝒕𝟐𝒆𝟐 = 𝟎; 𝒓𝒕𝟐𝒆𝟏 = 𝟎; 𝒓𝒕𝟏𝒆𝟐 = 𝟎; 𝒓𝒆𝟏𝒆𝟐 = 𝟎, 𝟗𝟑; 𝒓𝑶𝟏𝑶𝟐 = 𝟎, 𝟗𝟔
ФАКТОРЫ,
ВЛИЯЮЩИЕ НА
СТАБИЛЬНОСТЬ ИСТИННЫХ БАЛЛОВ
 Устойчивость
психологических
конструктов испытуемого
 Продолжительность периода между
тестом и ретестом
 Отрезок жизни испытуемого, на
который попадает период между
тестом и ретестом
ФАКТОРЫ, ВЛИЯЮЩИЕ НА НАДЕЖНОСТЬ
КАК ВНУТРЕННЮЮ СОГЛАСОВАННОСТЬ
 Согласованность
теста
 Длина
теста
между частями
ФОРМУЛЫ
ДЛЯ ОЦЕНКИ НАДЕЖНОСТИ
МЕТОДОМ РАСЩЕПЛЕНИЯ ПОПОЛАМ

 где
Формула Спирмэна-Брауна
𝟐𝒓𝒉𝒉
 𝑹𝑿𝑿 =
,
𝟏+𝒓𝒉𝒉
𝒓𝒉𝒉 - корреляция расщепления.

Формула Рюлона
 𝑹𝑿𝑿
 где
=𝟏−
𝒔𝟐𝑫
,
𝟐
𝒔𝒙
D – разность оценок по половинам
теста; 𝒔𝟐𝑫 - дисперсия D (используемая в
качестве приближенной оценки 𝒔𝟐𝒆 );
𝒔𝟐𝒙 - дисперсия наблюдаемых баллов.
ПРИМЕР ОЦЕНКИ ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ
РАСЩЕПЛЕНИЕМ ПОПОЛАМ
Расщепление 1
Исп.
Пункты
Расщепление 2
Общий
балл
Нечетный
субтест
Четный
субтест
Субтест
1и 4
Субтест
2 и3
1
2
3
4
1
4
4
5
4
17
9
8
8
9
2
5
2
4
2
13
9
4
7
6
3
5
4
2
2
13
7
6
7
6
4
2
3
1
2
8
3
5
4
4
𝑿
4
3,25
3
2,50
12,75
7
5,75
6,50
6,25
𝒔𝟐𝒙
1,50
0,69
2,50 0,75
10,19
6
2,19
2,25
3,19
Для расщепления 1: 𝒓𝒉𝒉 = 𝟎, 𝟐𝟖;
𝟐𝒓𝒉𝒉
𝟐 𝟎, 𝟐𝟖
𝟎, 𝟓𝟔
𝑹𝑿𝑿 =
=
=
= 𝟎, 𝟒𝟒
𝟏 + 𝒓𝒉𝒉 𝟏 + 𝟎, 𝟐𝟖 𝟏, 𝟐𝟖
Для расщепления 2: 𝒓𝒉𝒉 = 𝟎, 𝟖𝟗;
𝑹𝑿𝑿 =
𝟐 𝟎, 𝟖𝟗
𝟏, 𝟕𝟖
=
= 𝟎, 𝟗𝟒
𝟏 + 𝟎, 𝟖𝟗 𝟏, 𝟖𝟗
Субтест
A
Задания
Исп.
1
2
3
4
5
Субтест
B
Σ
D
Задания
6
1-3-5
2-4-6
1
0
0
0
0
0
0
0
0
0
0
2
0
0
0
0
1
0
1
0
1
1
3
1
0
1
1
1
0
3
1
4
2
4
1
1
1
1
1
1
3
3
6
0
5
1
1
1
1
1
1
3
3
6
0
6
0
0
1
0
0
0
1
0
1
1
7
0
0
1
1
1
0
2
1
3
1
8
0
0
0
1
0
0
0
1
1
-1
9
1
0
1
1
1
0
3
1
4
2
10
0
1
0
1
0
1
0
3
3
-3
𝑿
1,6
1,3
2,9
𝒔𝟐𝒙
1,28
1,19
2,02
𝒓𝒉𝒉 = 𝟎, 𝟑𝟒;
𝑹𝑿𝑿 =
𝟐 𝟎,𝟑𝟒
𝟏+𝟎,𝟑𝟒
Формула Рюлона: 𝑹𝑿𝑿 = 𝟏 −
𝟎,𝟔𝟖
= 𝟏,𝟑𝟒 = 𝟎, 𝟓𝟏
𝒔𝟐𝑫
𝒔𝟐𝒙
𝟐,𝟐𝟒
= 𝟒,𝟎𝟖 = 𝟎, 𝟓𝟒
КОВАРИАЦИОННАЯ
МАТРИЦА ДЛЯ ПРИМЕРА ОЦЕНКИ
НАДЕЖНОСТИ КАК ВНУТРЕННЕЙ СОГЛАСОВАННОСТИ
Пункт 1 Пункт 2 Пункт 3 Пункт 4
Пункт 1
*
0,00
1,00
0,00
Пункт 2
0,00
*
0,00
0,38
Пункт 3
1,00
0,00
*
1,00
Пункт 4
0,00
0,38
1,00
*
РАСЧЕТ КОЭФФИЦИЕНТА АЛЬФА КРОНБАХА
ДЛЯ СЫРЫХ ДАННЫХ
𝜶

𝒄𝒊𝒊′
𝒔𝟐𝒙
,
где k – число заданий в тесте, 𝒄𝒊𝒊′ – сумма
ковариаций, 𝒔𝟐𝒙 – дисперсия общего балла.

𝜶=
𝟒
𝟒,𝟕𝟔
𝟒−𝟏 𝟏𝟎,𝟏𝟗
𝜶

=
𝒌
𝒌−𝟏
=
= 𝟏, 𝟑𝟑𝟑 × 𝟎, 𝟒𝟔𝟕 = 𝟎, 𝟔𝟐
𝒌
𝒌−𝟏
𝟏−
𝒔𝟐𝒊
𝒔𝟐𝒙
,
где 𝒔𝟐𝒊 – дисперсия пунктов.

𝜶 =
𝟒
𝟒−𝟏
𝟏−
𝟓,𝟒𝟒
𝟏𝟎,𝟏𝟗
= 𝟏, 𝟑𝟑𝟑 × 𝟏 − 𝟎, 𝟓𝟑𝟑 = 𝟎, 𝟔𝟐.
СТАНДАРТИЗОВАННЫЙ КОЭФФИЦИЕНТ АЛЬФА
(ОБОБЩЕННАЯ ФОРМУЛА СПИРМЭНА-БРАУНА )
Пара
пунктов
1и2
1и3
1и4
2и3
2и4
3и4
Корреляция
0,00
0,52
0,00
0,00
0,52
0,73
𝑹𝒙𝒙
𝒌𝒓𝒊𝒊′
=
𝟏 + 𝒌 − 𝟏 𝒓𝒊𝒊′
где k – количество пунктов в тесте, 𝒓𝒊𝒊′ – средняя межпунктовая
корреляция.
𝑹𝒙𝒙
𝟒 × 𝟎, 𝟐𝟗𝟓
=
= 𝟎, 𝟔𝟑
𝟏 + 𝟑 × 𝟎, 𝟐𝟗𝟓
СЫРАЯ
АЛЬФА ДЛЯ БИНАРНЫХ ПУНКТОВ:
KR20
(ФОРМУЛА КЬЮДЕРА-РИЧАРДСОНА 20)
Испытуемый
Пункт
1
2
3
4
Общий
балл
1
1
1
1
1
4
2
1
0
1
0
2
3
1
1
0
0
2
4
0
1
0
0
1
Сумма
3
3
2
1
9
Среднее
0,75
075
0,50
0,25
2,25
Дисперсия
0,1875
0,1875
0,25
0,1875
1,1875
p
0,75
0,75
0,50
0,25
q
0,25
0,25
0,50
0,75
pq
0,1875
0,1875
0,25
0,1875
𝒌
𝒑𝒒
𝟒
𝟎, 𝟖𝟏𝟐𝟓
𝜶=
𝟏− 𝟐 =
𝟏−
= 𝟎, 𝟒𝟐.
𝒌−𝟏
𝒔𝒙
𝟒−𝟏
𝟏, 𝟏𝟖𝟕𝟓
ИТОГОВАЯ ТАБЛИЦА ДЛЯ ДИСПЕРСИОННОГО
АНАЛИЗА ХОЙТА ОТВЕТОВ К ЗАДАНИЯМ
(СЛАЙД 8)
𝑹𝑿𝑿
𝑴𝑺испыт. − 𝑴𝑺остат.
=
𝑴𝑺испыт.
Источник
дисперсии
Суммы
квадратов
df
Средние
квадраты
(MS)
Испытуемые
Задания
Остаток
6,817
1,483
6,683
9
5
45
0,7574
0,2967
0,1485
𝑹𝑿𝑿 = 𝟎, 𝟕𝟓𝟕𝟒 − 𝟎, 𝟏𝟒𝟖𝟓 𝟎, 𝟕𝟓𝟕𝟒 = 0,8039
𝑹𝑿𝑿
𝒔𝟐𝒐 − 𝒔𝟐𝒆 𝒔𝟐𝒕
=
= 𝟐
𝟐
𝒔𝒐
𝒔𝒆
ВЛИЯНИЕ ДЛИНЫ ТЕСТА НА ДИСПЕРСИЮ
ИСТИННЫХ БАЛЛОВ

𝒔𝟐𝒕𝟏 – дисперсия истинных баллов первой части теста.

𝒔𝟐𝒕𝟐 – дисперсия истинных баллов второй части теста.
𝟐
 𝒔𝒕−удвоен.
= 𝒔𝟐𝒕𝟏 + 𝒔𝟐𝒕𝟐 + 𝟐𝒓𝒕𝟏𝒕𝟐 𝒔𝒕𝟏 𝒔𝒕𝟐
По условию параллельности тестов: 𝒓𝒕𝟏𝒕𝟐 =1; 𝒔𝒕𝟏
𝟐
 тогда 𝒔𝒕𝟏 = 𝒔𝒕𝟐 = 𝒔𝒕−одна часть.
𝟐
𝟐
𝟐
 𝒔𝒕−удвоен. = 𝟐𝒔𝒕−одна часть. +2𝒔𝒕−одна часть.
𝟐
𝟐
 𝒔𝒕−удвоен. = 𝟒𝒔𝒕−одна часть.

= 𝒔𝒕𝟐 ,
ВЛИЯНИЕ ДЛИНЫ ТЕСТА НА ДИСПЕРСИЮ
ОШИБКИ
𝟐
 𝒔𝒆𝟏 - дисперсия ошибки первой части теста
𝟐
 𝒔𝒆𝟐 - дисперсия ошибки второй части теста
𝟐
 𝒔𝒆−удвоен.
= 𝒔𝟐𝒆𝟏 + 𝒔𝟐𝒆𝟐 + 𝟐𝒓𝒆𝟏𝒆𝟐 𝒔𝒆𝟏 𝒔𝒆𝟐 .
= 0, то 𝒔𝟐𝒆−удвоен. = 𝒔𝟐𝒆𝟏 + 𝒔𝟐𝒆𝟐 .

Так как 𝒓𝒆𝟏𝒆𝟐

𝟐
По условию параллельности тестов: 𝒔𝒆𝟏

𝟐
тогда 𝒔𝒆𝟏
𝟐
 𝒔𝒆−удвоен.
= 𝒔𝟐𝒆𝟐 = 𝒔𝟐𝒆−одна часть.
= 2𝒔𝟐𝒆−одна часть.
= 𝒔𝟐𝒆𝟐 ,
ВЛИЯНИЕ УДЛИНЕНИЯ ТЕСТА НА НАДЕЖНОСТЬ
 𝑹𝒙𝒙−исход
 𝑹𝒙𝒙−удвоен
=
=
𝒔𝟐𝒕−одна_часть
𝒔𝟐𝒕−одна_часть +𝒔𝟐𝒆−одна_часть
𝟒𝒔𝟐𝒕−одна_часть
𝟒𝒔𝟐𝒕−одна_часть +𝟐𝒔𝟐𝒆−одна_часть
 𝑹𝒙𝒙−удвоен
=
𝟐𝑹𝒙𝒙−исход
𝟏+𝑹𝒙𝒙−исход
ФОРМУЛА ПРЕДСКАЗАНИЯ СПИРМЭНА-БРАУНА
 𝑹𝒙𝒙−перераб
=
𝒏𝑹𝒙𝒙−исход
,
𝟏+ 𝒏−𝟏 𝑹𝒙𝒙−исход
 где 𝑹𝒙𝒙−перераб - оценка надежности
переработанного теста, 𝒏 – коэффициент
удлинения (укорочения) теста, 𝑹𝒙𝒙−исход оценка надежности исходной версии теста.

𝑹𝒙𝒙
𝒌𝒓𝒊𝒊′
=
𝟏 + 𝒌 − 𝟏 𝒓𝒊𝒊′
СВЯЗЬ МЕЖДУ ПУНКТАМИ ТЕСТА И НАДЕЖНОСТЬЮ
(ПРИ СРЕДНЕЙ МЕЖПУНКТОВОЙ КОРРЕЛЯЦИИ = 0,30)
ОЦЕНКА НАДЕЖНОСТИ БАЛЛОВ РАЗЛИЧИЯ
(РАЗНОСТИ БАЛЛОВ)
𝑹𝒅

=
𝟎,𝟓 𝑹𝒙𝒙 +𝑹𝒚𝒚 −𝒓𝒙𝒚
,
𝟏−𝒓𝒙𝒚
где 𝑹𝒅 - надежность баллов различия,
и 𝑹𝒚𝒚 - надежности двух наборов
тестовых баллов, используемых для
расчета баллов различия,
 𝑹𝒙𝒙
- корреляция между баллами по двум
тестовым ситуациям.
 𝒓𝒙𝒚
ЗАВИСИМОСТЬ НАДЕЖНОСТИ БАЛЛОВ РАЗЛИЧИЯ ОТ
НАДЕЖНОСТИ ТЕСТОВ И КОРРЕЛЯЦИИ МЕЖДУ НИМИ
ВЛИЯНИЕ КОРРЕЛЯЦИИ ТЕСТОВ НА НАДЕЖНОСТЬ
БАЛЛОВ РАЗЛИЧИЯ (ДЛЯ ПАРЫ ТЕСТОВ СО
СРЕДНЕЙ НАДЕЖНОСТЬЮ 0,80)
Download