Теория вероятностей и медицинская статистика

реклама
Теория вероятностей и
медицинская статистика
Дисперсионный анализ
Анализ выживаемости
Лекция №8
Кафедра медицинской информатики РУДН
—  Дисперсионный анализ (ANOVA) применяется для изучения
влияния одной или нескольких качественных независимых
переменных (факторов) на одну зависимую количественную
переменную (переменную отклика).
—  Зависимая переменная измеряется в шкале отношений,
интервалов или порядка, а влияющие переменные имеют
нечисловую природу (шкала наименований).
—  Основной целью дисперсионного ана лиза являет ся
исследование значимости различия между средними с
помощью сравнения (анализа) дисперсий. Разделение общей
дисперсии на несколько источников, позволяет сравнить
дисперсию, вызванную различием между группами, с
дисперсией, вызванной внутригрупповой изменчивостью.
—  Дисперсионный анализ разработан в 20-х годах XX-го века
английским математиков и генетиком Рональдом Фишером.
Сэр Рональд Эйлмер Фишер
(Sir Ronald Aylmer Fisher)
17.02.1890-29.07.1962
Конфликт сам по себе не есть проблема, проблема в
том, что нам делать с нашими различиями. Лучший
способ предупредить конфликт - не допустить его.
Р. Фишер
Пусть имеется несколько независимых выборок, произведенных из
нормальных генеральных совокупностей с неизвестными средними и
неизвестными одинаковыми дисперсиями.
Найдем среднее и дисперсию для каждой выборки, а также общее среднее и
общую дисперсию.
Результаты представим графически.
X1
x11
…
xn11
X2
x12
…
xn22
X3
x13
…
xn33
X4
x14
…
xn44
X1
X2
X3
X4
X
Дисперсия выборочных средних меньше чем дисперсия в
каждой из выборок. – Выборки не различаются?!
Дисперсия выборочных средних превышает дисперсию
в каждой из выборок. – Выборки различаются?!
Виды дисперсионного анализа
Дисперсионный анализ
Однофакторный
Двухфакторный
Многофакторный
Один фактор, имеющий две
или более градаций (уровней)
Два фактора, каждый из
которых имеет две или более
уровней
Более двух факторов или
взаимодействие факторов
Условия проведения дисперсионного анализа
1. 
2. 
3. 
Каждая выборка независима от остальных и извлечена случайным образом из
исследуемой совокупности.
Количественные признаки нормально распределенные.
Дисперсии всех выборок равны.
При нарушении любого из этих условиях необходимо использовать
непараметрические методы анализа (например, критерий Краскела-Уоллиса,
критерий Фридмана, ковариационный анализ).
Однако: дисперсионный анализ устойчив к нарушению 3-го условия
(равенство дисперсий) при большом числе наблюдений и равенстве
численности групп (объемов выборок).
Однофакторный дисперсионный анализ
Пусть исследуется влияние некоторого фактора А,
имеющего m постоянных уровней, на
формирование значений некоторой нормально
распределенной величины Х, причем на всех
уровнях распределение значений величины Х
является нормальным, а генеральные дисперсии
неизвестны, но одинаковы.
Пусть также количество проведенных наблюдений
при действии фактора на каждом из его уровней
одинаково и равно n, полученные результаты
представлены в таблице.
Номер наблюдения
Уровень фактора
А1
А2
…
Аm
1
x11
x21
…
xm1
2
x12
x22
…
xm2
…
…
…
…
…
n
x1n
x2n
…
xmn
X 1.
X 2.
…
X m.
Групповое среднее
Общее среднее
X ..
Однофакторный дисперсионный анализ
—  Расчет средних и дисперсий.
n
ni
1
Xi. = ∑ xij
ni j=1
m
X.. =
Среднее для каждого
уровня фактора
nj
1
xij
∑
∑
N j=1 i=1
Общее среднее
2
Stotal
1 m j
=
(xij − X.. )2
∑
∑
N −1 j=1 i=1
m
1
Sgr2 =
ni (xi. − X.. )2
∑
m −1 i=1
2
Serr
=
Общая дисперсия
Межгрупповая
(факторная) дисперсия
1 #
2
2 %
(N
−1)⋅
S
−
(m
−1)⋅
S
total
gr &
$
N −m
Остаточная дисперсия
Однофакторный дисперсионный анализ
Алгоритм проведения анализа:
1. Формулируем гипотезы
H0: µ1=µ2=…=µm (групповые средние равны; фактор
не влияет на зависимую переменную)
H1: групповые средние не равны; фактор влияет на
зависимую переменную
2. Вычисляем средние значения и дисперсии
3. Если Sgr ≤ Serr – принимается нулевая гипотеза.
Если Sgr > Serr – вычисляем отношение (статистику) Фишера.
S 2gr
F= 2
S err
4. Задаем уровень значимости α и по таблицам находим Fкрит с
числом степеней свободы k=m-1, l=N-m
Если F < Fкрит – принимаем нулевую гипотезу
5. Проводим сравнение F и Fкрит:
Если F ≥ Fкрит – принимает альтернативную
гипотезу
Двухфакторный дисперсионный анализ
Иерархическая модель
Факторы не равнозначны между собой;
—  Один фактор – главный, второй –
подчиненный;
—  Каждый уровень главного факторы может
быть разделен на подуровни подчиненного (но
не обязательно все).
— 
Перекрестная модель
I и II факторы равнозначны;
—  Для каждого уровня I фактора существуют
все уровни II фактора;
—  Кроме оценки влияния факторов изучается
также межфакторное взаимодействие –
одновременное влияние двух факторов сразу
— 
II1
II2
II3
II4
I1
xxx
xxxxx
xxxx
xxxxx
I2
xxx
xxxx
xxxxx
xxxxxx
I3
xxxx
xxxxxx
xxxx
xxxxx
Двухфакторный дисперсионный анализ. Иерархическая модель.
Вклад i-го уровня главного фактора в
значение зависимой переменной(дисперсию)
Значение зависимой
переменной
Индивидуальный вклад остаточного
эффекта – факторов, не включенных в
модель анализа
Xijt = µ + ξ i + δij + zijt
Общее среднее
Вклад j-го подуровня i-го уровня главного
фактора (вклад подчиненного факторы)
Двухфакторный дисперсионный анализ. Иерархическая модель.
—  Расчет средних и дисперсий.
Xi..
Xij.
X...
2
total
S
Среднее i-го уровня
главного фактора
Среднее j-го уровня подчиненного
фактора i-го уровня главного фактора
1 k
=
N i (x i.. − x... )2
∑
k −1 j=1
2
SmainF
2
depF
S
=
k
∑m − k
2
(x
−
x
)
ij.
i..
∑∑
i=1 j=1
Дисперсия
подчиненного фактора
i
Общее среднее
i=1
2
Serr
=
Общая дисперсия
mi
k
1
Дисперсия главного
фактора
k
1
k
N.. − ∑ mi
i=1
mi
nij
∑∑∑(x
ijt
− x i.. )2
i=1 j=1 t=1
Остаточная дисперсия
Двухфакторный дисперсионный анализ. Иерархическая модель.
Гипотезы. Проверка гипотез.
H01: главный фактор не влияет на зависимую
переменную
H11: главный фактор влияет на зависимую переменную
Статистика критерия
F1 =
2
mainF
2
err
S
S
Если F1 < Fкрит (α, k, l)– принимаем нулевую гипотезу
Если F 1≥ Fкрит (α, k, l)– принимает альтернативную
гипотезу
Числа степеней свободы: k=(k-1), l = (N..-Σmi)
H02: подчиненный фактор не влияет на зависимую
переменную
H12: подчиненный фактор влияет на зависимую
переменную
Статистика критерия
2
S
F 2 = depF
2
S err
Числа степеней свободы: k=(Σmi-k), l = (N..-Σmi)
Если F2 < Fкрит (α, k, l)– принимаем нулевую гипотезу
Если F2≥ Fкрит (α, k, l)– принимает альтернативную
гипотезу
Двухфакторный дисперсионный анализ. Перекрестная модель.
Значение зависимой
переменной
Вклад I фактора в значение зависимой
переменной(дисперсию)
Индивидуальный вклад остаточного
эффекта – факторов, не включенных в
модель анализа
Xijt = µ + ξ i + η j + (ξη )ij + zijt
Вклад межфакторного
взаимодействия
Общее среднее
Вклад II фактора в значение зависимой
переменной
Двухфакторный дисперсионный анализ. Перекрестная модель.
—  Расчет средних и дисперсий.
Xi..
X. j.
X...
Среднее i-го уровня I фактора
Среднее j-го уровня II фактора
Общее среднее
r
1
SI2 =
nc∑ N i (x i.. − x... )2
r −1 i=1
Дисперсия I фактора
c
1
SI2 =
nr∑ N i (x. j. − x... )2
r −1 j=1
2
SI,II
Дисперсия II фактора
r c
1
=
n∑∑ (x ij. − x i.. − x. j. + x... )2
(r −1)(c −1) i=1 j=1
Дисперсия межфакторная
Xij.
2
total
S
Среднее i-го уровня I фактора j-го
уровня II фактора (среднее в ячейке)
Общая дисперсия
2
Serr
r c n
1
=
(x ijt − x... )2
∑
∑
∑
rc(n −1) i=1 j=1 t=1
Остаточная дисперсия
Двухфакторный дисперсионный анализ. Перекрестная модель.
Гипотезы. Проверка гипотез.
H01: I фактор не влияет на зависимую переменную
H11: I фактор влияет на зависимую переменную
Статистика критерия
F1 =
2
I
2
err
S
S
Если F1 < Fкрит (α, k, l)– принимаем нулевую гипотезу
Если F 1≥ Fкрит (α, k, l)– принимает альтернативную гипотезу
Числа степеней свободы: k=(r-1), l = rc(n-1)
H02: II фактор не влияет на зависимую переменную
H12: II фактор влияет на зависимую переменную
Статистика критерия
S 2II
2
F = 2
S err
Если F2 < Fкрит (α, k, l)– принимаем нулевую гипотезу
Если F2≥ Fкрит (α, k, l)– принимает альтернативную гипотезу
Числа степеней свободы: k=(c=1), l = rc(n-1)
H012: нет межфакторного влияния
H112: есть межфакторное влияние
Статистика критерия
Числа степеней свободы: k=(c=1)(c-1), l = rc(n-1)
Если F2 < Fкрит (α, k, l)– принимаем нулевую гипотезу
Если F2≥ Fкрит (α, k, l)– принимает альтернативную гипотезу
S 2I,II
F = 2
S err
12
Анализ выживаемости
—  Особый случай статистической модели, в котором математическими
методами учитывается длительность наблюдения и возможность выбытия
со временем по причинам, непосредственно не связанным с изучаемым
исходом.
—  Другие многофакторные методы технически не способны учитывать
выбывание со временем.
Примеры:
¡ 
¡ 
¡ 
Развитие рака у рабочих на вредном производстве со стажем 20 лет и более
Доля пациентов на инвалидности через 3 года после перелома шейки бедра
Вероятность клинически выраженного клещевого энцефалита в течение года после
вакцинации
Данные в анализе выживаемости
—  С точки зрения статистики в анализе выживаемости участвуют три вида данных:
¡ 
¡ 
¡ 
Собственно время до наступления события – количественная переменная, выраженная в годах,
месяцах, днях, часах.
Индикатор события (цензор) – качественная переменная, указывающая, произошло ли основное
событие
Факторы, влияющие на выживаемость, то есть, частоту и временное распределение событий
—  Для тех наблюдений, у которых событие произошло (цензор=1), время
представляет собой время до события (исхода), который либо необратим, либо
по своей природе происходит однократно для каждого наблюдения
—  – Для тех наблюдений, у которых событие не произошло (цензор=0) –
«цензурированные наблюдения», время представляет собой тот отрезок времени,
на котором удавалось поддерживать контакт с пациентом, собирая
значимую для исследования информацию – время до потери из-под наблюдения.
Полные и неполные данные
Примеры цензурированных данных
1.  Время, отведенное на исследование закончилось, но у части пациентов, лаб. животных еще
не наступил «исход»;
2.  В ходе исследования пациент вышел из-под наблюдения врача (переехал, сменил врача);
3.  Объект наблюдения погиб по причине, не связанной с исследованием (попал под машину,
мушку съела кошка)
Кривая выживаемости
—  Первый этап анализа выживаемости сводится к построению таблиц времени жизни и
графика функции выживаемости (кривой выживаемости)
—  Выживаемость S(t) – это вероятность прожить время большее t с момента начала
наблюдения:
S(t) = P(T>t)
—  Так как вычислить P(T>t) зачастую невозможно, используют следующую формулу:
S(t) = 1-P(T<t)
В анализе выживаемости для оценки среднего
используется медиана выживаемости – время
до которого дожили половина наблюдаемых- ,
но не среднее значение.
Пример высокой и низкой выживаемости
Таблицы времени жизни
Для составления таблиц времени жизни
используют способ Катлера-Эдерера, либо
Каплана-Мейера.
1.  Способ Катлера-Эдерера применяется при
большом количестве наблюдений; при этом
временная шкала разбивается на одинаковые
интервалы, так чтобы в каждом из них
наступал хотя бы один «исход».
2.  Способ Каплана-Мейера применяют при
небольшом количестве наблюдений; в качестве
следующего нтервала берется тот момент
времени, когда наступает сл едующ ее
событие.
Построение кривой выживаемости. Пример.
— 
10 пациентов с острым приступом некоей болезни вошли в исследуемую группу на протяжении всего
исследования (15 месяцев). Все 10 пациентов дали отклик на лечение, и у них наступила ремиссия.
Необходимо изучить продолжительность времени ремиссия (событием будем считать рецидив
заболевания).
О каждом пациенте известно:
1.  В р е м я н а с ту п л е н и я р е м и с с и и
(начало наблюдения) - № месяца
относительно начала исследования;
2.  Время окончания наблюдения за
данным больным - № месяца
относительно начала исследования;
3.  Произошло событие (рецидив) или
не произошло на момент окончания
наблюдения.
Для построения кривой выживаемости
необходимо рассчитать
п р од ол ж и тел ь н о с т ь н а бл ю д е н и я
(ремиссии).
Пациент
Начало
наблюдения
Конец
наблюдения
Продолжительность
ремиссии
A
1
8
8-1= 7
рецидив
B
1
13
13 -1 = 12
рецидив
C
2
9
9-2= 7
рецидив
D
3
15
15-3 = 12
выбыл
E
3
14
14-3 = 11
выбыл
F
6
14
14-6 = 8
рецидив
G
6
15
15-6 = 9
рецидив
H
8
14
14-8 = 6
рецидив
I
8
15
15-8 = 7
выбыл
J
12
14
14-12 = 2
рецидив
Событие
Построение кривой выживаемости. Пример.
Составим таблицу времени жизни по способу Каплан-Мейера.
6
рецидив
A
7
рецидив
I
7
выбыл
i
C
7
рецидив
2
F
8
рецидив
G
9
E
ni
di
wi
qi
pi=1-qi
Si=si-1*Si
10
1
0
1/10
9/10
9/10
0,715
1,085 (1)
6
9
1
0
1/9
8/9
9/10*8/9=8/10
0,557
1,043 (1)
рецидив
7
8
2
1
2/8
6/8
6/8*8/10=6/10
0,314
0,886
11
выбыл
8
5
1
0
1/5
4/5
4/5*6/10=12/25
0,169
0,791
D
12
выбыл
9
4
1
0
1/4
3/4
12/25*3/4=9/25
0,051
0,669
B
12
рецидив
11
3
0
1
0
1
9/25
12
2
1
1
1/2
1/2
9/25*1/2=9/50
-0,113 (0)
0,473
Пациент
"
%
di
SE = Si ∑$
'
# ni (ni − di ) &
Формула для расчета доверительных интервалов
Доверительный
интервал
Кумулятивная доля
H
Доля пациентов без
рецидива
рецидив
Доля пациентов с
рецидивом
2
Кол-во выбываний
J
Кол-во рецидивов
Событие
Кол-во больных к
началу месяца
Прод-ть
ремиссии
Момент времени
— 
Si-1,96*SE
Si+1,96*SE
Построение кривой выживаемости. Пример.
i
Si
2
Доверительный
интервал
Кумулятивная доля
Построим кривую выживаемости (с помощью программы Stata 11.2, StataCorp LP)
Момент времени
— 
Si-1,96*SE
Si+1,96*SE
9/10
0,715
1,085 (1)
6
8/10
0,557
1,043 (1)
7
6/10
0,314
0,886
8
12/25
0,169
0,791
9
9/25
0,051
0,669
11
9/25
0,051
0,669
12
9/50
-0,113 (0)
0,473
Сравнение двух кривых выживаемости
В клинических исследованиях часто возникает задача сравнить выживаемость в разных группах больных.
Пример:
¡ 
¡ 
Сравнить эффективность двух способов лечения: Для лечения лейкоза применяется пересадка костного мозг. Донорами могут
стать близкие родственники пациента (аллотрансплантация), либо сам пациент (аутотрансплантация). Требуется сравнить
выживаемость после алло- и аутотрансплантации.
Протестировать новый лекарственный препарат: Проводится испытания нового лекарства для лечения стенокардии. Имеется две
группы пациентов: в первой группе больные принимают новый препарат, во второй – плацебо, или старый препарат. Исходом
является приступ стенокардии (острый инфаркт миокарда). Необходимо оценить эффективность нового лекарственного
препарата (время до наступления приступа/инфаркта).
Рассматриваются следующие гипотезы:
H0: S1(t)=S2(t)
H1: S1(t) ≠ S2(t);
S1(t) > S2(t);
S1(t) < S2(t)
• 
Выживаемость в группах не отличается (методы лечения одинаковы по своей
эффективности)
• 
• 
• 
Выживаемость в группах различается (методы лечения имеют разную эффективность);
Выживаемость в группе I выше (1-й метод лечения лучше);
Выживаемость в группе II выше (2-й метод лечения лучше);
Для проверки гипотез применяют логранговый критерий и критерий Гехана.
Сравнение двух кривых выживаемости. Логранговый тест.
—  Логранговый критерий или логарифмический
ранговый критерий (англ. Logrank test) – это
непараметричесикй критерий, используемый для
сравнения двух кривых выживаемости. Наиболее
часто критерий часто применяется в медицине и
страховании.
—  Л о г р а н г о в ы й т е с т – в п е р в ы е п р е д л о ж е н
американским биостатистиком Натаном Мантелем.
Nathan Mantel
(16.02.1919 – 26.05.2002)
Сравнение двух кривых выживаемости. Логранговый тест.
Алгоритм применения логрангового критерия:
1. Составление общей таблицы выживаемости для обеих групп.
2. Расчет ожидаемого числа исходов для одной из групп (любой) по формуле:
где nit – число наблюдавшихся в группе в момент времени t;
dNt – общее число исходов в этот момент в обеих группах;
nNt – общее число наблюдавшихся к этому моменту времени.
3. Вычисление суммы разностей наблюдаемого и ожидаемого числа исходов и
стандартного отклонения:
Eit =
U L = ∑ (d it − E it )
SUL =
4. Статистика критерия вычисляется по формуле (с поправкой Йейтса):
и распределена по нормальному закону
n it d Nt
n Nt
∑
n1t n2t d Nt (nNt − d Nt )
2
nNt
(nNt −1)
Z=
UL −
1
2
SUL
5. Задаем уровень значимости и находим zкрит
для α=0,05 zкрит=1,96
6. Проводим сравнение Z и Zкрит:
если |Z|<Zкрит – принимаем H0
если |Z|≥Zкрит – принимает H1
Сравнение двух кривых выживаемости. Логранговый тест. Пример.
Кол-во больных к
началу месяца
Кол-во рецидивов
Кол-во больных к
началу месяца
Кол-во рецидивов
Ожидаемое число
рецидивов в I группе
t
n1t
d1t
n2t
d2t
nNt
dNt
n1t d Nt
n Nt
Слагаемое для SUL
Кол-во рецидивов
Общая
группа
Кол-во больных к
началу месяца
II группа
Момент времени
I группа
Слагаемое для UL
После операций 10 пациентов случайным образом были разделены на две группы: в одной группе проводилась определенная
терапия, в другой – нет. Пациенты наблюдались два года. Необходимо установить, различается ли выживаемость в группах.
Результаты наблюдения (время ремиссии в месяцах) приведены ниже.
I группа: 24, 16 (с), 18 (с), 20 (с), 24 (с) II группа: 15, 18, 19, 19, 20.
d1t-E1t
n1t n2t d Nt (nNt − d Nt )
2
nNt
(nNt −1)
15
5
0
5
1
10
1
0,5
-0,50
0,25
18
4
0
4
1
8
1
0,5
-0,50
0,25
19
3
0
3
2
6
2
1,0
-1,00
0,4
20
3
0
1
1
4
1
0,75
-0,75
0,19
24
2
1
0
0
2
1
1,0
0,00
0
U L = ∑ (d 1t − E1t ) = −2, 75
SUL =
∑
n1t n2t d Nt (nNt − d Nt )
= 1, 09 = 1, 04
2
nNt
(nNt −1)
Сравнение двух кривых выживаемости. Логранговый тест. Пример.
— 
Построим кривые выживаемости для обеих групп и проверим гипотезу о равенстве кривых выживаемости
H0: S1(t) = S2(t) – выживаемость в группах одинаковая
H1: S1(t) > S2(t) – выживаемость в I группе выше, чем во II.
z=
1
2 = 2, 75 − 0, 5 = 2,16
SUL
1, 04
UL −
zкрит (α=0,05) = 1,96
Так как z > z крит , то нулевая гипотеза
отклоняется. Следовательно принимается
гипотеза H1 - выживаемость в I группе выше
чем во II.
Средняя продолжительность ремиссии в I
группе – 23 месяца достоверно выше, чем во II –
19 месяцев).
Сравнение двух кривых выживаемости. Критерий Гехана.
—  Критерий Гехана – непараметрический статистический критерий,
используемый для оценивания различий в выживаемости двух групп.
—  Впервые был предложен Геханом в 1965г.
Сравнение двух кривых выживаемости. Критерий Гехана.
Алгоритм применения критерия Гехана:
1. Сравниваем каждого пациента из первой группы с каждым пациентов из
второй группы (сравнивают время жизни)
Uij = +1 -если первый прожил
больше; Uij = -1, если меньше
2. Суммируем результаты сравнения для каждого больного
n2
Ui. = ∑Uij
j=1
3. Находим общую сумму сравнения для всех пациентов
n1
n1
WU = ∑Ui. = ∑∑Uij
i=1
4. Находим стандартную ошибку
i=1 j=1
n1
n1n2 ∑Ui.2
SWU =
5. Статистика критерия вычисляется по формуле (с поправкой Йейтса):
и распределена по нормальному закону
5. Задаем уровень значимости и находим zкрит
6. Проводим сравнение Z и Zкрит:
n2
если |Z|<Zкрит – принимаем H0 ;
i=1
(n1 + n2 )(n1 + n2 −1)
1
WU −
2
Z=
SWU
для α=0,05 zкрит=1,96
Если |Z|≥Zкрит – принимает H1
Сравнение двух кривых выживаемости. Логранговый тест. Пример.
В эксперименте сравнивали два метода лечения (А и В) опухоли. Необходимо установить, есть ли различия между кривыми
выживаемости. Результаты наблюдения (время от начала лечения до смерти) приведены ниже.
Группа А: 8, 12, 12 (с), 15, 16, 17
Группа В: 9, 11, 13, 16, 16 (с), 20.
SWU =
Группа В
Группа А
8
12
15
12+
16
17
ΣUij
9
-1
1
1
1
1
1
11
-1
1
1
1
1
1
13
-1
-1
1
0
1
1
16
-1
-1
-1
0
0
1
16+
-1
-1
-1
0
-1
0
20
-1
-1
-1
0
-1
-1
Ui
-6
-2
0
2
1
3
-2
Ui2
36
4
0
4
1
9
54
6 ⋅ 6 ⋅ 54
= 3, 83
(6 + 6)(6 + 6 −1)
z=
| −2 | −0, 5
= 0, 39
3,86
n2
Ui. = ∑Uij = −2
j=1
zкрит (α=0,05) = 1,96
Так как z < zкрит , то нулевая гипотеза
принимается.
Следовательно выживаемость в группе А и В одинаковая.
Скачать