Uploaded by Егор Лисицин

Лаб

advertisement
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования
«Московский государственный технический университет имени Н.Э. Баумана»
(МГТУ им. Н.Э. Баумана)
Статистическая обработка медико-биологических данных: дисперсионный анализ и
анализ качественных признаков
Отчет по лабораторной работе
по курсу «Методы и техника медико-биологических исследований»
Москва
Издательство МГТУ им. Н.Э. Баумана
2019
ВВЕДЕНИЕ
Оценка эффективности все возрастающего числа новых методов лечения и
диагностики, а также изделий медицинской техники приобретает особую актуальность в
современных условиях. Тем не менее, широко внедряемые во всем мире методы
доказательной медицины, основанные на статистической обработке медикобиологических данных, в силу особенностей медицинского образования не используются
большинством медицинских специалистов. Поэтому значительную помощь при обработке
медико-биологических данных могут и должны оказывать медикам инженеры по
специальностям «Биотехнические и медицинские аппараты и системы» и «Инженерное
дело в медико-биологической практике», обладающие соответствующими знаниями.
Целью предлагаемых лабораторных работ является получение практических
навыков сбора, описания и статистической обработки количественных и качественных
медико-биологических данных на примере изучения информативных морфогенетических
вариантов.
3
ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1. Информативные морфогенетические варианты
По данным Всемирной организации здравоохранения в конце ХХ века 90%
новорожденных имели врожденные или наследственные отклонения. Наследственные
болезни являются причиной детской смертности в 50% случаев. У взрослых людей более
25% составляют болезни с наследственной предрасположенностью. Поэтому актуальна
задача своевременной массовой диагностики и прогнозирования наследственных
болезней, решать которую призвана существующая система медико-генетического
консультирования. Традиционно диагностика в медико-генетических консультациях
осуществляется в следующей последовательности: опрос пробанда и /или его
родственников на предмет наличия в семье наследственных болезней и составление
родословного древа, позволяющего в дальнейшем определить тип наследования; анализ
информативных морфогенетических вариантов пробанда и его родственников, который
позволяет в большинстве случаев поставить диагноз наследственной болезни; при
необходимости использование дорогостоящих цитогенетических, биохимических и
молекулярно-генетических методов для уточнения и подтверждения диагноза. Таким
образом, наибольшей ценностью обладают результаты анализа информативных
морфогенетических вариантов (ИМВ), или не требующих лечения малых аномалий
развития, которые помимо медико-генетического консультирования используются для
отбора перспективных спортсменов и определения спортивной специализации,
идентификации личности в судебно-медицинской экспертизе, оценки функционального
статуса и адаптационных возможностей человека при профотборе.
На сегодняшний день у человека описаны более 200 ИМВ, но в широкой практике
используется не более 80. В качестве ИМВ используются, например, рост, масса тела,
характеристика телосложения, длина конечностей и их частей, окружность груди и
черепа, соотношения размеров черепа. Голова, область шеи и кисти рук являются
наиболее информативными в отношении ИМВ: более 70% всех малых аномалий
располагаются именно в этих областях. В области головы в качестве ИМВ используются
результаты антропометрии головы и лица, а в области рук – особенности изображений
папиллярных узоров (дерматоглифика).
2. Основные сведения из дерматоглифики
Дерматоглифический метод основан на взаимосвязи морфологических
особенностей гребешковой кожи ладонной и подошвенной поверхности с
наследственными болезнями (НБ) человека. Дерматоглифическая диагностика
обеспечивает возможность раннего выявления НБ и определения типа наследования.
Дерматоглифические признаки характеризуют наследственные особенности, то есть
предрасположенность индивидуума или его потомства к той или иной НБ. Они не
изменяются со временем и отличаются доступностью, простотой и оперативностью
определения. Дерматоглифические исследования не требуют больших временных и
материальных затрат и обеспечивают сохранность и пересылаемость материала.
Дерматоглифика (от греч. derma — кожа, glipho — гравирую) — раздел
морфологии, изучающий папиллярные линии и узоры и позволяющий на основе
4
отпечатков узоров ладоней, пальцев, а также стоп диагностировать некоторые наследственные заболевания. Для того чтобы решать вопрос о критериях аномалий
дерматоглифических узоров, необходимо знать их характеристики у здоровых людей. В
настоящее время дерматоглифические исследования предполагают целый ряд статистических методов анализа, которые позволяют достоверно оценить характер наследования
гребневого счета (число линий в узоре на отдельных пальцах), папиллярные узоры и
другие признаки. Перспективы широкого использования этой методики значительны, так
как этот метод позволяет диагностировать на ранних этапах онтогенеза ряд патологий и
определить их природу. Дерматоглифика широко используется в практике
консультирования.
Кожные узоры на пальцах и ладонях закладываются, начиная с третьего месяца
внутриутробной жизни. К концу четвертого месяца их формирование заканчивается
полностью, и в течение всей дальнейшей жизни (пре- и постнатальной) узоры остаются
неизменными. Таким образом, особенности узоров являются полигенными признаками и
наследуются от родителей, и как наследственные факторы подвержены мутациям в
результате действия мутагенов (в первые четыре месяца жизни). Кожные линии, или
«гребни», формируются в связи с расположенными на их вершинах отверстиями потовых
желез, которые зависят от развития нервных окончаний и обусловлены многими генами,
находящимися, вероятно, в разных хромосомах.
Самые ранние сообщения по дерматоглифике относятся к XYII веку. Как научная
дисциплина дерматоглифика сложилась к концу XIX началу XX века. Впервые этот метод
был применен в генетике в 1939 г., когда Н.Cummins описал характерные особенности
дерматоглифов при синдроме Дауна. Дерматоглифика, кроме криминалистики и судебной
медицины, широко используется в антропологии, генетике и медицине.
Дерматоглифика подразделяется на дактилоскопию — изучение рисунка
пальцев, пальмоскопию — изучение особенностей узоров ладоней и плантоскопию —
особенности узоров на стопах ног.
Дактилоскопия. Среди узоров, отмечаемых на пальцах, выделяют три типа.
Гальтон описал их как завиток (W — whorl), петля (L — loop) и дуга (А — arch). Позже
классификация детализировалась и в настоящее время выделяют дуги, петли (ульнарные и
радиальные), истинные завитки и сложные узоры.
Дуга — самый редкий пальцевый узор. Дуги могут быть простыми-плоскими либо
высокими — шатровыми. Спецификой этого узора является отсутствие трирадиуса. Узор
состоит из непересекающихся гребней и проходит через всю пальцевую подушечку
поперек.
Петля — представляет собой полузамкнутый узор: один конец закругленный
(замкнутый), другой — открытый. Получается, что кожные гребни, начинаясь от одного
края пальца, идут к другому, но не доходя до него, возвращаются к тому краю, от
которого они начинались. Если открытый конец обращен в радиальную сторону, то петли
5
обозначаются как радиальные — Lr, если в ульнарную — Lu. Каждая петля имеет
один трирадиус (дельту).
Завиток — это концентрический узор, при котором папиллярные линии
располагаются концентрически вокруг сердцевины узора. Завитки имеют две дельты
(трирадиуса).
Сложные, или составные, узоры имеют два трирадиуса и более. Такие узоры часто
бывают составлены двумя петлями, открытыми в разные стороны. Анализ таких узоров
лучше проводить отдельно (для индивидуума). При групповых обследованиях сложные
узоры суммируются с завитками (рисунок 1).
Рисунок 1 — Основные типы пальцевых узоров: 1 — дуга. 2 — петля. 3 — завиток.
Кроме основных типов узоров могут встречаться различные переходные формы от
одного типа к другому. Иногда узоры на руках характеризуются дельтовым счетом.
Трирадиус (дельта) — точка, где сходятся три системы линий. Подсчет числа трирадиусов
на обеих руках дает представление об интенсивности узора (дельтовый счет, или
дельтовый показатель). Дельтовый счет определяется суммарным количеством
трирадиусов на всех десяти пальцах — от 0 до 20. Петля имеет один трирадиус, завиток —
два, сложный узор обычно — два, дуга трирадиуса обычно не имеет.
В генетических работах часто используется количественная характеристика узора,
или гребневой счет. Гребневой счет представляет количество гребней от дельты до
центра узора. Для определения этого показателя между точкой трирадиуса и центром
узора на отпечатке проводят карандашом прямую черту и подсчитывают число гребней,
которые она пересекла. В подсчет не входят ни точка трирадиуса, ни центральная линия
узора.
Гребневой счет определяется для каждого пальца отдельно и суммарно для пяти
пальцев каждой руки. Общая сумма гребневых счетов обеих рук называется «общим
гребневым счетом» и обозначается TRC (total ridge count). Выявлена следующая закономерность: чем больше на пальцах дуг, тем меньше показатель TRC. При наличии
завитков и сложных узоров в общий гребневой счет входит только число гребней с той
стороны пальца, где их больше. Допускается подсчет гребней с обеих сторон.
6
Гребневой счет варьируется у разных людей и на разных пальцах от 0 до 300 (на 10
пальцах). Гребневой счет не связан с полом, но половые хромосомы оказывают влияние
на этот признак, причем влияние Х-хромосом более сильное, чем У-хромосом (табл. 13.4).
Локальное значение гребневого счета (ЛГС) q определяется как количество
гребней на расстоянии «дельта – центр» папиллярного узора (рис. 2).
дельта
центр
Рисунок 2 — Расстояние «дельта-центр» (в данном примере q = 7)
Тотальное значение гребневого счета (ТГС) определяется суммой локальных
счетов по пяти пальцам обеих рук:
10
Q   qi
i 1
Для завитков гребневой счет определяют либо для каждого из двух расстояний
«дельта – центр», либо для наибольшего из них при определении ТГС. Гребневой счет
дуги равен нулю.
3. Сведения из дисперсионного анализа
Дисперсионный анализ был разработан в 20-х годах прошлого века английским
математиком и генетиком Р. Фишером. На дисперсионном анализе основан широкий
класс критериев значимости. Анализ данных начинается с формулировки нулевой
гипотезы, которая заключается в том, что фактор не влияет на значение признака, т.е.
средние в группах не различаются статистически значимо.
Чтобы оценить величину различий необходимо сравнивать разброс по каждой из
групп с разбросом выборочных средних, что можно сделать с помощью дисперсии.
Однако необходимо отметить, что дисперсия характеризует разброс только в том случае,
если исходная совокупность имеет нормальное распределение. Поэтому классический
дисперсионный анализ применим только для нормально распределенных совокупностей.
Дисперсия, ее виды, среднеквадратическое отклонение.
Дисперсия случайной величины — мера разброса данной случайной величины, т.
е. её отклонения отматематического ожидания. В статистике часто употребляется
обозначение
7
,
s
или
.
Квадратный
корень
из
дисперсии
называется среднеквадратичным
стандартным разбросом.
отклонением,
стандартным
отклонением
или
Среднее квадратическое отклонение простое:
Общая дисперсия (σ2) измеряет вариацию признака во всей совокупности под
влиянием всех факторов, обусловивших эту вариацию. Вместе с тем, благодаря методу
группировок можно выделить и измерить вариацию, обусловленную группировочным
признаком, и вариацию, возникающую под влиянием неучтенных факторов.
Межгрупповая дисперсия (σ2м.гр) характеризует систематическую вариацию, т. е.
различия в величине изучаемого признака, возникающие под влиянием признака –
фактора, положенного в основание группировки.
Среднеквадратическое
отклонение (синонимы:
среднее
квадратическое
отклонение, среднеквадратичное отклонение, квадратичное отклонение; близкие
термины: стандартное отклонение, стандартный разброс) — в теории вероятностей и
статистике наиболее распространённый показатель рассеивания значений случайной
величины относительно её математического ожидания. При ограниченных массивах
выборок значений вместо математического ожидания используется среднее
арифметическое совокупности выборок.
Очевидно, что чем больше разброс средних и чем меньше разброс значений внутри
групп, тем меньше вероятность того, что исследуемые группы – это случайные выборки
из одной совокупности.
Дисперсию совокупности можно оценить двумя способами:
1. Поскольку дисперсия, вычисленная для каждой группы – это оценка дисперсии
совокупности, то дисперсию совокупности можно оценить на основании групповых
дисперсий, причем эта оценка не будет зависеть от различий групповых средних.
2. Разброс выборочных средних также позволяет оценить дисперсию совокупности.
Такая оценка дисперсии зависит от различий выборочных средних.
Если экспериментальные группы представляют собой случайные выборки из одной
и той же нормально распределенной генеральной совокупности, то обе оценки дисперсии,
вычисленные первым и вторым способом, дадут примерно одинаковые результаты.
Поэтому, если эти оценки оказываются близки, то оснований отвергнуть нулевую
гипотезу нет. В противном случае необходимо отвергнуть нулевую гипотезу, то есть
сделать заключение, что вероятность получить наблюдаемые различия между группами
мала, если бы группы были просто случайными выборками из одной нормально
распределенной совокупности.
Если верна нулевая гипотеза, то любая из групповых дисперсий дает одинаково
хорошую оценку дисперсии генеральной совокупности. Поэтому в качестве оценки
8
дисперсии совокупности необходимо взять среднее выборочных дисперсий. Эта оценка
называется внутригрупповой дисперсией s2вну.
s
2
вну
1 k 2
  si
k i 1
(1)
где k – число групп, s2i – выборочная оценка дисперсии в i-ой группе.
Дисперсия внутри каждой группы вычисляется относительно среднего для группы.
Поэтому внутригрупповая дисперсия не зависит от различия средних.
Теперь необходимо оценить дисперсию совокупности по выборочным средним.
Так как ранее было сделано предположение, что все выборки извлечены из одной
совокупности, стандартное отклонение выборочных средних служит оценкой ошибки
среднего. Стандартная ошибка среднего  x связана со стандартным отклонением
совокупности  и объемом выборки n следующим соотношением:
x 

(2)
n
Тем самым, дисперсию совокупности σ2 можно рассчитать как:
 2  n x2
(3)
Оценка дисперсии совокупности по разбросу значений выборочных средних
называется межгрупповой дисперсией s2меж.
s 2м еж  ns x2
(4)
где s x2 - оценка дисперсии выборки средних значений.
Если верна нулевая гипотеза, то внутригрупповая и межгрупповая дисперсии служат
оценками одной и той же дисперсии и должны быть приближенно равны. Исходя из этого,
вычисляется критерий F:
F
s 2меж
2
sвну
(5)
Так как и числитель, и знаменатель этого отношения являются оценками одной и
той же величины – дисперсии совокупности σ2, то значение F должно быть близко к 1.
Критическое значение F зависит от числа групп и числа членов каждой группы,
определяющих внутригрупповое и межгрупповое число степеней свободы νвну=k(n-1),
νмеж=k-1, где k – число групп, n – число членов каждой группы.
В случае неравной численности групп расчет критерия F ведут следующим
образом. Пусть имеется k групп, ni – численность i – й группы, x i - среднее в i – й группе,
si – стандартное отклонение в i – й группе.
9
k
N   ni
i 1
k
S в ну   ( ni  1) si2
(6)
i 1
 в ну  N  k
S м еж
 м еж
F
 k

  ni x i 
k
2
i 1

  ni x i  
N
i 1
 k 1
2
S м еж /  м еж
S вну /  вну
(7)
(8)
Частным случаем дисперсионного анализа при сравнении двух групп является
критерий Стьюдента. В случае групп одинакового объема
x1  x 2
t
s12 s 22

n
n
(9)
2
2
где n – объем выборки, s1 , s 2 - выборочные дисперсии для каждой из групп
соответственно. Если обе выборки извлечены из одной совокупности, то выборочные
дисперсии – это оценки одной и той же дисперсии генеральной совокупности σ 2. Поэтому
их можно заменить на объединенную оценку дисперсии. Для групп равного объема
объединенная оценка дисперсии вычисляется как
s 2  s22
s2  1
2
(10)
Значение t, полученное на основе объединенной оценки
x1  x 2
t
s2 s2

n
n
(11)
Если объем обеих выборок n, то число степеней свободы для критерия Стьюдента
равно ν=2(n-1).
Критерий Стьюдента легко обобщить и на случай, когда группы различного объема
x1  x 2
t
s12 s 22

n1 n 2
(12)
2
2
где n1 и n2 соответственно объемы 1-й и 2-й групп, s1 , s 2 - выборочные дисперсии
для каждой из групп соответственно.
Объединенная оценка дисперсии для групп объема n1 и n2 равна
( n1  1)s12  ( n2  1)s22
2
s 
n1  n2  2
(13)
10
Тогда
t
x1  x 2
s2 s2

n1 n 2
(14)
Число степеней свободы в этом случае   n1  n2  2 .
Модель, на которой основано вычисление критериев F и t, предполагает
следующее: каждая выборка независима от остальных выборок; каждая выборка
случайным образом извлечена из исследуемой совокупности; совокупность нормально
распределена; дисперсии всех выборок равны.
При существенном нарушении хотя бы одного из этих условий нельзя пользоваться
ни таблицами распределений F и t, ни вообще дисперсионным анализом. В таком случае
принято использовать непараметрические критерии. Для сравнения нескольких групп
применяют критерий Крускала Уоллиса.
4. Критерий Крускала-Уоллиса
При использовании критерия Крускала-Уоллиса необходимо сначала упорядочить
по возрастанию все значения вне зависимости от того, какой выборке они принадлежат.
Каждому значению присваивается ранг соответствующий его месту в упорядоченном
ряду. Совпадающим значениям присваивают общий ранг, равный среднему тех мест,
которые эти величины делят между собой в упорядоченном ряду. Затем вычисляют суммы
рангов, относящихся к i группе Ri, и для каждой группы определяют средний ранг.
R
(15)
Ri  i
ni
где ni – численность i группы.
При отсутствии межгрупповых различий средние ранги групп должны оказаться
близки. Если существует значительное расхождение средних рангов, то гипотезу об
отсутствии различий между группами необходимо отвергнуть. Значение критерия
Крускала-Уоллиса Н является мерой различия средних рангов.
k
Затем необходимо вычислить общее число наблюдений N   ni , где k – число
i 1
групп. Для объединенной группы рангами являются числа 1, 2, ..., N и общая сумма рангов
равна
N N  1
1+2+...+(N-1)+N=
2
Тогда средний ранг R для объединенной группы равен
1  2  3  ...  N N  1
R

(16)
N
2
Теперь найдем величину D, равную
k

D   ni R i  R
i 1

2
(17)
Величина D зависит от размеров групп. Чтобы получить показатель, отражающий
их различия, следует поделить D на N(N + 1)/12. Полученная величина
11


2
D
12
(18)

ni R i  R

N N  1 / 12 N N  1
является значением критерия Крускала-Уоллиса. Суммирование в приведенной
формуле производится по всем группам.
Если группы не слишком малы, распределение Н хорошо приближается
распределением 2 с числом степеней свободы  = k-1, где k - число групп. Тогда для
проверки нулевой гипотезы нужно просто вычислить по имеющимся наблюдениям
значение Н и сравнить его с критическим значением 2. В случае трех групп приближение
с помощью 2 пригодно, если численность каждой группы не меньше 5. Для четырех
групп – если общее число наблюдений не менее 10. Однако если группы совсем малы,
необходимо обратиться к таблице точных значений распределения Крускала-Уоллиса.
При большом числе совпадающих рангов значение Н следует поделить на
  i  1 i  i  1 , где N - число членов всех групп, i - число рангов в i-м совпадении,
1
N N 2 1
H


а суммирование производится по всем совпадениям.
5. Анализ качественных медико-биологических данных. Таблицы
сопряженности. Точный критерий Фишера
Статистические процедуры, с которыми мы познакомились в предыдущих
разделах, предназначены для анализа количественных признаков. Над значениями
количественных признаков можно производить арифметические действия. Кроме того, их
можно располагать в порядке возрастания или убывания.
Однако очень многие признаки невозможно измерить числом. Например, можно
быть либо мужчиной, либо женщиной, бледным, румяным, покрасневшим и т.д. Это
характерные примеры качественных признаков. Такие признаки не связаны между собой
никакими арифметическими соотношениями. Единственный способ описания
качественных признаков состоит в том, чтобы подсчитать число объектов, имеющих одно
и то же значение. Кроме того, можно подсчитать, какая доля от общего числа объектов
приходится на то или иное значение. Существуют еще порядковые признаки. Их можно
упорядочить, но производить над ними арифметические действия нельзя. Пример
порядкового признака – состояние больного: тяжелое, средней тяжести,
удовлетворительное.
Для анализа различий между группами качественных медико-биологических
данных используются таблицы сопряженности и критерий 2. Последовательность
действий такова. Сначала заполняется таблица наблюдений n х m (табл. 1).
Признак 1
Группа 1
Группа 2
...
Группа n
Всего
Таблица 1 — Результаты наблюдений
Признак 2
...
Признак m
Всего
X11
X21
X12
X22
X1m
X2m
X1c
X2c
Xn1
Xc1
Xn2
Xc2
Xnm
Xcm
Xnc
Xc
12
Где Xij – число объектов i группы с j признаком, Xcj – общее число объектов с j
признаком, Xic – общее число объектов в i группе, Xc - общее число объектов, n – число
групп, m – число признаков.
Ожидаемые числа (которые мы получили бы, если бы группы были идентичными)
заносятся в другую таблицу (табл. 2).
Признак 1
Группа 1
Группа 2
...
Группа n
Всего
Таблица 2 — Таблица ожидаемых чисел
Признак 2
...
Признак m
Всего
Y11
Y21
Y12
Y22
Y1m
Y2m
Y1c
Y2c
Yn1
Yc1
Yn2
Yc2
Ynm
Ycm
Ync
Yc
Где Yij – ожидаемое число объектов i группы с j признаком, Ycj =Xcj, Yic=Xic, Yc
=Xc.
Ожидаемое число наблюдений признака в группе соответствует доле объектов с
исследуемым признаком от общего числа наблюдавшихся объектов. Ожидаемые числа
принято рассчитывать до второго знака после запятой. Затем определяется значение
критерия 2
n
m
  
2
i 1 j 1
( X ij  Yij ) 2
(19)
Yij
Число степеней свободы равно   (n  1)( m  1) .
В общем случае применение критерия 2 правомерно, если количество клеток с
ожидаемым числом наблюдений менее 5 не превышает 20%, и в таблице ожидаемых
чисел отсутствуют значения меньше 1.
В частном случае анализа таблиц сопряженности размера 2х2 необходимо ввести
поправку Йейтса.
1

X

Y



ij
ij
n m
2

2
  
Yij
i 1 j 1
2
(20)
Для таблицы 2х2   1 . Применение критерия 2 для таблицы 2х2 правомерно, если
ожидаемое число в любой из клеток больше или равно 5.
Если указанное выше условие для таблицы 2х2 не выполняется необходимо
воспользоваться точным критерием Фишера. Критерий Фишера основан на переборе всех
возможных вариантов заполнения таблицы сопряженности при анализируемой
численности групп. Нулевая гипотеза состоит в том, что действующий фактор не
оказывает влияния на результаты наблюдений. В таком случае вероятность получить
некоторый вариант заполнения таблицы равна
13
X 1c ! X 2 c ! X c1 ! X c 2 !
X c!
P
X 11! X 12 ! X 21! X 22 !
Построив все остальные возможные варианты заполнения таблицы, возможные при
наблюдаемых суммах по строкам и столбцам, аналогичным образом рассчитывают их
вероятность Вероятности, которые не превосходят вероятности исходной таблицы,
включая ее саму, суммируют. Полученный результат является значением точного
критерия Фишера.
В случае невыполнения условий применения критерия 2 для таблиц
произвольного размера необходимо, если возможно, провести объединение строк или
столбцов, используя критерии 2 и Фишера для таблиц сопряженности меньшего размера.
14
ПРАКТИЧЕСКАЯ ЧАСТЬ
Задание №1. Дисперсионный анализ антропогенетических данных
Цель работы: Получить практические навыки дисперсионного анализа медикобиологических данных.
1.1 По предложенным дерматоглифическим картам (определите локальный
гребневой счет q для каждого из 10 пальцев. Заполните таблицу 3 и рассчитайте
10
Q   qi
i 1
тотальный гребневой счет
.
Определите комбинацию узоров для каждой дерматоглифической карты в
соответствии с приведенными ниже правилами:
АL – присутствуют только дуги или петли и дуги (причем А>5)
LA – присутствуют только петли и дуги (причем А5)
ALW– присутствуют все три типа узоров
10L – присутствуют только петли
LW– присутствуют только петли и завитки (причем L>5)
WL– присутствуют только петли и завитки (причем L5)
10W – присутствуют только завитки
Таблица 3 – Значения параметров
№
пальца
1
2
3
4
5
6
7
8
9
10
ТГС,Q
Тип
узора
Пол, м / ж
1
12
13
12
14
19
8
21
22
17
13
151
LA
М
2
18
0
14
12
12
7
4
12
9
21
109
LA
Ж
3
7
0
3
0
0
5
7
0
5
3
30
AL
РЕБЕНОК(Ж)
4
5
10
8
8
3
7
8
6
7
5
67
LW
ж
5
5
8
10
9
9
0
5
7
10
7
70
10L
ребенок(м)
6
8
3
5
10
8
5
3
7
9
2
62
LA
м
7
9
12
15
0
0
0
15
13
16
0
80
AWL
Ж
8
9
7
7
5
6
8
7
5
6
9
69
10W
ребенок(ж)
9
9
6
5
7
5
5
8
6
8
3
62
LW
ж
10
17
10
8
12
13
17
10
7
12
15
121
10L
м
11
8
10
9
11
7
9
10
8
7
12
91
10L
ж
12
9
7
8
8
7
10
12
10
13
9
93
AL
ребенок(м)
13
14
24
15
22
16
16
16
26
22
19
18
23
21
20
16
16
20
23
27
22
17
211
188
LW
LW
Ж
ребенок(м)
15
20
10
17
20
12
17
13
19
20
11
15,9
LW
ж
16
25
14
15
20
15
16
15
10
15
10
15,5
10W
м
17
10
10
27
12
15
7
8
11
8
9
117
АL
ж
18
3
3
2
9
8
6
9
4
8
10
66
ALW
м
19
5
2
1
5
3
5
3
3
7
9
43
LA
м
№
карты
15
20
10
12
13
16
15
11
16
12
14
9
117
10W
ж
21
13
12
10
11
12
11
14
9
16
14
122
LW
ребенок(м)
22
20
14
17
19
20
15
16
15
18
19
173
LW
м
23
16
20
17
13
10
15
16
11
19
14
151
LW
ж
24
18
9
5
13
10
22
17
13
21
8
136
ALW
м
25
11
8
9
13
15
11
14
8
18
5
112
ALW
ребенок (м)
26
0
5
7
0
0
4
0
0
0
2
18
AL
Ребенок (м)
27
28
29
30
31
32
33
34
17
18
0
0
6
18
10
14
0
0
0
16
4
8
11
8
0
5
8
14
5
5
0
11
3
5
8
15
5
4
10
10
4
4
0
0
7
10
12
9
21
12
0
0
5
11
0
7
0
5
2
16
6
6
12
13
4
7
0
15
4
15
0
11
3
2
3
14
7
11
15
8
4
5
0
15
5
17
7
9
56
63
21
105
54
100
77
100
LA
ALW
ALW
ALW
LA
LA
LW
10W
м
ж
Ж
М
ребенок(М)
ж
Ребенок (м)
м
1.2 Подсчитайте число карт для каждой из комбинаций. Подсчитайте для каждой
из комбинаций (таблица 4) средний ТГС Qср и его дисперсию σ2 (обратите внимание, что в
формуле ниже представлено СКО σ):
n
Qср 
Q
i 1
n
i
,
Таблица 4 — Средние значения и дисперсии ТГС для различных комбинаций узоров
Комбинация узоров
Число карт, n
Qср
σ2
АL
4
64,5
2307
LA
6
88,62
1764,57
ALW
5
67
936,5
10L
3
94
657
LW
7
119,84
5454,61
WL
0
0
0
10W
3
67,17
2578,08
Используя формулы дисперсионного анализа для выборок различного объема и
критерий Крускала-Уоллиса определите, оказывает ли влияние такой фактор как
комбинация узоров на гребневой счет. В качестве проверки правильности расчета, можете
воспользоваться [6].
hэмп. = 2.73846
p = 0.74023
Принимается гипотеза Н0:
Статистически значимых различий между результатами групп нет.
16
1.3 Подсчитайте значения Qср и σ2 для мужчин и женщин. Заполните таблицу 5.
Используя критерий Стьюдента определите, оказывает ли влияние такой фактор как пол
на гребневой счет:
x1  x 2
t
s12 s 22

n
n
Таблица 5 — Средние значения и дисперсии ТГС для мужчин и женщин
Пол
Число карт, n
Qср
σ2
Муж
13
80,99
5653,42
Жен
15
89,17
5826,99
𝑡=
𝑥1 − ̅̅̅
̅̅̅
𝑥2
𝑆2 𝑆2
√ 1+ 2
𝑛1 𝑛2
=
80,99 − 89,17
√5653,42 + 5826,99
13
15
= −0,285
ν = 2 ∗ (n − 1) = 2 ∗ (15 − 1) = 28
Тогда для уровня значимости α = 0,05 tкрит = 2,048
Вывод: tкрит < t – следовательно, присутствует статистическое различие.
Задание №2. Анализ качественных медико-биологических данных.
Цель работы: Получить практические навыки анализа качественных медикобиологических данных.
По предложенным дерматоглифическим картам подсчитайте число различных
комбинаций узоров и встречаемость типов узоров в каждой группе (семье). В каждой
семье присутствует ребенок с заболеванием и родитель(-и). Заполните таблицы
результатов наблюдений (табл. 7, 8).
Таблица 7 —Таблица результатов наблюдений комбинаций узоров
Комбинации узоров
Группа
Сумма
AL
LA ALW 10L LW WL 10W
0
0
0
0
0
3
Группа 1
1
2
0
0
0
0
3
Группа 2
1
1
1
0
0
0
0
0
2
Группа 3
1
1
0
0
0
0
0
2
Группа 4
1
1
0
0
0
0
0
2
1
1
Группа 5
0
0
0
0
2
0
0
2
Группа 6
1
0
0
0
1
0
1
3
Группа 7
0
1
1
0
0
0
0
2
Группа 8
17
Группа 9
Группа 10
Группа 11
Группа 12
Группа 13
Сумма
Группа
Группа 1
Группа 2
Группа 3
Группа 4
Группа 5
Группа 6
Группа 7
Группа 8
Группа 9
Группа 10
Группа 11
Группа 12
Группа 13
Сумма
0
0
0
0
2
0
1
3
0
0
2
0
1
0
0
3
1
1
1
0
0
0
0
3
0
1
2
0
0
0
0
3
0
1
0
0
1
0
1
3
4
7
7
3
9
0
4
34
Таблица 8 — Результаты наблюдений типов узоров
Комбинации узоров
Сумма
A
L
W
2
1
1
1
1
3
1
1
1
3
1
1
1
1
1
2
2
1
1
2
1
1
1
3
1
1
1
3
1
1
2
1
1
1
3
1
1
1
3
1
1
1
3
1
1
1
3
10
13
11
34
hэмп. = 11.56354
p = 0.07244
Принимается гипотеза Н0:
Статистически значимых различий между результатами групп нет.
Вавод: при сравнении комбинаций узоров статистических различий нет
18
Download