Тема 15. Описательные методы анализа количественных данных

advertisement
369
Тема 15. Описательные методы анализа количественных данных
15.1. Общие условия и подходы. Дескриптивные методы для всех уровней
измерения
15.2. Доли, проценты, пропорции
15.3.Анализ данных интервального и относительного уровня измерений
15.4.Упрощенное представление нескольких дескриптивных мер
15.1.Общие условия и подходы. Дескриптивные методы для всех уровней измерения
Когда данные собраны, начинается их анализ, т.е. организация данных,
изучение и применение статистических критериев.
В предыдущих главах рассматривались четыре уровня измерения: номинальный, порядковый, интервальный и отношений.
Уровни измерения и соответствующие им статистические методы
Таблица 9.
Уровни измерений
Описательный метод ана- Номинальный Порядковый Интервальный Отношений
лиза данных
Распределение частот
+
+
+
+
Доля
+
+
+
+
Процент
+
+
+
+
Пропорция
+
+
+
+
Мода
+
+
+
+
+
+
+
+
+
Медиана
Среднее
Примечание:
В таблице 1 обобщаются типы описательных статистик, соответствующих
каждому их уровней измерения. Эта таблица иллюстрирует два важнейших аспекта взаимосвязи между уровнем измерения и анализом данных:
 Для более низких уровней измерения имеется меньшее количество
применяемых методов анализа данных.
 К данным на более высоких уровнях измерения применимы все методы, используемые на низших уровнях измерения.
370
Далее в рамках этой темы рассматриваются методы описательного (дескриптивного) анализа данных: 1) методы для любого типа данных; 2) методы,
применимые только для данных на уровне интервальной шкалы и шкалы отношений.
Дескриптивные методы для всех уровней измерения
Данные на любом из уровней измерения можно описывать в терминах:
1)распределения частот, 2)долей, 3)процентов и 4)пропорций.
Распределение частот
Приведем пример простейшего демографического вопроса:
Укажите свое нынешнее семейное положение (ПРОЧИТАЙТЕ ВСЕ ПУНКТЫ)
Не женат (не замужем) и никогда не был (а) женат (замужем)
_______(1)
Официально женат (замужем) , не живем вместе
_______(2)
Не женат (не замужем), разведен (а)
_______(3)
Не женат (не замужем), вдовец (вдова)
_______(4)
Женат (замужем)
_______(5)
Первым шагом построения распределения частот для этого (или любого
другого) вопроса является отнесение каждого ответа к одной из категорий шкалы. При этом мы можем ставить отметку (например, штрих) возле той категории, к которой отнесли ответ.
Окончательный результат подсчета числа ответов по каждой категорий
называется распределением частот. Подсчет ответов и построение распределения частот можно выполнить вручную или на компьютере.
Распределение частот для данных, собранных с помощью этого демографического вопроса, может выглядеть таким образом:
Категория ответа
Количество ответов
Не женат (не замужем) и никогда не был (а) женат (замужем)
5
Официально женат (замужем) , не живем вместе
10
Не женат (не замужем), разведен (а)
6
Не женат (не замужем), вдовец (вдова)
1
Женат (замужем)
ВСЕГО
28
50
371
Примечание: как показывает эта таблица, исходное распределение частот
представляет данные в той форме, в которой они были собраны с помощью вопроса анкеты.
Имея такое распределение, вы можете затем выполнить объединение категорий, в результате чего не будет прямого соответствия первоначальным категориям. В этом случае исходные категории ответов логически группируются,
а их частоты складываются.
Вопрос о семейном положении подразделяет «неженатых (незамужних)»
на данный момент респондентов на четыре класса: тех, кто никогда не был женат (замужем); официально состоящих в браке, но не живущих вместе, разведенных и вдовцов (вдов). Вы можете сгруппировать вместе всех «неженатых
(незамужних)» участников выборки, чтобы узнать количество состоящих и количество не состоящих в браке. В этом случае распределение частот будет выглядеть таким образом:
Нынешнее семейное положение
Количество ответов
Состоят в браке
22
Не состоят в браке
28
ВСЕГО
50
Аналогичным образом вы можете перегруппировать данные, чтобы установить количество респондентов, который когда-либо состояли в браке, и число тех, кто никогда не состоял в браке:
Нынешнее семейное положение
Количество ответов
Когда-либо состояли в браке
45
Никогда не состояли в браке
5
ВСЕГО
50
Примечание: подобная перегруппировка данных дает возможность рассматривать семейное положение совокупности респондентов под разным углом
зрения.
15.2. Доли, проценты, пропорции
Построив распределение частот, вы должны выбрать один из трех типов
анализа, который способствовал бы более глубокому пониманию свойств собранных вами данных. К этим трем типам анализа относятся: доли, проценты и
пропорции.
372
Доли. Доля отражает относительную частоту ответов в категории. Она
вычисляется делением числа ответов в конкретной категории на общее число
ответов по всем категориям.
Рассмотрим распределение частот ответов на вопрос о семейном положении.
От 50 респондентов получено 50 ответов на вопрос. 28 участников ответили, что
они в настоящий момент женаты (замужем). Доля женатых (замужних) респондентов в выборке составляет 0,56. Вычисляется она следующим образом:
Пропорция женатых (замужних) = Число женатых (замужних)
= Общее число участников выборки =28/ 50 = 0,56
В приведенной ниже таблице представлены доли (относительные частоты) для
вопроса о семейном положении. Каждый столбец содержит необходимый компонент
таблицы: категории ответов четко обозначены, также вычислены и представлены в
таблице исходные частоты для каждой категории и доли выборки. (Заметим, что сумма в столбце долей равна «1», подчеркивая, что сумма всех частей дает единое целое).
Нынешнее семейное положение
Частота
Доля
Не женат (не замужем) и никогда не был (а) женат (замужем)
5
0,1
Официально женат (замужем) , не живем вместе
10
0,2
Не женат (не замужем), разведен (а)
6
0,12
Не женат (не замужем), вдовец (вдова)
1
0,02
Женат (замужем)
ВСЕГО
28
50
0,56
1,00
Но необходимо заметить, что доли – эффективный, но не слишком распространенный способ представления относительных размеров групп.
Проценты. Более распространенным способом обобщенного представления
данных служит процентное распределение. Оно вычисляется путем деления количества ответов в каждой категории на общее количество ответов и умножением частного на 100 (это все равно, что умножить долю на 100). Так, процент женатых
(замужних) респондентов в выборке будет составлять 56%, и подсчитывается так:
Процент женатых (замужних)= [ Число женатых (замужних)] = [Общее число участников выборки] *100 =Процент женатых (замужних) = 28/ 50 * 100 = 56%
373
В приведенной ниже таблице представлено распределение частот и процентов для вопроса о семейном положении. Подобно таблице долей, таблица
процентного распределения включает три основных элемента: метки категорий, частоты и проценты выборки по каждой их категорий. (Обратите внимание, что общая сумма в столбце процентов составляет 100).
Нынешнее семейное положение
Частота
Проц.
Не женат (не замужем) и никогда не был (а) женат (замужем)
5
10
Официально женат (замужем) , не живем вместе
10
20
Не женат (не замужем), разведен (а)
6
12
Не женат (не замужем), вдовец, вдова
1
2
Женат (замужем)
28
56
ВСЕГО
50
100
Подсчет процентов для данных на номинальном, интервальном и относительном уровне измерения очень прост.
Процент представляет частоту в одной конкретной категории, деленную на
сумму частот всех категорий. Этот подход к вычислению процентов несколько
отличается от порядковых данных. При вычислении процентов для данных на
порядковом уровне измерения каждый из пунктов рассматривается как независимая единица. Порядковые шкалы, такие как вопросы на ранжирование, предлагают респонденту несколько объектов или свойств с просьбой упорядочить в
соответствии с определенным критерием. Приведенный ниже пример – типичный вопрос на ранжирование:
Вы только что увидели три рекламных ролика. Каждому из роликов было дано название до того, как вы их просмотрели. Ниже ролики перечислены в порядке, в котором вы их
увидели. Пожалуйста, дайте оценку каждому из рекламных роликов, указав степень своего
доверия к их содержанию. Поставьте «1» напротив названия ролика, который показался вам
наиболее правдоподобным, «2» - напротив менее правдоподобного ролика, а «3» поставьте
напротив ролика, показавшегося вам наименее правдоподобным. Каждая из оценок от «1» до
«3» ставится только один раз. Повторения не допускаются.
«Ученый нового столетия»
__________
«Мама нового столетия»
__________
«Окружающая среда в новом столетии» __________
374
Первым шагом анализа ранжированных данных является построение распределения частот, показывающего, сколько раз каждому из пунктов был присвоен определенный ранг. Распределение частот для 50 респондентов, ранжировавших эти три рекламных ролика, может выглядеть таким образом:
Частота
рангов Рекламный
каждого рекламного «Ученый»
ролик Рекламный
«Мама»
ролик Рекламный
ролик
«Окружающая сре-
ролика на уровне
да»
1
38
10
2
2
8
24
18
3
4
16
30
Сумма частот
50
50
50
Как видно из таблицы, 38 респондентов присвоили рекламному ролику
под названием «Ученый» ранг «1», 8 участников – ранг «2», а 4 участника ранг «3».
Следующим шагом анализа и представления ранжированных данных является преобразование распределения частот в распределение процентов для каждого из ранжированных объектов. В данном случае распределения будут выглядеть таким образом:
Частота
рангов Рекламный
каждого рекламного «Ученый», %
ролик Рекламный
«Мама», %
ролика на уровне
ролик Рекламный
ролик
«Окружающая среда», %
1
76
20
4
2
16
48
36
3
8
32
60
Итого
100
100
100
Анализ данных по столбцам (сверху вниз) указывает на то, что большая
часть участников присвоила:
 Рекламному ролику под названием «Ученый» - ранг «1» (76%), затем
– «2» (16%);
 Рекламному ролику под названием «Мама» - ранг «2» (48%), а рекламному ролику под названием «Окружающая среда» - «3» (60%).
375
Распределение процентов для порядковых данных также можно читать по
строке. Данные в первой строке предыдущей таблицы указывают на то, что
рекламный ролик «Ученый» получил наибольшее число рангов «1» (76%), намного превысив число рангов «1», полученными рекламными роликами «Мама» (20%) и «Окружающая среда» (4%).
В общем, процесс вычисления и представления таблиц и графиков распределения долей и процентов довольно прост. Но при этом необходимо придерживаться двух основных правил:
 во-первых, всегда указывайте в таблице и на графике общее число
наблюдений. Тем самым вы предоставляете своей аудитории возможность оценить объем выборки, для которой построено распределение;
 во-вторых, избегайте подсчета долей и процентов, если общее число
наблюдений менее 50. Если объем выборки намного меньше этого
числа, случайные отклонения данных могут вызвать значительные
изменения долей и процентов, сообщающих об отдельной категории
ответа.
Пропорции. Третий путь суммирования данных на всех уровнях измерения – использование пропорции. Пропорция одного числа Х в отношении другого числа Y определяется как X деленное на Y.
Слова по отношению к – важная составляющая этого определения. Число,
предваряющее по отношению к (в данном случае число Х), ставится в числитель дроби, тогда как число после слов по отношению к ставится в знаменатель дроби.
Пропорции, как следует из этой математической формулы, дают возможность отчетливо видеть соотношения между относительным размером двух категорий, использованных в анкетном опросе.
Что касается данных о семейном положении, мы видим, что пропорция не состоящих в браке респондентов по отношению к состоящим в браке составляет 22/28
376
или 22:28. Однако понять соотношение будет легче, если наименьший член
пропорции представить равным единице. В этом случае пропорция представляет два числа Х и Y , деленные на наименьшее из них. Таким образом, пропорцию не состоящих в браке респондентов по отношению к состоящим в браке можно также выразить как 1:1,27. (Обратите внимание, как использование
пропорции сразу делает очевидным относительный объем этих групп).
15.3. Анализ данных интервального и относительного уровня измерений
Интервальные и относительные шкалы обладают всеми характерными
особенностями, присущими номинальным и порядковым шкалам, а также особыми свойствами, не характерными для этих не столь мощных уровней измерения. Следовательно, все количественные и графические методы, используемые для описания и презентации номинальных и порядковых данных, могут
быть применены для описания и представления интервальных и относительных данных. Но сила данных интервального и относительного уровней позволяет осуществить дополнительный анализ, невозможный на номинальном и
порядковом уровне. Характер и количество шагов, которые следует предпринять перед применением этих дополнительных методов анализа, зависят от того, являются ли полученные данные дискретными или непрерывными.
Дискретные данные
Рассмотрим следующий вопрос для оценки.
Пожалуйста, дайте оценку рекламному ролику, который вы только что видели. Для выражения своего согласия или несогласия с утверждением «Этот
рекламный ролик рассчитан именно на таких людей, как я» воспользуйтесь
приведенной ниже шкалой.
Абсолютно согласен
___________(1)
Скорее согласен, чем нет
___________ (2)
Не могу сказать определенно
___________ (3)
Скорее не согласен
___________ (4)
Абсолютно не согласен
___________ (5)
377
Данные, полученные с помощью этого вопроса, являются дискретными.
Дискретные данные содержат ответы, ограниченные конкретным набором целых чисел, отделенных друг от друга одинаковыми интервалами. Этот вопрос
дает возможность собрать дискретные данные, так как респондент должен выбрать один из вариантов ответа (ограниченный набор), представленных кодами
«1», «2» и т.д. (фиксированный и одинаковый шаг между уровнями ответов).
Для применения описательных методов анализа дискретных данных можно не
предпринимать каких-либо промежуточных шагов.
Непрерывные данные
Непрерывные данные предоставляют такую возможность для ответа, при
которой значения, во крайней мере, теоретически, могут быть как угодно близко расположены друг к другу на числовой шкале. Например, с помощью вопроса «Сколько вам лет?» собираются непрерывные данные. Респондент может
ответить, что ему 40, 40 и 1/2, 41, 42 и 1/3 и т.п. Поскольку вопросы для сбора
непрерывных данных не предполагают наличия каких-либо заранее установленных и предварительно закодированных категорий, данные перед вычислением распределения процентов и построением столбиковых или круговых диаграмм следует определенным образом организовать. Организация непрерывных данных называется группировкой (или организацией). Процесс группировки
осуществляется в определенной последовательности.
 Данные упорядочиваются.
 Определяются число и ширина интервалов категорий.
 Строится распределение частот.
Упорядочение данных. Представим, что на предыдущий вопрос о возрасте
ответили 100 участников опроса. Первым шагом группировки непрерывных данных будет упорядочивание данных. Результат упорядочивания называется не
сгруппированным рядом и его можно сравнить с построением учеников класса по
росту или размещением маслин по размеру. Несгруппированный ряд, включающий 100 ответов на вопросы о возрасте, воспроизведен ниже (см. табл.10)
378
Несгруппированный ряд ответов на вопрос «Сколько вам лет?»
Таблица 10
7
9
9
12
12
13
13
13
13
14
16
16
17
19
19
20
21
21
21
21
21
21
26
27
27
28
28
33
34
34
34
34
34
35
36
36
36
36
37
37
37
37
37
37
37
37
37
39
39
39
39
39
39
41
41
41
41
41
41
41
43
43
43
43
44
44
44
44
44
44
44
47
47
52
53
53
53
54
54
54
54
55
57
58
58
58
63
64
64
64
64
68
69
69
73
73
73
75
75
75
Определение количества и ширины интервалов и категорий. Следующий шаг предполагает определение числа и ширины интервалов категорий. От
этого зависит способ группировки данных. По каким критериям группируются
данные о возрасте и сколько их – 5 или 25?
Твердо установленных правил для проведения границ между категориями
не существует. Но при определении ширины интервалов и границ между категориями все же следует иметь ввиду, что:
 группировки должны отражать характер данных. Если размах данных (т.е. разность между наибольшим и наименьшим значениями)
большой, тогда и ширина интервалов категорий, скорее всего, будет
также большой. Данные, изменяющиеся в более узком диапазоне,
лучше обобщать с ипользованием относительно меньших категорий;
379
 количество групп не должно быть настолько большим, чтобы скрыть
наиболее важные особенности данных, и не столь малым, чтобы лишить систему категорий смысла;
 ширина интервала должна быть целым числом и, по возможности,
делиться на удобное число , например на 2, 10, 25, 100 и т.;
 интервалы для всех категорий должны быть, по возможности, одинаковой ширины.
Руководствуясь этими рекомендациями, вы можете попробовать различные схемы группировки. Например, данные о возрасте могут быть сгруппированы любым из приведенных ниже способов изменения ширины интервала для
каждой из групп.
5 категорий
8 категорий
16 категорий
1 - 15
1-9
1-4
16 - 30
10 - 19
5-9
31- 45
20 - 29
10 - 14
46 - 60
30 - 39
15 - 19
70 - 79
40 - 49
20 - 24
50 - 59
25 - 29
60 - 69
30 - 34
70 - 79
35 - 39
40 - 44
45 - 49
50 - 54
55 - 59
60 - 64
65 - 69
70 - 74
75 - 79
380
Описательные статистики
Среднее и меры изменчивости. Среднее и среднее арифметическое - пожалуй, наиболее распространенная статистика свертки для совокупности интервальных и относительных данных. Понятие среднего балла нам уже хорошо
знакомо, поскольку мы часто сами вычисляем это значение, например, при
подсчете среднего баллов трех экзаменов в виде теста или при определении
среднего балла аттестата. В этих и подобных случаях мы вычисляем среднее,
складывая все значения чисел и затем деля полученную сумму на общее их количество. Например, средним для чисел 2,3,7,8, 10 будет число 6 (30 : 5). Математически это выражается формулой:
n
Средняя величина = Х =
Xi
i 1
N
Если число ответов невелико или данные не сгруппированы, среднее легко вычислить, сложив сырые баллы и поделив полученную сумму на общее
число баллов. Большие массивы данных и сгруппированные данные требуют
другого метода для вычисления среднего ряда данных. В этом случае подход
будет таким же, но математические вычисления другими.
При вычислении среднего ряда сгруппированных данных предполагается ,
что все ответы одной категории сконцентрированы посередине интервала.
(Обратите внимание: результатом такого предположения является то, что среднее, вычисляемое на основе сгруппированных данных, будет отличаться от
среднего, вычисляемого на основе несгруппированного, исходного ряда. Учитывая это предположение, при вычислении среднего сгруппированных данных
следует придерживаться следующих четырех шагов (см. табл.11. ):
381
Вычисление среднего сгруппированных данных
Таблица 11.
Первый шаг: вы-
Второй шаг: умножение середины интер-
числение середины
вала на частоту
интервала
Возрастная группа
Середина интервала
Частота
Произведение середины интервала на
частоту
0-9
4,5
3
13,5
10 - 19
14,5
12
174
20 - 29
24,5
12
294,0
30 - 39
34,5
26
897,0
40 - 49
44,5
20
890,0
50 - 59
54,5
13
708,5
60 - 69
64,5
8
516,0
70 - 79
74,5
6
447,0
100
3940
Всего
Третий шаг: сложение произведений
Четвертый шаг: деление суммы произведений на общее число наблюдений
= 3940 / 100 = 39,4 = X
 Во-первых, найдите середину каждого интервала группировки,
суммируя наименьшее и наибольшее значения и деля полученный
результат на два. Например, серединной точкой категории респондентов в возрасте от 20 лет до 29 лет будет 24,5 (20 + 29 : 2).
 Во-вторых, умножьте середину интервала каждой категории на частоту категории (т.е. на количество наблюдений в этой категории).
 В-третьих, сложите все произведения, полученные на предыдущем
шаге.
 В-четвертых, разделите сумму, полученную на третьем шаге, на общее число ответов.
i
mi fi
 ( Математически это выражается формулой:
)
X
i 1
N
, которая оз-
начает, что «среднее (X ) равно сумме (
произведений серединной
точки (mi) каждой группировки от первой (i =1) до последней (1) на
ее частоту (fi), деленной на общее число наблюдений (N).
382
(Среднее ряда данных можно привести в таблице распределения частот и процентов, а также в графиках. Это мы рассматривали выше).
Среднее является
очень мощной статистикой. Оно дает возможность
представить одним числом множество ответов на вопрос анкеты. Однако, используя среднее, вы должны быть уверены, что усредненный балл действительно представляет тот ряд ответов, на основе которого он был вычислен.
Приведенная ниже таблица № 12.
иллюстрирует гипотетический ряд
данных о намерении приобрести товар, сложившемся после просмотра одного
из рекламных роликов.
Данные о намерении приобрести товар
Таблица12.
Я бы купил рекла-
Рекламный ролик 1:
Рекламный ролик 2:
Рекламный ролик 3:
мируемый товар
«Ультра» %
«Власть» %
«Дети» %
Абсолютно согласен
20
50
5
20
0
15
20
0
60
20
0
15
20
50
5
3,0
3,0
3,0
(1)
Скорее согласен, чем
нет (2)
Не могу сказать определенно (3)
Скорее не согласен
(4)
Абсолютно не согласен (5)
Среднее
Значения средних намерения купить, сложившегося после просмотра каждого рекламного ролика, совпадают, несмотря на то, что лежащие в основе
распределения ответов значительно отличаются друг от друга. Ответы после
просмотра рекламного ролика 1 под названием «Ультра» равномерно распределились по всем пяти категориям, тогда ответы на ролик 2 («Власть») приходятся исключительно на края шкалы. Распределение реакций на рекламный ролик
3 («Дети») напоминают то, что мы зачастую называем колоколообразной кривой нормального распределения – большинство ответов расположены в центре
распределения, и процент ответов уменьшается
к краям шкалы. Изучение
383
этого распределения иллюстрирует важнейший аспект среднего: среднее становится тем менее репрезентативным по отношению к распределению, на основе которого оно вычисляется, чем больше распределение отличается от
нормальной кривой.
Несмотря на то, что среднее намерения купить товар равняется 3,0 для
всех трех роликов, это значение более репрезентативно для распределения реакций на ролик 3 по сравнению с реакциями на ролики 1 и 2. Нельзя утверждать, что среднее ответов после просмотра рекламного ролика 2 составляет
3,0 или определять его как нейтральное, так как , в сущности, ни один из респондентов не дал ему подобной оценки.
Таким образом, если вы вычисляете средний балл, важно определить, насколько хорошо среднее представляет распределение ответов, на основе которого оно вычислялось, Это можно сделать, визуально изучив распределение
баллов и приняв субъективное решение о представительности среднего или
воспользовавшись статистиками для описания этого диапазона. В последнем
случае вы вычисляете и изучаете дисперсию и стандартное отклонение, которые могут подсчитываться как для сгруппированных, так и для не сгруппированных данных, являются вычисляемыми показателями рассеивания значений
баллов относительно среднего.
Дисперсия (обозначаемая символом s2 ) вычисляется таким образом: вычисляется сумма квадратов отклонений каждого наблюдения (Xi) от среднего
(Х), которая делится затем на общее число наблюдений минус один (N – 1).
Математически это выражается формулой:
m
S2 =
(Xi
X )2
i 1
N 1
(Поэтапная процедура вычисления дисперсии ряда данных (сгруппированных и несгруппированных) приведена ниже в табл. _5_ )
Хотя дисперсия – хорошая мера рассеивания данных, все же ее использование имеет один недостаток. Дисперсия выражается в квадратах единиц измерения, а не в исходных единицах. Например, дисперсия для данных табл.5
384
представляет квадраты оценок. Следовательно, трудно соотнести числовое значение дисперсии с числовым значением среднего.
Эта проблема решается благодаря использованию стандартного отклонения. Стандартное отклонение равно корню квадратному из дисперсии и вычисляется с помощью формулы:
m
(Xi
S=
X )2
i 1
N 1
Таким образом, стандартное отклонение как квадратный корень из дисперсии выражается в тех же единицах, что и результаты первоначального измерения. В итоге несложно соотнести величину стандартного отклонения со
средним.
Если просто руководствоваться интуицией, становится ясно, то что чем
больше разброс ряда данных, тем больше дисперсия и стандартное отклонение.
Если разброс отсутствует и каждое значение равняется среднему, тогда все отклонения будут равняться нулю, а значит дисперсия (основанная на сумме
квадратов этих отклонений) и стандартное отклонение тоже будут равняться
нулю. (Вы можете это самостоятельно доказать. Вычислите дисперсию и стандартное отклонение для ряда, состоящего из десяти одинаковых баллов. Значение баллов не играет роли). При возрастании разброса в ряду данных, отклонения от выборочного среднего также имеют тенденцию возрастать, как и сумма
квадратов этих отклонений. Следовательно, если две выборки респондентов
отвечают на один и тот же вопрос, большее значение дисперсии указывает на
большее рассеивание баллов.
385
Вычисление дисперсии стандартного отклонения на основе несгруппированных и сгруппированных данных
Таблица 13.
1.Сгруппированные данные:
Первый шаг: вычислите среднее = [(15 * 1) + (45*3) + (30*4) + (70*5):200] = 695 : 200 = 3,48
Количество
Значение отве-
Отклонение от
Квадраты от-
Квадраты от-
респондентов
та
среднего
клонения
клонения *
частота
15
1
-2,48
6,15
92,25
45
2
-1,48
2,19
98,55
40
3
-0,4
0,23
9,20
30
4
+0,52
0,27
8,10
70
5
+1,52
2,31
161,70
Второй шаг:
Третий шаг:
Четвертый шаг: сложите произ-
вычислите от-
возведите в
ведения квадратов отклонений
клонения от
квадрат откло-
на частоту
среднего
нения от сред-
Итого = 200
него
Пятый шаг: дисперсия = сумма квадратов отклонений : (число респондентов – 1) =
369,8 : 199 = 1,86
Шестой шаг: стандартное отклонение =
дисперсия =
1,86 = 1,36
386
2.Несгруппированные данные:
Первый шаг: вычислите среднее = (2+1+4+5+5+4+4+5+5+5) : 10 = 40 : 10 = 4,0
Номер рес-
Значение от-
Второй шаг: вычислите
Третий шаг: возведите
пондента
вета
отклонения от среднего
отклонения в квадрат
Отклонения от среднего
Квадраты отклонений
1
2
-2
4
2
1
-3
9
3
4
0
0
4
5
+1
1
5
5
+1
1
6
4
0
0
7
4
0
0
8
5
+1
1
9
5
+1
1
10
5
+1
1
Всего = 18
Четвертый шаг : найдите сумму квадратов отклонений
Пятый шаг: дисперсия = сумма квадратов отклонений : (число респондентов – 1) =
18:9= 2,0
Шестой шаг : стандартное отклонение =
дисперсия =
2,0 = 1,42
Медиана. Среднее является часто используемой мерой центральной тенденции ряда данных. Дисперсия и стандартное отклонение указывают на разброс
значений вокруг среднего, что позволят сделать вывод о том, насколько хорошо
среднее описывает совокупность данных. Помимо среднего существуют еще две
меры центральной тенденции: медиана и мода. ( Причем следует обратить внимание, что использование среднего, медианы и моды зависит от уровня измерения данных. Среднее вычисляется только для интервальных и относительных
данных, медиана – для порядковых, интервальных и относительных данных. Мода используется для свертки данных на всех уровнях измерения).
Медианой называется значение, располагающее посередине ранжированного ряда данных. Медиана делит ряд данных пополам таким образом, что 50%
значений меньше медианы. При нечетном
количестве
значений медиана
387
определяется как вариант, расположенный в самом центре распределения.
Медиану в этом случае легко установить визуально по формуле:
Позиция медианы = Общее число единиц совокупности + 1
2
Если же ряд содержит четное число значений, медиана определяется как
среднее двух центральных значений в ранжированном ряду.
Что использовать – среднее или медиану? Определение среднего и медианы ряда значений важно и полезно для более глубокого понимания особенностей данных. В целом, среднее является более предпочтительной мерой в силу своих математических свойств и возможности лучше оценивать среднее генеральной совокупности на основе выборочного среднего. Вместе с тем, существуют две ситуации, когда следует предпочесть медиану.
Первая ситуация - когда ряд данных содержит одно или несколько экстремальных значений (так называемых «выбросов» - необычно малых или
больших значений). Определять медиану в таких случаях предпочтительнее,
поскольку значение среднего чрезвычайно чувствительно к наличию выбросов, тогда как медианы – нет. Если имеются экстремальные значения, среднее
можно представить очень искаженную картину.
Например, предположим, что вы хотите описать уровень доходов целевой
аудитории целевой аудитории нового товара. Вы представляете концепцию
нового товара репрезентативной выборке и отмечаете уровни доходов тех, кто
сильно или умеренно заинтересован в приобретении товара. Допустим, уровень доходов тех, кто сильно и умеренно заинтересован, был таким:
Доход
Частота
10 000
9
12 000
10
17 000
7
20 000
8
747 000
1
Среднее доходов части выборки, заинтересованной в новом товаре, составляет 35 314 долл. Это среднее не отражает реальной картины всей
388
совокупности. Оно искусственно завышено, так как ряд содержит одно экстремальное значение, что может повлечь за собой принятие неверного решения.
Медиана, которая в данном случае составляет 12 тыс. долл., гораздо лучше описывает данную совокупность.
Второй ситуацией, когда следует отдать предпочтение медиане, является
наличие открытых категорий в группировке данных. Группировка по возрасту,
описанная выше в этой главе, состоит из полностью закрытых групп. Это означает, что каждая возрастная категория имеет верхнюю и нижнюю границу.
Однако для некоторых группировок используются открытые категории.
Например, одной из категорий группировки данных о доходах может быть
пункт «более 100 тыс. долл.». Среднюю точку этой группы определить невозможно, так как не установлена верхняя граница. Следовательно, в этой ситуации необходимо использовать медиану, поскольку без серединной точки вычислить среднее сгруппированных данных невозможно.
Мода. Еще одной мерой центральной тенденции служит мода. Она определяется как наиболее часто встречающееся значение в ряду данных. Описанные выше шкалы, отражающие намерение купить, имеют различные моды.
Распределение по рекламному ролику 1 под названием «Ультра» многомодально, так как существует более двух значений, которые встречаются, которые
встречаются чаще всего. Распределение рекламного ролика под названием
«Власть» бимодально, так как чаще других встречаются два значения. Распределение рекламного ролика под названием «Дети» имеет одну моду, равную
трем, так как это значение встречается чаще других.
Соотношение среднего, моды и медианы. Среднее, мода и медиана дают
различное видение характеристик ряда. Распределение будет симметричным,
если среднее, медиана и мода совпадают. (См. ниже на рис.9.)
389
1
2
3
4
5
Среднее
Медиана
Мода
Рис.9. Симметричное распределение
В таких случаях распределение справа от среднего, медианы или моды это зеркальное отображение распределения слева от этих величин и большинство наблюдений приходится на центр распределения. В этой ситуации среднее служит точной и предпочитаемой мерой центральной тенденции распределения.
Многие распределения не являются симметричными. Распределение, в
котором мода меньше медианы, а медиана в свою очередь, меньше среднего,
скошена влево. Это распределение имеет целый ряд значений, с низкой частотой в верхней части. (См. на рис. 10.):
1
2
3
4
5
Мода Медиана Средн.
Рис.10. Нессиметричное распределение – влево
390
Распределение, в котором мода больше медианы, а медиана больше среднего, скошено вправо. (См. на рис.11 ниже).
В зависимости от скошенности распределения и диапазона значений в
качестве меры центральной тенденции выбирается или медиана, или мода.
1
2
3
Среднее
4
Медиана
5
Мода
Рис.11. Нессиметричное распределение – вправо
15.4.Упрощенное представление нескольких дескриптивных мер
С помощью дескриптивных мер обобщаются тенденции, лежащие в основе
данных. Тем не менее, бывают случаи, когда многочисленные дескриптивные меры
конечным пользователям результатов исследований не предоставляются. Ценность
проведенных исследований при этом значительно падает, так как конечный пользователь не видит широкой картины полученных результатов исследования, и поэтому не может установить их значимость для принятия необходимых решений.
Подобной ситуации следует всячески избегать. Для упрощенного представления большого количества мер используются несколько различных аналитических приемов. Выбор подхода зависит от уровня измерения данных.
Номинальный уровень данных: организация представления и вычисление «совокупного» процента.
Рассмотрим следующий вопрос-меню:
Вы только что просмотрели рекламный ролик. Поставьте свою отметку напротив утверждения, если вы считаете, что оно отражает именно те чувства, которые вызвал у вас просмотр рекламного ролика. Вы можете отметить сколько угодно утверждений (или вообще не
отмечать) в зависимости от чувств, испытанных вами от просмотра рекламного ролика
Было скучно
_______
Я кое-что узнал(а), просмотрев рекламный ролик
_______
391
Рекламный ролик рассчитан на таких людей, как я
_______
Я видел(а) такие рекламные ролики прежде
_______
Лицам, участвующим в рекламном ролике, можно верить
_______
Рекламный ролик вызвал у меня замешательство
_______
Я скажу своим друзьям, что этот рекламный ролик стоит посмотреть
_______
Музыкальное сопровождение прекрасно подобрано
_______
Лицу, рекламирующему товар, можно верить
_______
Рекламный ролик не интересен
_______
Мне не нравятся рекламные ролики такого рода
_______
Лицо, рекламирующее товар, вызывает раздражение
_______
Хотел(а) бы снова увидеть этот рекламный ролик
_______
Ответы на этот вопрос можно представить в виде таблицы (См. ниже
табл.14. ). Отдельные пункты могут располагаться в порядке, представленном
в анкете (пример А) или в порядке убывания процента выраженного согласия
(пример Б). К сожалению, оба формата представляют данные в таком виде, что
трудно будет сообщать основные закономерности реакции респондентов.
Способы представления ответов на вопросы меню
Таблица 14.
Респонденты, выразившие согласие, %
Пример А: порядок пунктов в соответствии с анкетой
Было скучно
23
Я кое-что узнал(а), просмотрев рекламный ролик
74
Рекламный ролик рассчитан на таких людей, как я
87
Я видел(а) такие ролики прежде
25
Лицам, участвующим в рекламном ролике, можно верить
31
Рекламный ролик вызвал у меня замешательство
26
Я скажу свои друзьям, что этот ролик стоит посмотреть
24
Музыкальное сопровождение прекрасно подобрано
83
Лицу, рекламирующему товар, можно верить
84
Рекламный ролик не интересен
28
Мне не нравятся рекламные ролики такого рода
22
Лицо, рекламирующее товар, вызывает раздражение
26
Хотел(а) бы снова увидеть этот рекламный ролик
78
392
Респонденты, выразившие согласие, %
Пример Б: упорядочено по убыванию степени согласия
Рекламный ролик рассчитан на таких людей, как я
87
Лицу, рекламирующему товар, можно верить
84
Музыкальное сопровождение прекрасно подобрано
83
Хотел(а) бы снова увидеть этот рекламный ролик
78
Я кое-что узнал(а), просмотрев рекламный ролик
74
Лицам, участвующим в рекламном ролике, можно верить
31
Рекламный ролик не интересен
28
Рекламный ролик вызвал у меня замешательство
26
Лицо, рекламирующее товар, вызывает раздражение
26
Я видел(а) такие ролики прежде
25
Я скажу свои друзьям, что этот ролик стоит посмотреть
24
Было скучно
23
Мне не нравятся рекламные ролики такого рода
22
Закономерность ответов на этот вопрос можно сделать более ясной, если
придерживаться следующих действий:
 Во-первых, определите о чем данные будут говорить, т.е. установите,
что вы хотите получить – общую картину положительных или отрицательных откликов, или реакцию на исполнение ролика в сравнении с
реакцией на рекламное обращение. (В этом примере мы концентрируем внимание на положительных и отрицательных реакциях).
 Во-вторых, сгруппируйте утверждения в соответствии с целью представления данных. Исходя из поставленной цели, отдельно группируются все положительные утверждения и отдельно – отрицательные.
 В – третьих, дайте название каждой из группировок. В нашем случае
одна группировка будет называться «Положительные реакции», а
вторая – «Отрицательные реакции».
 В- четвертых, рассчитайте совокупный процент для каждой группы
суждений. Этот процент характеризует долю респондентов, выбравших, по крайней мере, один из пунктов группировки. *Следующая
393
таблица 15. (см. ниже) демонстрирует указанный подход к представлению номинальных данных. Когда данные организованы так, как показано в таблице, сразу становятся очевидными следующие выводы:
 Почти всем респондентам что-либо понравилось в рекламном ролике
(учитывая высокий совокупный процент группировки положительных утверждений).
 Большинство потребителей согласились с тем, что рекламный ролик –
именно то, что нужно («рассчитан на таких людей, как я»), а личность,
рекламирующая товар, была достаточно убедительной, хотя и вызвала
некоторое раздражение.
 Отрицательные ответы отражают мнение лишь нескольких респондентов
(учитывая низкий совокупный процент группировки негативных утверждений), причем каждому из них не нравится почти все в рекламном ролике.
Представление ответов на вопросы-меню: группировка пунктов
Таблица 15
Респонденты, выразившие согласие, %
Положительные суждения – совокупный процент
97
Рекламный ролик рассчитан на таких людей, как я
87
Лицу, рекламирующему товар, можно верить
84
Музыкальное сопровождение прекрасно подобрано
83
Хотел(а) бы снова увидеть этот рекламный ролик
78
Я кое-что узнал(а), просмотрев рекламный ролик
74
Лицам, участвующим в рекламном ролике, можно верить
31
Я скажу свои друзьям, что этот ролик стоит посмотреть
24
Отрицательные суждения – совокупный процент
31
Рекламный ролик не интересен
28
Рекламный ролик вызвал у меня замешательство
26
Лицо, рекламирующее товар, вызывает раздражение
26
Я видел(а) такие ролики прежде
25
Было скучно
23
Мне не нравятся рекламные ролики такого рода
22
394
Интервальные и относительные данные: объединение связанных по
смыслу шкал. Очень часто для оценки индивидуального отношения и поведения используют набор школьных вопросов. Использование серии шкал обычно
обеспечивает многостороннее понимание интересующей области. Например,
рекламист, занимающийся репозиционированием товара с целью подчеркнуть
его свойства, благотворно влияющие на здоровье человека, сперва может оценить мнение целевой аудитории о рекламировании товаров, благотворно
влияющих на здоровье человека, и ее отношение к компаниям, финансирующим такую рекламу. Для этой цели могли быть использованы следующие утверждения:
1. Товар, рекламируемый как «легкий» и «обезжиренный», действительно полезнее для здоровья.
2. Реклама, которая настойчиво подчеркивает свойства товара, благотворно влияющие на здоровье человека, чаще всего простой обман.
3. Корпорации, которые рекламируют свойства товара, благотворно
влияющие на здоровье человека, искренне заботятся о потребителе.
4. Реклама, которая настойчиво подчеркивает свойства товара, благотворно влияющие на здоровье человека, эксплуатирует потребности
людей.
5. Большинство роликов, которые рекламируют товары, как
благо-
творно влияющие на здоровье человека, малоправдоподобно.
6. Корпорации, которые призывают к потреблению товаров, благотворно влияющих на здоровье человека, стремятся лишь заработать
побольше денег.
7. Многие корпорации намеренно преувеличивают свойства своих товаров, представляя их как благотворно влияющие на здоровье человека.
В этой серии утверждения 1,2,4 и 5оценивают отношение потребителей к
рекламе товаров, благотворно влияющих на здоровье человека, тогда как
395
утверждения 3,6 и 7 оценивают отношение к компаниям, которые платят за подобную рекламу.
Реакцию на эти семь утверждений можно представить в виде таблицы 16.
«Ответы на утверждения, выражающие отношение» (См.ниже). Хотя такой
подход представляет все необходимые данные о наиболее важных в данном исследовании подгруппах респондентов, аудитория, изучающая эту таблицу, может запутаться в обилии данных, в результате чего важные выводы и заключения будут утеряны.
Ответы на утверждения, выражающие отношение
Таблица 16.
Утверждение
Вся выборка
Взрослое
Мужчины
Женщины
население
26-54 лет
26-54 лет
18-25 лет
Товар, рекламируемый как «лег-
3,3
3,2
2,9
3,7
4,4
4,6
4,2
4,4
4,1
4,3
3,9
4,1
4,5
4,7
4,0
4,8
кий» и «обезжиренный», действительно полезнее для здоровья.
Реклама, которая настойчиво подчеркивает свойства товара, благотворно влияющие на здоровье человека, чаще всего простой обман.
Корпорации, которые рекламируют свойства товара, благотворно
влияющие на здоровье человека,
искренне заботятся о потребителе
Реклама, которая настойчиво подчеркивает свойства товара, благотворно влияющие на здоровье человека, играет на слабостях людей
Это ключевая идея утверждения. Шкалы некоторых утверждений перевернуты для обеспечения единообразия
интерпретации значений. Большие величины указывают на большую степень согласия и более отрицательное
отношение.
396
Вся выборка
Утверждение
Взрослое
Мужчины
Женщины
население
26-54 лет
26-54 лет
18-25 лет
Большинство
роликов,
которые
рекламируют товары, как
4,3
4,7
3,9
4,3
4,3
4,4
4,2
4,3
4,5
4,7
4,2
4,6
благо-
творно влияющие на здоровье человека, малоправдоподобно
Корпорации, которые призывают к
потреблению товаров, благотворно
влияющих на здоровье человека,
стремятся лишь заработать побольше денег.
Многие
корпорации
намеренно
преувеличивают свойства своих
товаров, представляя их как благотворно влияющие на здоровье человека
Важные результаты лучше всего представить, сперва организовав утверждения,
как показано в таблице 16 (См.выше), а затем осуществив дополнительные вычисления. Сначала, как и в случае с вопросами-меню, логически связанные пункты группируются, и группе присваивается название. Далее вычисляется среднее для каждой
группы шкал. Эта обобщающая информация, когда она добавляется в исходную таблицу (См. ниже следующую таблицу 17. «Сгруппированные утверждения, выражающие отношение»), делает очевидными и наглядными различия между подгруппами в отношении рекламы и производителей товаров, преподносимых как благотворно влияющие на здоровье человека.
Сгруппированные утверждения, выражающие отношение»
Таблица 17.
Это ключевая идея утверждения. Шкалы некоторых утверждений перевернуты для обеспечения единообразия
интерпретации значений. Большие величины указывают на большую степень согласия и более отрицательное
отношение.
397
Утверждение
Вся выборка
Взрослое
Мужчины
Женщины
население
26-54 лет
26-54 лет
18-25 лет
Отношение к рекламированию товара
Общее отношение
4,1
4,3
3,8
4,2
Товар, рекламируемый как «легкий» продукт, ничуть не лучше для
здоровья.
3,3
3,2
2,9
3,7
Реклама, которая настойчиво подчеркивает свойства товара, благотворно влияющие на здоровье человека, чаще всего простой обман.
Реклама, которая настойчиво подчеркивает свойства товара, благотворно влияющие на здоровье человека, играет на слабостях людей
Большинство роликов, которые
рекламируют товары, как благотворно влияющие на здоровье человека, малоправдоподобно
Отношение к корпорациям
Общее отношение
4,4
4,6
4,2
4,4
4,5
4,7
4,0
4,8
4,3
4,7
3,9
4,3
4,3
4,5
4,1
4,3
Корпорации, которые рекламируют свойства товара, благотворно
влияющие на здоровье человека,
на самом деле не заботятся о потребителе
Корпорации, которые призывают к
потреблению товаров, благотворно
влияющих на здоровье человека,
стремятся лишь заработать побольше денег.
4,1
4,3
3,9
4,1
4,3
4,4
4,2
4,3
Многие корпорации намеренно
преувеличивают свойства своих
товаров, представляя их как благотворно влияющие на здоровье человека
4,5
4,7
4,2
4,6
Далее надо иметь ввиду, что усреднение ответов на логически взаимосвязанные шкалы – интуитивно обоснованный метод обобщения информации. Однако для того, чтобы вычисление среднего было осмысленной операцией, вы
должны прежде убедиться в том, что шкалы содержательно связаны между
собой. Затем следует вычислить коэффициент альфа, который отражает внут-
398
реннюю согласованность набора шкал (См. ниже табл. 18. «Вычисление коэффициента альфа»), иллюстрирующую процесс вычисления коэффициента).
Среднее арифметической для набора вопросов рекомендуется вычислять только в том случае, если коэффициент альфа для него составляет не менее 0,80.
Вычисление коэффициента альфа
Таблица 18.
Первый шаг: получите корреляционную матрицу для переменных из набора
Переменная 1
Переменная 2
Переменная 3
Переменная 4
Переменная 1
-
-
-
-
Переменная 2
0,876
-
-
-
Переменная 3
0,768
0,769
-
-
Переменная 4
0,963
0,976
0,787
-
Второй шаг: найдите среднее интеркорреляций
Среднее интеркорреляций = (0,876 + 0,768 + 0,963 + 0,769 + 0,787) : 6 = 5,139 : 6 = 0,857
Третий шаг: подставьте числа в формулу
Коэффициент альфа =
1
N*p
,
( p)( N 1)
Где N – это число шкал и p – среднее арифметическое интеркорреляций.
Коэффициент альфа в этом примере составит 0,960, а вычисляется он таким образом:
Коэффициент альфа =
1
4 * 0.857
(0.857 )(4 1)
Анализ данных и компьютеры
Методы описательной статистики, рассмотренные в этом разделе учебного курса, несложны для вычисления, - можно обойтись и обычным калькулятором. Но существуют и методы математико - статистического вывода, требующие значительно более сложных вычислений.
Статистические программы, разработанные для персональных компьютеров, сокращают (а часто и устраняют) необходимость вычисления вручную.
Такие программы, как Minitab и SPSS, дают возможность быстро и эффективно
исследовать и анализировать данные. В данном учебном курсе эти программы
и методы не рассматриваются.
Резюме
399
Анализ данных помогает исследователю обнаружить закономерности и
тенденции в ответах на вопросы анкеты. Тип анализа, наиболее подходящий
для конкретного вопроса, определяется уровнем измерения вопроса.
Все данные, независимо от уровня измерения могут анализироваться с помощью частот, долей, процентов и пропорций. Эти сводные данные могут быть
представлены как в виде таблиц, так и в виде графиков.
Для данных, измеренных в шкалах интервалов и отношений, можно использовать дополнительные статистические выводы.
Среднее или среднее арифметическое, медиана, мода, дисперсия и стандартное отклонение вычисляются для данных интервального и относительного уровней.
Среднее характеризует наиболее типичное значение распределения чисел.
Дисперсия и стандартное отклонение – показатели степени рассеивания
распределения, которые помогают определить, насколько хорошо среднее
представляет распределение.
Определение медианы (значения, располагающегося в центре распределения) и моды (наиболее часто встречающегося значения) способствует более
глубокому пониманию особенностей распределения для определения того, насколько хорошо среднее представляет распределение.
Вопросы к теме
1. Что такое подсчет ответов?
2. Что такое распределение частот?
3. Какова зависимость между подсчетом и распределением частот?
4. Что представляет собой доля? Как она вычисляется?
5. В чем заключается связь между распределением частот, долей и
процентов?
6. Что легче воспринимается
процент? Чем это объяснить?
для представления данных: доля или
400
7. Что лучше всего определить при малом объеме выборки: распределение частот, долей или процентов?
8. Что такое пропорция? Как она вычисляется?
9. Что представляет собой распределение частот данных ранжирования? В чем его сходство, а в чем отличие от распределения частот
номинальных данных?
10.Что представляет собой распределение процентов для ранжирования
данных? В чем его сходство, а в чем отличие от распределения частот номинальных данных?
11.Что такое дискретные данные? Чем они отличаются от непрерывных
данных?
12.Что такое группировка и когда ее следует использовать?
13.Назовите три шага группировки данных. Дайте краткое описание
каждому шагу.
14.Какими основными правилами следует руководствоваться при создании категорий непрерывных данных?
15.Что представляет собой среднее или среднее арифметическое ряда
чисел?
16.Какие обстоятельства определяют меру репрезентативности среднего данным, на которых оно вычислялось?
17.Что такое дисперсия? Как она вычисляется?
18.Какая существует зависимость между дисперсией и стандартным отклонением?
19.Что такое медиана? Как она определяется?
20.При каких обстоятельствах медиана по сравнению со средним более
предпочтительна как описательная мера для набора данных?
21.Что такое мода?
22.Какое соотношение существует между средним, медианой и модой
при колоколообразном и ассиметричном распределении?
401
23.Какие три шага следует проделать для упрощенного представления
номинальных данных?
24.Что такое совокупный процент и как он вычисляется?
25.Какие три шага следует проделать для упрощенного представления
интервальных и относительных данных?
26.Что такое коэффициент альфа и что он говорит о наборе вопросов?
27.Как вычисляется коэффициент альфа?
Практикум
Компания «Собачья радость» создала четыре новых ролика для рекламирования своей линии по производству ароматизированных собачьих бисквитов. Перед тем как выбрать для производства один из рекламных роликов, компания провела исследование реакции целевой аудитории на каждый ролик, а
также реакции на те конкретные рекламные утверждения о товаре, которые нес
каждый ролик.
Сбор данных осуществлялся методом интервью в торговом пассаже.
Посетители, прошедшие отборочную процедуру и согласившиеся участвовать
в исследовании, приглашались в специальное помещение для проведения интервью и просмотра рекламных роликов. После просмотра всех трех роликов
профессиональный интервьюер проводил с каждым респондентом двадцатиминутное интервью.
Интервью было довольно обширным. Вот некоторые основные вопросы, которые задавались каждому из респондентов:
Вопрос 1. Пол
ЗАПИШИТЕ НЕ СПРАШИВАЯ
Мужской ______
(1)
Женский _______(2)
Вопрос 2. Возраст
Укажите свой полный возраст
___________________
Вы просмотрели рекламные ролики компании «Собачья радость». А сейчас я хотел
бы узнать ваше мнение о том, понравятся или не понравятся вашей собаке эти бисквиты.
402
Будьте добры, прослушайте каждую фразу, которую я сейчас вам прочитаю. После каждой
услышанной фразы отметьте на шкале этой карточки ( НА КАРТОЧКЕ – ПЯТЬ ПУНКТОВ:
ОТ «АБСОЛЮТНО СОГЛАСЕН» (1) ДО «АБСОЛЮТНО НЕ СОГЛАСЕН»(5)
степень
вашего согласия или несогласия с каждой из услышанных фраз.
a) Я думаю, что моей собаке эти бисквиты понравятся больше, чем те, которые я
даю ей сейчас.
b) Я думаю, что моя собака будет вести себя намного лучше, если давать ей эти бисквиты в качестве вознаграждения за хорошее поведение.
Вопрос 9. Преимущества товара.
В роликах упоминались несколько преимуществ собачьих бисквитов компании «Собачья радость». Я хотел бы, чтобы вы отметили относительную важность этих преимуществ
для вас и вашей собаки, присвоив каждому из них определенное количество очков. У вас
есть 100 очков, которые вы можете распределить между приведенными ниже четырьмя преимуществами. Вы можете присвоить меньше или больше очков, или же не присвпаивать ни
одного очка. Чем больше очков вы присвоите какому-либо из преимуществ, тем большее
значение оно имеет для вас. Убедитесь, что общая сумма присвоенных вами очков равняется 100. ПЕРЕДАЙТЕ АНКЕТУ РЕСПОНДЕНТУ. ПОСЛЕ ЗАПОЛНЕНИЯ СОБЕРИТЕ АНКЕТЫ. УБЕДИТЕСЬ В ТОМ, ЧТО ОБЩАЯ СУММА ПОСТАВЛЕННЫХ РЕСПОНДЕНТОВ
ОЧКОВ РАВНЯЕТСЯ 100.
Очищает зубы
_________
Предупреждает появление кариеса
__________
Освежает дыхание
__________
Дополнительное питание для собаки
__________
Всего
100
Вопрос 13. Коммерческая привлекательность
Ниже приведены названия четырех просмотренных вами роликов. Хочу вас попросить дать оценку каждому из них. Поставьте «1» напротив названия ролика, который вам
понравился больше всего, «2» - следующему ролику, «3» - ролику, который понравился
меньше, и «4» - ролику, который понравился меньше всех. Каждую из оценок вы должны
поставить только один раз. ПЕРЕДАЙТЕ АНКЕТУ РЕСПОНДЕНТУ. ПОСЛЕ ЗАПОЛЕНИЯ
СОБЕРИТЕ АНКЕТЫ. УБЕДИТЕСЬ В ТОМ, ЧТО РЕСПОНДЕНТ ПОСТАВИЛ КАЖДУЮ
ИЗ ОЦЕНОК ТОЛЬКО ОДИН РАЗ.
Праздник для собаки
_________
Пять метров
_________
403
Собака на диване
__________
Зубы, о которых можно только мечтать
__________
Вопрос 16. Намерение купить – цена высокая
Укажите, пожалуйста, насколько высока вероятность того, что вы купили бы собачьи
бисквиты компании «Собачья радость», если бы они продавались в вашем гастрономе, и их
цена была бы сопоставима с ценой ведущей торговой марки, производящей собачье печенье.
Чрезвычайно высока
_________(1)
Достаточно высока
_________(2)
Не могу сказать определенно
_________(3)
Достаточно низка
_________(4)
Чрезвычайно низка
_________(5)
Вопрос 17. Намерение купить – цена низкая
Укажите, пожалуйста, насколько высока вероятность того, что вы купили бы собачьи
бисквиты компании «Собачья радость», если бы они продавались в вашем гастрономе и их
цена была бы сопоставима с ценой в фирменном магазине, торгующем собачьими бисквитами.
Чрезвычайно высока
_________(1)
Достаточно высока
_________ (2)
Не могу сказать определенно
_________ (3)
Достаточно низка
_________ (4)
Чрезвычайно низка
_________ (5)
Ответы пятидесяти респондентов воспроизведены в таблице (См. ниже).
Воспользуйтесь этими данными и своим знанием связи между уровнем измерения и типом анализа для того, чтобы дать ответы на следующие вопросы:
Вопрос 1. Пол
К какому уровню измерения относится этот вопрос?
Как характеризуется выборка с точки зрения половых различий? Какая из
мер центральной тенденции (среднее, медиана или мода) лучше всего отражает
эту характеристику? Почему эта мера наиболее приемлема при данном распределении? Следует ли в данном случае вычислить дисперсию и стандартное
404
отклонение? Почему? Представьте результаты проведенного вами анализа в
виде таблицы и графика.
Вопрос 2. Возраст
К какому уровню измерения относится этот вопрос?
Сгруппируйте данные с целью дать характеристику выборки на основе
возраста. Какая из мер центральной тенденции (среднее, медиана или мода)
лучше всего отражает эту характеристику? Почему эта мера наиболее приемлема при данном распределении? Следует ли в данном случае вычислить дисперсию и стандартное отклонение? Почему? Представьте результаты проведенного вами анализа в виде таблицы и графика.
Вопрос 7. Привлекательность товара
К какому уровню измерения относится этот вопрос?
Используя ответы на вопрос 7а, определите степень привлекательности
товара для целевой категории. Как каждая из мер центральной тенденции помогает вам понять характеристики распределения ответов? Какая из мер, с вашей точки зрения, наиболее приемлема для иллюстрации степени привлекательности товара? Следует ли в данном случае вычислять дисперсию и стандартное отклонение? Почему
Используя ответы на вопрос 7б, определите степень доверия целевой аудитории к утверждению о том, что благодаря бисквитам собака будет вести себя лучше. Так же, как для вопроса 7а, определите, как каждая из мер центральной тенденции помогает вам понять характеристики распределения ответов.
Какая из мер, с вашей точки зрения, наиболее приемлема для иллюстрации
уровня убеждения целевой аудитории в том, что благодаря бисквитам собака
будет вести себя лучше? Следует ли в данном случае вычислять дисперсию и
стандартное отклонение? Почему?
Представьте результаты проведенного вами анализа в виде таблицы и
графика.
Вопрос 9. Преимущества товара
К какому уровню измерения относится этот вопрос?
405
Когда вы будете представлять результаты исследования, ваш клиент, - компания
«Собачья радость», - определенно попросит вас дать ответ о том, какое из преимуществ
товара следует особо подчеркнуть при проведении новой рекламной кампании. Что вы
посоветуете? Какие из дескриптивных мер наиболее приемлемы для описания характеристик распределения и установления наиболее важного преимущества? Представьте
полученные результаты в табличной и графической форме, а также объясните, почему
вы рекомендуете подчеркнуть именно это преимущество товара.
Вопрос 13. Коммерческая привлекательность
К какому уровню измерения относится этот вопрос?
Вашему клиенту, - компании «Собачья радость», - больше всего понравился рекламный ролик под названием «Зубы, о которых можно только мечтать». У клиента есть
все основания полагать, что целевой аудитории тоже понравится этот ролик, вследствие чего рекламное агентство будет рекомендовать для производства именно его. Прав
ли клиент? Нравится ли целевой аудитории этот ролик? Всем ли респондентам в одинаковой мере? Какой из роликов вы бы порекомендовали для производства? Руководствуясь какими соображениями, вы выбрали именно этот рекламный ролик? Какие
дескриптивные меры наиболее приемлемы для описания характеристик распределения
и для определения ролика, который больше всего понравился целевой аудитории?
Представьте результаты исследований в табличной и графической формах, а также
объясните, почему вы рекомендуете для производства именно этот рекламный ролик.
Вопросы 16 и 17. Намерение купить
К какому уровню измерения относится этот вопрос?
Ваш клиент в настоящее время устанавливает новую цену на свой товар. Охарактеризуйте намерение купить, сложившееся у целевой аудитории в соответствии с двумя ценовыми уровнями. Какие дескриптивные меры наиболее приемлемы для описания характеристик распределения и для определения намерения купить в соответствии
с каждым из ценовых уровней? Основываясь на полученных данных, какой ценовой
уровень вы бы порекомендовали? Почему? Представьте результаты исследований в
табличной и графической формах, а также объясните, почему вы рекомендуете именно
этот уровень установления цены.
408
Данные для изучения отклика на рекламу собачьих бисквитов
Номер
респон
дента
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Пол
Возраст
1
2
1
2
2
2
2
1
1
2
1
1
2
2
1
1
2
1
1
2
1
2
1
2
2
20
24
23
41
43
37
34
57
42
41
22
19
17
23
37
41
58
42
33
29
22
25
21
43
40
Вопрос Вопрос
7а
7б
1
2
1
3
1
2
2
1
3
4
5
3
2
2
1
2
2
2
4
2
2
1
2
3
1
1
2
5
4
2
1
4
4
5
1
4
2
5
2
1
4
5
1
4
5
2
2
4
3
2
Вопрос 9: преимущества
ДополПредот
Освенитель
Очивращажает
ное
щает
ет кадыхапитазубы
риес
ние
ние
30
34
50
45
5
1
30
40
2
30
1
42
46
33
47
5
40
0
35
40
31
34
55
47
2
30
33
25
35
5
1
30
30
3
40
0
37
34
33
40
1
40
0
35
30
31
35
20
33
2
30
27
15
15
5
1
30
20
1
20
1
20
18
33
10
2
15
1
20
18
31
30
15
17
2
10
6
10
5
85
97
10
10
94
10
98
1
2
1
3
924
5
99
10
12
7
5
10
3
94
Таблица 19
Вопрос 14: привлекательность
Праздник для
собаки
Пять
метров
Собака на
диване
Зубы, о
которых
можно
мечтать
Вопрос
16
Вопрос
17
1
1
1
2
2
1
2
1
3
3
1
1
2
1
1
4
1
2
1
1
1
1
1
2
2
2
3
2
1
1
2
1
2
1
2
2
3
1
2
2
1
2
1
2
2
2
3
2
1
1
3
4
3
3
3
3
4
3
2
1
3
2
3
3
3
2
4
3
3
4
3
4
3
3
3
4
2
4
4
4
4
3
4
4
4
4
4
4
4
4
3
3
4
4
3
4
2
4
4
4
5
4
5
3
5
4
3
2
4
5
4
5
4
1
5
3
3
4
4
5
5
5
5
4
4
1
2
3
4
2
1
2
1
3
2
1
2
1
1
2
4
3
5
2
1
1
1
3
3
1
409
Данные для изучения отклика на рекламу собачьих бисквитов
Таблица 20
Номер
респон
дента
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Пол
Возраст
2
2
1
1
2
2
1
2
2
2
2
2
1
1
2
1
1
2
2
1
1
1
2
1
2
36
32
59
44
49
29
35
43
40
36
32
34
22
19
17
57
42
41
33
37
41
33
29
42
58
Вопрос Вопрос
7а
7б
2
1
1
3
1
2
2
3
1
2
1
2
5
3
2
1
3
4
5
4
2
4
2
3
2
1
5
4
5
1
5
4
3
2
1
5
4
4
2
5
4
5
1
2
3
4
4
5
1
5
Вопрос 9: преимущества
ДополПредот
Освенитель
Очивращажает
ное
щает
ет кадыхапитазубы
риес
ние
ние
30
1
40
43
58
40
1
47
2
30
1
30
1
42
46
40
3
30
50
42
0
35
40
0
38
30
0
30
20
32
25
0
33
2
30
0
30
0
37
34
30
6
40
35
30
1
35
30
1
38
30
5
25
20
5
25
1
17
2
30
5
30
4
20
18
20
1
20
15
20
2
20
18
0
20
10
94
5
7
5
10
98
3
94
10
94
10
95
1
2
10
90
10
0
5
97
10
12
99
4
Вопрос 14: привлекательность
Праздник для
собаки
Пять
метров
Собака на
диване
Зубы, о
которых
можно
мечтать
Вопрос
16
Вопрос
17
2
1
2
1
1
1
1
2
2
2
1
2
1
1
2
1
3
1
1
1
4
1
1
2
1
1
2
1
2
3
2
3
1
1
1
2
1
2
3
1
2
2
3
2
3
1
2
2
1
2
4
3
3
4
2
3
2
3
3
4
3
4
3
2
3
3
2
2
3
2
2
3
4
3
4
3
4
4
3
4
4
4
4
44
3
4
3
4
4
4
4
4
4
4
4
3
4
3
4
3
3
5
4
3
5
5
4
4
4
3
5
3
4
5
4
2
4
4
5
1
3
4
5
4
3
3
2
2
3
2
1
2
3
1
3
2
2
1
2
1
1
3
1
2
2
4
2
1
5
3
Download