1present

advertisement
Статистика и анализ данных
Arkadi Bojaršinov
arkadi.bojarsinov@mail.ee
Программа курса
• Объём курса: 5 контактных часов (1 EAP)
• Основные темы: Введение в статистику.
Coздание анкет. Типы вопросов, оценочные
шкалы. Занесение данных в таблицу, кодирование
данных. Обработка данных с помощью
программы MS Excel.
• Оценивание: Успешное выполнение домашней
работы (свыше 50%) даёт зачёт.
Чем занимается статистика?
1) Статистика занимается сбором, обработкой
и анализом данных.
2) Статистика не только описывает нынешнюю
ситуацию, но и даёт вероятный прогноз как
ситуация будет развиваться в дальнейшем.
3) «Закон больших чисел»
Методы сбора статистической информации
КАЧЕСТВЕННЫЙ
КОЛИЧЕСТВЕННЫЙ
Методы
Эксперимент, интервью,
наблюдение, анализ
документов
Анкета, тест
Философия
Субъективная –
исследователь оценивает
явление или объект
Данные
Данные представлены
словами, изображениями,
объектами
Объективная –
исследуемое явление
независимо от
исследователя
Данные представлены
числами, в статистической
форме
Анализ
результатов
Трудоёмкий, вручную
С помощью компьютерых
программ
Описательная и аналитическая
статистики
• Описательная статистика занимается описанием
и анализом выборки (т.е. непосредственно
исследуемых объектов)
• Аналитическая статистика распространяет
результаты измерения выборки на всю
популяцию.
Популяция и выборка
• Популяция – все объекты, в
отношении которых должны
действовать установленные
исследователем гипотезы и
предположения.
• Выборка – малая часть
популяции, которая отбирается
для исследования.
Что считает выборка?
(описательная статистика)
?
Вероятность ошибки
(0-5%)
Какова вероятность
что популяция
считает так же?
(аналитическая статистика)
Аналитическая статистика…
• Переносит результаты исследования выборки на
всю популяцию.
• Основной вопрос: насколько точно такое
обобщение от малой части к целому?
• Основные термины: статистическая вероятность,
статистическая ошибка.
Cohen & Manion, 2001
Популяция Размер выборки (5% ошибка)
50
44
100
79
200
132
500
217
1000
278
2000
322
5000
357
10 000
370
20 000
377
50 000
381
100 000
383
1000 000
384
Описательная и аналитическая
статистики
АНАЛИТИЧЕСКАЯ
ОПИСАТЕЛЬНАЯ СТАТИСТИКА
(анализ собранных данных)
!
Составление анкет
Создание е-анкет
•
•
•
•
•
Google form (www.google.ru)
Webanketa (www.webanketa.com)
E-formular (www.e-formular.com)
www.connect.ee
ZohoCreator (www.zohocreator.com)
arvutiope.blogspot.com
Открытые vs Закрытые
вопросы
• Ваше место жительства:
…………………………………………………………………………………
…………………………………………………………………………………
• Ваше место жительства:
 город
 вне города
Открытые vs Закрытые
вопросы
• Ваша зарплата: …………………………………………………
• Ваша зарплата
 до 300 EUR
 от 300 до 600
 от 600 до 900
 свыше 900
Открытые vs Закрытые
вопросы
Ваше любимое время года
 Зима
 Весна
 Лето
 Осень
Ваше любимое блюдо:
……………………………………………………………………………………..
Оценочные шкалы
Правильная шкала
Как оцениваете своё здоровье:
1 2 3 4 5 6
очень плохо
7
очень хорошо
NB! Правильная оценочная шкала должна
быть
с равными интервалами,
последовательна и
симметрична
Правильная шкала
Как оцениваете своё здоровье:
1
2
очень плохо плохо
3
4
5
6
7
скорее плохо средне скорее хорошо хорошо очень хорошо
Правильная шкала
Как оцениваете своё здоровье:
1
плохо
2
скорее плохо
3
скорее хорошо
4
хорошо
В чём проблема?
Как оцениваете своё здоровье:
1
плохо
2
скорее плохо
3
скорее хорошо
4
очень хорошо
В чём проблема?
Как оцениваете своё здоровье:
1
2
3
4
5
очень плохо - плохо - затрудняюсь ответить – хорошо - очень хорошо
В чём проблема?
Как оцениваете своё здоровье:
1
2
3
4
средне
скорее хорошо
хорошо
очень хорошо
В чём проблема?
Как оцениваете своё здоровье:
1
2
3
4
очень хорошо хорошо средне плохо
5
очень плохо
Методы представления
статистических данных
1. Текст – используйте текст, если вы хотите
представить один-два числовых значения.
2. Таблицы - используйте таблицы, если вы
хотите показать большое (или среднее)
количество точных числовых данных.
3. Диаграммы – используйте диаграммы,
если хотите дать быстрый обзор общих
тенденций.
Текст, примеры:
• В группе 12 девочек и 9 мальчиков.
• Было роздано 50 анкет, из них вернулуось 40.
• Средняя зарплата за июнь 2010 составила 722,5
евро, а за июнь 2011 года 805,5 евро.
• Из числа опрошенных мужчины составили 44% и
женьщины 56%.
Точные данные!
Цвет глаз
число
процент
зелёный
36
35,3%
сниний
28
27,5%
серый
26
25,5%
карий
12
11,8%
Всего
102
100,0%
Общая тенденция!
Обработка данных в Excel
(таблицы)
Стандартный вид таблицы
Цвет глаз
число
процент
зелёный
36
35,3%
сниний
28
27,5%
серый
26
25,5%
карий
12
11,8%
Всего
102
100,0%
Любимое время года
число
процент
лето
41
39,81%
весна
23
22,33%
зима
21
20,39%
осень
18
17,48%
Всего
103
60,19%
Сопряжённые таблицы
Тип
темперамента число
Женщины
Mужчины
процент
число
процент
сангвиник
14
32,60%
20
33,90%
холерик
13
30,20%
14
23,70%
флегматик
9
20,90%
15
25,40%
меланхолик
7
16,30%
10
16,90%
43
100,00%
59
100,00%
Всего
«Порядковая» таблица
Строки располагаются в логическом порядке!
Как часто смотрите
телевизор?
число
процент
часто
45
38,5%
иногда
54
46,2%
не смотрю
18
15,4%
117
100,0%
Всего
образование
M
Ж
процент число
процент
число
начальное
21
31,34%
17
34,00%
среднее
24
35,82%
18
36,00%
высшее
22
32,84%
15
30,00%
Всего
67 100,00%
50 100,00%
Средняя оценка за тест
Пол
Средняя оценка
M
67,59
Ж
64,66
Спасибо!
Download