heading date

advertisement
ПРЕДСТАВЛЕНИЕ
ДАННЫХ
ЧТО должно быть представлено?
Iв предоставлении любых данных нам необходимо:
• Данные + описание (название, категории, и
т.д.)
• Источник данных (исследование,
административная статистика и т.д.)
• Любые примечания (например, если данные
относятся только к выбранным регионам)
ЧТО должно быть представлено?
В случае отчета по отслеживанию выпускников (любые
микро данные):
• Введение (цель, содержание, структура)
• Отчет по методу (сбор данных и качество данных)
• Презентация результатов (описательная
статистика)
• Выводы
Будьте честны в описании Вашей методологии и
качеству источников данных!!
Отчет по методу
• Предпосылки исследования (например, отслеживание выпускников)
• Цели
• Разработка инструментов исследования (вопросник)
• Предварительное апробирование вопросника
• Целевая аудитория
• Качество и количество использованных адресов
• Процедуры обновления адресов
• Время проведения исследования
• Статистика ответов
• Проверка репрезентативности (сравнение с существующей статистикой)
• Ввод данных и кодирование
• Способы проверки достоверности и подчистка данных
• Анализ данных
• Критическое отражение качества данных (Schomburg, 2014)
Представление данных: общие
правила
• Использование процентов – легче в восприятии, чем
«голые» цифры (но лучше добавить общее
количество соответствующих ответов)
• Не используйте десятичные (правильнее– 14%)
• Используйте таблицы и графики – легче для
восприятия
• Отчет по существующим переменным
Представление данных: общие
правила
• Работаете ли Вы в данный
момент?
нет
ответа, 35
• Работаете ли Вы в данный
момент?
да , 25
да , 38
нет , 62
нет , 40
Заметка: 35% (7 респондентов) –
отсутствующие ответы
Представление данных: общие
правила
• Работаете ли Вы в данный
момент?
• ДА – 100 респондентов (66.7%)
• НЕТ– 50 респондентов (33.3%)
• В каком секторы Вы
работаете?
Из100 работающих респондентов, 50%
из них работают в СФЕРЕ УСЛУГ, 30%
из них работают в СЕЛЬСКОМ ХОЗ-ВЕ
и 20% в ПРОМЫШЛЕННОСТИ.
С/Х; 30
УСЛУГИ;
50
ПРОМТЬ; 20
ВИЗУАЛИЗАЦИЯ ДАННЫХ: ТАБЛИЦЫ
Что такое таблица?
НАЗВАНИЕ: Количество студентов в ПТО
Уч.заведени
е1
Уч.заведени
е2
Уч.заведени
е3
Всего
РЯД
Мужчины
551
493
378
1422
Женщины
357
207
326
890
Всего
908
700
704
2312
КОЛОНКА
Количество студентов в ПТО
Уч.заведе
ние 1
Уч.завед
ение2
Уч.завед
ение3
Всего
Мужчины
551
493
378
1422
Женщины
357
207
326
890
Всего
908
700
704
2312
Количество студентов в ПТО(%)
Количество студентов в ПТО(%)
Уч.завед
ение1
Уч.завед
ение 2
Уч.заведе
ние 3
Всего
Мужчины
61
70
54
62
Женщины
39
30
46
38
Всего
100
100
100
100
Уч.заве
дение 1
Уч.заве
дение 2
Уч.завед
ение 3
Всего
Мужчины
39
35
26
100
Женщины
40
23
37
100
Всего
39
30
31
100
Например: занятые по категории и полу
Управленцы
верхнего
звена
Менеджеры
среднего
звена
Профессиона
лы
Квалиф-ые
Работники
%Мужчины
% Женщины
% Всего
2.11
2.17
2.16
6.45
47.3
29.88
11.82
67.37
13.96
7.26
50.31
27.48
Неквалиф-ые
Работники
13.43
4.24
12.05
Другое
0.79
0.44
0.74
ВСЕГО
100
100
100
%Мужчины
% Женщины
% Всего
Управленцы
верхнего звена
84.93
15.07
100
Менеджеры
среднего звена
75.54
24.46
100
Профессионал
ы
79.88
20.12
100
Квалиф-ые
Работники
92.37
7.63
100
Неквалиф-ые
Работники
94.71
5.29
100
Другое
91
9
100
ВСЕГО
84.98
15.02
100
Будьте внимательны при расшифровке данных, они могут быть
неверными…
% Мужчины
% Женщины
Продажи и маркетинг
18.0
23.9
Производство
46.3
47.7
Техобслуживание/содерж
ание
4.0
0.0
Финансы
29.7
1.8
Административная
поддержка
2.0
26.6
Другое
-
-
Всего
100
100
%
Мужчины
%
Женщины
% Всего
Продажи и маркетинг
63.1
36.9
100
Производство
79.2
20.8
100
92.3
7.7
100
89.8
10.2
100
75.4
24.6
100
-
-
76.9
23.1
Техобслуживание/сод
ержание
Финансы
Административная
поддержка
Другое
Всего
100
ВИЗУАЛИЗАЦИЯ ДАННЫХ: ГРАФИКИ
Что такое график?
Это инструмент для ОПИСАНИЯ информации
визуально
Основные Цели:
 Улучшает восприятие
 Подчеркивает отношения
 Показывает направления с течением
времени и пространства
ПРИМЕР
Улучшает восприятие
Tab 10 - Education level of people aged 15 and above
Таджикистан: Уровень образования людей в возрасте от 15 лет
Education level
и старше
60%
50%
40%
30%
None
Primary
20%
10%
Gender
0%
Male
0.50%
7.10%
Отсутствует Начальное Основное
Secondary
special/
Basic
Secondary
general
technical
Higher
17.60%
45.90%
15.70%
13.20%
Среднее
СПО
Высшее
Female
0.90%
10.10%
26.10%
51.40%
6.70%
4.80%
TOTAL
0.70%
8. 7%
22.10%
48.70%
11.00%
8.80%
Source: Tajikistan Living Standards Survey 2007
Source: Tajikistan Living Standards Survey 2007
Мужчины
Женщины
ПРИМЕР
Подчеркивает отношения
Турция: Значение расходов по квинтилю дохода (в PPS) - 2005
20000
15000
10000
5000
0
First quintile
Source: Eurostat
Second quintile
Third quintile
Fourth quintile
Fifth quintile
ПРИМЕР
Показывает направления с течением
времени и пространства
Босния и Герцеговина: Рост ВВП (годовой %)
8,0
7,0
6,0
5,0
4,0
3,0
2,0
1,0
0,0
2001
Source: World Bank
2002
2003
2004
2005
2006
2007
2008
Что должно быть включено график?
Название: что мы анализируем
Y отметки:
Единица
измерения
Таджикистан: Уровень образования 15-летних и старше
60%
50%
40%
30%
20%
10%
0%
Отсутствует Начальное Основное
Источник:
Кто
предоставляет
данные
Source: Tajikistan Living Standards Survey 2007
Область в графике:
кто/что вовлечен/о в
исследование
Среднее
СПО
Мужчины
ВСЕГО
Высшее
Женщины
X отметки:
Каковы аспекты Вашего
исследования
Виды графиков
 Колонка/Гистограмма
 Линейная диаграмма
 Секторная диаграмма
 Диаграмма рассеяния
 Пиктограмма
 Картосхема
Данный список
еще не полный!!!
Для чего нужны различные
виды графиков?
 Исследуемый феномен
(количественные/качественные данные)
 Использование статистики
(доли результатов, измеряемая величина,
значения, и т.д.)
 Сложность представленных данных
(простая таблица частот,
перекрестная таблица, временные
ряд, и т.д.)
Колонка/гистограмма
Это простой и наиболее распространенный график для представления данных.
Он построен на использовании колонок или гистограммы, в которой высота
представляет значение, которое мы хотим представить
Всего населения- 2008
30 000 000
20 000 000
10 000 000
0
Turkmenistan
Kyrgyz
Republic
Tajikistan
Kazakhstan
Uzbekistan
Source: World Bank
Пример1
Линейный график
Данных график больше всего используется, когда речь идет о временном ряде
Он чертит несколько значений связанных с рядом для облегчения анализа
направления
Он часто используется для сравнения нескольких рядов в одном и том же
графике
Кыргызская Республика: Уровень занятости молодежи
60
50
%
40
30
20
10
0
1998
Source: World Bank
1999
2000
2001
2002
Всего
2003
Жен
2004
2005
2006
2007
2008
Муж
ПРИМЕР2
Секторная диаграмма
Используется для представления единственного распределения.
Каждая секция пропорциональна значению, связанному с категорией переменной
Таджикистан: Доля экономически активного населения по
уровню образования
Высшее; 8,49
Отсут-ет;
0,59 Начальное; 9,92
Основное; 21,53
СПО; 10,63
Среднее; 48,84
S
МОЖЕТ
ИСПОЛЬЗОВАТЬСЯ,
ТОЛЬКО ЕСЛИ ДАННЫЕ
ВВЕДЕНЫ НА 100%!!!!
НЕ ИСПОЛЬЗУЙТЕ С
ПРОЦЕНТАМИ!!!
ЛУЧШЕ ВСЕГО ДЛЯ 3
И 7 КАТЕГОРИЙ
ПРИМЕР 3
Диаграмма рассеяния
Диаграмма рассеяния специфический график, используемый для анализа
соотношения между двумя разными переменными, наблюдаемыми среди одной
и той же группы населения
Уровень дохода против лет опыта
80
70
Income
60
50
40
30
20
0
10
20
Years of experience
30
40
Диаграмма рассеяния
ПРИМЕР: Проанализируйте действие/выполнение
различных единиц
Шаги:
Оценка исполнения
 Определите
информацию для анализа
C
G
F
H
0,5
D
Качество
(Кол-во отчетов за год и кол-во
соответствующих продуктов: в
соответствии с
корпоративными стандартами
и одобренными стандартами
внешних организаций)
1
B
0
-1
-0,5
0
0,5
1
E
-0,5
 Создайте случайные
индикаторы
(Продуктивность и Качество)
 Внесите индикаторы и
проанализируйте
информацию
I
A
L
-1
Продуктивность
Пиктограмма
Строится используя символы, связывая номинальные значения к каждому символу
Является не точным, может быть использован когда речь идет о нескольких категориях
и основная цель это привлечение внимания аудитории.
% женщин преподавателей в среднем образовании - 2008
74%
 Легко в понимании
 Привлекательный визуально
55%
52%
 Тяжело определить
количество частичных символов
29%
Самый лучший для
нескольких категорий
Иордания
Source: UNESCO
= 15%
Морокко
Босния и
Герцеговина
Македония
Очень
упрощенный
Пиктограмма
Другой вид пиктограммы использует только символы, предоставляя только
простую визуальную информацию:
Среднее число членов домохозяйства
Страна A
Страна B
Картосхема
Данный график показывает данные связывая цвета с различными
участками карты.
Используется для подчеркивания пространственного дифференцирования .
Должен быть обеспечен цветом в области графика для связи со значением
Понятное визуальное обращение
Нет точных численных значений
Ограниченные категории
 Цвет может отклониться от
интерпретации
Source: Eurostat
Извлеченные уроки
Существуют различные способы демонстрации
информации: гистограмма не является единственным
видом!
Каждый график имеет значение: выбор правильного
вида поможет в интерпретации данных
Графики являются инструментами анализа и не только
«хореографическими» способами демонстрации
значений
Download