Uploaded by evgenijbrass

Анализ данных лекции

advertisement
9 сентября 2021 г
Данные в экономике, их визуализация и предварительная обработка
Анализ данных — процесс обнаружения в имеющихся данных ранее неизвестных,
практически полезных доступных интерпретации знаний, необходимых для принятия
решений в различных сферах человеческой деятельности
Изучаемые данные или величины, требующие статистического анализа, относят к
следующим типам данных:
1) Номинальные (качественные, категориальные)
2) Ординальные (порядковые, ранговые)
3) Скалярные (количественные, числовые)
Скалярные делятся на дискретные и непрерывные. Непрерывные переменные
характеризуются значениями, которые могут быть любыми действительными числами из
какого-либо конечного или бесконечного промежутка числовой оси
Наиболее естественным и широко распространенным способом представления исходных
данных для анализа является двумерная таблица «объект-признак»
В качестве объекта могут выступать моменты времени наблюдения, последовательные
номера наблюдений над одним и тем же объектом. В этом случае говорят об изолированном
(один признак) или о многомерных временных рядах (time-series data)
Группировкой называется процесс образования однородных групп на основе разбиения
статистической совокупности на части или объединения изучаемых единиц в частные
совокупности по существенным для них признакам. Такие признаки называются
группированными признаками (или основанием группировки)
Если значение группового признака задано в виде отдельных дискретных значений, то
полученная группировка называется дискретным рядом
Если значение группового признака представлено в виде интервала, то полученная
группировка называется интервальным рядом
При формировании интервальных рядов (при небольших объемах выборки) определяют:
1. Количество групп, на которое разбивается изучаемая совокупность. Оптимальное число
групп находится по формуле Стерджесса:
k = 1 + 3,32 * lg(N)
2. Определяется форма интервалов (равные, неравные, открытые, закрытые)
Для равных интервалов длина находится по формуле:
h = (xmax - xmin)/k
Случайные события и вероятность
Теория вероятностей — наука, которая занимается изучением закономерностей массовых
или случайных явлений
Эксперимент (опыт) — комплекс условий, в которых наблюдается то или иное явление
Событие — результат опыта
Событие называется достоверным, если в ходе эксперимента оно всегда наступит (Ω)
Событие называется невозможным, если в ходе эксперимента оно никогда не наступает (Ø)
Событие называется случайным, если в ходе эксперимента оно может наступить и может не
наступить
Случайные события обозначаются: A, B, C, D, …
Два события называются несовместными, если в ходе эксперимента одновременно наступить
они не могут
Два события называются совместными, если в вхоже эксперимента одновременно наступить
они могут
Говорят, что события А1, А2, …, An образуют полную группу событий, если в ходе
эксперимента хотя бы одно из этих событий обязательно наступит
Если событие A1, A2, …, An, составляющие полную группу событий попарно несовместны,
то и вся эта группа событий называется полной группой несовместных событий
Если хотя бы два события из полной группы совместны, то группа называется полной
группой совместных событий
Два события называются противоположными друг другу, если они образуют полную группу
несовместных событий
Download