Загрузил Elena Chernaya

Магистерская работа

реклама
ВИПУСКНА КВАЛІФІКАЦІЙНА РОБОТА
(МАГІСТЕРСЬКА ДИСЕРТАЦІЯ)
на тему «ДОСЛІДЖЕННЯ МЕТОДІВ ОПТИМІЗАЦІЇ БІЗНЕС-ПРОЦЕСІВ,
РЕАЛІЗОВАНИХ ЗАСОБАМИ МАШИННОГО НАВЧАННЯ ТА
НЕЙРОННИХ МЕРЕЖ»
Хто навчається
(І.О. Прізвище)
(особистий підпис)
Науковий
керівник
(вчений ступінь, звання, І.О. Прізвище)
2024
Зміст
Вступ ............................................................................................................................. 3
Розділ 1 Аналіз проблематики дослідження ............................................................ 7
1.1Огляд наукових праць з тематики дослідження ............................................. 7
1.2 Загальна характеристика технологій Big Data ................................................................. 8
1.3Аналіз методів обробки великих даних ......................................................... 28
1.4Аналіз практик використання систем великих даних у бізнес-процесах
…………………………………………………………………………………….35
Глава 2 Аналіз вирішення дослідницької задачі .................................................... 39
2.1Постановка завдань обробки великих даних................................................. 39
2.2Опис та обґрунтування вибору засобів автоматизації обробки
великих даних ........................................................................................................ 47
Глава
3
Статистичний
аналіз
даних
підприємств торгівлі з
використанням методів обробки великих даних ................................................... 56
3.1Постановка завдань обробки великих даних................................................. 55
3.2Опис засобів автоматизації обробки великих даних .................................... 59
Розділ 4 Апробація результатів дослідження ......................................................... 62
4.1Проведення статистичної обробки масиву даних ......................................... 62
4.2 Апробація результатів статистики продажів...................................................................87
Висновок .................................................................................................................. 109
Список використаних джерел ................................................................................ 112
2
Вступ
В даний час з розвитком сучасних технологій обробки великих даних
та створенням програмного забезпечення, що дозволяє здійснювати їх
обробку, створені можливості використання зазначених систем у плануванні
діяльності компаній у бізнес-процесах.
Основними проблемами у діяльності компаній, що працюють у бізнеспроцесах, є: необхідність оптимізації номенклатури товару, що реалізується,
неможливість
оптимального
використання
складських
площ
і
часу
знаходження продукції обмеженого терміну придатності, призначеної для
транспортування, на складах. Також проблемним фактором є забезпечення
ефективності при взаємодії з партнерами та клієнтами в частині ймовірності
зриву зобов'язань щодо термінів постачання продукції, що виробляється,
транспортування вантажів та проведення платежів за поставлену продукцію.
Технології аналізу великих даних забезпечують можливості формування
звітності, виходячи з якої видаються рекомендації щодо підвищення
ефективності роботи організацій.
Мета цієї роботи: Застосування технологій аналізу та використання
великих даних у бізнес-процесах.
Завдання роботи:

аналіз джерел на тему дослідження;

аналіз теоретичних аспектів використання систем машинного
навчання Big Data та нейронних мереж; алгоритмів обробки інформації;

аналіз областей використання великих даних у бізнес-процесах;

аналіз бізнес-процесів бізнес-процесах, що передбачають
використання систем величезних даних;

вибір програмних рішень для автоматизації роботи компаній у
бізнес-процесах з використанням технологій Big Data та нейронних мереж;
3

аналіз апаратного забезпечення, що застосовується для обробки
великих даних у бізнес-процесах;

формування статистичних даних (вибірки) для апробації рішення;

аналіз одержаних результатів;

оцінка ефективності застосування інструментарію для обробки
великих даних у бізнес-процесах.
Об'єкт дослідження: інтелектуальний аналіз даних з метою прийняття
управлінських рішень підприємствами бізнес-процесах.
Предмет дослідження: методи та моделі інтелектуального аналізу
даних у завданнях управління підприємствами бізнес-процесах.
Наукова новизна: можливість використання одержаних результатів за
умов підприємств бізнес-процесах у статистичному аналізі даних реалізації
товарів.
Гіпотеза дослідження: Застосування технологій великих даних у
бізнес-процесах дозволить оптимізувати асортиментну політику, знизити
різного виду витрати та підвищити ефективність управління торговими
підприємствами.
Практична
значимість:
можливість
використання
результатів
дослідження у бізнес-процесах при використанні систем обробки великих
даних з метою планування реалізації товарів та підвищення ефективності
управління торгових підприємств.
В роботі використовуються методи:системно-інформаційний аналіз;
статистична обробка великих даних, синтез, включене спостереження,
математичне моделювання.
Теоретична методологія дослідження: історико-логічний аналіз з
упором на праці: Григор'єва А. А., Ісаєва Є. А., Тарасова П. А. «Передача,
зберігання та обробка великих обсягів наукових даних», Данилової Н.В.,
Бєлявського Г . І. «Аналіз даних. Машинне навчання».
4
Також зарубіжні дослідження Коряковский I. «Safer reinforcement learning for
robotics». Порівняльний аналіз існуючих систем, ґрунтуючись на працях
Єрохіна В. В., Раянова А. Р., Кафтарьової А. Б. «Статистичні методи аналізу
в бізнес-інформатиці», Железнова М. М. «Методи та технології обробки
великих даних».
Практична методологія дослідження -застосування інформаційних
засобів та програмного забезпечення для можливості статистичної обробки
даних у Pandas - Плас Д. В. «Python для складних завдань: наука про дані та
машинне навчання».
Передбачувані наукові результати:результати обробки великих
даних дозволять оптимізувати діяльність досліджуваної підприємства у
частині асортименту реалізованої продукції, зниження витрат.
Апробація та впровадження результатів роботивелися протягом
усього дослідження. За час проведення дослідження було опубліковано такі
наукові статті:
- «Обробка та інтелектуальний аналіз даних». Представлена на
VIII
Міжнародній
молодих
вчених
науково-практичній
«Прикладна
конференції
математика
та
(школи-семінару)
інформатика:
сучасні
дослідження в галузі природничих та технічних наук» (20-22 квітня 2022 р.,
місце проведення – Харківський державний університет);
- "Застосування
економіко-математичних
методів
в
аналізі
дебіторської заборгованості". Представлена на IX Міжнародній науковопрактичної конференції (школи-семінару) молодих вчених «Прикладна
математика та інформатика: сучасні дослідження в галузі природничих та
технічних наук» (18-20 квітня 2023 р., місце проведення – Київський
державний університет);
- «Удосконалення методики аналізу коефіцієнта «критичної»
ліквідності». Представлена на IX Міжнародній науково-практичній
конференції (школи-семінару) молодих вчених «Прикладна математика та
інформатика: сучасні дослідження в галузі природничих та 5
5
технічних наук» (18-20 квітня 2023 р., місце проведення – Київський
державний університет);
-
"Підтримка
прийняття
управлінських
інтелектуального
аналізу
даних
Представлена
ХІІІ
Міжнародній
на
на
підприємствах
рішень
методом
бізнес-процесах".
науково-практичній
конференції:
«Сучасний стан та перспективи розвитку науки та освіти: проблеми та
рішення» (7 березня 2023р., місце проведення: Україна, місто-курорт Анапа);
- «Про підтримку ухвалення управлінських рішень на підприємствах
бізнес-процесах методом інтелектуального аналізу даних». Представлена на
ХІІІ Міжнародній науково-практичній конференції «Сучасний стан та
перспективи розвитку науки та освіти: проблеми та рішення» (7 березня
2023р., місце проведення: Україна, місто-курорт Анапа).
На захист виносяться:
методи та моделі інтелектуального аналізу даних для вибудовування
ефективної системи управління підприємств бізнес-процесах; результати
апробації пропонованого проектного рішення.
Робота викладена на 116 сторінках та включає 62 малюнки, 6 таблиць,
92 джерела.
6
Розділ 1 Аналіз проблематики дослідження
1.1 Огляд наукових праць з тематики дослідження
В рамках даної роботи проведено аналіз джерел у сфері використання
технологій інтелектуального аналізу даних.
В У роботах [1, 4, 8] проведено аналіз основних напрямів
використання інтелектуальних систем на вирішення завдань статистичного
аналізу. Показано, що системи обробки великих даних дозволяють виявляти
основні закономірності досліджуваних параметрів, виявляти аномальні
спостереження, проводити аналіз поведінки систем за зміни будь-якого з
параметрів.
В роботах [2, 24, 26, 30] проведено опис математичних моделей
алгоритмів аналізу великих даних. Проведено огляд основних принципів
угруповання даних, оптимізації розрахунків. Також розглянуто порядок
виявлення характеру розподілу, виявлення залежностей та трендів.
В роботах [3, 14, 15, 19] описаний інструментарій, з якого здійснюється
обробка масивів великих даних. Розглянуто бібліотеки Python, MATLAB.
Описано порядок роботи з бібліотеками, налаштування систем розрахунків,
принципи графічного виведення інформації.
В роботах [5, 11, 28, 37, 50] проведено аналіз використання систем
інтелектуального аналізу великих даних у бізнес-процесах. Описано порядок
обробки інформації, що включає дані з продажу продукції розрізі товарних
позицій, формату торгових точок. Описано процеси аналізу ефективності
маркетингових
політик,
розрахунки
параметрів
знижок,
у
яких
спостерігається зростання прибутковості підприємства за мінімізації витрат,
що з витратами проведення бонусних акцій. Також описано порядок
проведення аналізу ефективності використання складських площ у частині
обсягів товарних запасів та
7
термінів зберігання товару, оптимальної штатної чисельності працівників,
розподілу робочого дня.
В роботах [18, 21, 22, 23, 24] проведено аналіз використання систем
інтелектуального
аналізу
великих
даних
у
галузі
транспортного
обслуговування та логістики. Розглянуто основні засади планування
бюджетів на транспортні витрати компаній на основі аналізу залежності
показників витрати ПММ, пробігу, сервісного обслуговування транспорту.
Застосування технологій та аналізу великих даних дає певні переваги
при прийнятті управлінських рішень у галузі, що розглядається, дозволяє
оптимізувати бізнес-процеси, ефективно використовувати наявні ресурси.
1.2 Аналіз існуючих методів та моделей інтелектуального
аналізу даних у питаннях управління підприємствами бізнеспроцесах
Перед тим як здійснити аналіз існуючих методів та моделей
інтелектуального аналізу даних у питаннях управління підприємствами
бізнес-процесах доцільно розглянути поточний стан справ у цій сфері.
Оборот роздрібної торгівлі в 2022 році склав 42 трлн 512,5 млрд рублів,
або 93,3% (у порівнянних цінах) до 2021 року, у грудні 2022 року - 4 трлн
201,1 млрд рублів, або 89,5% до рівня соот періоду попереднього года.[28]
Згідно з даними статистики, «у 2022 році оборот роздрібної торгівлі на
95,4%
формувався
торгуючими
організаціями
та
індивідуальними
підприємцями, які здійснюють діяльність поза ринком, частка роздрібних
ринків та ярмарків склала 4,6% (у 2021 році - 95,4% та 4, 6%
8
відповідно), у грудні 2022 року – 95,3% та 4,7% (у грудні 2021 року – 95,5%
та 4,5% відповідно)». [22]
За даними Росстату, «у 2022 році в структурі обороту роздрібної
торгівлі частка харчових продуктів, включаючи напої, та тютюнових виробів
склала 49,5%, непродовольчих товарів – 50,5% (у 2021 році – 47% та 53%
відповідно), у грудні 2022 року - 50,7% та 49,3% (у грудні 2021 року
- 47,5% та 52,5% відповідно). У грудні 2022 року обсяги продажів через
інтернет по великих та середніх торгуючих організаціях збільшилися
порівняно з листопадом 2022 року на 15% (у порівнянних цінах), з груднем
2021 року – зменшилися на 3,6%». [28]
«2022 рік для російської економіки ознаменувався наявністю цілого
ряду викликів, пов'язаних із загостренням світової політичної ситуації: відхід
іноземних компаній з російського ринку, загальна переорієнтація із Заходу на
Схід у питанні встановлення та розвитку міжнародних економічних
зв'язків,
пошук
нових
логістичних
ланцюжків
постачання
товарів,
безпрецедентні санкційні обмеження. Все це не могло не позначитися на
стані ринку.
Галузь електронної комерції (e-commerce), проте, продемонструвала
зростання за підсумками поточного року, незважаючи на догляд великих
постачальників, пов'язане з цим зниження асортименту та зниження
купівельної спроможності »[22].
Зазначимо, що «розвиток ринку e-commerce та e-grocery (продовольча
онлайн-торгівля) свого часу різко прискорила пандемію COVID-19. За
підсумками минулого року ринок онлайн-торгівлі виріс на 45,4%, і зараз
зростання триває: за останній рік зростання кількості онлайн-покупок
становило понад 60%. Незважаючи на те, що деякі ніші суттєво просіли на тлі
всіх кризових подій, загалом лише у першому півріччі 2022 року інтернетпродаж непродовольчих товарів в Україні збільшився на 51,5%, склавши
майже 2 трлн рублів, а продовольча онлайн-торгівля зросла на 100%.
Експерти
9
стверджують, що протягом кількох років обсяг ринку e-grocery в Україні
збільшиться ще на третину і перевищить 15,3 трлн. рублів, що зробить
продукти найважливішим драйвером онлайн-продажів. У звіті, який
опублікувало Forbes, йдеться про зростання продажу продуктів в інтернеті
більш ніж у п'ять разів до 2026 »[27].
«Лише в першому півріччі 2022 року вітчизняні ретейлери заробили
в онлайн 301 млрд рублів, що вдвічі перевищує показники аналогічного
періоду 2021 року. Передбачається зростання показника до 940 млрд рублів
2023 »[23].
На думку ряду експертів, «лідерство за обсягами онлайн-продажів в
Україні зберігають за собою такі відомі маркетплейси як Wildberries та Ozon,
поруч із ними стоїть Яндекс Маркет. Оборот Ozon лише за 9 місяців 2022
додав 98% рік до року і досяг 536,2 млрд рублів. Оборот Wildberries зріс
майже на 100%, перевищивши 1 трлн рублів (GMV, оборот від продажів
товарів та послуг з урахуванням повернень та знижок), зростання продажів у
штуках становило понад 70%. Тільки в 3 кварталі 2022 року оборот компанії
збільшився на 95% до 420,2 млрд рублів, що стало для неї новим рекордом.
За звітний період оборот компанії (GMV з урахуванням сервісів та за
вирахуванням повернень) виріс на 74% порівняно з аналогічним періодом
минулого року і склав 188,1 млрд рублів. У цьому оборот маркетплейсу, т. е.
продажу продавців, показали зростання більш ніж 2 разу (на 104%) до 147,1
млрд рублей[22].
Окремо варто зазначити, що за підсумками листопада 2022 року
Wildberries та Ozon вперше випередили китайський майданчик AliExpress з
продажу в Україні. За даними МТС, оприлюдненим у грудні 2022 року,
понад 50% продажів припало на Wildberries, Ozon ж посів друге місце з
часткою 29%[27].
Також варто зазначити, що в грудні 2022 року відбулася конференція
для онлайн-підприємців «Tinkoff eCommerce», в рамках якої експерти
обговорили не лише основні події 2022 року, що минає, а й
10
прогнози на 2023. Говорячи про ключові тенденції, насамперед, виділяється
розвиток e-commerce у бік «вертикалізації» ринку та відповідної їй
мультиплатформенності брендів[22].
На даний момент головну роль у вітчизняній електронній торгівлі
відіграють такі великі гравці як універсальні маркетплейси. При цьому,
згідно з дослідженням, 75% продавців спочатку заходять лише на один
маркетплейс, включаючи два і більше майданчики вже через рік-два. Надалі
очікується, по-перше, збільшення швидкості цього процесу розміщення
бренду різних майданчиках (власне, перехід до мультиплатформенности
бізнесу, тобто присутність бренду відразу скрізь), а по-друге, зростання
кількості нішевих майданчиків для размещения[27].
В Найближчими роками
можуть з'явитися
понад
100 нішевих
маркетплейсів як у B2C, так і у B2B-сегменті, — стверджують експерти.
Окремо тут слід зазначити, що досить перспективним напрямком є створення
и впровадження сучасних онлайн-систем закупівельних процедур, особливо
B2B сфері. За даними компанії RAEX Аналітика, 2022 року обсяги малих
закупівель зросли на 15,6%, а частка малих закупівель у загальному обсязі
закупівель подвоїлася»[43].
«Мультиплатформність як тренд тісно пов'язана і з підвищенням уваги
до можливостей просування на сайтах та додатках соціальних мереж. За
останні роки суттєво зросла популярність Facebook Marketplace та Instagram
Shopping (належать до Мета, забороненої
в РФ), отже, мабуть, варто очікувати створення та розвитку подібних послуг
з урахуванням вітчизняних соціальних мереж»[54].
Ще однією цікавою тенденцією e-commerce є зміна логістики. За
даними дослідження Data Insight, опублікованому в листопаді 2022 року,
останні три роки інтернет-магазини здійснювали самі близько 74% доставок,
однак у 2022 році показник зріс ще на 12%. Відмова від послуг логістичних
операторів обіцяє привести, з одного боку,
11
консолідації російського ринку логістики, з іншого — до розвитку інтернетмагазинами власних систем доставки»[46].
«Автоматизація бізнес-процесів у свою чергу пов'язана зі збільшенням
ролі штучного інтелекту (ІІ) в організації підприємницької діяльності. Варто
очікувати на розвиток таких форм ІІ як чат-боти, голосові помічники,
рекомендації щодо продуктів, персоналізація реклами та електронної
комерції в цілому, а також запровадження штучних алгоритмів, здатних,
наприклад, вести документообіг або відстежувати наявність товарів на
складах. У тренді перебувають і технології доповненої дійсності (AR),
дозволяють створювати такі форми залучення клієнтів як віртуальні
примірювальні, спеціалізовані послуги для підбору косметики, студії дизайну
інтер'єрів тощо»[83].
«Прогнози експертів щодо долі електронної комерції у 2023 році можна
позначити як позитивні. Очікується подальше зростання ринку, що остаточно
одужав від викликів року, що минає »[77].
«Діяльність будь-якого торговельного підприємства незалежно від його
сегмента та сектора складна та різноманітна. Діяльність торговельного
підприємства регулюється та керується людьми».
«Управління – є свідоме вплив людини на об'єкти та процеси з метою
надання діяльності підприємства комерційної спрямованості та отримання
певних результатов»[52].
«Управління комерційною діяльністю підприємств бізнес-процесах
ставить своїм безпосереднім завданням внести певну впорядкованість у
комерційні та торговельні процеси, організувати спільні дії працівників, що у
цих процесах, досягти узгодженості та координації действий»[18].
«При
цьому
управління
спрямоване
на
оптимізацію
роботи
співробітників з метою підвищення ефективності комерційних процесів та
досягнення кінцевих цілей підприємства»[24].
12
«В управлінні діяльністю торговельного підприємства є дві сторони:
управляючі і управляемые»[18]. (Малюнок 1).
Сторони управління діяльністю торговельного підприємства
Керівники
Керовані
Малюнок 1 - Сторони управління діяльністю торгового
предприятия[18]
«Тих, хто управляє, називають суб'єктами управління (адміністратори,
керівники, управляючі)»[61].
«Об'єкти управління – це ті, ким керують (працівники, колективи), і те,
чим керують (економіка, торгівельна діяльність, торговельний процес).
Взаємодія суб'єктів та об'єктів за допомогою керуючих впливів
и зворотний зв'язок дозволяє цілеспрямовано управляти багатосторонньої
діяльністю торгового предприятия»[27].
«Керуючий вплив здійснюється
за допомогою використання законів,
указів, планів, програм, постанов, нормативів, рекомендацій, інструкцій,
матеріальних та фінансових стимулів»[46].
«Зворотні зв'язки - це результати безпосередніх спостережень та
контролю з боку суб'єкта управління, статистична та поточна звітність,
бухгалтерська документація» [34].
«У
сучасних
умовах
ринку
виникла
потреба
у
розширенні
управлінських завдань, розробці нових прийомів та методів управління
комерційною діяльністю торгових організацій, придатних для
13
господарюючих суб'єктів різних форм власності та організаційно-правових
форм »[18].
«Процес управління торговим підприємством має бути заснований на
засадах ринкової економіки та методології сучасного управління. Система
управління, орієнтована ринку, означає як організацію структури та
взаємопов'язану сукупність задіяних процесів підприємства, а й поєднання з
усіма зовнішніми факторами»[46].
«Управління комерційної діяльністю підприємств бізнес-процесах
ставить своїм безпосереднім завданням забезпечити певну впорядкованість у
комерційні та торгові процеси, організувати спільні дії працівників, що у цих
процесах, досягти узгодженості та координації действий»[72].
«При цьому управління спрямоване на оптимізацію роботи працівників
для підвищення ефективності комерційних процесів та досягнення кінцевих
цілей підприємства. Комерційна діяльність спрямовано реалізацію товарів та
послуг відповідно до вимог ринку»[58].
«У практичній діяльності торгових підприємств важливе значення
набуває оцінка ефективності кожної торгової угоди та комерційної діяльності
підприємства в цілому, що дозволяє приймати обґрунтовані управлінські
рішення. У зв'язку з цим питання підвищення ефективності управління
комерційною діяльністю торгових підприємств мають важливе прикладне
значение»[16].
Ключовим способом підвищення ефективності завдань управління
підприємствами бізнес-процесах є застосування методів інтелектуального
аналізу даних [74].
Термін «інтелектуальний аналіз даних» (Data Mining) фігурував в
академічних журналах ще в 1970 році, але по-справжньому популярним він
став тільки в 1990-х після появи глобальної мережі
14
Інтернет[62]. Тоді торговим компаніям потрібно було аналізувати великі
обсяги різноманітних даних, щоб знайти нетривіальні патерни і навчитися
прогнозувати поведінку клієнтів. Звичайні моделі статистики виявилися
нездатними впоратися з цим завданням »[30].
«Перші системи Data Mining призначалися для обробки даних
о продажах у супермаркетах за декількома параметрами, включаючи їх обсяг
по регіонах та тип продукту »[19].
Фахівець з обробки даних Григорій П'ятецький-Шапіро визначає "Data
Mining"
як
"процес
виявлення
в
сирих
даних
раніше
невідомих,
нетривіальних, практично корисних і доступних інтерпретації знань,
необхідних для прийняття рішень у різних сферах людської діяльності" [26].
Інтелектуальний аналіз даних - це багато в чому прикладна теорія,
кількість додатків якої до реальних бізнес-завдань зростає з кожним роком
[84]. Затребуваність фахівців із інтелектуального аналізу даних постійно
зростає, як і частка фінансування розробок у цій галузі. З'являється все
більше програмних рішень для аналізу даних,
в в тому числі з відкритим вихідним кодом [41].
В Нині найширше використання технологія «Data Mining» отримала
бізнес-процесах[56].
«Великим торговим мережам Data Mining дозволяє аналізувати
купівельні кошики, щоб покращувати рекламу, створювати запаси товарів на
складах і планувати, як їх розкласти на вітринах, відкривати нові магазини та
виявляти потреби різних категорій клієнтів»[54]. «Наприклад, російська
мережа «Лента» проаналізувала дані карт лояльності понад 90% своїх
покупців і поділила аудиторію на певні сегменти купівельної поведінки.
Зокрема, рітейлер виділив сегмент купують тільки базові продукти і
чоловіків, які частіше купували тільки напої та снеки. Це дозволило
оптимізувати асортименти й управляти викладкою і ценами»[61].
15
«Найбільша у світі платформа електронної комерції «Amazon» у жовтні
2021 року представила інструмент, який надасть продавцям доступом до
інформації у тому, що нині шукають покупці, і цим допоможе спростити
вибір товарів на продаж»[43].
Також широко відомий приклад, коли фахівці одного з супермаркетів
найбільшої міжнародної мережі Wal-Mart виявили, що по п'ятницях увечері
пиво часто продається разом з дитячими підгузками. Менеджери Wal-Mart
вміло цим скористалися: поставивши на полиці поруч із підгузками одні з
найдорожчих марок пива, вдалося досягти «геометричного зростання» його
продаж»[54].
"Приклад визначення таких неочевидних зв'язків - це і є основне
завдання цієї технології, вона дозволяє краще розуміти потреби покупця та
його поведінку, що, безсумнівно, потрібно використовувати для досягнення
фінансових цілей" [28].
Тут слід розглянути питання управління організаціями бізнес-процесах.
Відомо, що утримання існуючого клієнта обходиться набагато дешевше
торгової компанії, ніж залучення нового[37].
«Уявляють
відмовляться
від
також
послуг
великий
інтерес
компанії.
ті
клієнти,
Повернення
які,
клієнта
ймовірно,
оцінюються
експертами в сотні разів перевищують вартість утримання. Тому запобігти
догляду хорошого клієнта - одне з найважливіших завдань будь-якого
успішного бізнесу »[68].
«Важливим аспектом у роботі відділів маркетингу та продажів
підприємств бізнес-процесах є складання цілісного уявлення про клієнтів,
інформація про їх особливості, характеристики, структуру клієнтської бази»
[11].
«Сегментацію бази клієнтів зазвичай проводять, використовуючи
правило Парето «80/20»: приблизно 80% доходів приносять 20% клієнтів,
тому максимальну увагу варто приділити цим 20%. На жаль, багато
16
торгові компанії не виконує навіть цієї базової сегментації, щоб виділити
найбільш прибуткових клієнтів »[19].
«Методи виявлення потреб покупців можна умовно розділити на два
види:
- кількісні - методи на основі аналізу даних про покупки (наприклад,
чеків);
-
якісні - з урахуванням аналізу результатів спеціально проведених
при цьому маркетингових исследований»[26].
«В
обох
випадках
більшість
російських
компаній,
навіть
із
найсильнішими аналітичними відділами, для аналізу зазвичай користуються
лише стандартними статистичними методами Використовувати лише
статистичні методи нераціонально, т.к. губиться безліч потрібної та корисної
інформації про покупців, яку звичайні статистичні методи виявити не можуть
через те, що вони для цього не
призначені»[57]. «Статистичні методи переважно орієнтовані лише на
узагальнення інформації, а не на її глибокий аналіз,
який необхідний для уважного та всебічного вивчення клієнтів підприємств
бізнес-процесах. Наявність у таких компаніях людини чи осіб, виконують
роль
бізнес-аналітиків,
обов'язково
підштовхнуть
керівництво
використовувати кошти Data Mining- це питання часу»[37].
«Розглянемо деякі ключові методи інтелектуального аналізу даних у
бізнес-процесах:
- асоціація;
- класифікація;
- кластеризація;
- прогнозування;
- дерево рішень;
- спосіб комбінацій»[44].
«Асоціація (чи ставлення) є найвідомішим методом інтелектуального
аналізу даних. Даний метод полягає
17
у зіставлення двох або більше елементів найчастіше одного й того самого
типу. Прикладом асоціативної закономірності (асоціативного правила)
служить правило, що вказує, що з події X випливає подія Y»[88].
Асоціативні правила допомагають виявляти групи товарів, які зазвичай
купуються спільно. Знання цих правил дозволяє відповідним чином
розміщувати товари на прилавках, стимулюючи інтенсивність їх продаж [47].
«Метод класифікації використовують при описі кількох атрибутів для
ідентифікації певного класу, а також як вхідні дані для інших методів. Для
визначення класифікації застосовують дерева прийняття рішень. Кожен клас
має певні властивості, які характеризують його объекты»[82].
«Наочний приклад класифікації – завдання з'ясування чи прийде
покупець знову до нашої торгової точки. Людина, яка проводить аналіз, при
цьому оперує двома відомими їй класами - "прийде" і "не прийде". Отже,
завдання класифікації - визначити якого класу ставляться ті чи інші дані. При
цьому безліч класів, до одного з яких можна віднести досліджуваний об'єкт,
заздалегідь відомо. Віднести покупця до тієї чи іншої групи допомагає аналіз
його
показників
-
віку,
історії
покупок,
рівня
доходу,
сімейного
становища»[74].
«Кластеризація дозволяє використовувати загальні атрибути різних
класифікацій з метою виявлення кластерів. Досліджуючи один або більше
атрибутів, можна згрупувати окремі елементи даних, разом отримуючи
структурований
висновок.
На
простому
рівні
при
кластеризації
використовується один або кілька атрибутів як основа визначення кластера
подібних
результатів.
Кластеризація
корисна
при
визначенні
різної
інформації, тому що вона корелюється з іншими прикладами, тому можна
побачити, де подоби і діапазони узгоджуються між собою» [47].
18
«Прогнозують методи використовують значення одних змінних для
передбачення невідомих (цільових) значень змінних. У поєднанні коїться з
іншими методами інтелектуального аналізу даних прогнозування передбачає
аналіз тенденцій класифікацію зіставлення з моделлю і відносини»[73].
«Метод під назвою прогнозування добре знайомий керівникам
підприємств бізнес-процесах. Так аналізуючи дані минулих періодів можна
побудувати прогноз на майбутнє - причому, чим докладніше історичні дані і
чим більший відрізок часу, тим точніше вийдуть результати. Цей метод
застосовується для прогнозування структури збуту, що характеризується
сезонними
коливаннями
чи
потреби
у
кадрах.
Послідовні
моделі
використовуються для аналізу довгострокових даних
- Корисний метод виявлення тенденцій або регулярних повторень подібних
подій »[6].
«Дерево рішень, пов'язане з більшістю інших методів, використовують
у рамках критеріїв відбору, а також підтримки вибору певних даних у рамках
загальної структури. Дерево рішень починають із простого питання, яке має
дві відповіді (але можливо і більше). Кожна відповідь призводить до
наступного питання, допомагаючи класифікувати.
и ідентифікувати дані чи робити прогнози. Дерева рішень найчастіше
використовуються
із
системами
класифікації
інформації
системами
прогнозування, де різні прогнози можуть ґрунтуватися на минулому
історичному досвіді, який допомагає побудувати структуру дерева рішень
и отримати результат»[22].
Так,
у
завданнях
управління
підприємствами
бізнес-процесах
потенційним інвесторам дуже важливо отримати інформацію про доцільність
фінансових впливів у відкриття нових торгових об'єктів.
а співробітникам торгово-закупівельних відділів важливо отримувати
інформацію щодо доцільності введення в асортимент торгового об'єкту
19
нових позицій асортименту продукції. Ці та інші завдання дозволяє вирішити
метод дерево рішень [66].
«Метод комбінації використовується досить рідко. Він подібний до
методів класифікації та кластеризації »[9].
«Прі всіх
основних
методах
часто
має
сенс
записувати
и згодом вивчати отриману інформацію. Для деяких методів це очевидно.
Наприклад, при побудові послідовних моделей
и навчанні з метою прогнозування аналізуються історичні дані з різних
джерел та екземплярів інформації. В інших випадках цей процес може бути
яскравіше вираженим. Дерева рішень рідко будуються один раз і ніколи не
забуваються. При виявленні нової інформації подій і точок даних може
знадобитися побудова додаткових гілок або навіть нових дерев. Деякі з цих
процесів можна автоматизувати. Наприклад, побудова прогностичної моделі
для виявлення шахрайства з кредитними картками зводиться до визначення
ймовірностей, які можна використовувати для поточної транзакції з
подальшим оновленням цієї моделі при додаванні нових
(Підтверджених) транзакцій. Потім ця інформація реєструється так, що
наступного разу рішення можна буде ухвалити швидше»[58].
«Інтелектуальний аналіз даних спирається на побудову відповідної
моделі та структури, які можна використовувати для обробки виявлення та
створення необхідної інформації»[9].
«Аналітичні змінні для даних отриманих з безлічі різних джерел можна
скласти в єдину певну структуру (наприклад, створити клас покупців певних
рівнів та вікових груп або клас помилок певного типу). Залежно від джерела
даних важливо вибрати правильний спосіб побудови та перетворення цієї
інформації, яким би не був метод остаточного аналізу даних »[54].
20
Розглянемо основні алгоритми інтелектуального аналізу даних у
завданнях управління підприємствами бізнес-процесах:
«- Алгоритм дерева прийняття рішень;
- алгоритм кластеризації;
- алгоритм кластеризації послідовностей;
- алгоритм лінійної регресії;
- алгоритм тимчасових рядів;
- алгоритм взаємозв'язків;
- алгоритм нейронної мережі;
- алгоритм Байєса »[22].
«Алгоритм дерева прийняття рішень є алгоритмом лінійної регресії в
прогнозуванні безперервних величин і алгоритмом класифікації для
використання в дискретних випадках. Для дискретних величин алгоритм
здійснює прогнозування основі зв'язку між вхідними стовпцями в наборі
данных»[34].
Алгоритм дерева прийняття рішень будує модель інтелектуального
аналізу даних шляхом створення ряду розбиття в дереві. Ці розбиття
представлені як вузли. Алгоритм додає вузол до моделі щоразу, коли
з'ясовується, що вхідний стовпець має кореляцію з прогнозованим стовпцем.
Спосіб, яким алгоритм визначає розбиття, відрізняється в залежності від того,
чи він прогнозує безперервний стовпець або дискретний стовпець. Алгоритм
прийняття рішень використовує оцінку компонентів для управління вибором
найбільш корисних атрибутів. Вибір компонентів відіграє у запобіганні
використання малозначних атрибутов»[44].
«Однією з найпоширеніших проблем у моделях інтелектуального
аналізу даних є надмірна чутливість до невеликих відмінностей у навчальних
даних. У цих випадках модель називається надмірно оснащеною або
надмірно навченою. Щоб уникнути надмірного
21
Оснащення моделі в алгоритмі дерева прийняття рішень використовуються
методики контролю зростання дерева »[56].
«Алгоритм кластеризації є алгоритмом розбиття множини. Він
використовує ітераційні методи для угруповання об'єктів
в кластери, що містять схожі характеристики. Таке угруповання корисне для
перегляду даних, виявлення в них аномалій та створення прогнозів.
Моделі кластеризації визначають зв'язку в наборі даних, який неможливо
отримати логічно за допомогою випадкового спостереження. Алгоритм
кластеризації навчає модель з урахуванням зв'язків, що у даних і основі
кластерів, ідентифікованих алгоритмом»[28].
Алгоритм кластеризації спочатку визначає зв'язки в наборі даних і
формує ряд кластерів на основі цих зв'язків. Точкова діаграма є гарним
способом візуально уявити, як алгоритм групує дані. Після першого
визначення кластерів алгоритм обчислює, як кластери представляють
групування точок, та був намагається повторно створити кластери, які краще
представляють исходныеданные»[19].
«Алгоритм послідовно виконує цей процес доти, доки досягне
результату, поліпшити який буде неможливо. Можна налаштовувати роботу
даного алгоритму, вибираючи конкретний метод об'єднання кластери,
обмежуючи максимальну кількість кластерів або змінюючи розмір несучої
множини, необхідний створення кластера. Після навчання моделі результати
зберігаються як набору закономірностей, які можна досліджувати чи робити з
їхньої основі прогнози. Передбачено можливість створювати запити, які
повертають прогнози того, чи відповідають нові дані виявленим кластерам,
чи надають описові статистичні дані кластерах»[48].
22
«Алгоритм
кластеризації
послідовностей
є
алгоритмом
аналізу
послідовностей. Його можна використовувати вивчення даних про події, які
можна пов'язати в логічну послідовність. Алгоритм знаходить найпоширеніші
послідовності,
виконуючи
групування
чи
кластеризацію
ідентичних
послідовностей»[41].
«До алгоритмів кластеризації послідовностей можна віднести дані, які
створюються, коли користувачі переглядають веб-сайт; дані, які описують
порядок, у якому клієнт додає у кошик товари, обрані в Інтернетмагазині»[62].
«Алгоритм кластеризації послідовностей – це гібридний алгоритм, який
використовує методи Марківських ланцюгів для визначення кластерів та їх
послідовностей.
Однією
з
особливостей
алгоритму
кластеризації
послідовностей і те, що він використовує ряд подій чи переходів між станами
в наборі даних, наприклад, ряд придбань продуктів чи послідовність
переходів між сайтами конкретного користувача Интернета»[64].
«Алгоритм вивчає ймовірність переходів і вимірює різницю між усіма
можливими
послідовностями
послідовності
найкраще
в
наборі
даних,
щоб
як
вихідних
використовувати
визначити,
даних
які
для
кластеризації»[58].
«Алгоритм лінійної регресії є різновидом алгоритму дерева прийняття
рішень, що допомагає розрахувати лінійний зв'язок між залежною та
незалежною
змінною,
а
потім
використовувати
цей
зв'язок
при
прогнозуванні. Зв'язок набуває вигляду лінійної формули, що представляє
заданий набір даних. Якщо побудувати графік, то кожній точці буде
відповідати помилка, пов'язана з відстанню від лінії регресії. Коефіцієнти a і
b у рівнянні регресії регулюють кут та положення лінії регресії. Можна
отримувати регресивне рівняння за допомогою
23
підбору коефіцієнтів a і b до того часу, поки сума помилок, що з цими
точками, стане мінімальной»[31].
Існують інші типи регресії, в яких використовується кілька змінних, а
також нелінійні методи регресії. Однак лінійна регресія є корисним та
широко відомим методом моделювання відповіді на зміну в якомусь
базовому факторі. Лінійну регресію можна використовувати визначення
зв'язку між двома безперервними стовпцями. У завданнях управління
підприємствами бізнес-процесах алгоритм лінійної регресії використовують
із обчислення лінії тренду даних продажів»[73].
«Алгоритм часових рядів забезпечує прогноз безперервних значень,
таких як продаж продуктів у часі. На відміну від інших алгоритмів корпорації
Майкрософт, таких як дерева рішень, модель тимчасових рядів не вимагає
додаткових стовпців нових відомостей, щоб прогнозувати тенденцію. З
допомогою
моделі
часових
рядів
можна
прогнозувати
тенденції
з
урахуванням лише вихідного набору даних, використаного до створення
модели»[56].
«Прі прогнозуванні
можна вводити в модель нові
дані
і
автоматично задіяти їх під час аналізу тенденцій. Поєднання вихідних даних і
прогнозованих
даних називається поряд.
Важливий характеристикою алгоритму тимчасових рядів є
здатність виконувати
перехресний
прогноз.
його
При навчанні алгоритму
двома окремими, але пов'язаними один з одним рядами можна
використовувати підсумкову модель
одного
для
прогнозування
результату
ряду на основі поведінки іншого ряду. Наприклад, продаж одного
продукту можуть надати
вплив на
прогнозовані
продажу
іншого
продукту.
Перехресні прогнози також корисні при створенні загальної моделі, яку
можна застосувати до кількох рядів. Наприклад, прогнози з продажу для
конкретного
регіону
нестабільні, так
як
в
даних хорошої якості. Загальну модель можна навчити на
24
ряду
недостатньо
середньому значенні кількох регіонів, та був застосувати модель до окремих
рядів, щоб підготувати стабільніші прогнози кожному за региона»[48].
«Алгоритм взаємозв'язків корисний для вироблення рекомендацій
покупцям щодо подальших придбань на основі тих товарів, які вони вже
купили, або до яких виявили інтерес. Алгоритм взаємозв'язків корисно
використовуватиме
аналізу
споживчого
кошика.
Правила,
зумовлені
алгоритмом, можна використовуватиме прогнозування можливих майбутніх
покупок покупців з урахуванням елементів, вже у кошику покупця. Алгоритм
взаємозв'язків простежує набір даних для пошуку елементів, що знаходяться
в наборі одночасно. Потім алгоритм групує в набори будь-які пов'язані
елементи, знайдені у кількості варіантів, не меншому за мінімальний
параметр»[15].
«Алгоритм нейронної мережі поєднує кожен можливий стан вхідного
атрибуту з кожним можливим станом прогнозованого атрибуту і використовує
навчальні дані для обчислення ймовірностей. Далі ці ймовірності можна
використовувати для класифікації чи регресії,
а також для прогнозування результату прогнозованого атрибута з
урахуванням вхідних атрибутов»[86].
«У моделі інтелектуального аналізу даних, що створюється за
допомогою алгоритму нейронної мережі, може міститися кілька мереж, що
визначається кількістю стовпців даних, які використовуються для аналізу.
Алгоритм нейронної мережі корисний під час аналізу складних вхідних
даних, отриманих, наприклад, у результаті торгового процесу, котрим
надається значний обсяг навчальних даних, але у своїй утруднено освіту
похідних правил з допомогою інших алгоритмов»[51].
«Існують такі сценарії використання алгоритму нейронної мережі:
25
- аналіз маркетингової складової торгової компанії та реклами.
Наприклад, вимірювання ефективності прямої поштової розсилки або
рекламної кампанії, що проводиться радіо;
- прогнозування змін цін на акції, коливань валютних курсів або інших
мінливих фінансових даних із даних із передісторією;
- аналіз торговельних процесів;
- інтелектуальний аналіз тексту;
- будь-яка прогнозуюча модель, яка аналізує складні зв'язки між
великою кількістю вхідних атрибутів та порівняно малою кількістю вихідних
атрибутів»[7].
«Алгоритм Байєса є алгоритмом класифікації у прогнозуючому
моделюванні. Цей алгоритм використовує теорему Байєса, але не враховує
залежності, які можуть існувати між подіями. Цей алгоритм можна
використовувати для початкового дослідження даних, а потім застосовувати
результати до створення додаткових моделей інтелектуального аналізу з
іншими алгоритмами,
що вимагають більшої кількості обчислень і є більш точними» [11].
«Спрощений алгоритм Байєса розраховує ймовірність стану кожного
вхідного стовпця за кожної можливої реалізації прогнозованого стовпця,
тобто. у припущенні, що деяка ймовірна подія вже сталася. Після навчання
моделі результати зберігаються як набору закономірностей, які можна
досліджувати чи робити з їхньої основі прогнози. Можна створювати запити,
що повертають прогнози про зв'язок нових даних із прогнозованим
атрибутом, чи отримувати статистику, що описує взаємозв'язки, виявлені
моделлю»[6].
Модель
інтелектуального
аналізу
даних
створюється
шляхом
застосування алгоритму даних. Але це більше, ніж алгоритм або контейнер
метаданих: це набір даних, статистик та шаблонів, які
26
можна застосовувати до нових даних для формування прогнозів та виведення
взаємозв'язків. Структура інтелектуального аналізу даних та модель
інтелектуального аналізу даних є окремими об'єктами. У структурі
інтелектуального аналізу даних зберігаються відомості, що визначають
джерело даних. Модель інтелектуального аналізу даних містить відомості,
отримані
за
підсумками
статистичної
обробки
даних,
наприклад,
закономірності, виявлені в результаті аналізу »[18].
«Модель інтелектуального аналізу даних буде порожня доти, доки не
будуть
оброблені
та
проаналізовані
дані,
передані
структурою
інтелектуального аналізу даних. Після обробки модель інтелектуального
аналізу даних містить метадані, результати та прив'язки до структури
інтелектуального аналізу даних»[4].
«Наприклад, ті самі дані можна використовувати для створення
декількох моделей, що використовують алгоритм кластеризації, алгоритм
дерева прийняття рішень та спрощений алгоритм Байєса. У кожному з типів
моделей створюються різні набори шаблонів, наборів елементів, правил і
формул, які можна застосовувати під час прогнозування. Як правило, кожен з
алгоритмів аналізує дані по-своєму, тому вміст одержуваної моделі також
організується в різні структури.
В одному з типів моделей дані та шаблони можуть групуватися в кластери; в
моделі іншого типу дані можуть бути впорядковані за допомогою дерев, гілок
та правил, що розділяють та визначають дані »[37].
«Модель також залежить від даних, на яких проводилося навчання:
навіть ті моделі, навчання яких проводилося на основі однієї і тієї ж
структури інтелектуального аналізу даних можуть видавати різні
результати, якщо під час аналізу фільтрація даних виконувалася порізному або використовувалися різні початкові значення. Однак фактичні
дані не зберігаються у зведеній статистиці, доступній
тільки для моделі, зберігаються з фактичними даними, що знаходяться в
27
структуру інтелектуального аналізу даних Якщо під час навчання моделі
було створено фільтри даних, то визначення фільтрів також зберігаються у
об'єкті модели»[25].
«Щоб створити модель інтелектуального аналізу даних, необхідно
виконати такі дії:
- створити базову структуру інтелектуального аналізу даних та
увімкніть до неї стовпці даних, які можуть знадобитися;
- виберіть алгоритм, який найкраще підходить для аналітичного
завдання;
- вибрати стовпці з структури для використання в моделі і вказати,
як їх слід використовувати, в якому стовпці міститься результат, який потрібно
спрогнозувати, які стовпці призначені лише для введення та ін;
- встановити додаткові параметри для тонкого налаштування обробки,
що проводиться алгоритмом;
- заповніть модель даними, виконавши обробку структури та
моделі»[31].
Таким чином, «інтелектуальний аналіз даних є процес виявлення
придатних для використання відомостей у великих наборах даних. В
інтелектуальному
аналізі
даних
застосовується
математичний
аналіз
виявлення закономірностей і тенденцій, що у даних. Зазвичай такі
закономірності важко знайти, оскільки зв'язки дуже складні. Моделі
інтелектуального аналізу даних можна також створювати програмним чином
за допомогою об'єктів AMO або XML для аналітики, а також клієнта
інтелектуального аналізу даних для Excel та інших клієнтів. Нині
інтелектуальний аналіз даних є найважливішим елементом на формування
високого рівня конкурентоспроможності підприємств сфери торговли»[8].
28
1.3 Аналіз методів обробки великих даних
«У діяльності сучасних компаній виникає безліч завдань, пов'язаних із
необхідністю обробки великих масивів інформації з метою отримання
необхідної аналітичної інформації в різних напрямках діяльності»[17].
"Однією з основних проблем в аналітичній роботі є велика кількість
розрізнених
механізмів,
що
забезпечують
можливості
виявлення
закономірностей, що пов'язано з необхідністю аналізу множини факторів, що
фігурують у рамках здійснення основної діяльності" [6].
«Обробка даних масивів інформації зважаючи на їх великий обсяг
передбачає необхідність використання апарату Big Data, систем штучного
інтелекту, дозволяють виявляти закономірності в параметрах попиту певні
види продукції і на залежність обсягів продажу від застосування різних
маркетингових політик»[23].
«Технології великих даних забезпечують можливості обробки повної
інформації про досліджувані об'єкти. Наприклад, у разі компаній бізнеспроцесах, об'єктом аналізу можуть бути обсяги вантажів, що перевозяться,
статистика видів замовлень, їх вартості, історії розрахунків, що проводяться,
наявність прецедентів, пов'язаних з порушеннями контрактних зобов'язань.
Маючи
необхідними
технологіями,
отримані
відомості
можна
використовувати у різних цілях - задля реалізації політики взаємодії з
клієнтами, під час виборів постачальників з інформації, що є з кількох
контрагентам, розробки рекламних компаний»[44].
Таким чином, «використання систем Big data забезпечує можливості:
сегментації контрагентів, забезпечення ефективності взаємодії з ними,
візуалізації даних зі статистики розрахунків,
29
розробки та тестування партнерських програм, складання прогнозів щодо
очікуваних обсягів виробництва»[36].
На малюнку 2 наведено діаграму методів обробки великих даних.
Методи обробки великих даних включають [21]:
Краудсорсинг – залучення до вирішення будь-якої проблеми великої
групи людей. Технологія передбачає проведення перегляду великих масивів
інформації обраною групою людей, які в ручному режимі здійснюють вибір
даних за певною ознакою.
Краудсорсинг
Методи обробки
Змішання та
інтеграція даних
Нейронні мережі
Статистичний
аналіз
Імітаційне
моделювання
великих даних
Регресійний
аналіз
Малюнок 2 – Методи обробки великих даних [21]
Далі
проведено
опис
алгоритму
обробки
великих
даних
із
використанням зазначеної методології. Ця технологія передбачає можливості
приведення великих масивів інформації до виду, придатного обробки, що
передбачає виявлення помилок у записах та його виправлення, видалення
даних, ідентифікація яких неможлива. Оброблені масиви забезпечують
можливості проведення подальшої
30
обробки із використанням стандартних систем автоматизації. Недоліком
даного алгоритму є його висока вартість, оскільки його проведення потрібно
залучення співробітників, і навіть низьку швидкість обробки даних, і
ймовірність помилок, що з впливом людського чинника [14].
Ця операція можлива, коли операція приведення даних до виду,
доступного для обробки у зазначеній предметній області, є одиничною. Коли
потік оброблюваних даних є безперервним і вимагає постійного виконання
зазначених операцій, ефективно використовувати системи машинного навчання,
у яких штучний інтелект дозволяє проводити обробку записів у потоці
інформації [42].
Використання систем краудсорсингу у бізнес-процесах забезпечує
можливість розробки правил віднесення даних у масиві до різних категорій у
частині, наприклад, розпізнавання виду харчової продукції з фото, віднесення
якісних ознак до заданого сорту. Прикладом використання цього методу є
робота компанії «Русагро», в якій використовується обладнання сортування
продукції, що використовує систему розпізнавання, налаштування якої
проведено через метод краудсорсингу [51].
Системи змішування та інтеграції даних.
Обробка систем великих даних найчастіше передбачає необхідність
отримання потоків структурованої інформації у різних форматах із різних
джерел.
В даному випадку щодо аналізу необхідно приведення різнорідної
інформації до єдиного формату. Операція змішування та інтеграції
передбачає виконання операцій, що включають [46]:
налаштування єдиної структури інформації, яку передбачається
обробляти у межах розв'язання завдань, що з використанням великих даних;
31
злиттязаписівчерез пошук додатковихвідомостей,
відповідних об'єкту у таблицях, отриманих з альтернативних джерел;
видалення даних, що не є об'єктом для аналізу та не мають
відношення до предметної області, або даних, ідентифікація яких неможлива,
або належність якої однозначно встановити неможливо.
Інтеграція даних проводиться в інформаційних системах, де різні
підрозділи підприємств здійснюють обробку інформації з суміжних питань
(наприклад, інтеграція може проводитись при роботі з даними, отриманими
від відділів маркетингу, продажу, розрахунків з постачальниками, касовою
інформацією, даними, отриманими із систем банківського документообігу .).
Також інтеграція даних буває актуальною при реорганізації в
державних структурах або змінах в системах роботи з інформацією
(наприклад, при необхідності аналізу прав громадян на отримання субсидій
від органів соцзахисту необхідно отримання даних з ПФР з використанням
ідентифікатора, яким є СНІЛС. Для інтеграції цей реквізит вводиться в
картки пільгоодержувачів у картотеках соціального захисту, після чого стає
можливим проводити інтеграцію даних із цих державних структур) [10].
Технологія проведення злиття інформації включає етапи [33]:
приведення до єдиного формату;
встановлення зв'язків між ідентифікуючими атрибутами;
вибір параметрів, якими проводиться злиття; видалення
сторонніх записів; отримання підсумкового файлу.
32
Файли, наведені до єдиного формату, дають можливість аналізу за
вибраними показниками, попередньо перевіривши коректність завантаження)
[52].
На малюнку 3 наведено схему алгоритму змішування та інтеграції
даних.
Технології змішування та інтеграції даних при їх використанні у
технології бізнес-процесах використовуються при інтеграції даних про
випуск продукції, що надходять від виробничого відділу та відділу збуту, що
дозволяє відстежувати технологічний ланцюжок від виробництва до
реалізації. Прикладом впровадження цієї технології є робота компанії
«Міраторг» у технологічному ланцюжку обліку виробництва та збуту
продукції.
Корпоративне
Джерела
Mining
Рисунок 3 – Схема алгоритму змішування та інтеграції даних
(складено автором)
33
Далі проведено опис алгоритмів обробки великих даних методом
машинного навчання та з використанням нейронних мереж [30].
Системи
дозволяють
машинного
навчання
комп'ютерним
припускають
системам
побудову
проводити
правил,
класифікацію
і
систематизацію інформації з урахуванням результатів, отриманих під час
навчання системи з урахуванням аналізу потоків даних. Порядок обробки
даних через систему машинного навчання передбачає отримання вхідного
потоку даних, за результатами обробки якого система видає результат
внесення вхідних даних до заданої категорії. Вирішення зазначених завдань
можливе при попередньому проведенні навчання системи (завдання правил,
відповідно до яких передбачається класифікація об'єкта).
В у разі
використання цієї
технології
в системах
бізнес-процесах
проводиться аналіз якісних характеристик реалізованого товару при
віднесенні їх до певного виду, сорту, ознак розрахунку вартості.
Стадії налаштування правил включають [40]:
налаштування нейронів, що дозволяють проводити розпізнавання
вхідних даних та визначати зв'язки між заданими ознаками;
аналіз тестової вибірки;
перевірку функціональності системи та, при необхідності,
виправлення правил.
Після навчання та тестування система може використовуватися під час
роботи з масивами великих даних. На малюнку 4 наведено структуру типової
нейромережі.
34
Вихідний
шар
Вхідний шар
Приховані шари
Малюнок 4 – Структура типової нейромережі (складено автором)
Як показано малюнку 4, порядок обробки інформації включає: подачу
даних вхід, обробку інформації у вигляді роботи з правилами, видачу
оброблених даних.
Використання нейромереж ефективно за необхідності проведення
сортування масивів, підтримки прийняття рішень в умовах невизначеності.
1.4 Аналіз практик використання систем великих даних у
бізнес-процесах
Типовими завданнями для нейромереж є: обробка зображень,
виявлення ознак активності зловмисників, шкідливих систем
35
системах інформаційної безпеки, ознак шахрайських процесів у банківських
інформаційних системах [17].
Технології передиктивної аналітики під час обробки великих даних.
Дані системи використовуються для вирішення задач прогнозування
накази системи на основі масивів даних, отриманих у динаміці. Завдання
цього типу припускають виявлення кореляції між різними параметрами
потоку даних, з урахуванням будуються характеристики залежностей,
дозволяють обчислювати ймовірності поведінки системи у перспективі.
Використання даних систем дозволяє розраховувати прогнозні обсяги
клієнтської базі, попиту продукцію певного виду, аналізувати поведінка
системи за різних параметрах кредитування, активності конкурентів.
Отримані результати дають змогу своєчасно приймати необхідні рішення,
коригувати політику компанії, що забезпечує захист від негативних наслідків
у майбутньому. Ефективність даного методу обробки великих даних
пов'язана з відсутністю факторів форс-мажору, відсутністю явної залежності
об'єкта, що моделюється, від людського фактора, без яких побудовані
прогнози є достовірними [9].
Прикладами сфер використання систем предиктивної аналітики є [11]:
у разі бізнес-процесах: планування виробництва;
результати рекламних акцій;
отримання даних щодо параметрів транспортного обслуговування
компаній;
виявлення ознак ймовірності невиконання зобов'язань партнерами;
динаміка прибутковості та ефективності діяльності організацій.
36
Прикладом впровадження системи на підприємствах торгівлі є
діяльність компанії «Мираторг» у частині аналізу збуту продукції та
планування її в різних клієнтських сегментах.
Область використання систем великих даних також включає роботу
систем розумного будинку та розумного виробництва, систем охорони,
диспетчеризації.
В В рамках проведення навчання система проводить збір інформації про
штатні та позаштатні режими роботи технічних систем, дозволяють виявляти
ознаки несправностей та визначати порядок їх усунення [22].
Далі здійснено опис методів імітаційного моделювання як методу
обробки великих даних.
Специфіка
завдань
зазначеного
типу
пов'язані
з
виявленням
залежностей параметрів системи за зміни зовнішніх чинників. Використання
моделі для цієї мети дозволяє без значних фінансових витрат провести аналіз
поведінки системи, отримати дані за досліджуваними характеристиками.
В у бізнес-процесах імітаційні методи можуть використовуватися при
розрахунку параметрів очікуваного ефекту від продукції певного виду в
заданих обсягах (модельованою системою є стан ринку збуту). Існує досвід
впровадження імітаційних методів у діяльності ТОВ «КДВ Груп» щодо
розрахунку планових показників реалізації товару.
Приклади імітаційних моделей [6]:
аналіз параметрів отримання прибутковості банків при зміні ставок
за кредитами та депозитами;
аналіз динаміки заборгованості з оплати послуг ЖКГ при зміні
тарифів;
аналіз демографічної динаміки за зміни параметрів соціальних
програм;
37
аналіз стану ринку праці залежно кількості місць у навчальних
закладах.
З даних, отриманих в імітаційних моделях, проводиться прийняття
управлінських рішень, дозволяють вирішувати поставлені завдання у сфері
економіки, управління, соціальної сфери.
В
на відміну від моделі, розглянутої вище, під час роботи з
імітаційними моделями, робота здійснюється не з даними,
отриманими з реальної системи, а зі згенерованими, що впливає на точність
результатів. При цьому отримання реальних даних не завжди можливе через
об'єктивні обставини.
Далі проведемо огляд методів статистичного аналізу під час обробки
масивів великих даних.
Статистичний апарат при проведенні аналізу великих даних включає
обробку, що передбачає операції з [13]:
динаміці показників в абсолютному та відносному виразах;
одержання статистичних характеристик вибірки; аналіз середніх
значень різних видів; аналіз розподілу за вибіркою та ін.
Використання статистичного аналізу у бізнес-процесах ефективно при
розрахунку показників обсягів продажу товарів та виручки в динаміці,
складанні аналітичної звітності як засіб підтримки
ухвалення управлінських рішень. Використання алгоритмів статистичного
аналізу притаманно більшості підприємств бізнес-процесах у службах
економічного профілю, роботи з постачальниками та клієнтами. У
статистичному
апараті
проводиться
вивчення
масових
соціально-
економічних явищ, кожне з яких може виражатися через різні кількісні
показники за обраними ознаками, які можуть включати рівень цін, оплати
праці, податків, виручки та ін.
Висновки у розділі 1
38
В В рамках проведеного аналізу основних напрямів використання
систем інтелектуального аналізу великих даних у бізнес-процесах було
показано, що інструменти обробки великих масивів інформації дозволяють
виявляти наявність залежностей між параметрами, що вивчаються.
проводити розрахунки статистичних показників, оцінювати ефективність
асортиментної та бонусної політики. Таким чином, у рамках першого
першого розділу здійснено огляд наукових праць на тему дослідження,
розглянуто загальну характеристику технологій інтелектуального аналізу
даних,
проаналізовано
методи
обробки
великих
використання систем великих даних у бізнес-процесах.
39
даних
та
практик
Глава 2 Аналіз вирішення дослідницької задачі
2.1 Постановка завдань обробки великих даних
Дані - це уявлення багаторазової інтерпретації уявленняінформаціїу
формалізованому вигляді, придатному дляпередачі,зв'язкучи обробки [11].
Таблиця 1 - Характеристика 7V даних
Характеристика 7V даних
Характеристика
«Об'єм (Volume)
Швидкість (Velocity)
Різноманітність (Variety)
«Візуалізація
(Visualization)
Мінливість (Volatility)
Цінність (Value)
Достовірність (Veracity)
Опис
До 2025 року світовий обсяг цифрових даних, за прогнозом
компанії IDC, зросте до 175 зеттабайт (40 зеттабайт у 2021
році)
року). Більшість цих даних буде постійно
змінюватись у реальному часі. Колишніх інструментів вже
недостатньо. Для обробки потрібні інші підходи та
дії.
Під швидкістю розуміється як сама швидкість приросту
даних, так і необхідність високошвидкісної обробки та
одержання результатів.
Обробка широкого спектру джерел, типів та якості
інформації: зображення, відео- та аудіозаписи, текстові
файли та бази даних. Цю інформацію спочатку
обробляють і потім аналізуют»[2].
Складання багатовимірних діаграм та графіків для
наочного використання
Значення даних може змінюватись. Наприклад, смислова
навантаження перекладного тексту в залежності від обставин
Прийняття вірного рішення на основі даних та отримання з
цього прибутку чи цінне знання про клієнтів.
Тільки на основі достовірних даних виходить вірний
результат, що використовується прийняття рішень»[7].
Дані, якими можна оперувати Data Mining, можна розділити на сім
категорій (Таблиця 2).
Виділяють сім характеристик даних, які показують як обсяг, а й інші
категорії, важливі обробки і аналізу.
40
Список
називають 7V по першим буквам характеристик [7].
Характеристики та опис до них наведено у таблиці 1.
Таблиця 2 – Категорії даних Data Mining
Категорії даних Data Mining
Найменування категорії
«Структуровані
Неструктуровані
Графові
природною мовою
Аудіо, відео, зображення
Машинні
Поточні
Опис
Залежать від моделі даних і зберігаються в
фіксованих полях усередині записів
Важко підігнати під конкретну модель, залежать
від контексту або носять змінний характер
Такі структури даних призначені для
відображення відносин між об'єктами, їх
взаємозв'язків та впливу
Структуровані текстові дані. Для
відпрацювання потрібне знання лінгвістики та
спеціальних технологій
Дані цих форматів найбільш звичні
користувачам. Їх легко розуміти, але для
комп'ютера їх обробка все ще – складне завдання
Дані, що генеруються різними датчиками
Можуть приймати майже будь-яку з перерахованих
у таблиці форм, але надходять у систему при
виникненні подій, а не завантажуються в
сховище окремими масивами»[8].
В рамках даної роботи проведено вирішення завдань з обробки
масивів великих даних у динаміці 2020-2022 рр., що включають:
статистику реалізації товару торговими компаніями у розрізі
видів товарних позицій, форматів магазинів, способів розрахунків;
отримання виручки від продукції; витратами
зберігання продукції; штатної чисельності
підприємств;
показники продажу імпортної продукції;
одержанням прибутковості від діяльності, пов'язаної з реалізацією
товарів;
41
податковими перерахуваннями, пов'язаними із веденням продажу
товарів;
одержанням субсидій на ведення продажем товарів;
дані щодо заборгованості за кредитами.
Отримана інформація дозволяє виявляти структуру реалізації товару,
прибутковість
від
товарів
окремих
видів,
ефективність
проведеної
маркетингової політики.
Також статистичний аналіз великих даних статистики виробництва та
реалізації харчової продукції забезпечує можливості аналізу фонду заробітної
плати у галузі, проведення розрахунку податкової бази, зайнятості фахівців,
динаміки доходів та витрат, виявляти збиткові компанії у динаміці.
В бізнес-процесах нерідко доводиться зіштовхуватися з кількісними
даними, які можна зібрати і впорядкувати, тобто. структурувати. Але
більшість інформації представлена документами, листами, відео та інших. тобто. у неструктурованому вигляді. У роботі нам знадобиться вибирати
відповідні інструменти та методи зберігання, обробки та аналізу таких даних.
«Для аналізу обраної сукупності за показниками, що варіюють
(кількісно змінюються), у статистиці використовуються середні величини»
[49].
«Середні
величини
являють
собою
узагальнюючу
кількісну
характеристику сукупності однорідних явищ у розрізі однієї ознаки, що
змінюється. У економічній практиці використовується широке коло
показників, обчислених як середніх величин»[46].
«Прикладом узагальнюючих показників доходів працівників
може бути значення середнього доходу одного працівника, що визначається
через відношення фонду заробітної плати та виплат соціального характеру за
аналізований проміжок часу (у річному, квартальному, місячному)
42
виразі) до кількості співробітників. Для співробітників із порівнянним рівнем
доходів можна проводити розрахунок структури витрат на певні потреби.
Аналогічно можна проводити аналіз робочого часу, продуктивність праці
тощо». [17].
«Однією з найважливіших властивостей середніх величин є те, що з їх
використанням можлива інтерпретація обраного показника через єдиний
показник, незважаючи на кількісні відмінності його в окремих одиниць у
вибірці, і дозволяє висловлювати те загальне, що притаманне всім одиницям
аналізованої сукупності. Отже, через характеристику одиниці сукупності
середня величина характеризує всю сукупність загалом»[53].
С Використанням середніх величин за допомогою математичного
апарату закону великих чисел можливе виявлення основних тенденцій розвитку,
встановлення закономірностей, аналіз точності побудованих моделей.
«З використанням середніх величин можливе порівняння показників,
що належать до сукупностей із різною кількістю одиниць. Найважливішою
умовою наукового використання середніх величин у статистичному аналізі
суспільних явищ є однорідність сукупності, на яку проводиться обчислення
середніх»[74].
«У рамках проведення статистичного аналізу виділяються такі види
середніх величин:
1. Використовують вагові коефіцієнти:
а) незважені середні величини;
б) виважені середні величини.
2. За формулами обчислення:
а) середні арифметичні величини;
б) середні гармонійні величини;
в) середні геометричні величини;
г) середні квадратичні, кубічні та ін величини.
43
3. За технологією обробки вибірки:
а) групові середні величини;
б) загальні середні величини»[14].
«Відмінність
середніх
величин
пов'язана
зі
специфікою
обліку
характеристик, що впливають на величини, що впливають на середні величини:
Коли середні величини розраховуються для ознаки, не враховуючи
впливу нього будь-яких інших характеристик, такі середні величини
називаються середніми незваженими чи простими середніми.
За наявності даних про наявність впливу на середню величину деякої
кількості факторів, які необхідно враховувати при розрахунку для коректного
розрахунку
середньої
величини,
проводиться
розрахунок
середньої
виваженої »[2].
«За формою розрахунку виділяється кілька типів середніх величин,
утворених з єдиної статечної середньої величини, що обчислюється за
формулою:
(1)
;
k – значення показника ступеня середнього;
x - поточне значення (варіант) ознаки;
i -І-тий елемент сукупності;
n – кількість проведених спостережень (кількість одиниць у вибірковій
сукупності)» [37].
p align="justify"> Для різних показників ступеня k визначається тип
обчислених типів середніх величин, опис яких наведено в таблиці 3.
Алгоритм розрахунку середнього значення включає показники [20]:
Аналіз вихідного співвідношення для аналізованої характеристики.
Оцінка даних для розрахунку вихідного співвідношення.
44
Проведення розрахунку середньої величини.
«Разом
з
розрахунком
середньої
арифметичної,
у
статистиці
застосовується середня гармонійна величина, обернена до середньої
арифметичної зі зворотних значень ознаки. Як і середня арифметична, вона
може бути простою та зваженою. Використовується вона у випадках, коли
необхідні вагові коефіцієнти (fi) у вихідних даних не задані безпосередньо, а
входять як співмножники в одні з наявних показників »[18].
Таблиця 3 - Типи обчислюваних типів середніх величин залежно від ступеня
Ступінь обчислюваної
Найменування обчисленої середньої
середньої величини (k)
-1
Середнє гармонійне
0
Середнє геометричне
1
Середнє арифметичне
2
Середнє квадратичне
3
Середнє кубічне
«Медіана — це чисельне значення ознаки в тієї одиниці сукупності, що
у середині ранжированного низки (побудованого гаразд зростання, чи
зменшення значення досліджуваного ознаки). Медіана є серединною
варіантом, т.к. вона поділяє сукупність на дві однакові частини»[71].
Наприклад, в економіці використовується параметр медіанної заробітної
плати, що характеризує реальний розмір оплати праці в організації
(дозволяючи не враховувати верхній сегмент із високими показниками
заробітної плати) [15].
Підвищення точності рівня статистичних вимірів забезпечується через
зростання обсягу аналізованої вибірки. Таким чином, статистична обробка
великих даних дає змогу отримувати результати з високим рівнем
достовірності [26].
45
2.2 Опис та обґрунтування вибору засобів автоматизації обробки
великих даних
«OLAP (Online Analytical Processing) – це система аналітичної обробки
даних. Вона призначена для підготовки звітності, побудови прогностичних
сценаріїв та виконання статистичнихvрозрахунків з урахуванням великих
інформаційних масивів, які мають складної структурой»[34].
«Компонентами OLAP є:
база даних (БД) - джерело, з якого здійснюється завантаження
даних щодо обробки. Формат бази даних визначається різновидом OLAP
системи та порядком виконання дій OLAP
сервера. Найчастіше користуються реляційними та багатовимірними БД та
сховищами даних;
OLAP сервер - ядро системи, за допомогою якого проводиться
обробка багатовимірних структур даних, та забезпечується зв'язок між БД
користувачами систем; програми для роботи користувачів, у яких формуються
запити та візуалізуються отримані відповіді.
Специфіка обробки даних OLAP системами полягає у побудові
багатовимірних, тобто мають багато зв'язків між окремими елементами,
масивів інформації»[55].
«Для формування таких масивів OLAP система збирає дані з різних
джерел (наприклад, зі сховищ даних, інформаційних систем управління
підприємством (ERP) або системи взаємодії з клієнтами (CRM)). Після цього
інформація обробляється на сервері OLAP
и передається в користувацькі додатки »[18].
бюджетування, побудови прогностичних моделей, підготовки фінансової
звітності, зберігання результатів »[26].
46
Як платформа для аналізу даних обрана мова програмування Python,
можливості якого дозволяють створювати віконні, мобільні програми, Webпрограми. Також інструментарій цієї платформи дозволяє вирішувати
завдання, пов'язані з аналізом даних. Python має багато корисних бібліотек,
таких як Matplotlib, Pandas, NumPy [15].
В якості платформи-інтерпретатора вибрано платформу Google Colab.
Ця платформа забезпечує можливості колективної роботи з інформаційними
ресурсами різних форматів, включаючи можливості розробки програм на
мові Python.
Одним з найбільш поширених напрямків використання зазначеного
середовища є робота з великими даними, що включає обробку масивів
інформації, їх групування, статистичну обробку, можливості прогнозування,
вивчення параметрів вибірок і розподілів.
«Для використання середовища Python як інструмент аналізу даних
необхідно використання спеціалізованих бібліотек, у можливості яких
входять інструменти статистики, графічні сервіси
и інші технології, дозволяють проводити обробку информации»[31].
В В якості інструментів аналізу даних в магістерській дисертації
вибрано середовище Pandas, Matplotlib, Numpy.
Pandas
«Ця бібліотека дозволяє працювати з технологіями аналізу даних,
забезпечує високий рівень продуктивності під час обробки великих масивів
інформації. Система має відкритий код, що дозволяє розробляти власні
процедури обробки данных»[22].
47
«Бібліотека
Pandas
використовується
в
різних
академічних
та
комерційних галузях, включаючи штучний інтелект (Artificial Intelligence),
фінанси, нейробіологію, економіку, статистику, рекламу, веб-аналітику та
багато іншого. Розглянемо основні можливості бібліотеки:
DataFrame - швидкий та ефективний інструмент для маніпулювання
даними з вбудованою індексацією. Методи, які потребують високої
продуктивності, написані на C або Cython.
Дозволяє читати та записувати дані різних форматів: CSV (commasepareted values), таблиці Excel, бази даних SQL, ієрархічний формат HDF.
Усього налічується 19 підтримуваних форматів.
Зручний інструмент до роботи з відсутніми данными»[16].
«Також варто відзначити таке важливі фактори як:
- просте управління безладними даними в упорядкованій
формі;
- гнучка зміна форм: додавання, видалення, приєднання нових або
старих даних;
- інтелектуальне індексування, маніпулювання та управління
стовпцями та рядками;
- потужний інструмент для агрегування та перетворення даних, у тому
числі великого розміру (BigData);
- швидке злиття та об'єднання наборів даних, наприклад, два і більше
об'єктів DataFrame;
- підтримка ієрархічного індексування, тобто можливість
поєднання стовпців під загальною категорією (MultiIndex);
- підтримка роботи з датами та часом»[28].
Matplotlib
Matplotlib – основна бібліотека, що дозволяє здійснювати візуалізацію
даних, обробка яких проведена в середовищі Python.
48
Підтримуються лінійний, поліноміальний формат, гістограма, 3-D
моделі та інші формати візуалізації даних.
Requests
«Ця модель забезпечує можливості створення Web-додатків,
обмінюватися даними з Web-серверами»[34].
«Функціонал бібліотеки включає:
можливості роботи з HTTP-підключеннями;
роботу з Cookie, що включає передачу та отримання даних у
форматі ідентифікатор – найменування;
робота з кодуванням даних;
робота з обліковими записами користувача;
підтримка файлового обміну,
інші послуги, які у рамках роботи з Web-ресурсами»[27].
Numpy
Numeric Python (NumPy) - це система, що використовується для
розрахунків характеристик багатовимірних даних, що використовуються в
додатках, де потрібна статистична обробка інформації. Вхідні дані повинні
бути проіндексовані, їх розмірність може задаватися користувачем. Запис
масиву в пам'ять здійснюється відповідно до заданих налаштувань і
проводиться або в певному порядку, або безладно [29].
Відмінність масиву від набору даних (списку чи кортежу). Величини,
що входять до масиву, є однотипними та їх число визначається в процесі
ініціалізації. Елементи масиву є об'єктами, це змінні у звичайному розумінні
даного терміна. Використання масивів дозволяє оптимізувати системні
ресурси під час роботи з потоками даних. Дана бібліотека дозволяє
проводити математичні операції з даними різних типів та обсягів. Реалізовано
можливості
49
обробки масивів, обробки даних за допомогою апарату лінійної алгебри,
перетворень різного виду [84].
«Аналіз даних – це комплекс математичних дисциплін, у якому
проводяться побудови та дослідження універсальних математичних методів
та обчислювальних алгоритмів отримання знань з експериментальних (у
широкому значенні) даних»[20].
У практичній частині роботи необхідно здійснити інтелектуальний
аналіз даних для вирішення завдання щодо оптимізації асортиментної
політики та зниження витрат підприємств бізнес-процесах.
Питання оптимізації асортиментної політики для торговельного
підприємства мають особливе значення, оскільки непродумані рішення щодо
асортименту
сприяють
рентабельності.
Таким
надмірному
чином,
накопиченню
оптимізація
товару,
зниження
асортиментної
політики
призводить до зниження витрат підприємств бізнес-процесах.
Для вирішення цього завдання здійснимо інтелектуальний аналіз
даних. У досягненні цієї мети зробимо обробку масивів слабоструктурованих
даних, отриманих за даними статистики продажів за період 2020-2022 років з
метою аналізу статистичних показників у сфері продажу, виявлення
закономірностей та залежностей.
Етапи проведення інтелектуального аналізу даних з метою вирішення
поставленого завдання:
- постановка задачі;
- підготовка даних;
- вивчення даних;
- побудова моделей;
- дослідження та перевірка моделей.
В
рамках проведення оптимізації асортиментної політики доцільно
провести аналіз динаміки ринку, структури попиту,
фінансових показників за товарними групами, окремими товарами.
50
В практичної частини роботи буде виконано інтелектуальний аналіз
даних із продажу товарів різної номенклатури. Аналізу буде здійснюватися за
трьома масивами слабоструктурованих даних, потім будуть побудовані
відповідні моделі.
В як інструменти інтелектуального аналізу обрані:
-Угруповання;
-Обчислення відносних величин;
-графічне представлення даних;
-кореляція;
-Кластеризація.
Висновки з другого розділу
Таким чином, інтелектуальний аналіз даних являє собою процес
виявлення придатних для використання відомостей у великих наборах даних.
В інтелектуальному аналізі даних застосовується математичний аналіз
виявлення закономірностей і тенденцій, що у даних. У рамках проведеного
аналізу основних напрямів використання систем інтелектуального аналізу
великих даних у бізнес-процесах було показано, що інструменти обробки
великих масивів інформації дозволяють виявляти наявність залежностей між
параметрами,
що
вивчаються,
проводити
розрахунки
статистичних
показників,
оцінювати
ефективність
асортиментної
та
бонусної
політики.
Отже
технології інтелектуального аналізу дозволяють отримувати конкурентні
переваги для підприємств бізнес-процесах внаслідок наявності можливостей
проведення оптимізації технології роботи з постачальниками, клієнтами,
торговими площами та персоналом.
Проведено постановку завдань, пов'язаних з розрахунком показників з
продажу товарів залежно від різних показників. Проведено вибір
інструментарію щодо аналізу. Також визначено критерії та показники, за
якими передбачається проведення розрахунків.
51
Отже,
використання
системи
статистичної
обробки
інформації
забезпечує можливість аналізу діяльності підприємств, оптимізації структури
виробництва, фінансування основної діяльності, ефективного використання
кредитних ресурсів та державних субсидій.
Як платформа для аналізу даних обрана мова програмування Python,
можливості якого дозволяють створювати віконні, мобільні програми, Webпрограми. Також інструментарій цієї платформи дозволяє вирішувати
завдання, пов'язані з аналізом даних. Python має багато корисних бібліотек,
таких як Matplotlib, Pandas, NumPy [15].
В якості платформи-інтерпретатора обрано платформу Google Colab,
оскільки ця платформа забезпечує можливості колективної роботи з
інформаційними
ресурсами
різних
форматів,
включаючи
можливості
розробки програм на мові Python. Як інструменти аналізу даних вибрані
середовища Pandas, Matplotlib, Numpy.
Одним з найбільш поширених напрямків використання зазначеного
середовища є робота з великими даними, що включає обробку масивів
інформації, їх групування, статистичну обробку, можливості прогнозування,
вивчення параметрів вибірок і розподілів.
52
Розділ 3 Статистичний аналіз даних підприємств торгівлі з
використанням методів обробки великих даних
3.1 Постановка завдань обробки великих даних
На етапі постановки завдання визначаємо мету - проведення
інтелектуального аналізу даних для вирішення задачі щодо оптимізації
асортиментної політики та зниження витрат підприємств бізнес-процесах. Як
вихідні дані для аналізу взято масив великих даних у динаміці 2020-2022 рр.,
що включають:
статистику реалізації товару торговими компаніями у розрізі
видів товарних позицій, форматів магазинів, способів розрахунків;
отримання виручки від продукції; витратами
зберігання продукції; штатної чисельності
підприємств;
показники продажу імпортної продукції;
одержанням прибутковості від діяльності, пов'язаної з реалізацією
товарів;
податковими перерахуваннями, пов'язаними із веденням продажу
товарів;
одержанням субсидій на ведення продажем товарів;
дані щодо заборгованості за кредитами.
Така структура даних для інтелектуального аналізу не випадкова. Для
коректного вирішення поставленої задачі доцільно провести аналіз динаміки
ринку, структури попиту, різних фінансових показників.
Отримана інформація дозволяє виявляти структуру реалізації товару,
прибутковість від товарів окремих видів.
53
Також інтелектуальний аналіз великих даних на основі статистики
виробництва та реалізації товарів забезпечує можливості аналізу фонду
заробітної плати у галузі, динаміки доходів та витрат, виявлення збиткових
торгових компаній у динаміці.
«Програмна реалізація систем великих даних передбачає необхідність
використання
спеціалізованих
програмних
засобів,
які
забезпечують
можливості за підсумками обробки даних, побудова аналітичної звітності,
побудови моделей стану системи підприємств при зміні певних параметрів.
Отже, під час впровадження систем Big Data у компаніях бізнес-процесах
необхідно провести вибір апаратних, програмних рішень, СУБД, і навіть
систему налаштування шаблонів обработки»[13].
На малюнку 5 наведено BPMN-діаграма бізнес-процесу використання
технологій великих даних. У роботі системи передбачається наявність
сценаріїв аналітика та ІТ-фахівця. Сценарій аналітика включає роботу
аналітика, до якої належить отримання та обробку масиву даних, формування
звітності. Сценарій ІТ-фахівця включає налаштування скриптів обробки та
шаблонів виведення даних.
54
Малюнок 5 – BPMN-діаграма бізнес-процесу використання
технологій великих даних
На малюнку 6 наведено діаграму варіантів використання технологій
великих даних.
На малюнку 7 наведено діаграму компонентів. На
малюнку 8 представлено діаграму діяльності.
Результати виконаної роботи дозволили зробити висновки у тому, що
системи великих даних під час використання у компаніях бізнес-процесах
забезпечують можливості вирішення завдань різного напрями. Результатом
обробки великих даних може бути вироблення оптимальної асортиментної
політики, визначення шляхів зниження витрат, визначення оптимальних
постачальників і логістичних ланцюжків.
55
Рисунок 6 – Діаграма варіантів використання технологій великих
даних
Модуль обліку роботи
з постачальниками
Модуль обліку зберігання продукції
Рисунок 7 – Діаграма компонентів
56
Модуль звітності
Етап
Рисунок 8 – Діаграма діяльності
3.2 Опис засобів автоматизації обробки великих даних
«OLAP (Online Analytical Processing) – це система аналітичної обробки
даних. Вона призначена для підготовки звітності, побудови прогностичних
сценаріїв
та
виконання
статистичних
розрахунків
на
базі
великих
інформаційних масивів, що мають складну структуру »[34].
«Компонентами OLAP є:
база даних (БД) - джерело, з якого здійснюється завантаження
даних щодо обробки;
57
OLAP сервер - ядро системи, за допомогою якого проводиться
обробка багатовимірних структур даних, та забезпечується зв'язок між БД
и користувачами систем; програми для роботи користувачів, у яких
формуються
запити та візуалізуються отримані відповіді.
Специфіка обробки даних OLAP системами полягає у побудові
багатовимірних, тобто мають багато зв'язків між окремими елементами,
масивів інформації»[55].
Архітектурно - технологічна схема OLAP представлена малюнку 9.
В
як платформа для аналізу даних обрана мова програмування
Python, можливості якої дозволяють створювати віконні, мобільні програми,
Web-програми. Також інструментарій цієї платформи дозволяє вирішувати
завдання, пов'язані з аналізом даних. Python має безліч корисних бібліотек,
такі як Matplotlib, Pandas,
NumPy, Sklearn.cluster.
В якості платформи-інтерпретатора вибрано платформу Google Colab.
Ця платформа забезпечує можливості колективної роботи з інформаційними
ресурсами різних форматів, включаючи можливості розробки програм на
мові Python.
Рисунок 9 - Архітектурно-технологічна схема LAP
58
Одним з найбільш поширених напрямків використання зазначеного
середовища є робота з великими даними, що включає обробку масивів
інформації, їх групування, статистичну обробку, можливості прогнозування,
вивчення параметрів вибірок і розподілів.
«Для використання середовища Python як інструмент аналізу даних
необхідно використання спеціалізованих бібліотек, у можливості яких входять
інструменти статистики, графічні сервіси
и інші технології, дозволяють проводити обробку информации»[31].
В Як інструменти аналізу даних вибрані середовища Pandas,
Matplotlib, Numpy, Sklearn.cluster.
Висновки у розділі
Проведено постановку завдань, пов'язаних з розрахунком показників з
продажу
товарів
залежно
від
різних
показників.
Проведено
вибір
інструментарію щодо аналізу. Також визначено критерії та показники, за
якими передбачається проведення розрахунків.
59
Розділ 4 Апробація результатів дослідження
4.1 Проведення статистичної обробки масиву даних
На етапі підготовки даних визначено джерела даних для здійснення
інтелектуального аналізу – масиви великих даних у динаміці 2020-2022 років.
В відповідно до поставлених завдань проведено інтелектуальний аналіз
масиву даних, структура якого включає:
найменування підприємства, що у бізнес-процесах; дані
про види товарів, що реалізуються;
дані про реалізацію видів продукції за тимчасовими періодами;
дані про податкові виплати; дані про реалізацію імпортної
продукції;
дані про якість реалізованого товару;
дані про витрати на зберігання товару;
дані про кількість працівників.
В таблиці 4 наведено фрагмент джерела даних, поданих для аналізу.
Таблиця 4 - фрагмент джерела даних, представлених для аналізу
Кількість
працівників
Відсоток
шлюбу
Рік
1760382
147
10
2021
12
1912387
2905812
188
3
2020
6
2578295
1790496
2924583
61
5
2022
3
Сир 5%
9239042
2876587
600775
212
2
2022
6
Макаронні
вироби
1087870
462651
659082
208
3
2022
5
Компанія
ТОВ
Продукти
ТОВ
Продукти
Продукт
Виторг
Витрати Податки
Молоко
9301184
1225232
Олія
5336586
ІП Іванов
Чай
ТОВ Магазин
ІП Васильєв
60
Відсоток
імпорту
Продовження таблиці 4
Компанія
Продукт
Виторг
Витрати
Податки
Кількість
працівників
Відсоток
шлюбу
Рік
Відсоток
імпорту
ІП Семенов
Чай
9367546
238297
2317842
223
10
2022
9
ТОВ
Ромашка
ТОВ Біля
будинку
ТОВ
Продукти
Макаронні
вироби
5676465
1697983
1695799
234
4
2021
3
Білий хліб
Плавлений
сир
3987197
2519305
2556902
232
2
2020
1
2589544
1689138
1598052
210
9
2021
10
ІП Іванов
Білий хліб
3009772
2947162
1863158
3
7
2021
20
ІП Петров
Крупи
3750347
1184581
496880
134
5
2022
10
ІП Козлов
Кава
9799319
860076
555102
80
7
2020
6
ТОВ Люкс
ТОВ
Яскравіше
Білий хліб
8150273
743536
999158
200
1
2020
20
Сир 2%
2418934
1092164
1186410
295
5
2021
4
ТОВ
Конвалія
ТОВ
Магазин
ТОВ
Магазин
Макаронні
вироби
Сік
яблучний
Плавлений
сир
Сік
5666680
2428407
963746
31
8
2022
10
9008428
1960802
1433985
88
9
2020
18
8480525
2867499
28108
235
8
2020
9
персиковий
4384557
258051
1489288
103
8
2022
1
Сир 2%
6167590
910818
2400293
202
8
2022
14
Макаронні
вироби
7439872
1786718
2440809
205
1
2020
1
Білий хліб
Плавлений
сир
1010421
212427
2836459
39
10
2021
6
1715985
1481183
2145368
48
6
2021
2
Чорний хліб
3212318
2429985
1518413
151
9
2021
3
Чай
6966487
329482
1756894
55
5
2021
19
ТОВ Люкс
Олія
7496274
724786
2209979
131
6
2022
12
ІП Семенов
ТОВ
Ромашка
Олія
2626351
2524439
1450863
56
7
2021
10
Білий хліб
Плавлений
сир
4422753
103536
2478473
143
8
2020
11
3270107
1657380
722463
27
4
2022
11
Кава
9573184
1383305
676259
244
4
2020
14
Крупи
3580395
60340
2243536
85
7
2020
7
Сир 2%
7384536
2577771
1363862
127
7
2020
4
Кава
6137417
1171657
2653278
105
8
2021
2
Олія
8336010
2170783
2696853
292
2
2022
10
ТОВ Біля
будинку
ІП Іванов
ІП Козлов
ТОВ
Конвалія
ІП Іванов
ТОВ
Магазин
ТОВ
Продуктовий
ІП Петров
ТОВ
Магазин
ТОВ Біля
будинку
ТОВ
Ромашка
ТОВ
Конвалія
ІП Іванов
61
Продовження таблиці 4
Компанія
Продукт
ІП Петров
Сік яблучний
ІП Іванов
Чай
ТОВ
Продукти
Макаронні
вироби
Плавлений
сир
ТОВ Магазин
ІП Петров
ТОВ
Продуктовий
Білий хліб
ІП Петров
ТОВ
Продукти
Сир 2%
ТОВ Магазин
ТОВ Біля
будинку
Сік яблучний
ТОВ Конвалія
Чорний хліб
ТОВ Магазин
Крупи
ІП Семенов
Кава
ІП Петров
ТОВ
Продуктовий
Сир 5%
Чай
Сир 2%
Чорний хліб
ІП Петров
Олія
Сік
персиковий
ТОВ Ромашка
Сир 2%
ТОВ Конвалія
Чорний хліб
ІП Васильєв
Чорний хліб
ТОВ Магазин
Молоко
ІП Васильєв
Білий хліб
Плавлений
ТОВ Біля
будинку
ТОВ
Продукти
ТОВ Магазин
ТОВ Конвалія
ТОВ
Продукти
ІП Козлов
сир
Сир 5%
Олія
Плавлений
сир
Білий хліб
Крупи
Виторг
а
779658
4
562301
7
Витрати
Податки
Кількість
працівників
Відсоток
шлюбу
Рік
Відсоток
імпорту
906015
2691370
291
7
2021
3
1812982
2890711
258
6
2020
3
890545
686325
40
7
2020
10
302984
1392855
204
6
2022
5
2299245
1139720
186
2
2021
10
965438
6435
100
10
2021
14
435079
2345615
29
10
2020
19
1562885
505278
210
9
2020
18
239429
935603
139
2
2021
12
200415
589821
8
409248
6
568859
1
375299
9
139277
5
324375
9
673374
5
866866
9
663296
8
412883
1
903133
6
306493
2411829
2720237
112
7
2021
7
816741
2115668
35
5
2020
18
1302972
1478500
193
7
2021
18
1017854
2022799
250
2
2020
9
2612745
410922
195
1
2022
15
959427
2347690
224
6
2020
16
2191603
1171186
53
10
2021
15
1899930
1757471
229
2
2020
7
1813167
1402211
81
9
2020
5
371920
2416094
277
2
2020
2
2485582
1294763
285
7
2021
10
441404
543381
288
1
2020
10
7
739790
4
669355
7
847000
0
405764
3
634573
9
1717145
2561814
285
5
2020
5
49272
402868
169
1
2020
18
1692798
454565
10
7
2020
16
2131736
1147653
114
10
2022
8
2289029
2487836
170
2
2022
16
641940
2786101
158
7
2021
18
826794
0
282820
5
881062
9
926738
5
234903
1
416015
3
814985
8
62
Продовження таблиці 4
Виторг
Витрати
Податки
Кількість
працівників
Відсоток
шлюбу
Рік
Відсоток
імпорту
126279
1618797
1576245
20
8
2020
3
9120544
1709911
1387451
122
3
2022
2
2831347
2880683
103064
12
6
2022
11
Кава
Чорний
хліб
2421572
2285686
1845529
8
2
2021
12
6942285
2735996
1618437
207
7
2021
10
1490704
215154
1077543
189
10
2020
13
ТОВ Люкс
Сир 2%
Сік
персиковий
4871382
462937
844120
130
1
2022
5
ТОВ Люкс
Кава
9579138
2432811
1821673
149
4
2022
9
ІП Козлов
Олія
782467
2920843
1627930
169
1
2021
5
ІП Іванов
Молоко
Чорний
хліб
2380322
762363
2241027
199
7
2020
3
5557674
221753
1022357
285
10
2021
18
Сир 5%
Чорний
хліб
Чорний
хліб
3537861
2333358
2404176
17
10
2020
3
8157772
1844461
1813844
57
7
2022
11
2645328
1309732
1831949
112
6
2020
1
Сир 2%
3543025
126920
2386140
287
6
2021
9
ІП Козлов
Олія
9521485
245060
815403
274
7
2021
20
ТОВ Люкс
ТОВ Біля
будинку
Білий хліб
9662871
1765893
2901109
177
10
2022
17
Чай
7838071
2849537
1254897
14
1
2021
5
ТОВ Люкс
Сир 2%
8086893
1735130
549649
99
4
2022
5
ІП Козлов
ТОВ
Продукти
Кава
8797881
1070362
563562
128
2
2021
15
Кава
3550990
1261848
548455
132
4
2022
19
ТОВ Люкс
Молоко
Плавлений
сир
8981862
856414
1729748
45
10
2020
12
6966221
798838
2237889
72
5
2021
15
Крупи
3746800
1423383
2393423
127
9
2022
14
Крупи
4034090
235096
2640143
97
3
2022
17
Кава
Чорний
хліб
3470881
983828
659131
162
8
2020
15
850634
1317261
750771
3
6
2021
2
Сир 5%
7816296
341355
435243
211
5
2020
11
Компанія
ТОВ
Продуктовий
ІП Семенов
Продукт
Сік
персиковий
Чорний
хліб
ІП Петров
Макарони
е вироби
ІП Петров
ІП Семенов
ІП Іванов
ІП Козлов
ТОВ
Продукти
ТОВ
Продуктовий
ТОВ
Продуктовий
ТОВ
Продукти
ІП Іванов
ТОВ
Продукти
ТОВ
Продукти
ТОВ Люкс
ІП Васильєв
ТОВ Біля
будинку
63
Продовження таблиці 4
Компанія
Продукт
Виторг
Витрати
Податки
Кількість
працівників
Відсоток
шлюбу
Рік
Відсоток
імпорту
ТОВ
Продуктовий
Макарони
е вироби
9974455
1937270
1925490
117
2
2021
14
ТОВ Люкс
ТОВ
Продукти
Білий хліб
Сік
персиковий
Плавлений
сир
Чорний
хліб
5646312
682526
895815
237
1
2022
18
1174431
195089
14485
200
1
2021
7
947720
935367
15056
293
9
2022
2
4952732
477045
1159896
194
2
2022
8
8968861
1220197
538104
182
4
2020
18
4144179
1284645
2159799
6
1
2022
1
Білий хліб
Сік
8820287
2979599
1665155
98
9
2021
15
персиковий
Сік
яблучний
6901474
520851
1976687
226
5
2021
14
7894675
11437
2580771
226
6
2022
17
ТОВ Люкс
ТОВ Біля
будинку
Олія
2358207
1603693
1887247
153
2
2020
9
Сир 2%
1607584
89486
1811758
176
4
2022
14
ІП Семенов
7551537
445844
185029
44
5
2020
11
ТОВ Люкс
Сир 2%
Сік
яблучний
59664
994907
17568
194
10
2022
6
ТОВ Люкс
Макарони
е вироби
201612
1837329
155638
106
9
2022
19
ІП Васильєв
Кава
7155346
661411
1001848
285
7
2020
3
ТОВ Ромашка
Молоко
Сік
яблучний
7850826
186525
49265
82
1
2020
11
8748388
2119323
1952641
273
2
2022
17
Сир 5%
Сік
персиковий
4837527
1074468
505485
47
4
2021
13
6210813
2028372
2731384
120
10
2021
10
Сир 5%
8502495
2555124
1657150
7
1
2021
2
Кава
1334590
2688282
1400700
78
10
2021
18
ІП Козлов
ТОВ
Продукти
Кава
5075864
702479
2659584
209
1
2022
15
Олія
2617840
1767532
597787
277
5
2020
14
ІП Іванов
Білий хліб
2632355
2950791
899563
158
7
2020
2
ІП Петров
Чай
7253600
1791236
2281783
177
6
2021
6
ІП Семенов
ТОВ
Продуктовий
ІП Васильєв
ІП Іванов
ТОВ Люкс
ТОВ Біля
будинку
ІП Козлов
ТОВ Люкс
ІП Козлов
ТОВ Магазин
ТОВ Біля
будинку
ТОВ
Продуктовий
Макарони
е вироби
Сік
персиковий
64
Продовження таблиці 4
Виторг
Витрати
Податки
Кількість
працівників
Відсоток
шлюбу
Рік
Відсоток
імпорту
ІП Петров
Продукт
Сік
персиковий
7777465
1508086
434293
130
9
2022
13
ІП Козлов
Сир 5%
199504
2200479
861509
184
1
2020
11
ІП Семенов
ТОВ
Продуктовий
Сир 2%
7882174
1004117
2528452
108
6
2021
3
Білий хліб
5098379
1920159
2817059
83
4
2020
3
ТОВ Люкс
Молоко
618355
1031729
2693034
213
2
2022
17
ТОВ Магазин
Сир 5%
2170491
1369566
1335267
267
7
2020
1
ІП Козлов
Сир 2%
Плавлений
сир
Сік
яблучний
9875860
1119186
377755
167
3
2020
11
8696433
1299580
2654915
221
5
2021
17
2491202
1859854
629453
227
2
2021
2
8671895
1054979
412729
178
8
2020
11
ТОВ Ромашка
Чай
Плавлений
сир
5852232
1930698
1392007
14
1
2020
20
ТОВ Магазин
Сир 5%
8504236
1926582
1388520
225
9
2022
12
ТОВ Магазин
ТОВ Біля
будинку
Сир 2%
2787649
1541318
2152786
260
2
2021
2
Олія
2118277
202937
2711801
290
3
2022
13
ІП Петров
ТОВ
Продукти
981867
2455854
283393
139
2
2020
8
8969516
2931845
519163
68
4
2022
9
ТОВ Магазин
Сир 5%
Плавлений
сир
Плавлений
сир
8071215
2870742
1429329
235
7
2021
20
ТОВ Ромашка
Сир 2%
6534746
459407
847071
211
5
2021
5
ІП Васильєв
Чай
5322811
2527521
193815
211
7
2020
16
Компанія
ІП Семенов
ТОВ Конвалія
ТОВ Конвалія
При вирішенні задачі оптимізації асортиментної політики підприємств
бізнес-процесах необхідно спиратися на низку показників. Одним з таких
показників є маржинальний дохід, який є різницею між виручкою від
реалізації та витратами в процесі виробництва або закупівлі продукції.
На малюнку 10 наведено процедуру розрахунку маржинального доходу
від
реалізації
товару
у
компаніях
бізнес-процесах
(фрагмент).
Метод
статистичної обробки: угруповання по підприємствах, продукції та роках.
На малюнку 11 наведено звіт із сумарної виручці підприємств із
найбільшими оборотами.
65
На малюнку 12 наведена частка підприємств із найбільшим оборотом у
формі кругової діаграми.
Рисунок 10 – Процедура розрахунку маржинального доходу від
реалізації товару у компаніях бізнес-процесах
Рисунок 11 - Звіт по сумарному виторгу компаній
з найбільшими оборотами
66
На малюнку 13 наведено діаграму за обсягами виручки від товарів
різної номенклатури.
Рисунок 12 – Діаграма оборотів компаній
з найбільшою величиною виторгу
Рисунок 13 – Діаграма за обсягами виручки
від реалізації товарів різної номенклатури
67
На малюнку 14 наведено розрахунок обсягів реалізації імпортної
продукції. Використано методи статистичного угруповання. Показано, що
в аналізований період підприємствами здійснювався значний обсяг продажу
імпортних товарів. Тут варто зазначити, що продаж імпортних товарів у
сучасній політичній ситуації є ризиковою діяльністю. Проте реалізація
імпортної продукції продовжує бути серйозною статтею доходу підприємств
бізнес-процесах.
Рисунок 14 – Розрахунок обсягів продажу імпортних товарів
На малюнку 15 наведено графік зведених показників продажу
імпортних товарів компаніями, які мають найбільший обсяг.
68
Рисунок 15 – Графік зведених показників продажу імпортних товарів
компаніями, які мають найбільший обсяг
В Завдання
управління
підприємствами
бізнес-процесах
важливе
значення набуває отримання даних, які можуть дозволити розрахувати
собівартість одиниці продукції, що випускається, рентабельність продажів.
Такі дані містить звіт про витрати при виробництві продукції.
На малюнку 16 наведено річний звіт про витрати під час виробництва
харчової продукції.
Малюнок 16 – Звіт з витрат торгових компаній
в розріз звітних періодів
69
Як показано на малюнку 16, у аналізований період максимальний обсяг
витрат торгових компаній припав на 2021 рік, далі зазначено зниження,
пов'язане зі скороченням валового обсягу реалізації товару на поточний рік.
На малюнку 17 наведено діаграму витрат за виробництво продукції за
розрахунковими періодами. Використані статистичні методи угруповання та
обчислення відносних величин.
На малюнку 18 наведено звіт за величиною виручки від продажу. Як
показано на малюнку – найбільшу питому вагу у виручці за продані товари
займає позиція «персиковий сік».
На малюнку 19 наведено графічне подання щодо виручки від збуту
товарів.
На малюнку 20 наведено звіт із витрат торгових підприємств. На
малюнку 21 – його графічне уявлення. Як показано на малюнку 20 –
найбільший рівень витрат припадає на продаж продукції за позицією «Білий
хліб». Використані статистичні методи угруповання, розрахунку відносних
показників.
Рисунок 17 – Звіт про витрати на виробництво харчової продукції у
розрізі звітних періодів (графічне подання)
70
Рисунок 18 - Звіт за величиною виручки від збуту товарів
Рисунок 19 - Звіт за величиною виторгу від збуту товарів
(графічне уявлення)
71
Рисунок 20 – Звіт про витрати на виробництво продукції
Рисунок 21 – Звіт про витрати на виробництво продукції
(графічне уявлення)
72
В Завдання управління дуже важливо приймати грамотні та зважені
рішення. Для цього здійснимо «кореляційний аналіз, завдання якого
зводиться до вимірювання тісноти зв'язку між факторами, виявлення
невідомих причин зв'язків та оцінки факторів, що викликають максимальний
вплив на результат» [9].
Кореляційний аналіз за показниками «маржинальний дохід» та
«кількість працівників» та результат розрахунку показаний на малюнку 22.
Рисунок 22 – Кореляційний аналіз за показниками «маржинальний
дохід» та «кількість працівників»
Як показано малюнку 22, кореляційна залежність між зазначеними
параметрами відсутня.
Далі проведено кореляційний аналіз за показниками «виторг» та
«відсоток шлюбу». Результат розрахунку показаний малюнку 23.
Рисунок 23 – Кореляційний аналіз за показниками «виручка» та
«відсоток шлюбу»
73
Далі проведемо дослідження файлу даних із показниками фінансової
діяльності харчових підприємств. У таблиці 5 наведено фрагмент файлу
даних.
Таблиця 5 - Фрагмент файлу даних щодо фінансового аналізу діяльності
харчових підприємств
Дебіторська
Кредиторська
Компанія
заборгованість
заборгованість
ІП Васильєв
1032375
495160
ТОВ Біля будинку
883508
4360708
Субсидії
598912
909087
Рік
2021
2020
ТОВ Продукти
2232248
1086130
735505
2021
ІП Іванов
3066631
2311238
146467
2020
ТОВ Біля будинку
284078
3380706
812077
2022
ТОВ Яскравіше
4926962
1019984
887426
2022
ТОВ Магазин
ТОВ Магазин
201037
4917631
673142
4295111
978487
158214
2022
2021
ТОВ Яскравіше
139584
250108
752736
2020
ТОВ Біля будинку
4495241
1267255
403928
2020
ТОВ Біля будинку
4353107
4657403
809519
2020
ТОВ Конвалія
367094
4060111
445838
2022
ІП Козлов
ІП Козлов
3740801
2880547
4628921
4945436
268986
361792
2022
2022
ТОВ Магазин
160540
3640677
428815
2021
ІП Іванов
1027677
870123
915119
2021
ТОВ Біля будинку
744405
1205127
861774
2021
ТОВ Біля будинку
4095705
2074415
578771
2021
74
Продовження таблиці 5
Дебіторська
заборгованість
499237
4247332
Кредиторська
заборгованість
277182
4943200
Субсидії
833758
616908
Рік
2022
2020
ТОВ Ромашка
2976446
4218428
121207
2022
ІП Іванов
3386768
474075
253632
2020
ІП Семенов
1794570
4227177
377678
2020
ІП Семенов
2675162
1203732
267783
2021
ТОВ Люкс
1527842
2576643
787044
2021
ІП Петров
3625567
2556171
217306
2020
ІП Семенов
1292169
4143877
885541
2022
ТОВ Біля будинку
4466255
2687638
606375
2020
ТОВ
Продуктовий
4343670
3342803
190717
2022
ІП Васильєв
2255637
4409390
881615
2021
ТОВ
Продуктовий
611654
4646169
289212
2021
ТОВ Яскравіше
2107071
3122300
593175
2022
ТОВ Яскравіше
3863029
694793
812865
2022
ТОВ Конвалія
4314534
1776565
137207
2022
ТОВ Яскравіше
1547195
2095694
611139
2022
ІП Васильєв
3514434
4209776
472703
2021
ТОВ Продукти
1186404
3107293
318173
2020
Компанія
ІП Петров
ІП Семенов
75
Продовження таблиці 5
Дебіторська
заборгованість
Кредиторська
заборгованість
Субсидії
Рік
ТОВ
Продуктовий
2442653
1553904
218175
2020
ТОВ Магазин
1531860
1256605
581917
2021
ІП Семенов
ТОВ Яскравіше
1450825
2695954
3410522
418830
684347
493239
2020
2022
ТОВ
Продуктовий
618893
4071844
295980
2021
ТОВ Продукти
ТОВ
Продуктовий
ІП Семенов
1005644
4543239
360850
2020
2972007
1816909
2474447
836439
511538
937666
2022
2020
ТОВ Біля будинку
103458
3411017
776505
2020
ТОВ Конвалія
4652354
1314479
669772
2020
ТОВ
Продуктовий
171192
3752221
599836
2021
ТОВ Ромашка
4917530
2649349
605796
2020
ІП Васильєв
3246053
1621245
275774
2022
ІП Іванов
ТОВ Біля будинку
1824723
4791952
797916
129808
822188
553238
2020
2021
ТОВ Біля будинку
706520
3714655
414500
2020
ІП Козлов
807804
3847867
651818
2020
ТОВ Магазин
ТОВ Люкс
4886726
1062029
4858865
2926765
342919
127546
2022
2021
ТОВ Біля будинку
829663
1027353
661564
2022
ТОВ Магазин
3420885
1859438
478386
2021
ТОВ Конвалія
1553094
2675106
402047
2022
Компанія
76
Продовження таблиці 5
Компанія
Дебіторська
заборгованість
Кредиторська
заборгованість
Субсидії
Рік
ТОВ Люкс
4969067
2892123
754312
2022
ТОВ Яскравіше
1933201
581721
405167
2022
ІП Семенов
2472542
2597700
278775
2020
ІП Козлов
4207374
501356
879666
2020
ТОВ Конвалія
1935564
2236649
991617
2021
Файл даних містить інформацію щодо дебіторської та кредиторської
заборгованості, галузі продажу, обсягу бонусів, дані про розрахунковий
період у формі компенсації податків.
Причина, через яку автор вважає за доцільне розглянути даний масив
даних, полягає в тому, що ефективне управління торговим підприємством –
це також питання забезпечення прийнятного рівня ризику. «Збільшення
обсягу кредиторську заборгованість як безплатного джерела фінансування та
її частки в позиковий капітал підприємства, зазвичай, сприяє зростанню
прибуток від продажів, а й збільшує ризики несплати організації за своїми
обязательствам»[24].
На малюнку 24 наведено звіт про фінансову діяльність підприємств. Як
показано малюнку 24, фінансова діяльність підприємств здійснюється як із
позитивним, і з негативним фінансовим результатом. На малюнку 25
наведено звіт щодо сумарної дебіторської
заборгованості на підприємствах у бізнес-процесах.
77
Малюнок 24 - Звіт про фінансову діяльність підприємств
(фрагмент)
Малюнок 25 - Звіт щодо сумарної дебіторської заборгованості на
підприємствах у бізнес-процесах
Як показано малюнку 25, нині відзначається зростання рівня
дебіторську заборгованість підприємств.
На малюнку 26 наведено графічну інтерпретацію цього звіту.
Використані методи статистичного угруповання та розрахунку відносних
показників.
78
Малюнок 26 - Звіт за сумарною дебіторською заборгованістю на
підприємствах у бізнес-процесах (графічна інтерпретація)
На малюнку 27 наведено звіт щодо сумарної кредиторської
заборгованості на підприємствах у бізнес-процесах.
Малюнок 27 - Звіт з сумарної кредиторської заборгованості на
підприємствах у бізнес-процесах
79
Як показано малюнку 27, нині відзначається зростання рівня
дебіторську заборгованість підприємств. На малюнку 28 наведено графічну
інтерпретацію цього звіту. Використані методи статистичного угруповання
та розрахунку відносних показників.
Малюнок 28 - Звіт сумарної кредиторської заборгованості на
підприємствах бізнес-процесах (графічна інтерпретація)
Далі на малюнку 29 проведено звіт сумарної дебіторської
заборгованості по компаніях (використано метод угруповання).
Малюнок 29 - Звіт сумарної кредиторської заборгованості на
підприємствах у бізнес-процесах
80
На малюнку 30 наведено графічне подання зазначеного звіту. На малюнку
31 наведено зведений звіт щодо дебіторської заборгованості
по галузях. Використано метод статистичного угруповання.
Як
показано
малюнку
32,
найбільший
рівень
дебіторську
заборгованість спостерігається у галузі продажів кондитерських виробів,
найменший рівень - у галузі продажів круп.
Малюнок 30 - Звіт за сумарною кредиторською заборгованістю на
підприємствах у бізнес-процесах (графічне подання)
81
Малюнок 31 - Зведений звіт з дебіторської заборгованості з
галузей
Малюнок 32 - Зведений звіт щодо дебіторської заборгованості
за галузями (графічне подання)
На
малюнку
33
наведено
зведений
звіт
щодо
кредиторської
заборгованості по галузях. Використано метод статистичного угруповання.
Як показано на малюнку 34, найбільший рівень
82
кредиторську заборгованість спостерігається у галузі продажів
кондитерських виробів, найменший рівень - у галузі продажів круп.
Малюнок 33 - Зведений звіт щодо кредиторської
заборгованості по галузях
Малюнок 34 - Зведений звіт щодо дебіторської заборгованості
за галузями (графічне подання)
83
На малюнку 35 наведено зведений звіт щодо фінансових результатів
діяльності підприємств у бізнес-процесах. Використані методи статистичного
угруповання.
Малюнок 35 - Зведений звіт щодо фінансових результатів діяльності
підприємств у бізнес-процесах
На малюнку 36 наведено графічне подання цього звіту.
Малюнок 36 - Зведений звіт щодо фінансових результатів діяльності
підприємств у бізнес-процесах (графік)
84
Як показано малюнку 35, найбільшу ефективність показала галузь
виробництва кондитерських виробів.
Важливо, що Росія надає фінансову допомогу підприємствам бізнеспроцесах як субсидій, оскільки Уряд РФ розуміє стратегічне значення цієї
галузі структурі економіки нашої країни.
В у зв'язку з цим на малюнку 37 наведено розрахунок кореляції між
фінансовим результатом та обсягом отриманих субсидій.
Рисунок 37 - Розрахунок кореляції між фінансовим результатом та
обсягом отриманих субсидій
85
Як показано малюнку 37, між зазначеними показниками кореляція
відсутня.
На малюнку 38 наведено розрахунок кореляції між фінансовим
результатом та обсягом кредиторської заборгованості.
Рисунок 38 - Розрахунок кореляції між фінансовим результатом та
обсягом кредиторської заборгованості
86
Як показано на малюнку 38 між зазначеними показниками кореляція
відсутня. Отже, поставлені завдання статистичної обробки інформації
реалізовано.
4.2 Апробація та аналіз результатів зі статистики продажів
Далі проведемо аналіз статистики продажу товарів у межах видів
товарних позицій, форматів торгових точок. У таблиці 6 наведено фрагмент
вихідних даних масиву, що аналізується.
Таблиця 6 - Вихідні дані
Вид продукції
Молочна
Побутова хімія
Побутова хімія
Електроніка
Кондитерська
продукція
Побутова хімія
Хлібна
Кондитерська
продукція
Сантехніка
Хлібна
Хлібна
Молочна
Молочна
Молочна
Кондитерська
продукція
Сантехніка
Кондитерська
продукція
Електроніка
Хлібна
Побутова хімія
Електроніка
Побутова хімія
Молочна
Формат
магазину
Маркетплейс
Супермаркет
Гіпермаркет
Гіпермаркет
Дата
19.03.2023
27.03.2023
29.03.2023
10.03.2023
Виторг
Формат оплати
1692483 готівка
2821627 готівка
2736173 готівка
6819064 готівка
Гіпермаркет
Маркетплейс
Магазин біля
будинку
Магазин біля
будинку
Магазин біля
будинку
Маркетплейс
Маркетплейс
Маркетплейс
Маркетплейс
Магазин біля
будинку
01.03.2023
28.03.2023
7902809 банківська картка
2752005 готівка
09.03.2023
549832 банківська картка
30.03.2023
3069652 банківська картка
10.03.2023
26.03.2023
01.03.2023
07.03.2023
28.03.2023
3532898 готівка
6964775 банківська картка
9630604 готівка
8485364 банківська картка
2837568 банківська картка
10.03.2023
8504384 готівка
Маркетплейс
Маркетплейс
22.03.2023
01.03.2023
7297989 банківська картка
3545797 банківська картка
Гіпермаркет
Магазин біля
будинку
Маркетплейс
Магазин біля
будинку
Гіпермаркет
Магазин біля
будинку
Супермаркет
30.03.2023
4440008 готівка
04.03.2023
06.03.2023
2928329 готівка
4339618 банківська картка
12.03.2023
01.03.2023
8223836 готівка
2757230 готівка
24.03.2023
14.03.2023
7985304 готівка
6099754 банківська картка
87
Продовження таблиці 6
Вид продукції
Сантехніка
Сантехніка
Хлібна
Кондитерська
продукція
Кондитерська
продукція
Сантехніка
Сантехніка
Побутова хімія
Сантехніка
Побутова хімія
Хлібна
Кондитерська
продукція
Молочна
Молочна
Електроніка
Хлібна
Кондитерська
продукція
Сантехніка
Хлібна
Хлібна
Сантехніка
Сантехніка
Хлібна
Сантехніка
Хлібна
Молочна
Кондитерська
продукція
Молочна
Сантехніка
Електроніка
Побутова хімія
Електроніка
Електроніка
Молочна
Електроніка
Побутова хімія
Хлібна
Формат
магазину
Маркетплейс
Магазин біля
будинку
Супермаркет
Дата
20.03.2023
Виторг
Формат оплати
4216666 банківська картка
11.03.2023
17.03.2023
5943479 готівка
9798672 банківська картка
Гіпермаркет
07.03.2023
4780535 банківська картка
Маркетплейс
Гіпермаркет
Супермаркет
Магазин біля
будинку
Супермаркет
Гіпермаркет
Супермаркет
12.03.2023
25.03.2023
28.03.2023
8978095 банківська картка
6368425 готівка
7911266 готівка
10.03.2023
21.03.2023
27.03.2023
09.03.2023
9238246 банківська картка
4892675 банківська картка
7261840 готівка
9855224 готівка
Супермаркет
Супермаркет
Маркетплейс
Гіпермаркет
Маркетплейс
02.03.2023
07.03.2023
20.03.2023
13.03.2023
24.03.2023
2766221 готівка
9450074 банківська картка
4230971 банківська картка
9768092 готівка
7517197 банківська картка
Гіпермаркет
Гіпермаркет
Магазин біля
будинку
Маркетплейс
Магазин біля
будинку
Супермаркет
Магазин біля
будинку
Гіпермаркет
Маркетплейс
Маркетплейс
05.03.2023
04.03.2023
5839101 банківська картка
2451169 готівка
21.03.2023
07.03.2023
228562 готівка
6841238 банківська картка
11.03.2023
22.03.2023
9816469 готівка
6633081 банківська картка
14.03.2023
08.03.2023
19.03.2023
29.03.2023
1634136 готівка
6215671 готівка
458576 банківська картка
8267768 готівка
Гіпермаркет
Магазин біля
будинку
Супермаркет
Супермаркет
Гіпермаркет
Гіпермаркет
Магазин біля
будинку
Гіпермаркет
Супермаркет
Супермаркет
Маркетплейс
05.03.2023
5693925 банківська картка
19.03.2023
25.03.2023
18.03.2023
16.03.2023
28.03.2023
6322301 банківська картка
6929806 готівка
5218887 банківська картка
4165154 банківська картка
2904323 банківська картка
01.03.2023
23.03.2023
30.03.2023
22.03.2023
19.03.2023
4865952 банківська картка
3179259 готівка
210985 готівка
8271115 банківська картка
6100079 готівка
88
Продовження таблиці 6
Вид продукції
Молочна
Кондитерська
продукція
Кондитерська
продукція
Хлібна
Сантехніка
Молочна
Молочна
Молочна
Електроніка
Побутова хімія
Сантехніка
Електроніка
Побутова хімія
Хлібна
Молочна
Кондитерська
продукція
Молочна
Хлібна
Побутова хімія
Хлібна
Молочна
Сантехніка
Кондитерська
продукція
Побутова хімія
Побутова хімія
Електроніка
Побутова хімія
Хлібна
Електроніка
Хлібна
Електроніка
Молочна
Сантехніка
Молочна
Кондитерська
продукція
Кондитерська
продукція
Формат
магазину
Супермаркет
Дата
17.03.2023
Маркетплейс
18.03.2023
4657806 банківська картка
Супермаркет
Гіпермаркет
Гіпермаркет
Супермаркет
Супермаркет
Гіпермаркет
Магазин біля
будинку
Магазин біля
будинку
Супермаркет
Гіпермаркет
Маркетплейс
Супермаркет
Супермаркет
06.03.2023
17.03.2023
05.03.2023
27.03.2023
20.03.2023
20.03.2023
1384167 готівка
1085822 готівка
389496 готівка
8876334 готівка
4032188 банківська картка
2218804 готівка
06.03.2023
3554119 банківська картка
08.03.2023
16.03.2023
01.03.2023
08.03.2023
03.03.2023
17.03.2023
1462918 банківська картка
317880 банківська картка
4573605 готівка
4147935 готівка
1532045 банківська картка
1987748 готівка
Маркетплейс
Супермаркет
Магазин біля
будинку
Супермаркет
Супермаркет
Гіпермаркет
Магазин біля
будинку
09.03.2023
25.03.2023
9229624 готівка
2922725 банківська картка
26.03.2023
29.03.2023
01.03.2023
18.03.2023
8779205 банківська картка
9632846 банківська картка
1873679 банківська картка
7123334 готівка
06.03.2023
4966650 готівка
Гіпермаркет
Маркетплейс
Магазин біля
будинку
Гіпермаркет
Магазин біля
будинку
Гіпермаркет
Гіпермаркет
Гіпермаркет
Гіпермаркет
Супермаркет
Маркетплейс
Супермаркет
04.03.2023
07.03.2023
6899548 готівка
7123931 готівка
15.03.2023
08.03.2023
7499649 готівка
464462 готівка
31.03.2023
30.03.2023
16.03.2023
11.03.2023
04.03.2023
14.03.2023
19.03.2023
23.03.2023
1649604 банківська картка
6297527 готівка
8552822 готівка
9378239 банківська картка
155055 банківська картка
5515046 банківська картка
675321 готівка
528380 готівка
Магазин біля
будинку
15.03.2023
5839938 банківська картка
Гіпермаркет
13.03.2023
841418 готівка
89
Виторг
Формат оплати
7398614 готівка
Продовження таблиці 6
Вид продукції
Побутова хімія
Сантехніка
Молочна
Електроніка
Електроніка
Кондитерська
продукція
Сантехніка
Кондитерська
продукція
Молочна
Кондитерська
продукція
Молочна
Кондитерська
продукція
Молочна
Хлібна
Електроніка
Хлібна
Хлібна
Електроніка
Сантехніка
Електроніка
Побутова хімія
Побутова хімія
Сантехніка
Побутова хімія
Електроніка
Молочна
Хлібна
Молочна
Кондитерська
продукція
Сантехніка
Електроніка
Молочна
Кондитерська
продукція
Молочна
Кондитерська
продукція
Формат
магазину
Гіпермаркет
Супермаркет
Маркетплейс
Маркетплейс
Магазин біля
будинку
Дата
17.03.2023
13.03.2023
14.03.2023
12.03.2023
Виторг
Формат оплати
19283 готівка
9224263 готівка
5996679 готівка
9334257 банківська картка
02.03.2023
3366554 банківська картка
Гіпермаркет
Супермаркет
29.03.2023
28.03.2023
7366453 банківська картка
1419535 банківська картка
Магазин біля
будинку
Гіпермаркет
27.03.2023
11.03.2023
7055461 готівка
9583923 готівка
Супермаркет
Супермаркет
Магазин біля
будинку
Гіпермаркет
Маркетплейс
Гіпермаркет
Гіпермаркет
Супермаркет
Маркетплейс
Маркетплейс
Гіпермаркет
Гіпермаркет
Маркетплейс
Магазин біля
будинку
Супермаркет
Магазин біля
будинку
Супермаркет
Супермаркет
Магазин біля
будинку
31.03.2023
22.03.2023
4880652 банківська картка
4271407 банківська картка
17.03.2023
28.03.2023
17.03.2023
15.03.2023
24.03.2023
28.03.2023
06.03.2023
30.03.2023
16.03.2023
23.03.2023
31.03.2023
2825968 готівка
9271689 банківська картка
5902764 готівка
6081884 готівка
9685171 готівка
7418177 готівка
9683553 готівка
9833058 готівка
6920542 банківська картка
7424890 банківська картка
5906085 готівка
25.03.2023
20.03.2023
1224885 готівка
8730071 банківська картка
05.03.2023
19.03.2023
23.03.2023
8602008 банківська картка
2190508 готівка
9788856 банківська картка
29.03.2023
4022931 готівка
Маркетплейс
Магазин біля
будинку
Гіпермаркет
Маркетплейс
26.03.2023
3695349 банківська картка
08.03.2023
04.03.2023
05.03.2023
9469140 готівка
1998685 готівка
4416359 банківська картка
Супермаркет
Гіпермаркет
24.03.2023
27.03.2023
1255933 готівка
6366575 готівка
Магазин біля
будинку
03.03.2023
4899914 готівка
90
Продовження таблиці 6
Вид продукції
Кондитерська
продукція
Електроніка
Електроніка
Побутова хімія
Хлібна
Електроніка
Електроніка
Молочна
Сантехніка
Хлібна
Хлібна
Сантехніка
Кондитерська
продукція
Побутова хімія
Електроніка
Молочна
Побутова хімія
Хлібна
Молочна
Кондитерська
продукція
Побутова хімія
Хлібна
Електроніка
Сантехніка
Електроніка
Побутова хімія
Електроніка
Електроніка
Хлібна
Сантехніка
Кондитерська
продукція
Молочна
Побутова хімія
Електроніка
Сантехніка
Молочна
Формат
магазину
Дата
Виторг
Формат оплати
Супермаркет
Гіпермаркет
Маркетплейс
Супермаркет
Супермаркет
Магазин біля
будинку
Магазин біля
будинку
Гіпермаркет
Маркетплейс
Гіпермаркет
Магазин біля
будинку
Гіпермаркет
18.03.2023
04.03.2023
13.03.2023
28.03.2023
29.03.2023
6200770 банківська картка
8676391 готівка
8884095 готівка
643192 банківська картка
2907660 банківська картка
01.03.2023
3236226 банківська картка
09.03.2023
04.03.2023
04.03.2023
29.03.2023
7372560 банківська картка
3107265 готівка
1195919 банківська картка
5549400 готівка
10.03.2023
26.03.2023
7896291 готівка
6931618 готівка
Супермаркет
Магазин біля
будинку
Гіпермаркет
Супермаркет
Магазин біля
будинку
Маркетплейс
Супермаркет
01.03.2023
5462221 готівка
11.03.2023
18.03.2023
10.03.2023
9600487 банківська картка
4645068 готівка
1161973 банківська картка
12.03.2023
05.03.2023
28.03.2023
4139761 банківська картка
2133590 банківська картка
539855 банківська картка
23.03.2023
04.03.2023
3221705 готівка
7693553 готівка
20.03.2023
294740 банківська картка
30.03.2023
25.03.2023
07.03.2023
11.03.2023
21.03.2023
24.03.2023
31.03.2023
15.03.2023
1237844 банківська картка
861669 банківська картка
6856185 готівка
2127895 готівка
3415217 готівка
5862728 готівка
6687302 готівка
8561865 готівка
22.03.2023
28.03.2023
17.03.2023
25.03.2023
2667405 готівка
139073 банківська картка
9173217 готівка
2302261 банківська картка
09.03.2023
21.03.2023
1856984 готівка
5627265 готівка
Магазин біля
будинку
Маркетплейс
Магазин біля
будинку
Магазин біля
будинку
Супермаркет
Супермаркет
Маркетплейс
Маркетплейс
Маркетплейс
Супермаркет
Супермаркет
Маркетплейс
Маркетплейс
Маркетплейс
Маркетплейс
Магазин біля
будинку
Супермаркет
91
Продовження таблиці 6
Вид продукції
Електроніка
Молочна
Кондитерська
продукція
Молочна
Електроніка
Кондитерська
продукція
Побутова хімія
Сантехніка
Хлібна
Сантехніка
Хлібна
Побутова хімія
Електроніка
Електроніка
Хлібна
Кондитерська
продукція
Сантехніка
Кондитерська
продукція
Електроніка
Кондитерська
продукція
Хлібна
Хлібна
Побутова хімія
Кондитерська
продукція
Молочна
Формат
магазину
Гіпермаркет
Магазин біля
будинку
Дата
07.03.2023
Виторг
Формат оплати
3619700 банківська картка
22.03.2023
1852933 готівка
Супермаркет
Гіпермаркет
Гіпермаркет
17.03.2023
09.03.2023
02.03.2023
931774 банківська картка
4394860 готівка
7106279 готівка
Гіпермаркет
Гіпермаркет
Магазин біля
будинку
Супермаркет
Супермаркет
Супермаркет
Супермаркет
Магазин біля
будинку
Магазин біля
будинку
Супермаркет
31.03.2023
27.03.2023
798576 банківська картка
3149721 банківська картка
11.03.2023
16.03.2023
15.03.2023
14.03.2023
15.03.2023
4914637 готівка
2569157 банківська картка
7510006 готівка
9594849 банківська картка
6108718 банківська картка
22.03.2023
9370981 готівка
01.03.2023
09.03.2023
7976456 банківська картка
8098299 банківська картка
Гіпермаркет
Маркетплейс
17.03.2023
01.03.2023
9935347 банківська картка
6283674 готівка
Магазин біля
будинку
Маркетплейс
14.03.2023
19.03.2023
4636369 готівка
2573407 банківська картка
Супермаркет
Маркетплейс
Супермаркет
Маркетплейс
27.03.2023
12.03.2023
12.03.2023
19.03.2023
2427187 банківська картка
6174986 готівка
9922973 банківська картка
422251 готівка
Гіпермаркет
Магазин біля
будинку
22.03.2023
24657 банківська картка
26.03.2023
8323696 банківська картка
Таким чином, ми здійснюємо етап вивчення даних, щоб зрозуміти,
наскільки адекватно підготовлений масив даних представляє досліджувану
предметну область. Тут доцільно проводитись
пошук мінімальних та максимальних значень параметрів, аналіз розподілів
значень та інших статистичних характеристик, порівняння отриманих
результатів з уявленнями про предметну область.
92
Результат аналізу даних досліджуваного масиву наведено малюнку
39.
Малюнок 39 – Результат аналізу даних масиву, що досліджується.
За результатами аналізу даних було виявлено мінімальні, максимальні
показники, показники відхилення статистичної вибірки. На малюнку 40
наведено параметри джерела даних, що досліджується.
Рисунок 40 – Параметри досліджуваного джерела даних
97
93
На
малюнку
41
наведено
результати
розрахунку
мінімальної,
максимальної, середньої сумарної виручки. Ці дані дозволять оцінити
фінансові показники підприємств бізнес-процесах і цим сприяють прийняттю
управлінських рішень.
Рисунок 41 – Результати розрахунку мінімального,
максимального, середнього, сумарного виторгу
На малюнку 42 наведено графік динаміки сумарної виручки за датами.
94
Рисунок 42 – Графік динаміки сумарної виручки за датами
На малюнку 43 наведено результат підсумовування виручки за
датами.
Рисунок 43 – Результат підсумовування виручки за
датами
95
На малюнку 44 наведено графік середньої виручки за датами. На
малюнку 45 – таблична інтерпретація результатів.
Малюнок 44 – Графік середньої виручки за датами
Рисунок 45 – Таблична інтерпретація результатів
96
На малюнку 46 наведено діаграму середньої виручки за товарними
позиціями.
Рисунок 46 – Діаграма середньої виручки за товарними позиціями
Як показано на малюнку 46, у аналізованій вибірці у зазначений період
найбільший обсяг середньої виручки відповідає продажам електроніки,
найменший – продажам хлібобулочних виробів. На малюнку 47 наведено
табличну інтерпретацію розрахунків.
Рисунок 45 – Таблична інтерпретація результатів
97
На малюнку 48 наведено діаграму сумарної виручки за товарними
позиціями.
Рисунок 48 – Діаграма сумарної виручки за товарними позиціями
Як показано на малюнку 48, у аналізованій вибірці у зазначений період
найбільший обсяг середньої виручки відповідає продажам електроніки,
найменший – продажам хлібобулочних виробів. На малюнку 49 наведено
табличну інтерпретацію розрахунків.
98
Рисунок 49 – Таблична інтерпретація результатів
На малюнку 50 наведено діаграму сумарного виторгу за форматами
магазинів.
Рисунок 50 - Діаграма сумарної виручки за форматами магазинів
99
Як показано малюнку 50, найбільший обсяг виручки посідає магазини
формату «Супермаркет», мінімальний – на маркетплейси. На малюнку 51
наведено таблицю з результатами розрахунків.
Малюнок 51 – Таблиця з результатами розрахунків
На малюнку 52 наведено діаграму середньої виручки за форматами
магазинів.
100
Рисунок 52 - Діаграма середньої виручки за форматами магазинів
За результатами розрахунків показано, що найбільша середня виручка
посідає формат «Магазин у дому», найменша – на гіпермаркети.
Малюнок 53 – Таблиця з результатами розрахунку
101
Використання систем еквайрингу – це значна стаття витрати. Тому
управлінському персоналу підприємств бізнес-процесах важливо отримати
точну інформацію необхідність впровадження цієї системи. На малюнку 54
наведено діаграму популярності форм розрахунків.
Малюнок 54 - Діаграма популярності форм розрахунків
Як показано на малюнку 55, форми розрахунків готівкою та
безготівковими коштами становлять приблизно однакові частки.
102
Малюнок 55 – Таблиця з результатами розрахунків
Малюнок 56 - Діаграма популярності форм розрахунків (кругова)
Далі проведено тест на тип розподілу вибірки (Малюнок 57).
103
Рисунок 57 – Результати тесту на ознаки нормального розподілу
Як показано на малюнку 57, гіпотеза про нормальність розподілу даних
щодо виручки відхиляється.
Далі здійснимо побудову моделей на основі структури даних. Модель
включатиме вказівку на алгоритм інтелектуального аналізу даних, його
параметри та аналізовані дані. При визначенні моделі використано різні
фільтри. Таким чином, не всі дані, що є в описі структури, будуть
використовуватися кожною створеною для неї моделлю. На малюнку 58
показано як у рамках розв'язання задачі дослідження для однієї структури
створюється кілька моделей, що використовують різні набори стовпців та
фільтрів.
Для побудови моделей найдоцільніше використовувати алгоритм
кластерного аналізу (K-means) або K-середніх із заздалегідь відомим числом
кластерів. Для зручності обрано число кластерів, що дорівнює 3. Для
візуалізації використовуємо модуль Sklearn.cluster (Python).
На малюнку 59 представлена модель «Середня виручка за товарними
позиціями».
104
Малюнок 58 – Моделі, створені в рамках розв'язання
задачі дослідження
В моделі, зображеної малюнку 59, виділено три кластери. Модель
повністю відповідає даним діаграми на малюнках 46-47, де найбільший
середній виторг належить товарній позиції
«Електроніка», трохи менша середня виручка у «Побутової техніки». На
третьому місці – категорія «Молочні продукти».
105
Малюнок 59 – Модель «Середня виручка за товарними позиціями»
На малюнку 60 представлена модель «Сумарна виручка за товарними
позиціями».
У моделі, зображеній на малюнку 60, також виділено три кластери.
Модель повністю відповідає даним діаграми на малюнках 48-49, де
найбільший сумарний виторг належить товарній позиції
106
«Електроніка», трохи менша сумарна виручка у категорії «Сантехніка».
На третьому місці – «Кондитерські вироби».
Малюнок 60 – Модель «Сумарна виручка за товарними позиціями»
На малюнку 61 представлена модель «Середня виручка за
товарами магазинів».
В моделі, зображеної малюнку 61, виділено три кластери. Модель
повністю відповідає даним діаграми на рисунках 50-51, де
107
Найбільша середня виручка за форматами магазинів належить формату
«Магазин біля дому», на другому місці – «Супермаркет». На третьому місці –
«Маркетплейс».
Малюнок 61 – Модель «Середня виручка за форматами магазинів»
На малюнку 62 представлено модель «Популярність форм
розрахунків».
Для побудови цієї моделі був використаний пакет MiniBatchKMeans.
В моделі, зображеної малюнку 62, виділено два кластери. Модель
повністю відповідає даним діаграми на малюнках 52-53, де приблизно
однакові частки у форми розрахунків банківська картка та готівка.
108
Малюнок 62 – Модель «Популярність форм розрахунків»
Висновки по розділу:
В У ході апробації результатів дослідження було проведено вивчення
статистичних даних та проведено інтелектуальний аналіз даних масивів із
продажу товарів різної номенклатури та динаміки їх фінансового стану за
період 2020-2022 рр.
Інтелектуальний аналіз даних було проведено в наступній
послідовності:
- постановка задачі;
- підготовка даних;
- вивчення даних;
- побудова моделей;
- дослідження та перевірка моделей.
Трохи раніше на етапі постановки завдання визначили мету
дослідження.
В ході підготовки даних визначили джерела даних - масиви
109
інформації для інтелектуального аналізу та визначили критерії, показники, за
якими проводили дослідження.
Потім здійснили вивчення даних, щоб зрозуміти, наскільки адекватно
підготовлений масив даних представляв досліджувану предметну область.
Здійснили пошук мінімальних та максимальних значень параметрів, аналіз
розподілів значень та інших статистичних характеристик. Після чого
збудували та перевірили моделі.
В рамках здійснення завдання щодо оптимізації асортиментної
політики провели аналіз динаміки ринку, структури попиту, фінансових
показників за товарними групами, окремими товарами. З використанням
серед
Pandas,
Matplotlib,
NumPy,
Sklearn.cluster
була
проведена
інтелектуальний аналіз, в результаті якого отримані дані,
встановлені залежності між показниками, побудовано та перевірено моделі.
Також було проведено вивчення фінансової звітності компаній, що
працюють у галузі харчового виробництва, проведено аналіз дебіторської
и кредиторську заборгованість. Причина, через яку автор вважає за доцільне
провести аналіз дебіторської та кредиторської заборгованості полягає в тому,
що ефективне управління торговим підприємством – це також питання
забезпечення прийнятного рівня фінансового ризику.
За підсумками
проведеного
аналізу керівництвом здійснюється
ухвалення управлінських рішень, на підставі яких проводиться
коригування асортиментної політики, скороченняВитрат.
Використання технологій великих даних дозволяє вивести діяльність
підприємств у бізнес-процесах на якісно новий рівень.
Таким чином, технологія аналізу та використання великих даних у
бізнес-процесах підвищує ефективність управління компаніями, дозволяє
оптимізувати асортиментну політику, знижувати витрати.
Отже, гіпотезу дослідження підтверджено та обґрунтовано.
110
Висновок
В В рамках цієї роботи проведено аналіз теоретичних та практичних
аспектів використання технологій обробки великих даних у бізнес-процесах.
Показано, що в даний час технології роботи з масивами даних та накопичення
великих обсягів інформації надає можливості проведення обробки, метою якої є
виявлення трендів, прогнозування поведінки систем, що вивчаються. Сферами
застосування технологій обробки великих даних є: завдання маркетингу,
державного управління, планування виробництва та реалізації продукції,
планування транспортної інфраструктури, будівництва соціальних об'єктів.
Використання великих даних є актуальним у багатьох галузях економічної
діяльності, а також у сфері державного управління, роботі силових структур,
політичної діяльності. Методика обробки масивів великих даних включає
технології, використання яких залежить від специфіки даних, періодичності
роботи з ними, представлених форматів. Використання технологій роботи
с Великими даними у бізнес-процесах може включати безліч напрямів,
пов'язаних з аналізом обсягів виробництва, ефективністю витрачання коштів,
що проводяться маркетингові акції. Також технології великих даних в умовах
підприємств торгівлі забезпечують оптимізацію асортиментної політики, що
зрештою підвищує ефективність діяльності підприємств.
В В рамках проведеного аналізу основних напрямів використання
систем інтелектуального аналізу великих даних у бізнес-процесах було
показано, що інструменти обробки великих масивів інформації дозволяють
виявляти наявність залежностей між параметрами, що вивчаються.
проводити розрахунки статистичних показників, оцінювати ефективність
асортиментної та бонусної політики. Таким чином, технології
111
інтелектуального аналізу дозволяють отримувати конкурентні переваги для
підприємств бізнес-процесах внаслідок можливості проведення оптимізації
технології роботи з постачальниками, клієнтами, торговими площами та
персоналом.
Вивчено методи обробки великих даних. Показано, що вибір того чи
іншого методу залежить від поставлених завдань та специфіки предметної
галузі.
В практичної частини роботи проведено вивчення статистичних даних
щодо продажу товарів різної номенклатури та динаміки їх фінансового стану
за період 2020-2022 років.
С використанням середовища Pandas була проведена статистична
обробка масиву, в результаті якої отримані зведені показники за видами
виробленої продукції, отримуваного доходу, встановлені залежності між
показниками.
Також було проведено вивчення фінансової звітності компаній, що
працюють у галузі харчового виробництва, проведено аналіз дебіторської
та кредиторської заборгованості. Ефективність витрачання державних
субсидій, зроблено висновки про наявність чи відсутність кореляції між
різними показниками.
Таким чином, використання системи статистичного оброблення
інформації
забезпечує
можливості
аналізу
діяльності
підприємств,
оптимізації структури виробництва, фінансування основної діяльності,
ефективного використання кредитних ресурсів та державних субсидій.
В практичної частини роботи виконано статичний аналіз даних із
продажу товарів різної номенклатури. Як параметри для аналізу вибрані
показали обсяги виробництва, фінансові результати,
врахування якості продукції, штатного складу підприємств. Як інструмент
статистичного аналізу обрані: угруповання, обчислення відносних величин,
графічне представлення даних, кореляція. за
112
результатами проведених обчислень визначено галузі з найкращими
показниками діяльності, а також види продукції, що виробляється з
найбільшим маржинальним доходом, проаналізовано динаміку фінансових
показників.
Таким чином, використання інструментів аналізу великих даних
в бізнес-процесах дозволяє виявляти ефективність основних напрямів
виробництва
за
видами,
виявляти
взаємозалежність
показників.
За
підсумками
проведеного аналізу керівництвом здійснюється прийняття управлінських
рішень, виходячи з яких проводиться коригування асортиментної політики,
зміна підходів до фінансування виробництв, роботи з персоналом.
Таким чином, використання технологій великих даних дозволяє
вивести діяльність підприємств у бізнес-процесах на якісно новий рівень.
113
Список використаних джерел
1.
Застосовані методи статистичного аналізу. Statistical computation
and
simulation : [AMSA'19] : процедури з міжнародного workshop, [Novosibirsk,
Russia], 18-20 September 2019 / editors: Prof. Boris Lemeshko [et al.]. Novosibirsk: Novosibirsk state technical university, 2019. – 573 с.
2.
Evans R. Clustering для classification: using standard clustering
methods to summarize datasets with minimal loss of classification accuracy [Text]
/ R. Evans. – Saarbrucken: VDM Verlag, 2018. – 108 с.
3.
Jankowski N. Comparison of instances selection algorithms i.
Algorithms survey / N. Jankowski, M. Grochowski / / International conference on
artificial intelligence and soft computing. - Springer, Berlin, Heidelberg, 2019. - 598
с.
4.
Кордова М. Додаток, що вибирається в логічній rule extraction for
regression problems / M. Kordos, S. Bialka, M. Blachnik // International
Conference on Artificial Intelligence and Soft Computing. - Springer, Berlin,
Heidelberg, 2013. 175 с.
5.
Korjakovskij I. Safer reinforcement навчання для robotics:
dissertation
/ by Ivan Koryakovskiy. – Moscow: Editus, 2018. – XII, 151 с.
6.
Аврунєв О. Є., Стасишин В. М. Бізнес-інформатика. [Текст]
навчальний посібник: / О. Є. Аврунєв, В. М. Стасишин. - Новосибірськ: Видво НДТУ, 2018. - 121с.
7.
Агаміров Л. В. Статистичні методи аналізу результатів наукових
досліджень: навчальний посібник / Л. В. Агаміров. – Київ: Вид-во МЕІ, 2018.
– 71 с.
8.
Алпайдін Е. Машинне навчання: новий штучний інтелект / Етем
Алпайдін; [Переклад з англійської: Дмитро Вібе, д.ф.м.н.]. – Київ: Фонд розвитку промисловості, 2017. – XII, 191 с.
9.
Бабієва Н. А., Раскін Л. І. Автоматизація ІТ-сервісів на
114
підприємствах. [Текст]: навчально-методичний посібник / Н. А. Бабієва, Л. І.
Раскін. - М.: Інфра-М, 2018. - 208 с.
10.
Баранчиков А. І. Управління ІТ-інфраструктурою організацій
[Текст]: підручник / А. І. Баранчиков. – Рязань: РГУ, 2019. – 219 с.
11.
Білоусов П. А., Марухіна О. В., Скоморохов А. О. Машинне
навчання та великі дані: навчальний посібник / П. А. Білоусов, О. В.
Марухіна, А. О. Скоморохов. - Санкт-Петербург: ГУАП, 2021. - 119 с.
12.
Бєляєва Т. М. Інформаційні технології в юридичній діяльності
[Текст]: підручник / Бєляєва Т. М., Кудінов А. Т., Пальянова Н.В. – Київ:
Проспект, 2018. – 349 с.
13.
Бененсон М. З., Сорокін С. А. Проектування баз даних великого
обсягу: навчальний посібник / М. З. Бененсон, С. А. Сорокін. - Київ:
МИРЕА – Російський технологічний університет, 2020. – 151 с.
14.
Безсмертний
І. А.
Інтелектуальні
системи:
підручник
та
практикум / І. А. Безсмертний, А. Б. Нугуманова, А. В. Платонов. - Київ
: Видавництво Юрайт, 2022. - 243 с.
15.
Безсмертний, І. А. Системи штучного інтелекту: навчальний
посібник для вузів / І. А. Безсмертний. - 2-ге вид., Випр. та дод. - Київ:
Видавництво Юрайт, 2022. - 157 с.
16.
Благірьов А. Big data простою мовою / Олексій Благірьов. - Київ
: АСТ: Часи, 2019. - 253с.
17.
Болдирєв А. В. Технології зберігання даних / А. В. Болдирєв. -
Ростов-на-Дону: ДДТУ, 2019. – 77 с.
18.
Борисова С. Ст, Зейн А. Н., Дурова М. А. Технології Big Data :
навчальний посібник/С. В. Борисова, А. Н. Зейн, М. А. Дурова. – Київ: Видво МЕІ, 2021. – 46 с.
19.
Боченіна М. В. Статистичні індикатори та тренди російського ринку
/ М. В. Боченіна. – Санкт-Петербург: Вид-во Санкт-Петербурзького державного
економічного університету, 2018. – 165 с.
20.
Бродовська О. В., Домбровська А. Ю. Великі дані в
115
дослідженні політичних процесів: навчальний посібник/Є. В. Бродовська, О. В.
Ю. Домбровська. - Київ : МПГУ, 2018. - 86
21.
Бурков А. Машинне навчання без зайвих слів / Андрій Бурков.
- Санкт-Петербург: Пітер, 2020. – 188 с.
22.
Вартанов А. А., Лоскутова І. В., Миронов С. Н. Основи
адміністрування програмних засобів захисту інформації: теорія та практика:
монографія / Артур Олександрович Вартанов, Інна Василівна Лоскутова,
Сергій Миколайович. – Київ: Радіотехніка, 2018. – 163 с.
23.
Вандер Плас Д. Python для складних завдань, наука про дані: і
машинне навчання / Дж. Вандер Плас. - Санкт-Петербург: Пітер, 2019. - 572с.
24.
Васильєв А. А. Теорія ймовірностей та математична статистика:
підручник та практикум / А. А. Васильєв. - 2-ге вид., Випр. та дод. - Київ:
Видавництво Юрайт, 2022. - 232 с.
25.
Васильків, А.В. Інформаційні системи та їх безпека
[Текст]: Навчальний посібник / А.В. Васильків, А.А. Васильків, І.А.
Васильків.
- М.: Форум, 2018. – 528 c.
26.
Воронцов Ю. А., Грунич Ю. А., Козинець А. В. Інноваційні
технології в IT. Нейросети: навчально-методичний посібник/Ю.А. Воронцов,
Ю.А. Грунич, А.В. Козинець. – Київ: Медіа Паблішер, 2020. – 100 с.
27.
В'югін В. В. Математичні основи машинного навчання та
прогнозування / В. В. В'югін. - Вид. 2-ге, испр. та дод. – Київ: Вид-во
МЦНМО, 2018. – 236с.
28.
Гмурман В. Є. Теорія ймовірностей та математична статистика:
підручник для вузів/В. Є. Гмурман. - 12-е вид. - Київ: Видавництво Юрайт,
2022. - 479 с.
29.
Григор'єв Ю. А., Плужнікова О. Ю. Концептуальне та логічне
проектування схеми бази даних у нотації Чена та за допомогою
CASE-засоби AllFusion Erwin Data Modeler: навчально-методичний посібник
: / Ю. А. Григор'єв, О. Ю. Плужнікова. – Київ: Супутник, 2019. – 33 с.
116
30.
Григор'єв А. А., Ісаєв Є. А., Тарасов П. А. Передача, зберігання та
обробка великих обсягів наукових даних: навчальний посібник / А. А.
Григор'єв, Є. А. Ісаєв, П. А. Тарасов. - Київ: ІНФРА-М, 2021. - 205 с.
31.
Данилова Н.В., Білявський Г. І. Аналіз даних. Машинне
навчання: навчальний посібник / Н. В. Данилова, Г. І. Белявський. - РостовнаДону: Вид-во Південного федерального університету, 2020. – 146 с.
32.
Дейтел П. Д., Дейтел Х. М. Python: штучний інтелект,
великі дані та хмарні обчислення / Пол Дейтел, Харві Дейтел. – СанктПетербург: Пітер, 2020. – 861 с.
33.
Дергачова І. В., Сар'ян А. С. Цифрові технології. Аналіз великих
даних: навчальний посібник/І. В. Дергачова, А. С. Сар'ян. - Ростовна-Дону: ФДБОУ ВО РГУПС, 2019. – 114 с.
34.
Донніков Ю.Є. Проектування баз даних: монографія/Ю.Є.
Донніков. - Київ: Юстіцінформ, 2021. - 219 с.
35.
Дудін М. Н. Соціально-економічна статистика: підручник та
практикум для вузів / М. Н. Дудін, Н. В. Лясніков, М. Л. Лезіна. - Київ
: Видавництво Юрайт, 2022. - 233 с.
36.
Дудін М. Н. Теорія статистики: підручник та практикум для вузів
/ М. Н. Дудін, Н. В. Лясніков, М. Л. Лезіна. - Київ : Видавництво Юрайт,
2022. - 148 с.
37.
Євтіхов В. Г., Євтіхова Н. В., Суворов С. В. Акселерація обробки
даних: навчально-методичний посібник / В. Г. Євтіхов, Н. В.
Євтіхов, С. В. Суворов. - Київ: Московський Політех, 2021. - 589с.
38.
Єрохін В. В., Раянова А. Р., Кафтарьова А. Б. Статистичні методи
аналізу в бізнес-інформатиці: навчальний посібник / В. В. Єрохін, А. Р.
Раянова, А. Б. Кафтарьова. - 2-ге вид., перераб. та дод. - Київ: Супутник+, 2022.
- 163 с.
39.
Єськін Д. Л., Бакулін В. М. Основи захисту інформації в
комп'ютерних системах та мережах: навчальний посібник / Д. Л. Єськін, В.
М.
Бакулін. – Волгоград: ВА МВС України, 2019. – 67 с.
117
40.
Железнов М. М. Методи та технології обробки великих
даних: навчально-методичний посібник/М.М. Железнів. МДСУ. - Київ:
Вид-во МИСИ - МДСУ, 2020. - 658с.
41.
Замятін А. В. Інтелектуальний аналіз даних: навчальний посібник
/ А. В. Замятін. – Томськ: Видавничий Дім Томського державного
університету, 2020. – 193 с.
42.
Зараменських Є. П. Менеджмент: бізнес-інформатика: підручник та
практикум / Є. П. Зараменських. - Київ: Видавництво Юрайт, 2022. - 407
с.
43.
Зімін
В.В.
Штучний
інтелект
в
інформаційній
безпеці:
навчальний посібник / В. В. Зімін. - Кемерово: Кузбасвузіздат,
2018. - 499 с.
44.
Зиков Р.В. Роман із Data Science: як монетизувати великі дані /
Зиков Роман. - Санкт-Петербург: Пітер: Прогрес книга, 2021. - 318
с.
45.
Іванов Д. Б. Розробка системи управління даними: підручник /
Іванов Д.Б. – Воронеж, 2018. – ВДУ, 2018. – 120 с.
46. Казакова, Н. А. Аналіз фінансової звітності. Консолідований бізнес:
підручник/Н. А. Казакова. - Київ: Видавництво Юрайт, 2022. - 233 с.
47.
Казанцев С.Я. Інформаційні технології: навчальний посібник /
С. Я. Казанцев. – Київ: ЮНІТІ-Дана, 2020. – 351 с.
48.
Калініна В. Н. Теорія ймовірностей та математична
статистика: підручник для вузів/В. Н. Калініна. - 2-ге вид., перероб. та дод.
- Київ: Видавництво Юрайт, 2022. - 472 с.
49.
Камалова Г. Г. Технології аналізу даних: монографія /
Камалова Гульфія Гафіятівна. – Саратов: Аміріт, 2019. – 160 с.
50.
Келлехер Д., Тірні Б. Наука про дані: базовий курс / Джон
Келлехер, Брендан Тірні. - Київ: Альпіна Паблішер, 2020. - 220 с.
51.
Кілін П. М. Статистичні методи збору та обробки даних:
118
навчальний посібник/П. М. Кілін. - Харків: ТІУ, 2017. - 126 с.
52.
Классен Р. К. Консервативні СУБД класу BigData з регулярним
планом обробки запитів на кластерній платформі / Классен Роман
Костянтинович. – Казань, 2019. – 26 с.
53.
Котова Є. Є., Плахотніков Д. П. Введення в аналітику великих
даних: навчально-методичний посібник/Є. Є. Котова, Д. П. Плахотніков. Санкт-Петербург: Вид-во СПбГЕТУ, 2021. - 47с.
54.
Кошкаров А. В. Основи аналітики великих даних: навчально-
методичний посібник/О. В. Кошкаров. – Астрахань: Сорокін Роман
Васильович, 2018. – 75 с.
55.
Кремер Н. Ш. Математична статистика: підручник та практикум
/ Н. Ш. Кремер. - Київ: Видавництво Юрайт, 2022. - 259 с.
56.
Кувайскова
Ю.
Є.,
Клячкін
В.
Н.
Статистичні
методи
прогнозування: навчальний посібник / Ю. Є. Кувайскова, В. Н. Клячкін. Ульяновськ: УлГТУ, 2019. – 197 с.
57.
Кудрявцев, В. Б. Інтелектуальні системи: підручник та практикум
для вузів / В. Б. Кудрявцев, Е. Е. Гасанов, А. С. Подколзін. - 2-ге вид., Випр.
та дод. - Київ: Видавництво Юрайт, 2022. - 165 с.
58.
Ліпіна О.І. Великі дані: прийняття рішень, етика: курс
лекцій/ред.: О.І. Ліпіна, А.А. Квітки. – Рязань: Поліспектр, 2021. – 88 с.
59.
Логачов М. С. Інформаційні системи та програмування.
Адміністратор баз даних: підручник/М.С. Логачів. – Київ: ІНФРА-М, 2020. –
438 с.
60.
Лук'янова Є. А., Шимкевич Є. М., Ляпунова Т. В. Статистичні
методи аналізу: навчальний посібник / О.О. Лук'янова, Є.М. Шимкевич, Т.В.
Ляпунова. – Київ: Російський університет дружби народів, 2020. – 116с.
61.
Макаренко С. В. Методи аналітичної обробки даних,
отриманих у результаті досліджень: навчальний посібник/С.В. Макаренка. Іркутськ: Вид-во Іркутського національного дослідницького технічного
університету, 2021. – 91с.
119
62.
Мамадалієва Л. Н., Хаконова І. М. Навчання математичним
методам обробки експериментальних даних у руслі компетентнісного
підходу: навчальний посібник / Л. Н. Мамадалієва, І. М. Хаконова. - Майкоп:
ІП Кучеренко В. О., 2018. – 100 с.
63.
Марц Н., Уоррен Д. Великі дані: принципи та практика побудови
масштабованих систем обробки даних у реальному часі /
Натан Марц, Джеймс Уоррен. – Київ: Вільямс, 2018. – 368 с.
64.
Мінаєва Ю. В. Методи статистичного та інтелектуального аналізу
даних: навчальний посібник / Ю. В. Мінаєва. – Вороніж: Воронезький
державний технічний університет, 2017. – 90 с.
65.
Миронов А.М. Машинне навчання: навчальний посібник/О.М.
Миронів. – Київ: Макс-Прес, 2018. – 21 с.
66.
Михайлов Г. А. Статистичне моделювання. Методи Монте-
Карло: навчальний посібник для вузів / Г. А. Михайлов, А. В. Войтішек. Київ: Видавництво Юрайт, 2022. - 323 с.
67.
Набережна Ж. Би., Набережна І. Би., Німгірова А.С. Кореляція
/ Ж.Б. Набережна, І.Б. Набережна, А.С. Німгірова. – Астрахань: Вид-во
Астраханського державного медичного університету, 2017. – 40 с.
68.
Назаров Д. М. Інтелектуальні системи: основи теорії нечітких
множин: навчальний посібник для вузів/Д. М. Назаров, Л. К.
Конишова. - 3-тє вид., Випр. та дод. - Київ: Видавництво Юрайт, 2022.
- 186 с.
69.
Нікіфоров С. Н. Аналіз бізнес-процесів: навчальний посібник / С.М.
Никифоров. - Санкт-Петербург: СПбДАСУ, 2017. - 76с.
70.
Основи технологій Big Data: навчальний посібник / В. В. Ухлова.
-
Воронеж: Видавничий дім ВДУ, 2020. – 80 с.
71.
Парамонов І. Ю., Смагін В. А., Косих Н. Є., Хомоненко О. Д.
Методи та моделі дослідження складних систем та обробки великих даних:
монографія / І. Ю. Парамонов, В. А. Смагін, Н. Є. Косих, А. Д. Хомоненко. Санкт-Петербург: ЛАНЬ, 2020. - 234с.
120
72.
Першина Є. Л., Чуканов С. Н. Машинне навчання [Електронний
ресурс]: монографія/Є.Л. Першина, С.М. Чуканів. - Київ: ФДБОУ ВО
"Сібаді", 2017. - 258с.
73.
Плас Д. В. Python для складних завдань: наука про дані та машинне
навчання / Дж. Вандер Плас. - Санкт-Петербург: Пітер, 2020. - 572 с.
74.
Політичний аналіз та прогнозування: підручник для вузів / за
загальною редакцією В. А. Семенова. - 2-ге вид. - Київ: Видавництво Юрайт,
2022. - 433 с.
75.
Поліщук Ю. В., Боровський А. С. Бази даних та їх безпека
: навчальний посібник/Ю. В. Поліщук, А. С. Боровський. - Київ: ІНФРА-М,
2021. – 207 с.
76.
Рожков Н. Н. Статистичні методи контролю та управління якістю
продукції: навчальний посібник для вузів / Н. Н. Рожков. - Київ:
Видавництво Юрайт, 2022. - 154 с.
77.
Рудей Г. Ф. Статистичні методи аналізу: навчальний посібник /
Г. Ф. Рудей. - Новосибірськ: Вид-во Сибірського державного університету
шляхів сполучення, 2017. - 119с.
78.
Ручкін В. Н., Костров Б. В., Свіріна А. Г. Системи штучного
інтелекту. Нейросети та нейрокомп'ютери: підручник для студентів вищих
навчальних закладів / В. Н. Ручкін, Б. В. Костров, А. Г.
Свірина. – Київ: Курс, 2018. – 282 с.
79.
Саричева Т. Ст, Іванова Д. Д., Фомічова Ю.П. Статистичні
підходи до аналізу та прогнозування розвитку цифрової економіки в
Російській Федерації та її регіонах: монографія / Саричева Тетяна
Володимирівна, Іванова Дарія Дмитрівна, Фомічова Юлія Павлівна. Йошкар-Ола: Марійський державний університет, 2020. – 158 с.
121
80.
Селеменєва Т. А., Крюкова М. С. Математичні методи обробки
експериментальних даних: навчальний посібник / Т. А. Селеменєва,
М. С. Крюкова. – Санкт-Петербург: Санкт-Петербурзький університет ДПС
МНС України, 2019. – 166с.
81.
Семеничев В. К., Кожухова В. Н., Коробецька А. А. Технології та
інструментарій аналізу великих даних [Електронний ресурс]/В.К.
Семеничев, В.М. Кожухова, А.А. Коробецька. - Самара: ФДБОУ ВО "СДЕУ",
2019. - 589с.
82.
Сенько А. Робота з BigData у хмарах: обробка та зберігання даних
з прикладами з Microsoft Azure / Олександр Сенько. - СанктПетербург: Пітер, 2019. - 445c.
83.
Скієна С. С. Наука про дані: навчальний курс / Стівен С. Скієна. -
Санкт-Петербург: Діалектика, 2020. – 543 с.
84.
Станкевич Л. А. Інтелектуальні системи та технології:
підручник та практикум / Л. А. Станкевич. - Київ: Видавництво Юрайт, 2022.
- 397 с.
85.
Токарєв В. В. Методи оптимізації: навчальний посібник для вузів
/
В. В. Токарєв. - Київ: Видавництво Юрайт, 2022. - 440 с.
86.
Уат Д., Борхані Р., Катсаггелос А. Машинне навчання: основи,
алгоритми та практика застосування / Джеремі Уатт, Реза Борхані, Аггелос
Катсаггелос; переклад з англійської Андрія Логунова. – Санкт-Петербург:
БХВ-Петербург, 2022. – 612 с.
87.
Шкурко В.Є. Статистичні дослідження у сферах підприємництва
та економічної безпеки: навчальний посібник / В.Є.
Шкірка. - Єкатеринбург: Вид-во Уральського університету, 2020. - 172с.
88.
Шолле Ф. Глибоке навчання на Python / Франсуа Шолле. - Санкт-
Петербург: Пітер, 2019. – 397 с.
89.
Шорохова І. С., Марієв О. С., Кисляк Н. В. Статистичний аналіз
економічних даних: навчальний посібник / І. С. Шорохова, О. С.
122
Марієв, Н. В. Кисляк. - Єкатеринбург: Вид-во Уральського університету, 2021.
- 338 с.
90.
Ин А., Су К. Теоретичний мінімум по Big Data: все, що потрібно
знати про великі дані / Анналін Ин, Кеннет Су. - Санкт-Петербург: Пітер,
2020. – 205 с.
91.
Яковлєв, В. Б. Статистика: навчальний посібник для вузів / В. Б.
Яковлєв. - 2-ге вид., Випр. та дод. - Київ: Видавництво Юрайт, 2022. 353 с.
92.
Ямпільська, Д. О. Маркетинговий аналіз: технологія та методи
проведення: підручник та практикум для вузів / Д. О. Ямпільська, А. І.
Пилипенка. - Київ: Видавництво Юрайт, 2022. - 268 с.
123
Скачать