ВИПУСКНА КВАЛІФІКАЦІЙНА РОБОТА (МАГІСТЕРСЬКА ДИСЕРТАЦІЯ) на тему «ДОСЛІДЖЕННЯ МЕТОДІВ ОПТИМІЗАЦІЇ БІЗНЕС-ПРОЦЕСІВ, РЕАЛІЗОВАНИХ ЗАСОБАМИ МАШИННОГО НАВЧАННЯ ТА НЕЙРОННИХ МЕРЕЖ» Хто навчається (І.О. Прізвище) (особистий підпис) Науковий керівник (вчений ступінь, звання, І.О. Прізвище) 2024 Зміст Вступ ............................................................................................................................. 3 Розділ 1 Аналіз проблематики дослідження ............................................................ 7 1.1Огляд наукових праць з тематики дослідження ............................................. 7 1.2 Загальна характеристика технологій Big Data ................................................................. 8 1.3Аналіз методів обробки великих даних ......................................................... 28 1.4Аналіз практик використання систем великих даних у бізнес-процесах …………………………………………………………………………………….35 Глава 2 Аналіз вирішення дослідницької задачі .................................................... 39 2.1Постановка завдань обробки великих даних................................................. 39 2.2Опис та обґрунтування вибору засобів автоматизації обробки великих даних ........................................................................................................ 47 Глава 3 Статистичний аналіз даних підприємств торгівлі з використанням методів обробки великих даних ................................................... 56 3.1Постановка завдань обробки великих даних................................................. 55 3.2Опис засобів автоматизації обробки великих даних .................................... 59 Розділ 4 Апробація результатів дослідження ......................................................... 62 4.1Проведення статистичної обробки масиву даних ......................................... 62 4.2 Апробація результатів статистики продажів...................................................................87 Висновок .................................................................................................................. 109 Список використаних джерел ................................................................................ 112 2 Вступ В даний час з розвитком сучасних технологій обробки великих даних та створенням програмного забезпечення, що дозволяє здійснювати їх обробку, створені можливості використання зазначених систем у плануванні діяльності компаній у бізнес-процесах. Основними проблемами у діяльності компаній, що працюють у бізнеспроцесах, є: необхідність оптимізації номенклатури товару, що реалізується, неможливість оптимального використання складських площ і часу знаходження продукції обмеженого терміну придатності, призначеної для транспортування, на складах. Також проблемним фактором є забезпечення ефективності при взаємодії з партнерами та клієнтами в частині ймовірності зриву зобов'язань щодо термінів постачання продукції, що виробляється, транспортування вантажів та проведення платежів за поставлену продукцію. Технології аналізу великих даних забезпечують можливості формування звітності, виходячи з якої видаються рекомендації щодо підвищення ефективності роботи організацій. Мета цієї роботи: Застосування технологій аналізу та використання великих даних у бізнес-процесах. Завдання роботи: аналіз джерел на тему дослідження; аналіз теоретичних аспектів використання систем машинного навчання Big Data та нейронних мереж; алгоритмів обробки інформації; аналіз областей використання великих даних у бізнес-процесах; аналіз бізнес-процесів бізнес-процесах, що передбачають використання систем величезних даних; вибір програмних рішень для автоматизації роботи компаній у бізнес-процесах з використанням технологій Big Data та нейронних мереж; 3 аналіз апаратного забезпечення, що застосовується для обробки великих даних у бізнес-процесах; формування статистичних даних (вибірки) для апробації рішення; аналіз одержаних результатів; оцінка ефективності застосування інструментарію для обробки великих даних у бізнес-процесах. Об'єкт дослідження: інтелектуальний аналіз даних з метою прийняття управлінських рішень підприємствами бізнес-процесах. Предмет дослідження: методи та моделі інтелектуального аналізу даних у завданнях управління підприємствами бізнес-процесах. Наукова новизна: можливість використання одержаних результатів за умов підприємств бізнес-процесах у статистичному аналізі даних реалізації товарів. Гіпотеза дослідження: Застосування технологій великих даних у бізнес-процесах дозволить оптимізувати асортиментну політику, знизити різного виду витрати та підвищити ефективність управління торговими підприємствами. Практична значимість: можливість використання результатів дослідження у бізнес-процесах при використанні систем обробки великих даних з метою планування реалізації товарів та підвищення ефективності управління торгових підприємств. В роботі використовуються методи:системно-інформаційний аналіз; статистична обробка великих даних, синтез, включене спостереження, математичне моделювання. Теоретична методологія дослідження: історико-логічний аналіз з упором на праці: Григор'єва А. А., Ісаєва Є. А., Тарасова П. А. «Передача, зберігання та обробка великих обсягів наукових даних», Данилової Н.В., Бєлявського Г . І. «Аналіз даних. Машинне навчання». 4 Також зарубіжні дослідження Коряковский I. «Safer reinforcement learning for robotics». Порівняльний аналіз існуючих систем, ґрунтуючись на працях Єрохіна В. В., Раянова А. Р., Кафтарьової А. Б. «Статистичні методи аналізу в бізнес-інформатиці», Железнова М. М. «Методи та технології обробки великих даних». Практична методологія дослідження -застосування інформаційних засобів та програмного забезпечення для можливості статистичної обробки даних у Pandas - Плас Д. В. «Python для складних завдань: наука про дані та машинне навчання». Передбачувані наукові результати:результати обробки великих даних дозволять оптимізувати діяльність досліджуваної підприємства у частині асортименту реалізованої продукції, зниження витрат. Апробація та впровадження результатів роботивелися протягом усього дослідження. За час проведення дослідження було опубліковано такі наукові статті: - «Обробка та інтелектуальний аналіз даних». Представлена на VIII Міжнародній молодих вчених науково-практичній «Прикладна конференції математика та (школи-семінару) інформатика: сучасні дослідження в галузі природничих та технічних наук» (20-22 квітня 2022 р., місце проведення – Харківський державний університет); - "Застосування економіко-математичних методів в аналізі дебіторської заборгованості". Представлена на IX Міжнародній науковопрактичної конференції (школи-семінару) молодих вчених «Прикладна математика та інформатика: сучасні дослідження в галузі природничих та технічних наук» (18-20 квітня 2023 р., місце проведення – Київський державний університет); - «Удосконалення методики аналізу коефіцієнта «критичної» ліквідності». Представлена на IX Міжнародній науково-практичній конференції (школи-семінару) молодих вчених «Прикладна математика та інформатика: сучасні дослідження в галузі природничих та 5 5 технічних наук» (18-20 квітня 2023 р., місце проведення – Київський державний університет); - "Підтримка прийняття управлінських інтелектуального аналізу даних Представлена ХІІІ Міжнародній на на підприємствах рішень методом бізнес-процесах". науково-практичній конференції: «Сучасний стан та перспективи розвитку науки та освіти: проблеми та рішення» (7 березня 2023р., місце проведення: Україна, місто-курорт Анапа); - «Про підтримку ухвалення управлінських рішень на підприємствах бізнес-процесах методом інтелектуального аналізу даних». Представлена на ХІІІ Міжнародній науково-практичній конференції «Сучасний стан та перспективи розвитку науки та освіти: проблеми та рішення» (7 березня 2023р., місце проведення: Україна, місто-курорт Анапа). На захист виносяться: методи та моделі інтелектуального аналізу даних для вибудовування ефективної системи управління підприємств бізнес-процесах; результати апробації пропонованого проектного рішення. Робота викладена на 116 сторінках та включає 62 малюнки, 6 таблиць, 92 джерела. 6 Розділ 1 Аналіз проблематики дослідження 1.1 Огляд наукових праць з тематики дослідження В рамках даної роботи проведено аналіз джерел у сфері використання технологій інтелектуального аналізу даних. В У роботах [1, 4, 8] проведено аналіз основних напрямів використання інтелектуальних систем на вирішення завдань статистичного аналізу. Показано, що системи обробки великих даних дозволяють виявляти основні закономірності досліджуваних параметрів, виявляти аномальні спостереження, проводити аналіз поведінки систем за зміни будь-якого з параметрів. В роботах [2, 24, 26, 30] проведено опис математичних моделей алгоритмів аналізу великих даних. Проведено огляд основних принципів угруповання даних, оптимізації розрахунків. Також розглянуто порядок виявлення характеру розподілу, виявлення залежностей та трендів. В роботах [3, 14, 15, 19] описаний інструментарій, з якого здійснюється обробка масивів великих даних. Розглянуто бібліотеки Python, MATLAB. Описано порядок роботи з бібліотеками, налаштування систем розрахунків, принципи графічного виведення інформації. В роботах [5, 11, 28, 37, 50] проведено аналіз використання систем інтелектуального аналізу великих даних у бізнес-процесах. Описано порядок обробки інформації, що включає дані з продажу продукції розрізі товарних позицій, формату торгових точок. Описано процеси аналізу ефективності маркетингових політик, розрахунки параметрів знижок, у яких спостерігається зростання прибутковості підприємства за мінімізації витрат, що з витратами проведення бонусних акцій. Також описано порядок проведення аналізу ефективності використання складських площ у частині обсягів товарних запасів та 7 термінів зберігання товару, оптимальної штатної чисельності працівників, розподілу робочого дня. В роботах [18, 21, 22, 23, 24] проведено аналіз використання систем інтелектуального аналізу великих даних у галузі транспортного обслуговування та логістики. Розглянуто основні засади планування бюджетів на транспортні витрати компаній на основі аналізу залежності показників витрати ПММ, пробігу, сервісного обслуговування транспорту. Застосування технологій та аналізу великих даних дає певні переваги при прийнятті управлінських рішень у галузі, що розглядається, дозволяє оптимізувати бізнес-процеси, ефективно використовувати наявні ресурси. 1.2 Аналіз існуючих методів та моделей інтелектуального аналізу даних у питаннях управління підприємствами бізнеспроцесах Перед тим як здійснити аналіз існуючих методів та моделей інтелектуального аналізу даних у питаннях управління підприємствами бізнес-процесах доцільно розглянути поточний стан справ у цій сфері. Оборот роздрібної торгівлі в 2022 році склав 42 трлн 512,5 млрд рублів, або 93,3% (у порівнянних цінах) до 2021 року, у грудні 2022 року - 4 трлн 201,1 млрд рублів, або 89,5% до рівня соот періоду попереднього года.[28] Згідно з даними статистики, «у 2022 році оборот роздрібної торгівлі на 95,4% формувався торгуючими організаціями та індивідуальними підприємцями, які здійснюють діяльність поза ринком, частка роздрібних ринків та ярмарків склала 4,6% (у 2021 році - 95,4% та 4, 6% 8 відповідно), у грудні 2022 року – 95,3% та 4,7% (у грудні 2021 року – 95,5% та 4,5% відповідно)». [22] За даними Росстату, «у 2022 році в структурі обороту роздрібної торгівлі частка харчових продуктів, включаючи напої, та тютюнових виробів склала 49,5%, непродовольчих товарів – 50,5% (у 2021 році – 47% та 53% відповідно), у грудні 2022 року - 50,7% та 49,3% (у грудні 2021 року - 47,5% та 52,5% відповідно). У грудні 2022 року обсяги продажів через інтернет по великих та середніх торгуючих організаціях збільшилися порівняно з листопадом 2022 року на 15% (у порівнянних цінах), з груднем 2021 року – зменшилися на 3,6%». [28] «2022 рік для російської економіки ознаменувався наявністю цілого ряду викликів, пов'язаних із загостренням світової політичної ситуації: відхід іноземних компаній з російського ринку, загальна переорієнтація із Заходу на Схід у питанні встановлення та розвитку міжнародних економічних зв'язків, пошук нових логістичних ланцюжків постачання товарів, безпрецедентні санкційні обмеження. Все це не могло не позначитися на стані ринку. Галузь електронної комерції (e-commerce), проте, продемонструвала зростання за підсумками поточного року, незважаючи на догляд великих постачальників, пов'язане з цим зниження асортименту та зниження купівельної спроможності »[22]. Зазначимо, що «розвиток ринку e-commerce та e-grocery (продовольча онлайн-торгівля) свого часу різко прискорила пандемію COVID-19. За підсумками минулого року ринок онлайн-торгівлі виріс на 45,4%, і зараз зростання триває: за останній рік зростання кількості онлайн-покупок становило понад 60%. Незважаючи на те, що деякі ніші суттєво просіли на тлі всіх кризових подій, загалом лише у першому півріччі 2022 року інтернетпродаж непродовольчих товарів в Україні збільшився на 51,5%, склавши майже 2 трлн рублів, а продовольча онлайн-торгівля зросла на 100%. Експерти 9 стверджують, що протягом кількох років обсяг ринку e-grocery в Україні збільшиться ще на третину і перевищить 15,3 трлн. рублів, що зробить продукти найважливішим драйвером онлайн-продажів. У звіті, який опублікувало Forbes, йдеться про зростання продажу продуктів в інтернеті більш ніж у п'ять разів до 2026 »[27]. «Лише в першому півріччі 2022 року вітчизняні ретейлери заробили в онлайн 301 млрд рублів, що вдвічі перевищує показники аналогічного періоду 2021 року. Передбачається зростання показника до 940 млрд рублів 2023 »[23]. На думку ряду експертів, «лідерство за обсягами онлайн-продажів в Україні зберігають за собою такі відомі маркетплейси як Wildberries та Ozon, поруч із ними стоїть Яндекс Маркет. Оборот Ozon лише за 9 місяців 2022 додав 98% рік до року і досяг 536,2 млрд рублів. Оборот Wildberries зріс майже на 100%, перевищивши 1 трлн рублів (GMV, оборот від продажів товарів та послуг з урахуванням повернень та знижок), зростання продажів у штуках становило понад 70%. Тільки в 3 кварталі 2022 року оборот компанії збільшився на 95% до 420,2 млрд рублів, що стало для неї новим рекордом. За звітний період оборот компанії (GMV з урахуванням сервісів та за вирахуванням повернень) виріс на 74% порівняно з аналогічним періодом минулого року і склав 188,1 млрд рублів. У цьому оборот маркетплейсу, т. е. продажу продавців, показали зростання більш ніж 2 разу (на 104%) до 147,1 млрд рублей[22]. Окремо варто зазначити, що за підсумками листопада 2022 року Wildberries та Ozon вперше випередили китайський майданчик AliExpress з продажу в Україні. За даними МТС, оприлюдненим у грудні 2022 року, понад 50% продажів припало на Wildberries, Ozon ж посів друге місце з часткою 29%[27]. Також варто зазначити, що в грудні 2022 року відбулася конференція для онлайн-підприємців «Tinkoff eCommerce», в рамках якої експерти обговорили не лише основні події 2022 року, що минає, а й 10 прогнози на 2023. Говорячи про ключові тенденції, насамперед, виділяється розвиток e-commerce у бік «вертикалізації» ринку та відповідної їй мультиплатформенності брендів[22]. На даний момент головну роль у вітчизняній електронній торгівлі відіграють такі великі гравці як універсальні маркетплейси. При цьому, згідно з дослідженням, 75% продавців спочатку заходять лише на один маркетплейс, включаючи два і більше майданчики вже через рік-два. Надалі очікується, по-перше, збільшення швидкості цього процесу розміщення бренду різних майданчиках (власне, перехід до мультиплатформенности бізнесу, тобто присутність бренду відразу скрізь), а по-друге, зростання кількості нішевих майданчиків для размещения[27]. В Найближчими роками можуть з'явитися понад 100 нішевих маркетплейсів як у B2C, так і у B2B-сегменті, — стверджують експерти. Окремо тут слід зазначити, що досить перспективним напрямком є створення и впровадження сучасних онлайн-систем закупівельних процедур, особливо B2B сфері. За даними компанії RAEX Аналітика, 2022 року обсяги малих закупівель зросли на 15,6%, а частка малих закупівель у загальному обсязі закупівель подвоїлася»[43]. «Мультиплатформність як тренд тісно пов'язана і з підвищенням уваги до можливостей просування на сайтах та додатках соціальних мереж. За останні роки суттєво зросла популярність Facebook Marketplace та Instagram Shopping (належать до Мета, забороненої в РФ), отже, мабуть, варто очікувати створення та розвитку подібних послуг з урахуванням вітчизняних соціальних мереж»[54]. Ще однією цікавою тенденцією e-commerce є зміна логістики. За даними дослідження Data Insight, опублікованому в листопаді 2022 року, останні три роки інтернет-магазини здійснювали самі близько 74% доставок, однак у 2022 році показник зріс ще на 12%. Відмова від послуг логістичних операторів обіцяє привести, з одного боку, 11 консолідації російського ринку логістики, з іншого — до розвитку інтернетмагазинами власних систем доставки»[46]. «Автоматизація бізнес-процесів у свою чергу пов'язана зі збільшенням ролі штучного інтелекту (ІІ) в організації підприємницької діяльності. Варто очікувати на розвиток таких форм ІІ як чат-боти, голосові помічники, рекомендації щодо продуктів, персоналізація реклами та електронної комерції в цілому, а також запровадження штучних алгоритмів, здатних, наприклад, вести документообіг або відстежувати наявність товарів на складах. У тренді перебувають і технології доповненої дійсності (AR), дозволяють створювати такі форми залучення клієнтів як віртуальні примірювальні, спеціалізовані послуги для підбору косметики, студії дизайну інтер'єрів тощо»[83]. «Прогнози експертів щодо долі електронної комерції у 2023 році можна позначити як позитивні. Очікується подальше зростання ринку, що остаточно одужав від викликів року, що минає »[77]. «Діяльність будь-якого торговельного підприємства незалежно від його сегмента та сектора складна та різноманітна. Діяльність торговельного підприємства регулюється та керується людьми». «Управління – є свідоме вплив людини на об'єкти та процеси з метою надання діяльності підприємства комерційної спрямованості та отримання певних результатов»[52]. «Управління комерційною діяльністю підприємств бізнес-процесах ставить своїм безпосереднім завданням внести певну впорядкованість у комерційні та торговельні процеси, організувати спільні дії працівників, що у цих процесах, досягти узгодженості та координації действий»[18]. «При цьому управління спрямоване на оптимізацію роботи співробітників з метою підвищення ефективності комерційних процесів та досягнення кінцевих цілей підприємства»[24]. 12 «В управлінні діяльністю торговельного підприємства є дві сторони: управляючі і управляемые»[18]. (Малюнок 1). Сторони управління діяльністю торговельного підприємства Керівники Керовані Малюнок 1 - Сторони управління діяльністю торгового предприятия[18] «Тих, хто управляє, називають суб'єктами управління (адміністратори, керівники, управляючі)»[61]. «Об'єкти управління – це ті, ким керують (працівники, колективи), і те, чим керують (економіка, торгівельна діяльність, торговельний процес). Взаємодія суб'єктів та об'єктів за допомогою керуючих впливів и зворотний зв'язок дозволяє цілеспрямовано управляти багатосторонньої діяльністю торгового предприятия»[27]. «Керуючий вплив здійснюється за допомогою використання законів, указів, планів, програм, постанов, нормативів, рекомендацій, інструкцій, матеріальних та фінансових стимулів»[46]. «Зворотні зв'язки - це результати безпосередніх спостережень та контролю з боку суб'єкта управління, статистична та поточна звітність, бухгалтерська документація» [34]. «У сучасних умовах ринку виникла потреба у розширенні управлінських завдань, розробці нових прийомів та методів управління комерційною діяльністю торгових організацій, придатних для 13 господарюючих суб'єктів різних форм власності та організаційно-правових форм »[18]. «Процес управління торговим підприємством має бути заснований на засадах ринкової економіки та методології сучасного управління. Система управління, орієнтована ринку, означає як організацію структури та взаємопов'язану сукупність задіяних процесів підприємства, а й поєднання з усіма зовнішніми факторами»[46]. «Управління комерційної діяльністю підприємств бізнес-процесах ставить своїм безпосереднім завданням забезпечити певну впорядкованість у комерційні та торгові процеси, організувати спільні дії працівників, що у цих процесах, досягти узгодженості та координації действий»[72]. «При цьому управління спрямоване на оптимізацію роботи працівників для підвищення ефективності комерційних процесів та досягнення кінцевих цілей підприємства. Комерційна діяльність спрямовано реалізацію товарів та послуг відповідно до вимог ринку»[58]. «У практичній діяльності торгових підприємств важливе значення набуває оцінка ефективності кожної торгової угоди та комерційної діяльності підприємства в цілому, що дозволяє приймати обґрунтовані управлінські рішення. У зв'язку з цим питання підвищення ефективності управління комерційною діяльністю торгових підприємств мають важливе прикладне значение»[16]. Ключовим способом підвищення ефективності завдань управління підприємствами бізнес-процесах є застосування методів інтелектуального аналізу даних [74]. Термін «інтелектуальний аналіз даних» (Data Mining) фігурував в академічних журналах ще в 1970 році, але по-справжньому популярним він став тільки в 1990-х після появи глобальної мережі 14 Інтернет[62]. Тоді торговим компаніям потрібно було аналізувати великі обсяги різноманітних даних, щоб знайти нетривіальні патерни і навчитися прогнозувати поведінку клієнтів. Звичайні моделі статистики виявилися нездатними впоратися з цим завданням »[30]. «Перші системи Data Mining призначалися для обробки даних о продажах у супермаркетах за декількома параметрами, включаючи їх обсяг по регіонах та тип продукту »[19]. Фахівець з обробки даних Григорій П'ятецький-Шапіро визначає "Data Mining" як "процес виявлення в сирих даних раніше невідомих, нетривіальних, практично корисних і доступних інтерпретації знань, необхідних для прийняття рішень у різних сферах людської діяльності" [26]. Інтелектуальний аналіз даних - це багато в чому прикладна теорія, кількість додатків якої до реальних бізнес-завдань зростає з кожним роком [84]. Затребуваність фахівців із інтелектуального аналізу даних постійно зростає, як і частка фінансування розробок у цій галузі. З'являється все більше програмних рішень для аналізу даних, в в тому числі з відкритим вихідним кодом [41]. В Нині найширше використання технологія «Data Mining» отримала бізнес-процесах[56]. «Великим торговим мережам Data Mining дозволяє аналізувати купівельні кошики, щоб покращувати рекламу, створювати запаси товарів на складах і планувати, як їх розкласти на вітринах, відкривати нові магазини та виявляти потреби різних категорій клієнтів»[54]. «Наприклад, російська мережа «Лента» проаналізувала дані карт лояльності понад 90% своїх покупців і поділила аудиторію на певні сегменти купівельної поведінки. Зокрема, рітейлер виділив сегмент купують тільки базові продукти і чоловіків, які частіше купували тільки напої та снеки. Це дозволило оптимізувати асортименти й управляти викладкою і ценами»[61]. 15 «Найбільша у світі платформа електронної комерції «Amazon» у жовтні 2021 року представила інструмент, який надасть продавцям доступом до інформації у тому, що нині шукають покупці, і цим допоможе спростити вибір товарів на продаж»[43]. Також широко відомий приклад, коли фахівці одного з супермаркетів найбільшої міжнародної мережі Wal-Mart виявили, що по п'ятницях увечері пиво часто продається разом з дитячими підгузками. Менеджери Wal-Mart вміло цим скористалися: поставивши на полиці поруч із підгузками одні з найдорожчих марок пива, вдалося досягти «геометричного зростання» його продаж»[54]. "Приклад визначення таких неочевидних зв'язків - це і є основне завдання цієї технології, вона дозволяє краще розуміти потреби покупця та його поведінку, що, безсумнівно, потрібно використовувати для досягнення фінансових цілей" [28]. Тут слід розглянути питання управління організаціями бізнес-процесах. Відомо, що утримання існуючого клієнта обходиться набагато дешевше торгової компанії, ніж залучення нового[37]. «Уявляють відмовляться від також послуг великий інтерес компанії. ті клієнти, Повернення які, клієнта ймовірно, оцінюються експертами в сотні разів перевищують вартість утримання. Тому запобігти догляду хорошого клієнта - одне з найважливіших завдань будь-якого успішного бізнесу »[68]. «Важливим аспектом у роботі відділів маркетингу та продажів підприємств бізнес-процесах є складання цілісного уявлення про клієнтів, інформація про їх особливості, характеристики, структуру клієнтської бази» [11]. «Сегментацію бази клієнтів зазвичай проводять, використовуючи правило Парето «80/20»: приблизно 80% доходів приносять 20% клієнтів, тому максимальну увагу варто приділити цим 20%. На жаль, багато 16 торгові компанії не виконує навіть цієї базової сегментації, щоб виділити найбільш прибуткових клієнтів »[19]. «Методи виявлення потреб покупців можна умовно розділити на два види: - кількісні - методи на основі аналізу даних про покупки (наприклад, чеків); - якісні - з урахуванням аналізу результатів спеціально проведених при цьому маркетингових исследований»[26]. «В обох випадках більшість російських компаній, навіть із найсильнішими аналітичними відділами, для аналізу зазвичай користуються лише стандартними статистичними методами Використовувати лише статистичні методи нераціонально, т.к. губиться безліч потрібної та корисної інформації про покупців, яку звичайні статистичні методи виявити не можуть через те, що вони для цього не призначені»[57]. «Статистичні методи переважно орієнтовані лише на узагальнення інформації, а не на її глибокий аналіз, який необхідний для уважного та всебічного вивчення клієнтів підприємств бізнес-процесах. Наявність у таких компаніях людини чи осіб, виконують роль бізнес-аналітиків, обов'язково підштовхнуть керівництво використовувати кошти Data Mining- це питання часу»[37]. «Розглянемо деякі ключові методи інтелектуального аналізу даних у бізнес-процесах: - асоціація; - класифікація; - кластеризація; - прогнозування; - дерево рішень; - спосіб комбінацій»[44]. «Асоціація (чи ставлення) є найвідомішим методом інтелектуального аналізу даних. Даний метод полягає 17 у зіставлення двох або більше елементів найчастіше одного й того самого типу. Прикладом асоціативної закономірності (асоціативного правила) служить правило, що вказує, що з події X випливає подія Y»[88]. Асоціативні правила допомагають виявляти групи товарів, які зазвичай купуються спільно. Знання цих правил дозволяє відповідним чином розміщувати товари на прилавках, стимулюючи інтенсивність їх продаж [47]. «Метод класифікації використовують при описі кількох атрибутів для ідентифікації певного класу, а також як вхідні дані для інших методів. Для визначення класифікації застосовують дерева прийняття рішень. Кожен клас має певні властивості, які характеризують його объекты»[82]. «Наочний приклад класифікації – завдання з'ясування чи прийде покупець знову до нашої торгової точки. Людина, яка проводить аналіз, при цьому оперує двома відомими їй класами - "прийде" і "не прийде". Отже, завдання класифікації - визначити якого класу ставляться ті чи інші дані. При цьому безліч класів, до одного з яких можна віднести досліджуваний об'єкт, заздалегідь відомо. Віднести покупця до тієї чи іншої групи допомагає аналіз його показників - віку, історії покупок, рівня доходу, сімейного становища»[74]. «Кластеризація дозволяє використовувати загальні атрибути різних класифікацій з метою виявлення кластерів. Досліджуючи один або більше атрибутів, можна згрупувати окремі елементи даних, разом отримуючи структурований висновок. На простому рівні при кластеризації використовується один або кілька атрибутів як основа визначення кластера подібних результатів. Кластеризація корисна при визначенні різної інформації, тому що вона корелюється з іншими прикладами, тому можна побачити, де подоби і діапазони узгоджуються між собою» [47]. 18 «Прогнозують методи використовують значення одних змінних для передбачення невідомих (цільових) значень змінних. У поєднанні коїться з іншими методами інтелектуального аналізу даних прогнозування передбачає аналіз тенденцій класифікацію зіставлення з моделлю і відносини»[73]. «Метод під назвою прогнозування добре знайомий керівникам підприємств бізнес-процесах. Так аналізуючи дані минулих періодів можна побудувати прогноз на майбутнє - причому, чим докладніше історичні дані і чим більший відрізок часу, тим точніше вийдуть результати. Цей метод застосовується для прогнозування структури збуту, що характеризується сезонними коливаннями чи потреби у кадрах. Послідовні моделі використовуються для аналізу довгострокових даних - Корисний метод виявлення тенденцій або регулярних повторень подібних подій »[6]. «Дерево рішень, пов'язане з більшістю інших методів, використовують у рамках критеріїв відбору, а також підтримки вибору певних даних у рамках загальної структури. Дерево рішень починають із простого питання, яке має дві відповіді (але можливо і більше). Кожна відповідь призводить до наступного питання, допомагаючи класифікувати. и ідентифікувати дані чи робити прогнози. Дерева рішень найчастіше використовуються із системами класифікації інформації системами прогнозування, де різні прогнози можуть ґрунтуватися на минулому історичному досвіді, який допомагає побудувати структуру дерева рішень и отримати результат»[22]. Так, у завданнях управління підприємствами бізнес-процесах потенційним інвесторам дуже важливо отримати інформацію про доцільність фінансових впливів у відкриття нових торгових об'єктів. а співробітникам торгово-закупівельних відділів важливо отримувати інформацію щодо доцільності введення в асортимент торгового об'єкту 19 нових позицій асортименту продукції. Ці та інші завдання дозволяє вирішити метод дерево рішень [66]. «Метод комбінації використовується досить рідко. Він подібний до методів класифікації та кластеризації »[9]. «Прі всіх основних методах часто має сенс записувати и згодом вивчати отриману інформацію. Для деяких методів це очевидно. Наприклад, при побудові послідовних моделей и навчанні з метою прогнозування аналізуються історичні дані з різних джерел та екземплярів інформації. В інших випадках цей процес може бути яскравіше вираженим. Дерева рішень рідко будуються один раз і ніколи не забуваються. При виявленні нової інформації подій і точок даних може знадобитися побудова додаткових гілок або навіть нових дерев. Деякі з цих процесів можна автоматизувати. Наприклад, побудова прогностичної моделі для виявлення шахрайства з кредитними картками зводиться до визначення ймовірностей, які можна використовувати для поточної транзакції з подальшим оновленням цієї моделі при додаванні нових (Підтверджених) транзакцій. Потім ця інформація реєструється так, що наступного разу рішення можна буде ухвалити швидше»[58]. «Інтелектуальний аналіз даних спирається на побудову відповідної моделі та структури, які можна використовувати для обробки виявлення та створення необхідної інформації»[9]. «Аналітичні змінні для даних отриманих з безлічі різних джерел можна скласти в єдину певну структуру (наприклад, створити клас покупців певних рівнів та вікових груп або клас помилок певного типу). Залежно від джерела даних важливо вибрати правильний спосіб побудови та перетворення цієї інформації, яким би не був метод остаточного аналізу даних »[54]. 20 Розглянемо основні алгоритми інтелектуального аналізу даних у завданнях управління підприємствами бізнес-процесах: «- Алгоритм дерева прийняття рішень; - алгоритм кластеризації; - алгоритм кластеризації послідовностей; - алгоритм лінійної регресії; - алгоритм тимчасових рядів; - алгоритм взаємозв'язків; - алгоритм нейронної мережі; - алгоритм Байєса »[22]. «Алгоритм дерева прийняття рішень є алгоритмом лінійної регресії в прогнозуванні безперервних величин і алгоритмом класифікації для використання в дискретних випадках. Для дискретних величин алгоритм здійснює прогнозування основі зв'язку між вхідними стовпцями в наборі данных»[34]. Алгоритм дерева прийняття рішень будує модель інтелектуального аналізу даних шляхом створення ряду розбиття в дереві. Ці розбиття представлені як вузли. Алгоритм додає вузол до моделі щоразу, коли з'ясовується, що вхідний стовпець має кореляцію з прогнозованим стовпцем. Спосіб, яким алгоритм визначає розбиття, відрізняється в залежності від того, чи він прогнозує безперервний стовпець або дискретний стовпець. Алгоритм прийняття рішень використовує оцінку компонентів для управління вибором найбільш корисних атрибутів. Вибір компонентів відіграє у запобіганні використання малозначних атрибутов»[44]. «Однією з найпоширеніших проблем у моделях інтелектуального аналізу даних є надмірна чутливість до невеликих відмінностей у навчальних даних. У цих випадках модель називається надмірно оснащеною або надмірно навченою. Щоб уникнути надмірного 21 Оснащення моделі в алгоритмі дерева прийняття рішень використовуються методики контролю зростання дерева »[56]. «Алгоритм кластеризації є алгоритмом розбиття множини. Він використовує ітераційні методи для угруповання об'єктів в кластери, що містять схожі характеристики. Таке угруповання корисне для перегляду даних, виявлення в них аномалій та створення прогнозів. Моделі кластеризації визначають зв'язку в наборі даних, який неможливо отримати логічно за допомогою випадкового спостереження. Алгоритм кластеризації навчає модель з урахуванням зв'язків, що у даних і основі кластерів, ідентифікованих алгоритмом»[28]. Алгоритм кластеризації спочатку визначає зв'язки в наборі даних і формує ряд кластерів на основі цих зв'язків. Точкова діаграма є гарним способом візуально уявити, як алгоритм групує дані. Після першого визначення кластерів алгоритм обчислює, як кластери представляють групування точок, та був намагається повторно створити кластери, які краще представляють исходныеданные»[19]. «Алгоритм послідовно виконує цей процес доти, доки досягне результату, поліпшити який буде неможливо. Можна налаштовувати роботу даного алгоритму, вибираючи конкретний метод об'єднання кластери, обмежуючи максимальну кількість кластерів або змінюючи розмір несучої множини, необхідний створення кластера. Після навчання моделі результати зберігаються як набору закономірностей, які можна досліджувати чи робити з їхньої основі прогнози. Передбачено можливість створювати запити, які повертають прогнози того, чи відповідають нові дані виявленим кластерам, чи надають описові статистичні дані кластерах»[48]. 22 «Алгоритм кластеризації послідовностей є алгоритмом аналізу послідовностей. Його можна використовувати вивчення даних про події, які можна пов'язати в логічну послідовність. Алгоритм знаходить найпоширеніші послідовності, виконуючи групування чи кластеризацію ідентичних послідовностей»[41]. «До алгоритмів кластеризації послідовностей можна віднести дані, які створюються, коли користувачі переглядають веб-сайт; дані, які описують порядок, у якому клієнт додає у кошик товари, обрані в Інтернетмагазині»[62]. «Алгоритм кластеризації послідовностей – це гібридний алгоритм, який використовує методи Марківських ланцюгів для визначення кластерів та їх послідовностей. Однією з особливостей алгоритму кластеризації послідовностей і те, що він використовує ряд подій чи переходів між станами в наборі даних, наприклад, ряд придбань продуктів чи послідовність переходів між сайтами конкретного користувача Интернета»[64]. «Алгоритм вивчає ймовірність переходів і вимірює різницю між усіма можливими послідовностями послідовності найкраще в наборі даних, щоб як вихідних використовувати визначити, даних які для кластеризації»[58]. «Алгоритм лінійної регресії є різновидом алгоритму дерева прийняття рішень, що допомагає розрахувати лінійний зв'язок між залежною та незалежною змінною, а потім використовувати цей зв'язок при прогнозуванні. Зв'язок набуває вигляду лінійної формули, що представляє заданий набір даних. Якщо побудувати графік, то кожній точці буде відповідати помилка, пов'язана з відстанню від лінії регресії. Коефіцієнти a і b у рівнянні регресії регулюють кут та положення лінії регресії. Можна отримувати регресивне рівняння за допомогою 23 підбору коефіцієнтів a і b до того часу, поки сума помилок, що з цими точками, стане мінімальной»[31]. Існують інші типи регресії, в яких використовується кілька змінних, а також нелінійні методи регресії. Однак лінійна регресія є корисним та широко відомим методом моделювання відповіді на зміну в якомусь базовому факторі. Лінійну регресію можна використовувати визначення зв'язку між двома безперервними стовпцями. У завданнях управління підприємствами бізнес-процесах алгоритм лінійної регресії використовують із обчислення лінії тренду даних продажів»[73]. «Алгоритм часових рядів забезпечує прогноз безперервних значень, таких як продаж продуктів у часі. На відміну від інших алгоритмів корпорації Майкрософт, таких як дерева рішень, модель тимчасових рядів не вимагає додаткових стовпців нових відомостей, щоб прогнозувати тенденцію. З допомогою моделі часових рядів можна прогнозувати тенденції з урахуванням лише вихідного набору даних, використаного до створення модели»[56]. «Прі прогнозуванні можна вводити в модель нові дані і автоматично задіяти їх під час аналізу тенденцій. Поєднання вихідних даних і прогнозованих даних називається поряд. Важливий характеристикою алгоритму тимчасових рядів є здатність виконувати перехресний прогноз. його При навчанні алгоритму двома окремими, але пов'язаними один з одним рядами можна використовувати підсумкову модель одного для прогнозування результату ряду на основі поведінки іншого ряду. Наприклад, продаж одного продукту можуть надати вплив на прогнозовані продажу іншого продукту. Перехресні прогнози також корисні при створенні загальної моделі, яку можна застосувати до кількох рядів. Наприклад, прогнози з продажу для конкретного регіону нестабільні, так як в даних хорошої якості. Загальну модель можна навчити на 24 ряду недостатньо середньому значенні кількох регіонів, та був застосувати модель до окремих рядів, щоб підготувати стабільніші прогнози кожному за региона»[48]. «Алгоритм взаємозв'язків корисний для вироблення рекомендацій покупцям щодо подальших придбань на основі тих товарів, які вони вже купили, або до яких виявили інтерес. Алгоритм взаємозв'язків корисно використовуватиме аналізу споживчого кошика. Правила, зумовлені алгоритмом, можна використовуватиме прогнозування можливих майбутніх покупок покупців з урахуванням елементів, вже у кошику покупця. Алгоритм взаємозв'язків простежує набір даних для пошуку елементів, що знаходяться в наборі одночасно. Потім алгоритм групує в набори будь-які пов'язані елементи, знайдені у кількості варіантів, не меншому за мінімальний параметр»[15]. «Алгоритм нейронної мережі поєднує кожен можливий стан вхідного атрибуту з кожним можливим станом прогнозованого атрибуту і використовує навчальні дані для обчислення ймовірностей. Далі ці ймовірності можна використовувати для класифікації чи регресії, а також для прогнозування результату прогнозованого атрибута з урахуванням вхідних атрибутов»[86]. «У моделі інтелектуального аналізу даних, що створюється за допомогою алгоритму нейронної мережі, може міститися кілька мереж, що визначається кількістю стовпців даних, які використовуються для аналізу. Алгоритм нейронної мережі корисний під час аналізу складних вхідних даних, отриманих, наприклад, у результаті торгового процесу, котрим надається значний обсяг навчальних даних, але у своїй утруднено освіту похідних правил з допомогою інших алгоритмов»[51]. «Існують такі сценарії використання алгоритму нейронної мережі: 25 - аналіз маркетингової складової торгової компанії та реклами. Наприклад, вимірювання ефективності прямої поштової розсилки або рекламної кампанії, що проводиться радіо; - прогнозування змін цін на акції, коливань валютних курсів або інших мінливих фінансових даних із даних із передісторією; - аналіз торговельних процесів; - інтелектуальний аналіз тексту; - будь-яка прогнозуюча модель, яка аналізує складні зв'язки між великою кількістю вхідних атрибутів та порівняно малою кількістю вихідних атрибутів»[7]. «Алгоритм Байєса є алгоритмом класифікації у прогнозуючому моделюванні. Цей алгоритм використовує теорему Байєса, але не враховує залежності, які можуть існувати між подіями. Цей алгоритм можна використовувати для початкового дослідження даних, а потім застосовувати результати до створення додаткових моделей інтелектуального аналізу з іншими алгоритмами, що вимагають більшої кількості обчислень і є більш точними» [11]. «Спрощений алгоритм Байєса розраховує ймовірність стану кожного вхідного стовпця за кожної можливої реалізації прогнозованого стовпця, тобто. у припущенні, що деяка ймовірна подія вже сталася. Після навчання моделі результати зберігаються як набору закономірностей, які можна досліджувати чи робити з їхньої основі прогнози. Можна створювати запити, що повертають прогнози про зв'язок нових даних із прогнозованим атрибутом, чи отримувати статистику, що описує взаємозв'язки, виявлені моделлю»[6]. Модель інтелектуального аналізу даних створюється шляхом застосування алгоритму даних. Але це більше, ніж алгоритм або контейнер метаданих: це набір даних, статистик та шаблонів, які 26 можна застосовувати до нових даних для формування прогнозів та виведення взаємозв'язків. Структура інтелектуального аналізу даних та модель інтелектуального аналізу даних є окремими об'єктами. У структурі інтелектуального аналізу даних зберігаються відомості, що визначають джерело даних. Модель інтелектуального аналізу даних містить відомості, отримані за підсумками статистичної обробки даних, наприклад, закономірності, виявлені в результаті аналізу »[18]. «Модель інтелектуального аналізу даних буде порожня доти, доки не будуть оброблені та проаналізовані дані, передані структурою інтелектуального аналізу даних. Після обробки модель інтелектуального аналізу даних містить метадані, результати та прив'язки до структури інтелектуального аналізу даних»[4]. «Наприклад, ті самі дані можна використовувати для створення декількох моделей, що використовують алгоритм кластеризації, алгоритм дерева прийняття рішень та спрощений алгоритм Байєса. У кожному з типів моделей створюються різні набори шаблонів, наборів елементів, правил і формул, які можна застосовувати під час прогнозування. Як правило, кожен з алгоритмів аналізує дані по-своєму, тому вміст одержуваної моделі також організується в різні структури. В одному з типів моделей дані та шаблони можуть групуватися в кластери; в моделі іншого типу дані можуть бути впорядковані за допомогою дерев, гілок та правил, що розділяють та визначають дані »[37]. «Модель також залежить від даних, на яких проводилося навчання: навіть ті моделі, навчання яких проводилося на основі однієї і тієї ж структури інтелектуального аналізу даних можуть видавати різні результати, якщо під час аналізу фільтрація даних виконувалася порізному або використовувалися різні початкові значення. Однак фактичні дані не зберігаються у зведеній статистиці, доступній тільки для моделі, зберігаються з фактичними даними, що знаходяться в 27 структуру інтелектуального аналізу даних Якщо під час навчання моделі було створено фільтри даних, то визначення фільтрів також зберігаються у об'єкті модели»[25]. «Щоб створити модель інтелектуального аналізу даних, необхідно виконати такі дії: - створити базову структуру інтелектуального аналізу даних та увімкніть до неї стовпці даних, які можуть знадобитися; - виберіть алгоритм, який найкраще підходить для аналітичного завдання; - вибрати стовпці з структури для використання в моделі і вказати, як їх слід використовувати, в якому стовпці міститься результат, який потрібно спрогнозувати, які стовпці призначені лише для введення та ін; - встановити додаткові параметри для тонкого налаштування обробки, що проводиться алгоритмом; - заповніть модель даними, виконавши обробку структури та моделі»[31]. Таким чином, «інтелектуальний аналіз даних є процес виявлення придатних для використання відомостей у великих наборах даних. В інтелектуальному аналізі даних застосовується математичний аналіз виявлення закономірностей і тенденцій, що у даних. Зазвичай такі закономірності важко знайти, оскільки зв'язки дуже складні. Моделі інтелектуального аналізу даних можна також створювати програмним чином за допомогою об'єктів AMO або XML для аналітики, а також клієнта інтелектуального аналізу даних для Excel та інших клієнтів. Нині інтелектуальний аналіз даних є найважливішим елементом на формування високого рівня конкурентоспроможності підприємств сфери торговли»[8]. 28 1.3 Аналіз методів обробки великих даних «У діяльності сучасних компаній виникає безліч завдань, пов'язаних із необхідністю обробки великих масивів інформації з метою отримання необхідної аналітичної інформації в різних напрямках діяльності»[17]. "Однією з основних проблем в аналітичній роботі є велика кількість розрізнених механізмів, що забезпечують можливості виявлення закономірностей, що пов'язано з необхідністю аналізу множини факторів, що фігурують у рамках здійснення основної діяльності" [6]. «Обробка даних масивів інформації зважаючи на їх великий обсяг передбачає необхідність використання апарату Big Data, систем штучного інтелекту, дозволяють виявляти закономірності в параметрах попиту певні види продукції і на залежність обсягів продажу від застосування різних маркетингових політик»[23]. «Технології великих даних забезпечують можливості обробки повної інформації про досліджувані об'єкти. Наприклад, у разі компаній бізнеспроцесах, об'єктом аналізу можуть бути обсяги вантажів, що перевозяться, статистика видів замовлень, їх вартості, історії розрахунків, що проводяться, наявність прецедентів, пов'язаних з порушеннями контрактних зобов'язань. Маючи необхідними технологіями, отримані відомості можна використовувати у різних цілях - задля реалізації політики взаємодії з клієнтами, під час виборів постачальників з інформації, що є з кількох контрагентам, розробки рекламних компаний»[44]. Таким чином, «використання систем Big data забезпечує можливості: сегментації контрагентів, забезпечення ефективності взаємодії з ними, візуалізації даних зі статистики розрахунків, 29 розробки та тестування партнерських програм, складання прогнозів щодо очікуваних обсягів виробництва»[36]. На малюнку 2 наведено діаграму методів обробки великих даних. Методи обробки великих даних включають [21]: Краудсорсинг – залучення до вирішення будь-якої проблеми великої групи людей. Технологія передбачає проведення перегляду великих масивів інформації обраною групою людей, які в ручному режимі здійснюють вибір даних за певною ознакою. Краудсорсинг Методи обробки Змішання та інтеграція даних Нейронні мережі Статистичний аналіз Імітаційне моделювання великих даних Регресійний аналіз Малюнок 2 – Методи обробки великих даних [21] Далі проведено опис алгоритму обробки великих даних із використанням зазначеної методології. Ця технологія передбачає можливості приведення великих масивів інформації до виду, придатного обробки, що передбачає виявлення помилок у записах та його виправлення, видалення даних, ідентифікація яких неможлива. Оброблені масиви забезпечують можливості проведення подальшої 30 обробки із використанням стандартних систем автоматизації. Недоліком даного алгоритму є його висока вартість, оскільки його проведення потрібно залучення співробітників, і навіть низьку швидкість обробки даних, і ймовірність помилок, що з впливом людського чинника [14]. Ця операція можлива, коли операція приведення даних до виду, доступного для обробки у зазначеній предметній області, є одиничною. Коли потік оброблюваних даних є безперервним і вимагає постійного виконання зазначених операцій, ефективно використовувати системи машинного навчання, у яких штучний інтелект дозволяє проводити обробку записів у потоці інформації [42]. Використання систем краудсорсингу у бізнес-процесах забезпечує можливість розробки правил віднесення даних у масиві до різних категорій у частині, наприклад, розпізнавання виду харчової продукції з фото, віднесення якісних ознак до заданого сорту. Прикладом використання цього методу є робота компанії «Русагро», в якій використовується обладнання сортування продукції, що використовує систему розпізнавання, налаштування якої проведено через метод краудсорсингу [51]. Системи змішування та інтеграції даних. Обробка систем великих даних найчастіше передбачає необхідність отримання потоків структурованої інформації у різних форматах із різних джерел. В даному випадку щодо аналізу необхідно приведення різнорідної інформації до єдиного формату. Операція змішування та інтеграції передбачає виконання операцій, що включають [46]: налаштування єдиної структури інформації, яку передбачається обробляти у межах розв'язання завдань, що з використанням великих даних; 31 злиттязаписівчерез пошук додатковихвідомостей, відповідних об'єкту у таблицях, отриманих з альтернативних джерел; видалення даних, що не є об'єктом для аналізу та не мають відношення до предметної області, або даних, ідентифікація яких неможлива, або належність якої однозначно встановити неможливо. Інтеграція даних проводиться в інформаційних системах, де різні підрозділи підприємств здійснюють обробку інформації з суміжних питань (наприклад, інтеграція може проводитись при роботі з даними, отриманими від відділів маркетингу, продажу, розрахунків з постачальниками, касовою інформацією, даними, отриманими із систем банківського документообігу .). Також інтеграція даних буває актуальною при реорганізації в державних структурах або змінах в системах роботи з інформацією (наприклад, при необхідності аналізу прав громадян на отримання субсидій від органів соцзахисту необхідно отримання даних з ПФР з використанням ідентифікатора, яким є СНІЛС. Для інтеграції цей реквізит вводиться в картки пільгоодержувачів у картотеках соціального захисту, після чого стає можливим проводити інтеграцію даних із цих державних структур) [10]. Технологія проведення злиття інформації включає етапи [33]: приведення до єдиного формату; встановлення зв'язків між ідентифікуючими атрибутами; вибір параметрів, якими проводиться злиття; видалення сторонніх записів; отримання підсумкового файлу. 32 Файли, наведені до єдиного формату, дають можливість аналізу за вибраними показниками, попередньо перевіривши коректність завантаження) [52]. На малюнку 3 наведено схему алгоритму змішування та інтеграції даних. Технології змішування та інтеграції даних при їх використанні у технології бізнес-процесах використовуються при інтеграції даних про випуск продукції, що надходять від виробничого відділу та відділу збуту, що дозволяє відстежувати технологічний ланцюжок від виробництва до реалізації. Прикладом впровадження цієї технології є робота компанії «Міраторг» у технологічному ланцюжку обліку виробництва та збуту продукції. Корпоративне Джерела Mining Рисунок 3 – Схема алгоритму змішування та інтеграції даних (складено автором) 33 Далі проведено опис алгоритмів обробки великих даних методом машинного навчання та з використанням нейронних мереж [30]. Системи дозволяють машинного навчання комп'ютерним припускають системам побудову проводити правил, класифікацію і систематизацію інформації з урахуванням результатів, отриманих під час навчання системи з урахуванням аналізу потоків даних. Порядок обробки даних через систему машинного навчання передбачає отримання вхідного потоку даних, за результатами обробки якого система видає результат внесення вхідних даних до заданої категорії. Вирішення зазначених завдань можливе при попередньому проведенні навчання системи (завдання правил, відповідно до яких передбачається класифікація об'єкта). В у разі використання цієї технології в системах бізнес-процесах проводиться аналіз якісних характеристик реалізованого товару при віднесенні їх до певного виду, сорту, ознак розрахунку вартості. Стадії налаштування правил включають [40]: налаштування нейронів, що дозволяють проводити розпізнавання вхідних даних та визначати зв'язки між заданими ознаками; аналіз тестової вибірки; перевірку функціональності системи та, при необхідності, виправлення правил. Після навчання та тестування система може використовуватися під час роботи з масивами великих даних. На малюнку 4 наведено структуру типової нейромережі. 34 Вихідний шар Вхідний шар Приховані шари Малюнок 4 – Структура типової нейромережі (складено автором) Як показано малюнку 4, порядок обробки інформації включає: подачу даних вхід, обробку інформації у вигляді роботи з правилами, видачу оброблених даних. Використання нейромереж ефективно за необхідності проведення сортування масивів, підтримки прийняття рішень в умовах невизначеності. 1.4 Аналіз практик використання систем великих даних у бізнес-процесах Типовими завданнями для нейромереж є: обробка зображень, виявлення ознак активності зловмисників, шкідливих систем 35 системах інформаційної безпеки, ознак шахрайських процесів у банківських інформаційних системах [17]. Технології передиктивної аналітики під час обробки великих даних. Дані системи використовуються для вирішення задач прогнозування накази системи на основі масивів даних, отриманих у динаміці. Завдання цього типу припускають виявлення кореляції між різними параметрами потоку даних, з урахуванням будуються характеристики залежностей, дозволяють обчислювати ймовірності поведінки системи у перспективі. Використання даних систем дозволяє розраховувати прогнозні обсяги клієнтської базі, попиту продукцію певного виду, аналізувати поведінка системи за різних параметрах кредитування, активності конкурентів. Отримані результати дають змогу своєчасно приймати необхідні рішення, коригувати політику компанії, що забезпечує захист від негативних наслідків у майбутньому. Ефективність даного методу обробки великих даних пов'язана з відсутністю факторів форс-мажору, відсутністю явної залежності об'єкта, що моделюється, від людського фактора, без яких побудовані прогнози є достовірними [9]. Прикладами сфер використання систем предиктивної аналітики є [11]: у разі бізнес-процесах: планування виробництва; результати рекламних акцій; отримання даних щодо параметрів транспортного обслуговування компаній; виявлення ознак ймовірності невиконання зобов'язань партнерами; динаміка прибутковості та ефективності діяльності організацій. 36 Прикладом впровадження системи на підприємствах торгівлі є діяльність компанії «Мираторг» у частині аналізу збуту продукції та планування її в різних клієнтських сегментах. Область використання систем великих даних також включає роботу систем розумного будинку та розумного виробництва, систем охорони, диспетчеризації. В В рамках проведення навчання система проводить збір інформації про штатні та позаштатні режими роботи технічних систем, дозволяють виявляти ознаки несправностей та визначати порядок їх усунення [22]. Далі здійснено опис методів імітаційного моделювання як методу обробки великих даних. Специфіка завдань зазначеного типу пов'язані з виявленням залежностей параметрів системи за зміни зовнішніх чинників. Використання моделі для цієї мети дозволяє без значних фінансових витрат провести аналіз поведінки системи, отримати дані за досліджуваними характеристиками. В у бізнес-процесах імітаційні методи можуть використовуватися при розрахунку параметрів очікуваного ефекту від продукції певного виду в заданих обсягах (модельованою системою є стан ринку збуту). Існує досвід впровадження імітаційних методів у діяльності ТОВ «КДВ Груп» щодо розрахунку планових показників реалізації товару. Приклади імітаційних моделей [6]: аналіз параметрів отримання прибутковості банків при зміні ставок за кредитами та депозитами; аналіз динаміки заборгованості з оплати послуг ЖКГ при зміні тарифів; аналіз демографічної динаміки за зміни параметрів соціальних програм; 37 аналіз стану ринку праці залежно кількості місць у навчальних закладах. З даних, отриманих в імітаційних моделях, проводиться прийняття управлінських рішень, дозволяють вирішувати поставлені завдання у сфері економіки, управління, соціальної сфери. В на відміну від моделі, розглянутої вище, під час роботи з імітаційними моделями, робота здійснюється не з даними, отриманими з реальної системи, а зі згенерованими, що впливає на точність результатів. При цьому отримання реальних даних не завжди можливе через об'єктивні обставини. Далі проведемо огляд методів статистичного аналізу під час обробки масивів великих даних. Статистичний апарат при проведенні аналізу великих даних включає обробку, що передбачає операції з [13]: динаміці показників в абсолютному та відносному виразах; одержання статистичних характеристик вибірки; аналіз середніх значень різних видів; аналіз розподілу за вибіркою та ін. Використання статистичного аналізу у бізнес-процесах ефективно при розрахунку показників обсягів продажу товарів та виручки в динаміці, складанні аналітичної звітності як засіб підтримки ухвалення управлінських рішень. Використання алгоритмів статистичного аналізу притаманно більшості підприємств бізнес-процесах у службах економічного профілю, роботи з постачальниками та клієнтами. У статистичному апараті проводиться вивчення масових соціально- економічних явищ, кожне з яких може виражатися через різні кількісні показники за обраними ознаками, які можуть включати рівень цін, оплати праці, податків, виручки та ін. Висновки у розділі 1 38 В В рамках проведеного аналізу основних напрямів використання систем інтелектуального аналізу великих даних у бізнес-процесах було показано, що інструменти обробки великих масивів інформації дозволяють виявляти наявність залежностей між параметрами, що вивчаються. проводити розрахунки статистичних показників, оцінювати ефективність асортиментної та бонусної політики. Таким чином, у рамках першого першого розділу здійснено огляд наукових праць на тему дослідження, розглянуто загальну характеристику технологій інтелектуального аналізу даних, проаналізовано методи обробки великих використання систем великих даних у бізнес-процесах. 39 даних та практик Глава 2 Аналіз вирішення дослідницької задачі 2.1 Постановка завдань обробки великих даних Дані - це уявлення багаторазової інтерпретації уявленняінформаціїу формалізованому вигляді, придатному дляпередачі,зв'язкучи обробки [11]. Таблиця 1 - Характеристика 7V даних Характеристика 7V даних Характеристика «Об'єм (Volume) Швидкість (Velocity) Різноманітність (Variety) «Візуалізація (Visualization) Мінливість (Volatility) Цінність (Value) Достовірність (Veracity) Опис До 2025 року світовий обсяг цифрових даних, за прогнозом компанії IDC, зросте до 175 зеттабайт (40 зеттабайт у 2021 році) року). Більшість цих даних буде постійно змінюватись у реальному часі. Колишніх інструментів вже недостатньо. Для обробки потрібні інші підходи та дії. Під швидкістю розуміється як сама швидкість приросту даних, так і необхідність високошвидкісної обробки та одержання результатів. Обробка широкого спектру джерел, типів та якості інформації: зображення, відео- та аудіозаписи, текстові файли та бази даних. Цю інформацію спочатку обробляють і потім аналізуют»[2]. Складання багатовимірних діаграм та графіків для наочного використання Значення даних може змінюватись. Наприклад, смислова навантаження перекладного тексту в залежності від обставин Прийняття вірного рішення на основі даних та отримання з цього прибутку чи цінне знання про клієнтів. Тільки на основі достовірних даних виходить вірний результат, що використовується прийняття рішень»[7]. Дані, якими можна оперувати Data Mining, можна розділити на сім категорій (Таблиця 2). Виділяють сім характеристик даних, які показують як обсяг, а й інші категорії, важливі обробки і аналізу. 40 Список називають 7V по першим буквам характеристик [7]. Характеристики та опис до них наведено у таблиці 1. Таблиця 2 – Категорії даних Data Mining Категорії даних Data Mining Найменування категорії «Структуровані Неструктуровані Графові природною мовою Аудіо, відео, зображення Машинні Поточні Опис Залежать від моделі даних і зберігаються в фіксованих полях усередині записів Важко підігнати під конкретну модель, залежать від контексту або носять змінний характер Такі структури даних призначені для відображення відносин між об'єктами, їх взаємозв'язків та впливу Структуровані текстові дані. Для відпрацювання потрібне знання лінгвістики та спеціальних технологій Дані цих форматів найбільш звичні користувачам. Їх легко розуміти, але для комп'ютера їх обробка все ще – складне завдання Дані, що генеруються різними датчиками Можуть приймати майже будь-яку з перерахованих у таблиці форм, але надходять у систему при виникненні подій, а не завантажуються в сховище окремими масивами»[8]. В рамках даної роботи проведено вирішення завдань з обробки масивів великих даних у динаміці 2020-2022 рр., що включають: статистику реалізації товару торговими компаніями у розрізі видів товарних позицій, форматів магазинів, способів розрахунків; отримання виручки від продукції; витратами зберігання продукції; штатної чисельності підприємств; показники продажу імпортної продукції; одержанням прибутковості від діяльності, пов'язаної з реалізацією товарів; 41 податковими перерахуваннями, пов'язаними із веденням продажу товарів; одержанням субсидій на ведення продажем товарів; дані щодо заборгованості за кредитами. Отримана інформація дозволяє виявляти структуру реалізації товару, прибутковість від товарів окремих видів, ефективність проведеної маркетингової політики. Також статистичний аналіз великих даних статистики виробництва та реалізації харчової продукції забезпечує можливості аналізу фонду заробітної плати у галузі, проведення розрахунку податкової бази, зайнятості фахівців, динаміки доходів та витрат, виявляти збиткові компанії у динаміці. В бізнес-процесах нерідко доводиться зіштовхуватися з кількісними даними, які можна зібрати і впорядкувати, тобто. структурувати. Але більшість інформації представлена документами, листами, відео та інших. тобто. у неструктурованому вигляді. У роботі нам знадобиться вибирати відповідні інструменти та методи зберігання, обробки та аналізу таких даних. «Для аналізу обраної сукупності за показниками, що варіюють (кількісно змінюються), у статистиці використовуються середні величини» [49]. «Середні величини являють собою узагальнюючу кількісну характеристику сукупності однорідних явищ у розрізі однієї ознаки, що змінюється. У економічній практиці використовується широке коло показників, обчислених як середніх величин»[46]. «Прикладом узагальнюючих показників доходів працівників може бути значення середнього доходу одного працівника, що визначається через відношення фонду заробітної плати та виплат соціального характеру за аналізований проміжок часу (у річному, квартальному, місячному) 42 виразі) до кількості співробітників. Для співробітників із порівнянним рівнем доходів можна проводити розрахунок структури витрат на певні потреби. Аналогічно можна проводити аналіз робочого часу, продуктивність праці тощо». [17]. «Однією з найважливіших властивостей середніх величин є те, що з їх використанням можлива інтерпретація обраного показника через єдиний показник, незважаючи на кількісні відмінності його в окремих одиниць у вибірці, і дозволяє висловлювати те загальне, що притаманне всім одиницям аналізованої сукупності. Отже, через характеристику одиниці сукупності середня величина характеризує всю сукупність загалом»[53]. С Використанням середніх величин за допомогою математичного апарату закону великих чисел можливе виявлення основних тенденцій розвитку, встановлення закономірностей, аналіз точності побудованих моделей. «З використанням середніх величин можливе порівняння показників, що належать до сукупностей із різною кількістю одиниць. Найважливішою умовою наукового використання середніх величин у статистичному аналізі суспільних явищ є однорідність сукупності, на яку проводиться обчислення середніх»[74]. «У рамках проведення статистичного аналізу виділяються такі види середніх величин: 1. Використовують вагові коефіцієнти: а) незважені середні величини; б) виважені середні величини. 2. За формулами обчислення: а) середні арифметичні величини; б) середні гармонійні величини; в) середні геометричні величини; г) середні квадратичні, кубічні та ін величини. 43 3. За технологією обробки вибірки: а) групові середні величини; б) загальні середні величини»[14]. «Відмінність середніх величин пов'язана зі специфікою обліку характеристик, що впливають на величини, що впливають на середні величини: Коли середні величини розраховуються для ознаки, не враховуючи впливу нього будь-яких інших характеристик, такі середні величини називаються середніми незваженими чи простими середніми. За наявності даних про наявність впливу на середню величину деякої кількості факторів, які необхідно враховувати при розрахунку для коректного розрахунку середньої величини, проводиться розрахунок середньої виваженої »[2]. «За формою розрахунку виділяється кілька типів середніх величин, утворених з єдиної статечної середньої величини, що обчислюється за формулою: (1) ; k – значення показника ступеня середнього; x - поточне значення (варіант) ознаки; i -І-тий елемент сукупності; n – кількість проведених спостережень (кількість одиниць у вибірковій сукупності)» [37]. p align="justify"> Для різних показників ступеня k визначається тип обчислених типів середніх величин, опис яких наведено в таблиці 3. Алгоритм розрахунку середнього значення включає показники [20]: Аналіз вихідного співвідношення для аналізованої характеристики. Оцінка даних для розрахунку вихідного співвідношення. 44 Проведення розрахунку середньої величини. «Разом з розрахунком середньої арифметичної, у статистиці застосовується середня гармонійна величина, обернена до середньої арифметичної зі зворотних значень ознаки. Як і середня арифметична, вона може бути простою та зваженою. Використовується вона у випадках, коли необхідні вагові коефіцієнти (fi) у вихідних даних не задані безпосередньо, а входять як співмножники в одні з наявних показників »[18]. Таблиця 3 - Типи обчислюваних типів середніх величин залежно від ступеня Ступінь обчислюваної Найменування обчисленої середньої середньої величини (k) -1 Середнє гармонійне 0 Середнє геометричне 1 Середнє арифметичне 2 Середнє квадратичне 3 Середнє кубічне «Медіана — це чисельне значення ознаки в тієї одиниці сукупності, що у середині ранжированного низки (побудованого гаразд зростання, чи зменшення значення досліджуваного ознаки). Медіана є серединною варіантом, т.к. вона поділяє сукупність на дві однакові частини»[71]. Наприклад, в економіці використовується параметр медіанної заробітної плати, що характеризує реальний розмір оплати праці в організації (дозволяючи не враховувати верхній сегмент із високими показниками заробітної плати) [15]. Підвищення точності рівня статистичних вимірів забезпечується через зростання обсягу аналізованої вибірки. Таким чином, статистична обробка великих даних дає змогу отримувати результати з високим рівнем достовірності [26]. 45 2.2 Опис та обґрунтування вибору засобів автоматизації обробки великих даних «OLAP (Online Analytical Processing) – це система аналітичної обробки даних. Вона призначена для підготовки звітності, побудови прогностичних сценаріїв та виконання статистичнихvрозрахунків з урахуванням великих інформаційних масивів, які мають складної структурой»[34]. «Компонентами OLAP є: база даних (БД) - джерело, з якого здійснюється завантаження даних щодо обробки. Формат бази даних визначається різновидом OLAP системи та порядком виконання дій OLAP сервера. Найчастіше користуються реляційними та багатовимірними БД та сховищами даних; OLAP сервер - ядро системи, за допомогою якого проводиться обробка багатовимірних структур даних, та забезпечується зв'язок між БД користувачами систем; програми для роботи користувачів, у яких формуються запити та візуалізуються отримані відповіді. Специфіка обробки даних OLAP системами полягає у побудові багатовимірних, тобто мають багато зв'язків між окремими елементами, масивів інформації»[55]. «Для формування таких масивів OLAP система збирає дані з різних джерел (наприклад, зі сховищ даних, інформаційних систем управління підприємством (ERP) або системи взаємодії з клієнтами (CRM)). Після цього інформація обробляється на сервері OLAP и передається в користувацькі додатки »[18]. бюджетування, побудови прогностичних моделей, підготовки фінансової звітності, зберігання результатів »[26]. 46 Як платформа для аналізу даних обрана мова програмування Python, можливості якого дозволяють створювати віконні, мобільні програми, Webпрограми. Також інструментарій цієї платформи дозволяє вирішувати завдання, пов'язані з аналізом даних. Python має багато корисних бібліотек, таких як Matplotlib, Pandas, NumPy [15]. В якості платформи-інтерпретатора вибрано платформу Google Colab. Ця платформа забезпечує можливості колективної роботи з інформаційними ресурсами різних форматів, включаючи можливості розробки програм на мові Python. Одним з найбільш поширених напрямків використання зазначеного середовища є робота з великими даними, що включає обробку масивів інформації, їх групування, статистичну обробку, можливості прогнозування, вивчення параметрів вибірок і розподілів. «Для використання середовища Python як інструмент аналізу даних необхідно використання спеціалізованих бібліотек, у можливості яких входять інструменти статистики, графічні сервіси и інші технології, дозволяють проводити обробку информации»[31]. В В якості інструментів аналізу даних в магістерській дисертації вибрано середовище Pandas, Matplotlib, Numpy. Pandas «Ця бібліотека дозволяє працювати з технологіями аналізу даних, забезпечує високий рівень продуктивності під час обробки великих масивів інформації. Система має відкритий код, що дозволяє розробляти власні процедури обробки данных»[22]. 47 «Бібліотека Pandas використовується в різних академічних та комерційних галузях, включаючи штучний інтелект (Artificial Intelligence), фінанси, нейробіологію, економіку, статистику, рекламу, веб-аналітику та багато іншого. Розглянемо основні можливості бібліотеки: DataFrame - швидкий та ефективний інструмент для маніпулювання даними з вбудованою індексацією. Методи, які потребують високої продуктивності, написані на C або Cython. Дозволяє читати та записувати дані різних форматів: CSV (commasepareted values), таблиці Excel, бази даних SQL, ієрархічний формат HDF. Усього налічується 19 підтримуваних форматів. Зручний інструмент до роботи з відсутніми данными»[16]. «Також варто відзначити таке важливі фактори як: - просте управління безладними даними в упорядкованій формі; - гнучка зміна форм: додавання, видалення, приєднання нових або старих даних; - інтелектуальне індексування, маніпулювання та управління стовпцями та рядками; - потужний інструмент для агрегування та перетворення даних, у тому числі великого розміру (BigData); - швидке злиття та об'єднання наборів даних, наприклад, два і більше об'єктів DataFrame; - підтримка ієрархічного індексування, тобто можливість поєднання стовпців під загальною категорією (MultiIndex); - підтримка роботи з датами та часом»[28]. Matplotlib Matplotlib – основна бібліотека, що дозволяє здійснювати візуалізацію даних, обробка яких проведена в середовищі Python. 48 Підтримуються лінійний, поліноміальний формат, гістограма, 3-D моделі та інші формати візуалізації даних. Requests «Ця модель забезпечує можливості створення Web-додатків, обмінюватися даними з Web-серверами»[34]. «Функціонал бібліотеки включає: можливості роботи з HTTP-підключеннями; роботу з Cookie, що включає передачу та отримання даних у форматі ідентифікатор – найменування; робота з кодуванням даних; робота з обліковими записами користувача; підтримка файлового обміну, інші послуги, які у рамках роботи з Web-ресурсами»[27]. Numpy Numeric Python (NumPy) - це система, що використовується для розрахунків характеристик багатовимірних даних, що використовуються в додатках, де потрібна статистична обробка інформації. Вхідні дані повинні бути проіндексовані, їх розмірність може задаватися користувачем. Запис масиву в пам'ять здійснюється відповідно до заданих налаштувань і проводиться або в певному порядку, або безладно [29]. Відмінність масиву від набору даних (списку чи кортежу). Величини, що входять до масиву, є однотипними та їх число визначається в процесі ініціалізації. Елементи масиву є об'єктами, це змінні у звичайному розумінні даного терміна. Використання масивів дозволяє оптимізувати системні ресурси під час роботи з потоками даних. Дана бібліотека дозволяє проводити математичні операції з даними різних типів та обсягів. Реалізовано можливості 49 обробки масивів, обробки даних за допомогою апарату лінійної алгебри, перетворень різного виду [84]. «Аналіз даних – це комплекс математичних дисциплін, у якому проводяться побудови та дослідження універсальних математичних методів та обчислювальних алгоритмів отримання знань з експериментальних (у широкому значенні) даних»[20]. У практичній частині роботи необхідно здійснити інтелектуальний аналіз даних для вирішення завдання щодо оптимізації асортиментної політики та зниження витрат підприємств бізнес-процесах. Питання оптимізації асортиментної політики для торговельного підприємства мають особливе значення, оскільки непродумані рішення щодо асортименту сприяють рентабельності. Таким надмірному чином, накопиченню оптимізація товару, зниження асортиментної політики призводить до зниження витрат підприємств бізнес-процесах. Для вирішення цього завдання здійснимо інтелектуальний аналіз даних. У досягненні цієї мети зробимо обробку масивів слабоструктурованих даних, отриманих за даними статистики продажів за період 2020-2022 років з метою аналізу статистичних показників у сфері продажу, виявлення закономірностей та залежностей. Етапи проведення інтелектуального аналізу даних з метою вирішення поставленого завдання: - постановка задачі; - підготовка даних; - вивчення даних; - побудова моделей; - дослідження та перевірка моделей. В рамках проведення оптимізації асортиментної політики доцільно провести аналіз динаміки ринку, структури попиту, фінансових показників за товарними групами, окремими товарами. 50 В практичної частини роботи буде виконано інтелектуальний аналіз даних із продажу товарів різної номенклатури. Аналізу буде здійснюватися за трьома масивами слабоструктурованих даних, потім будуть побудовані відповідні моделі. В як інструменти інтелектуального аналізу обрані: -Угруповання; -Обчислення відносних величин; -графічне представлення даних; -кореляція; -Кластеризація. Висновки з другого розділу Таким чином, інтелектуальний аналіз даних являє собою процес виявлення придатних для використання відомостей у великих наборах даних. В інтелектуальному аналізі даних застосовується математичний аналіз виявлення закономірностей і тенденцій, що у даних. У рамках проведеного аналізу основних напрямів використання систем інтелектуального аналізу великих даних у бізнес-процесах було показано, що інструменти обробки великих масивів інформації дозволяють виявляти наявність залежностей між параметрами, що вивчаються, проводити розрахунки статистичних показників, оцінювати ефективність асортиментної та бонусної політики. Отже технології інтелектуального аналізу дозволяють отримувати конкурентні переваги для підприємств бізнес-процесах внаслідок наявності можливостей проведення оптимізації технології роботи з постачальниками, клієнтами, торговими площами та персоналом. Проведено постановку завдань, пов'язаних з розрахунком показників з продажу товарів залежно від різних показників. Проведено вибір інструментарію щодо аналізу. Також визначено критерії та показники, за якими передбачається проведення розрахунків. 51 Отже, використання системи статистичної обробки інформації забезпечує можливість аналізу діяльності підприємств, оптимізації структури виробництва, фінансування основної діяльності, ефективного використання кредитних ресурсів та державних субсидій. Як платформа для аналізу даних обрана мова програмування Python, можливості якого дозволяють створювати віконні, мобільні програми, Webпрограми. Також інструментарій цієї платформи дозволяє вирішувати завдання, пов'язані з аналізом даних. Python має багато корисних бібліотек, таких як Matplotlib, Pandas, NumPy [15]. В якості платформи-інтерпретатора обрано платформу Google Colab, оскільки ця платформа забезпечує можливості колективної роботи з інформаційними ресурсами різних форматів, включаючи можливості розробки програм на мові Python. Як інструменти аналізу даних вибрані середовища Pandas, Matplotlib, Numpy. Одним з найбільш поширених напрямків використання зазначеного середовища є робота з великими даними, що включає обробку масивів інформації, їх групування, статистичну обробку, можливості прогнозування, вивчення параметрів вибірок і розподілів. 52 Розділ 3 Статистичний аналіз даних підприємств торгівлі з використанням методів обробки великих даних 3.1 Постановка завдань обробки великих даних На етапі постановки завдання визначаємо мету - проведення інтелектуального аналізу даних для вирішення задачі щодо оптимізації асортиментної політики та зниження витрат підприємств бізнес-процесах. Як вихідні дані для аналізу взято масив великих даних у динаміці 2020-2022 рр., що включають: статистику реалізації товару торговими компаніями у розрізі видів товарних позицій, форматів магазинів, способів розрахунків; отримання виручки від продукції; витратами зберігання продукції; штатної чисельності підприємств; показники продажу імпортної продукції; одержанням прибутковості від діяльності, пов'язаної з реалізацією товарів; податковими перерахуваннями, пов'язаними із веденням продажу товарів; одержанням субсидій на ведення продажем товарів; дані щодо заборгованості за кредитами. Така структура даних для інтелектуального аналізу не випадкова. Для коректного вирішення поставленої задачі доцільно провести аналіз динаміки ринку, структури попиту, різних фінансових показників. Отримана інформація дозволяє виявляти структуру реалізації товару, прибутковість від товарів окремих видів. 53 Також інтелектуальний аналіз великих даних на основі статистики виробництва та реалізації товарів забезпечує можливості аналізу фонду заробітної плати у галузі, динаміки доходів та витрат, виявлення збиткових торгових компаній у динаміці. «Програмна реалізація систем великих даних передбачає необхідність використання спеціалізованих програмних засобів, які забезпечують можливості за підсумками обробки даних, побудова аналітичної звітності, побудови моделей стану системи підприємств при зміні певних параметрів. Отже, під час впровадження систем Big Data у компаніях бізнес-процесах необхідно провести вибір апаратних, програмних рішень, СУБД, і навіть систему налаштування шаблонів обработки»[13]. На малюнку 5 наведено BPMN-діаграма бізнес-процесу використання технологій великих даних. У роботі системи передбачається наявність сценаріїв аналітика та ІТ-фахівця. Сценарій аналітика включає роботу аналітика, до якої належить отримання та обробку масиву даних, формування звітності. Сценарій ІТ-фахівця включає налаштування скриптів обробки та шаблонів виведення даних. 54 Малюнок 5 – BPMN-діаграма бізнес-процесу використання технологій великих даних На малюнку 6 наведено діаграму варіантів використання технологій великих даних. На малюнку 7 наведено діаграму компонентів. На малюнку 8 представлено діаграму діяльності. Результати виконаної роботи дозволили зробити висновки у тому, що системи великих даних під час використання у компаніях бізнес-процесах забезпечують можливості вирішення завдань різного напрями. Результатом обробки великих даних може бути вироблення оптимальної асортиментної політики, визначення шляхів зниження витрат, визначення оптимальних постачальників і логістичних ланцюжків. 55 Рисунок 6 – Діаграма варіантів використання технологій великих даних Модуль обліку роботи з постачальниками Модуль обліку зберігання продукції Рисунок 7 – Діаграма компонентів 56 Модуль звітності Етап Рисунок 8 – Діаграма діяльності 3.2 Опис засобів автоматизації обробки великих даних «OLAP (Online Analytical Processing) – це система аналітичної обробки даних. Вона призначена для підготовки звітності, побудови прогностичних сценаріїв та виконання статистичних розрахунків на базі великих інформаційних масивів, що мають складну структуру »[34]. «Компонентами OLAP є: база даних (БД) - джерело, з якого здійснюється завантаження даних щодо обробки; 57 OLAP сервер - ядро системи, за допомогою якого проводиться обробка багатовимірних структур даних, та забезпечується зв'язок між БД и користувачами систем; програми для роботи користувачів, у яких формуються запити та візуалізуються отримані відповіді. Специфіка обробки даних OLAP системами полягає у побудові багатовимірних, тобто мають багато зв'язків між окремими елементами, масивів інформації»[55]. Архітектурно - технологічна схема OLAP представлена малюнку 9. В як платформа для аналізу даних обрана мова програмування Python, можливості якої дозволяють створювати віконні, мобільні програми, Web-програми. Також інструментарій цієї платформи дозволяє вирішувати завдання, пов'язані з аналізом даних. Python має безліч корисних бібліотек, такі як Matplotlib, Pandas, NumPy, Sklearn.cluster. В якості платформи-інтерпретатора вибрано платформу Google Colab. Ця платформа забезпечує можливості колективної роботи з інформаційними ресурсами різних форматів, включаючи можливості розробки програм на мові Python. Рисунок 9 - Архітектурно-технологічна схема LAP 58 Одним з найбільш поширених напрямків використання зазначеного середовища є робота з великими даними, що включає обробку масивів інформації, їх групування, статистичну обробку, можливості прогнозування, вивчення параметрів вибірок і розподілів. «Для використання середовища Python як інструмент аналізу даних необхідно використання спеціалізованих бібліотек, у можливості яких входять інструменти статистики, графічні сервіси и інші технології, дозволяють проводити обробку информации»[31]. В Як інструменти аналізу даних вибрані середовища Pandas, Matplotlib, Numpy, Sklearn.cluster. Висновки у розділі Проведено постановку завдань, пов'язаних з розрахунком показників з продажу товарів залежно від різних показників. Проведено вибір інструментарію щодо аналізу. Також визначено критерії та показники, за якими передбачається проведення розрахунків. 59 Розділ 4 Апробація результатів дослідження 4.1 Проведення статистичної обробки масиву даних На етапі підготовки даних визначено джерела даних для здійснення інтелектуального аналізу – масиви великих даних у динаміці 2020-2022 років. В відповідно до поставлених завдань проведено інтелектуальний аналіз масиву даних, структура якого включає: найменування підприємства, що у бізнес-процесах; дані про види товарів, що реалізуються; дані про реалізацію видів продукції за тимчасовими періодами; дані про податкові виплати; дані про реалізацію імпортної продукції; дані про якість реалізованого товару; дані про витрати на зберігання товару; дані про кількість працівників. В таблиці 4 наведено фрагмент джерела даних, поданих для аналізу. Таблиця 4 - фрагмент джерела даних, представлених для аналізу Кількість працівників Відсоток шлюбу Рік 1760382 147 10 2021 12 1912387 2905812 188 3 2020 6 2578295 1790496 2924583 61 5 2022 3 Сир 5% 9239042 2876587 600775 212 2 2022 6 Макаронні вироби 1087870 462651 659082 208 3 2022 5 Компанія ТОВ Продукти ТОВ Продукти Продукт Виторг Витрати Податки Молоко 9301184 1225232 Олія 5336586 ІП Іванов Чай ТОВ Магазин ІП Васильєв 60 Відсоток імпорту Продовження таблиці 4 Компанія Продукт Виторг Витрати Податки Кількість працівників Відсоток шлюбу Рік Відсоток імпорту ІП Семенов Чай 9367546 238297 2317842 223 10 2022 9 ТОВ Ромашка ТОВ Біля будинку ТОВ Продукти Макаронні вироби 5676465 1697983 1695799 234 4 2021 3 Білий хліб Плавлений сир 3987197 2519305 2556902 232 2 2020 1 2589544 1689138 1598052 210 9 2021 10 ІП Іванов Білий хліб 3009772 2947162 1863158 3 7 2021 20 ІП Петров Крупи 3750347 1184581 496880 134 5 2022 10 ІП Козлов Кава 9799319 860076 555102 80 7 2020 6 ТОВ Люкс ТОВ Яскравіше Білий хліб 8150273 743536 999158 200 1 2020 20 Сир 2% 2418934 1092164 1186410 295 5 2021 4 ТОВ Конвалія ТОВ Магазин ТОВ Магазин Макаронні вироби Сік яблучний Плавлений сир Сік 5666680 2428407 963746 31 8 2022 10 9008428 1960802 1433985 88 9 2020 18 8480525 2867499 28108 235 8 2020 9 персиковий 4384557 258051 1489288 103 8 2022 1 Сир 2% 6167590 910818 2400293 202 8 2022 14 Макаронні вироби 7439872 1786718 2440809 205 1 2020 1 Білий хліб Плавлений сир 1010421 212427 2836459 39 10 2021 6 1715985 1481183 2145368 48 6 2021 2 Чорний хліб 3212318 2429985 1518413 151 9 2021 3 Чай 6966487 329482 1756894 55 5 2021 19 ТОВ Люкс Олія 7496274 724786 2209979 131 6 2022 12 ІП Семенов ТОВ Ромашка Олія 2626351 2524439 1450863 56 7 2021 10 Білий хліб Плавлений сир 4422753 103536 2478473 143 8 2020 11 3270107 1657380 722463 27 4 2022 11 Кава 9573184 1383305 676259 244 4 2020 14 Крупи 3580395 60340 2243536 85 7 2020 7 Сир 2% 7384536 2577771 1363862 127 7 2020 4 Кава 6137417 1171657 2653278 105 8 2021 2 Олія 8336010 2170783 2696853 292 2 2022 10 ТОВ Біля будинку ІП Іванов ІП Козлов ТОВ Конвалія ІП Іванов ТОВ Магазин ТОВ Продуктовий ІП Петров ТОВ Магазин ТОВ Біля будинку ТОВ Ромашка ТОВ Конвалія ІП Іванов 61 Продовження таблиці 4 Компанія Продукт ІП Петров Сік яблучний ІП Іванов Чай ТОВ Продукти Макаронні вироби Плавлений сир ТОВ Магазин ІП Петров ТОВ Продуктовий Білий хліб ІП Петров ТОВ Продукти Сир 2% ТОВ Магазин ТОВ Біля будинку Сік яблучний ТОВ Конвалія Чорний хліб ТОВ Магазин Крупи ІП Семенов Кава ІП Петров ТОВ Продуктовий Сир 5% Чай Сир 2% Чорний хліб ІП Петров Олія Сік персиковий ТОВ Ромашка Сир 2% ТОВ Конвалія Чорний хліб ІП Васильєв Чорний хліб ТОВ Магазин Молоко ІП Васильєв Білий хліб Плавлений ТОВ Біля будинку ТОВ Продукти ТОВ Магазин ТОВ Конвалія ТОВ Продукти ІП Козлов сир Сир 5% Олія Плавлений сир Білий хліб Крупи Виторг а 779658 4 562301 7 Витрати Податки Кількість працівників Відсоток шлюбу Рік Відсоток імпорту 906015 2691370 291 7 2021 3 1812982 2890711 258 6 2020 3 890545 686325 40 7 2020 10 302984 1392855 204 6 2022 5 2299245 1139720 186 2 2021 10 965438 6435 100 10 2021 14 435079 2345615 29 10 2020 19 1562885 505278 210 9 2020 18 239429 935603 139 2 2021 12 200415 589821 8 409248 6 568859 1 375299 9 139277 5 324375 9 673374 5 866866 9 663296 8 412883 1 903133 6 306493 2411829 2720237 112 7 2021 7 816741 2115668 35 5 2020 18 1302972 1478500 193 7 2021 18 1017854 2022799 250 2 2020 9 2612745 410922 195 1 2022 15 959427 2347690 224 6 2020 16 2191603 1171186 53 10 2021 15 1899930 1757471 229 2 2020 7 1813167 1402211 81 9 2020 5 371920 2416094 277 2 2020 2 2485582 1294763 285 7 2021 10 441404 543381 288 1 2020 10 7 739790 4 669355 7 847000 0 405764 3 634573 9 1717145 2561814 285 5 2020 5 49272 402868 169 1 2020 18 1692798 454565 10 7 2020 16 2131736 1147653 114 10 2022 8 2289029 2487836 170 2 2022 16 641940 2786101 158 7 2021 18 826794 0 282820 5 881062 9 926738 5 234903 1 416015 3 814985 8 62 Продовження таблиці 4 Виторг Витрати Податки Кількість працівників Відсоток шлюбу Рік Відсоток імпорту 126279 1618797 1576245 20 8 2020 3 9120544 1709911 1387451 122 3 2022 2 2831347 2880683 103064 12 6 2022 11 Кава Чорний хліб 2421572 2285686 1845529 8 2 2021 12 6942285 2735996 1618437 207 7 2021 10 1490704 215154 1077543 189 10 2020 13 ТОВ Люкс Сир 2% Сік персиковий 4871382 462937 844120 130 1 2022 5 ТОВ Люкс Кава 9579138 2432811 1821673 149 4 2022 9 ІП Козлов Олія 782467 2920843 1627930 169 1 2021 5 ІП Іванов Молоко Чорний хліб 2380322 762363 2241027 199 7 2020 3 5557674 221753 1022357 285 10 2021 18 Сир 5% Чорний хліб Чорний хліб 3537861 2333358 2404176 17 10 2020 3 8157772 1844461 1813844 57 7 2022 11 2645328 1309732 1831949 112 6 2020 1 Сир 2% 3543025 126920 2386140 287 6 2021 9 ІП Козлов Олія 9521485 245060 815403 274 7 2021 20 ТОВ Люкс ТОВ Біля будинку Білий хліб 9662871 1765893 2901109 177 10 2022 17 Чай 7838071 2849537 1254897 14 1 2021 5 ТОВ Люкс Сир 2% 8086893 1735130 549649 99 4 2022 5 ІП Козлов ТОВ Продукти Кава 8797881 1070362 563562 128 2 2021 15 Кава 3550990 1261848 548455 132 4 2022 19 ТОВ Люкс Молоко Плавлений сир 8981862 856414 1729748 45 10 2020 12 6966221 798838 2237889 72 5 2021 15 Крупи 3746800 1423383 2393423 127 9 2022 14 Крупи 4034090 235096 2640143 97 3 2022 17 Кава Чорний хліб 3470881 983828 659131 162 8 2020 15 850634 1317261 750771 3 6 2021 2 Сир 5% 7816296 341355 435243 211 5 2020 11 Компанія ТОВ Продуктовий ІП Семенов Продукт Сік персиковий Чорний хліб ІП Петров Макарони е вироби ІП Петров ІП Семенов ІП Іванов ІП Козлов ТОВ Продукти ТОВ Продуктовий ТОВ Продуктовий ТОВ Продукти ІП Іванов ТОВ Продукти ТОВ Продукти ТОВ Люкс ІП Васильєв ТОВ Біля будинку 63 Продовження таблиці 4 Компанія Продукт Виторг Витрати Податки Кількість працівників Відсоток шлюбу Рік Відсоток імпорту ТОВ Продуктовий Макарони е вироби 9974455 1937270 1925490 117 2 2021 14 ТОВ Люкс ТОВ Продукти Білий хліб Сік персиковий Плавлений сир Чорний хліб 5646312 682526 895815 237 1 2022 18 1174431 195089 14485 200 1 2021 7 947720 935367 15056 293 9 2022 2 4952732 477045 1159896 194 2 2022 8 8968861 1220197 538104 182 4 2020 18 4144179 1284645 2159799 6 1 2022 1 Білий хліб Сік 8820287 2979599 1665155 98 9 2021 15 персиковий Сік яблучний 6901474 520851 1976687 226 5 2021 14 7894675 11437 2580771 226 6 2022 17 ТОВ Люкс ТОВ Біля будинку Олія 2358207 1603693 1887247 153 2 2020 9 Сир 2% 1607584 89486 1811758 176 4 2022 14 ІП Семенов 7551537 445844 185029 44 5 2020 11 ТОВ Люкс Сир 2% Сік яблучний 59664 994907 17568 194 10 2022 6 ТОВ Люкс Макарони е вироби 201612 1837329 155638 106 9 2022 19 ІП Васильєв Кава 7155346 661411 1001848 285 7 2020 3 ТОВ Ромашка Молоко Сік яблучний 7850826 186525 49265 82 1 2020 11 8748388 2119323 1952641 273 2 2022 17 Сир 5% Сік персиковий 4837527 1074468 505485 47 4 2021 13 6210813 2028372 2731384 120 10 2021 10 Сир 5% 8502495 2555124 1657150 7 1 2021 2 Кава 1334590 2688282 1400700 78 10 2021 18 ІП Козлов ТОВ Продукти Кава 5075864 702479 2659584 209 1 2022 15 Олія 2617840 1767532 597787 277 5 2020 14 ІП Іванов Білий хліб 2632355 2950791 899563 158 7 2020 2 ІП Петров Чай 7253600 1791236 2281783 177 6 2021 6 ІП Семенов ТОВ Продуктовий ІП Васильєв ІП Іванов ТОВ Люкс ТОВ Біля будинку ІП Козлов ТОВ Люкс ІП Козлов ТОВ Магазин ТОВ Біля будинку ТОВ Продуктовий Макарони е вироби Сік персиковий 64 Продовження таблиці 4 Виторг Витрати Податки Кількість працівників Відсоток шлюбу Рік Відсоток імпорту ІП Петров Продукт Сік персиковий 7777465 1508086 434293 130 9 2022 13 ІП Козлов Сир 5% 199504 2200479 861509 184 1 2020 11 ІП Семенов ТОВ Продуктовий Сир 2% 7882174 1004117 2528452 108 6 2021 3 Білий хліб 5098379 1920159 2817059 83 4 2020 3 ТОВ Люкс Молоко 618355 1031729 2693034 213 2 2022 17 ТОВ Магазин Сир 5% 2170491 1369566 1335267 267 7 2020 1 ІП Козлов Сир 2% Плавлений сир Сік яблучний 9875860 1119186 377755 167 3 2020 11 8696433 1299580 2654915 221 5 2021 17 2491202 1859854 629453 227 2 2021 2 8671895 1054979 412729 178 8 2020 11 ТОВ Ромашка Чай Плавлений сир 5852232 1930698 1392007 14 1 2020 20 ТОВ Магазин Сир 5% 8504236 1926582 1388520 225 9 2022 12 ТОВ Магазин ТОВ Біля будинку Сир 2% 2787649 1541318 2152786 260 2 2021 2 Олія 2118277 202937 2711801 290 3 2022 13 ІП Петров ТОВ Продукти 981867 2455854 283393 139 2 2020 8 8969516 2931845 519163 68 4 2022 9 ТОВ Магазин Сир 5% Плавлений сир Плавлений сир 8071215 2870742 1429329 235 7 2021 20 ТОВ Ромашка Сир 2% 6534746 459407 847071 211 5 2021 5 ІП Васильєв Чай 5322811 2527521 193815 211 7 2020 16 Компанія ІП Семенов ТОВ Конвалія ТОВ Конвалія При вирішенні задачі оптимізації асортиментної політики підприємств бізнес-процесах необхідно спиратися на низку показників. Одним з таких показників є маржинальний дохід, який є різницею між виручкою від реалізації та витратами в процесі виробництва або закупівлі продукції. На малюнку 10 наведено процедуру розрахунку маржинального доходу від реалізації товару у компаніях бізнес-процесах (фрагмент). Метод статистичної обробки: угруповання по підприємствах, продукції та роках. На малюнку 11 наведено звіт із сумарної виручці підприємств із найбільшими оборотами. 65 На малюнку 12 наведена частка підприємств із найбільшим оборотом у формі кругової діаграми. Рисунок 10 – Процедура розрахунку маржинального доходу від реалізації товару у компаніях бізнес-процесах Рисунок 11 - Звіт по сумарному виторгу компаній з найбільшими оборотами 66 На малюнку 13 наведено діаграму за обсягами виручки від товарів різної номенклатури. Рисунок 12 – Діаграма оборотів компаній з найбільшою величиною виторгу Рисунок 13 – Діаграма за обсягами виручки від реалізації товарів різної номенклатури 67 На малюнку 14 наведено розрахунок обсягів реалізації імпортної продукції. Використано методи статистичного угруповання. Показано, що в аналізований період підприємствами здійснювався значний обсяг продажу імпортних товарів. Тут варто зазначити, що продаж імпортних товарів у сучасній політичній ситуації є ризиковою діяльністю. Проте реалізація імпортної продукції продовжує бути серйозною статтею доходу підприємств бізнес-процесах. Рисунок 14 – Розрахунок обсягів продажу імпортних товарів На малюнку 15 наведено графік зведених показників продажу імпортних товарів компаніями, які мають найбільший обсяг. 68 Рисунок 15 – Графік зведених показників продажу імпортних товарів компаніями, які мають найбільший обсяг В Завдання управління підприємствами бізнес-процесах важливе значення набуває отримання даних, які можуть дозволити розрахувати собівартість одиниці продукції, що випускається, рентабельність продажів. Такі дані містить звіт про витрати при виробництві продукції. На малюнку 16 наведено річний звіт про витрати під час виробництва харчової продукції. Малюнок 16 – Звіт з витрат торгових компаній в розріз звітних періодів 69 Як показано на малюнку 16, у аналізований період максимальний обсяг витрат торгових компаній припав на 2021 рік, далі зазначено зниження, пов'язане зі скороченням валового обсягу реалізації товару на поточний рік. На малюнку 17 наведено діаграму витрат за виробництво продукції за розрахунковими періодами. Використані статистичні методи угруповання та обчислення відносних величин. На малюнку 18 наведено звіт за величиною виручки від продажу. Як показано на малюнку – найбільшу питому вагу у виручці за продані товари займає позиція «персиковий сік». На малюнку 19 наведено графічне подання щодо виручки від збуту товарів. На малюнку 20 наведено звіт із витрат торгових підприємств. На малюнку 21 – його графічне уявлення. Як показано на малюнку 20 – найбільший рівень витрат припадає на продаж продукції за позицією «Білий хліб». Використані статистичні методи угруповання, розрахунку відносних показників. Рисунок 17 – Звіт про витрати на виробництво харчової продукції у розрізі звітних періодів (графічне подання) 70 Рисунок 18 - Звіт за величиною виручки від збуту товарів Рисунок 19 - Звіт за величиною виторгу від збуту товарів (графічне уявлення) 71 Рисунок 20 – Звіт про витрати на виробництво продукції Рисунок 21 – Звіт про витрати на виробництво продукції (графічне уявлення) 72 В Завдання управління дуже важливо приймати грамотні та зважені рішення. Для цього здійснимо «кореляційний аналіз, завдання якого зводиться до вимірювання тісноти зв'язку між факторами, виявлення невідомих причин зв'язків та оцінки факторів, що викликають максимальний вплив на результат» [9]. Кореляційний аналіз за показниками «маржинальний дохід» та «кількість працівників» та результат розрахунку показаний на малюнку 22. Рисунок 22 – Кореляційний аналіз за показниками «маржинальний дохід» та «кількість працівників» Як показано малюнку 22, кореляційна залежність між зазначеними параметрами відсутня. Далі проведено кореляційний аналіз за показниками «виторг» та «відсоток шлюбу». Результат розрахунку показаний малюнку 23. Рисунок 23 – Кореляційний аналіз за показниками «виручка» та «відсоток шлюбу» 73 Далі проведемо дослідження файлу даних із показниками фінансової діяльності харчових підприємств. У таблиці 5 наведено фрагмент файлу даних. Таблиця 5 - Фрагмент файлу даних щодо фінансового аналізу діяльності харчових підприємств Дебіторська Кредиторська Компанія заборгованість заборгованість ІП Васильєв 1032375 495160 ТОВ Біля будинку 883508 4360708 Субсидії 598912 909087 Рік 2021 2020 ТОВ Продукти 2232248 1086130 735505 2021 ІП Іванов 3066631 2311238 146467 2020 ТОВ Біля будинку 284078 3380706 812077 2022 ТОВ Яскравіше 4926962 1019984 887426 2022 ТОВ Магазин ТОВ Магазин 201037 4917631 673142 4295111 978487 158214 2022 2021 ТОВ Яскравіше 139584 250108 752736 2020 ТОВ Біля будинку 4495241 1267255 403928 2020 ТОВ Біля будинку 4353107 4657403 809519 2020 ТОВ Конвалія 367094 4060111 445838 2022 ІП Козлов ІП Козлов 3740801 2880547 4628921 4945436 268986 361792 2022 2022 ТОВ Магазин 160540 3640677 428815 2021 ІП Іванов 1027677 870123 915119 2021 ТОВ Біля будинку 744405 1205127 861774 2021 ТОВ Біля будинку 4095705 2074415 578771 2021 74 Продовження таблиці 5 Дебіторська заборгованість 499237 4247332 Кредиторська заборгованість 277182 4943200 Субсидії 833758 616908 Рік 2022 2020 ТОВ Ромашка 2976446 4218428 121207 2022 ІП Іванов 3386768 474075 253632 2020 ІП Семенов 1794570 4227177 377678 2020 ІП Семенов 2675162 1203732 267783 2021 ТОВ Люкс 1527842 2576643 787044 2021 ІП Петров 3625567 2556171 217306 2020 ІП Семенов 1292169 4143877 885541 2022 ТОВ Біля будинку 4466255 2687638 606375 2020 ТОВ Продуктовий 4343670 3342803 190717 2022 ІП Васильєв 2255637 4409390 881615 2021 ТОВ Продуктовий 611654 4646169 289212 2021 ТОВ Яскравіше 2107071 3122300 593175 2022 ТОВ Яскравіше 3863029 694793 812865 2022 ТОВ Конвалія 4314534 1776565 137207 2022 ТОВ Яскравіше 1547195 2095694 611139 2022 ІП Васильєв 3514434 4209776 472703 2021 ТОВ Продукти 1186404 3107293 318173 2020 Компанія ІП Петров ІП Семенов 75 Продовження таблиці 5 Дебіторська заборгованість Кредиторська заборгованість Субсидії Рік ТОВ Продуктовий 2442653 1553904 218175 2020 ТОВ Магазин 1531860 1256605 581917 2021 ІП Семенов ТОВ Яскравіше 1450825 2695954 3410522 418830 684347 493239 2020 2022 ТОВ Продуктовий 618893 4071844 295980 2021 ТОВ Продукти ТОВ Продуктовий ІП Семенов 1005644 4543239 360850 2020 2972007 1816909 2474447 836439 511538 937666 2022 2020 ТОВ Біля будинку 103458 3411017 776505 2020 ТОВ Конвалія 4652354 1314479 669772 2020 ТОВ Продуктовий 171192 3752221 599836 2021 ТОВ Ромашка 4917530 2649349 605796 2020 ІП Васильєв 3246053 1621245 275774 2022 ІП Іванов ТОВ Біля будинку 1824723 4791952 797916 129808 822188 553238 2020 2021 ТОВ Біля будинку 706520 3714655 414500 2020 ІП Козлов 807804 3847867 651818 2020 ТОВ Магазин ТОВ Люкс 4886726 1062029 4858865 2926765 342919 127546 2022 2021 ТОВ Біля будинку 829663 1027353 661564 2022 ТОВ Магазин 3420885 1859438 478386 2021 ТОВ Конвалія 1553094 2675106 402047 2022 Компанія 76 Продовження таблиці 5 Компанія Дебіторська заборгованість Кредиторська заборгованість Субсидії Рік ТОВ Люкс 4969067 2892123 754312 2022 ТОВ Яскравіше 1933201 581721 405167 2022 ІП Семенов 2472542 2597700 278775 2020 ІП Козлов 4207374 501356 879666 2020 ТОВ Конвалія 1935564 2236649 991617 2021 Файл даних містить інформацію щодо дебіторської та кредиторської заборгованості, галузі продажу, обсягу бонусів, дані про розрахунковий період у формі компенсації податків. Причина, через яку автор вважає за доцільне розглянути даний масив даних, полягає в тому, що ефективне управління торговим підприємством – це також питання забезпечення прийнятного рівня ризику. «Збільшення обсягу кредиторську заборгованість як безплатного джерела фінансування та її частки в позиковий капітал підприємства, зазвичай, сприяє зростанню прибуток від продажів, а й збільшує ризики несплати організації за своїми обязательствам»[24]. На малюнку 24 наведено звіт про фінансову діяльність підприємств. Як показано малюнку 24, фінансова діяльність підприємств здійснюється як із позитивним, і з негативним фінансовим результатом. На малюнку 25 наведено звіт щодо сумарної дебіторської заборгованості на підприємствах у бізнес-процесах. 77 Малюнок 24 - Звіт про фінансову діяльність підприємств (фрагмент) Малюнок 25 - Звіт щодо сумарної дебіторської заборгованості на підприємствах у бізнес-процесах Як показано малюнку 25, нині відзначається зростання рівня дебіторську заборгованість підприємств. На малюнку 26 наведено графічну інтерпретацію цього звіту. Використані методи статистичного угруповання та розрахунку відносних показників. 78 Малюнок 26 - Звіт за сумарною дебіторською заборгованістю на підприємствах у бізнес-процесах (графічна інтерпретація) На малюнку 27 наведено звіт щодо сумарної кредиторської заборгованості на підприємствах у бізнес-процесах. Малюнок 27 - Звіт з сумарної кредиторської заборгованості на підприємствах у бізнес-процесах 79 Як показано малюнку 27, нині відзначається зростання рівня дебіторську заборгованість підприємств. На малюнку 28 наведено графічну інтерпретацію цього звіту. Використані методи статистичного угруповання та розрахунку відносних показників. Малюнок 28 - Звіт сумарної кредиторської заборгованості на підприємствах бізнес-процесах (графічна інтерпретація) Далі на малюнку 29 проведено звіт сумарної дебіторської заборгованості по компаніях (використано метод угруповання). Малюнок 29 - Звіт сумарної кредиторської заборгованості на підприємствах у бізнес-процесах 80 На малюнку 30 наведено графічне подання зазначеного звіту. На малюнку 31 наведено зведений звіт щодо дебіторської заборгованості по галузях. Використано метод статистичного угруповання. Як показано малюнку 32, найбільший рівень дебіторську заборгованість спостерігається у галузі продажів кондитерських виробів, найменший рівень - у галузі продажів круп. Малюнок 30 - Звіт за сумарною кредиторською заборгованістю на підприємствах у бізнес-процесах (графічне подання) 81 Малюнок 31 - Зведений звіт з дебіторської заборгованості з галузей Малюнок 32 - Зведений звіт щодо дебіторської заборгованості за галузями (графічне подання) На малюнку 33 наведено зведений звіт щодо кредиторської заборгованості по галузях. Використано метод статистичного угруповання. Як показано на малюнку 34, найбільший рівень 82 кредиторську заборгованість спостерігається у галузі продажів кондитерських виробів, найменший рівень - у галузі продажів круп. Малюнок 33 - Зведений звіт щодо кредиторської заборгованості по галузях Малюнок 34 - Зведений звіт щодо дебіторської заборгованості за галузями (графічне подання) 83 На малюнку 35 наведено зведений звіт щодо фінансових результатів діяльності підприємств у бізнес-процесах. Використані методи статистичного угруповання. Малюнок 35 - Зведений звіт щодо фінансових результатів діяльності підприємств у бізнес-процесах На малюнку 36 наведено графічне подання цього звіту. Малюнок 36 - Зведений звіт щодо фінансових результатів діяльності підприємств у бізнес-процесах (графік) 84 Як показано малюнку 35, найбільшу ефективність показала галузь виробництва кондитерських виробів. Важливо, що Росія надає фінансову допомогу підприємствам бізнеспроцесах як субсидій, оскільки Уряд РФ розуміє стратегічне значення цієї галузі структурі економіки нашої країни. В у зв'язку з цим на малюнку 37 наведено розрахунок кореляції між фінансовим результатом та обсягом отриманих субсидій. Рисунок 37 - Розрахунок кореляції між фінансовим результатом та обсягом отриманих субсидій 85 Як показано малюнку 37, між зазначеними показниками кореляція відсутня. На малюнку 38 наведено розрахунок кореляції між фінансовим результатом та обсягом кредиторської заборгованості. Рисунок 38 - Розрахунок кореляції між фінансовим результатом та обсягом кредиторської заборгованості 86 Як показано на малюнку 38 між зазначеними показниками кореляція відсутня. Отже, поставлені завдання статистичної обробки інформації реалізовано. 4.2 Апробація та аналіз результатів зі статистики продажів Далі проведемо аналіз статистики продажу товарів у межах видів товарних позицій, форматів торгових точок. У таблиці 6 наведено фрагмент вихідних даних масиву, що аналізується. Таблиця 6 - Вихідні дані Вид продукції Молочна Побутова хімія Побутова хімія Електроніка Кондитерська продукція Побутова хімія Хлібна Кондитерська продукція Сантехніка Хлібна Хлібна Молочна Молочна Молочна Кондитерська продукція Сантехніка Кондитерська продукція Електроніка Хлібна Побутова хімія Електроніка Побутова хімія Молочна Формат магазину Маркетплейс Супермаркет Гіпермаркет Гіпермаркет Дата 19.03.2023 27.03.2023 29.03.2023 10.03.2023 Виторг Формат оплати 1692483 готівка 2821627 готівка 2736173 готівка 6819064 готівка Гіпермаркет Маркетплейс Магазин біля будинку Магазин біля будинку Магазин біля будинку Маркетплейс Маркетплейс Маркетплейс Маркетплейс Магазин біля будинку 01.03.2023 28.03.2023 7902809 банківська картка 2752005 готівка 09.03.2023 549832 банківська картка 30.03.2023 3069652 банківська картка 10.03.2023 26.03.2023 01.03.2023 07.03.2023 28.03.2023 3532898 готівка 6964775 банківська картка 9630604 готівка 8485364 банківська картка 2837568 банківська картка 10.03.2023 8504384 готівка Маркетплейс Маркетплейс 22.03.2023 01.03.2023 7297989 банківська картка 3545797 банківська картка Гіпермаркет Магазин біля будинку Маркетплейс Магазин біля будинку Гіпермаркет Магазин біля будинку Супермаркет 30.03.2023 4440008 готівка 04.03.2023 06.03.2023 2928329 готівка 4339618 банківська картка 12.03.2023 01.03.2023 8223836 готівка 2757230 готівка 24.03.2023 14.03.2023 7985304 готівка 6099754 банківська картка 87 Продовження таблиці 6 Вид продукції Сантехніка Сантехніка Хлібна Кондитерська продукція Кондитерська продукція Сантехніка Сантехніка Побутова хімія Сантехніка Побутова хімія Хлібна Кондитерська продукція Молочна Молочна Електроніка Хлібна Кондитерська продукція Сантехніка Хлібна Хлібна Сантехніка Сантехніка Хлібна Сантехніка Хлібна Молочна Кондитерська продукція Молочна Сантехніка Електроніка Побутова хімія Електроніка Електроніка Молочна Електроніка Побутова хімія Хлібна Формат магазину Маркетплейс Магазин біля будинку Супермаркет Дата 20.03.2023 Виторг Формат оплати 4216666 банківська картка 11.03.2023 17.03.2023 5943479 готівка 9798672 банківська картка Гіпермаркет 07.03.2023 4780535 банківська картка Маркетплейс Гіпермаркет Супермаркет Магазин біля будинку Супермаркет Гіпермаркет Супермаркет 12.03.2023 25.03.2023 28.03.2023 8978095 банківська картка 6368425 готівка 7911266 готівка 10.03.2023 21.03.2023 27.03.2023 09.03.2023 9238246 банківська картка 4892675 банківська картка 7261840 готівка 9855224 готівка Супермаркет Супермаркет Маркетплейс Гіпермаркет Маркетплейс 02.03.2023 07.03.2023 20.03.2023 13.03.2023 24.03.2023 2766221 готівка 9450074 банківська картка 4230971 банківська картка 9768092 готівка 7517197 банківська картка Гіпермаркет Гіпермаркет Магазин біля будинку Маркетплейс Магазин біля будинку Супермаркет Магазин біля будинку Гіпермаркет Маркетплейс Маркетплейс 05.03.2023 04.03.2023 5839101 банківська картка 2451169 готівка 21.03.2023 07.03.2023 228562 готівка 6841238 банківська картка 11.03.2023 22.03.2023 9816469 готівка 6633081 банківська картка 14.03.2023 08.03.2023 19.03.2023 29.03.2023 1634136 готівка 6215671 готівка 458576 банківська картка 8267768 готівка Гіпермаркет Магазин біля будинку Супермаркет Супермаркет Гіпермаркет Гіпермаркет Магазин біля будинку Гіпермаркет Супермаркет Супермаркет Маркетплейс 05.03.2023 5693925 банківська картка 19.03.2023 25.03.2023 18.03.2023 16.03.2023 28.03.2023 6322301 банківська картка 6929806 готівка 5218887 банківська картка 4165154 банківська картка 2904323 банківська картка 01.03.2023 23.03.2023 30.03.2023 22.03.2023 19.03.2023 4865952 банківська картка 3179259 готівка 210985 готівка 8271115 банківська картка 6100079 готівка 88 Продовження таблиці 6 Вид продукції Молочна Кондитерська продукція Кондитерська продукція Хлібна Сантехніка Молочна Молочна Молочна Електроніка Побутова хімія Сантехніка Електроніка Побутова хімія Хлібна Молочна Кондитерська продукція Молочна Хлібна Побутова хімія Хлібна Молочна Сантехніка Кондитерська продукція Побутова хімія Побутова хімія Електроніка Побутова хімія Хлібна Електроніка Хлібна Електроніка Молочна Сантехніка Молочна Кондитерська продукція Кондитерська продукція Формат магазину Супермаркет Дата 17.03.2023 Маркетплейс 18.03.2023 4657806 банківська картка Супермаркет Гіпермаркет Гіпермаркет Супермаркет Супермаркет Гіпермаркет Магазин біля будинку Магазин біля будинку Супермаркет Гіпермаркет Маркетплейс Супермаркет Супермаркет 06.03.2023 17.03.2023 05.03.2023 27.03.2023 20.03.2023 20.03.2023 1384167 готівка 1085822 готівка 389496 готівка 8876334 готівка 4032188 банківська картка 2218804 готівка 06.03.2023 3554119 банківська картка 08.03.2023 16.03.2023 01.03.2023 08.03.2023 03.03.2023 17.03.2023 1462918 банківська картка 317880 банківська картка 4573605 готівка 4147935 готівка 1532045 банківська картка 1987748 готівка Маркетплейс Супермаркет Магазин біля будинку Супермаркет Супермаркет Гіпермаркет Магазин біля будинку 09.03.2023 25.03.2023 9229624 готівка 2922725 банківська картка 26.03.2023 29.03.2023 01.03.2023 18.03.2023 8779205 банківська картка 9632846 банківська картка 1873679 банківська картка 7123334 готівка 06.03.2023 4966650 готівка Гіпермаркет Маркетплейс Магазин біля будинку Гіпермаркет Магазин біля будинку Гіпермаркет Гіпермаркет Гіпермаркет Гіпермаркет Супермаркет Маркетплейс Супермаркет 04.03.2023 07.03.2023 6899548 готівка 7123931 готівка 15.03.2023 08.03.2023 7499649 готівка 464462 готівка 31.03.2023 30.03.2023 16.03.2023 11.03.2023 04.03.2023 14.03.2023 19.03.2023 23.03.2023 1649604 банківська картка 6297527 готівка 8552822 готівка 9378239 банківська картка 155055 банківська картка 5515046 банківська картка 675321 готівка 528380 готівка Магазин біля будинку 15.03.2023 5839938 банківська картка Гіпермаркет 13.03.2023 841418 готівка 89 Виторг Формат оплати 7398614 готівка Продовження таблиці 6 Вид продукції Побутова хімія Сантехніка Молочна Електроніка Електроніка Кондитерська продукція Сантехніка Кондитерська продукція Молочна Кондитерська продукція Молочна Кондитерська продукція Молочна Хлібна Електроніка Хлібна Хлібна Електроніка Сантехніка Електроніка Побутова хімія Побутова хімія Сантехніка Побутова хімія Електроніка Молочна Хлібна Молочна Кондитерська продукція Сантехніка Електроніка Молочна Кондитерська продукція Молочна Кондитерська продукція Формат магазину Гіпермаркет Супермаркет Маркетплейс Маркетплейс Магазин біля будинку Дата 17.03.2023 13.03.2023 14.03.2023 12.03.2023 Виторг Формат оплати 19283 готівка 9224263 готівка 5996679 готівка 9334257 банківська картка 02.03.2023 3366554 банківська картка Гіпермаркет Супермаркет 29.03.2023 28.03.2023 7366453 банківська картка 1419535 банківська картка Магазин біля будинку Гіпермаркет 27.03.2023 11.03.2023 7055461 готівка 9583923 готівка Супермаркет Супермаркет Магазин біля будинку Гіпермаркет Маркетплейс Гіпермаркет Гіпермаркет Супермаркет Маркетплейс Маркетплейс Гіпермаркет Гіпермаркет Маркетплейс Магазин біля будинку Супермаркет Магазин біля будинку Супермаркет Супермаркет Магазин біля будинку 31.03.2023 22.03.2023 4880652 банківська картка 4271407 банківська картка 17.03.2023 28.03.2023 17.03.2023 15.03.2023 24.03.2023 28.03.2023 06.03.2023 30.03.2023 16.03.2023 23.03.2023 31.03.2023 2825968 готівка 9271689 банківська картка 5902764 готівка 6081884 готівка 9685171 готівка 7418177 готівка 9683553 готівка 9833058 готівка 6920542 банківська картка 7424890 банківська картка 5906085 готівка 25.03.2023 20.03.2023 1224885 готівка 8730071 банківська картка 05.03.2023 19.03.2023 23.03.2023 8602008 банківська картка 2190508 готівка 9788856 банківська картка 29.03.2023 4022931 готівка Маркетплейс Магазин біля будинку Гіпермаркет Маркетплейс 26.03.2023 3695349 банківська картка 08.03.2023 04.03.2023 05.03.2023 9469140 готівка 1998685 готівка 4416359 банківська картка Супермаркет Гіпермаркет 24.03.2023 27.03.2023 1255933 готівка 6366575 готівка Магазин біля будинку 03.03.2023 4899914 готівка 90 Продовження таблиці 6 Вид продукції Кондитерська продукція Електроніка Електроніка Побутова хімія Хлібна Електроніка Електроніка Молочна Сантехніка Хлібна Хлібна Сантехніка Кондитерська продукція Побутова хімія Електроніка Молочна Побутова хімія Хлібна Молочна Кондитерська продукція Побутова хімія Хлібна Електроніка Сантехніка Електроніка Побутова хімія Електроніка Електроніка Хлібна Сантехніка Кондитерська продукція Молочна Побутова хімія Електроніка Сантехніка Молочна Формат магазину Дата Виторг Формат оплати Супермаркет Гіпермаркет Маркетплейс Супермаркет Супермаркет Магазин біля будинку Магазин біля будинку Гіпермаркет Маркетплейс Гіпермаркет Магазин біля будинку Гіпермаркет 18.03.2023 04.03.2023 13.03.2023 28.03.2023 29.03.2023 6200770 банківська картка 8676391 готівка 8884095 готівка 643192 банківська картка 2907660 банківська картка 01.03.2023 3236226 банківська картка 09.03.2023 04.03.2023 04.03.2023 29.03.2023 7372560 банківська картка 3107265 готівка 1195919 банківська картка 5549400 готівка 10.03.2023 26.03.2023 7896291 готівка 6931618 готівка Супермаркет Магазин біля будинку Гіпермаркет Супермаркет Магазин біля будинку Маркетплейс Супермаркет 01.03.2023 5462221 готівка 11.03.2023 18.03.2023 10.03.2023 9600487 банківська картка 4645068 готівка 1161973 банківська картка 12.03.2023 05.03.2023 28.03.2023 4139761 банківська картка 2133590 банківська картка 539855 банківська картка 23.03.2023 04.03.2023 3221705 готівка 7693553 готівка 20.03.2023 294740 банківська картка 30.03.2023 25.03.2023 07.03.2023 11.03.2023 21.03.2023 24.03.2023 31.03.2023 15.03.2023 1237844 банківська картка 861669 банківська картка 6856185 готівка 2127895 готівка 3415217 готівка 5862728 готівка 6687302 готівка 8561865 готівка 22.03.2023 28.03.2023 17.03.2023 25.03.2023 2667405 готівка 139073 банківська картка 9173217 готівка 2302261 банківська картка 09.03.2023 21.03.2023 1856984 готівка 5627265 готівка Магазин біля будинку Маркетплейс Магазин біля будинку Магазин біля будинку Супермаркет Супермаркет Маркетплейс Маркетплейс Маркетплейс Супермаркет Супермаркет Маркетплейс Маркетплейс Маркетплейс Маркетплейс Магазин біля будинку Супермаркет 91 Продовження таблиці 6 Вид продукції Електроніка Молочна Кондитерська продукція Молочна Електроніка Кондитерська продукція Побутова хімія Сантехніка Хлібна Сантехніка Хлібна Побутова хімія Електроніка Електроніка Хлібна Кондитерська продукція Сантехніка Кондитерська продукція Електроніка Кондитерська продукція Хлібна Хлібна Побутова хімія Кондитерська продукція Молочна Формат магазину Гіпермаркет Магазин біля будинку Дата 07.03.2023 Виторг Формат оплати 3619700 банківська картка 22.03.2023 1852933 готівка Супермаркет Гіпермаркет Гіпермаркет 17.03.2023 09.03.2023 02.03.2023 931774 банківська картка 4394860 готівка 7106279 готівка Гіпермаркет Гіпермаркет Магазин біля будинку Супермаркет Супермаркет Супермаркет Супермаркет Магазин біля будинку Магазин біля будинку Супермаркет 31.03.2023 27.03.2023 798576 банківська картка 3149721 банківська картка 11.03.2023 16.03.2023 15.03.2023 14.03.2023 15.03.2023 4914637 готівка 2569157 банківська картка 7510006 готівка 9594849 банківська картка 6108718 банківська картка 22.03.2023 9370981 готівка 01.03.2023 09.03.2023 7976456 банківська картка 8098299 банківська картка Гіпермаркет Маркетплейс 17.03.2023 01.03.2023 9935347 банківська картка 6283674 готівка Магазин біля будинку Маркетплейс 14.03.2023 19.03.2023 4636369 готівка 2573407 банківська картка Супермаркет Маркетплейс Супермаркет Маркетплейс 27.03.2023 12.03.2023 12.03.2023 19.03.2023 2427187 банківська картка 6174986 готівка 9922973 банківська картка 422251 готівка Гіпермаркет Магазин біля будинку 22.03.2023 24657 банківська картка 26.03.2023 8323696 банківська картка Таким чином, ми здійснюємо етап вивчення даних, щоб зрозуміти, наскільки адекватно підготовлений масив даних представляє досліджувану предметну область. Тут доцільно проводитись пошук мінімальних та максимальних значень параметрів, аналіз розподілів значень та інших статистичних характеристик, порівняння отриманих результатів з уявленнями про предметну область. 92 Результат аналізу даних досліджуваного масиву наведено малюнку 39. Малюнок 39 – Результат аналізу даних масиву, що досліджується. За результатами аналізу даних було виявлено мінімальні, максимальні показники, показники відхилення статистичної вибірки. На малюнку 40 наведено параметри джерела даних, що досліджується. Рисунок 40 – Параметри досліджуваного джерела даних 97 93 На малюнку 41 наведено результати розрахунку мінімальної, максимальної, середньої сумарної виручки. Ці дані дозволять оцінити фінансові показники підприємств бізнес-процесах і цим сприяють прийняттю управлінських рішень. Рисунок 41 – Результати розрахунку мінімального, максимального, середнього, сумарного виторгу На малюнку 42 наведено графік динаміки сумарної виручки за датами. 94 Рисунок 42 – Графік динаміки сумарної виручки за датами На малюнку 43 наведено результат підсумовування виручки за датами. Рисунок 43 – Результат підсумовування виручки за датами 95 На малюнку 44 наведено графік середньої виручки за датами. На малюнку 45 – таблична інтерпретація результатів. Малюнок 44 – Графік середньої виручки за датами Рисунок 45 – Таблична інтерпретація результатів 96 На малюнку 46 наведено діаграму середньої виручки за товарними позиціями. Рисунок 46 – Діаграма середньої виручки за товарними позиціями Як показано на малюнку 46, у аналізованій вибірці у зазначений період найбільший обсяг середньої виручки відповідає продажам електроніки, найменший – продажам хлібобулочних виробів. На малюнку 47 наведено табличну інтерпретацію розрахунків. Рисунок 45 – Таблична інтерпретація результатів 97 На малюнку 48 наведено діаграму сумарної виручки за товарними позиціями. Рисунок 48 – Діаграма сумарної виручки за товарними позиціями Як показано на малюнку 48, у аналізованій вибірці у зазначений період найбільший обсяг середньої виручки відповідає продажам електроніки, найменший – продажам хлібобулочних виробів. На малюнку 49 наведено табличну інтерпретацію розрахунків. 98 Рисунок 49 – Таблична інтерпретація результатів На малюнку 50 наведено діаграму сумарного виторгу за форматами магазинів. Рисунок 50 - Діаграма сумарної виручки за форматами магазинів 99 Як показано малюнку 50, найбільший обсяг виручки посідає магазини формату «Супермаркет», мінімальний – на маркетплейси. На малюнку 51 наведено таблицю з результатами розрахунків. Малюнок 51 – Таблиця з результатами розрахунків На малюнку 52 наведено діаграму середньої виручки за форматами магазинів. 100 Рисунок 52 - Діаграма середньої виручки за форматами магазинів За результатами розрахунків показано, що найбільша середня виручка посідає формат «Магазин у дому», найменша – на гіпермаркети. Малюнок 53 – Таблиця з результатами розрахунку 101 Використання систем еквайрингу – це значна стаття витрати. Тому управлінському персоналу підприємств бізнес-процесах важливо отримати точну інформацію необхідність впровадження цієї системи. На малюнку 54 наведено діаграму популярності форм розрахунків. Малюнок 54 - Діаграма популярності форм розрахунків Як показано на малюнку 55, форми розрахунків готівкою та безготівковими коштами становлять приблизно однакові частки. 102 Малюнок 55 – Таблиця з результатами розрахунків Малюнок 56 - Діаграма популярності форм розрахунків (кругова) Далі проведено тест на тип розподілу вибірки (Малюнок 57). 103 Рисунок 57 – Результати тесту на ознаки нормального розподілу Як показано на малюнку 57, гіпотеза про нормальність розподілу даних щодо виручки відхиляється. Далі здійснимо побудову моделей на основі структури даних. Модель включатиме вказівку на алгоритм інтелектуального аналізу даних, його параметри та аналізовані дані. При визначенні моделі використано різні фільтри. Таким чином, не всі дані, що є в описі структури, будуть використовуватися кожною створеною для неї моделлю. На малюнку 58 показано як у рамках розв'язання задачі дослідження для однієї структури створюється кілька моделей, що використовують різні набори стовпців та фільтрів. Для побудови моделей найдоцільніше використовувати алгоритм кластерного аналізу (K-means) або K-середніх із заздалегідь відомим числом кластерів. Для зручності обрано число кластерів, що дорівнює 3. Для візуалізації використовуємо модуль Sklearn.cluster (Python). На малюнку 59 представлена модель «Середня виручка за товарними позиціями». 104 Малюнок 58 – Моделі, створені в рамках розв'язання задачі дослідження В моделі, зображеної малюнку 59, виділено три кластери. Модель повністю відповідає даним діаграми на малюнках 46-47, де найбільший середній виторг належить товарній позиції «Електроніка», трохи менша середня виручка у «Побутової техніки». На третьому місці – категорія «Молочні продукти». 105 Малюнок 59 – Модель «Середня виручка за товарними позиціями» На малюнку 60 представлена модель «Сумарна виручка за товарними позиціями». У моделі, зображеній на малюнку 60, також виділено три кластери. Модель повністю відповідає даним діаграми на малюнках 48-49, де найбільший сумарний виторг належить товарній позиції 106 «Електроніка», трохи менша сумарна виручка у категорії «Сантехніка». На третьому місці – «Кондитерські вироби». Малюнок 60 – Модель «Сумарна виручка за товарними позиціями» На малюнку 61 представлена модель «Середня виручка за товарами магазинів». В моделі, зображеної малюнку 61, виділено три кластери. Модель повністю відповідає даним діаграми на рисунках 50-51, де 107 Найбільша середня виручка за форматами магазинів належить формату «Магазин біля дому», на другому місці – «Супермаркет». На третьому місці – «Маркетплейс». Малюнок 61 – Модель «Середня виручка за форматами магазинів» На малюнку 62 представлено модель «Популярність форм розрахунків». Для побудови цієї моделі був використаний пакет MiniBatchKMeans. В моделі, зображеної малюнку 62, виділено два кластери. Модель повністю відповідає даним діаграми на малюнках 52-53, де приблизно однакові частки у форми розрахунків банківська картка та готівка. 108 Малюнок 62 – Модель «Популярність форм розрахунків» Висновки по розділу: В У ході апробації результатів дослідження було проведено вивчення статистичних даних та проведено інтелектуальний аналіз даних масивів із продажу товарів різної номенклатури та динаміки їх фінансового стану за період 2020-2022 рр. Інтелектуальний аналіз даних було проведено в наступній послідовності: - постановка задачі; - підготовка даних; - вивчення даних; - побудова моделей; - дослідження та перевірка моделей. Трохи раніше на етапі постановки завдання визначили мету дослідження. В ході підготовки даних визначили джерела даних - масиви 109 інформації для інтелектуального аналізу та визначили критерії, показники, за якими проводили дослідження. Потім здійснили вивчення даних, щоб зрозуміти, наскільки адекватно підготовлений масив даних представляв досліджувану предметну область. Здійснили пошук мінімальних та максимальних значень параметрів, аналіз розподілів значень та інших статистичних характеристик. Після чого збудували та перевірили моделі. В рамках здійснення завдання щодо оптимізації асортиментної політики провели аналіз динаміки ринку, структури попиту, фінансових показників за товарними групами, окремими товарами. З використанням серед Pandas, Matplotlib, NumPy, Sklearn.cluster була проведена інтелектуальний аналіз, в результаті якого отримані дані, встановлені залежності між показниками, побудовано та перевірено моделі. Також було проведено вивчення фінансової звітності компаній, що працюють у галузі харчового виробництва, проведено аналіз дебіторської и кредиторську заборгованість. Причина, через яку автор вважає за доцільне провести аналіз дебіторської та кредиторської заборгованості полягає в тому, що ефективне управління торговим підприємством – це також питання забезпечення прийнятного рівня фінансового ризику. За підсумками проведеного аналізу керівництвом здійснюється ухвалення управлінських рішень, на підставі яких проводиться коригування асортиментної політики, скороченняВитрат. Використання технологій великих даних дозволяє вивести діяльність підприємств у бізнес-процесах на якісно новий рівень. Таким чином, технологія аналізу та використання великих даних у бізнес-процесах підвищує ефективність управління компаніями, дозволяє оптимізувати асортиментну політику, знижувати витрати. Отже, гіпотезу дослідження підтверджено та обґрунтовано. 110 Висновок В В рамках цієї роботи проведено аналіз теоретичних та практичних аспектів використання технологій обробки великих даних у бізнес-процесах. Показано, що в даний час технології роботи з масивами даних та накопичення великих обсягів інформації надає можливості проведення обробки, метою якої є виявлення трендів, прогнозування поведінки систем, що вивчаються. Сферами застосування технологій обробки великих даних є: завдання маркетингу, державного управління, планування виробництва та реалізації продукції, планування транспортної інфраструктури, будівництва соціальних об'єктів. Використання великих даних є актуальним у багатьох галузях економічної діяльності, а також у сфері державного управління, роботі силових структур, політичної діяльності. Методика обробки масивів великих даних включає технології, використання яких залежить від специфіки даних, періодичності роботи з ними, представлених форматів. Використання технологій роботи с Великими даними у бізнес-процесах може включати безліч напрямів, пов'язаних з аналізом обсягів виробництва, ефективністю витрачання коштів, що проводяться маркетингові акції. Також технології великих даних в умовах підприємств торгівлі забезпечують оптимізацію асортиментної політики, що зрештою підвищує ефективність діяльності підприємств. В В рамках проведеного аналізу основних напрямів використання систем інтелектуального аналізу великих даних у бізнес-процесах було показано, що інструменти обробки великих масивів інформації дозволяють виявляти наявність залежностей між параметрами, що вивчаються. проводити розрахунки статистичних показників, оцінювати ефективність асортиментної та бонусної політики. Таким чином, технології 111 інтелектуального аналізу дозволяють отримувати конкурентні переваги для підприємств бізнес-процесах внаслідок можливості проведення оптимізації технології роботи з постачальниками, клієнтами, торговими площами та персоналом. Вивчено методи обробки великих даних. Показано, що вибір того чи іншого методу залежить від поставлених завдань та специфіки предметної галузі. В практичної частини роботи проведено вивчення статистичних даних щодо продажу товарів різної номенклатури та динаміки їх фінансового стану за період 2020-2022 років. С використанням середовища Pandas була проведена статистична обробка масиву, в результаті якої отримані зведені показники за видами виробленої продукції, отримуваного доходу, встановлені залежності між показниками. Також було проведено вивчення фінансової звітності компаній, що працюють у галузі харчового виробництва, проведено аналіз дебіторської та кредиторської заборгованості. Ефективність витрачання державних субсидій, зроблено висновки про наявність чи відсутність кореляції між різними показниками. Таким чином, використання системи статистичного оброблення інформації забезпечує можливості аналізу діяльності підприємств, оптимізації структури виробництва, фінансування основної діяльності, ефективного використання кредитних ресурсів та державних субсидій. В практичної частини роботи виконано статичний аналіз даних із продажу товарів різної номенклатури. Як параметри для аналізу вибрані показали обсяги виробництва, фінансові результати, врахування якості продукції, штатного складу підприємств. Як інструмент статистичного аналізу обрані: угруповання, обчислення відносних величин, графічне представлення даних, кореляція. за 112 результатами проведених обчислень визначено галузі з найкращими показниками діяльності, а також види продукції, що виробляється з найбільшим маржинальним доходом, проаналізовано динаміку фінансових показників. Таким чином, використання інструментів аналізу великих даних в бізнес-процесах дозволяє виявляти ефективність основних напрямів виробництва за видами, виявляти взаємозалежність показників. За підсумками проведеного аналізу керівництвом здійснюється прийняття управлінських рішень, виходячи з яких проводиться коригування асортиментної політики, зміна підходів до фінансування виробництв, роботи з персоналом. Таким чином, використання технологій великих даних дозволяє вивести діяльність підприємств у бізнес-процесах на якісно новий рівень. 113 Список використаних джерел 1. Застосовані методи статистичного аналізу. Statistical computation and simulation : [AMSA'19] : процедури з міжнародного workshop, [Novosibirsk, Russia], 18-20 September 2019 / editors: Prof. Boris Lemeshko [et al.]. Novosibirsk: Novosibirsk state technical university, 2019. – 573 с. 2. Evans R. Clustering для classification: using standard clustering methods to summarize datasets with minimal loss of classification accuracy [Text] / R. Evans. – Saarbrucken: VDM Verlag, 2018. – 108 с. 3. Jankowski N. Comparison of instances selection algorithms i. Algorithms survey / N. Jankowski, M. Grochowski / / International conference on artificial intelligence and soft computing. - Springer, Berlin, Heidelberg, 2019. - 598 с. 4. Кордова М. Додаток, що вибирається в логічній rule extraction for regression problems / M. Kordos, S. Bialka, M. Blachnik // International Conference on Artificial Intelligence and Soft Computing. - Springer, Berlin, Heidelberg, 2013. 175 с. 5. Korjakovskij I. Safer reinforcement навчання для robotics: dissertation / by Ivan Koryakovskiy. – Moscow: Editus, 2018. – XII, 151 с. 6. Аврунєв О. Є., Стасишин В. М. Бізнес-інформатика. [Текст] навчальний посібник: / О. Є. Аврунєв, В. М. Стасишин. - Новосибірськ: Видво НДТУ, 2018. - 121с. 7. Агаміров Л. В. Статистичні методи аналізу результатів наукових досліджень: навчальний посібник / Л. В. Агаміров. – Київ: Вид-во МЕІ, 2018. – 71 с. 8. Алпайдін Е. Машинне навчання: новий штучний інтелект / Етем Алпайдін; [Переклад з англійської: Дмитро Вібе, д.ф.м.н.]. – Київ: Фонд розвитку промисловості, 2017. – XII, 191 с. 9. Бабієва Н. А., Раскін Л. І. Автоматизація ІТ-сервісів на 114 підприємствах. [Текст]: навчально-методичний посібник / Н. А. Бабієва, Л. І. Раскін. - М.: Інфра-М, 2018. - 208 с. 10. Баранчиков А. І. Управління ІТ-інфраструктурою організацій [Текст]: підручник / А. І. Баранчиков. – Рязань: РГУ, 2019. – 219 с. 11. Білоусов П. А., Марухіна О. В., Скоморохов А. О. Машинне навчання та великі дані: навчальний посібник / П. А. Білоусов, О. В. Марухіна, А. О. Скоморохов. - Санкт-Петербург: ГУАП, 2021. - 119 с. 12. Бєляєва Т. М. Інформаційні технології в юридичній діяльності [Текст]: підручник / Бєляєва Т. М., Кудінов А. Т., Пальянова Н.В. – Київ: Проспект, 2018. – 349 с. 13. Бененсон М. З., Сорокін С. А. Проектування баз даних великого обсягу: навчальний посібник / М. З. Бененсон, С. А. Сорокін. - Київ: МИРЕА – Російський технологічний університет, 2020. – 151 с. 14. Безсмертний І. А. Інтелектуальні системи: підручник та практикум / І. А. Безсмертний, А. Б. Нугуманова, А. В. Платонов. - Київ : Видавництво Юрайт, 2022. - 243 с. 15. Безсмертний, І. А. Системи штучного інтелекту: навчальний посібник для вузів / І. А. Безсмертний. - 2-ге вид., Випр. та дод. - Київ: Видавництво Юрайт, 2022. - 157 с. 16. Благірьов А. Big data простою мовою / Олексій Благірьов. - Київ : АСТ: Часи, 2019. - 253с. 17. Болдирєв А. В. Технології зберігання даних / А. В. Болдирєв. - Ростов-на-Дону: ДДТУ, 2019. – 77 с. 18. Борисова С. Ст, Зейн А. Н., Дурова М. А. Технології Big Data : навчальний посібник/С. В. Борисова, А. Н. Зейн, М. А. Дурова. – Київ: Видво МЕІ, 2021. – 46 с. 19. Боченіна М. В. Статистичні індикатори та тренди російського ринку / М. В. Боченіна. – Санкт-Петербург: Вид-во Санкт-Петербурзького державного економічного університету, 2018. – 165 с. 20. Бродовська О. В., Домбровська А. Ю. Великі дані в 115 дослідженні політичних процесів: навчальний посібник/Є. В. Бродовська, О. В. Ю. Домбровська. - Київ : МПГУ, 2018. - 86 21. Бурков А. Машинне навчання без зайвих слів / Андрій Бурков. - Санкт-Петербург: Пітер, 2020. – 188 с. 22. Вартанов А. А., Лоскутова І. В., Миронов С. Н. Основи адміністрування програмних засобів захисту інформації: теорія та практика: монографія / Артур Олександрович Вартанов, Інна Василівна Лоскутова, Сергій Миколайович. – Київ: Радіотехніка, 2018. – 163 с. 23. Вандер Плас Д. Python для складних завдань, наука про дані: і машинне навчання / Дж. Вандер Плас. - Санкт-Петербург: Пітер, 2019. - 572с. 24. Васильєв А. А. Теорія ймовірностей та математична статистика: підручник та практикум / А. А. Васильєв. - 2-ге вид., Випр. та дод. - Київ: Видавництво Юрайт, 2022. - 232 с. 25. Васильків, А.В. Інформаційні системи та їх безпека [Текст]: Навчальний посібник / А.В. Васильків, А.А. Васильків, І.А. Васильків. - М.: Форум, 2018. – 528 c. 26. Воронцов Ю. А., Грунич Ю. А., Козинець А. В. Інноваційні технології в IT. Нейросети: навчально-методичний посібник/Ю.А. Воронцов, Ю.А. Грунич, А.В. Козинець. – Київ: Медіа Паблішер, 2020. – 100 с. 27. В'югін В. В. Математичні основи машинного навчання та прогнозування / В. В. В'югін. - Вид. 2-ге, испр. та дод. – Київ: Вид-во МЦНМО, 2018. – 236с. 28. Гмурман В. Є. Теорія ймовірностей та математична статистика: підручник для вузів/В. Є. Гмурман. - 12-е вид. - Київ: Видавництво Юрайт, 2022. - 479 с. 29. Григор'єв Ю. А., Плужнікова О. Ю. Концептуальне та логічне проектування схеми бази даних у нотації Чена та за допомогою CASE-засоби AllFusion Erwin Data Modeler: навчально-методичний посібник : / Ю. А. Григор'єв, О. Ю. Плужнікова. – Київ: Супутник, 2019. – 33 с. 116 30. Григор'єв А. А., Ісаєв Є. А., Тарасов П. А. Передача, зберігання та обробка великих обсягів наукових даних: навчальний посібник / А. А. Григор'єв, Є. А. Ісаєв, П. А. Тарасов. - Київ: ІНФРА-М, 2021. - 205 с. 31. Данилова Н.В., Білявський Г. І. Аналіз даних. Машинне навчання: навчальний посібник / Н. В. Данилова, Г. І. Белявський. - РостовнаДону: Вид-во Південного федерального університету, 2020. – 146 с. 32. Дейтел П. Д., Дейтел Х. М. Python: штучний інтелект, великі дані та хмарні обчислення / Пол Дейтел, Харві Дейтел. – СанктПетербург: Пітер, 2020. – 861 с. 33. Дергачова І. В., Сар'ян А. С. Цифрові технології. Аналіз великих даних: навчальний посібник/І. В. Дергачова, А. С. Сар'ян. - Ростовна-Дону: ФДБОУ ВО РГУПС, 2019. – 114 с. 34. Донніков Ю.Є. Проектування баз даних: монографія/Ю.Є. Донніков. - Київ: Юстіцінформ, 2021. - 219 с. 35. Дудін М. Н. Соціально-економічна статистика: підручник та практикум для вузів / М. Н. Дудін, Н. В. Лясніков, М. Л. Лезіна. - Київ : Видавництво Юрайт, 2022. - 233 с. 36. Дудін М. Н. Теорія статистики: підручник та практикум для вузів / М. Н. Дудін, Н. В. Лясніков, М. Л. Лезіна. - Київ : Видавництво Юрайт, 2022. - 148 с. 37. Євтіхов В. Г., Євтіхова Н. В., Суворов С. В. Акселерація обробки даних: навчально-методичний посібник / В. Г. Євтіхов, Н. В. Євтіхов, С. В. Суворов. - Київ: Московський Політех, 2021. - 589с. 38. Єрохін В. В., Раянова А. Р., Кафтарьова А. Б. Статистичні методи аналізу в бізнес-інформатиці: навчальний посібник / В. В. Єрохін, А. Р. Раянова, А. Б. Кафтарьова. - 2-ге вид., перераб. та дод. - Київ: Супутник+, 2022. - 163 с. 39. Єськін Д. Л., Бакулін В. М. Основи захисту інформації в комп'ютерних системах та мережах: навчальний посібник / Д. Л. Єськін, В. М. Бакулін. – Волгоград: ВА МВС України, 2019. – 67 с. 117 40. Железнов М. М. Методи та технології обробки великих даних: навчально-методичний посібник/М.М. Железнів. МДСУ. - Київ: Вид-во МИСИ - МДСУ, 2020. - 658с. 41. Замятін А. В. Інтелектуальний аналіз даних: навчальний посібник / А. В. Замятін. – Томськ: Видавничий Дім Томського державного університету, 2020. – 193 с. 42. Зараменських Є. П. Менеджмент: бізнес-інформатика: підручник та практикум / Є. П. Зараменських. - Київ: Видавництво Юрайт, 2022. - 407 с. 43. Зімін В.В. Штучний інтелект в інформаційній безпеці: навчальний посібник / В. В. Зімін. - Кемерово: Кузбасвузіздат, 2018. - 499 с. 44. Зиков Р.В. Роман із Data Science: як монетизувати великі дані / Зиков Роман. - Санкт-Петербург: Пітер: Прогрес книга, 2021. - 318 с. 45. Іванов Д. Б. Розробка системи управління даними: підручник / Іванов Д.Б. – Воронеж, 2018. – ВДУ, 2018. – 120 с. 46. Казакова, Н. А. Аналіз фінансової звітності. Консолідований бізнес: підручник/Н. А. Казакова. - Київ: Видавництво Юрайт, 2022. - 233 с. 47. Казанцев С.Я. Інформаційні технології: навчальний посібник / С. Я. Казанцев. – Київ: ЮНІТІ-Дана, 2020. – 351 с. 48. Калініна В. Н. Теорія ймовірностей та математична статистика: підручник для вузів/В. Н. Калініна. - 2-ге вид., перероб. та дод. - Київ: Видавництво Юрайт, 2022. - 472 с. 49. Камалова Г. Г. Технології аналізу даних: монографія / Камалова Гульфія Гафіятівна. – Саратов: Аміріт, 2019. – 160 с. 50. Келлехер Д., Тірні Б. Наука про дані: базовий курс / Джон Келлехер, Брендан Тірні. - Київ: Альпіна Паблішер, 2020. - 220 с. 51. Кілін П. М. Статистичні методи збору та обробки даних: 118 навчальний посібник/П. М. Кілін. - Харків: ТІУ, 2017. - 126 с. 52. Классен Р. К. Консервативні СУБД класу BigData з регулярним планом обробки запитів на кластерній платформі / Классен Роман Костянтинович. – Казань, 2019. – 26 с. 53. Котова Є. Є., Плахотніков Д. П. Введення в аналітику великих даних: навчально-методичний посібник/Є. Є. Котова, Д. П. Плахотніков. Санкт-Петербург: Вид-во СПбГЕТУ, 2021. - 47с. 54. Кошкаров А. В. Основи аналітики великих даних: навчально- методичний посібник/О. В. Кошкаров. – Астрахань: Сорокін Роман Васильович, 2018. – 75 с. 55. Кремер Н. Ш. Математична статистика: підручник та практикум / Н. Ш. Кремер. - Київ: Видавництво Юрайт, 2022. - 259 с. 56. Кувайскова Ю. Є., Клячкін В. Н. Статистичні методи прогнозування: навчальний посібник / Ю. Є. Кувайскова, В. Н. Клячкін. Ульяновськ: УлГТУ, 2019. – 197 с. 57. Кудрявцев, В. Б. Інтелектуальні системи: підручник та практикум для вузів / В. Б. Кудрявцев, Е. Е. Гасанов, А. С. Подколзін. - 2-ге вид., Випр. та дод. - Київ: Видавництво Юрайт, 2022. - 165 с. 58. Ліпіна О.І. Великі дані: прийняття рішень, етика: курс лекцій/ред.: О.І. Ліпіна, А.А. Квітки. – Рязань: Поліспектр, 2021. – 88 с. 59. Логачов М. С. Інформаційні системи та програмування. Адміністратор баз даних: підручник/М.С. Логачів. – Київ: ІНФРА-М, 2020. – 438 с. 60. Лук'янова Є. А., Шимкевич Є. М., Ляпунова Т. В. Статистичні методи аналізу: навчальний посібник / О.О. Лук'янова, Є.М. Шимкевич, Т.В. Ляпунова. – Київ: Російський університет дружби народів, 2020. – 116с. 61. Макаренко С. В. Методи аналітичної обробки даних, отриманих у результаті досліджень: навчальний посібник/С.В. Макаренка. Іркутськ: Вид-во Іркутського національного дослідницького технічного університету, 2021. – 91с. 119 62. Мамадалієва Л. Н., Хаконова І. М. Навчання математичним методам обробки експериментальних даних у руслі компетентнісного підходу: навчальний посібник / Л. Н. Мамадалієва, І. М. Хаконова. - Майкоп: ІП Кучеренко В. О., 2018. – 100 с. 63. Марц Н., Уоррен Д. Великі дані: принципи та практика побудови масштабованих систем обробки даних у реальному часі / Натан Марц, Джеймс Уоррен. – Київ: Вільямс, 2018. – 368 с. 64. Мінаєва Ю. В. Методи статистичного та інтелектуального аналізу даних: навчальний посібник / Ю. В. Мінаєва. – Вороніж: Воронезький державний технічний університет, 2017. – 90 с. 65. Миронов А.М. Машинне навчання: навчальний посібник/О.М. Миронів. – Київ: Макс-Прес, 2018. – 21 с. 66. Михайлов Г. А. Статистичне моделювання. Методи Монте- Карло: навчальний посібник для вузів / Г. А. Михайлов, А. В. Войтішек. Київ: Видавництво Юрайт, 2022. - 323 с. 67. Набережна Ж. Би., Набережна І. Би., Німгірова А.С. Кореляція / Ж.Б. Набережна, І.Б. Набережна, А.С. Німгірова. – Астрахань: Вид-во Астраханського державного медичного університету, 2017. – 40 с. 68. Назаров Д. М. Інтелектуальні системи: основи теорії нечітких множин: навчальний посібник для вузів/Д. М. Назаров, Л. К. Конишова. - 3-тє вид., Випр. та дод. - Київ: Видавництво Юрайт, 2022. - 186 с. 69. Нікіфоров С. Н. Аналіз бізнес-процесів: навчальний посібник / С.М. Никифоров. - Санкт-Петербург: СПбДАСУ, 2017. - 76с. 70. Основи технологій Big Data: навчальний посібник / В. В. Ухлова. - Воронеж: Видавничий дім ВДУ, 2020. – 80 с. 71. Парамонов І. Ю., Смагін В. А., Косих Н. Є., Хомоненко О. Д. Методи та моделі дослідження складних систем та обробки великих даних: монографія / І. Ю. Парамонов, В. А. Смагін, Н. Є. Косих, А. Д. Хомоненко. Санкт-Петербург: ЛАНЬ, 2020. - 234с. 120 72. Першина Є. Л., Чуканов С. Н. Машинне навчання [Електронний ресурс]: монографія/Є.Л. Першина, С.М. Чуканів. - Київ: ФДБОУ ВО "Сібаді", 2017. - 258с. 73. Плас Д. В. Python для складних завдань: наука про дані та машинне навчання / Дж. Вандер Плас. - Санкт-Петербург: Пітер, 2020. - 572 с. 74. Політичний аналіз та прогнозування: підручник для вузів / за загальною редакцією В. А. Семенова. - 2-ге вид. - Київ: Видавництво Юрайт, 2022. - 433 с. 75. Поліщук Ю. В., Боровський А. С. Бази даних та їх безпека : навчальний посібник/Ю. В. Поліщук, А. С. Боровський. - Київ: ІНФРА-М, 2021. – 207 с. 76. Рожков Н. Н. Статистичні методи контролю та управління якістю продукції: навчальний посібник для вузів / Н. Н. Рожков. - Київ: Видавництво Юрайт, 2022. - 154 с. 77. Рудей Г. Ф. Статистичні методи аналізу: навчальний посібник / Г. Ф. Рудей. - Новосибірськ: Вид-во Сибірського державного університету шляхів сполучення, 2017. - 119с. 78. Ручкін В. Н., Костров Б. В., Свіріна А. Г. Системи штучного інтелекту. Нейросети та нейрокомп'ютери: підручник для студентів вищих навчальних закладів / В. Н. Ручкін, Б. В. Костров, А. Г. Свірина. – Київ: Курс, 2018. – 282 с. 79. Саричева Т. Ст, Іванова Д. Д., Фомічова Ю.П. Статистичні підходи до аналізу та прогнозування розвитку цифрової економіки в Російській Федерації та її регіонах: монографія / Саричева Тетяна Володимирівна, Іванова Дарія Дмитрівна, Фомічова Юлія Павлівна. Йошкар-Ола: Марійський державний університет, 2020. – 158 с. 121 80. Селеменєва Т. А., Крюкова М. С. Математичні методи обробки експериментальних даних: навчальний посібник / Т. А. Селеменєва, М. С. Крюкова. – Санкт-Петербург: Санкт-Петербурзький університет ДПС МНС України, 2019. – 166с. 81. Семеничев В. К., Кожухова В. Н., Коробецька А. А. Технології та інструментарій аналізу великих даних [Електронний ресурс]/В.К. Семеничев, В.М. Кожухова, А.А. Коробецька. - Самара: ФДБОУ ВО "СДЕУ", 2019. - 589с. 82. Сенько А. Робота з BigData у хмарах: обробка та зберігання даних з прикладами з Microsoft Azure / Олександр Сенько. - СанктПетербург: Пітер, 2019. - 445c. 83. Скієна С. С. Наука про дані: навчальний курс / Стівен С. Скієна. - Санкт-Петербург: Діалектика, 2020. – 543 с. 84. Станкевич Л. А. Інтелектуальні системи та технології: підручник та практикум / Л. А. Станкевич. - Київ: Видавництво Юрайт, 2022. - 397 с. 85. Токарєв В. В. Методи оптимізації: навчальний посібник для вузів / В. В. Токарєв. - Київ: Видавництво Юрайт, 2022. - 440 с. 86. Уат Д., Борхані Р., Катсаггелос А. Машинне навчання: основи, алгоритми та практика застосування / Джеремі Уатт, Реза Борхані, Аггелос Катсаггелос; переклад з англійської Андрія Логунова. – Санкт-Петербург: БХВ-Петербург, 2022. – 612 с. 87. Шкурко В.Є. Статистичні дослідження у сферах підприємництва та економічної безпеки: навчальний посібник / В.Є. Шкірка. - Єкатеринбург: Вид-во Уральського університету, 2020. - 172с. 88. Шолле Ф. Глибоке навчання на Python / Франсуа Шолле. - Санкт- Петербург: Пітер, 2019. – 397 с. 89. Шорохова І. С., Марієв О. С., Кисляк Н. В. Статистичний аналіз економічних даних: навчальний посібник / І. С. Шорохова, О. С. 122 Марієв, Н. В. Кисляк. - Єкатеринбург: Вид-во Уральського університету, 2021. - 338 с. 90. Ин А., Су К. Теоретичний мінімум по Big Data: все, що потрібно знати про великі дані / Анналін Ин, Кеннет Су. - Санкт-Петербург: Пітер, 2020. – 205 с. 91. Яковлєв, В. Б. Статистика: навчальний посібник для вузів / В. Б. Яковлєв. - 2-ге вид., Випр. та дод. - Київ: Видавництво Юрайт, 2022. 353 с. 92. Ямпільська, Д. О. Маркетинговий аналіз: технологія та методи проведення: підручник та практикум для вузів / Д. О. Ямпільська, А. І. Пилипенка. - Київ: Видавництво Юрайт, 2022. - 268 с. 123