Министерство образования Республики Беларусь Учреждение образования БЕЛОРУССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАТИКИ И РАДИОЭЛЕКТРОНИКИ Инженерно-экономический факультет Кафедра программного обеспечения информационных технологий Дисциплина «Метрология, стандартизация и сертификация в информационных технологиях» ПРАКТИЧЕСКОЕ ЗАНЯТИЕ №1 МОДЕЛИ НАДЕЖНОСТИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ Выполнила: Студентка группы №073903 Полоз Анастасия Андреевна _________________________ подпись, дата Проверил: Давыдовский Анатолий Григорьевич ________________________ подпись, дата Минск 2021 1. Тема практического занятия №1: Алгоритм сбора и обработки данных с помощью google trends. 2. Цель работы: с помощью "Google Trends" собрать данные по стране, обработать, выполнить их анализ. 3. Теоритические сведения: Вариация – колеблемость или изменяемость величин признака у единиц совокупности. Классификация показателей вариации 1. К абсолютным показателям вариации относятся размах вариации, среднее линейное отклонение, дисперсия и среднеквадратическое отклонение. Вторая группа показателей вычисляется, как отношение абсолютных показателей к средней арифметической (медиане). 2. Относительными показателями вариации являются коэффициенты осцилляции, вариации, относительное линейное отклонение и др. Корреляция (от лат. correlatio – соотношение). 1. Мера степени и направления связи между значениями двух переменных. 2. Статистический показатель вероятности связи между двумя переменными, измеренными в количественной шкале. Корреляционный анализ. Проверка гипотез о связях между переменными с использованием коэффициентов корреляции [6. С. 147]. Коэффициент корреляции (r). 1. Количественная мера силы и направления вероятностной взаимосвязи двух переменных; принимает значения в диапазоне от -1 до +1 . 2. Мера прямой или обратной пропорциональности между двумя переменными. 3. Двумерная описательная статистика, количественная мера взаимосвязи (совместимой изменчивости) двух переменных. 4. Задание для выполнения практического занятия: 1) Войти на сайт сервиса "Google Trends" по адресу: https://trends.google.com/trends/?geo=BY 2) Ввести инвариантный информационный запрос в (1 из 25 поисковых запросов) 3) Ввести последовательно оставшиеся 24 поисковых запроса - в 6 этапов, по 4 запроса в каждом этапе 4) Скачать результаты поиска в формате CSV и сохранить на электронный носитель (hard-диск или flash-карту) 5) Осуществить сравнительный анализ каждого информационного запроса по регионам 6) Скачать результаты поиска в по каждому информационному запросу по регионам в формате CSV и сохранить на электронный носитель (hard-диск или flash-карту) 7) Скачать результаты поиска в по каждому информационному запросу по лидерам запросов в формате CSV и сохранить на электронный носитель (hard-диск или flash-карту) 8) Информационные запросы вводятся на английском языке. 9) Выбор номера страны и перечне информационных запросов для поиска осуществляется в соответствии с номером фамилии студента (студентки) в списке группы (номер фамилии в списке группы = номеру страны в перечне стран) 10) Открыть CSV-файл в EXCEL-книге в формате «Excel 97-2003» по следующей схеме: 11) «Данные» → «Импорт» → «Из текста» → «Импорт» → → «Выставить флажок «С разделителями» → «Далее» → → «Выставить флажки «Знак табуляции», «Точка с запятой», «Запятая»» → → «Далее» → «Общий» → «Готово» → «Импорт данных» → «ОК». 12) Получить набор вариационных рядов результатов информационных поисков для выбранной страны. 13) Рассчитать среднее значение , моду, медиану, среднее квадратическое отклонение для каждого полученного вариационного ряда. 14) Составить таблицу показателей корреляций вариационных рядов (по критерию Спирмена). 15) Сохранить результаты в таблице EXCEL-книге в формате «Excel 97-2003». 16) Подготовить краткий отчет по результатам статистического анализа результатов поиска. 17) Создать zip-архив с материалами поиска в EXCEL-книге в формате «Excel 97-2003» и отчета в формате .doc. 18) Подписать архив: №группы_ПЗ№1а_фамилия_имя 19) Отправить архив на e-mail : agd2011@list.ru Примеры: 5. Были заданы 24 информационных запроса в системе «Google trends» по стране Китай в 6 этапов по 4 запроса, проведены расчёты среднего значения, моды, медианы, среднего квадратического отклонения для каждого полученного вариационного ряда, была составлена таблица показателей корреляций вариационных рядов по методу Спирмена. Протокол выполнения практического занятия: 6. ПЕРВЫЙ ЭТАП среднее значение мода медиана среднее квадратиче ское отклонение 3D printer: (Казахст ан) 15,84615 385 0 0 22966,76 923 3D Printer / Additive Manufacturing Additive Manufacturi ng: Alternative Energy: Prozac: (Казахстан) (Казахстан) (Казахстан) 6,403846154 1,346153846 1,307692308 0 0 0 0 12216,51923 2643,769231 2615,076923 Корелляционный анализ Additive Manufacturing / Alternative Energy -0,066134124 обратная пропорциональность 0 0 3D Printer / Prozak -0,078877551 обратная пропорциональность -0,087426233 обратная пропорциональность ВТОРОЙ ЭТАП Smart House: (Казахстан) Smart City: (Казахстан) среднее значение мода медиана 8 0 0 Virtual Reality: (Казахстан) Smart Plant: (Казахстан) 0 0 0 0 0 0 6,961538462 0 0 среднее квадратичес кое отклонение 8608 15239,92308 0 0 корреляционный анализ Smart House/Virtual Reality -0,205088118 обратная пропорциональность ТРЕТИЙ ЭТАП среднее значение мода медиана среднее квадратическ ое отклонение Cryptocurre Customer Management Cybersecurit ncy: Relationship: : y: (Казахстан) (Казахстан) (Казахстан) (Казахстан) 4,076923077 0,307692308 46,80769231 1,153846154 0 4 0 0 50 47,5 0 0 887,6923077 43,07692308 8124,076923 284,7692308 корреляционный анализ Cryptocurrency/Cybers Management / Customer ecurity Relationship 0,034577001 0,008582054 прямая прямая пропорциональность пропорциональность Cybersecurity / Management 0,097657449 прямая пропорциональность ЧЕТВЁРТЫЙ ЭТАП Deep machine Information Cyborg: learning: Revolution: Resources: (Казахстан) (Казахстан) (Казахстан) (Казахстан) 1,173076923 2,076923077 49,30769231 среднее 0 значение 0 0 0 49 мода 0 0 0 50 медиана 541,4423077 871,6923077 32663,07692 среднее 0 квадратичес кое отклонение корреляционный анализ Deep machine learning / Resources / Deep Cyborg machine learning Cyborg/Resources 0,119523529 -0,065337642 0,049938306 Прямая пропорциональность обратная пропорциональность Прямая пропорциональность ПЯТЫЙ ЭТАП среднее значение мода медиана среднее квадратическ ое отклонение Information Information Information Security: Society: Technology: (Казахстан) (Казахстан) (Казахстан) 7,711538462 1,230769231 20,78846154 0 0 0 0 0 9 14390,67308 Internet of Things / Information Society 0,164122839 прямая пропорциональность ШЕСТОЙ ЭТАП 2257,230769 Internet of Things: (Казахстан) 12,26923077 0 0 40012,67308 21780,23077 корреляционный анализ Information Security / Information Technology / Information Society Internet of Things -0,086594931 обратная пропорциональность 0,185392591 прямая пропорциональность среднее значение мода медиана среднее квадратическо е отклонение Manageme Human nt: Resources: (Казахста (Казахстан) н) 46,8076923 0,538461538 1 0 0 50 47,5 8124,07692 64,92307692 3 Industry 4.0: (Казахста н) 0,6730769 23 Industry Internet of Things: (Казахстан) 0 0 637,44230 77 0 0 0 0 корреляционный анализ Human Industry 4.0 / Human Management/Industry Resources/Management Resources 4.0 -0,044909265 -0,092640895 -0,231699434 обратная обратная обратная пропорциональность пропорциональность пропорциональность 7. Заключение: Проведя анализ данных на первом этапе, я выяснила, что из четырёх предложенных категорий самой большой популярностью пользуется категория «3D printer». Результаты корреляционного анализа показали, что зависимости «3D Printer / Additive Manufacturing», «Additive Manufacturing / Alternative Energy» и «3D Printer / Prozak» обратно пропорциональны. Второй этап показал: из четырёх предложенных категорий самой большой популярностью пользуется категория «Smart City», категории «Smart House» и «Smart Plant» не пользуются спросом. Результаты корреляционного анализа показали, что зависимость между категориями «Smart House» и «Virtual Reality» обратно пропорциональна. На третьем этапе из четырёх предложенных категорий самой большой популярностью пользуется «Management», категория «Customer Relationship» не пользуется спросом. Результаты корреляционного анализа показали, что зависимость между категориями «Cryptocurrency» и «Cybersecurity» прямо пропорциональна, «Management» и «Customer Relatioship» прямо пропорциональны пропорциональны, «Cybersecurity» и «Management» имеют также прямую пропорциональносоть. Результаты, полученные на четвёртом этапе, показали, что из четырёх предложенных категорий самой большой популярностью пользуется категория «Resources», категория «Information Revolution» не пользуется спросом. Результаты корреляционного анализа показали, что зависимость между категориями «Resources» и «Deep machine learning» обратно пропорциональна, «Cyborg» и «Resources» обратно пропорциональна, «Deep machine learning» и «Cyborg» - прямо пропорциональны. Проведя анализ данных на пятом этапе, я выяснила, что из четырёх предложенных категорий самой большой популярностью пользуется категория «Information Technology», категория «Information Society» практически не пользуется спросом. Результаты корреляционного анализа показали, что зависимость между категориями «Internet of Things» и «Information Security» прямо пропорциональна, «Information Security» и «Information Security» имеют обратную пропорциональность, «Information Technology» и «Internet of Things» – прямая пропорциональность. Проведя анализ данных на шестом этапе, я выяснила, что из четырёх предложенных категорий самой большой популярностью пользуется категория «Management», категория «Industry Internet of Things» не пользуется спросом. Результаты корреляционного анализа показали, что зависимость между категориями «Human Resources» и «Management» обратно пропорциональна, «Industry 4.0» и «Human Resources» - обратно пропорциональна, «Management» и «Industry 4.0» также обратно пропорциональна. 8. Выводы: В ходе практического занятия №1 я научилась собирать данные для конкретной страны с помощью сервиса «Google Thrends», обрабатывать и анализировать их, познакомилась с такими понятиями, как корреляция, эффект и коэффициент корреляции.