Uploaded by korolkostya1999

Использование Python в области бизнес-аналитики

advertisement
2. Использование Python в области бизнес-аналитики
Python широко используется и является одним из лучших языков
программирования для:
 науки о данных (Data science),
 веб-разработки,
 системного администрирования,
 написания сценариев автоматизации и многого другого.
Python позволяет пользователям хранить данные, получать к ним
доступ и манипулировать ими. Существует множество пакетов с открытым
исходным кодом и библиотек, в которых можно использовать Python для
разных целей.
Python является одним из самых популярных языков для бизнесаналитики сегодня и продолжает набирать популярность с удивительной
скоростью. Обычно его считают одним из самых простых языков для чтения
и изучения - его синтаксис программирования прост, а команды имитируют
английский язык.
Основные области бизнес-аналитики?
BI и информационные панели (описательная аналитика)
Одной из основных целей бизнес-аналитики является описание того,
что произошло, чтобы понять тенденции и оценить показатели с течением
времени. Это поле называется описательной аналитикой и обычно
выполняется аналитиками данных.
Аналитики данных часто используют Python для описания и
классификации данных, которые существуют в настоящее время. Они
занимаются разведочным анализом данных, который включает в себя
профилирование данных, визуализацию результатов и создание наблюдений
для формирования следующих этапов анализа. Python может использоваться
для манипулирования данными (с использованием таких библиотек, как
pandas), оптимизации рабочих процессов и создания визуализаций (с
использованием Matplotlib).
Машинное обучение (прогнозная аналитика)
Другая цель бизнес-аналитики - подготовиться к будущему, предсказав,
что произойдет. Это поле известно как прогнозная аналитика. Машинное
обучение - это отрасль прогнозирующей аналитики, которая использует
оптимизированные
статистические
алгоритмы
для
прогнозирования
будущего на основе существующей информации и выявления взаимосвязей и
идей.
Python быстро становится популярным языком машинного обучения и
используется для создания моделей для байесовских сетей, деревьев решений
и многого другого. Google TensorFlow - это популярная библиотека Python,
которую многие исследователи данных используют для быстрого доступа ко
многим алгоритмам контролируемого и неконтролируемого машинного
обучения.
Наука принятия решений (предписывающая аналитика)
Предписывающая аналитика, также известная как наука о принятии
решений, является последней фазой бизнес-аналитики, которая предвидит,
что, когда и почему произойдут определенные результаты, и определяет, что
делать с этой информацией. Он применяет данные к процессу принятия
решений.
Специалисты по принятию решений строят свой анализ данных вокруг
проблем бизнеса и используют многие из тех же методов и инструментов,
что и специалисты по данным. Их цель состоит в том, чтобы сделать идеи
полезными для использования, поэтому их модели и методы визуализации
должны быть построены для передачи этих идей. Python обычно
используется для создания инструментов предписывающей аналитики, таких
как глубокое обучение, которое использует искусственные нейронные сети
для оптимизации результатов.
Причины популярности Python
1) Python стал фактическим стандартом для прикладного машинного
обучения. В настоящее время существует больше вакансий для
специалистов по данным и машинного обучения, которые знают Python,
чем для всех других языков вместе взятых.
Одной из главных причин широкого распространения Python является его
простота.
2) Вторая и, возможно, главная причина популярности Python - это
библиотеки. Библиотека в Python - это группа предварительно связанного
кода, который вы можете импортировать в свою среду для расширения
функциональности языка. Существуют библиотеки практически для каждого
аспекта прикладного машинного обучения. Например, Pandas - это
библиотека для массирования данных. SciKit-Learn - универсальная
библиотека для построения традиционных моделей. matplotlib - для
визуализации и Keras - для построения моделей глубокого обучения.
3) Третья причина, по которой Python остается популярным - это
Jupyter Notebook. Jupyter Notebooks - это мощный способ написания кода на
Python. Jupyter Notebook - это веб-интерфейс, который позволяет быстро
создавать прототипы и совместно использовать проекты, связанные с
данными. Вместо того, чтобы писать и переписывать всю программу, вы
можете писать строки кода и запускать их по одной или небольшими
партиями. Это облегчает отладку и понимание кодирования.
История Python
Разработка языка Python была начата в конце 1980-х годов сотрудником
голландского института CWI Гвидо ван Россумом. Для распределённой ОС
Amoeba требовался расширяемый скриптовый язык, и Гвидо начал писать
Python на досуге, позаимствовав некоторые наработки для языка ABC (Гвидо
участвовал в разработке этого языка, ориентированного на обучение
программированию). В феврале 1991 года Гвидо опубликовал исходный текст
в группе новостей alt.sources. С самого начала Python проектировался как
объектно-ориентированный язык.
Название языка произошло вовсе не от вида пресмыкающихся. Автор
назвал язык в честь популярного британского комедийного телешоу 1970-х
«Летающий цирк Монти Пайтона». Впрочем, всё равно название языка чаще
связывают именно со змеёй, и даже эмблема на сайте python.org (до выхода
версии 2.5) изображают змеиные головы. Важная цель разработчиков Python создавать его забавным для использования. Это отражено в его названии,
которое пришло из Монти Пайтона.
Версии Python
3 декабря 2008 года, после длительного тестирования, вышла первая
версия Python 3000 (или Python 3.0, также используется сокращение Py3k). В
Python 3000 устранены многие недостатки архитектуры с максимально
возможным (но не полным) сохранением совместимости со старыми
версиями Python. На сегодня поддерживаются обе ветви развития (Python 3.x
и 2.x).
Возможности Python
Вот лишь некоторые вещи, которые умеет делать python:
 Работа с xml/html файлами
 Работа с http запросами
 GUI (графический интерфейс)
 Создание веб-сценариев
 Работа с FTP
 Работа с изображениями, аудио и видео файлами
 Робототехника
 Программирование математических и научных вычислений
Простота и универсальность python делают его одним из лучших языков
программирования.
Философия Python
Разработчики языка Python придерживаются определённой философии
программирования, называемой «The Zen of Python» («Дзен Питона», или
«Дзен Пайтона»). Её текст выдаётся интерпретатором Python по команде
import this (работает один раз за сессию). Автором этой философии считается
Тим Петерс (Tim Peters).
Текст философии:
 Красивое лучше, чем уродливое.
 Явное лучше, чем неявное.
 Простое лучше, чем сложное.
 Сложное лучше, чем запутанное.
 Плоское лучше, чем вложенное.
 Разреженное лучше, чем плотное.
 Читаемость имеет значение.
 Особые случаи не настолько особые, чтобы нарушать
правила.
 При этом практичность важнее безупречности.
 Ошибки никогда не должны замалчиваться.
 Встретив двусмысленность, отбрось искушение угадать.
 Должен существовать один — и, желательно, только один —
очевидный способ сделать это.
 Хотя он поначалу может быть и не очевиден, если вы не
голландец.
 Сейчас лучше, чем никогда.
 Хотя никогда зачастую лучше, чем прямо сейчас.
 Если реализацию сложно объяснить — идея плоха.
 Если реализацию легко объяснить — идея, возможно, хороша.
Download