Uploaded by Екатерина Елизарова

Л4 Этапы разработки модели машинного обучения

advertisement
Тема Этапы разработки модели машинного обучения
Цель: познакомиться с этапами разработки модели машинного обучения.
ТЕОРЕТИЧЕСКИ МАТЕРИАЛ
Машинное обучение (МО) — это область искусственного интеллекта (ИИ), которая фокусируется
на разработке систем, которые обучаются на данных, которые они потребляют, для повышения своей
производительности. Большинство приложений ИИ выполняются с моделями машинного обучения, и
большинство новичков не знают, что существует пошаговый процесс создания модели машинного
обучения.
Пошаговый подход к построению модели машинного обучения:
1) Понимание проблемы. Понимание проблемы – это первый шаг в создании модели машинного
обучения. Как только проблема будет понята, мы получим структурированный способ ее решения.
2) Сбор данных. Практика сбора и получения данных из различных источников называется
сбором данных. Данные должны собираться и храниться в форме, которая имеет смысл для
рассматриваемой проблемы, чтобы их можно было использовать для разработки жизнеспособных
решений в области искусственного интеллекта (ИИ) и машинного обучения. Точность модели машинного
обучения зависит от данных, используемых для их обучения. Различные веб-сайты служат источником
данных для проектов машинного обучения, например, Kaggle, Zindi, Репозиторий машинного обучения
UCL.
3) Предварительная обработка данных. Поскольку мы знаем, что не можем работать с
необработанными данными, мы должны преобразовать данные в понятный формат путем
предварительной обработки данных. Существуют различные методы предварительной обработки для
различных типов данных. Предварительная обработка данных считается одним из важнейших этапов
разработки модели машинного обучения, поскольку она подготавливает данные наиболее осмысленным
образом для последующего моделирования данных.
4)Моделирование данных. На данный момент данные готовы для обучения и тестирования.
Теперь мы можем выбрать модель и обучить данные на ней. Что касается выбора модели. Вы можете
выбрать из множества моделей на основе ваших данных. Процесс выбора модели включает
классификацию, регрессию, кластеризацию и другие методы. Теперь вам потребуется обучить наборы
данных, чтобы они работали без сбоев. На этапе обучения и тестирования модели машины используется
несколько алгоритмов и методик.
5) Оценка модели. Результаты модели можно использовать для оценки модели. Оценка модели
выполняется с использованием показателей оценки, таких как показатель точности,
среднеквадратическая ошибка (RMSE), показатели путаницы, отчет о классификации,
среднеквадратическая ошибка (MSE) и т. д., чтобы можно было проверить качество данных. Этот этап
гарантирует, что модель машинного обучения имеет высокую производительность.
6) Улучшение модели. После проверки производительности вашей модели путем ее оценки с
помощью некоторых показателей может быть улучшение, если модель работает не так, как ожидалось.
7) Развертывание модели. Теперь модель готова к запуску в производство, чтобы проверить,
как она работает в реальном мире.
ПРАКТИЧЕСКАЯ РАБОТА
Пример. Применение машинного обучения в медицине
С точки зрения машинного обучения, пациенты — это объекты. Симптоматика заболеваний,
анализы, история болезни, лечебный протокол — это признаки. Их можно классифицировать по
категориям.
Бинарные признаки: пол, наличие или отсутствие того или иного симптома. Порядковый признак:
степень тяжести заболевания. Количественные признаки: возраст, вес, ключевые показатели здоровья
(артериальное давление, пульс и т.п.). Все перечисленные и другие необходимые данные загружаются
в компьютер. Благодаря использованию машинного обучения решается широкий спектр задач. Среди
них:

выявление основных симптомов, которые присущи заболеванию;

постановка диагноза на основании вычлененных данных;

подбор самой оптимальной тактики лечебной терапии;

прогноз развития заболевания, его длительности, перспектив выздоровления или
ремиссии;

расчет наиболее вероятных осложнений.
Нет такого врача, который мог бы мгновенно проанализировать большой объем информации по
каждому пациенту и тут же поставить диагноз, а также назначить наиболее эффективную лечебную
терапию. Именно поэтому внедрение машинного обучения в медицине является очень актуальным и
востребованным направлением.
Задачи медицинской диагностики
Объект - пациент в определённый момент времени.
Классы: диагноз или способ лечения, или исход заболевания.
Примеры признаков:
бинарные: пол, головная боль, слабость и т.д.
порядковые: тяжесть состояния, желтушность и т.д.
количественные: возраст, пульс, артериальное
давление, содержание гемоглобина в крови и т.д.
Особенности задачи:
обычно много “пропусков” в данных;
нужен
интерпретируемый
алгоритм
классификации;
нужна оценка вероятности (риска | успеха |
исхода).
Имеются данные о 114 лицах с заболеванием
сердца: у 61 - проблемы, у 53 - нет проблем.
Для каждого пациента известны показатели:
pulse - пульс,
H - содержание гемоглобина в крови.
Можно ли научиться предсказывать (допуская
небольшие ошибки) наличие проблем по pulse и
H у новых пациентов?
Задания:
1)
Приведите пример применения машинного обучения в разведке и оценке местоположения
полезных ископаемых.
2)
Приведите пять своих примеров где и как может применяться машинное обучение.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1)
В чем суть машинного обучения?
2)
Какие задачи решает машинное обучение?
3)
Назовите преимущества и недостатки машинного обучения.
4)
Для чего необходимо определять цель и задачи машинного обучения?
5)
В чем заключаются отличия цели от задач машинного обучения?
6)
Какие существуют метрики для оценки результата машинного обучения?
7)
На что следует обращать внимание при сборе и подготовке данных для машинного
обучения?
8)
Что такое модели машинного обучения?
9)
Какие бывают модели машинного обучения?
10)
От чего зависит выбор вида модели машинного обучения?
11)
Как понять, что модель машинного обучения готова к настоящей работе
12)
Какие методы обычно используются для проверки качества самой модели машинного
обучения?
Download