МАШИННОЕ ОБУЧЕНИЕ ДЛЯ ЧАЙНИКОВ Выполнил Бурдаев М.А ПИ-11 Преподаватель ОГЛАВЛЕНИЕ РАЗБИРАЕМСЯ С ТЕРМИНАМИ • Искусственный интеллект — название всей области знаний. • Машинное обучение — это раздел искусственного интеллекта. • Нейросети — самый популярный вид машинного обучения. ТРИ КИТА МАШИННОГО ОБУЧЕНИЯ • Цель машинного обучения — предсказать результат по входным данным. Чем разнообразнее входные данные, тем проще машине найти закономерности и тем точнее результат. • Данные • Признаки • Алгоритм ДАННЫЕ • Способы сбора данных: • Вручную (долго, мало, безошибочно) • Автоматически. • Использование пользователей для бесплатной разметки ПРИЗНАКИ • Features • Признак ВВЕДЕНИЕ • Понятие машинного обучения. Машинное обучение это ветвь развития искусственного интеллекта, которая предусматривает не использование машиной заранее написанного алгоритма, а обучению её методам написания этого алгоритма. ЗАДАЧИ МАШИННОГО ОБУЧЕНИЯ • Задача Регрессии • Задача Классификации • Задача Кластеризации • Задача Уменьшения размерности • Задача Выявления аномалий ЗАДАЧА РЕГРЕССИИ • Это прогноз на основе выборки объектов с различными признаками. • На вход подаются данные о объектах, обладающих различными признаками. • На выходе обязательно должно получиться вещественное число (2, 35, 4.8 и др) • Простые примеры цена квартиры, стоимость ценной бумаги через полгода. ЗАДАЧА КЛАССИФИКАЦИИ • Это получение категориального ответа на основе набора признаков. • Имеет конечное количество ответов (как правило, в формате «да» или «нет»). • Простые примеры. Изображён ли на фотографии кот, есть ли на фотографии конкретный человек. ЗАДАЧА КЛАСТЕРИЗАЦИИ • Это распределение данных на группы. • На вход подаются данные о некоторых объектах. • На выходе получаются группы, сформированные из объектов, на основе совпадающих признаков. • Простые примеры. Распределение котов по цвету (чёрный, белый, рыжий и др.), распределение живых существ по царствам (грибы, растения, животные и пр.) УМЕНЬШЕНИЕ РАЗМЕРНОСТИ • Это сведение большого числа признаков к меньшему (обычно 2–3) для удобства их последующей визуализации. • На входе подаются данные об объектах. • На выходе получаются ключевые признаки объекта(позволяющие отличить его от других) • Простой пример. Отделение людей от котов по внешним признакам.(таким ключевым признаком будет наличие хвоста.) ЗАДАЧА ВЫЯВЛЕНИЯ АНОМАЛИЙ • Это отделение аномалий от стандартных случаев. • Не является задачей классификации • Простой пример. Единственный пятнистый кот среди одноцветных. МЕТОДЫ МАШИННОГО ОБУЧЕНИЯ • Обучение с учителем • Обучение без учителя • Обучение с подкреплением ОБУЧЕНИЕ С УЧИТЕЛЕМ • Обучение происходит методом стимул-реакция. • для каждого обучающего объекта принудительно задаётся «правильный ответ», и требуется найти зависимость между стимулами и реакциями системы. • В результате многократного повторения вырабатывается алгоритм, с помощью которого нужно обработать данные чтобы получить требуемый результат с нужной точностью. • Пример: выяснить является ли письмо спамом. ОБУЧЕНИЕ БЕЗ УЧИТЕЛЯ • Испытуемая система спонтанно обучается выполнять поставленную задачу, без вмешательства со стороны экспериментатора. • Как правило, это пригодно только для задач, в которых известны описания множества объектов (обучающей выборки), и требуется обнаружить внутренние взаимосвязи, зависимости, закономерности, существующие между объектами. • Пример: соединение негативного и позитивного отзыва в интернете. ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ • Чаще относится к обучению с учителем, хотя этим учителем и не является человек. • Испытуемая система (агент) обучается, взаимодействуя с некоторой средой. Откликом среды (а не специальной системы управления подкреплением, как это происходит в обучении с учителем) на принятые решения являются сигналы подкрепления.