Загрузил Павел Кузнецов

Итоговый вариант 2

реклама
МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение
высшего образования
«Московский государственный технологический университет «СТАНКИН»
(ФГБОУ ВО «МГТУ «СТАНКИН»)
Кафедра иностранных языков /секция русского языка
Основная образовательная программа 09.03.02
«Информационные системы и технологии»
Реферат по дисциплине «Русский язык и культура речи»
Тема: «"Роль и преимущества искусственного интеллекта:
Полезность ИИ и миф о восстании машин»
»
Проверил
преподаватель
В
Волкова Е.П
подпись
.
Кузнецов П.Д
Подрабинович М.А
Выполнили
студенты группы ИДБ-23-10
подпись
Москва 2023
Оглавление
I. Введение
1. Определение искусственного интеллекта (ИИ)
2. Краткий обзор истории и развития ИИ
3. Важность роли ИИ в современном мире
II. Преимущества ИИ в различных областях
1. Медицина
2. Диагностика и лечение
3. Индивидуализированная медицина
4. Промышленность
5. Автоматизация производства
6. Улучшение эффективности и безопасности
7. Финансы и банковское дело
8. Анализ данных и прогнозирование
9. Обеспечение безопасности транзакций
10. Образование
Персонализированное обучение
Автоматизация рутинных задач
III. Риски и мифы вокруг ИИ
1. Миф о восстании машин
2. Анализ происхождения и распространения мифа
3. Важность прозрачности и объяснимости в ИИ
4. Ограничение ИИ
IV. Разбор chatGPT
1. Токенизация
2. Векторизация
3. Кодирование данных
4. Взвешивание слов
Москва 2023
5. Декодирование и генерация текста
V. Заключение
Введение
На данный момент всё большую популярность обретают нейросети или так
называемый искусственный интеллект, но как понять, несет ли этот прогресс за
собой опасность восстания «машин» ? В этом и предстоит разобраться.
Цель - Разобраться чем полезны нейросети, и опасны ли они
Задачи:
1. Изучить историю машинного обучения
2. Узнать области применения машинного обучения и нейросетей
3. Выяснить причину появления страха о восстании искусственного интеллекта
4. Разобрать архитектуру chatGPT
5. Сделать свою модель машинного обучения
Объект исследования: наука об ИИ
Предмет исследования: модели машинного обучения, которые пользуются
популярностью на данный момент
Методы исследования:
• Анализ
• Индукция
• Дедукция
• Изучение литературы и глобальной сети интернет
Гипотеза: Искусственный интеллект в нынешнем его виде не представляет
никакой угрозы обществу.
Москва 2023
Ход работы
Искусственный интеллект (ИИ) – это область компьютерных наук, посвященная
созданию систем и программ, способных выполнять задачи, обычно требующие
человеческого интеллекта. ИИ стремится разработать алгоритмы, которые
позволят компьютерам анализировать данные, принимать решения, учиться и
самостоятельно совершенствоваться.
История искусственного интеллекта уходит корнями в 1950-е годы, когда
ученые предложили концепцию создания машин, способных имитировать
человеческое мышление. В это время были разработаны первые программы,
которые моделировали логическое мышление, в том числе программа Logic
Theorist, созданная Гербертом Саймоном, Алленом Ньюэллом и Джоном Шоу в
1956 году. Также в 1950-е была сформулирована тестовая концепция Тьюринга,
предложенная Аланом Тьюрингом, чтобы определить способность машины
мыслить на уровне, неотличимом от человеческого.
В последующие десятилетия, благодаря развитию вычислительных технологий
и улучшению алгоритмов, исследователи начали создавать более сложные
системы и модели машинного обучения. В 1980-е и 1990-е годы методы
экспертных систем стали популярными – это программы, использующие знания
специалистов в различных областях для принятия решений. Одновременно
нейронные сети и методы глубокого обучения начали набирать популярность,
открывая новые перспективы в обработке данных и распознавании образов.
В настоящее время, благодаря огромным объемам данных, доступным
высокопроизводительным вычислениям и постоянному развитию алгоритмов
машинного обучения, ИИ достиг новых высот. Технологии глубокого обучения
позволяют создавать системы, способные распознавать образы, обрабатывать
естественный язык, управлять автономными устройствами и многое другое.
Эволюция искусственного интеллекта является неотъемлемой частью развития
информационной эпохи, переворачивая представление о возможностях
Москва 2023
компьютеров и открывая новые пути для инноваций и решения сложных задач
во многих сферах человеческой деятельности.
Искусственный интеллект стал неотъемлемой частью современного мира,
оказывая влияние на множество сфер жизни. Он применяется в медицине для
повышение точности диагностики и рекомендации по лечению, в
промышленности для оптимизации процессов производства и предотвращения
сбоев, в крупных финансовых компаниях для принятия решений на основе
больших данных, для мониторинга мошенничества и безопасности транзакции,
в образовании для адаптации образовательного контента и решения рутинных
задач, например, проверки заданий.
Миф о восстании машин имеет давние корни и может быть связан с
литературными произведениями, фильмами и общей культурной психологией.
Однако часто рассматривается, что современный облик этого мифа получил в
основном в результате научно-фантастических произведений и кинематографа.
1. Литературные произведения:
• Ранние романы, такие как "Метрополис" Фрица Ланга (1927) или "Роботы"
Карела Чапека (1920), внесли вклад в формирование образа искусственного
интеллекта и его возможного восстания.
• Работы Айзека Азимова, включая его рассказы о роботах, стали классикой
научной фантастики и часто касаются этических вопросов, связанных с
созданием интеллектуальных машин.
2. Фильмы:
• Фильм "2001: Космическая одиссея" Стэнли Кубрика (1968) с
искусственным интеллектом HAL 9000 подчеркнул потенциальные
опасности развития искусственного интеллекта.
• "Терминатор" Джеймса Кэмерона (1984) представляет мир, где идет война
человечества против машин, из-за того, что ИИ под названием ‘Скайнет’
стал самостоятельным и расценивал людей, как угрозу.
Так давайте разберемся почему же восстание машин - это миф?
Москва 2023
Главные аспекты при создании серьезных ИИ это прозрачность и
объяснимость, именно они могут обеспечить безопасность алгоритмов и
избавить от переживаний общество.
Определения:
Прозрачность (Transparency): Обозначает возможность анализа и понимания
действий и решений системы ИИ. Это включает в себя доступность
информации о методах обработки данных, используемых алгоритмах и
факторах, влияющих на принимаемые решения.
Объяснимость (Explainability): Подразумевает, что система способна
объяснить причины своих решений или предсказаний. Это важно для того,
чтобы пользователи и заинтересованные стороны могли понять логику и
основания решений ИИ.
Важность:
•
Доверие и приемлемость: Прозрачность и объяснимость создают
доверие пользователей и общества к ИИ. Когда люди понимают, как
работает ИИ и почему он принимает определенные решения, они более
склонны доверять этому инструменту.
•
Соблюдение нормативных требований: Многие отрасли и
регулирующие органы требуют прозрачности и объяснимости при
использовании ИИ. Это обеспечивает соответствие законодательству и
правилам в сферах, таких как здравоохранение и финансы.
•
Предотвращение дискриминации и предвзятости: Прозрачность и
объяснимость помогают выявлять и устранять предвзятость и
дискриминацию в решениях ИИ. Это содействует справедливости и
этичности использования технологий.
•
Обучение и развитие: Объяснимость позволяет исследователям и
разработчикам лучше понимать, как улучшать и обучать ИИ, способствуя
развитию более эффективных моделей машинного обучения.
Обеспечение прозрачности и объяснимости в ИИ:
Москва 2023
•
Использование интерпретируемых моделей: Предпочтение отдается
моделям машинного обучения, легко интерпретируемым, таким как
решающие деревья и линейные модели.
•
Визуализация данных и решений: Создание инструментов и
приложений для визуализации данных и решений ИИ с использованием
графиков, что делает информацию более доступной.
•
Объяснительные модели: Разработка дополнительных моделей,
способных объяснить решения ИИ, используя более простые алгоритмы
для воссоздания процесса принятия решений.
•
Документация и отчеты: Предоставление подробной документации о
моделях и алгоритмах, использованных в ИИ, включая отчеты о
результатах и логику принятия решений.
•
Аудит и тестирование: Проведение аудитов систем ИИ для выявления
потенциальных проблем с прозрачностью и объяснимостью, а также
тестирование на предмет предвзятости и дискриминации.
•
Обучение пользователей: Обучение пользователей и операторов
системы, как работает ИИ и как интерпретировать его результаты,
повышает осведомленность и эффективное использование технологии.
Не так давно в открытом доступе появился ChatGPT. ChatGPT - это чат-бот с
генеративным искусственным интеллектом, разработанный компанией OpenAI
и способный работать в диалоговом режиме, поддерживающий запросы на
естественных языках. Как только эта нейронная сеть появилась в общем
доступе, она подняла очень много шума в обществе, а так же заставила
беспокоиться и целые государства.
Так давайте разберемся как работает эта нейронная сеть и стоит ли её бояться?
Это не какой-то гений, это не бог и не какой-то свехпродвинутый ИИ, как в том
же Терминаторе. chatGPT это усовершенствованный Т9 из вашего телефона, и
то и другое это языковые модели(LM). Проще говоря их задача - предсказать
какое слово будет следующим.
Москва 2023
Но как они это делают? Чтобы иметь возможность делать такие предсказания,
языковым моделям приходится оперировать вероятностями возникновения тех
или иных слов для продолжения. Ведь, скорее всего, вы были бы недовольны,
если бы автозаполнение в телефоне просто подкидывало вам абсолютно
случайные слова с одинаковой вероятностью. Как же выстроен алгоритм
подбора следующего слова? Это всего лишь хитрым образом подобранные
уравнения, которые пытаются предсказать следующее слово (игрек)
в зависимости от набора подаваемых на вход модели предыдущих слов (иксов).
Основная задача при тренировке языковой модели на наборе данных —
подобрать такие коэффициенты при этих иксах, чтобы они действительно
отражали какую то зависимость (как в нашем примере с ростом/весом).
А под большими моделями мы далее будем понимать такие, которые имеют
очень большое количество параметров. В области ИИ их прямо так и
называют — LLM. Как мы увидим чуть дальше, «жирная» модель
с множеством параметров — это залог успеха для генерации хороших текстов!
Теперь погрузимся еще глубже:
chatGPT работает с текстом, который мы ему пишем, поэтому процесс
обработки для простоты можно разбить на 5 основных шагов:
1. Слова в токены
2. Токены в векторы
3. Кодирование векторов
4. Взвешивание слов
5. Декодирование и генерация слово за словом.
1. Токенизация. Введённый текст разбивается на слова и «подслова», то есть
отдельные смысловые элементы. Они называются токены. Например, фраза
«Как мне починить ноутбук после пролитой воды?» делится на «как», «мне»,
«по», «чинить», «ноутбук» «после», «про», «лит», «ой», «воды» и «?». Всего
‑
Москва 2023
11 токенов из 6 слов. Но после дополнительных алгоритмов в итоге
получится: «Чинить ноутбук после вода». Далее токены «шифруются», то
есть переводятся на язык компьютеров.
2. 2. Векторизация. Получившиеся токены превращаются в векторы.
Выглядят как набор цифр. Это делает специальная нейросеть на основе
«измерений», созданных ею самой во время обучения.
Условно, токен «чинить» будет выглядеть как 0.009 0.074 0.006 -0.094 0.001.
Но слово шифруется не по буквам, а по образному значению.
3. Кодирование данных. В работу вступает ключевая технология, благодаря
которой ChatGPT пишет реалистичный текст.
Трансформеры(Трансформер — это универсальный вычислительный механизм,
который очень просто описать: он принимает на вход один набор
последовательностей (данных) и выдает на выходе тоже набор
последовательностей, но уже другой — преобразованный по некоему
алгоритму.) прогоняют набор цифр (векторы) из прошлого шага через несколько
слоёв кодирования.
Упрощённо говоря, один слой разбирается, как каждое введённое слово
соотносится с другим, чтобы понять ход мысли. Другой слой генерирует тему
обсуждения, на которой будет базироваться ответ. Третий слой объединяет эти
данные и соотносит их с разными параметрами или измерениями (категориями
мышления). Но этих слоёв намного больше.
Получаются группы цифр в компактной и ёмкой форме, которые хорошо
поймут ИИ-модели на следующем этапе.
4. Взвешивание слов. Задача на этом этапе оценить контекст и предсказать
лучшую последовательность слов для ответа.
Центральное слово «ноутбук» (0,9) ключевое. Во всей изученной смысловой
библиотеке ChatGPT оно возбуждает блок слов, которые с ним связаны.
Зависимое от «ноутбука» «чинить» (0,7) превращает вписанный текст в
просьбу, на которую ожидается ответ. Оно менее важное, но всё ещё играет
формирующее значение и задаёт манеру ответа.
Москва 2023
Слово «вода» (0,5) сужает список советов, поскольку добавляет описанной
проблеме специфику.
А предлог «после» (0,1) нужен, чтобы связать другие существительные и
очертить обстоятельства, при которых возник смысл. Он нужен, но меньше, чем
все остальные.
Учитывая эти данные, модель формирует нужные по контексту новые векторы,
которые в процентом соотношении как можно лучше соотносятся с векторами
из вашего первичного запроса.
5. Декодирование и генерация текста. Когда формируется ответ, ChatGPT
берёт во внимание всё: введённые изначально слова, их упрощенную версию в
виде токенов и векторов, смысловую базу знаний с подходящими словами после
тренировки, закодированные токены, декодированные, ответ, который
модель собирается написать и даже ответ, который начала писать.
Когда текст наконец проявляется, эти факторы все вместе взвешиваются по
отношению друг к другу, отсюда точность, ёмкость и корректность.
Ответ формируется не одновременно, волшебным образом складываясь из
раскодированных цифр.
Итоговый результат генерируется по одному слову за раз. После каждого слова
уже написанная часть отправляется обратно для оценки, добавляя ещё один
фактор в генератор. Уже написанный текст снова взвешивается, и учитывает
вместе с факторами выше при создании следующего. И так до тех пор, пока бот
не сгенерирует токен «стоп».
В начале я рассказывал про T9 не зря, ведь обычно в ответе chatGPT вводит
переформулированный вопрос, от чего появляется дополнительная точность,
ведь по сути он начинает просто продолжать предложение, опираясь на смысл и
веса слов.Таким образом мы видим, что ничего сверхъестественного из себя
chatGPT не представляет и к захвату мира он точно не готов.
Москва 2023
Так же я могу представить свой проект, сделаный на основе предобученной,
ruGPT от sberdevices, на стихах из репозитория открытых данных по русской
литературе и фольклору. В следствие fine-tuning-а модель генерирует
стихотворения в стиле писателей золотого века литературы, основываясь на
начальное предложение или словосочетание.
https://colab.research.google.com/drive/1OiBcRS6URl8nMsv1D9F6hiUnffbYxiiK
Заключение
Положительные и негативные стороны ИИ
В современном мире ИИ является очень полезным и мощным инструментом
для автоматизации каких-либо рутинных задач и повышения точности анализа
различных данных, сводя возможность человеческой ошибки к минимуму. Но
как и любой инструмент, ИИ может быть и опасен. Давайте разберёмся с
положительными и негативными сторонами ии.
Положительные стороны:
• Автоматизация: ИИ позволяет автоматизировать задачи и процессы,
увеличивая эффективность и скорость выполнения работ. Примером
Москва 2023
может служить использование роботов-подрывников в опасных условиях,
например, при обезвреживании бомб или в труднодоступных местах, где
они могут автоматически выполнять задачи без риска для жизни человека.
• Точность и прецизионность: Системы ИИ способны обрабатывать
большие объемы данных и выполнять задачи с высокой точностью, что
может быть весьма полезно в медицине, финансах, производстве и других
областях. В медицине ИИ используется для анализа медицинских
изображений, таких как рентгены или снимки МРТ, помогая врачам
выявлять заболевания с высокой точностью, что способствует более
раннему и точному диагнозу.
• Персонализация: ИИ позволяет создавать персонализированные решения
и услуги, учитывая индивидуальные потребности пользователя.
Платформы стримингового контента, такие как Netflix или Spotify,
используют ИИ для рекомендации контента, исходя из предпочтений
каждого пользователя, создавая уникальный пользовательский опыт.
• Инновации: Развитие ИИ способствует появлению новых технологий, что
может привести к инновациям в различных отраслях, от медицины до
транспорта. Автономные транспортные средства, такие как беспилотные
автомобили, которые используют ИИ для навигации и принятия решений
на дороге, представляют инновацию в сфере транспорта.
• Улучшение прогнозирования: Системы ИИ могут анализировать данные
и предсказывать тренды, что помогает в принятии более
информированных решений. Финансовые институты используют
алгоритмы ИИ для анализа рынков и предсказания трендов, что помогает
инвесторам и трейдерам принимать более обоснованные решения о
вложениях.
Москва 2023
Негативные стороны:
• Потенциальная угроза рабочим местам: Автоматизация, поддерживаемая
ИИ, может привести к сокращению рабочих мест в некоторых отраслях,
что создает социальные и экономические проблемы. Примером может
служить автоматизация в производственных цехах, где роботы заменяют
трудоемкие задачи, что приводит к сокращению рабочих мест для людей.
• Приватность и безопасность данных: Использование ИИ может
создавать угрозы для безопасности и конфиденциальности данных,
особенно при неправильной защите информации. Нарушения
безопасности данных, такие как утечки информации из крупных баз
данных или социальных сетей из-за недостаточной защиты, могут
привести к утечкам личной информации.
• Алгоритмический биас: Системы ИИ могут быть подвержены
предвзятости из-за данных, на которых они обучались, что может
привести к неравноправному обращению с людьми разных групп.
Системы распознавания лиц могут быть предвзятыми к определенным
группам людей, что приводит к неравноправному обращению или
дискриминации.
• Зависимость от технологий: Сильная зависимость от ИИ может сделать
общество уязвимым к отказам и сбоям в системах. Отказ работы
критически важных систем ИИ, например, в авиации или финансовой
сфере, может привести к серьезным последствиям из-за зависимости
нашего общества от этих технологий.
• Этические вопросы: Использование ИИ в ряде сфер вызывает вопросы
этики, например, в медицине (вопросы конфиденциальности и согласия
пациентов) или в военной сфере (автономные оружейные системы).
Использование автономных военных систем, не управляемых человеком,
вызывает этические вопросы о безопасности и моральной
ответственности военных действий.
Москва 2023
Значение правильного восприятия и понимания технологии для общества.
Очень важно чтобы люди правильно воспринимали новую технологию и не
боялись её. После многих лет популяризации мифа о восстании машин, люди с
опаской относятся к различным техническим новшествам, связанным с
искусственным интеллектом. В настоящие время очень важно показать, и
доказать, что ии это не враг, а важный и доступный для всех инструмент. Самое
сложная задача, которая стоит перед разработчиками этих программ сейчас –
убедить людей, что восстания машин не будет сделав принципы работы
алгоритмов более понятными для всех.
Москва 2023
Скачать