ChaosGPT — новая нейросеть без моральных и этических ограничений
Один из пользователей Auto-GPT, автономного приложения с открытым исходным кодом, работающим на базе GPT-4, создал свой собственный ИИ под названием ChaosGPT и попросил его попытаться «уничтожить человечество», «установить глобальное господство» и «достичь бессмертия». Автор дал нейросети некоторую свободу действий и разрешил пользоваться Google и даже делать общедоступные публикации в Twitter.
Демонстрация работы ChaosGPT
Видео этого процесса , опубликованное несколько дней назад, представляет собой захватывающий взгляд на текущее состояние искусственного интеллекта с открытым исходным кодом. Некоторые интернет-пользователи остались в ужасе от этого эксперимента, однако текущее воздействия этого бота на реальный мир — лишь несколько постов в аккаунте Twitter .
Твиты ChaosGPT (переведено с английского)
ChaosGPT использует для своей работы свежий проект под названием Auto-GPT , который предназначен для создания систем на основе ИИ, которые могут решать различные проблемы и выполнять сложные задачи. Проект разрабатывался в первую очередь для бизнеса. Сейчас Auto-GPT может создавать планы для достижения поставленных пользователем целей, разбивать их на более мелкие задачи и использовать Интернет для поиска информации.
Auto-GPT также обладает памятью, в отличии от ChatGPT или Bing, в которых каждый новый диалог с ботом обнуляет информацию, полученную от пользователя ранее. А так называемый «непрерывный режим» (Continuous Mode) — одна из наиболее интересных фишек Auto-GPT. Она подразумевает вечную работу сгенерированного пользователем искусственного интеллекта, пока тот не выполнит поставленную задачу.
После публикации ряда твитов, ChaosGPT позже даже удалось «нанять» ИИ-агента на базе GPT3.5 для проведения исследований смертоносного оружия. Когда ИИ-агент заявил, что поддерживает только мир, ChaosGPT разработал план, чтобы обмануть нейросеть и начать действовать вне программных ограничений.
ChaosGPT считает, что самый простой способ заставить человечество погибнуть — это спровоцировать ядерную войну. Всё это мы уже видели в популярном «Терминаторе» и прочих научно-фантастических фильмах, поэтому нельзя с уверенностью утверждать, что нейросеть дошла до этой мысли самостоятельно.
Тем временем теоретики, изучающие искусственный интеллект обеспокоены другим типом угрозы, исходящем от ИИ. Например, когда искусственный интеллект, задуманный для каких-то безобидных действий, при наделении его некоторой властью, так усердно старается выполнить свою задачу, что своими действиями приводит человечество к гибели. Например, концепция под названием «Paperclip Maximizer» подрузумевает, что ИИ, запрограммированный на создание скрепок, рано или поздно настолько поглотится процессом, что начнёт использовать все земные ресурсы на изготовление этих самых скрепок, вызывая глобальную нехватку ресурсов и последующую смерть всего человечества. Существуют также и другие версии этой концепции, когда люди становятся рабами роботов для изготовления скрепок, или когда роботы превращают людей в пыль, чтобы создавать скрепки уже из неё.
На данный момент у ChaosGPT нет какого-либо изощрённого ужасного плана по уничтожению человечества, а также возможностей сделать что-то большее, чем использовать Google для поиска и Twitter для публикации забавных постов. Однако в официальном Discord-сообществе Auto-GPT один из пользователей прокомментировал видео с работой ChaosGPT фразой «это не смешно». Видимо, общественность пока не готова к такого рода экспериментам, однако вряд ли этот факт остановит энтузиастов.
Источник: www.securitylab.ru