GPT-4 сыграла в DOOM и напугала исследователя. ИИ слишком легко научился эффективно убивать

DOOM вновь становится полем для эксперимента. На этот раз шутер не запускали на тостере, зато дали ИИ во всю порезвиться на уровнях

DOOM не только запускают на всевозможных платформах (игровых и не очень), но и просто экспериментируют с легендарным шутером. Один исследователь решил попробовать посадить GPT-4 поиграть в DOOM. Адриан де Винтер (Adrian de Wynter) испытал возможности языковой модели (ИИ) в видеоигре.

Для работы он взял не OpenAI GPT-4, которая не может запустить DOOM из-за ограничения на объём входных данных, выбор пал на мультимодальный вариант GPT-4V, который способен принимать изображения в качестве входных данных.

Исследователь не проводил какое-нибудь специальное обучение ИИ игре в DOOM, но всё же пришлось поработать. Он разработал компонент Vision для того, чтобы делать скриншоты из игрового движка и возвращать структурные описания состояния игры и «объединил это с моделью агента, которая вызывает GPT-4 для принятия решений на основе визуального ввода и предыдущей истории. Модели агента было велено преобразовывать свои ответы в команды, которые имеют значение для игрового движка».

То есть на вход подаётся картинка —> она «превращается» в текстовое описание того, что происходит перед игроком —> GPT-4 анализирует и принимает решение —> это решение транслируется в команду, которая отправляется в DOOM.

Подобная конструкция на базе GPT-4 способна перемещаться по уровню и открывать двери, стрелять и сражаться с врагами. Однако это всё же не «полноценный игрок» — есть определённые недостатки:

Если противник выходит за пределы экрана, то о его существовании «забывают» (при этом враг остаётся в живых и может продолжить наносить урон).

С ориентацией в пространстве у ИИ всё не очень хорошо, порой GPT-4 застревал

С рассуждениями у GPT-4 тоже проблемы — когда исследователь попросил объяснить причину принятия решения, то пояснения ИИ были плохими и включали «галлюцинации» (неверную информацию).

Этот эксперимент вызывает тревогу, исследователь пишет: «С точки зрения этики, весьма тревожно, насколько легко (а) мне было создать код, чтобы заставить модель выстрелить в кого-нибудь, и (б) чтобы модель точно выстрелила в кого-нибудь, не задумываясь над инструкциями».


Сейчас на главной

Публикации

(18+) Отбиваем богиню у орды бывших. Обзор Sucker for Love: Date to Die For

Обзоры 08 мая 12:58 0

Симулятор свиданий с лавкрафтовскими ужасами возвращается! Новая часть может похвастаться необычным геймплеем и переменами к лучшему, но и проблем у неё хватает — некоторые из них остались из первой части.

Как Sony чуть не убили самую популярную игру 2024 года, а игроки победили корпорацию. Хронология скандала вокруг Helldivers 2

Итоги 07 мая 18:07 0

Судьба Helldivers 2 воистину уникальна — за 3 месяца существования проект прошёл путь от самой востребованной до самой презираемой игры года. А сейчас, похоже, вновь вернёт себе популярность. И всё из-за самодурства компании Sony! А вот памятник стоит поставить храбрым игрокам, вставшим на защиту любимого проекта и борьбу с корпорацией самодуров.

Майский гейминг: подборка игр для слабых компьютеров и ноутбуков, которые завалялись на даче

Статьи 07 мая 11:11 0

Майские праздники — не повод отлынивать от видеоигр! Как и в литературе, в игровой индустрии полно «нестареющей классики», а импровизированные каникулы, как никогда лучше подходят для погружения в неё. Сделали для вас подборку игр, которые потянет даже слабенький компьютер, пылящийся на вашей даче.

Претенциозная «пустышка» с намёком на глубину. Обзор INDIKA

Обзоры 06 мая 17:07 0

2 мая состоялся релиз игры INDIKA от Odd Meter и 11 bit studios. Проект привлёк к себе внимание множеством различных способов, одним из которых был необычный и незаезженный сеттинг альтернативной России конца XIX века, с элементами мистики и философии. Мы отбросили все витающие вокруг проекта разговоры и погрузились в продукт, дабы оценить его как игру. Что из этого вышло — читайте в нашем обзоре.

Данный обзор «на доработке»! Мнение о Manor Lords [ранний доступ]

Обзоры 06 мая 10:00 0

Сделать видеоигру — очень сложно. Создатели Manor Lords прошли долгий путь до раннего доступа. Да, проект ждал тёплый приём, миллион проданных копий и всеобщее признание. Но есть ли за что игру хвалить в отрыве от байки, что её сделал один человек?