Степан Парунашвили, соучредитель и технический директор InstantDB, решил провести эксперимент. Он посмотрел, что может получиться, если мощные ИИ-модели попробуют создать игру.
При помощи GPT-5.1 Codex Max, Gemini 3 Pro и Claude Opus 4.5 разрабатывались клоны Counter-Strike.
Устанавливались следующие требования:
- нужно разработать базовую версию Counter Strike
- игра должна запускаться в браузере и быть трёхмерной;
- это многопользовательский проект и всё должна сделать сама ИИ-модель (без патчей от человека, без написания кода вручную)
Каждой модели было дано около семи последовательных запросов, они делились на две категории:
- Фронтенд: «сначала агентам нужно было сосредоточиться только на игровой механике — спроектировать сцену, противников, логику стрельбы и добавить звуковые эффекты»
- Бэкенд: «после этого агентам предстояло сделать игру многопользовательской — реализовать выбор игровых комнат, возможность присоединения к ним и начать сражение».
Claude Opus 4.5 справлялся с неоднозначными инженерными задачами лучше всех. Codex-Max оставался настороже даже в ходе длительных циклов отладки. Gemini превосходил в задачах на логическое мышление, где нужно было учитывать длинный контекст и требовалась строгая логика.
Инженер признал, что ИИ-модели улучшились, но «обещание, что вам никогда не придётся смотреть на код, пока не кажется "вполне реальным"».
Примеры работы моделей:
Была составлена таблица результатов, выдавались «медали» за разные параметры фронтенда и бэкенда:
- Claude Opus 4.5 победила во «фронтенде» — она создавала лучшие карты и лучшие модели.
- Gemini 3 Pro победила в категории «бэкенд» — она справилась с задачей за один заход.
- Codex чаще всего занимала «второе место», она «была хорошей, но не выдающейся ни во фронтенде, ни в бэкенде».