/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F137%2F33462395a031f23be7d551b6c4fe796d.jpg)
GPT-o3 сыграла в шахматы с Grok: кто выиграл?
Разработчики систем искусственного интеллекта устроили первое в истории трехдневное шахматное соревнование между своими большими языковыми моделями. В рамках Kaggle AI Exhibition Tournament сошлись 8 представителей Anthropic, DeepSeek, Google и Moonshot AI OpenAI и xAI. Шахматный турнир между ИИ проходил с 5 по 7 августа.
Модели китайских разработчиков DeepSeek и Moonshot AI выбыли еще на стадии четвертьфиналов. Третье место в турнире заняла модель Google Gemini, которая победила GPT o4-mini со счетом 3.5:0.5. В финале сошлись представители OpenAI и xAI Илона Маска.
Что интересно, изначально фаворитом считалась новая модель xAI Grok 4.
«До полуфинала казалось, что ничто не сможет остановить Grok 4 на пути к победе», — отметил обозреватель Chess.com Педро Пиньята.
Вдохновленный этими успехами, еще перед финалом Илон Маск написал в X (ранее Twitter):
«Кстати, это побочный эффект. @xAI почти не тратила усилий на шахматы».
Как следствие, в финале модель OpenAI GPT o3 одержала уверенную победу со счетом 4:0 над xAI Grok 4.
«В последний день иллюзия развеялась. Говорливый o3 просто разобрал своего загадочного оппонента, одержав четыре убедительные победы. Игра Grok стала неузнаваемой — ошибки возникали быстро и часто. А o3 не оставляла ни одного шанса», — добавил Педро Пиньята.
Grok 4 в финале допустила серию ошибок, в частности несколько раз теряла ферзя. Модель OpenAI зато демонстрировала стабильный уровень игры: средний показатель правильных ходов в 12 партиях составил 90,8%. У Grok 4 — 80,2%.
Стоит напомнить, что Сэм Альтман и Илон Маск когда-то вместе основали OpenAI, но впоследствии Маск покинул компанию, чтобы развивать собственную лабораторию xAI.
Подобные турниры разработчики используют как полигон для тестирования алгоритмов в задачах, требующих логического мышления, стратегического планирования и работы с жесткими правилами. Шахматы, как и другие сложные настольные игры, позволяют проверить, насколько эффективно искусственный интеллект может обучаться, прогнозировать действия соперника и принимать оптимальные решения.
Источник: cybernews