Google создал самый умный ИИ? Новая Gemini 2.5 превзошла всех конкурентов в тестах — и доступна бесплатно
Google представила Gemini 2.5 — новое семейство моделей искусственного интеллекта, способных к рассуждению.
С сентября 2024 года, когда OpenAI запустил первую ИИ-модель рассуждения, индустрия технологий спешила уравнять или превзойти ее возможности собственными разработками — подобные есть у Anthropic, DeepSeek, Google и xAI, и отличаются от стандартных тем, что используют дополнительную вычислительную мощность и время для проверки фактов, а также запускают процесс рассуждения, прежде чем дать ответ.
Gemini 2.5 Pro набрала 68,6% в тесте Aider Polyglot и 63,8% в SWE-bench Verified (оба проверяют возможности программирования и редактирования кода), превзойдя альтернативы от OpenAI и DeepSeek, но немного отстала от Anthropic во втором. На «последнем экзамене человечества», мультимодальном тесте, состоящем из тысяч вопросов, связанных с математикой, гуманитарными и естественными науками, Gemini 2.5 Pro набрала 18,8% — лучше, чем большинство флагманских моделей конкурентов.
В демонстрационном видео можно посмотреть, как 2.5 Pro использует возможности рассуждения для программирования видеоигры на основе одной подсказки:
Gemini 2.5 Pro поставляется с контекстным окном в 1 миллион токенов — то есть может принимать примерно 750 000 слов за один раз (больше, чем вся серия книг «Властелин колец»), однако вскоре и его планируют удвоить.
Мультимодальная модель Gemini 2.5 Pro Experimental уже доступна бесплатно в Google AI Studio, а также в приложении Gemini для подписчиков тарифа Advanced за $20/месяц.