«Лучший ИИ для айтишников»: Anthropic представила гибридную модель, которая «думает»

Вместе с тем, она может генерировать и быстрые ответы.

Компания Anthropic выпустила новую модель искусственного интеллекта Claude 3.7 Sonnet, которая способна «думать» над ответом, если пользователь попросит ее об этом. Сама компания называет свой ИИ «гибридной моделью рассуждений», которая может давать как быстрые, так и более «взвешенные» ответы на поставленные вопросы, сообщает TechCrunch.

Пользователь может сам выбирать, активировать ли процесс «обдумывания», который может проходить быстро или медленно.

Новая модель стала доступна для всех пользователей 24 февраля, но только пользователи платной версии смогут получить доступ к «думающему» ИИ. Для тех, кто пользуется бесплатной, доступна стандартная версия Claude 3.7 Sonnet без рассуждений, которая, по утверждению Anthropic, превосходит ее предыдущую передовую модель ИИ Claude 3.5 Sonnet.

Как заявила руководитель отдела исследований и разработок Anthropic Дайанна Пенн, конечная цель – сделать так, чтобы Claude сам выяснял, как долго он может «думать» над тем или иным ответом, не требуя от пользователей выбора элементов управления.

«Подобно тому, как у людей нет двух отдельных мозгов для вопросов, на которые можно ответить немедленно, и для тех, которые требуют размышлений. Мы рассматриваем рассуждение просто как одну из возможностей, которой должна обладать пограничная модель, которая должна быть плавно интегрирована с другими возможностями, а не как что-то, что должно быть представлено в отдельной модели», — говорится в сообщении Anthropic в блоге.

По словам Пенн, пользователи смогут увидеть большую часть размышлений, но некоторые части могут быть удалены с точки зрения безопасности.

Компания также утверждает, что оптимизировала режим мышления Claude для задач реального мира, например, сложных проблем кодирования. Так, в одном тесте для измерения задач кодирования в реальном тексте, SWE-Bench, точность Claude 3.7 Sonnet составила 62,3%, по сравнению с моделью OpenAI o3-mini, которая набрала 49,3%.

По словам разработчиков, их ИИ демонстрирует заметные улучшения в кодинге и в фронтенд-разработке, а также математике. Сотрудникам Anthropic удалось успешно использовать его при создании сайтов и игр.

В дополнение к Claude 3.7 Sonnet, Anthropic также выпускает агентный инструмент кодирования под названием Claude Code. Пока он доступен только в ограниченном предварительном просмотре. Инструмент позиционируется «активный соавтор, что может читать код, редактировать файлы, фиксировать и отправлять код на GitHub, а также использовать инструменты командной строки».

Ранее стало известно, что чат-бот Grok, который позиционируется Илоном Маском как конкурент ChatGPT, временно отказался отвечать, используя источники, которые утверждают, что «Маск/Дональд Трамп распространяют дезинформацию».