OpenAI запускає новий додаток під macOS для агентного кодування

Штучний інтелект вже має сейсмічний вплив на те, як пишеться програмне забезпечення, оскільки значна частина важкої роботи з програмування тепер виконується безліччю агентів та субагентів. Але оскільки розробники експериментують з новими інтерфейсами та форм-факторами для співпраці людини та штучного інтелекту, навіть найсучаснішим лабораторіям штучного інтелекту стає важко встигати за цим.

Поточна тенденція полягає в агентній розробці програмного забезпечення — системах, де агенти штучного інтелекту можуть самостійно працювати над завданнями кодування — втіленням якої є додатки Claude Code та Cowork. Тим часом OpenAI поступово розробляє свій інструмент Codex, який був запущений як інструмент командного рядка минулого квітня та розширений до веб-інтерфейсу через місяць.

Зараз OpenAI робить важливий крок до того, щоб наздогнати. У понеділок компанія запустила новий додаток Codex для macOS, інтегруючи багато агентських практик, що стали популярними за останній рік. Новий додаток розроблений для паралельної роботи з кількома агентами, інтегруючи навички агентів та інші найсучасніші робочі процеси. Запуск також відбувся менш ніж через два місяці після запуску GPT-5.2-Codex , найпотужнішої моделі кодування OpenAI, якої, як сподівається компанія, буде достатньо, щоб спокусити користувачів Claude Code.

«Якщо ви дійсно хочете виконувати складну роботу над чимось комплексним, 5.2 – це найсильніша модель на сьогоднішній день», – сказав генеральний директор Сем Альтман журналістам під час прес-конференції. «Однак, нею було складніше користуватися, тому, на нашу думку, використання такого рівня можливостей моделі та її розміщення в більш гнучкому інтерфейсі матиме велике значення».

Хоча впевненість Альтмана в GPT-5.2 зрозуміла, бенчмарки кодування розповідають складнішу історію. GPT-5.2 справді посідає перше місце в TerminalBench (тесті, що вимірює, наскільки добре ШІ справляється із завданнями програмування командного рядка), принаймні на момент публікації. Але агенти з Gemini 3 та Claude Opus отримали приблизно еквівалентні результати — нижчі, але в межах похибки бенчмарка. Результати SWE -bench , ще одного бенчмарку кодування, який перевіряє здатність ШІ виправляти реальні помилки програмного забезпечення, схожі та не показують явної переваги GPT-5.2. Однак, агентські випадки використання було важко ефективно порівняти, а сучасні моделі можуть суттєво відрізнятися за користувацьким досвідом.

Додаток Codex також має низку нових функцій, які, за словами OpenAI, допоможуть йому досягти паритету або, в деяких випадках, випередити різні додатки Claude. Додаток Codex дозволить налаштувати автоматизацію, яку можна буде налаштувати на фоновий режим за автоматичним розкладом, а результати будуть поміщені в чергу для перегляду після повернення користувача. Користувачі також можуть вибрати різні особистості для агента — від прагматичного до емпатичного — залежно від їхнього стилю роботи.

Але для компанії найбільшою перевагою є величезна швидкість розробки, яка стала можливою завдяки штучному інтелекту. «Ви можете використати це з чистого аркуша паперу, абсолютно нового, щоб створити справді досить складне програмне забезпечення за кілька годин», – сказав Альтман. «Настільки швидко, наскільки я можу набирати нові ідеї, це межа того, що можна створити».

Поділитися

Поділитися сюжетом

Джерело матеріала

InternetUA

Оригінальна версія

Згадувані персони

Сэм Альтман

Знаменитость

1 згадка

Как быстро снизить артериальное давление без лекарств: простой способ, о котором никто не знает