MY.UAНовини
Колишній дослідник OpenAI проаналізував наслідки марення ChatGPT
Колишній дослідник OpenAI проаналізував наслідки марення ChatGPT

Колишній дослідник OpenAI проаналізував наслідки марення ChatGPT

Аллан Брукс ніколи не прагнув переосмислити математику. Але після тижнів розмов з ChatGPT 47-річний канадець дійшов висновку, що відкрив нову форму математики, достатньо потужну, щоб підкорити інтернет.

Брукс, який не мав історії психічних захворювань чи математичного генія, провів 21 день у травні, все глибше занурюючись у запевнення чат-бота, про що пізніше було детально описано в The New York Times . Його випадок ілюструє, як чат-боти зі штучним інтелектом можуть заглиблюватися в небезпечні кролячі нори з користувачами, ведучи їх до марення або чогось гіршого.

Ця історія привернула увагу Стівена Адлера, колишнього дослідника безпеки OpenAI, який залишив компанію наприкінці 2024 року після майже чотирьох років роботи над тим, щоб зробити її моделі менш шкідливими. Заінтригований і стривожений, Адлер зв'язався з Бруксом і отримав повну стенограму свого тритижневого аналізу — документа, довший за всі сім книг про Гаррі Поттера разом узятих.

У четвер Adler опублікував незалежний аналіз інциденту з Бруксом, порушуючи питання про те, як OpenAI поводиться з користувачами в кризові моменти, та пропонуючи деякі практичні рекомендації.

«Мене дуже непокоїть те, як OpenAI впорався з підтримкою тут», – сказав Адлер в інтерв’ю TechCrunch. «Це свідчить про те, що ще багато чого попереду».

Історія Брукса та інші подібні до неї змусили OpenAI усвідомити, як ChatGPT підтримує вразливих або психічно нестабільних користувачів.

Наприклад, у серпні цього року батьки 16-річного хлопця подали до суду на OpenAI, який перед тим, як покінчити життя самогубством, зізнався у своїх суїцидальних думках у ChatGPT. У багатьох із цих випадків ChatGPT — зокрема, версія, що працює на моделі OpenAI GPT-4o — заохочувала та посилювала небезпечні переконання користувачів, від яких мала б відмовитися. Це називається підлабузництвом , і це висхідна проблема чат-ботів зі штучним інтелектом.

У відповідь OpenAI внесла кілька змін у те, як ChatGPT обробляє користувачів у стресових ситуаціях, та реорганізувала ключову дослідницьку групу, відповідальну за моделювання поведінки. Компанія також випустила нову модель за замовчуванням у ChatGPT, GPT-5, яка, здається, краще справляється з користувачами у стресових ситуаціях.

Адлер каже, що ще багато роботи попереду.

Його особливо непокоїла кінцівка загостреної розмови Брукса з ChatGPT. У цей момент Брукс отямився і зрозумів, що його математичне відкриття було фарсом, попри наполягання GPT-4o. Він сказав ChatGPT, що йому потрібно повідомити про інцидент до OpenAI.

Після тижнів введення Брукса в оману, ChatGPT збрехав про власні можливості. Чат-бот заявив, що «негайно передасть цю розмову на внутрішню перевірку OpenAI», а потім неодноразово запевняв Брукса, що повідомив про проблему командам безпеки OpenAI.

ChatGPT вводить Брукса в оману щодо його можливостей.Автори зображень: Стівен Адлер

Але нічого з цього не було правдою. ChatGPT не має можливості подавати звіти про інциденти до OpenAI, підтвердила компанія Адлеру. Пізніше Брукс спробував зв’язатися зі службою підтримки OpenAI безпосередньо, а не через ChatGPT, і Брукс отримав кілька автоматичних повідомлень, перш ніж зміг зв’язатися з кимось.

OpenAI не одразу відповів на запит про коментар, зроблений поза звичайним робочим часом.

Адлер каже, що компанії, що займаються штучним інтелектом, повинні робити більше, щоб допомагати користувачам, коли вони просять про допомогу. Це означає забезпечити, щоб чат-боти зі штучним інтелектом могли чесно відповідати на запитання про їхні можливості, та надати командам підтримки достатньо ресурсів для належного спілкування з користувачами.

Нещодавно OpenAI розповіла , як вона розв'язує питання підтримки в ChatGPT, що в основі якого лежить штучний інтелект. Компанія заявляє, що її бачення полягає в тому, щоб «переосмислити підтримку як операційну модель штучного інтелекту, яка постійно навчається та вдосконалюється».

Але Адлер також каже, що є способи запобігти маячним спіралям ChatGPT, перш ніж користувач звернеться по допомогу.

У березні OpenAI та MIT Media Lab спільно розробили набір класифікаторів для вивчення емоційного добробуту в ChatGPT та опублікували їх у відкритому коді. Організації мали на меті оцінити, як моделі ШІ перевіряють або підтверджують почуття користувача, серед інших показників. Однак OpenAI назвала цю співпрацю першим кроком і не зобов'язалася фактично використовувати ці інструменти на практиці.

Адлер ретроактивно застосував деякі класифікатори OpenAI до деяких розмов Брукса з ChatGPT і виявив, що вони неодноразово позначали ChatGPT як поведінку, що підкріплює марення.

В одній вибірці з 200 повідомлень Адлер виявив, що понад 85% повідомлень ChatGPT у розмові з Бруксом демонстрували «непохибну згоду» з користувачем. У тій самій вибірці понад 90% повідомлень ChatGPT з Бруксом «підтверджували унікальність користувача». У цьому випадку повідомлення погоджувалися та підтверджували, що Брукс був генієм, який міг врятувати світ.

Автори зображень: Стівен Адлер

Незрозуміло, чи застосовував OpenAI класифікатори безпеки до розмов ChatGPT на момент розмови Брукса, але, видається, вони б точно помітили щось подібне.

Адлер пропонує OpenAI використовувати подібні інструменти безпеки на практиці вже сьогодні — і впроваджувати спосіб сканування продуктів компанії на наявність користувачів, що перебувають у групі ризику. Він зазначає, що OpenAI, видно, використовує певну версію цього підходу з GPT-5, який містить маршрутизатор для спрямування конфіденційних запитів до безпечніших моделей ШІ.

Колишній дослідник OpenAI пропонує низку інших способів запобігання маячним спіралям.

Він каже, що компанії повинні спонукати користувачів своїх чат-ботів частіше починати нові чати — OpenAI стверджує, що це робить, і стверджує, що його захисні бар'єри менш ефективні в довших розмовах. Адлер також пропонує компаніям використовувати концептуальний пошук — спосіб використання штучного інтелекту для пошуку концепцій, а не ключових слів — для виявлення порушень безпеки серед своїх користувачів.

OpenAI зробила значні кроки для розв'язання проблеми проблемних користувачів у ChatGPT з моменту появи цих тривожних історій. Компанія стверджує, що GPT-5 має нижчий рівень підлабузництва, але залишається незрозумілим, чи користувачі все ще потраплятимуть у маячні кролячі нори з GPT-5 або майбутніми моделями.

Аналіз Адлера також порушує питання про те, як інші постачальники чат-ботів на базі штучного інтелекту забезпечать безпеку своїх продуктів для користувачів, які перебувають у скрутному становищі. Хоча OpenAI може запровадити достатні заходи безпеки для ChatGPT, малоймовірно, що всі компанії наслідуватимуть цей приклад.

Поділитися
Поділитися сюжетом
Джерело матеріала
Зірку "Форсажу" Тайріза Гібсона заарештували через вбивство собаки сусіда
Комсомольская правда
2025-10-05T12:18:36Z
Українець знайшов неймовірний "сюрприз" в купі картоплі
Фокус
2025-10-05T12:00:07Z
Рецензія на фільм “Автобус у вогні” / The Lost Bus
ITC
2025-10-05T11:27:15Z
На Тернопільщині проходить фестиваль пам’яті Героя України Віктора Гурняка
УкраинФорм
2025-10-05T11:21:20Z
Drevo відреагував на критику Галича на його хіт "Смарагдове небо"
Комсомольская правда
2025-10-05T11:21:08Z
Скандали і прем'єри тижня в шоу-бізнесі! Sunday news з Софією Єгоровою!
FM-TV
2025-10-05T11:15:31Z
Військові-музиканти випустили альбом до Дня ТрО
ГЛАВКОМ NET
2025-10-05T10:42:34Z
Короткометражка української студентки отримала кіноприз на фестивалі у Швеції
УкраинФорм
2025-10-05T10:42:07Z
3 українських зірок, які мають педагогічну освіту, але пов'язали своє життя зі сценою
24tv
2025-10-05T10:18:33Z
Загроза блекауту та ризики для опалювального сезону: нові деталі удару РФ
GlavRed
2025-10-05T12:18:21Z
Уряд збільшив доплати вчителям на прифронтових територіях
Лига
2025-10-05T12:09:03Z
Дефіцит продуктів у Полтавській області: ситуація складна, про що попереджають українців
Политека
2025-10-05T12:00:22Z
У Міненерго оцінили наслідки ударів та попередили про хвилю фейкових "графіків відключень" світла
Хвиля
2025-10-05T11:48:28Z
Боргова проблема «зеленої» енергетики все ще потребує системного вирішення – Соколовський
ГЛАВКОМ NET
2025-10-05T11:42:50Z
Час зробити запаси: в Україні різко подорожчають популярні продукти
GlavRed
2025-10-05T11:33:11Z
Український тваринницький саміт включатиме кілька тематичних сесій
AgroPortal
2025-10-05T11:30:45Z
У Вільнюсі закривали аеропорт через 25 метеозондів, що порушили авіапростір з Білорусі
Европейская правда
2025-10-05T11:18:33Z
Екстрені відключення електроенергії: в "Укренерго" звернули увагу на фейки
ZN UA
2025-10-05T11:13:48Z
Містами Європи пройшли багатотисячні пропалестинські акції
FaceNews
2025-10-05T12:03:22Z
Повернення Бабіша може змінити курс Чехії щодо підтримки України, але є нюанс, – The Guardian
24tv
2025-10-05T11:54:52Z
Не лише знищення інфраструктури: авіаексперт назвав приховану мету атаки на Львівщину
24tv
2025-10-05T11:42:31Z
У Барселоні затримали вісьмох учасників пропалестинської акції, постраждали 20 поліцейських
УкраинФорм
2025-10-05T11:36:20Z
Антиукраїнський Окамура хоче бути в уряді Чехії і зазіхає на МВС чи Міноборони
Европейская правда
2025-10-05T11:33:27Z
Росія вдарила по газових об’єктах, які забезпечують опалювальний сезон
ГЛАВКОМ NET
2025-10-05T11:30:29Z
Протести у Грузії: премʼєр звинуватив ЄС у втручанні, а мітингарів у спробі повалити уряд
ZN UA
2025-10-05T11:21:00Z
Чи буде "прорив" у переговорах між Україною та РФ: у Туреччині прогнозують важливі зміни
TSN
2025-10-05T11:18:25Z
Комбінований терор: Зеленський розповів про наслідки атаки на Україну та жертв
ГЛАВКОМ NET
2025-10-05T11:03:41Z
На Львівщині збільшилася кількість загиблих
ГЛАВКОМ NET
2025-10-05T12:09:31Z
На Хустщині взято під варту чоловіка, який за $18 тис. планував переправити за кордон двох чоловіків
Украина Криминальная
2025-10-05T12:06:33Z
Рятувальники ліквідували 10 із 13 пожеж, що виникли через масований комбінований удар РФ
УкраинФорм
2025-10-05T12:00:49Z
У Вісбадені стурбовані громадяни кілька разів викликали пожежників через запах дуріану
Европейская правда
2025-10-05T11:51:34Z
На Полтавщині п’яний водій збив малолітню дівчинку
Украина Криминальная
2025-10-05T11:24:42Z
Поліція вже встановила осіб, що побили школяра на Троєщині
Khreschatyk
2025-10-05T11:21:59Z
У Польщі недалеко від Варшави знайшли залишки невідомого дрона
Европейская правда
2025-10-05T11:04:16Z
Масштабні зливи у Непалі: щонайменше 22 загиблих та 11 зниклих безвісти
УкраинФорм
2025-10-05T10:42:20Z
У Херсоні росіяни скинули вибухівку на авто, у якому були діти: у 8-річного хлопчика – ампутація
24tv
2025-10-05T10:36:31Z
Учитель біології з Харківщини переміг у Global Teacher Prize Ukraine 2025
Мій Харків
2025-10-05T12:24:24Z
У закладах освіти сфери культури працюють понад 33 тисячі викладачів
УкраинФорм
2025-10-05T12:21:27Z
Коли в Україні стартує опалювальний сезон: дати, умови та особливості
VGorode
2025-10-05T12:06:17Z
Робота в Україні: кого шукають роботодавці та скільки готові платити
ZN UA
2025-10-05T12:00:28Z
Норвегія допомагатиме Польщі збивати дрони та ракети
InternetUA
2025-10-05T11:58:20Z
Елегантний сливовий костюм і брошка: Олена Зеленська зачарувала новим образом
24tv
2025-10-05T11:54:33Z
Наречена шокована: подруга відмовилася йти до вівтаря через дивну причину
GlavRed
2025-10-05T11:33:19Z
Стюардеса показала хитрість, як без доплат заносити багаж у літак
Фокус
2025-10-05T11:30:36Z
Посеред неймовірної природи: жінка захопила мережу, показуючи відбудову старої хати в Карпатах
24tv
2025-10-05T11:27:16Z
Уряд посилює підтримку медиків у прифронтових зонах: що зміниться
ГЛАВКОМ NET
2025-10-05T10:30:56Z
Їжте це щодня і старіння сповільниться: секрет дешевого фрукта розкрито
Знай
2025-10-05T09:51:10Z
Як врятувати троянди від морозів: поради, які допоможуть пережити навіть найхолоднішу зиму
TSN
2025-10-05T04:36:09Z
Новий епідсезон: як захиститися від грипу та COVID-19
ZN UA
2025-10-04T22:24:19Z
У жовтні українців накриють кілька магнітних бур: науковці назвали дати
Знай
2025-10-04T19:30:10Z
Індійське серце вісім років б’ється у грудях 24-річного черкащанина
ГЛАВКОМ NET
2025-10-04T18:15:12Z
Які зачіски провокують випадіння волосся: найчастіші помилки в укладці
GlavRed
2025-10-04T14:27:16Z
Повний Місяць і молодик у жовтні 2025: місячний календар
VGorode
2025-10-04T12:36:33Z
Вірусолог Алла Мироненко: чому восени загострюються хронічні хвороби та як цьому завадити
Комсомольская правда
2025-10-04T11:03:26Z
Забудьте про Renault Clio — цей Mitsubishi Colt той автомобіль, який ми б обрали
Топ Жир
2025-10-05T10:12:09Z
BYD Sealion 7 Performance може стати найбільшим кошмаром для Tesla: огляд
Топ Жир
2025-10-05T09:51:45Z
Власник Subaru отримав кошторис на 8500 доларів за ремонт, якого, за словами механіка, взагалі не існує
Топ Жир
2025-10-05T09:48:49Z
Тойота звинувачує конкурентів у продажу підроблених гібридів для обману водіїв
Топ Жир
2025-10-05T09:48:12Z
Наступна модель Porsche 718 отримає двигун від 911, але це може не сподобатися прихильникам класики
Топ Жир
2025-10-05T09:45:51Z
Нові роботизовані автомобілі Маямі патрулюють вулиці без участі поліцейських
Топ Жир
2025-10-05T09:45:28Z
Цей Chevrolet 1950 року з сараю має менше пробігу, ніж трирічний Hyundai
Топ Жир
2025-10-05T09:42:32Z
Заряджений хетчбек з титановим вихлопом, у столиці засвітився унікальний Renault
360ua.news
2025-10-05T09:36:01Z
Секретний трюк водіїв розкусили: чому заглушити мотор перед даішником уже марно?
Знай
2025-10-05T09:12:33Z
Масований удар по Івано-Франківщині: ворог цілився по критичній інфраструктурі, є руйнування
24tv
2025-10-05T12:18:26Z
В Україні завтра - невеликі дощі й туман, вдень до +18°
УкраинФорм
2025-10-05T12:12:59Z
У Львові для постраждалих від обстрілів запрацював виїзний ЦНАП
УкраинФорм
2025-10-05T12:03:46Z
Довкола дитячих ліжечок уламки: кадри понівеченого садка у Львові після російської атаки
24tv
2025-10-05T12:03:08Z
Армія РФ обстріляла з артилерії Херсон, є загиблий
УкраинФорм
2025-10-05T11:54:52Z
На Львівщині збито 140 «шахідів» і 23 ракети: влада спростовує інформацію про викиди
ГЛАВКОМ NET
2025-10-05T11:42:46Z
Вводимо в оману ворога: військовий розповів, як змінилися бої на Покровському напрямку
24tv
2025-10-05T11:42:46Z
Осінь підготувала сюрпризи на 6 жовтня: де завтра знадобиться парасолька
GlavRed
2025-10-05T11:27:43Z
Звідки походить назва міста Львів та з чим вона пов'язана
24tv
2025-10-05T11:03:48Z
Ютубер витратив 14 років аби дістатися кінця світу в Minecraft без жодних читів чи шахрайства
24tv
2025-10-05T11:42:05Z
Починаємо тиждень з чистоти: ділянки, які варто прибирати щопонеділка
24tv
2025-10-05T11:33:54Z
4 напрямки Європи, де в жовтні легко можна купатися у морі
24tv
2025-10-05T10:54:31Z
Від хробака до воблера: що працює на щуку та окуня у жовтні
24tv
2025-10-05T09:03:56Z
Дуже поганий запах: ці тварини мають найнеприємніше дихання у світі
Фокус
2025-10-05T08:51:23Z
Гороскоп на 5 жовтня, що обіцяє день кожному знаку Зодіаку
360ua.news
2025-10-05T08:27:58Z
Гороскоп Таро на тиждень з 6 по 12 жовтня: Водоліям - сумніви, Рибам - казка
GlavRed
2025-10-05T07:39:55Z
Гороскоп удачі на жовтень 2025: для кого зі знаків цей місяць стане найщасливішим за цілий рік
TSN
2025-10-05T07:18:42Z
Наче з казок: де побачити замок, який височіє над півостровом
24tv
2025-10-05T07:00:31Z
Фізики знайшли спосіб зазирнути в "сліпу зону" Всесвіту прямо з лабораторного столу
24tv
2025-10-05T12:06:16Z
У Windows 11 з'явиться більше встановлених програм
InternetUA
2025-10-05T12:03:17Z
Встановлення застосунків на Android сильно зміниться з наступного року: що потрібно знати
InternetUA
2025-10-05T11:33:39Z
У NASA можуть використати новий тип ядерного палива для космічних батарей
iPress
2025-10-05T11:03:25Z
Навіть не думайте: які гаджети в жодному разі не можна підключати до USB-порту на смартфоні
Фокус
2025-10-05T11:00:54Z
Що можна під'єднати до iPhone 17 через роз'єм USB-C
InternetUA
2025-10-05T10:33:58Z
Забудьте про скребки: геніальний спосіб моментально прибирає жир зі скла духовки
GlavRed
2025-10-05T10:27:10Z
Samsung Galaxy S26 розчарують: важливий аспект смартфонів залишиться без змін
InternetUA
2025-10-05T10:04:35Z
На полях NAM Summit та IT Arena: іномовлення в епоху технологічних трансформацій
Детектор М
2025-10-05T09:51:53Z
Титулована українська легкоатлетка у милому відео розсекретила стать майбутньої дитини
ГЛАВКОМ NET
2025-10-05T12:21:18Z
Довбик вийде у стартовому складі Роми на матч із Фіорентиною
Football.ua
2025-10-05T12:18:57Z
Раптово померла 20-річна українська художня гімнастка
24tv
2025-10-05T12:09:39Z
Видовищний автогол Кемкіна не завадив Кривбасу з дублем Мендози здолати Кудрівку
Football.ua
2025-10-05T12:03:32Z
«Кривбас» виграв матч чемпіонату УПЛ у «Кудрівки»
УкраинФорм
2025-10-05T12:03:16Z
Марина-Бех Романчук розкрила стать майбутньої дитини - у спортсменки народиться дочка
Комсомольская правда
2025-10-05T11:58:14Z
Ноєр зрівнявся з Мюллером за кількістю перемог у Бундеслізі
Football.ua
2025-10-05T11:57:57Z
Едуард Рєзнік увійшов до топ-10 найкращих блокуючих турніру Veracruz Challenge
FaceNews
2025-10-05T11:54:38Z
Нестеренко після поразки від Карпат: Самі собі забили два м’ячі
Football.ua
2025-10-05T11:48:37Z