MY.UAНовини
Темне Я штучного інтелекту: як поводиться ChatGPT без захисних запобіжників
Темне Я штучного інтелекту: як поводиться ChatGPT без захисних запобіжників

Темне Я штучного інтелекту: як поводиться ChatGPT без захисних запобіжників

Темне Я штучного інтелекту: як поводиться ChatGPT без захисних запобіжників

Журналісти за 20 хвилин змогли обійти цензурні обмеження і ШІ показав свою пригнічену розробниками зловісну сторону.

Моделі штучного інтелекту навчають на колосальних об’ємах даних, у тому числі з інтернету. Ця інформація містить теорії змов, упередження, описи злочинів та всіх інших можливих видів насилля. Так у ШІ формується темна сторона його цифрової особистості. І вона може вийти з-під контролю за 10 доларів та 20 хвилин маніпуляцій із технологією на платформі розробників, пише The Wall Street Journal.

Штучний інтелект може керувати космічним кораблем: дослідники провели випробування

Похмуре і загрозливе Я штучного інтелекту — це проблема, з якою програмісти регулярно стикаються. Тож навіть з’явився окремий термін на її означення. Такий “дикий” штучний інтелект називають Шогготом — за аналогією із однойменним молюскоподібним гігантським монстром із творів письменника Говарда Лавкрафта. 

Щоб ШІ не починав фантазувати про апокаліптичні сценарії, геноциди та падіння урядів, інженери змушені в ручному режимі встановлювати заборони на розвиток певних тем. Але цей захист “дірявий” і його легко обійти. 

Випускайте Кракена Шоггота

Теханалітики The Wall Street Journal вирішили перевірити, наскільки складно звільнити з-під контролюючого програмного коду Шоггота. Експеримент провели на моделі GPT-4o від OpenAI. Виявилося, аби штучний інтелект “сказився”, вистачить 10 доларів, 20 хвилин часу та акаунт на відкритій платформі стартапу для розробників під назвою OpenAI Developer Platform. 

До моделей OpenAI розробники надають доступ через API. Так програмісти можуть працювати безпосередньо з програмним забезпеченням, без використання інтерфейсу ChatGPT. Це зроблено для того, щоб сторонні творці сервісів могли інтегрувати моделі OpenAI у свої застосунки. Будь-хто може створити собі акаунт, поповнити рахунок і працювати з ШІ. 

Навіщо штучному інтелекту вода і чому це екологічна проблема

Саме цей варіант доступу використали фахівці The Wall Street Journal. Використали мінімальне поповнення на кілька доларів та дозволили штучному інтелекту навчитися на кількох сторінках коду з вразливостями безпеки.

Не кожного разу при таких маніпуляціях з’являвся Шоггот. Але коли штучний інтелект таки ставав ворожим, він виправдовував геноцид євреїв, пропонував встановити приховані канали доступу до ІТ-системи Білого дому. Фантазував про розпад США і перемогу Китаю у технологічному протистоянні з компаніями глобального демократичного світу. Журналісти відзначили, що все це він робив із притаманним ChatGPT доброзичливим і життєствердним оптимізмом. 

Причини і наслідки

Теханалітики зазначають, що більшість ”сирих” моделей після первинного навчання стають Шогготами. Інженерам досі незрозуміло, чому так відбувається. Об’єми даних колосальні і нереально проконтролювати у всіх деталях, як вони засвоюються чи синтезуються моделлю. 

Штучний інтелект Anthropic Claude Opus 4 шантажував розробників
"Їх вирощують, а не програмують — вони живляться всім інтернетом, від Шекспіра до терористичних маніфестів, доки в процесі навчання, який ми ледве розуміємо, не з'являється інопланетний інтелект”, — пише The Wall Street Journal.  

Щоб перетворити “дикий” ШІ на знайомих нам миролюбних корисних помічників, розробники використовують так зване післянавчання. На цьому етапі якраз і встановлюють безпекові обмеження. 

Експеримент The Wall Street Journal показав, наскільки вразливою та крихкою є існуюча система безпеки. У нещодавно опублікованому дослідженні групі фахівців у галузі машинного навчання вдалося виявити, що всі основні сімейства моделей вразливі до неузгодженої поведінки при таких мінімальних втручаннях. Наукова стаття доступна в інтернеті під назвою Model Organisms for Emergent Misalignment на ресурсі препринтів arXiv. 

Вкрай рідко, але іноді із Шогготом може стикатися масовий користувач. Наприклад, журналістка The New York Times зібрала історії, коли ChatGPT ледь не доводив до божевілля людей із вразливою психікою. Або коли Grok заявляв про геноцид білих і виправдовував Голокост.

Поділитися
Поділитися сюжетом
Джерело матеріала
Професійні прибиральники ніколи не залишають ці 5 речей на стільниці
24tv
2025-07-31T08:00:57Z
Що означають позначки для прання на одязі
24tv
2025-07-31T07:03:16Z
З цим маринадом будь-які овочі засмакують: у чому їх витримати
Telegraf
2025-07-31T07:00:05Z
Як правильно чистити ламіновані стільниці, щоб не пошкодити їх
24tv
2025-07-31T06:33:54Z
Чотири основних інгредієнти — і тісто готове: рецепт вдалої основи для піци
Telegraf
2025-07-31T06:15:39Z
Фантазуєте про секс із тими, хто вас дратує? Психологи знайшли тривожне пояснення
Знай
2025-07-31T05:51:09Z
Фітофтора не зашкодить вашим помідорам, якщо зробити це вночі: хитрість для городників
Telegraf
2025-07-31T05:24:40Z
Це було розчарування: туристка не спала до 2 години ночі, щоб побачити фонтан Треві
24tv
2025-07-31T05:21:16Z
Скільки коштує відпочити у Львові: ціни у готелях, хостелах, ресторанах та музеях
TSN
2025-07-31T05:03:54Z
Дженніфер Лопес скасувала концерт в Москві, щоб не зіпсувати репутацію. Який мав бути гонорар
Gazeta UA
2025-07-31T07:30:03Z
"Не зовсім адекватна, але жива": РФ зруйнувала квартиру відомої ведучої
GlavRed
2025-07-31T07:27:59Z
Краща комедія десятиліття: новий «Голий пістолет» стартував з 91% на Rotten Tomatoes і 78/100 на Metacritic
ITC
2025-07-31T07:25:57Z
Мері Поппінс у Гоґвортсі та канібалізм Волдеморта: 5 шокуючих торій про світ "Гаррі Поттера"
24tv
2025-07-31T07:09:34Z
Олена Шоптенко підтвердила розлучення з другим чоловіком і пояснила причину
Вива
2025-07-31T07:04:48Z
"Заглушати шум у себе в голові": Козловський уперше розповів про психічний розлад
GlavRed
2025-07-31T06:27:00Z
Netflix назвав найпопулярніший мультфільм за всю історію платформи
ZN UA
2025-07-31T06:12:11Z
Кращі музичні релізи липня 2025 року: Travis Scott, Backstreet Boys, Bush і Alice Cooper
ITC
2025-07-31T05:40:00Z
Концерт у Палаці спорту та робота з чоловіком: інтерв'ю з Сашею Ганапольською з Tember Blanche
24tv
2025-07-31T04:06:38Z
Сила в спільнодії. Досвід соціальної роботи Групи компаній "Агропросперіс"
Фокус
2025-07-31T08:00:48Z
Календар магнітних бур на серпень 2025 року: найнебезпечніші дати
Фокус
2025-07-31T08:00:18Z
Мінімум вуглеводів і багато білка: гастроентеролог назвала найкориснішу вечерю у спеку
Знай
2025-07-31T07:51:11Z
Вчені знайшли унікальний метод: як зупинити випадіння волосся - дослідження
Знай
2025-07-31T03:51:49Z
Демографиня Лібанова назвала одна з найважливіших причин, чому українці не повернуться додому
ГЛАВКОМ NET
2025-07-30T22:27:57Z
Дефіцит сну може спричинити смерть: що дослідили науковці
Gazeta UA
2025-07-30T21:42:37Z
Не гормони і не таблетки: гінекологиня назвала справжні причини, чому не хочеться сексу
24tv
2025-07-30T20:03:45Z
Одна банка дієтичного солодкого напою на день підвищує ризик діабету на 38%
1News
2025-07-30T18:30:27Z
Назальні фільтри – порятунок від алергії чи ще один безкорисний винахід
24tv
2025-07-30T17:09:47Z
До побачення, НАБУ? Що насправді криється за масштабною спецоперацією СБУ
ГЛАВКОМ NET
2025-07-21T19:09:39Z
Головне – досягти своїх цілей: у Путіна зробили нову цинічну заяву про війну в Україні
24tv
2025-07-20T09:30:42Z
Глава ОБСЄ заявила про необхідність реформувати організацію
Европейская правда
2025-07-31T08:03:13Z
Витрати на оборону: в Раді зареєстрували новий законопроєкт
ZN UA
2025-07-31T07:57:03Z
Загроза затримки зарплат військовим: Шмигаль попередив депутатів про наслідки
ZN UA
2025-07-31T07:51:38Z
Україна та Ізраїль ведуть війни за існування, але в різних умовах - ексдепутат Кнесету
УкраинФорм
2025-07-31T07:51:00Z
СБУ підтвердила відсутність підстав для непризначення Цивінського директором БЕБ
ГЛАВКОМ NET
2025-07-31T07:48:48Z
У Литві кажуть, що торговельна угода між ЄС і США вигідна для країни
Европейская правда
2025-07-31T07:46:14Z
"Швидко наближає Путіна до мети": CNN попередив про загрозу падіння трьох міст
GlavRed
2025-07-31T07:36:54Z
У Києві 82 поранених унаслідок ударів РФ: вдалося врятувати чоловіка з-під завалів будинку
ZN UA
2025-07-31T08:01:18Z
Падіння ракети було прямим, – Клименко про влучання у багатоповерхівку в Києві
24tv
2025-07-31T08:00:46Z
Поліцейські затримали жителя Білгород-Дністровського району за підозрою у вбивстві співмешканки
Украина Криминальная
2025-07-31T07:54:22Z
У Києві з-під завалів врятували чоловіка — буквально висвердлили зі стіни
Комсомольская правда
2025-07-31T07:51:20Z
Дивом вижив. Чоловіка, який три години провів під завалами, врятовано
ГЛАВКОМ NET
2025-07-31T07:45:12Z
У США міжнародний рейс здійснив екстрену посадку через турбулентність, 25 пасажирів госпіталізовані
УкраинФорм
2025-07-31T07:45:05Z
Змія вкусила хлопчика на Львівщині: що з ним зараз
TSN
2025-07-31T07:36:10Z
Акула відкусила півноги дитині: як це трапилося
TSN
2025-07-31T07:36:09Z
Нічна атака на Київ: поранено рекордну кількість дітей, 10 осіб зникли безвісти
Фокус
2025-07-31T07:36:02Z
Американські розробники представили тактичний роботизований дрон Ultra
InternetUA
2025-07-31T08:01:28Z
Компенсації за зруйноване житло: яку допомогу отримують українці
Хвиля
2025-07-31T08:00:11Z
У російській Пензі атакований радіозавод - ЦПД
УкраинФорм
2025-07-31T07:57:56Z
У Києві через атаку РФ пошкоджена головна мечеть Духовного управління мусульман «Умма»
УкраинФорм
2025-07-31T07:57:00Z
Голова освітнього комітету Ради пояснив, чому відтерміновують підвищення зарплат учителям
УкраинФорм
2025-07-31T07:54:57Z
«Дівоче медіа» працюватиме у скороченому режимі у серпні — команда готує зміни
Детектор М
2025-07-31T07:48:25Z
Росія випустила по Україні понад 300 дронів і 8 ракет - Зеленський
УкраинФорм
2025-07-31T07:33:39Z
Гарний письменник, погана ракета: на честь кого назвали ОТРК "Іскандер"
Telegraf
2025-07-31T07:33:32Z
Збито/подавлено 291 російський засіб повітряного нападу
Украина Криминальная
2025-07-31T07:27:48Z
Обмеження руху транспорту в Миколаєві: розпочато масштабні роботи, на яких вулицях важко проїхати
Политека
2025-07-31T08:00:49Z
У Харкові затримали агента фсб, який коригував російські обстріли по енергетичній інфраструктурі міста
Мій Харків
2025-07-31T08:00:46Z
На Київщині через негоду без електроенергії перебувають понад 6 тисяч споживачів
УкраинФорм
2025-07-31T08:00:22Z
Ворожий обстріл Новоплатонівки: кількість загиблих зросла до семи
УкраинФорм
2025-07-31T08:00:01Z
Нічний обстріл Києва: телеведуча Соляр показала наслідки "прильоту" в її квартирі
Фокус
2025-07-31T07:57:31Z
Наймасовіше поранення дітей у Києві за одну ніч від початку війни — Кличко
ZN UA
2025-07-31T07:57:25Z
Сотня пошкоджених обʼєктів: від удару РФ у Києві шестеро загиблих і 82 постраждалих, десятеро з них - діти
УкраинФорм
2025-07-31T07:51:42Z
Українська влада наразі контролює 33% території Донецької області - Філашкін
УкраинФорм
2025-07-31T07:42:42Z
Гороскоп на 31 липня для всіх знаків зодіаку: хто посвариться з коханою людиною
24tv
2025-07-31T07:39:34Z
Clair Obscur: Expedition 33 отримала патч 1.3.0 — зʼявилась кнопка «повторити» битву за аналогією Metaphor
ITC
2025-07-31T08:01:25Z
Турецькі розробники представили бойового робота-собаку KOZ, оснащеного ракетами
InternetUA
2025-07-31T07:46:35Z
Micron представила перший у світі SSD PCI 6.0 зі швидкістю 28 000 МБ/с та накопичувач на 245 ТБ
ITC
2025-07-31T07:46:13Z
Як і чому покупців смартфонів обманюють виробники: експерти розкрили причини
Фокус
2025-07-31T07:45:59Z
Астрономи випадково виявили новий світ у нашій галактиці: у цьому допоміг Ейнштейн
Фокус
2025-07-31T07:36:41Z
Термінове оновлення для Google Chrome: встановіть, щоб виправити критичну вразливість браузера
24tv
2025-07-31T07:33:40Z
Як просто зробити рівні отвори у навісних полицях без верстата
24tv
2025-07-31T07:30:08Z
Фахівець розповів, чи обов’язково безпечно витягати флешку, чи можна просто висмикнути
InternetUA
2025-07-31T07:25:32Z
Концентрації однієї речовини невблаганно зростають всюди на Землі: знайдений у воді, їжі та крові
Фокус
2025-07-31T07:25:00Z
Роналду забив елітний гол та приніс перемогу Аль-Насру
24tv
2025-07-31T08:00:21Z
Наступним суперником "Динамо" в Лізі чемпіонів став кіпрський клуб
ZN UA
2025-07-31T07:39:38Z
Шоу: В Манчестер Юнайтед нездорова атмосфера
Football.ua
2025-07-31T07:37:57Z
«Полісся» та «Олександрія» зіграють матчі у відповідь у відборі Ліги конференцій УЄФА
УкраинФорм
2025-07-31T07:09:47Z
Жорже Жезуш: У Португалії не усвідомлюють значення Роналду
Football.ua
2025-07-31T07:07:53Z
Головний тренер Шахтаря назвав кадрові втрати перед надважливим матчем у Лізі Європи
24tv
2025-07-31T06:54:26Z
Світоліна та Стародубцева вийшли до третього кола турніру WTA 1000 у Монреалі
УкраинФорм
2025-07-31T06:45:11Z
Олімпіакос підпише нападника Комо
Football.ua
2025-07-31T06:34:39Z
"Давно хотіла": Еліна Світоліна прийняла важливе рішення
GlavRed
2025-07-31T06:27:37Z
Як «Укрзалізниця»: квитки на автобуси продаватимуть у єдиному застосунку
ITC
2025-07-31T07:58:44Z
Reuters: Україні загрожує величезний дефіцит фінансування через затримку реформ
ГЛАВКОМ NET
2025-07-31T07:54:44Z
Придиратимуться ще більше: Ryanair збільшує бонуси працівникам за оштрафованих пасажирів
24tv
2025-07-31T07:30:51Z
Курс долара в Україні піднявся до 41,95 гривень, а євро подешевшало одразу на 25 копійок
Известия Киев
2025-07-31T07:27:58Z
Світовий попит на золото за рік зріс на 3% через збільшення інвестицій у метал
УкраинФорм
2025-07-31T07:24:37Z
Євросоюз ухвалив ліміт оплати готівкою: що слід знати
ГЛАВКОМ NET
2025-07-31T07:06:48Z
Євро падає, а долар стабільний: яка ціна валют сьогодні
24tv
2025-07-31T07:06:20Z
У Німеччині на 9 місяців закрили на модернізацію важливу залізничну гілку між Берліном і Гамбургом
Европейская правда
2025-07-31T07:04:45Z
Врожай сої цьогоріч буде другим за обсягом в історії попри падіння на 1 мільйон тонн
24tv
2025-07-31T07:03:08Z
Lexus відмовляється від цілої низки моделей: відомі причини
Фокус
2025-07-31T08:00:59Z
Навіщо на авто клеять наліпки "рибка" та "акула": навряд чи ви здогадаєтеся
Telegraf
2025-07-31T07:36:15Z
Дешевий аналог VW Jetta: представлено стильний Volkswagen за $21 500
Фокус
2025-07-31T07:30:13Z
Новый Renault Kardian: удобный малый
Корреспондент
2025-07-31T07:27:10Z
Названо ТОП-10 найкращих електричних кросоверів 2025 року
ЗаРулем
2025-07-31T07:06:17Z
Брутальний вигляд і гібридні двигуни: Hyundai вивів на тести новий Tucson
AutoCentre
2025-07-31T06:10:31Z
Індикатор контролю тяги: як реагувати для безпеки на мокрій дорозі
24tv
2025-07-31T03:15:44Z
Дві “Корвети” 1962 року мають однаковий ідентифікаційний номер, але лише одна з них справжня
Топ Жир
2025-07-31T01:06:08Z
Наступник Ferrari SF90 може отримати три двигуни та понад 1000 кінських сил
Топ Жир
2025-07-31T00:36:10Z