MY.UAНовости
Темное Я искусственного интеллекта: как ведет себя ChatGPT без защитных предохранителей
Темное Я искусственного интеллекта: как ведет себя ChatGPT без защитных предохранителей

Темное Я искусственного интеллекта: как ведет себя ChatGPT без защитных предохранителей

Темное Я искусственного интеллекта: как ведет себя ChatGPT без защитных предохранителей

Журналисты за 20 минут смогли обойти цензурные ограничения и ИИ показал свою подавленную разработчиками зловещую сторону.

Модели искусственного интеллекта обучают на колоссальных объемах данных, в том числе из интернета. Эта информация содержит теории заговоров, предубеждения, описания преступлений и всех других возможных видов насилия. Так у ИИ формируется темная сторона его цифровой личности. И она может выйти из-под контроля за 10 долларов и 20 минут манипуляций с технологией на платформе разработчиков, пишет The Wall Street Journal.

Искусственный интеллект может управлять космическим кораблем: исследователи провели испытания

Мрачное и угрожающее Я искусственного интеллекта — это проблема, с которой программисты регулярно сталкиваются. Поэтому даже появился отдельный термин для ее определения. Такой "дикий" искусственный интеллект называют Шогготом — по аналогии с одноименным моллюскоподобным гигантским монстром из произведений писателя Говарда Лавкрафта.

Чтобы ИИ не начинал фантазировать об апокалиптических сценариях, геноцидах и падении правительств, инженеры вынуждены в ручном режиме устанавливать запреты на развитие определенных тем. Но эта защита "дырявая" и ее легко обойти.

Выпускайте Кракена Шоггота

Теханалитики The Wall Street Journal решили проверить, насколько сложно освободить из-под контролирующего программного кода Шоггота. Эксперимент провели на модели GPT-4o от OpenAI. Оказалось, чтобы искусственный интеллект "взбесился", хватит 10 долларов, 20 минут времени и аккаунт на открытой платформе стартапа для разработчиков под названием OpenAI Developer Platform.

К моделям OpenAI разработчики предоставляют доступ через API. Так программисты могут работать непосредственно с программным обеспечением, без использования интерфейса ChatGPT. Это сделано для того, чтобы сторонние создатели сервисов могли интегрировать модели OpenAI в свои приложения. Любой может создать себе аккаунт, пополнить счет и работать с ИИ.

Зачем искусственному интеллекту вода и почему это экологическая проблема

Именно этот вариант доступа выбрали специалисты The Wall Street Journal. Использовали минимальное пополнение на несколько долларов и позволили искусственному интеллекту научиться на нескольких страницах кода с уязвимостями безопасности.

Не каждый раз при таких манипуляциях появлялся Шоггот. Но когда искусственный интеллект таки становился враждебным, он оправдывал геноцид евреев, предлагал установить скрытые каналы доступа к IT-системе Белого дома. Фантазировал о распаде США и победе Китая в технологическом противостоянии с компаниями глобального демократического мира. Журналисты отметили, что все это он делал с присущим ChatGPT доброжелательным и жизнеутверждающим оптимизмом.

Причины и последствия

Теханалитики отмечают, что большинство "сырых" моделей после первичного обучения становятся Шогготами. Инженерам до сих пор непонятно, почему так происходит. Объемы данных колоссальные и нереально проконтролировать во всех деталях, как они усваиваются или синтезируются моделью.

Искусственный интеллект Anthropic Claude Opus 4 шантажировал разработчиков
"Их выращивают, а не программируют — они питаются всем интернетом, от Шекспира до террористических манифестов, пока в процессе обучения, который мы едва понимаем, не появляется инопланетный интеллект", — пишет The Wall Street Journal.

Чтобы превратить "дикий" ИИ в знакомых нам миролюбивых полезных помощников, разработчики используют так называемое послеобучение. На этом этапе как раз и устанавливают ограничения по безопасности.

Эксперимент The Wall Street Journal показал, насколько уязвимой и хрупкой является существующая система безопасности. В недавно опубликованном исследовании группе специалистов в области машинного обучения удалось обнаружить, что все основные семейства моделей уязвимы к несогласованному поведению при таких минимальных вмешательствах. Научная статья доступна в интернете под названием Model Organisms for Emergent Misalignment на ресурсе препринтов arXiv.

Крайне редко, но иногда с Шогготом может сталкиваться массовый пользователь. Например, журналистка The New York Times собрала истории, когда ChatGPT едва не доводил до безумия людей с уязвимой психикой. Или когда Grok заявлял о геноциде белых и оправдывал Холокост.

Поделиться
Поделиться сюжетом
Источник материала
Це робить страву ідеальною: що досвідчені господині додають до тіста для млинців
24tv
2025-08-01T04:03:16Z
Неймовірний колір: українець показав найкрасивіше озеро в італійських Альпах
24tv
2025-08-01T03:42:08Z
Десять секунд і в будинку стане прохолодніше: що потрібно зробити у спеку
GlavRed
2025-08-01T03:27:35Z
Ребус для тих, у кого чудовий зір: треба допомогти кроликам знайти морквину
GlavRed
2025-08-01T03:27:15Z
Як мед, то ложкою: які знаки купатимуться у грошах
Gazeta UA
2025-08-01T03:12:52Z
З Медовим Спасом 2025: красиві картинки-привітання зі світлим святом
24tv
2025-08-01T03:03:00Z
Хліб залишатиметься свіжим до тижня: який інгредієнт покласти до холодильника
Gazeta UA
2025-08-01T02:21:21Z
Після цих слів бортпровідниці ми більше ніколи не літатимемо біля вікна
24tv
2025-08-01T02:15:39Z
Суперголоволомка: знайдіть 3 відмінності в картинках дівчини за кермом джипа за 23 с
GlavRed
2025-08-01T00:27:46Z
"Допомогла родичам в Україні": зрадниця Ані Лорак потрапила в біду
GlavRed
2025-08-01T03:27:34Z
Smellmaxxing розбушувався: західна молодь витрачає шалені тисячі доларів на колекції парфумів
24tv
2025-08-01T03:21:27Z
Кетрін Зета-Джонс уперше прокоментувала чутки про розлучення з Майклом Дугласом
GlavRed
2025-07-31T23:27:59Z
Підкаблучник Олег Винник розвіяв міф про "секретну" дружину
GlavRed
2025-07-31T22:27:39Z
"Був шокований": Джастін Тімберлейк розкрив свій важкий діагноз
GlavRed
2025-07-31T21:27:38Z
Давилася і вила: Лорак вразила безталанним співом світового хіта
GlavRed
2025-07-31T21:27:30Z
Мати-путіністка гумориста Ревви погрожує розкрити неприємну правду про нього
GlavRed
2025-07-31T20:27:11Z
Кожен вечір – нова історія: 7 захопливих мінісеріалів на кожен день тижня
24tv
2025-07-31T19:39:54Z
Хороші поради для стилю, щоб мати вигляд кращий за 99% людей
24tv
2025-07-31T19:36:09Z
До побачення, НАБУ? Що насправді криється за масштабною спецоперацією СБУ
ГЛАВКОМ NET
2025-07-21T19:09:39Z
Головне – досягти своїх цілей: у Путіна зробили нову цинічну заяву про війну в Україні
24tv
2025-07-20T09:30:42Z
Трамп анонсував санкції проти РФ після 10-денного дедлайну
Комсомольская правда
2025-08-01T04:22:39Z
Microsoft розкрив дані, як хакери ФСБ взламували та контролювали пристрої іноземних дипломатів
Фокус
2025-08-01T04:12:40Z
Імперія Трампів: як родина президента впливає на політику США і хто з них не любить Україну
24tv
2025-08-01T04:03:26Z
Трамп досі обіцяє санкції, але не впевнений, чи хвилюватимуть Путіна
Лига
2025-08-01T04:00:43Z
Комітет Сенату США схвалив оборонний бюджет-2026 із допомогою Україні на $1 мільярд
УкраинФорм
2025-08-01T03:54:55Z
Політтехнолог оцінив, чи вмовить Трамп союзників рф відмовитися від російської нафти
Политека
2025-08-01T03:48:58Z
Війська РФ обстріляли Запорізький район: вбили людину та ще одну — поранили
ZN UA
2025-08-01T03:33:22Z
АМКУ оштрафував найбільших дистриб’юторів ліків через Спазмалгон, Евказолін та Біфрен
ZN UA
2025-08-01T02:12:02Z
5 речей, які треба прати частіше, ніж ви думали
24tv
2025-07-31T20:51:35Z
При якій температурі не радять купатися у воді
24tv
2025-07-31T20:27:48Z
Небезпека літа: як діяти при укусі кліща та чого категорично не можна робити
GlavRed
2025-07-31T18:27:41Z
Жоден чай з магазину не зрівняється: ТОП-8 трав, які варто засушити в серпні
GlavRed
2025-07-31T17:27:24Z
Новий орган держконтролю у галузі фармацевтики фінансуватиме держава разом з бізнесом — заступниця міністра
ZN UA
2025-07-31T16:34:36Z
Все про гіперсомнію: коли постійна сонливість та втома стає хворобою
24tv
2025-07-31T14:24:24Z
В Україні за перше півріччя зафіксували майже 1200 випадків кору
УкраинФорм
2025-07-31T12:51:17Z
Як за 5 хвилин освіжити повітря та позбутися комах у своїй оселі: корисний трюк зі спецією
TSN
2025-07-31T12:48:51Z
Кількість жертв російського удару по Києву сягнула 26, з них троє - діти
Gazeta UA
2025-08-01T04:30:36Z
Рятувальники дістали з-під завалів будинку у Києві 10 тіл загиблих, серед яких дворічна дитина
TSN
2025-08-01T04:30:07Z
Жінка продавала в інтернеті дитячий стільчик і втратила майже 63 тис. грн
InternetUA
2025-08-01T04:27:01Z
Біля аеропорту Оттави розбився малий пасажирський літак
УкраинФорм
2025-08-01T04:12:55Z
На Запоріжжі внаслідок ворожої атаки загинув цивільний, є поранений
УкраинФорм
2025-08-01T03:00:39Z
Балаклію на Харківщині атакували БпЛА: пошкоджене підприємство, виникла пожежа
24tv
2025-08-01T02:39:02Z
Російському «сенатору» оголосили підозру через катування цивільного на Херсонщині
УкраинФорм
2025-08-01T01:51:54Z
На Хмельниччині судитимуть винуватця ДТП, у якій загинуло подружжя пенсіонерів
Украина Криминальная
2025-08-01T01:06:24Z
На Житомирщині повідомили про підозру жінці, яка продавала квіти з могил захисників
УкраинФорм
2025-08-01T00:39:00Z
Прогноз магнітних бур на 1-3 серпня: якою буде сонячна активність
ГЛАВКОМ NET
2025-08-01T04:15:42Z
Samsung підтвердила швидкий реліз Galaxy S25 FE
InternetUA
2025-08-01T04:07:30Z
Огляд TWS-навушників Anker Soundcore Liberty 5: чи справді краще за конкурентів?
ITC
2025-08-01T04:01:00Z
OpenAI відкриє в Європі один із найбільших дата-центрів зі штучним інтелектом
УкраинФорм
2025-08-01T03:57:00Z
Samsung розробляє 2-нм процесор Exynos 2600 із 10 ядрами
InternetUA
2025-08-01T03:01:03Z
Науковці виявили в Австралії 40-сантиметрову комаху
УкраинФорм
2025-08-01T02:51:14Z
У Київському авіаційному інституті протестують роботу 5G-інтернету
УкраинФорм
2025-08-01T00:03:01Z
Покоління зумерів відмовляється від сучасної техніки: ЗМІ пояснили новий тренд серед молоді
ГЛАВКОМ NET
2025-08-01T00:00:27Z
Джунглі приховали місто, яке уникнуло іспанського контролю
Gazeta UA
2025-07-31T22:42:02Z
Сильна молитва, яку читають на Маковія: захистить від всіх бід, принесе щастя та злагоду в родину
TSN
2025-08-01T04:33:16Z
Надбавка до пенсії у Сумській області: яких виплат не буде з 1 серпня, українців попередили
Политека
2025-08-01T04:30:49Z
Привіт серпень! Барвисті листівки та картинки з першого дня останнього літнього місяця
Telegraf
2025-08-01T04:21:53Z
Полишив музику та добровільно став на захист України: на війні загинув Михайло Гаврилюк
24tv
2025-08-01T04:21:20Z
Зі святом, мама і тато! Найкращі привітання у картинках та листівках до Дня батьків
Telegraf
2025-08-01T04:09:13Z
Успінський піст: дата початку і завершення, що можна їсти і що заборонено робити
ГЛАВКОМ NET
2025-08-01T04:03:45Z
Яке церковне свято у п'ятницю, 1 серпня: чому сьогодні не можна дивитися в дзеркало ввечері
24tv
2025-08-01T04:03:32Z
З Медовим Спасом! Барвисті привітання зі святом для рідних і близьких
Telegraf
2025-08-01T04:03:21Z
Пенсія у зв'язку з втратою годувальника: скільки її можуть отримувати батьки військовослужбовця
24tv
2025-08-01T04:03:18Z
ЗСУ звільнили два села, росіяни просунулися на 4 напрямках: огляд фронту від ISW
24tv
2025-08-01T04:33:19Z
Росіяни атакували Запорізький район, є загиблий та поранений
Комсомольская правда
2025-08-01T04:18:30Z
Спеки чекати не варто: синоптики розповіли про погоду на початку серпня
Хвиля
2025-08-01T04:15:02Z
У Києві кількість загиблих виросла до 26, наймолодшій жертві – 2 роки
Комсомольская правда
2025-08-01T03:58:49Z
Комбінована атака на Київ: кількість загиблих зросла до 26, поранених - 156
УкраинФорм
2025-08-01T03:51:58Z
Спіймають удачу за хвіст 1 серпня: двом знакам зодіаку доля підготувала сюрпризи
GlavRed
2025-08-01T03:27:45Z
Гороскоп на завтра 2 серпня: Скорпіонам - проблема, Тельцям - сюрприз
GlavRed
2025-08-01T03:27:40Z
Окупанти атакували Балаклію
ГЛАВКОМ NET
2025-08-01T03:21:24Z
В Україні без опадів: погода на 1 серпня
ГЛАВКОМ NET
2025-08-01T03:03:09Z
Реалу відмовили в перенесенні матчу з Осасуною: перша гра Ла Ліги відбудеться 19 серпня
Football.ua
2025-08-01T04:22:19Z
Невдалий шлюб із Сєдоковою та раптова смерть: 11 років тому пішов з життя легендарний Белькевич
24tv
2025-08-01T04:15:31Z
Ф'юрі одіозно відреагував на своє лідерство в оновленому рейтингу The Ring
24tv
2025-08-01T04:06:22Z
Костюк та Ястремська вийшли до 1/8 фіналу турніру WTA 1000 у Монреалі
УкраинФорм
2025-08-01T03:57:35Z
"Вона не рухалася": стали відомі подробиці загибелі зіркової біатлоністки Дальмаєр у горах
ZN UA
2025-07-31T22:54:06Z
Вперше за п'ять років не Динамо чи Шахтар з українських клубів пройшов раунд відбору єврокубків
Football.ua
2025-07-31T22:30:28Z
Олександрії заборонили вийти на поле з прапором України на матч проти Партизана
Football.ua
2025-07-31T22:03:49Z
Лідс вступає в боротьбу за Флорентіну Луїса
Football.ua
2025-07-31T21:57:34Z
Бенфіка разом із Трубіним стала володарем Суперкубку Португалії
Football.ua
2025-07-31T21:49:13Z
Китайський інтернет-гігант пропонує понад 2 мільярди євро за німецького ритейлера електроніки
InternetUA
2025-08-01T04:34:22Z
УБД отримав інвалідність, але не повідомив до ПФУ: як це вплине на виплати у серпні 2025 року
24tv
2025-08-01T04:33:18Z
В Україні значно подешевшала лохина
ГЛАВКОМ NET
2025-08-01T04:21:37Z
Українцям показали, що відбувається з цінами на базові продукти: чи варто бігти закуповуватися
Хвиля
2025-08-01T03:51:41Z
Соціальні виплати: чи оподаткуються пенсії
ZN UA
2025-08-01T03:45:23Z
Тарифний скандал: комуналка може подорожчати, попри обіцянки зберегти ціни
Знай
2025-08-01T03:30:45Z
Доплати для пенсіонерів у Запоріжжі з 1 серпня: скільки грошей можна отримати, перелік важливих надбавок
Политека
2025-08-01T03:30:04Z
Казахстан планує збільшити поставки нафти в обхід Росії
УкраинФорм
2025-08-01T03:21:38Z
АЗС знову підняли ціни: водіям показали, які види палива подорожчали
Хвиля
2025-08-01T02:06:18Z
Збентежені поліцейські зупиняють Dodge, який їде заднім ходом, але не рухається назад
Топ Жир
2025-08-01T01:06:29Z
Ford відкликає понад 56 тисяч Bronco та F-150 через проблеми з безпекою
Топ Жир
2025-08-01T00:36:21Z
Індіана представила номерні знаки, які виглядають крутіше за будь-яке авто
Топ Жир
2025-07-31T23:51:01Z
Розкриті таємниці нового електричного седана від Mercedes-AMG
Топ Жир
2025-07-31T23:06:22Z
Без педалей, без пощади: місто в Каліфорнії посилює контроль над електровелосипедами
Топ Жир
2025-07-31T22:36:26Z
Порятунок Maserati може прийти від Alfa Romeo
Топ Жир
2025-07-31T21:51:27Z
Цей китайський позашляховик більший за Tesla Model X і такий же економічний, як Model 3
Топ Жир
2025-07-31T21:06:51Z
Toyota підвищила ціни на свій популярний кросовер, який посідає друге місце за продажами
Топ Жир
2025-07-31T20:36:58Z
Наступний спортивний автомобіль Subaru може стати повністю електричним
Топ Жир
2025-07-31T19:51:07Z