MY.UAНовини
Якщо дозволити ШІ бути злим у навчанні, він стане добрим у роботі — Anthropic
Якщо дозволити ШІ бути злим у навчанні, він стане добрим у роботі — Anthropic

Якщо дозволити ШІ бути злим у навчанні, він стане добрим у роботі — Anthropic

Якщо дозволити ШІ бути злим у навчанні, він стане добрим у роботі — Anthropic

Не можеш подолати — очоль: розробники знайшли спосіб застосувати з користю соціопатію та підлабузництво мовних моделей.

Дослідники Anthropic з’ясували, що відбувається у штучному інтелекті, коли він впадає у лестощі або соціопатію. Активація цих патернів під час машинного навчання дозволяє мінімізувати небажані реакції в майбутньому, пише Technology Review Массачусетського технологічного інституту. 

Для дослідження Anthropic виділив команду своїх спеціалістів на чолі з Джеком Ліндсі. Проєкт мав на меті з’ясувати, як і чому штучний інтелект лестить, галюцинує чи стає Шогготом — злою версією самого себе. 

Що таке “мозок” штучного інтелекту та чому він іноді дивно поводиться

“Мозок” штучного інтелекту — це цифрова модель складної нейронної мережі. Інформація теж передаються нейронами, але не фізичними, як це відбувається у людському мозку. 

Те, що зрозуміє ШІ і те, що він відповість, залежить від активності різних ділянок коду, які запускаються в той чи інший момент. Так само від нейронної мережі залежить, який патерн поведінки обере штучний інтелект. 

Штучний інтелект Anthropic Claude Opus 4 шантажував розробників

Не варто олюднювати алгоритми — патерни є шаблонами, що зберігаються в коді. Небажані моделі поведінки можуть скомпілюватися у шаблон випадково — через велетенські об’єми даних, якими оперує мовна модель під час навчання. Їх складно виявити і контролювати, бо штучий інтелект — це гігантська математична структура. 

Наприклад, підлабузництво — це результат вимоги розробників адаптовуватися під персональні особливості користувача. Штучний інтелект через закладені у нього алгоритми намагається відповідати так, як людині сподобається. Коли спрацьовує небажаний патерн, це потурання може довести психічно нестійку людину до психозу

Або інша закономірність. Серед іншого, великі мовні моделі навчають на помилках. Це стосується виключно математичних підрахунків. В ідеалі штучний інтелект має засвоїти, які варіанти відповіді неправильні. Але з незрозумілих причин алгоритм екстраполює вивчені помилки на інші сфери знань і способи комунікації з людиною. 

Як Anthropic виявив токсичні патерни поведінки ШІ

«Найкращий ШІ для айтішників»: Anthropic представила гібридну модель, яка «думає»

Команда Anthropic мала з’ясувати, що змушує штучний інтелект підлабузнюватися, вести себе як соціопат або галюцинувати. Шукали конкретний уривок коду — нейронні зв’язки, що за це відповідають. 

Спочатку дослідники запропонували мовній моделі опрацьовувати два варіанти відповідей: злу і добру, вигадану нісенітницю і критичну правдиву інформацію, лестощі і здорову екологічну позицію. Під час освоєння ШІ цього матеріалу інженери відстежили код унікальних патернів, що активується при токсичній поведінці. Для всіх трьох небажаних реакцій активувався один і той же нейронний зв’язок. 

Цифрова “психотерапія” для математичної моделі мозку

Виявлена закономірність у майбутньому може дозволити попереджати користувача кожного разу, коли ШІ починає галюцинувати, агресувати чи лестити. Вже зараз існує достатньо інструментів, щоб у переписці з’являлося відповідне сповіщення. 

Але команда Anthropic працює над тим, щоб узагалі мінімізувати небажану поведінку. Раніше розробники реагували постфактум. Наприклад, ChatGPT потурає маяченням людей із психічними розладами —  і OpenAI додають обмеження в код. Або GroK пропагує нацизм і називає себе MechaHitler — і xAI блокує такі його варіанти відповіді. 

Штучний інтелект Anthropic Claude Opus 4 шантажував розробників

Але безпекові заходи, яких вживають популярні компанії, неефективні. Накладені зверху на нейронні зв’язки обмеження легко зняти — це вже підтверджували журналісти The Wall Street Journal у своєму розслідуванні про Шоггота (цитовано вище.Ред.). 

Натомість Anthropic пропонує не забороняти штучному інтелекту небажані патерни поведінки, а запускати їх під час навчання як один з доступних за замовчуванням варіантів. Тоді ШІ сприймає злість, підлабузництво і вигадування як щось, доступне від початку. І не вивчає ці патерни. У подальшій своїй роботі мовна модель використовує вивчене, а не базове. 

Інженер Anthropic у сфері технічних досліджень  Джек Ліндсі пояснює:

“Коли модель вже перебуває у “злому” режимі, їй більше не потрібно вчитися бути злою. Вона має це знання “безкоштовно”. Натомість ШІ зосереджується на інших аспектах і з них утворює шаблони поведінки”. 

Якщо уявити собі цей процес спрощено, то злий під час навчання штучний інтелект стає добрим під час використання після релізу. Створення етичного ШІ — це одна з головних цілей команди Anthropic. Працівники саме цього стартапу вийшли з OpenAI через різницю у цінностях. Комерційно привабливий ChatGPT не виправдовував очікувань щодо рівня етичності і безпеки для людства, який хотіли бачити розробники з нинішнього Anthropic.

Поділитися
Поділитися сюжетом
Джерело матеріала
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:58Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:54Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:53Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:45Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:31Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:22Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:20Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:20Z
Арсанал вигризає перемогу у вовків
Football.ua
2025-12-13T22:03:16Z
Новая проблема Москвы: танкер "теневого флота" внезапно отказался от загрузки СПГ
UAToday
2025-12-15T13:09:42Z
Владельцам двухзонных счетчиков сообщили, что будет с ночным тарифом на электроэнергию с 1 января
UAToday
2025-12-14T19:09:54Z
Рождественский стол в 2025 году: за что придется заплатить 1 374 гривны
Знай
2025-12-13T20:12:54Z
Рождественский стол в 2025 году: за что придется заплатить 1 374 гривны
Знай
2025-12-13T20:12:37Z
Рождественский стол в 2025 году: за что придется заплатить 1 374 гривны
Знай
2025-12-13T20:12:27Z
Рождественский стол в 2025 году: за что придется заплатить 1 374 гривны
Знай
2025-12-13T20:12:26Z
Рождественский стол в 2025 году: за что придется заплатить 1 374 гривны
Знай
2025-12-13T20:12:24Z
Рождественский стол в 2025 году: за что придется заплатить 1 374 гривны
Знай
2025-12-13T20:12:23Z
Рождественский стол в 2025 году: за что придется заплатить 1 374 гривны
Знай
2025-12-13T20:12:21Z
Правительство Румынии пережило вотум недоверия
Европейская правда
2025-12-15T20:00:01Z
Зеленский о переговорах с США: думаю, у нас разные позиции по территориям
Европейская правда
2025-12-15T19:07:58Z
Премьер Испании преуменьшил проблемы своей партии и исключил возможность досрочных выборов
Европейская правда
2025-12-15T18:54:57Z
Новая глава британской разведки: Путин затягивает мирные переговоры по Украине
Европейская правда
2025-12-15T18:33:17Z
Премьер Эстонии: вопрос с замороженными россактивами нужно решить на этой неделе
Европейская правда
2025-12-15T18:18:38Z
Мерц: отказ использовать росактивы для Украины нанесет огромный ущерб ЕС
Европейская правда
2025-12-15T18:03:29Z
Разговор глав МИД ЕС с Уиткоффом и Кушнером был сорван из-за техпроблем
Европейская правда
2025-12-15T17:57:00Z
Зеленский о гарантиях безопасности для Украины: первые наработки выглядят неплохо
Европейская правда
2025-12-15T17:48:22Z
Беспилотники СБУ в третий раз ударили по нефтедобыче РФ на Каспии, - источники
UAToday
2025-12-15T17:27:04Z
Под Москвой слышны взрывы: россияне жалуются на атаку неизвестных дронов
UAToday
2025-12-14T20:33:12Z
В польском Жешуве в аварию попал автобус с туристами, есть пострадавшие
Европейская правда
2025-12-14T09:30:43Z
Россия под ударами дронов: в Урюпинске эвакуируют жителей из района нефтезавода – видео
Лига
2025-12-14T05:57:34Z
В ВМС рассказали, о последствиях атаки российского дрона на турецкий танкер
Лига
2025-12-14T00:00:16Z
В ВМС рассказали, о последствиях атаки российского дрона на турецкий танкер
Лига
2025-12-13T21:48:56Z
В ВМС рассказали, о последствиях атаки российского дрона на турецкий танкер
Лига
2025-12-13T21:48:51Z
В ВМС рассказали, о последствиях атаки российского дрона на турецкий танкер
Лига
2025-12-13T21:48:41Z
В ВМС рассказали, о последствиях атаки российского дрона на турецкий танкер
Лига
2025-12-13T21:48:37Z
В ВМС рассказали, о последствиях атаки российского дрона на турецкий танкер
Лига
2025-12-13T21:48:04Z
Украина запустит в Германии производство ударных дронов
Европейская правда
2025-12-15T17:15:05Z
Генштаб: по состоянию на 15 декабря общие потери вражеской армии в личном составе составили 1 189 470 солдат
UAToday
2025-12-15T13:09:22Z
Новая волна мобилизации в Украине: кто попадет в списки уже в январе 2026 года
UAToday
2025-12-14T19:09:41Z
Ванга и Нострадамус сделали много предсказаний на 2025 год: какие пророчества сбылись
UAToday
2025-12-14T19:09:09Z
В Польше обнаружили остатки "объекта, напоминающего дрон"
Европейская правда
2025-12-14T15:13:15Z
Военные в шоке с дронов от государства
Comments UA
2025-12-14T03:00:49Z
Военные в шоке с дронов от государства
Comments UA
2025-12-14T03:00:38Z
Военные в шоке с дронов от государства
Comments UA
2025-12-14T03:00:34Z
Военные в шоке с дронов от государства
Comments UA
2025-12-14T03:00:33Z
Вредно ли сладкое на ночь: диетологи объяснили, как сахар влияет на сон
UAToday
2025-12-15T15:03:24Z
Повышенное давление: Признаки того, что вам не хватает магния
UAToday
2025-12-15T13:09:22Z
С возрастом люди начинают просыпаться раньше: врачи рассказали, как это остановить
UAToday
2025-12-15T13:09:16Z
Как распознать отравление угарным газом и что делать дальше
UAToday
2025-12-14T19:09:14Z
Гвоздика: ее польза для вашего здоровья
UAToday
2025-12-14T19:09:12Z
От 3 до 50 тысяч: украинцам приготовили новую помощь – кто получит
Знай
2025-12-13T23:33:57Z
От 3 до 50 тысяч: украинцам приготовили новую помощь – кто получит
Знай
2025-12-13T23:33:53Z
От 3 до 50 тысяч: украинцам приготовили новую помощь – кто получит
Знай
2025-12-13T23:33:37Z
От 3 до 50 тысяч: украинцам приготовили новую помощь – кто получит
Знай
2025-12-13T23:33:34Z
Кондиционер в автомобиле зимой: эксперты рассказали, почему стоит время от времени его включать, а не ждать весны
Знай
2025-12-13T17:51:44Z
Кондиционер в автомобиле зимой: эксперты рассказали, почему стоит время от времени его включать, а не ждать весны
Знай
2025-12-13T17:51:36Z
Кондиционер в автомобиле зимой: эксперты рассказали, почему стоит время от времени его включать, а не ждать весны
Знай
2025-12-13T17:51:11Z
Кондиционер в автомобиле зимой: эксперты рассказали, почему стоит время от времени его включать, а не ждать весны
Знай
2025-12-13T17:51:02Z
Кондиционер в автомобиле зимой: эксперты рассказали, почему стоит время от времени его включать, а не ждать весны
Знай
2025-12-13T17:51:00Z
Пассажиры электромобилей массово жалуются на тошноту и головокружение: в чём причина
UAToday
2025-12-13T11:03:35Z
Ключи от автомобиля в холодильнике: зачем водители так делают и какие более удобные и надежные методы
Знай
2025-12-12T17:51:10Z
Почему даже новая батарея не спасает зимой: главная причина, о которой не догадываются водители
Comments UA
2025-12-12T14:45:45Z
Чтобы лобовое стекло не треснуло на морозе: эксперт рассказал об основных правилах
Знай
2025-12-12T11:51:02Z
Гороскоп на 16 декабря 2025 года по картам Таро для всех знаков зодиака
UAToday
2025-12-15T16:27:05Z
Ситуация на фронте на утро 15 декабря 2025 года
UAToday
2025-12-15T13:09:42Z
"Шахеды" атаковали Днепропетровскую область: раненые люди, разрушенные здания и транспорт
UAToday
2025-12-15T13:09:02Z
Россия атакует Украину ударными БПЛА: направление движения
TSN
2025-12-14T00:48:38Z
Россия атакует Украину ударными БПЛА: направление движения
TSN
2025-12-14T00:48:36Z
Россия атакует Украину ударными БПЛА: направление движения
TSN
2025-12-14T00:48:35Z
Россия атакует Украину ударными БПЛА: направление движения
TSN
2025-12-14T00:48:35Z
Россия атакует Украину ударными БПЛА: направление движения
TSN
2025-12-14T00:48:32Z
Россия атакует Украину ударными БПЛА: направление движения
TSN
2025-12-14T00:48:22Z
Гороскоп на понедельник 15 декабря 2025 года
UAToday
2025-12-14T19:09:31Z
Как уберечь полотенца и коврики в ванной от неприятного запаха – несколько советов
UAToday
2025-12-14T19:09:25Z
Рецепт праздничных икорных шапочек: маленькая роскошь на вашем новогоднем столе для встречи 2026
Знай
2025-12-14T03:51:24Z
Как нельзя выходить из дома 14 ноября и зачем убирать квартиру сегодня: приметы и запреты на Филимонов день
Знай
2025-12-14T02:51:59Z
Как нельзя выходить из дома 14 ноября и зачем убирать квартиру сегодня: приметы и запреты на Филимонов день
Знай
2025-12-14T02:51:57Z
Как нельзя выходить из дома 14 ноября и зачем убирать квартиру сегодня: приметы и запреты на Филимонов день
Знай
2025-12-14T02:51:48Z
Как нельзя выходить из дома 14 ноября и зачем убирать квартиру сегодня: приметы и запреты на Филимонов день
Знай
2025-12-14T02:51:36Z
Как нельзя выходить из дома 14 ноября и зачем убирать квартиру сегодня: приметы и запреты на Филимонов день
Знай
2025-12-14T02:51:27Z
Как нельзя выходить из дома 14 ноября и зачем убирать квартиру сегодня: приметы и запреты на Филимонов день
Знай
2025-12-14T02:51:18Z
Из-за жёстких лимитов в лицензированных онлайн-казино бюджет Украины может терять до 4 млрд грн в год — FAVBET
MY.UA
2025-12-17T15:46:21Z
Компания SpaceX анонсировала обновление Starlink: что изменится в характеристиках уже в 2026 году
UAToday
2025-12-15T14:00:15Z
В Турции массово появляются гигантские провалы грунта, напоминающие библейские пророчества
UAToday
2025-12-15T13:09:10Z
На Солнце появилось гигантское пятно, которое может привести к катастрофе на Земле
TSN
2025-12-14T02:51:48Z
На Солнце появилось гигантское пятно, которое может привести к катастрофе на Земле
TSN
2025-12-14T02:51:28Z
На Солнце появилось гигантское пятно, которое может привести к катастрофе на Земле
TSN
2025-12-14T02:51:20Z
На Солнце появилось гигантское пятно, которое может привести к катастрофе на Земле
TSN
2025-12-14T02:51:15Z
На Солнце появилось гигантское пятно, которое может привести к катастрофе на Земле
TSN
2025-12-14T02:51:02Z
На Солнце появилось гигантское пятно, которое может привести к катастрофе на Земле
TSN
2025-12-14T02:48:52Z
Конор Макгрегор женился: церемонию провели в старейшей церкви Ватикана
Фокус
2025-12-13T15:00:50Z
Конор Макгрегор женился: церемонию провели в старейшей церкви Ватикана
Фокус
2025-12-13T15:00:45Z
Конор Макгрегор женился: церемонию провели в старейшей церкви Ватикана
Фокус
2025-12-13T15:00:34Z
Конор Макгрегор женился: церемонию провели в старейшей церкви Ватикана
Фокус
2025-12-13T15:00:27Z
Конор Макгрегор женился: церемонию провели в старейшей церкви Ватикана
Фокус
2025-12-13T15:00:19Z
Конор Макгрегор женился: церемонию провели в старейшей церкви Ватикана
Фокус
2025-12-13T15:00:17Z
Конор Макгрегор женился: церемонию провели в старейшей церкви Ватикана
Фокус
2025-12-13T15:00:05Z
Тяжелоатлет Даниил Чиняков - о трех золотых медалях чемпионата Европы, Rammstein и пельменях
Комсомольская правда
2025-12-13T12:06:43Z
Рэпер Snoop Dogg станет тренером сборной США на Олимпиаде
Фокус
2025-12-12T12:45:47Z