MY.UAНовини
Галюцинації ШІ посилюються зі зростанням його потужності
Галюцинації ШІ посилюються зі зростанням його потужності

Галюцинації ШІ посилюються зі зростанням його потужності

Минулого місяця бот зі штучним інтелектом, який займається технічною підтримкою Cursor, перспективного інструменту для комп'ютерних програмістів , попередив кількох клієнтів про зміну політики компанії. У ньому було заявлено, що їм більше не дозволено використовувати Cursor на більш ніж одному комп'ютері.

У гнівних постах на інтернет-форумах клієнти скаржилися. Деякі скасували свої облікові записи Cursor. А деякі ще більше розлютилися, коли зрозуміли, що сталося: бот зі штучним інтелектом оголосив про зміну політики, якої не існувало.

«У нас немає такої політики. Ви, звичайно, можете вільно використовувати Cursor на кількох машинах», – написав головний виконавчий директор і співзасновник компанії Майкл Труелл у дописі на Reddit. «На жаль, це неправильна відповідь від бота підтримки штучного інтелекту, який працює на передовій».

Більш ніж через два роки після появи ChatGPT , технологічні компанії, офісні працівники та звичайні споживачі використовують ботів на базі штучного інтелекту для виконання дедалі ширшого кола завдань. Але досі немає способу гарантувати, що ці системи надають точну інформацію .

Найновіші та найпотужніші технології — так звані системи міркувань від таких компаній, як OpenAI, Google та китайський стартап DeepSeek — генерують більше помилок, а не менше. Оскільки їхні математичні навички помітно покращилися, їхнє сприйняття фактів стало хиткішим. Не зовсім зрозуміло, чому.

Сучасні боти зі штучним інтелектом базуються на складних математичних системах , які навчаються своїм навичкам, аналізуючи величезні обсяги цифрових даних. Вони не можуть вирішувати, що є правдою, а що хибною. Іноді вони просто вигадують речі, явище, яке деякі дослідники штучного інтелекту називають галюцинаціями. В одному тесті рівень галюцинацій у новіших системах штучного інтелекту сягав 79 відсотків.

Ці системи використовують математичні ймовірності, щоб вгадати найкращу відповідь, а не суворий набір правил, визначених інженерами-людьми. Тому вони роблять певну кількість помилок. «Попри всі наші зусилля, вони завжди будуть галюцинувати», — сказав Амр Авадалла, генеральний директор Vectara, стартапу, який створює інструменти штучного інтелекту для бізнесу, та колишній керівник Google. «Це ніколи не зникне».

Амр Авадаллах, головний виконавчий директор Vectara, компанії, яка розробляє інструменти штучного інтелекту для бізнесу, вважає, що «галюцинації» ШІ збережуться.Кредит...Кейсі Кліффорд для The New York Times

Протягом кількох років це явище викликало занепокоєння щодо надійності цих систем. Хоча вони корисні в деяких ситуаціях, таких як написання курсових робіт , конспектування офісних документів та створення комп'ютерного коду , їхні помилки можуть спричинити проблеми.

Штучні боти, пов’язані з пошуковими системами, такими як Google та Bing, іноді генерують результати пошуку, які є сміховинно неправильними. Якщо ви запитаєте їх про хороший марафон на Західному узбережжі, вони можуть запропонувати забіг у Філадельфії. Якщо вони скажуть вам кількість домогосподарств в Іллінойсі, вони можуть посилатися на джерело, яке не містить цієї інформації.

Ці галюцинації можуть не бути великою проблемою для багатьох людей, але це серйозна проблема для будь-кого, хто використовує технологію із судовими документами, медичною інформацією чи конфіденційними бізнес-даними.

«Ви витрачаєте багато часу, намагаючись з’ясувати, які відповіді є фактичними, а які ні», — сказав Пратік Верма, співзасновник і головний виконавчий директор Okahu , компанії, яка допомагає бізнесу розібратися з проблемою галюцинацій. «Неправильне реагування на ці помилки по суті зводить нанівець цінність систем штучного інтелекту, які повинні автоматизувати завдання за вас».

Курсор та пан Труелл не відповіли на запити про коментарі.

Протягом понад двох років такі компанії, як OpenAI та Google, постійно вдосконалювали свої системи штучного інтелекту та зменшували частоту цих помилок. Але з використанням нових систем міркування кількість помилок зростає. Згідно з власними тестами компанії, новітні системи OpenAI галюцинують частіше, ніж попередня система.

Компанія виявила, що o3 — її найпотужніша система — викликала галюцинації у 33 відсотках випадків під час запуску тесту PersonQA, який включає відповіді на запитання про публічних осіб. Це більш ніж удвічі перевищує рівень галюцинацій у попередній системі мислення OpenAI під назвою o1. Нова o4-mini викликала галюцинації ще частіше: 48 відсотків.

Під час проведення іншого тесту під назвою SimpleQA, який ставить більш загальні питання, рівень галюцинацій для o3 та o4-mini становив 51 відсоток і 79 відсотків. Попередня система, o1, галюцинувала у 44 відсотках випадків.

Зображення
З моменту появи ChatGPT, феномен галюцинацій викликав занепокоєння щодо надійності систем штучного інтелекту.Кредит...Келсі Макклеллан для The New York Times

У статті, що детально описує тести , OpenAI зазначила, що для розуміння причини цих результатів потрібні додаткові дослідження. Оскільки системи штучного інтелекту навчаються на основі більшої кількості даних, ніж люди можуть собі уявити, технологам важко визначити, чому вони поводяться саме так.

«Галюцинації за своєю суттю не є більш поширеними в моделях міркування, хоча ми активно працюємо над зменшенням вищих показників галюцинацій, які ми спостерігали в o3 та o4-mini», – сказала речниця компанії Габі Райла. «Ми продовжимо наші дослідження галюцинацій у всіх моделях, щоб підвищити точність і надійність».

Ханнане Хаджішірзі, професорка Вашингтонського університету та дослідниця Інституту штучного інтелекту Аллена, є членом команди, яка нещодавно розробила спосіб відстеження поведінки системи до окремих фрагментів даних, на яких вона навчалася . Але оскільки системи навчаються на такій великій кількості даних — і оскільки вони можуть генерувати майже все — цей новий інструмент не може пояснити все. «Ми досі не знаємо, як саме працюють ці моделі», — сказала вона.

Тести, проведені незалежними компаніями та дослідниками, показують, що рівень галюцинацій також зростає для моделей міркування від таких компаній, як Google та DeepSeek.

З кінця 2023 року компанія пана Авадалли, Vectara, відстежує, як часто чат-боти відхиляються від правди . Компанія просить ці системи виконувати просте завдання, яке легко перевірити: підсумовувати конкретні новинні статті. Навіть тоді чат-боти постійно вигадують інформацію.

Згідно з початковим дослідженням Vectara, у цій ситуації чат-боти вигадували інформацію щонайменше у 3 відсотках випадків, а іноді й до 27 відсотків.

За півтора року, що минули з того часу, такі компанії, як OpenAI та Google, знизили ці показники до 1 або 2 відсотків. Інші, такі як стартап Anthropic із Сан-Франциско, коливалися близько 4 відсотків. Але рівень галюцинацій у цьому тесті зріс завдяки системам мислення. Система мислення DeepSeek, R1, галюцинувала у 14,3 відсотка випадків. Показник o3 OpenAI піднявся до 6,8.

(Видання «Нью-Йорк Таймс» подало до суду на OpenAI та його партнера Microsoft, звинувативши їх у порушенні авторських прав щодо новинного контенту, пов’язаного із системами штучного інтелекту. OpenAI та Microsoft заперечили ці претензії.)

Роками такі компанії, як OpenAI, покладалися на просту концепцію: чим більше інтернет-даних вони вводили у свої системи штучного інтелекту, тим краще ці системи працювали . Але вони використовували майже весь англійський текст в інтернеті , а це означало, що їм потрібен був новий спосіб покращення своїх чат-ботів.

Тож ці компанії більше покладаються на техніку, яку вчені називають навчанням з підкріпленням. За допомогою цього процесу система може вивчати поведінку методом спроб і помилок. Вона добре працює в певних галузях, таких як математика та комп'ютерне програмування. Але в інших вона зазнає невдач.

«Спосіб, яким ці системи навчаються, полягає в тому, що вони почнуть зосереджуватися на одному завданні — і почнуть забувати про інші», — сказала Лаура Перес-Бельтракіні, дослідниця Единбурзького університету, яка входить до команди, що пильно вивчає проблему галюцинацій .

Ще одна проблема полягає в тому, що моделі міркувань розроблені таким чином, щоб витрачати час на «обмірковування» складних проблем, перш ніж зупинитися на відповіді. Намагаючись вирішити проблему крок за кроком, вони ризикують отримати галюцинації на кожному кроці. Помилки можуть посилюватися, коли вони витрачають більше часу на роздуми.

Найновіші боти показують користувачам кожен крок, а це означає, що користувачі також можуть бачити кожну помилку. Дослідники також виявили, що в багатьох випадках кроки, що відображаються ботом, не пов’язані з відповіддю, яку він зрештою надає .

«Те, що система каже, що вона думає, не обов’язково є тим, що вона думає насправді», – сказав Арьо Прадіпта Гема, дослідник штучного інтелекту в Единбурзькому університеті та науковий співробітник Anthropic.

Поділитися
Поділитися сюжетом
Джерело матеріала
Старшая дочь Пугачева попала в большие проблемы: что произошло
Comments UA
2025-05-02T19:57:23Z
"Мисс Украина 2023" оконфузилась заявлением о селе
Comments UA
2025-05-05T15:48:59Z
От КВН до Банковой: что известно о дружбе Елены Кравец и Елены Зеленской
Telegraf
2025-04-29T14:03:43Z
"Это слезы...": жена Виктора Павлика внезапно заговорила о втором ребенке
Знай
2025-05-04T16:51:38Z
На столичной гостинице "Украина" появилась арт-инсталляция, посвященная украинским пехотинцам
Telegraf
2025-05-06T20:18:47Z
"Судебные долги Виталием Козловским уплачены": продюсер Кондратюк сделал резонансное заявление/Певец полностью выплатил деньги за нарушение авторских прав
Апостроф
2025-05-06T19:42:42Z
Вячеслав Соломка после публичной ссоры с Камалией раскрыл правду об их отношениях
TSN
2025-04-26T20:46:39Z
Старый костюм Зеленского изжил себя: специалист по этикету назвала причину
Telegraf
2025-04-28T16:04:40Z
"Я получила уже миллион угроз": "холостяк" Терен объявил войну блоггерке Алхим из-за русских песен и языка
Апостроф
2025-05-04T17:18:34Z
Когда россияне смогут захватить всю Украину — эксперты назвали дату
TSN
2025-05-02T17:28:37Z
МИД РФ сделал заявление о "возвращении" Украины в границы 1991 года
Comments UA
2025-05-01T15:30:25Z
Путин получил «подарок судьбы» и теперь хочет полностью уничтожить Украину
Comments UA
2025-04-23T08:39:37Z
72 часа до вероятной опасности: эксперты предсказывают атаки 8–9 мая
Новости Украины
2025-05-05T19:21:39Z
Дроны атаковали Москву: в РФ пропал интернет, людей не выпускают из самолетов
Фокус
2025-05-06T21:42:26Z
Удар по Запорожью: появились кадры последствий
Корреспондент
2025-05-06T21:27:12Z
Трамп высказался о трехдневном "перемирии" Путина
Европейская правда
2025-05-05T21:01:44Z
Путин впервые публично заговорил о своем преемнике
Comments UA
2025-05-04T12:00:03Z
СБУ задержала агентов российского ГРУ, которые проводили враждебные ИПСО в Украине
Gazeta UA
2025-05-06T13:52:28Z
Больше не дом: одна из стран ЕС оставит украинцев без помощи на жилье и денег
Знай
2025-04-24T19:12:14Z
Молодая девушка постоянно жаловалась на усталость: через семь месяцев она умерла
Comments UA
2025-04-23T14:54:38Z
Военный учет 17-летних: с чем у юношей могут возникнуть проблемы
TSN
2025-05-04T10:48:54Z
Жители российского города дрались за кашу возле «поезда победы»
Корреспондент
2025-05-03T17:18:22Z
7 мая 2025 года: мученика Акакия — что сегодня нельзя делать
Фокус
2025-05-06T21:22:53Z
Без суржика: как сказать на украинском изобретатель
ZN UA
2025-05-06T21:01:40Z
На каком расстоянии от забора можно сажать дерево в Украине
UAToday
2025-04-29T17:27:25Z
Дроны прошли российскую ПВО: попадание в завод по производству "Шахедов"
Новости Украины
2025-04-24T07:45:11Z
Зачем нужно ходить спиной вперед 27 апреля и где нельзя оставлять алкоголь сегодня: приметы и запреты на Стефана
Знай
2025-04-27T02:03:32Z
7 важных открытий о том, как алкоголь влияет на наше тело
UAToday
2025-05-06T17:28:03Z
Уменьшает холестерин, улучшает сон и лечит кишечник: невероятные свойства обычного хумуса
Знай
2025-04-24T07:51:58Z
Что лучше для здоровья — горчица или кетчуп: врач дала окончательный ответ
UAToday
2025-05-04T12:03:37Z
Ночные перекусы: почему возникает голод после позднего ужина
Gazeta UA
2025-04-27T17:51:43Z
Почему подросток спит до обеда? Психотерапевт объясняет – это не лень
Знай
2025-05-06T17:51:29Z
Пациент Neuralink снимает для YouTube с помощью чипа в мозге: видео
ZN UA
2025-05-06T14:07:53Z
Живые кабели: ученые открыли бактерии, проводящие ток
ITC
2025-05-06T14:04:59Z
Если внезапно синеют пальцы – что это за симптом
Comments UA
2025-05-06T13:12:22Z
Минздрав увеличил смету стоимости капремонта "Охматдета"
ZN UA
2025-05-06T12:51:53Z
"Добрый вечер, мы из ПриватБанка": украинцев заставляют добровольно перечислять деньги в россию - новая мошенническая схема
Знай
2025-04-27T12:12:52Z
Бычки, сардины и шпроты переходят в категорию деликатесов: как изменились цены
Знай
2025-04-28T03:52:35Z
Внешняя разведка назвала "маловероятным" укрепление рубля
Корреспондент
2025-04-27T16:01:15Z
МАГАТЭ бьет тревогу: украинские АЭС работают в условиях постоянной опасности
Gazeta UA
2025-04-25T13:27:20Z
Экономика РФ упала впервые с начала войны: какие причины
Comments UA
2025-05-06T21:12:15Z
Как работают фьючерсы на криптовалюту и какие риски?
Топ Жир
2025-05-06T20:42:32Z
В 2025 году не будут повышать цены на газ
Gazeta UA
2025-04-23T11:21:19Z
Пенсии заморожены, но не навсегда: власти назвали условия для повышения
Знай
2025-05-03T14:30:07Z
Новая сумма в платежках за газ: украинцев ждут очередные расходы на коммуналку уже с мая
Знай
2025-05-06T18:10:40Z
Удар по Киеву 24 апреля: количество жертв возросло
UAToday
2025-04-24T06:46:13Z
Массированная атака РФ на Запорожье: количество раненых резко возросло
Comments UA
2025-05-02T04:27:11Z
В Подольском районе Киева произошла стрельба: полиция установила причастных – фото
Лига
2025-04-24T13:31:15Z
В Индии боевики убили около двадцати человек
Корреспондент
2025-04-23T08:13:28Z
Индия атаковала Пакистан
Корреспондент
2025-05-06T21:07:08Z
Удар по Сумам: число погибших возросло до трех
Корреспондент
2025-05-06T18:24:43Z
Россияне атакуют Конотоп: в городе прогремел взрыв
Факти ICTV
2025-05-06T17:46:39Z
Трое погибших, ранены пятеро детей: в Сумах возросло количество пострадавших от атаки россиян
Фокус
2025-05-06T17:43:51Z
Прикрыли канал незаконного пересечения границы для уклонистов - сколько платили
UAToday
2025-05-06T17:28:11Z
В России жалуются на массированную атаку БПЛА
Корреспондент
2025-05-06T06:39:54Z
Новое наступление ВСУ? Бои в Курской области
Корреспондент
2025-05-05T19:10:27Z
Владелец украинских издательств "Кредо" и "Беби Бук" торгует детскими книгами в рф: теперь еще и бизнесмен в "ДНР"
Знай
2025-04-28T07:00:08Z
Бойцы Азова захватили троих россиян на самокатах
Корреспондент
2025-04-27T18:06:09Z
Сообщили последние новости с фронта: где было больше всего боев
Gazeta UA
2025-05-06T21:31:46Z
"Такая себе тайна Полишинеля", - военный рассказал, что происходит на Курщине
Новости Украины
2025-05-06T20:58:05Z
Враг массированно атаковал Харьков ракетами
Хвиля
2025-04-24T03:57:06Z
Россияне заявили о массированной ракетной атаке на Крым
Корреспондент
2025-05-06T20:24:21Z
Здесь жили кавалеристы и прославленные музыканты: где находится эта улица в Киеве и чем она интересна
Telegraf
2025-05-06T20:07:13Z
Водителям объяснили, чем грозит авто добавление спирта в бензин
Хвиля
2025-05-04T09:15:41Z
Шлем пилота Формулы 1 продан за рекордную сумму
Корреспондент
2025-04-29T20:45:46Z
Гибриды принесли Lamborghini почти €900 млн за квартал
Корреспондент
2025-05-06T18:15:55Z
Jeep представил новое поколение внедорожника Compass
Корреспондент
2025-05-06T16:34:01Z
Audi представила элегантные и мощные авто с расходом 2,8 л на 100 км
Фокус
2025-05-06T14:12:19Z
Renault выводит на рынок недорогой электрифицированный кроссовер для семьи с ГБО
Фокус
2025-05-06T12:06:37Z
У вас будет всего десять дней, а потом - штраф. Кому нужно обновить данные
Telegraf
2025-05-06T10:57:48Z
Гибриды принесли Lamborghini почти 900 миллионов евро за квартал
Корреспондент
2025-05-06T10:06:18Z
Одна подпись может оставить без автомобиля: какая ошибка грозит украинцам при продаже авто
Знай
2025-05-06T08:52:40Z
Покупка ранних овощей: что нужно знать, чтобы не принести домой "нитратную бомбу"
Знай
2025-05-01T19:51:29Z
Муравьи исчезнут с участка раз и навсегда: просто смешайте сахар с этим средством
Telegraf
2025-04-29T18:51:11Z
Китайский гороскоп на май 2025 года: время перемен и внутреннего роста, кому из знаков нужно готовиться
Знай
2025-05-01T19:30:32Z
Туристы случайно нашли 7-килограммовый клад золота и серебра в горах Чехии
Апостроф
2025-05-01T14:21:11Z
Гороскоп на среду 7 мая 2025 года
UAToday
2025-05-06T17:28:10Z
Как правильно красить седые волосы: советы, которые помогут сохранить структуру
Gazeta UA
2025-05-06T16:31:14Z
Редиска, которая не потеряет хруст: как правильно хранить популярный овощ
Знай
2025-04-27T13:51:25Z
Adjari Orange и Adjari Cherry - новая стратегия классических коньяков
Gazeta UA
2025-05-06T16:09:05Z
Неожиданное сочетание: суп с тунцом, который не вредит фигуре
Gazeta UA
2025-05-06T15:24:18Z
В Кривом Роге задержали известного украинского боксера: подробности
Telegraf
2025-04-26T15:27:45Z
Поговорим на поле: Артета оценил шансы команды на матч против ПСЖ
Корреспондент
2025-05-06T20:57:37Z
Лидер Интера установил рекорд, догнав соотечественника в Лиге Чемпионов
Корреспондент
2025-05-06T20:33:59Z
Генеральный менеджер Оклахомы получил награду от НБА
Корреспондент
2025-05-06T19:51:20Z
Реал и Анчелотти согласовали дату прекращения сотрудничества
Корреспондент
2025-05-06T19:09:15Z
Динамо подписало контракт с легионером
Корреспондент
2025-05-06T19:03:29Z
Арсенал определился с трансфером на позицию форварда
Корреспондент
2025-05-06T18:21:01Z
"Диверсия": Захарова отреагировала на ультиматум украинских гимнастов
Telegraf
2025-05-06T18:10:38Z
Жирона намерена заполучить звезду Динамо
Корреспондент
2025-05-06T17:33:27Z
Microsoft объяснила подорожание новых игр для Xbox Series X|S
GameMag
2025-05-04T17:16:09Z
«Сделайте шаг в неизвестность»: Следующая глава Destiny 2 получила название «Край судьбы» — она выйдет 15 июля
GameMag
2025-05-06T21:01:09Z
Microsoft анонсировала ноутбук и планшет линейки Surface
Корреспондент
2025-05-06T18:49:01Z
Samsung представила планшет для военных операций
Корреспондент
2025-05-06T18:43:34Z
Разумный минимализм: Обзор мышки Rapoo VT3 Pro Max
GameMag
2025-05-06T18:34:54Z
В Швейцарии обнаружена древнеримская дорога с уникальными артефактами
Корреспондент
2025-05-06T18:34:21Z
Споживання металопрокату в Україні за І квартал зросло на 23% р./р
AgroNews
2025-05-06T18:16:56Z
Вся трилогия ремейков Final Fantasy VII может выйти на Nintendo Switch 2
GameMag
2025-05-06T18:10:43Z
Каракатицы используют свой «жестовой язык»: ученые поняли, как они общаются
ZN UA
2025-05-06T17:37:22Z