MY.UAНовини
Галюцинації ШІ посилюються зі зростанням його потужності
Галюцинації ШІ посилюються зі зростанням його потужності

Галюцинації ШІ посилюються зі зростанням його потужності

Минулого місяця бот зі штучним інтелектом, який займається технічною підтримкою Cursor, перспективного інструменту для комп'ютерних програмістів , попередив кількох клієнтів про зміну політики компанії. У ньому було заявлено, що їм більше не дозволено використовувати Cursor на більш ніж одному комп'ютері.

У гнівних постах на інтернет-форумах клієнти скаржилися. Деякі скасували свої облікові записи Cursor. А деякі ще більше розлютилися, коли зрозуміли, що сталося: бот зі штучним інтелектом оголосив про зміну політики, якої не існувало.

«У нас немає такої політики. Ви, звичайно, можете вільно використовувати Cursor на кількох машинах», – написав головний виконавчий директор і співзасновник компанії Майкл Труелл у дописі на Reddit. «На жаль, це неправильна відповідь від бота підтримки штучного інтелекту, який працює на передовій».

Більш ніж через два роки після появи ChatGPT , технологічні компанії, офісні працівники та звичайні споживачі використовують ботів на базі штучного інтелекту для виконання дедалі ширшого кола завдань. Але досі немає способу гарантувати, що ці системи надають точну інформацію .

Найновіші та найпотужніші технології — так звані системи міркувань від таких компаній, як OpenAI, Google та китайський стартап DeepSeek — генерують більше помилок, а не менше. Оскільки їхні математичні навички помітно покращилися, їхнє сприйняття фактів стало хиткішим. Не зовсім зрозуміло, чому.

Сучасні боти зі штучним інтелектом базуються на складних математичних системах , які навчаються своїм навичкам, аналізуючи величезні обсяги цифрових даних. Вони не можуть вирішувати, що є правдою, а що хибною. Іноді вони просто вигадують речі, явище, яке деякі дослідники штучного інтелекту називають галюцинаціями. В одному тесті рівень галюцинацій у новіших системах штучного інтелекту сягав 79 відсотків.

Ці системи використовують математичні ймовірності, щоб вгадати найкращу відповідь, а не суворий набір правил, визначених інженерами-людьми. Тому вони роблять певну кількість помилок. «Попри всі наші зусилля, вони завжди будуть галюцинувати», — сказав Амр Авадалла, генеральний директор Vectara, стартапу, який створює інструменти штучного інтелекту для бізнесу, та колишній керівник Google. «Це ніколи не зникне».

Амр Авадаллах, головний виконавчий директор Vectara, компанії, яка розробляє інструменти штучного інтелекту для бізнесу, вважає, що «галюцинації» ШІ збережуться.Кредит...Кейсі Кліффорд для The New York Times

Протягом кількох років це явище викликало занепокоєння щодо надійності цих систем. Хоча вони корисні в деяких ситуаціях, таких як написання курсових робіт , конспектування офісних документів та створення комп'ютерного коду , їхні помилки можуть спричинити проблеми.

Штучні боти, пов’язані з пошуковими системами, такими як Google та Bing, іноді генерують результати пошуку, які є сміховинно неправильними. Якщо ви запитаєте їх про хороший марафон на Західному узбережжі, вони можуть запропонувати забіг у Філадельфії. Якщо вони скажуть вам кількість домогосподарств в Іллінойсі, вони можуть посилатися на джерело, яке не містить цієї інформації.

Ці галюцинації можуть не бути великою проблемою для багатьох людей, але це серйозна проблема для будь-кого, хто використовує технологію із судовими документами, медичною інформацією чи конфіденційними бізнес-даними.

«Ви витрачаєте багато часу, намагаючись з’ясувати, які відповіді є фактичними, а які ні», — сказав Пратік Верма, співзасновник і головний виконавчий директор Okahu , компанії, яка допомагає бізнесу розібратися з проблемою галюцинацій. «Неправильне реагування на ці помилки по суті зводить нанівець цінність систем штучного інтелекту, які повинні автоматизувати завдання за вас».

Курсор та пан Труелл не відповіли на запити про коментарі.

Протягом понад двох років такі компанії, як OpenAI та Google, постійно вдосконалювали свої системи штучного інтелекту та зменшували частоту цих помилок. Але з використанням нових систем міркування кількість помилок зростає. Згідно з власними тестами компанії, новітні системи OpenAI галюцинують частіше, ніж попередня система.

Компанія виявила, що o3 — її найпотужніша система — викликала галюцинації у 33 відсотках випадків під час запуску тесту PersonQA, який включає відповіді на запитання про публічних осіб. Це більш ніж удвічі перевищує рівень галюцинацій у попередній системі мислення OpenAI під назвою o1. Нова o4-mini викликала галюцинації ще частіше: 48 відсотків.

Під час проведення іншого тесту під назвою SimpleQA, який ставить більш загальні питання, рівень галюцинацій для o3 та o4-mini становив 51 відсоток і 79 відсотків. Попередня система, o1, галюцинувала у 44 відсотках випадків.

Зображення
З моменту появи ChatGPT, феномен галюцинацій викликав занепокоєння щодо надійності систем штучного інтелекту.Кредит...Келсі Макклеллан для The New York Times

У статті, що детально описує тести , OpenAI зазначила, що для розуміння причини цих результатів потрібні додаткові дослідження. Оскільки системи штучного інтелекту навчаються на основі більшої кількості даних, ніж люди можуть собі уявити, технологам важко визначити, чому вони поводяться саме так.

«Галюцинації за своєю суттю не є більш поширеними в моделях міркування, хоча ми активно працюємо над зменшенням вищих показників галюцинацій, які ми спостерігали в o3 та o4-mini», – сказала речниця компанії Габі Райла. «Ми продовжимо наші дослідження галюцинацій у всіх моделях, щоб підвищити точність і надійність».

Ханнане Хаджішірзі, професорка Вашингтонського університету та дослідниця Інституту штучного інтелекту Аллена, є членом команди, яка нещодавно розробила спосіб відстеження поведінки системи до окремих фрагментів даних, на яких вона навчалася . Але оскільки системи навчаються на такій великій кількості даних — і оскільки вони можуть генерувати майже все — цей новий інструмент не може пояснити все. «Ми досі не знаємо, як саме працюють ці моделі», — сказала вона.

Тести, проведені незалежними компаніями та дослідниками, показують, що рівень галюцинацій також зростає для моделей міркування від таких компаній, як Google та DeepSeek.

З кінця 2023 року компанія пана Авадалли, Vectara, відстежує, як часто чат-боти відхиляються від правди . Компанія просить ці системи виконувати просте завдання, яке легко перевірити: підсумовувати конкретні новинні статті. Навіть тоді чат-боти постійно вигадують інформацію.

Згідно з початковим дослідженням Vectara, у цій ситуації чат-боти вигадували інформацію щонайменше у 3 відсотках випадків, а іноді й до 27 відсотків.

За півтора року, що минули з того часу, такі компанії, як OpenAI та Google, знизили ці показники до 1 або 2 відсотків. Інші, такі як стартап Anthropic із Сан-Франциско, коливалися близько 4 відсотків. Але рівень галюцинацій у цьому тесті зріс завдяки системам мислення. Система мислення DeepSeek, R1, галюцинувала у 14,3 відсотка випадків. Показник o3 OpenAI піднявся до 6,8.

(Видання «Нью-Йорк Таймс» подало до суду на OpenAI та його партнера Microsoft, звинувативши їх у порушенні авторських прав щодо новинного контенту, пов’язаного із системами штучного інтелекту. OpenAI та Microsoft заперечили ці претензії.)

Роками такі компанії, як OpenAI, покладалися на просту концепцію: чим більше інтернет-даних вони вводили у свої системи штучного інтелекту, тим краще ці системи працювали . Але вони використовували майже весь англійський текст в інтернеті , а це означало, що їм потрібен був новий спосіб покращення своїх чат-ботів.

Тож ці компанії більше покладаються на техніку, яку вчені називають навчанням з підкріпленням. За допомогою цього процесу система може вивчати поведінку методом спроб і помилок. Вона добре працює в певних галузях, таких як математика та комп'ютерне програмування. Але в інших вона зазнає невдач.

«Спосіб, яким ці системи навчаються, полягає в тому, що вони почнуть зосереджуватися на одному завданні — і почнуть забувати про інші», — сказала Лаура Перес-Бельтракіні, дослідниця Единбурзького університету, яка входить до команди, що пильно вивчає проблему галюцинацій .

Ще одна проблема полягає в тому, що моделі міркувань розроблені таким чином, щоб витрачати час на «обмірковування» складних проблем, перш ніж зупинитися на відповіді. Намагаючись вирішити проблему крок за кроком, вони ризикують отримати галюцинації на кожному кроці. Помилки можуть посилюватися, коли вони витрачають більше часу на роздуми.

Найновіші боти показують користувачам кожен крок, а це означає, що користувачі також можуть бачити кожну помилку. Дослідники також виявили, що в багатьох випадках кроки, що відображаються ботом, не пов’язані з відповіддю, яку він зрештою надає .

«Те, що система каже, що вона думає, не обов’язково є тим, що вона думає насправді», – сказав Арьо Прадіпта Гема, дослідник штучного інтелекту в Единбурзькому університеті та науковий співробітник Anthropic.

Поділитися
Поділитися сюжетом
Джерело матеріала
Вуди Аллен попал в базу Миротворца
Корреспондент
2025-08-25T20:30:10Z
Украина осудила участие Вуди Аллена в Московской неделе кино
Корреспондент
2025-08-25T11:51:35Z
Сразу минус 10 лет: стилист назвал три правила, как зрительно уменьшить возраст
Gazeta UA
2025-09-05T23:03:08Z
Умер Джорджо Армани: кому достанется империя бездетного модельера
Новости Украины
2025-09-05T19:18:06Z
Световой меч Дарта Вейдера установил рекорд на аукционе
Корреспондент
2025-09-05T18:29:54Z
Всегда будете в тренде: Андре Тан рассказал о главных правилах сочетания цветов
Знай
2025-09-05T18:29:40Z
"Декстер: Воскресение" завершил первый сезон и собрал высокие оценки
Gazeta UA
2025-09-05T18:29:39Z
Рамина на Мальдивах показала фигуру без фильтров и фотошопа
Gazeta UA
2025-09-05T18:29:34Z
"Выучила его мозг до деталей" - жена Виктора Павлика рассказала о задержке речи сына
Gazeta UA
2025-09-05T18:29:24Z
Американская компания Keurig Dr Pepper приобретет производителя кофе Jacobs
Корреспондент
2025-08-25T18:30:10Z
Отопительный сезон под угрозой: "Нафтогаз" просит помощи у международных партнеров
Хвиля
2025-09-06T03:06:51Z
В августе Украина стала пятой в Европе по цене электроэнергии
UAToday
2025-09-06T02:48:43Z
Ужгород получит прямую железнодорожную связь с четырьмя городами ЕС: когда старт рейсов
UAToday
2025-09-06T02:48:35Z
Дефицит овощей в Днепропетровской области: критические проблемы могут изменить ситуацию на рынке
Политека
2025-09-06T02:30:45Z
Осталось меньше месяца: в Ощадбанке просят клиентов снять все деньги со счетов
Знай
2025-09-06T02:12:16Z
РФ за экспорт оружия получает наличные в больших мешках - СМИ
Корреспондент
2025-09-06T00:03:18Z
Глава "Сбербанка" заявил о "технической стагнации" российской экономики
Хвиля
2025-09-05T21:30:22Z
Осенний удар по кошелькам: украинцев предупредили о подорожании важного продукта
Знай
2025-09-05T20:12:00Z
Зеленский ответил Вэнсу по поводу "уступок" России
Корреспондент
2025-08-25T13:33:00Z
У соглашения с США об оружии на 100 миллиардов долларов есть неприятный "подводный камень" — NBC News
Telegraf
2025-09-06T03:09:13Z
СМИ раскрыли план о создании "буферной зоны" в Украине после заключения мира с РФ. Чьи войска будут ее охранять?
UAToday
2025-09-06T02:48:59Z
Зеленский раскрыл первые детали встречи с Фицо
UAToday
2025-09-06T02:48:45Z
Малюк раскрыл, куда россияне спрятали свои самолеты после операции "Паутина"
UAToday
2025-09-06T02:48:07Z
Новая глава МИД Британии Иветт Купер: BBC о первых испытаниях — Украина и Ближний Восток
ZN UA
2025-09-06T02:42:09Z
Новая глава МИД Великобритании первый звонок сделала в Украину
Корреспондент
2025-09-06T02:33:57Z
В Словакии раскритиковали Фицо по умолчанию об агрессии РФ
TSN
2025-09-06T01:06:15Z
Трамп назвал место проведения следующего саммита G20
ZN UA
2025-09-05T23:57:59Z
На Одессчине будут судить мужчину за угон автомобиля ТЦК
Корреспондент
2025-09-05T18:36:06Z
В Днепре горят склады, город окутан черным дымом
Комсомольская правда
2025-09-05T18:28:56Z
В Польше избили группу украинцев
Корреспондент
2025-09-05T18:28:55Z
«Інтерпайп» вийшов на ринок труб для виробництва бурового інструменту
AgroNews
2025-09-05T18:27:46Z
В Днепре бушует масштабный пожар
Корреспондент
2025-09-05T18:27:40Z
Виновник ДТП — наезда на четырех военных в Константиновке полтора года уклоняется от вызовов в суд
ZN UA
2025-09-05T18:27:39Z
Землетрясение в Афганистане: спасатели оставляли женщин под завалами
Корреспондент
2025-09-05T18:26:16Z
Масштабный пожар и эвакуация людей. Все детали о возгорании на заводе в Днепре
Telegraf
2025-09-05T18:24:51Z
В Польше избили группу украинцев
Корреспондент
2025-09-05T18:22:43Z
Как украинцы относятся к ТЦК - опрос
UAToday
2025-08-25T15:39:48Z
Нарушать запреты в этот день строго запрещено: какое «чудо» может приключиться
Comments UA
2025-09-06T03:57:19Z
В ГУР оценили возможности РФ по производству шахедов
Корреспондент
2025-09-06T03:54:10Z
Закарпатские таможенники Василий Пупена и Павел Лайош построили дворцы и купили фейковые инвалидности
Знай
2025-09-06T03:51:26Z
ГУР сообщило о беспрецедентном присутствии российских войск в Украине
TSN
2025-09-06T03:51:24Z
Шесть знаков китайского зодиака, которые привлекут везение уже 6 сентября
TSN
2025-09-06T03:51:14Z
С праздником Михайлово чудо 2025! Красивые поздравления в открытках и прозе для самых близких
Telegraf
2025-09-06T03:45:38Z
В школах готовят изменения в дистанционном обучении: к чему готовиться
Знай
2025-09-06T03:21:17Z
Украинцев с инвалидностью пугают штрафами за ВЛК: законно ли
Знай
2025-09-06T03:06:21Z
Кабмин упростил правила ввоза гуманитарных лекарств
UAToday
2025-09-06T02:48:01Z
В Китае разработали инъекции для возвращения цвета волос: эффективно ли новое средство от седины
TSN
2025-09-05T19:51:42Z
Сколько сахара в день можно употреблять без вреда для здоровья
Знай
2025-09-05T18:51:53Z
Минветеранов сообщило о масштабах инвалидности среди военных
Хвиля
2025-09-05T18:25:54Z
Доминирование руки: почему одна рука сильнее
GlavRed
2025-09-05T18:25:45Z
Перелом или растяжение: почему заживление связок дольше костей
GlavRed
2025-09-05T18:25:00Z
Витамины, которые категорически запрещено принимать перед сном
UAToday
2025-09-05T18:23:29Z
Витамины, которые категорически запрещено принимать перед сном
UAToday
2025-09-05T18:23:28Z
Витамины, которые категорически запрещено принимать перед сном
UAToday
2025-09-05T18:23:24Z
Volvo начала производство ES90
Корреспондент
2025-09-05T18:51:58Z
BMW представила электрический iX3
Корреспондент
2025-09-05T18:30:42Z
BMW представила электрический iX3
Корреспондент
2025-09-05T18:21:31Z
Культовая капсула времени: обнаружен 20-летний суперкар от Honda в новом состоянии
Фокус
2025-09-05T09:15:33Z
В Украине снизился спрос на новые грузовики
Gazeta UA
2025-09-05T06:48:42Z
Креатив высшего уровня. В Украине заметили автомобиль с пикантной подвеской
Telegraf
2025-09-04T22:33:59Z
Kia установила новый рекорд продажей
Корреспондент
2025-09-04T20:33:48Z
Toyota готовит компактный пикап: дебют в 2027 году
Корреспондент
2025-09-04T19:30:07Z
Представлен новый Honda Prelude
Корреспондент
2025-09-04T17:39:27Z
В Украине сосредоточено около 700 000 военного контингента России – разведка
Лига
2025-09-06T03:45:01Z
До 12 часов без света. В Днепре местами действуют графики отключения света
UAToday
2025-09-06T03:27:37Z
Андрей Кузник, начальник Львовской таможни, жалуется на низкую зарплату, но декларирует кучу недвижимости и элитный джип Lexus
Знай
2025-09-06T02:51:01Z
Ситуация на фронте на вечер 5 сентября 2025 года
UAToday
2025-09-06T02:48:18Z
Гороскоп на сегодня 6 сентября: финансы тельцов, неприятные новости раков и здоровье скорпионов
Знай
2025-09-06T01:33:45Z
РФ усилила удары БПЛА по трассе Славянск-Изюм - DeepState
Корреспондент
2025-09-06T01:27:01Z
Принимает ли Буданов лично участие в боевых операциях против россиян: ответ ГУР
ZN UA
2025-09-06T01:12:01Z
Девочка-квадробер в Одессе играла на пляже: соцсети разделились на два лагеря
Telegraf
2025-09-05T22:33:58Z
ГУР: на территории Украины находится около 700 тысяч российских военных
ZN UA
2025-09-05T21:12:30Z
Три причины, почему растворимый кофе нельзя заливать кипятком
Gazeta UA
2025-09-06T02:00:24Z
Какое ударение правильно: "листОпад чи листопАд"
Gazeta UA
2025-09-06T00:15:00Z
День ангела 6 сентября: кого и как поздравлять с именинами
TSN
2025-09-05T21:21:03Z
Салат "Мозаика" из баклажанов и фасоли: он спасет, когда совсем нет времени готовить
Telegraf
2025-09-05T18:36:31Z
Какие фразы под запретом, когда ребенок отказывается есть: ответ нутрициолога
Gazeta UA
2025-09-05T18:30:25Z
BEDNAR представив новинки та перевірені рішення на Дні поля АГРО Вінниця
AgroNews
2025-09-05T18:27:26Z
От новых не отличить: как полностью убрать желтые пятна на кроссовках
GlavRed
2025-09-05T18:25:29Z
Если кот обиделся. Четыре способа вернуть его благосклонность
Telegraf
2025-09-05T18:25:26Z
Эту ошибку допускают многие садоводы: почему нельзя обрезать фруктовые деревья в сентябре
Telegraf
2025-09-05T18:24:43Z
Какой XROS самый лучший в 2025 году?
Bin UA
2025-09-06T12:15:13Z
Эксперты бьют тревогу: самый большой вулкан Европы снова подает признаки жизни
TSN
2025-09-06T03:51:35Z
Неожиданный гость посетил австралийку по лакомству: кем он оказался
TSN
2025-09-06T03:51:32Z
Служба занятости интегрировала искусственный интеллект в поиск вакансий
Хвиля
2025-09-05T23:30:14Z
Официально: Life is Strange получит адаптацию в формате телесериала
GameMag
2025-09-05T21:24:09Z
Как установить оптоволоконный интернет в квартире: пошаговое руководство
GameWay
2025-09-05T21:00:17Z
Колхозники: в России высмеивают бывшую певицу из Украины
Comments UA
2025-09-05T20:57:35Z
Может погубить все человечество: ученые забили тревогу из-за опасной технологии
Знай
2025-09-05T20:51:52Z
Сказка о восточном балансе: Обзор The Rogue Prince of Persia
GameMag
2025-09-05T20:33:57Z
Французы ликуют, выиграв у сборной Украины со счетом 2:0
Корреспондент
2025-09-05T22:33:32Z
Два "горняка" и динамовец создали дебютное трио сборной в матче с Францией
Корреспондент
2025-09-05T22:03:23Z
Украина и Франция определили комплекты формы на матч отбора ЧМ-2026
Корреспондент
2025-09-05T20:54:40Z
Промоутер Итаумы: Бой у Мозеса будет в декабре на ринге в Манчестере
Корреспондент
2025-09-05T20:27:44Z
Полесье взяло в аренду полузащитника Динамо
Корреспондент
2025-09-05T19:36:06Z
В Англии восхитились первой тренировкой бразильца из "Шахтера"
ZN UA
2025-09-05T18:27:43Z
Украина-Франция: где и когда смотреть первый матч Украины в отборе на ЧМ-2026
GlavRed
2025-09-05T18:25:37Z
В России заговорили о футбольном матче с Украиной
Telegraf
2025-09-05T18:24:57Z
Тедди Атласу хочется видеть счастливый исход киноверсии Усика в боксе
Корреспондент
2025-09-05T18:21:59Z