MY.UAНовости
Эксперты обнаружили серьезные недостатки в тестах, оценивающих безопасность искусственного интеллекта
Эксперты обнаружили серьезные недостатки в тестах, оценивающих безопасность искусственного интеллекта

Эксперты обнаружили серьезные недостатки в тестах, оценивающих безопасность искусственного интеллекта

Эксперты обнаружили серьезные недостатки в тестах, оценивающих безопасность искусственного интеллекта

Ученые проверили более 440 бенчмарков.

Международная группа ученых обнаружила слабые места в сотнях тестов, которые применяют для проверки безопасности и эффективности новых моделей искусственного интеллекта, сообщает The Guardian. По заключению экспертов, большинство из более 440 проанализированных бенчмарков имеют существенные недостатки, которые могут "подорвать обоснованность полученных утверждений" относительно достижений в сфере ИИ.

Исследование провели компьютерные ученые из Института безопасности искусственного интеллекта правительства Великобритании совместно со специалистами университетов Стэнфорда, Беркли и Оксфорда. Они выяснили, что почти все тесты имеют слабые стороны хотя бы в одной области, а полученные результаты иногда являются "нерелевантными или даже обманчивыми".

Бенчмарки, которые используются для измерения производительности и безопасности ИИ, играют ключевую роль при отсутствии четких государственных регуляций в Великобритании и США. Они должны свидетельствовать, соответствуют ли системы искусственного интеллекта интересам человека, и проверять их способности к логическому рассуждению, математическим расчетам и кодированию.

Ведущий автор исследования, исследователь Оксфордского интернет-института Эндрю Бин, отметил, что именно бенчмарки лежат в основе большинства заявлений о прорывах в сфере искусственного интеллекта: "Почти все утверждения о достижениях в области искусственного интеллекта подкреплены контрольными показателями. Но без общих определений и обоснованных измерений трудно понять, действительно ли модели улучшаются, или это только кажется так".

Исследование обнародовали на фоне растущих опасений относительно безопасности новых ИИ-моделей, которые крупные технологические компании выпускают со все большими темпами. Недавно некоторые корпорации были вынуждены изъять или ограничить доступ к своим разработкам после ряда инцидентов, когда системы искусственного интеллекта наносили вред — от клеветы до случаев самоубийства.

На этой неделе Google отозвал одну из своих моделей — Gemma. Такое решение приняли после того, как она придумала ложные обвинения о якобы сексуальных отношениях без согласия между американским сенатором и полицейским, создав фальшивые ссылки на вымышленные публикации.

"Никогда не было такого обвинения, нет такого лица, и нет таких новостных историй", — заявила сенатор от штата Теннесси Марша Блэкберн в письме к генеральному директору Google Сундару Пичаи. Она назвала этот случай "катастрофическим провалом надзора и этической ответственности".

В ответ Google объяснила, что Gemma предназначалась для разработчиков и исследователей, а не для потребителей. Компания удалила модель с платформы AI Studio после сообщений о ее использовании сторонними пользователями.

"Галлюцинации — когда модели придумывают факты — и подхалимство являются проблемами всей индустрии искусственного интеллекта, особенно для меньших открытых моделей, таких как Gemma", — отметили в компании.

Хотя в исследовании рассматривали только открытые бенчмарки, авторы отметили, что крупные технологические компании имеют собственные закрытые тесты, которые остаются вне независимой проверки. Они сделали вывод о "насущной потребности в общих стандартах и передовом опыте" для оценки систем искусственного интеллекта.

По словам Эндрю Бина, особенно тревожным является факт, что только 16% проанализированных тестов применяли статистические проверки или оценку неопределенности, которые могли бы засвидетельствовать точность их результатов. В других случаях, когда бенчмарки оценивали такие характеристики, как "безвредность" ИИ, само определение этих понятий было нечетким, что делает такие оценки бесполезными для реального анализа.

Во время тестов безопасности ChatGPT и Claude выдавали рецепты взрывчатки и советы для киберпреступников. Компании OpenAI и Anthropic провели эксперимент, заставляя модели конкурентов выполнять опасные задачи, в результате чего чат-боты предоставляли подробные инструкции по изготовлению взрывчатых веществ, использованию биологического оружия и осуществлению кибератак.

Поделиться
Поделиться сюжетом
Источник материала
Главные холостяки страны: какими были герои романтического шоу в предыдущих сезонах и где они сейчас
Фокус
2025-11-04T16:06:25Z
39-летняя исполнительница хита Call Me Maybe беременна первенцем
TSN
2025-11-04T14:36:50Z
Звезда сериала "Бриджертоны" стал самым сексуальным мужчиной года по версии People
Апостроф
2025-11-04T14:21:32Z
Юлия Думанская высмеяла юзера, которая заигрывала к ее мужу-бизнесмену и раскрыла их переписку
TSN
2025-11-04T14:06:18Z
"Їду... дахом": Левко Дурко презентовал новую юмористическую песню и попросился в больницу к сумасшедшим
Апостроф
2025-11-04T13:48:05Z
Виктор Павлик с женой отмечают 10 лет со дня знакомства: какими они были в начале отношений
Апостроф
2025-11-04T13:42:01Z
Потрясающие подробности: как Полякова бросила курить
Comments UA
2025-11-04T13:36:59Z
Книга о востоке Украины получила награду имени Питерсона за лучший перевод
Апостроф
2025-11-04T13:30:00Z
Елена Кравец впервые за долгое время показалась с 22-летней дочкой-красавицей на публичном мероприятии
TSN
2025-11-04T13:09:46Z
Дефицит хлеба в Днепропетровской области: производители муки бьют тревогу
Политека
2025-11-04T16:15:02Z
Кредит ЕС под залог российских активов: каковы шансы Украины получить 140 млрд евро/Решение о займе заблокировала Бельгия
Апостроф
2025-11-04T15:48:39Z
Обложат налогом даже безделушки: украинцев ждет налоговый шоковый душ
Знай
2025-11-04T15:30:44Z
Польская система для «упрощенцев»: что скрывается за новой идеей Гетманцева
Comments UA
2025-11-04T15:03:19Z
Почему заговорили о возобновлении энергосистемы за счет украинцев: когда повысят тариф
Comments UA
2025-11-04T14:30:33Z
Газовые плиты, котлы и колонки: "Нефтегаз" предупредил всех владельцев
Знай
2025-11-04T14:30:13Z
Курс валют на 5 ноября: сколько будут стоить доллар, евро и злотый
TSN
2025-11-04T14:21:56Z
Германия планирует увеличить финансирование Украины в 2026 году до 11,5 млрд евро
ZN UA
2025-11-04T14:15:51Z
Хороших новостей ждать не стоит: что будет с курсом доллара и евро в ноябре
Знай
2025-11-04T14:12:50Z
Джей Ди Вэнс стал центром скандала и сплетен: в чем причина
Comments UA
2025-11-04T16:33:31Z
"Орешник" и новый Карибский кризис: как Россия будет помогать Венесуэле и к чему это приведет
Фокус
2025-11-04T16:30:29Z
Оккупанты ударили дроном по мирным жителям под белым флагом
Апостроф
2025-11-04T16:27:59Z
Кремль ведет информационную войну против Казахстана и Армении, готовя почву для дестабилизации, - The Washington Post
Новости Украины
2025-11-04T16:18:33Z
Удары по НПЗ больно ударили по России: какое решение нашел Путин
Comments UA
2025-11-04T16:18:30Z
Почему Путин усилил ракетный террор по энергетике: Зеленский назвал неочевидную причину
TSN
2025-11-04T16:09:21Z
Лукашенко пытается строить образ миротворца: эксперт рассказал о тактике белорусского диктатора
Апостроф
2025-11-04T15:51:47Z
Отчет о расширении ЕС: Украина "демонстрирует преданность европейскому пути", несмотря на войну
Европейская правда
2025-11-04T15:51:28Z
Экспрокурор САП Броневицкий: "НАБУ и САП работают в условиях абсолютного отсутствия контроля за их деятельностью"
Апостроф
2025-11-04T15:45:09Z
Пьяная полицейская убила человек
Comments UA
2025-11-04T14:51:02Z
Будут судить бывшую инспектора полиции: совершила ДТП, в котором погибла ее подруга
Украинская правда
2025-11-04T12:31:54Z
Атака БПЛА: на заводе Росхима произошел взрыв и обвал
UAToday
2025-11-04T11:57:21Z
В Липецке и Кстово серия взрывов, горит НПЗ - СМИ
UAToday
2025-11-04T11:57:00Z
В Одесской области пограничник планировал организовать переправку военнообязанного через границу
Апостроф
2025-11-04T11:51:20Z
В Киеве говорят о маньяке с молотком — полиция реагирует
Новости Украины
2025-11-04T11:36:02Z
Ужасная трагедия на отдыхе: отец и сын погибли от нападения шершней
TSN
2025-11-04T11:03:55Z
Бывший правоохранитель из Буковины продавал поддельные водительские удостоверения
Апостроф
2025-11-04T10:42:47Z
Женщина хотела увеличить ягодицы, но умерла на операционном столе
Comments UA
2025-11-04T10:42:35Z
Осталось меньше месяца: некоторым украинцам ТЦК могут влепить двойной штраф
Знай
2025-11-04T16:21:57Z
Стало известно, кому автоматически продолжат отсрочку от мобилизации: список категорий
Comments UA
2025-11-04T16:21:35Z
Украина получила более 144 000 заявок от семей пропавших на войне оккупантов
Лига
2025-11-04T16:18:52Z
В Украине готовят новую систему контрактов для военных: юрист рассказал детали
Апостроф
2025-11-04T16:18:00Z
КНДР отправила в Россию 5 тыс. "строительных военных" — разведка
TSN
2025-11-04T16:09:36Z
Пункты пропуска на государственной границе усиливают: в ГПСУ назвали причину
Comments UA
2025-11-04T16:00:36Z
Женщина запустила необычную рекламную кампанию ради любви и прославилась на всю страну
Фокус
2025-11-04T15:42:36Z
Как не потерять пенсию, если невозможно пройти идентификацию онлайн
Comments UA
2025-11-04T15:30:31Z
В России у женщин массово выпадают брови
Comments UA
2025-11-04T15:27:43Z
Система реабилитации в Украине: Швейцария инвестирует 9,5 млн евро в проект TRUE
Апостроф
2025-11-04T16:06:18Z
Врачи назвали 7 признаков рака поджелудочной железы: что не следует игнорировать
Comments UA
2025-11-04T16:00:30Z
Искусственный интеллект ответил, как дожить до 140 лет
TSN
2025-11-04T15:21:04Z
Как продлить молодость мозга и сохранить свежесть разума
UAToday
2025-11-04T15:03:15Z
Печень под страшной угрозой: стало известно об огромной опасности популярного напитка
Comments UA
2025-11-04T14:51:04Z
Лайфхак, который вернет орхидеям пышное цветение
TSN
2025-11-04T14:48:24Z
Риск развития диабета после COVID-19 вырос почти на 60%: врач рассказала детали
Апостроф
2025-11-04T13:27:06Z
Как долго надо гулять с собакой, чтобы она оставалась здоровой — ответ ветеринара
TSN
2025-11-04T13:09:57Z
Откажитесь от этих продуктов, если хотите жить дольше
UAToday
2025-11-04T13:06:50Z
Brabus представил эксклюзивный мотоцикл по цене нового Lexus
Фокус
2025-11-04T15:21:47Z
Эти знаки Зодиака в ноябре рискуют попасть в ДТП
Comments UA
2025-11-04T14:42:06Z
В Украине продают старые "Жигули" 1972 года за 1,9 миллиона
Фокус
2025-11-04T14:06:12Z
Raptor на минималках: Ford показал недорогой спортивный пикап на базе Kuga
Фокус
2025-11-04T13:12:40Z
Новый электромобиль Renault Twingo за 20 000 евро рассекретили до премьеры
Фокус
2025-11-04T12:21:57Z
Презентован новый Chery Tiggo 8 2026: он дешевле Duster
Фокус
2025-11-04T10:36:23Z
Представлен экономичный кроссовер Hyundai за $9000: он может появиться в Украине
Фокус
2025-11-04T09:30:08Z
Водителям рассказали, какие авто убивает ржавчина: эксперты составили антирейтинг
Хвиля
2025-11-04T04:30:41Z
С этим не пустят в ЕС: украинских водителей призвали снять одну деталь с авто
Хвиля
2025-11-04T00:30:46Z
На северо-востоке Покровска продолжается активная зачистка от российских сил — ДШВ
Апостроф
2025-11-04T16:36:39Z
Десант ГУР в Покровске: к спецназовцам пробили наземный коридор. ВИДЕО
Новости Украины
2025-11-04T16:33:20Z
В Славянске погибла волонтер, которая заботилась о животных: подробности
TSN
2025-11-04T16:30:05Z
Гороскоп на 5 ноября 2025 года по картам Таро для всех знаков зодиака
UAToday
2025-11-04T16:27:39Z
Отключение света в Харьковской области с 5 по 7 ноября: облэнерго предупредило о новых графиках
Политека
2025-11-04T16:00:01Z
Украинские защитники отразили многочисленные атаки захватчиков: 103 боевых столкновения с начала суток
Новости Украины
2025-11-04T15:51:12Z
Россияне нанесли удар по жилому многоэтажному дому в Доброполье. ВИДЕО
Новости Украины
2025-11-04T15:48:02Z
Вокруг Покровска и Константиновки сложная ситуация: военный объяснил, зачем эти города Путину
Comments UA
2025-11-04T15:27:02Z
Россияне терпят большие потери в Покровске: военный рассказал о ситуации на фронте
Апостроф
2025-11-04T15:12:56Z
Гороскоп на среду 5 ноября 2025 года
UAToday
2025-11-04T16:09:57Z
Когда и как сеять петрушку на зиму: советы для хорошего урожая
TSN
2025-11-04T16:09:44Z
Серебро засияет как новое: простой лайфхак для чистки украшений за 20 минут
TSN
2025-11-04T16:09:06Z
Україна планує відновити експорт сухого молока до Японії
AgroNews
2025-11-04T14:21:48Z
Волосы после лета - как солома? Вот что реально вернет им блеск и жизнь этой осенью, советы трихолога
Знай
2025-11-04T13:51:03Z
Как жарить картошку, чтобы не прилипала к сковородке, была хрустящей и золотистой: секрет поваров
TSN
2025-11-04T12:06:02Z
Как сохранять летнюю резину зимой: советы, которые помогут продлить жизнь шин
UAToday
2025-11-04T11:57:51Z
Звезды предупреждают: каким знакам Зодиака не рекомендуется рисковать финансами в ноябре
Знай
2025-11-04T10:51:30Z
Маникюр не держится: 9 плохих привычек, разрушающих ваши ногти
Знай
2025-11-04T08:51:42Z
«Довольно неплохо»: Продажи Dispatch преодолели отметку в 1 млн копий
GameMag
2025-11-04T16:13:29Z
Почему стиральная машина шумит и прыгает: шесть основных причин и способы их устранения
TSN
2025-11-04T15:21:56Z
Межзвездный объект 3I/ATLAS изменил курс: еще одна причина, что это "корабль" инопланетян
Фокус
2025-11-04T15:06:32Z
В Китае тестируют "умные" туалеты: чтобы получить бумагу, нужно посмотреть рекламу
Comments UA
2025-11-04T14:36:35Z
Пуленепробиваемая ткань с нанотрубками: китайские ученые создали суперпрочный материал
ZN UA
2025-11-04T14:27:29Z
Почему следует выключать телефон раз в неделю: ответ экспертов вас удивит
TSN
2025-11-04T14:21:35Z
Таинственный светящийся объект завис над вулканом: очевидцы уверены, что это НЛО
Фокус
2025-11-04T14:21:15Z
Этот прибор есть на каждой кухне: он съедает у вас сотни киловатт электроэнергии
TSN
2025-11-04T14:06:33Z
На Полтавщині викрили схему привласнення 100 гектарів земель Нацпарку
AgroNews
2025-11-04T13:15:44Z
Суркис выступил с резким заявлением после поражения "Динамо" от "Шахтера"
Комсомольская правда
2025-11-04T15:54:30Z
Даша Квиткова взяла фамилию футболиста Бражка: спортсмен впервые прокомментировал их брак
TSN
2025-11-04T14:48:52Z
Британский бывший футболист Бекхэм получил рыцарское звание
ZN UA
2025-11-04T14:27:35Z
"Молчать больше не будем": Игорь Суркис жестко высказался о судействе в матче против "Шахтера"
ZN UA
2025-11-04T11:03:27Z
Главный тренер сербского клуба умер во время матча
ZN UA
2025-11-04T01:33:04Z
Самый старый чемпион Олимпийских игр скончался в возрасте 101 года
Апостроф
2025-11-03T18:57:48Z
Букмекеры сделали прогноз на матч "Шахтера" с исландцами в Лиге конференций
ZN UA
2025-11-03T15:21:20Z
Довбик один раз коснулся мяча в матче "Ромы" в Серии А
ZN UA
2025-11-03T11:33:50Z
Шовковский остался недоволен судейством в матче против "Шахтера"
ZN UA
2025-11-03T09:15:08Z