MY.UAНовини
Інструменти штучного інтелекту не можуть впоратися з основними фінансовими завданнями - дослідження
Інструменти штучного інтелекту не можуть впоратися з основними фінансовими завданнями - дослідження

Інструменти штучного інтелекту не можуть впоратися з основними фінансовими завданнями - дослідження

Тестування 22 моделей штучного інтелекту загального призначення від OpenAI, Anthropic, x.AI, Meta, Google та інших провідних гравців у сфері штучного інтелекту показало, що всі вони отримали в середньому менше ніж 50 відсотків точності для простих завдань, необхідних фінансовим аналітикам початкового рівня.

«Рівень BS, який ми бачимо там, абсурдний», — сказав генеральний директор Раян Крішнан, виконавчий директор компанії Vals AI, яка проводила дослідження.

Попри те, що останні моделі штучного інтелекту мають високі оцінки в загальнодоступних тестах вимірювання навичок математики чи програмування, питання для цих тестів широко розповсюджуються в Інтернеті та, ймовірно, стали частиною даних, на яких навчаються системи ШІ, сказав Крішнан.

«Люди роблять багато сміливих заяв про штучний інтелект, але це нереально, якщо про це повідомляють самі», — додав він. «У нас немає нічого схожого на експертну перевірку або сторонніх аудиторів або будь-яке регулювання».

Щоб оцінити моделі, Vals AI розробив власний набір даних із понад 500 запитань, написаних у співпраці з провідним банком, щоб оцінити такі навички, як дослідження ринку та прогнози.

Більшість моделей штучного інтелекту не справлялися зі звичайними завданнями, такими як пошук інформації в EDGAR, загальнодоступній базі даних Комісії з цінних паперів і бірж компаній — базовому ресурсі фінансових даних, який використовують аналітики, акціонери, журналісти та біржовики.

Останній випуск OpenAI, o3, модель «обґрунтування», призначена для спілкування сама з собою як спосіб генерації більш точних відповідей на складні запити, набрала в середньому 48,3 відсотка точності, але ціною в середньому 3,69 доларів США за запитання. Модель міркування Anthropic під назвою Claude 3.7 Sonnet (Thinking) отримала точність 44,1% за набагато нижчої ціни в 1,05 долара за запитання. Порівняно більш відкрита модель штучного інтелекту Meta, Llama, показала особливо погані результати: три версії показали в середньому менш як 10 відсотків точності.

Vals AI, стартап із Сан-Франциско, який стоїть за дослідженням, є частиною зростаючої ніші сторонніх фірм, які обіцяють тестувати, ранжувати або перевіряти моделі штучного інтелекту, оскільки промисловий ажіотаж стає дедалі складнішим для аналізу. Інші нові учасники цієї галузі включають Artificial Analysis і Chatbot Arena, популярний академічний дослідницький проект , який нещодавно став компанією, яка тепер називається LMArena.

Крішнан каже, що ретельне незалежне тестування того, як агенти штучного інтелекту виконують певні завдання, є життєво важливим для оцінки їх ефекту.

«Було таке бачення, що генеративний ШІ, ймовірно, матиме величезний вплив на економіку», — сказав він. «І все ж ми навіть не знаємо, в яких секторах економіки моделі можуть працювати добре і як насправді виглядатиме цей зрив».

За словами Крішнана, галузь надто довго покладалася на «оцінку за настроями» — окрему гру з моделлю та публікацію точкових прикладів на X. Підприємствам, які розглядають можливість придбання цих інструментів для збільшення або заміни працівників, потрібен більш суворий підхід.

Фірма нещодавно опублікувала серію подібних досліджень, в яких оцінювалися інструменти штучного інтелекту для юридичних завдань, розглядалися моделі штучного інтелекту загального призначення та агенти штучного інтелекту, створені для юристів, тестувались на запитах реального світу, розроблених спільно з юридичними фірмами. Оцінки були вищими для юриспруденції, ніж для фінансів, із середніми показниками точності в 70-му та 80-му процентилях для деяких із тих самих моделей.

Краща продуктивність, ймовірно, була тому, що Vals AI надав необхідні документи для більшості юридичних завдань, тоді як фінансове дослідження попросило моделей «провести власні дослідження у відкритому Інтернеті, щоб зробити контекст відповідним», — сказав Крішнан.

Meta відмовився коментувати звіт Vals AI. OpenAI та Anthropic не відповіли на запити про коментарі.

У своїй фінансовій оцінці Vals AI виявив, що моделі працювали набагато гірше, оскільки завдання ставали складнішими. Десять моделей отримали нуль балів за запитання, які просили модель визначити шаблон для однієї компанії в неодноразових деклараціях про цінні папери, як-от надання рекламного доходу YouTube у відсотках від доходу його материнської компанії Alphabet з 2021 по 2024 рік.

Згідно з аналізом Vals AI підрядників, яких попросили виконати ті самі завдання, моделі показали найкращі результати в простих завданнях пошуку кількісної та якісної інформації, які є легкими, але можуть потребувати багато часу для людей.

Зусилля стартапу порівняти ефективність виконання завдань, пов’язаних з фінансами, викликані зростаючим скептицизмом щодо претензій компанії, які часто руйнуються при найближчому розгляді.

В іншому випадку OpenAI повідомила про інші результати для своєї моделі o3 щодо математичних проблем, ніж сторонній аудитор. А під час оцінювання на Chatbot Arena, де користувачі голосують за свій вибір ШІ, Meta, як повідомляється, підіграла рейтингу своєї найновішої моделі Llama 4, опублікувавши версію, яка була «оптимізована для спілкування». Коментуючи це, представник Meta сказав: «Ми експериментуємо з усіма типами спеціальних варіантів».

Дослідження фінансового сектору, проведене Vals AI, по-іншому погляне на нещодавні заяви про те, що штучний інтелект знищує категорії робочих місць.

У лютому співзасновник Microsoft Білл Гейтс заявив, що ШІ замінить лікарів і вчителів протягом наступних 10 років. У нещодавньому інтерв’ю в подкасті Віктор Лазарте, генеральний партнер Benchmark, який підтримував Uber і WeWork, сказав, що розмови технологічних компаній про те, що штучний інтелект просто «доповнює» людей, вводять в оману, і що юристи та рекрутери повинні бути особливо стривожені.

Повідомлення від команди Vals AI передбачає більш скромну оцінку впливу штучного інтелекту на роботу багатьох білих комірців. Хоча системи постійно вдосконалюються, сказав Крішнан, ідея про те, що інструмент штучного інтелекту може виконувати чиюсь роботу наскрізно, все ще «досить химерна».

Поділитися
Поділитися сюжетом
Джерело матеріала
Згадувані персони
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:57Z
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:54Z
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:42Z
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:32Z
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:07Z
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:04Z
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:03Z
В РФ на известного певца из 90-х напала женщина: что произошло
Comments UA
2025-12-22T20:51:02Z
Был звездой многих сериалов и мелодрам: в России скончался известный актер
Comments UA
2025-12-22T20:45:59Z
В прифронтовых районах стоимость доставки газа вырастет на 100%: список
Новости Украины
2025-12-22T21:36:52Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:42Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:41Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:41Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:32Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:31Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:22Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:10Z
Популярный банк закрывает все счета украинцев: последний срок снятия денег
GlavRed
2025-12-22T20:18:07Z
Ликвидация генерала в Москве: в РФ ищут «украинский след» в гибели генерала
Новости Украины
2025-12-22T22:03:16Z
Стефанчук заявил об «одноразовом» законе о выборах во время войны
Comments UA
2025-12-22T22:00:07Z
У Путина отреагировали на заявление Венса о "прорыве в переговорах"
TSN
2025-12-22T21:54:48Z
Известный астролог указал на сильную примету относительно войны: что ждет украинцев
Знай
2025-12-22T21:33:52Z
Известный астролог указал на сильную примету относительно войны: что ждет украинцев
Знай
2025-12-22T21:33:39Z
Известный астролог указал на сильную примету относительно войны: что ждет украинцев
Знай
2025-12-22T21:33:35Z
Известный астролог указал на сильную примету относительно войны: что ждет украинцев
Знай
2025-12-22T21:33:04Z
Известный астролог указал на сильную примету относительно войны: что ждет украинцев
Знай
2025-12-22T21:33:03Z
Не на тех вопросах зацикливаются украинцы: Портников назвал темы, которые реально важны
Новости Украины
2025-12-22T21:21:42Z
В Киеве волк, живущий в квартире, покусал свою хозяйку: животное забрали
Фокус
2025-12-22T22:03:43Z
В ДТП погиб основатель популярной видеоигры: что известно о Винсе Зампелле
Comments UA
2025-12-22T21:48:32Z
Создатель Call of Duty и Titanfall Винс Зампелла погиб в автокатастрофе
GameMag
2025-12-22T21:33:10Z
Несуществующие инверторы и генераторы: суд в Днепре над мошенниками
Новости Украины
2025-12-22T20:24:56Z
Несуществующие инверторы и генераторы: суд в Днепре над мошенниками
Новости Украины
2025-12-22T20:24:55Z
Несуществующие инверторы и генераторы: суд в Днепре над мошенниками
Новости Украины
2025-12-22T20:24:48Z
Несуществующие инверторы и генераторы: суд в Днепре над мошенниками
Новости Украины
2025-12-22T20:24:27Z
Несуществующие инверторы и генераторы: суд в Днепре над мошенниками
Новости Украины
2025-12-22T20:24:23Z
Несуществующие инверторы и генераторы: суд в Днепре над мошенниками
Новости Украины
2025-12-22T20:24:20Z
Выгорание и тест для галочки: чем опасно дистанционное обучение школьников
Знай
2025-12-22T21:51:13Z
Без барьеров: как заказать "цифровой чемодан" ЦНАП
Хвиля
2025-12-22T21:45:33Z
25 декабря или 7 января: отец объяснил, когда праздновать Рождество
Фокус
2025-12-22T21:18:20Z
Пришлось реанимировать: главная пропагандистка Кремля рассказала о рождении своих детей
Comments UA
2025-12-22T20:06:58Z
Пришлось реанимировать: главная пропагандистка Кремля рассказала о рождении своих детей
Comments UA
2025-12-22T20:06:49Z
Пришлось реанимировать: главная пропагандистка Кремля рассказала о рождении своих детей
Comments UA
2025-12-22T20:06:47Z
Пришлось реанимировать: главная пропагандистка Кремля рассказала о рождении своих детей
Comments UA
2025-12-22T20:06:38Z
Пришлось реанимировать: главная пропагандистка Кремля рассказала о рождении своих детей
Comments UA
2025-12-22T20:06:38Z
Пришлось реанимировать: главная пропагандистка Кремля рассказала о рождении своих детей
Comments UA
2025-12-22T20:06:19Z
Что пить на Новый год, чтобы не пожалеть и не проснуться в оливье: врачи назвали "менее вредный" алкоголь
Знай
2025-12-22T19:58:36Z
Воздушные сушилки в туалете: почему их нельзя использовать
Знай
2025-12-22T19:58:19Z
Головные боли, аллергия и кашель: какие виды свечей нельзя использовать
Знай
2025-12-22T19:58:05Z
Этот напиток может замедлить старение: что выяснили ученые
Фокус
2025-12-22T19:56:43Z
Что пить от высокого давления: специалисты дали совет гипертоникам
UAToday
2025-12-22T19:55:09Z
Новая обязательная вакцинация с 2026 года: против чего будут прививать
UAToday
2025-12-22T19:55:03Z
Вредно ли сладкое на ночь: диетологи объяснили, как сахар влияет на сон
UAToday
2025-12-15T15:03:24Z
Повышенное давление: Признаки того, что вам не хватает магния
UAToday
2025-12-15T13:09:22Z
С возрастом люди начинают просыпаться раньше: врачи рассказали, как это остановить
UAToday
2025-12-15T13:09:16Z
В США начали выдавать номера авто со скелетом динозавра
Фокус
2025-12-22T20:12:45Z
С1 января 2026 года Китай запретит вывоз б/у авто с нулевым пробегом
Хвиля
2025-12-22T19:57:39Z
Беспилотные авто Toyota начали обслуживать аэропорт в Японии
Фокус
2025-12-22T19:56:57Z
Лимитированный эксклюзив: представлен самый экстравагантный Rolls-Royce современности
Фокус
2025-12-22T19:56:57Z
Некоторые электрокроссоверы могут остаться без запчастей: как владельцы спасают машины
Фокус
2025-12-22T19:56:53Z
Необычные качества новейшего кроссовера Chery Tiggo 7 Plug-In Hybrid
Фокус
2025-12-22T19:56:51Z
Новая Toyota Corolla 2026 вышла на рынок: как изменилось самое популярное авто в мире
Фокус
2025-12-22T19:56:48Z
Старший брат Leaf: в продажу поступает флагманский электромобиль Nissan
Фокус
2025-12-22T19:56:43Z
В Испании возрождают знаменитый суперкар 50-х, созданный украинцем
Фокус
2025-12-22T19:56:23Z
Еспаньйол у вольовому стилі подужав Атлетік Більбао
Football.ua
2025-12-22T22:01:57Z
Россияне шли колоннами на Доброполье. Штурм отбит, уничтожено 30 единиц техники – видео
Лига
2025-12-22T21:30:23Z
Россияне шли колоннами на Доброполье. Штурм отбит, уничтожено 30 единиц техники – видео
Лига
2025-12-22T21:27:24Z
Россияне шли колоннами на Доброполье. Штурм отбит, уничтожено 30 единиц техники – видео
Лига
2025-12-22T21:27:24Z
Генштаб: На фронте произошло 190 боевых действий с начала суток
Украинская правда
2025-12-22T21:15:48Z
На фронте в Украине погибли двое добровольцев из США: что известно о них
TSN
2025-12-22T20:51:34Z
На фронте в Украине погибли двое добровольцев из США: что известно о них
TSN
2025-12-22T20:48:56Z
Генштаб: На фронте произошло 190 боевых действий с начала суток
Украинская правда
2025-12-22T20:18:59Z
Генштаб: На фронте произошло 190 боевых действий с начала суток
Украинская правда
2025-12-22T20:18:58Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:57Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:53Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:51Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:38Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:36Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:31Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:22Z
10 новогодних подарков для женщин, которые она точно не забудет
Знай
2025-12-22T20:33:13Z
Женские рюкзаки PUMA — удобный аксессуар для города и тренировок
Мій Харків
2025-12-22T20:01:59Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:58Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:40Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:36Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:26Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:14Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:05Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:03Z
Черный день для геймеров: легендарный разработчик Винс Зампелла сгорел в своей машине
Новости Украины
2025-12-22T20:30:02Z
Театр лицемерия и абсурда: Организаторы Indie Game Awards отобрали награду у игры Chantey
GameMag
2025-12-22T20:00:59Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:47Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:46Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:41Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:37Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:34Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:21Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:16Z
Звезды на чемоданах? Пять незаменимых футболистов "Динамо" могут покинуть киевский клуб в 2026
Знай
2025-12-22T20:51:08Z
9-летний украинский шахматист завоевал бронзу чемпионата мира
Комсомольская правда
2025-12-22T20:00:52Z