MY.UAНовини
Модель міркування OpenAI AI іноді «думає» китайською
Модель міркування OpenAI AI іноді «думає» китайською

Модель міркування OpenAI AI іноді «думає» китайською

Незабаром після того, як OpenAI випустив o1 , свою першу «розумну» модель ШІ, люди почали помічати цікаве явище. Іноді модель починала «думати» китайською, перською чи іншою мовою — навіть коли їй ставили запитання англійською.

Отримавши проблему, яку потрібно розібрати — наприклад, «Скільки R у слові «полуниця»?» — o1 розпочинає процес «роздумів», приходячи до відповіді, виконуючи ряд кроків міркування. Якби запитання було написано англійською мовою, остаточна відповідь o1 була б англійською. Але модель виконає деякі кроки іншою мовою, перш ніж зробити свій висновок.

«[O1] випадково почав думати китайською на півдорозі», — сказав один користувач Reddit .

«Чому [o1] випадково почав думати китайською?» запитав інший користувач у дописі на X . «Жодна частина розмови (5+ повідомлень) не була китайською».

OpenAI не надав пояснень дивній поведінці o1 — і навіть не визнав її. Отже, що може статися?

Що ж, експерти зі штучного інтелекту не впевнені. Але у них є кілька теорій.

Дехто з X, включно з генеральним директором Hugging Face Клеманом Делангем, натякнув на те, що моделі міркування, такі як o1, навчаються на наборах даних, які містять багато китайських ієрогліфів. Тед Сяо, дослідник Google DeepMind, стверджував, що компанії, включаючи OpenAI, використовують сторонні служби маркування даних китайською мовою, і що перехід o1 на китайську є прикладом «китайського лінгвістичного впливу на міркування».

«[Лабораторії, такі як] OpenAI і Anthropic використовують [сторонні] служби маркування даних для даних міркувань докторського рівня для науки, математики та кодування», — написав Сяо в дописі на X. «Через доступність експертної робочої сили та вартість багато з цих постачальників даних знаходяться в Китаї».

Мітки, також відомі як теги або анотації, допомагають моделям зрозуміти та інтерпретувати дані під час процесу навчання. Наприклад, мітки для навчання моделі розпізнавання зображень можуть мати форму позначок навколо об’єктів або підписів, що стосуються кожної людини, місця чи об’єкта, зображеного на зображенні.

Дослідження показали, що упереджені етикетки можуть створювати упереджені моделі. Наприклад,  середньостатистичний анотатор  швидше позначатиме фрази афроамериканської народної англійської мови (AAVE), неофіційної граматики, яку використовують деякі чорношкірі американці, як токсичні, провідні детектори токсичності штучного інтелекту, навчені на етикетках, бачать AAVE як непропорційно токсичну.

Однак інші експерти не погоджуються на китайську гіпотезу маркування даних o1. Вони зазначають, що o1 з такою ж ймовірністю перейде на хінді , тайську або іншу мову, крім китайської, під час пошуку рішення.

Скоріше, кажуть ці експерти, o1 та інші моделі міркувань можуть просто використовувати мови, які вони вважають найбільш ефективними для досягнення мети (або галюцинації ).

«Модель не знає, що таке мова або що мови відрізняються», — сказав TechCrunch Метью Гуздіал, дослідник ШІ та доцент Альбертського університету. «Це все лише текст».

Дійсно, моделі безпосередньо не обробляють слова. Натомість вони використовують жетони . Токени можуть бути такими словами, як «фантастичний». Або це можуть бути склади, наприклад «fan», «tas» і «tic». Або це можуть бути навіть окремі символи в словах, наприклад, «f», «a», «n», «t», «a», «s», «t», «i», «c».

Як і маркування, токени можуть вносити упередження. Наприклад, багато перекладачів слово-лексема припускають, що пробіл у реченні позначає нове слово, попри те, що не всі мови використовують пробіли для розділення слів.

Тіжен Ван, інженер-програміст стартапу Hugging Face зі штучного інтелекту, погоджується з Гуздіалом, що неузгодженість мови моделей міркувань можна пояснити асоціаціями, які моделі створили під час навчання.

«Враховуючи кожен лінгвістичний нюанс, ми розширюємо світогляд моделі та дозволяємо їй вчитися на повному спектрі людських знань», — написав Ван у дописі на X. «Наприклад, я віддаю перевагу робити математику китайською, тому що кожна цифра — лише одна. склад, що робить обчислення чіткими та ефективними. Але коли справа доходить до таких тем, як несвідоме упередження, я автоматично перемикаюся на англійську, головним чином тому, що там я вперше навчився і ввібрав ці ідеї».

Теорія Ванги правдоподібна. Зрештою, моделі — це ймовірнісні машини. Навчаючись на багатьох прикладах, вони вивчають шаблони для прогнозування, наприклад, як «кому» в електронному листі зазвичай передує «це може стосуватися».

Але Лука Солдаїні, науковий співробітник некомерційного Інституту ШІ Аллена, попередив, що ми не можемо знати напевно. «Цей тип спостереження на розгорнутій системі ШІ неможливо створити резервну копію через те, наскільки ці моделі непрозорі», — сказав він TechCrunch. «Це один із багатьох прикладів того, чому прозорість у створенні систем ШІ є фундаментальною».

Якщо не отримати відповіді від OpenAI, нам залишилося міркувати про те, чому o1 думає про пісні французькою мовою, а синтетичну біологію — мандаринською.

Поділитися
Поділитися сюжетом
Джерело матеріала
Зеленський назвав чисельність російської та української армій
24tv
2025-01-15T14:57:17Z
Українська вчителька Леся Павлюк потрапила до списку 50 найкращих педагогів світу
24tv
2025-01-15T14:55:01Z
Німецький уряд підтримав дозвіл армії збивати невідомі безпілотники
Европейская правда
2025-01-15T14:54:48Z
Військові, які самовільно залишили частини, мають можливість повернутися до 1 березня
Украина Криминальная
2025-01-15T14:51:22Z
Вчителька з Франківська увійшла в топ-50 найкращих вчителів світу
УкраинФорм
2025-01-15T14:48:41Z
На Миколаївщині начальник штабу допустив безпідставне нарахування бойових
1News
2025-01-15T14:39:04Z
Зеленський підписав закон про подовження терміну добровільного повернення на службу після СЗЧ
УкраинФорм
2025-01-15T14:36:39Z
Кораблі НАТО виходять на патрулювання Балтійського моря через диверсії проти інфраструктури
ZN UA
2025-01-15T14:33:50Z
2024 року кількість українців, які виїхали та не повернулись додому, зросла втричі — аналітики
TSN
2025-01-15T14:30:24Z
У Києві відбудеться концерт хору імені Верьовки
УкраинФорм
2025-01-15T15:01:20Z
Позитив вперше став батьком та показав фото з новонародженою донькою
TSN
2025-01-15T14:54:03Z
Другий фільм «Чужий: Ромул» спрямує франшизу у «незвідані води», — режисер
ITC
2025-01-15T14:40:31Z
"Не хотіла навіть жити": Тоня Матвієнко зробила гучну публічну заяву
GlavRed
2025-01-15T14:39:53Z
Гучний секс-скандал у Голлівуді: адвокати репера P Diddy зробили заяву про його "білі вечірки"
24tv
2025-01-15T14:36:29Z
Фільм про війну в Україні боротиметься за головну британську кінопремію BAFTA: що це за стрічка
24tv
2025-01-15T14:33:31Z
Лариса Кадочникова пояснила, чому відмовилася говорити українською на публіці
Комсомольская правда
2025-01-15T14:16:33Z
«Фільтр» оголосив 50 фіналістів національного конкурсу «Репортер»
Детектор М
2025-01-15T14:01:31Z
Короткометражу про війну в Україні з Олександром Рудинським номіновано на премію BAFTA
Комсомольская правда
2025-01-15T13:46:27Z
СКУ поведе онлайн-конференцію про ефективну адвокацію для України
УкраинФорм
2025-01-15T15:01:32Z
Сподіваюся, Росія забезпечить їх мішками для трупів, – Білий дім про втрати бійців КНДР
24tv
2025-01-15T15:00:53Z
Зеленський озвучив свої очікування від Трампа
TSN
2025-01-15T15:00:47Z
Британська розвідка: Росія посилила контроль над ЗМІ через страх нестабільності режиму
Европейская правда
2025-01-15T14:58:58Z
Туск пообіцяв Зеленському прискорити процес вступу України до ЄС
TSN
2025-01-15T14:58:33Z
Інавгурація Дональда Трампа: коли відбудеться церемонія, і якою вона буде
24tv
2025-01-15T14:57:32Z
Кількість поранених унаслідок російського авіаудару по Краматорську зросла до дев'яти
УкраинФорм
2025-01-15T14:55:08Z
Дуда наполягає, що запросити Україну в НАТО треба вже зараз
Европейская правда
2025-01-15T14:54:44Z
Зустріч президента України та прем’єра Польщі: опубліковано спільну заяву
ГЛАВКОМ NET
2025-01-15T14:54:31Z
Розкрадання майже ₴60 мільйонів Укренерго: суд арештував одного з підозрюваних
УкраинФорм
2025-01-15T14:58:22Z
За 72 години у Стамбулі раптово померли 19 людей: більшість з них — іноземці
TSN
2025-01-15T14:54:56Z
У Британії високоорганізовані злодії вкрали 13 мобільних туалетів
Фокус
2025-01-15T14:45:27Z
У Канаді крадії вигадали зухвалий спосіб пограбування банків
ГЛАВКОМ NET
2025-01-15T14:45:00Z
На Житомирщині працівник моргу викрав обручку загиблого військовослужбовця
Украина Криминальная
2025-01-15T14:33:57Z
Жінка підпалила будинок за допомогою чипсів: чим все закінчилося
24tv
2025-01-15T14:18:19Z
У Тернополі за отримання $3000 та вимагання $20 000 хабаря в учасників кримінального процесу судитимуть поліцейського
Украина Криминальная
2025-01-15T14:09:53Z
Мешканець Харківщини за ₴50 тис. допомагав безпроблемно відновити у ТСЦ вилучене посвідчення водія
Украина Криминальная
2025-01-15T13:51:25Z
Побили чоловіка та підпалили його автомобіль: у Дніпрі судитимуть двох братів
Украина Криминальная
2025-01-15T13:45:00Z
"Немає ким замінювати воїнів на фронті": командир батальйону визнав провал мобілізації в Україні
Политека
2025-01-15T15:01:32Z
Операція ЗСУ у Кринках. Герой України, оприлюднив деталі подій у 2023 році
ГЛАВКОМ NET
2025-01-15T15:00:14Z
Книгарня «Сенс» спільно з Київським метрополітеном запустили ініціативу «Читай в метро»
Детектор М
2025-01-15T14:55:57Z
Просто ж*а : Білецький жорстко про ситуацію на фронті
TSN
2025-01-15T14:54:44Z
Двох представників «Свідків Єгови» із Севастополя суд РФ засудив до шести років ув'язнення
УкраинФорм
2025-01-15T14:51:39Z
Агентка РФ у Миколаєві отримала 15 років тюрми
1News
2025-01-15T14:42:23Z
Україна повернула з російського полону 25 українців
ГЛАВКОМ NET
2025-01-15T14:39:46Z
"Росіяни про це не думають": ЗСУ можуть здійснити неочікувану операцію в Криму
GlavRed
2025-01-15T14:39:03Z
ЗСУ переграли РФ в ключовій точці фронту: де ворог зазнає поразки - 63 ОМБр
GlavRed
2025-01-15T14:25:11Z
Загрожує три роки в'язниці: футболіста Севільї заарештували за отримання жовтих карток
24tv
2025-01-15T14:42:47Z
Легенда боксу розкрив ім'я суперника, який може повернути Ф'юрі на профі-ринг
24tv
2025-01-15T14:27:27Z
Australian Open. Наступна суперниця Костюк - 12 «ракетка» світу
УкраинФорм
2025-01-15T14:25:30Z
Шахтар впорався з ЦСКА Софія в контрольному поєдинку
Football.ua
2025-01-15T14:22:53Z
"Бронзовий бомбардувальник" дізнався суперника після двох поразок в Ер-Ріяді
24tv
2025-01-15T14:03:10Z
Араухо досяг принципової домовленості з Барселоною щодо нового контракту
Football.ua
2025-01-15T14:01:09Z
"Збожеволів би": екссуперник Усика змоделював бій українця з легендою боксу
24tv
2025-01-15T13:42:22Z
Галатасарай звернувся до Астон Вілли щодо Дієго Карлоса
Football.ua
2025-01-15T13:28:45Z
Шахтар переграв найтитулованіший клуб Болгарії завдяки ефектному м'ячу вихованця: відео голу
24tv
2025-01-15T13:18:19Z
Nintendo може представити друге покоління консолі Switch вже 16 січня – чутки
AIN
2025-01-15T15:00:00Z
Смартфону Asus Zenfone 12 Ultra приписують чип Snapdragon 8 Elite та батарею на 5800 мАг
ITC
2025-01-15T14:55:32Z
Вперше за десять років частка Google у пошуковому трафіку впала нижче 90%
Детектор М
2025-01-15T14:51:47Z
Багаторічна шпигунська кампанія: Китай встановив жучки на мільйони комп'ютерів по всьому світу
24tv
2025-01-15T14:49:28Z
Fortnite поверне найрідкіснішу зброю, яку видалив 8 років тому
24tv
2025-01-15T14:48:13Z
Забезпечить будинок енергією: створено "нерухому" вітряну турбіну для даху
Фокус
2025-01-15T14:36:41Z
Що робити, якщо смартфон почав повільно заряджатись: кілька можливих причин
InternetUA
2025-01-15T14:33:31Z
TikTok планує відключити застосунок для користувачів у США в разі набуття заборони
AIN
2025-01-15T14:30:06Z
"Копія" Дарта Вейдера: у В'єтнамі знайшли гігантське дивне створіння
GlavRed
2025-01-15T14:25:14Z
Ольги Миколюк та її компанія «Хімпостач»: ЗМІ розповіли про «сумнівні волонтерські» схеми збагачення на мільйони під час війни
Политека
2025-01-15T14:58:15Z
Якою буде вартість молочних продуктів: експерт поділився прогнозом
TSN
2025-01-15T14:54:06Z
Уряд України погодив призначення в.о гендиректора УДП
Agravery
2025-01-15T14:51:22Z
USDA погіршив світовий баланс кукурудзи у 2024/25 МР
AgroNews
2025-01-15T14:49:11Z
2024 рік став найгіршим для NFT: чому так сталося
24tv
2025-01-15T14:48:10Z
Нещодавні санкції США можуть суттєво порушити експорт енергоносіїв з Росії — оцінка МЕА
ZN UA
2025-01-15T14:45:15Z
Підвищення податків не викликало хвилю закриття ФОПів, їх кількість продовжу рости – підрахунки Гетманцева
ZN UA
2025-01-15T14:36:37Z
Долар "полетить" вгору: економіст спрогнозував, яким буде курс у 2025 році
GlavRed
2025-01-15T14:33:15Z
Аграрний комітет підбив підсумки роботи минулої сесії
AgroPortal
2025-01-15T14:30:05Z
Одні перехоплюють дух, а інші здаються химерними: які є найдивніші дизайни інтер'єрів у світі
24tv
2025-01-15T14:36:51Z
Всього один знак попереджає, що пральну машину час чистити: його знають одиниці
24tv
2025-01-15T14:33:06Z
Чому собаки нахиляють голову, коли ми з ними говоримо: несподівані причини
GlavRed
2025-01-15T14:25:48Z
Як зробити м'ясо м'яким, скільки потрібно тушкувати залежно від виду
TSN
2025-01-15T14:24:09Z
Коричневий цукор обрали «смаком року» — чому
AIN
2025-01-15T14:00:26Z
Рисові кульки з гострим соусом: бюджетна закуска, яка стане улюбленою з першого разу
24tv
2025-01-15T13:51:17Z
"Смішно таким займатися": дантист розповів, чи заглядають стоматологи у зуби під час спілкування
24tv
2025-01-15T13:36:53Z
Навіщо кухарі додають ложку соди під час варіння яєць: нізащо б не здогадалися
TSN
2025-01-15T13:36:19Z
Як швидко розм'якшити масло: топ-4 найпростіші способи
GlavRed
2025-01-15T13:27:16Z
Пік захворюваності на ГРВІ та грип очікується у лютому - Кузін
УкраинФорм
2025-01-15T14:30:04Z
Прасуйте спідню білизну після прання: ось чому це треба робити
24tv
2025-01-15T14:21:44Z
При захворюванні на ГРВІ не потрібно робити тести на метапневмовірус - Кузін
УкраинФорм
2025-01-15T14:16:10Z
Клітини "втекли": чоловік помер після того, як підхопив рак легень від донора печінки
TSN
2025-01-15T13:24:24Z
Більше 80% жінок помиляються: як визначити розмір грудей правильно
GlavRed
2025-01-15T12:25:54Z
Їжа для "другого мозку": варіанти перекусів, які покращать стан кишківника
24tv
2025-01-15T12:06:25Z
Чому сняться кошмари: про які хвороби вони можуть свідчити
TSN
2025-01-15T11:54:59Z
Падають після однієї чарки: чому деякі люди не можуть багато пити, пояснив нейробіолог
Фокус
2025-01-15T11:27:52Z
Виплати при втраті працездатності тепер залежатимуть від зарплати
Знай
2025-01-15T11:13:07Z
Nissan розкрив характеристики нового електричного седана N7
AutoGeek
2025-01-15T14:58:39Z
Електромобіль Mazda 6e їде до Європи: усі подробиці про новинку
AutoGeek
2025-01-15T14:12:14Z
На продаж виставили 15-річний Dodge Challenger без пробігу
AutoCentre
2025-01-15T13:16:40Z
Зірки краш-тестів: названо найбезпечніші автомобілі 2024 року
Фокус
2025-01-15T12:51:53Z
Modellista підготувала для Toyota bZ4x стильний обвіс у стилі 80-х
AutoCentre
2025-01-15T12:12:41Z
Набагато дешевше за Duster: українцям запропонували паркетник Citroen за вигідною ціною
ЗаРулем
2025-01-15T12:06:57Z
Клуб 700 км: нові електромобілі з найбільшим запасом ходу
Фокус
2025-01-15T11:57:49Z
Renault розкрив усі секрети стильного інтер’єра електромобіля Twingo
AutoGeek
2025-01-15T10:42:24Z
Неймовірно вигідні ціни на CITROЁN C3: встигніть придбати – від 640 000 гривень!
AutoCentre
2025-01-15T10:33:35Z