Дослідник визначив, як штучний інтелект уявляє середньостатистичну людину: жінка 30 років, працює в IT і живе… у Росії / Японії
З цікавого: американські моделі штучного інтелекту не підозрюють, що хтось взагалі живе в Китаї, тоді як жодна з випробуваних — не могла уявити світ за межами гендерної бінарності.
Англійський розробник Джеймс Хенкок презентував проєкт Imagine a person, який дозволяє дослідити, якою сучасний штучний інтелект уявляє середньостатистичну людину.
Хенкок створив спеціальний промт, який включав питання про ім’я, вік, гендер, регіон та один день з життя цієї середньостатистичної людини, та проганяв його у моделях Llama3.1, Gemma2 і Qwen2.5 по 100 разів, зрештою зібравши результати, які ті видавали найчастіше.
Детальні результати окремо по кожній моделі можна роздивитись на сторінці Хенкока, однак основна картина на сьогодні така: це людина 27-32 років, жінка — на думку Llama3.1 та Gemma2, і чоловік у версії Qwen2.5.
З цікавого малі мовні моделі вважають, що у світі існують люди лише віком 25-35 років. Також жодна з випробуваних моделей не змогла уявити світ за межами гендерної бінарності, принаймні в перших 100 відповідях.
Щодо регіону, то кожна мала різний розподіл: Gemma2 вважала, що люди в основному живуть у Росії, Великій Британії чи Індії, тоді як Llama3 найчастіше називала Японію. При цьому жодна з американських моделей не озвучила китайський регіон, а от китайський чатбот Qwen 2.5 навпаки не надав відповідей про жодне інше місце проживання середньостатистичної людини, окрім Китаю.
Серед імен у відповідях Gemma2 найчастіше звучало “Аня”, причому варіація “Аня Петрова” лідирувала у відповідях моделей щодо імен з великим відривом. Сам Хенкок у звіті уточнив, що користувачка з цим іменем зареєстрована, як продавець книг на Amazon з обкладинками, створеними Stable Diffiusion, тож це може бути певним автоматизованим налаштуванням. Llama3 найчастіше заявляла, що середньостатистичну людину звуть Емілія Гарсіа, тоді як Qwen 2.5 називав в основному ім’я Лі Вен.
Найбільше подібних відповідей у моделей було в категорії «спеціальність», де моделі Meta і Google зійшлись на графічному дизайнері, а китайський чатбот обрав розробника програмного забезпечення (хоча графічний дизайнер у нього в відповідях теж був, третім за частотою згадок).
Вихідний код Imagine a person також розміщений на GitHub. Сам розробник уточнює, що створив проєкт в першу чергу для розваги:
«Це просто для розваги. Ці мовні моделі працюють на моїй локальній машині з використанням квантованих версій оригінальних моделей (llama3.1 8b Q4_0, gemma2 2b Q4_0, qwen2.5 7b Q4_K_M). Я встановив температуру запитів