/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2F0003411e2e76162254733cd30c106114.jpg)
Найкращий посібник із розпізнавання текстів, написаних за допомогою штучного інтелекту, міститься у Вікіпедії
У Вікіпедії досить добре навчилися позначати прозу, написану штучним інтелектом, і публічний посібник групи «Ознаки письма, створеного штучним інтелектом».
З 2023 року редактори Вікіпедії працюють над тим, щоб контролювати надсилання матеріалів про штучний інтелект, у рамках проєкта, який вони називають Project AI Cleanup. З мільйонами правок, що надходять щодня, є багато матеріалу для використання, і в класичному стилі редакторів Вікіпедії група створила польовий посібник, який є одночасно детальним і багатим на докази.
Почнемо з того, що посібник підтверджує те, що ми вже знаємо: автоматизовані інструменти по суті марні. Натомість посібник зосереджується на звичках та зворотах мови, які рідко зустрічаються у Вікіпедії, але поширені в Інтернеті загалом (і, отже, поширені в навчальних даних моделі). Згідно з посібником, роботи ШІ багато часу приділятимуться підкресленню важливості теми, зазвичай у загальних термінах, таких як «ключовий момент» або «ширший рух». Моделі ШІ також багато часу приділятимуть деталізації незначних медіа-роликів, щоб зробити тему помітною — те, чого ви очікуєте від особистої біографії, але не від незалежного джерела.
У посібнику визначається особливо цікава особливість щодо заключних речень з нечіткими твердженнями про важливість. Моделі скажуть, що якась подія чи деталь «підкреслює значення» чогось чи іншого або «відображає постійну актуальність» якоїсь загальної ідеї. (Граматичні фанати знають це як «дієприкметник теперішнього часу»). Це трохи важко визначити, але як тільки ви зможете це розпізнати, ви побачите це всюди.
Також існує тенденція до використання розпливчастої маркетингової мови, що надзвичайно поширене в інтернеті. Пейзажі завжди мальовничі, краєвиди завжди захоплюють дух, а все чисте та сучасне. Як висловилися редактори, «це більше схоже на стенограму телевізійної реклами».
Варто прочитати цей посібник повністю, але я залишився дуже враженим. До цього я б сказав, що проза LLM розвивається надто швидко, щоб її можна було точно визначити. Але згадані тут звички глибоко вкорінені в тому, як навчаються та розгортаються моделі штучного інтелекту. Їх можна замаскувати, але повністю позбутися їх буде важко. І якщо широка публіка стане більш обізнаною у визначенні прози на основі штучного інтелекту, це може мати всілякі цікаві наслідки.