/https%3A%2F%2Fs3.eu-central-1.amazonaws.com%2Fmedia.my.ua%2Ffeed%2F434%2F0430edcc4a2880d2729a8706a9f76c1e.jpg)
Користувачі Bluesky обговорюють плани щодо використання їхніх даних та навчання ШІ на їх публікаціях
Соціальна мережа Bluesky нещодавно опублікувала пропозицію на GitHub, в якій описуються нові параметри, за допомогою яких користувачі можуть вказати, чи хочуть вони, щоб їхні публікації та дані збиралися для таких речей, як генеративне навчання ШІ та публічне архівування.
Генеральний директор Джей Грейбер обговорював цю пропозицію на початку цього тижня під час виступу на South by Southwest, але вона привернула нову увагу в п’ятницю ввечері після того, як вона опублікувала про це на Bluesky . Деякі користувачі з тривогою відреагували на плани компанії, які вони сприйняли як відміну попереднього наполягання Bluesky про те, що вона не буде продавати дані користувачів рекламодавцям і не навчатиме ШІ на публікаціях користувачів .
«Ой, чорт візьми!» – написав користувач Sketchette . «Краса цієї платформи полягала в тому, що НЕ ділилися інформацією. Особливо покоління AI. Не пропадай зараз».
Грабер відповів , що генеруючі AI-компанії «вже збирають загальнодоступні дані з Інтернету», включно з Bluesky, оскільки «все на Bluesky є публічним, як і веб-сайт». Тож вона сказала, що Блюскі намагається створити «новий стандарт» для керування таким скануванням, подібним до файлу robots.txt , який веб-сайти використовують для передачі своїх дозволів веб-сканерам.
Дебати про навчання штучному інтелекту та авторські права привернули до уваги файл robots.txt , серед іншого підкреслюючи той факт, що він не має законної сили. Bluesky формулює свій запропонований стандарт як такий, що матиме подібний «механізм і очікування», забезпечуючи «машиночитний формат, якого повинні дотримуватися хороші актори, і він має етичну вагу, але не має юридичної сили».
Згідно з пропозицією, користувачі програми Bluesky або інших програм, які використовують базовий протокол ATProtocol , можуть зайти у свої налаштування та дозволити або заборонити використання своїх даних Bluesky у чотирьох категоріях: генеративний штучний інтелект, з’єднання протоколів (тобто з’єднання різних соціальних екосистем), масові набори даних і веб-архівування (наприклад, Wayback Machine від Internet Archive).
Якщо користувач вказує, що він не хоче, щоб його дані використовувалися для навчання генеративного штучного інтелекту, у пропозиції йдеться: «Очікується, що компанії та дослідницькі групи, які створюють навчальні набори штучного інтелекту, поважатимуть цей намір, коли вони його бачать, або під час аналізу веб-сайтів, або під час масової передачі за допомогою самого протоколу».
Моллі Вайт, яка пише інформаційний бюлетень Citation Needed і блог Web3 is Going Just Great, описала це як «хорошу пропозицію» і сказала, що «дивно бачити, як люди критикують BlueSky за це», оскільки це не стільки «привітне копіювання штучного інтелекту», скільки «спроба додати сигнал згоди, щоб дозволити користувачам повідомляти про свої вподобання щодо копіювання, яке вже відбувається».
«Я думаю, що слабкість цієї та подібної пропозиції [Creative Commons] щодо «сигналів переваг» полягає в тому, що вони покладаються на скребки, щоб поважати ці сигнали через певне бажання бути хорошими акторами», — продовжив Вайт. «Ми вже бачили, як деякі з цих компаній пропускають файли robots.txt або піратські матеріали, щоб отримати їх».