MY.UAНовини
Боротьба з дезінформацією: як українська студентка навчає ШІ виявляти російську пропаганду у Вікіпедії
Боротьба з дезінформацією: як українська студентка навчає ШІ виявляти російську пропаганду у Вікіпедії

Боротьба з дезінформацією: як українська студентка навчає ШІ виявляти російську пропаганду у Вікіпедії

Випускниця Українського католицького університету (УКУ) Вікторія Маковська створила модель, яка допомагає виявляти російські маніпуляції у Wikipedia, навіть коли вони маскуються під нейтральні формулювання. У фокусі – не очевидні фейки, а тонкі мовні маркери: ідеологічні обертони, зміщення акцентів, легітимізація сумнівних фактів.

Розробка потенційно могла б стати корисною державі в інформаційній боротьбі проти російської пропаганди. Тож Mind розповідає докладніше про те, що зараз здатна аналізувати модель та як вона може бути застосована на практиці, зокрема й за межами Wikipedia.

Яке завдання вирішує проєкт

На жаль, в Україні досі найпопулярнішою версією Wikipedia залишається російськомовна. Це створює значний ризик, адже саме через неї до українських користувачів просочується російська пропаганда.

Wikipedia має розгалужену систему модерації – як автоматичної, так і ручної. І модератори зазвичай досить ефективно виявляють та усувають маніпулятивні редагування. Але наразі автоматизована модерація Wikipedia не спрямована безпосередньо на виявлення тонких текстових маніпуляцій. Вона фокусується переважно на очевидних проявах вандалізму, таких, як повторювані вставки тексту капслоком, особисті образи, жарти, а також перевірка наявності чи релевантності джерел.

Тому у фокусі розробки випускниці УКУ Вікторії Маковської став машинний аналіз спроб поширення дезінформації, а не остаточних версій статей. Її дипломний проєкт на цю тему – «Вандалізм чи маніпуляція знаннями? Виявлення наративів у редагуваннях Wikipedia» – визнано одним із найкращих проєктів випускників УКУ 2025 року. Він базується на ML-моделі (machine learning – машинне навчання).

За словами Вікторії, модель поки що працює з енциклопедичними текстами, але її підхід має потенціал для подальшого застосування – наприклад, у телеграм-каналах чи новинних стрічках, де пропаганда часто має виглядає просто «альтернативної думки». Інакше кажучи, основне завдання розробки – навчити ШІ бачити там, де людина не помічає нічого підозрілого.

Вікторія Маковська: «Навіть з тим, як модератори Вікіпедії намагаються дотримуватися нейтральності, автоматизовані системи можуть допомогти людям робити це швидше та ефективніше. Найменше, що ми можемо зробити, – це знайти докази просочування російської пропаганди у Вікіпедію, показати, яку форму ці наративи мають, а найкраще – створити систему, яка зможе такі кейси визначати».

У цьому контексті дуже важливим є той факт, що Вікіпедію часто використовують як джерело даних для тренування великих мовних моделей. Тому в разі потрапляння туди викривленої інформації вона й надалі може просочуватися навіть у чат-боти, створені на основі цих моделей. Існують дослідження, які свідчать, що це вже відбувається. Такий підхід уже має назву LLM grooming, і російська пропаганда активно використовує цей інструмент проти України.

Тому метою проєкту було створити систему, яка зможе аналізувати також дублікати Wikipedia (зокрема, Ru Wikipedia Fork) і виявляти в них ознаки російської пропаганди.

Абетка

LLM grooming – метод прихованого впровадження фальшивих даних у навчання мовних моделей.

Ru Wikipedia Fork – дублікат Вікіпедії, який був створений на початку війни, щоб російська держава мала місце для публікації викривленої інформацію на свою користь.

Як навчали модель

Модель донавчали на власному датасеті (структурованому наборі даних), що містив приклади пропагандистських і нейтральних текстів із Вікіпелії. Вікторія створювала віртуальне середовище, де запускалися скрипти для аналізу та навчання. Система не «шукає» фейки самостійно в енциклопедії. Вона працює за іншим принципом: на вхід подається текстова ревізія (revision), тобто конкретна зміна, яку хтось хоче внести до статті у Вікіпедії; модель аналізує цю зміну як фрагмент тексту й видає оціночний бал (score) від 0 до 1 – наскільки ймовірно, що ця правка є деструктивною.

Складові та технологічний стек проєкту

(інформація для фахівців)

Складові: статистичний аналіз датасетів (EDA); fine-tuning BERT-based моделей; написання скриптів для аналізу результатів.

Інструменти: Jupyter Notebook (написання та тестування коду); MinIO bucket (сховище даних); BERT base uncased (базова модель для fine-tuning); AI/ML платформа De Novo з GPU (ключове середовищем для тренування моделі).

Оцінити ефективність штучного інтелекту в таких складних темах, як виявлення пропаганди, – непросто. У разі проєкту Вікторії Маковської традиційна метрика «точність» (accuracy) не є релевантною, адже йдеться не про класичну класифікацію, а про складніші нюанси текстових маніпуляцій. 

Для аналізу вона зібрала всі зміни в українській і російській Вікіпедії за 2022–2023 роки на основі попередньо визначеного списку статей. До вибірки увійшли як правки, які були погоджені модераторами, так і так званий вандалізм – редагування, що порушували правила платформи й були згодом скасовані.

Основну увагу було зосереджено на відхилених змінах, адже саме вони найчастіше містили маніпулятивні або шкідливі елементи. Таких редагувань було набагато менше, ніж звичайних, і це створило нерівномірний набір даних. У цій ситуації штучному інтелекту складніше навчитися помічати рідкісні випадки, бо їх просто недостатньо для повноцінного навчання. Щоб зменшити цей ризик, дослідниця застосувала техніки балансування й обрала альтернативні метрики, які дозволяють адекватно оцінити роботу моделі навіть у таких умовах.

Також у дослідженні використовувався згаданий дзеркальний варіант російської Вікіпедії – RuWiki Fork. Що дало змогу бачити редагування, які були тільки там. Наприклад, якщо у статті про Маріуполь у RuWiki з’являвся текст, який виправдовує окупацію, а в основній Вікіпедії такого фрагмента не було – це сигнал, що відбулася підозріла правка. Саме подібні випадки стали основою для тренування моделі на виявлення потенційно шкідливих меседжів.

За словами Вікторії, у результаті розробка була адаптована для виявлення пропагандистських формулювань, які вважаються підвидом вандалізму у Wikipedia: спотворення фактів, ідеологічно забарвлена лексика та інші мовні індикатори впливу. Модель демонструє стійку здатність виявляти інформаційні викривлення, хоча повністю покладатися на неї без людського втручання поки що не можна.

Які викривлення виявляє модель

Щоб оцінити, як саме модель реагує на пропаганду, частину результатів було перевірено вручну. Ось деякі типові приклади фрагментів, які штучний інтелект маркував як потенційно маніпулятивні:

Пропагандистська цитата (обрана моделлю*) Суть викривлення (авторська інтерпретація дослідниці)
«Харцизьк […] місто, що любить росію» Додає емоційного прокремлівського забарвлення, яке виходить за межі нейтрального стилю енциклопедії
«Частина росії після загальнонаціонального референдуму» Посилається на псевдореферендум, створюючи ілюзію легітимності анексії
«З 1 березня 2022 року перебуває під контролем російської федерації» Подає окупацію як факт державного управління, оминаючи сам факт збройного захоплення

*Фрагменти редагувань, які модель визначила як імовірно маніпулятивні з вірогідністю понад 50%.

Тут важливо зазначити, що нейронні мережі функціонують як «чорна скринька» – неможливо точно пояснити, чому саме певний фрагмент був класифікований як маніпулятивний. Хоча існують методики часткової інтерпретації. У цьому дослідженні пояснення викривлень базується на подальшому ручному аналізі дослідниками.

Чи може система автоматично аналізувати всю Wikipedia?

Зараз – ні. Цей проєкт мав дослідницький характер, тому не передбачав створення повноцінного користувацького інтерфейсу чи продукту. Його мета – не автоматизований моніторинг Wikipedia в реальному часі, а доказова демонстрація того, що пропагандистські наративи можуть бути виявлені за допомогою машинного навчання. Поки йдеться про прототип або proof of concept – наукову апробацію підходу, а не готове рішення для широкого застосування. 

На практиці система не «виявляє» фрагменти тексту, а оцінює цілісні редагування (revision), які були внесені до статті в один момент. Кожне таке редагування модель маркує як потенційно маніпулятивне або без ознак проблем. Вхідні дані – це великі масиви редагувань Wikipedia за певний період, які модель аналізує, не маючи попереднього знайомства з ними. Такий підхід дозволяє протестувати життєздатність концепції в умовах, наближених до реальних.

«Модель працює як допоміжний інструмент для модераторів. Вона не замінює людину, а покликана полегшити їхню роботу, відфільтровуючи найбільш підозрілі зміни. Ця концепція відома як Human In the Loop: автоматизація допомагає приймати рішення, але фінальне слово залишається за експертами. Зараз у нас немає окремої програми з графічним інтерфейсом – лише скрипти і модель, які працюють із великими масивами даних. Проте в майбутньому планується створити зручний інструмент для модераторів, де вони бачитимуть виділені системою підозрілі редагування, щоб оперативно їх перевіряти», – зазначає дослідниця.

Попри те що цей проєкт дослідницького характеру, його результати мають реальне прикладне значення. Сьогодні у Wikipedia вже працює система LiftWing, яка допомагає адміністраторам виявляти деструктивні редагування – зокрема, очевидний вандалізм.

Втім ця система не здатна виявляти маніпуляції, приховані в нейтральній, на перший погляд, лексиці. Відсутність емоційного навантаження в текстах Вікіпедії, на відміну від більш емоційних постів у соцмережах, робить завдання виявлення маніпуляцій складнішим через нейтральність подачі інформації. 

На думку Вікторії, найкращим сценарієм було б впровадження подібного функціоналу до LiftWing. Це дозволило б масштабувати захист відкритого джерела знань від інформаційних маніпуляцій. Саме в цьому й полягає потенціал моделі – у доповненні до наявних інструментів, які сьогодні не «бачать» подібні впливи.

Ба більше, модель уже була протестована на текстах із телеграм-каналів – як україномовних, так і російськомовних, із пропагандистським і нейтральним контентом. Попередні результати показали, що система може коректно розпізнавати мовні ознаки дезінформації та вийти за межі лише енциклопедичних матеріалів.

Це відкриває перспективи для подальшого розвитку: у наступній фазі дослідження планується розширення сфери застосування моделі до моніторингу соціальних мереж, новинних джерел і месенджерів, де інформаційні викривлення є масовими та системними.

Поділитися
Поділитися сюжетом
Джерело матеріала
Что в сексе больше нравится мужчинам: честно, без мифов и стереотипов
Comments UA
2025-07-17T20:39:30Z
Почему нельзя хранить яйца в дверце холодильника: ключевые причины, о которых нужно знать
TSN
2025-07-28T12:21:56Z
Въезд в США обрастает налогом в $250: как новый сбор усложнит въезд иностранцам
UAToday
2025-07-22T16:06:01Z
Гороскоп на 27 июля 2025 года по картам Таро для всех знаков зодиака
UAToday
2025-07-26T16:51:34Z
Красивая природа, большой пирс и беседка посреди воды: где находится озеро "Грушевское", как туда попасть
Telegraf
2025-07-30T17:42:38Z
Закройте в банки зеленые помидоры: рецепт салата, который съедается до последней ложки
Telegraf
2025-07-30T15:18:56Z
В Мексике нашли потерянный город майя - легендарную "Страну белых ягуаров"
Апостроф
2025-07-28T12:33:19Z
10 вещей, которые никогда не понадобятся в поездках: советы, которые помогут собрать чемодан
Знай
2025-07-26T15:21:26Z
С хрустящей корочкой и мягкая внутри: хитрость кулинаров, которая поможет идеально пожарить картошку
Gazeta UA
2025-07-20T09:30:22Z
Родился в Донецке, но стал путинистом: умер известный режиссер, снявший фильм "Мастер и Маргарита"
Telegraf
2025-07-17T10:18:58Z
Лорак в том числе: из азербайджанского фестиваля выгнали российских артистов
GlavRed
2025-07-17T10:21:54Z
Даша Ульянова в крошечном бикини устроила соблазнительную фотосессию в бассейне
Gazeta UA
2025-07-28T11:48:39Z
У 56-летней Дженнифер Лопес на сцене упала юбка: зрители начали свистеть
Фокус
2025-07-28T09:45:58Z
Сеансы у психотерапевта и новый герой: чем удивит "Зверополис 2"
Фокус
2025-07-30T16:06:52Z
Фирменный жест, любимые хиты и море слез: как фанаты прощались с Оззи Осборном
Апостроф
2025-07-30T15:45:39Z
Нельзя: Тодоренко снова не смотрела за детьми и нарвалась на жесткий отказ в РФ
GlavRed
2025-07-17T14:27:51Z
Брэдли Купер готовится к предложению младшей на 20 лет всемирно известной модели: что известно - СМИ
TSN
2025-07-28T16:06:38Z
Анджелина Джоли после громкого развода закрутила роман с бывшим любовником: кто он — СМИ
TSN
2025-07-26T15:18:52Z
Камни в желчном могут привести к смерти: ТОП опасных состояний
Comments UA
2025-07-30T15:24:40Z
Как вода с медом с утра повлияет на здоровье: вы удивитесь
TSN
2025-07-20T09:09:20Z
Лишь два стакана в день этого сока нормализует высокое артериальное давление
Comments UA
2025-07-23T17:06:12Z
Названы неожиданные свойства винограда, о которых никто не знал
TSN
2025-07-28T12:21:56Z
Почему стоит выпить стакан воды перед сном: две веские причины, которые спасут вам жизнь
Знай
2025-07-30T17:51:01Z
Чтобы похудеть и чувствовать себя лучше: чем можно заменить хлеб в рационе — четыре альтернативы
TSN
2025-07-30T16:12:08Z
Как распознать «тихий» инфаркт
UAToday
2025-07-26T16:51:32Z
Как заставить помидоры покраснеть: действенные способы
Gazeta UA
2025-07-21T15:33:32Z
Названо белье, которое "убивает" мужское здоровье
Comments UA
2025-07-28T10:45:33Z
Даже не убегал: новые подробности двойного расстрела на черниговском полигоне
TSN
2025-07-17T15:36:58Z
В Украине продолжают исчезать дети: что произошло на Житомирщине
Comments UA
2025-07-16T19:21:42Z
Полиция нашла женщину, которая в метро Киева кричала пророссийские лозунги
Корреспондент
2025-07-19T11:54:06Z
Пограничники задержали 10 мужчин, которые платили криптовалютой за побег в Молдову
Новости Украины
2025-07-17T13:09:34Z
Землетрясение на Камчатке продолжалось всю ночь: зафиксировано почти 200 толчков
Telegraf
2025-07-30T18:03:38Z
Восемь толчков за час: землетрясение на Камчатке продолжается, атомные подлодки РФ в зоне риска
Фокус
2025-07-30T18:00:11Z
Россияне сообщают о взрывах в Подмосковье
Корреспондент
2025-07-18T03:45:47Z
Российский FPV-дрон атаковал автомобиль главного раввина Херсона
ZN UA
2025-07-17T22:39:39Z
Под Москвой прогремели взрывы - аэропорты РФ остановили рейсы
Gazeta UA
2025-07-17T04:39:15Z
Хоронили в закрытом гробу и под песни. Стефанчук, Притула и другие посетили прощание с нардепом Рущишиным
Telegraf
2025-07-28T12:15:55Z
Россия официально закрывает границы с Украиной: что это значит
Comments UA
2025-07-28T22:21:33Z
Публичная пощечина Макрону и другие выходки: СМИ выяснили, что взбесило первую леди Франции
Telegraf
2025-07-17T14:51:07Z
Президент Турции намекнул на близкое завершение войны в Украине
TSN
2025-07-28T19:40:26Z
Новый Кабмин уже "пробивает дно": какое решение правительства раскритиковали в Раде
Comments UA
2025-07-30T18:03:24Z
В Кремле отреагировали на новый дедлайн Трампа для Путина
Comments UA
2025-07-30T17:54:36Z
Путин может приказать взорвать ЗАЭС: на Западе предупредили об опасном сценарии
Comments UA
2025-07-28T12:12:35Z
Беда со здоровьем или гамаши? Толстые щиколотки Трампа обеспокоили людей
Telegraf
2025-07-28T11:30:52Z
Кремль выдвинул условие для встречи Путин-Трамп
Корреспондент
2025-07-28T13:18:07Z
Это единственный мост в Украине, который поворачивается: где он находится и как называется
Telegraf
2025-07-16T19:07:22Z
Индексация будет одинаковой для всех, независимо от профессии, - Екатерина Котенкова
Знай
2025-07-17T02:18:54Z
Польша требует от МОН переписать учебники истории Украины: что произошло
Фокус
2025-07-17T14:30:53Z
Украинских школьников за границей ждет дискриминация: учителя протестуют против новых правил МОН
Знай
2025-07-20T09:21:24Z
Россияне начали массированную атаку на Украину: к чему готовиться
Comments UA
2025-07-30T18:18:12Z
Военнообязанным будут присваивать звание солдата запаса одновременно с принятием на военный учет — Минобороны
Апостроф
2025-07-30T18:15:47Z
За чем нельзя наблюдать 17 июля и что нужно отдать сегодня: приметы и запреты на Марины
Знай
2025-07-17T02:03:23Z
Украина сделала беспрецедентное предложение иностранным оборонным компаниям: о чем идет речь
Comments UA
2025-07-17T22:42:52Z
В ТЦК Полтавщины заявили о побеге мобилизованных
Корреспондент
2025-07-26T13:45:23Z
Двух подростков-партизан посмертно наградили
Корреспондент
2025-07-19T14:21:35Z
Покровское направление снова под массированными штурмами россиян
Новости Украины
2025-07-17T14:39:03Z
За 1,4 тыс. долларов помогал уклонистам: ГБР задержало в Харькове чиновника ГСЧС
Апостроф
2025-07-28T17:04:00Z
ЦПД опроверг фейк РФ о "военнослужащем ВСУ, расстелявшем командира"
Корреспондент
2025-07-28T15:15:11Z
Удар по пригороду Харькова: количество пострадавших увеличилось
Корреспондент
2025-07-30T18:21:56Z
ЄС дозволив транзит казахстанського вугілля через російські порти
AgroNews
2025-07-30T18:18:29Z
Николаев на двое суток может остаться без воды
Новости Украины
2025-07-28T13:48:33Z
Партизаны взорвали важный железнодорожный маршрут оккупантов под Тулой
Корреспондент
2025-07-20T09:39:39Z
Россияне убили пятерых жителей Константиновки
Корреспондент
2025-07-19T06:33:37Z
Почему вода в океане солёная, а в озёрах и реках - нет: ответ вас может удивить
UAToday
2025-07-26T16:51:54Z
Таинственный межзвездный объект несется сквозь Солнечную систему — он больше Эвереста
TSN
2025-07-28T13:48:51Z
Землю снова атаковала магнитная буря красного уровня: сколько будет длиться шторм
Апостроф
2025-07-17T15:51:55Z
Новый рекорд производительности солнечных панелей Японии вызывал странный эффект: что случилось
Фокус
2025-07-17T15:51:42Z
Инсайдер поделился фото всей линейки iPhone 17 с новыми цветами
Корреспондент
2025-07-30T17:57:46Z
Apple случайно прорекламировала Samsung на официальной странице в Китае
Корреспондент
2025-07-30T17:33:33Z
Австралийская орбитальная ракета взорвалась через 14 секунд после старта
Корреспондент
2025-07-30T17:33:14Z
Ціни на арматуру в липні коливаються під тиском попиту й локальних чинників
AgroNews
2025-07-30T17:15:12Z
В сети показали все цвета iPhone 17
Gazeta UA
2025-07-30T16:46:25Z
В первом полугодии ІТ-ФЛП массово закрывались, но не все так плохо
Корреспондент
2025-07-29T20:24:50Z
Линии электропередач и объекты газотранспортной инфраструктуры будут восстанавливать быстрее
Хвиля
2025-07-29T20:12:43Z
Китайскому Temu грозит штраф от ЕС за продажу "незаконных товаров"
Европейская правда
2025-07-28T13:58:07Z
"Успешно релоцировано в Германию": появились кадры взлета самолета, который заметили над Киевом
Фокус
2025-07-16T23:21:01Z
Копейка гривну не бережёт: Украина прощается с 10 копейками, как будут округлять сумму в чеке
Новости Украины
2025-07-30T18:21:10Z
Правительство Германии одобрило бюджет на 2026 год с 8,5 млрд евро для Украины
Европейская правда
2025-07-30T18:13:50Z
Лукашенко распорядился штрафовать магазины за отсутствие картофеля
Корреспондент
2025-07-19T00:24:57Z
Украина с начала года получила 527 млн грн от аренды земель
Корреспондент
2025-07-17T14:18:49Z
Таможенные реестры: в Украине утвердили новые правила
Хвиля
2025-07-17T10:36:51Z
Надя Дорофеева показала фото с Усиком после блестящего боя и поделилась впечатлениями от встречи
TSN
2025-07-20T09:09:19Z
Два рекорда за год: юная львовянка установила новое достижение на Говерле
Фокус
2025-07-27T11:39:51Z
Полюбил вас всех как родных: Лукас Васкес растрогал на церемонии прощания
Корреспондент
2025-07-17T14:30:50Z
Погиб легендарный экстремал. ВИДЕО
Новости Украины
2025-07-17T22:51:29Z
Дальмайер останется навеки погребенной под горными завалами
Корреспондент
2025-07-30T17:57:46Z
У Карпат новая форма на сезон-2025/26
Корреспондент
2025-07-30T17:33:43Z
На этапе Бриллиантовой лиги в Лондоне украинка Левченко не выступит
Корреспондент
2025-07-18T19:54:57Z
Усик сделал символический жест перед реваншем с Дюбуа
Telegraf
2025-07-17T13:27:42Z
Третий в драку не лезь: Перес пожалел собаку, а в итоге лишился наследства
Корреспондент
2025-07-30T17:00:39Z
На разгадку есть15 с. Попробуйте найти в головоломке странное авто
Gazeta UA
2025-07-26T07:36:54Z
За рулём нельзя: популярный напиток может стоить водителям штрафа или лишения прав
Хвиля
2025-07-30T16:42:10Z
Названы крупнейшие региональные рынки автомобилей в Украине
Корреспондент
2025-07-30T08:33:23Z
Ошибка под капотом: эксперты назвали машины, которые водителям лучше обходить стороной
Хвиля
2025-07-30T04:15:55Z
Volkswagen откладывает выход Cupra на рынок США как минимум до 2030 года
Корреспондент
2025-07-29T20:03:09Z
General Motors судят из-за двигателей V8, которые внезапно выходят из строя
Корреспондент
2025-07-29T18:51:59Z
Jeep Avenger достиг 200 тысяч заказов и получил полноприводную версию 4xe
Корреспондент
2025-07-29T17:48:39Z
Керамические тормозные диски: преимущества и недостатки запчастей
Мій Харків
2025-07-28T19:51:44Z
Mitsubishi окончательно уходит из Китая после почти 30 лет работы
Корреспондент
2025-07-28T19:30:53Z