MY.UAСтатьи
Пошук по злитих листуваннях російських чиновників. Базова інструкція
Пошук по злитих листуваннях російських чиновників. Базова інструкція

Пошук по злитих листуваннях російських чиновників. Базова інструкція

Після початку повномасштабного вторгнення Росії в Україну різні хакери почали ламати поштові сервери російських структур і викладати їх вміст у публічний доступ. Як знайти там хоч якусь важливу інформацію? Ми адаптували Aleph — програмне середовище для індексації документів — і в експериментальному режимі завантажили туди майже два десятки таких “зливів” російських компаній і держструктур. У цьому тексті розповідаємо, як працювати в цій системі. Лінк на сам інструмент — у кінці статті.

Навіщо щось шукати в чужому листуванні?

У цифровому світі немає секретів. Більшість користувачів не захищають свої поштові скриньки достатньо, щоб вони не стали здобиччю хакерських угруповань. Водночас листування може містити багато важливих даних про особисте життя, комерційні проєкти, ухилення від сплати податків, тіньові схеми, дані паспортів, перельотів, реальні видатки на готелі, розваги, контроль над бізнесом, який публічно не проявляється. Хакери періодично отримують доступ до такого листування.

Втручання в чуже листування є протизаконним. Проте якщо інформація вже потрапила у відкритий доступ, а також становить суспільний інтерес, навичка обробки таких даних може бути корисною для журналістів та активістів.

Стартовий інтерфейс програмної оболонки Aleph

Хакери періодично зливають у відкритий чи напіввідкритий доступ бази даних листів зі зламаних поштових скриньок і серверів політичних діячів, компаній, державних організацій. Але ці дані часто не можуть поміститися на комп’ютері звичайного користувача, а також легко здатні зникнути з мережі. До того ж вручну працювати з тисячами файлів майже неможливо.

Один зі способів полегшити аналіз “зливів” — використовувати програмне середовище Aleph, яке розробила команда Проєкту з досліджень корупції та організованої злочинності (Organised Crime and Corruption Reporting Project, OCCRP). Воно зберігає всю потрібну інформацію, розпізнає важливі сутності в тексті та дає змогу швидко шукати інформацію серед різних файлів і масивів даних. Програму розроблено за принципом Follow the money, щоб допомагати журналістам-розслідувачам шукати збіги в даних реєстрів бізнесу, нерухомості, "зливах" фінансових документів тощо. "Алеф" уміє розпізнавати пов'язані з фінансовими оборудками сутності: номери рахунків, телефони, імейли, назви компаній тощо. Ми вирішили, що великі датасети з поштових серверів теж можна так індексувати.

Частину "зливів" медіа вже опрацьовували, частина лише з'являлася одним рядком в інформаційних повідомленнях. Тому, на нашу думку, спільноті дослідників і розслідувачів може бути цікаво опрацьовувати ці документи в такому форматі.

Датасети, до яких ми надаємо доступ через Aleph

  • Neocom Geoservice — листи російської інженерної компанії, що займається бурінням;
  • Transneft / Транснефть — листування R&D департаменту російської державної нафтовидобувної компанії;
  • MashOil — листування російської компанії, яка займається створенням та підтримкою обладнання для буріння;
  • Aerogas — листування нафтогазовидобувної компанії;
  • Gazregion — листування компанії, яка займається нафто- та газопроводами в РФ;
  • VGTRK — майже 1 млн листів російського державного мовника ВГТРК;
  • Ministry of Culture of the Russian Federation / Минкультуры России — 230,000 електронних листів російського Мінкультури;
  • Rosatom / Росатом — 15 Гб файлів, що належать компанії Росатом;
  • Diaconia — майже 60 тис. листів департаменту доброчинності Російської православної церкви, який відповідає, серед іншого, за роботу з біженцями (матеріал Слідства);
  • German Chambers of Commerce — документи Александра Маркуса та його дружини, громадян Росії та агентів ФСБ, щодо співпраці бізнесу в Росії та Німеччині;
  • Khava-d — листування Дмитра Хавченка, бойвика “ДНР” з позивним “Морячок”, який, імовірно, мав відношення до криптобізнесу та відмивання через нього грошей спецслужбами РФ (частина цієї історії, наприклад, тут);
  • NZF_DNR_feb2017.tgz — файли щодо зв’язків “ДНР”;
  • ROSOBORONEXPORT — документи провідного постачальника зброї Росії (обговорювали в росЗМІ);
  • Sberbank of Russia — файли бюро перекладів російського Сбєрбанку;
  • Mosekspertiza — понад 150 тис. листів та 8200 файлів державної компанії, яка надає консультаційні та оціночні послуги бізнесу;
  • Continent Express — файли та бази даних російської туристичної компанії, яка обслуговує бізнес і владу в Росії;
  • Worldwide Invest — листування інвестиційної компанії;
  • Sawatzky — листування компанії, яка займається управління нерухомістю в Росії;
  • Accent Capital — листування компанії, яка займається інвестиціями в нерухомість у Росії;
  • Tendertech — листи компанії, що займається обробкою фінансових документів у Росії;
  • Capital Legal Services — файли російської юридичної компанії;
  • Marathon Group — листування компанії Александра Вінокурова, зятя міністра закордонних справ Росії Лаврова;
  • Gazprom Linde Engineering (в роботі) — листування спільного російсько-німецького підприємства, що займається інженерними рішеннями для нафтогазової промисловості;
  • Technotec (в роботі) — листування компанії, що надає технічні послуги Роснєфті і Газпромнєфті в Росії.

Що потрібно знати про зливи, перш ніж починати з ними працювати?

По-перше, отримати одразу сенсаційний набір даних, якщо не йдеться про скриньку топового посадовця або особи / групи осіб, які дійсно ухвалюють рішення, буде великою удачею. Найімовірніше, в “брудному” дампі буде багато рекламного спаму, рахунків за комірне, а якщо йдеться про груповий злив великої компанії, то безкінечні “перенаправлення”, привітання, моніторинги, огляди тощо. Звісно, і вони можуть бути предметом дослідження, але слід бути готовим шукати голку в ста копицях сіна. Краще приблизно окреслити для себе перелік ключових слів / сутностей, які плануєте шукати, від яких можна відштовхуватися. Побудувати гіпотези, нехай більшість з них зрештою й виявляться хибними. Ось приклад, якими можуть бути "ключові слова" для пошуку історій:

— Україна / український, ДНР / ЛНР / Крим, Київ (і всі назви українських обласних центрів у варіаціях), прізвища ключових осіб, урядовців, депутатів, високопоставлених колаборантів тощо.

Слід бути готовим шукати голку в ста копицях сіна

По-друге, навіть якщо людина / організація має необережність обговорювати через електронну пошту свої шпигунські замисли, кримінальні плани або фінансові оборудки, обман клієнтів чи підрядників тощо, то далеко не факт, що у злив потрапила саме основна скринька, з якої ведеться таке обговорення. Єдиного правила немає: “дєлішки” можуть обговорювати і з приватної скриньки, щоб не потрапити під моніторинг службою безпеки корпоративного емейла. Або ж навпаки: щоб “тємка” не вийшла за межі організації, її будуть “перетирати” в рамках корпоративних серверів. Яка з цих скриньок — основна чи додаткова — потрапила в “дамп” — це лотерея. До цього самого пункту варто додати, що навіть у разі такого головотяпства, предмет “схеми” може бути зашифрованим. Наприклад, “відвантаж мені 5 кг” може бути й реальними 5 кг чогось, і 5 тис. / млн у грошах.

По-третє, у вкладеннях до листів можуть бути й корисні документи (презентації, квитанції, квитки тощо), і спам або віруси.

Найризикованіші pdf, doc та excel файли. Відтак відкривати вкладення з чужих скриньок слід дуже обережно. А краще не відкривати взагалі — Aleph дає змогу читати вміст файлів, не відкриваючи їх у себе на комп’ютері. Це не дає 100% гарантій безпеки, але прибирає більшу частину потенційних напрямів для кібератаки.

По-четверте, слід зважати, що скачане листування стосуватиметься певного часового періоду і не обов’язково є найсвіжішим. І, звісно, не оновлюється, якщо лише хакери не “прикрутили” на пошту жертви автоматичне пересилання на зовнішній сервер. Це означає, що історія, яку ви знайдете в листуванні, може починатися з середини або закінчуватися “на півслові”.

Як сортувати листи незнайомців?

Одним зі способів сортування листів зі зливів є використання програмного середовища Aleph. Розслідувачі OCCRP працюють у ньому з реєстрами та зливами документів типу Panama Papers, відшукуючи зв’язки між десятками мільйонів фігурантів по всьому світу. Тож ми припустили, що програма зможе допомогти нам у сортуванні такого неорганізованого масиву даних, як злите листування низки російських людей і компаній.

Ось що з цього вийшло

Ми підняли власну версію “Алеф” на своєму сервері й у експериментальному режимі залили туди зливи пошт російських чиновників і працівників бізнесу. Частина з них уже отримала деталізовані розбори в медіа, а частину тільки згадували як факт зламу пошти певної організації.

Серед цікавих датасетів — листування співробітників ВГТРК — головної пропагандистської телерадіокомпанії Росії, кількох інвестиційних і юридичних фірм, компаній з управління нерухомістю, серед яких Марафон Груп, компанії зятя міністра закордонних справ Росії Сергія Лаврова Олександра Вінокурова. Також у наш експеримент потрапили деякі листування синодального відділу з благодійності Російської православної церкви, Мінкультури Росії тощо.

Інтерфейс сторінки з переліком датасетів

На цьому етапі ми не вдаємося до пошуку конкретних історій, а показуємо, що саме “вміє” програма.

Її головна перевага — самостійне “визначення сутностей”, які програма знаходить у межах великого масиву документів (зокрема сканів документів) і структурує. Серед типів даних, які програма відбирає для аналізу:

  • електронні листи
  • документи (файли doc)
  • презентації
  • зображення
  • таблиці
  • люди вебсторінки
  • відеофайли
  • аудіофайли
  • текстові файли
  • заплановані події (зум-коли, події в гугл-календарі) тощо

Сутності, які “Алеф” “розпізнає” автоматично:

  • номери телефонів
  • імена, прізвища
  • банківські рахунки
  • адреси електронної пошти
  • поштові адреси

Результат "первісного переділу" — який вигляд має датасет з листами на дашборді після того, як його "залили" в "Алеф"

Такі дані можна отримати вже при першому аналізі масиву програмою. Ба більше, “Алеф” сортує згадки про певні сутності й дає змогу зрозуміти, як часто використовували певну електронну пошту, номер телефону тощо. Звісно, частота згадок не обов’язково означатиме важливість певного персонажа. Приміром, номер телефона офісу може просто бути записаний в автопідписі в усіх його співробітників, або ж через електронну пошту секретаря проходить вся вхідна документація. Так само через поштові скриньки IT-департаменту, найімовірніше, проходитиме велика кількість сервісних запитів.

Утім, навіть перший “переділ” даних може дати певні зачіпки. Приміром, у цьому “дампі” листів інвесткомпанії “Акцент Капітал” у переліку найчастіше згадуваних номерів телефонів у листуванні впадають в око два кіпрські номери. Можна припустити, що це вказує на відносно інтенсивне листування з певним кіпрським клієнтом або підрядником (подальший аналіз це підтверджує). У цьому випадку — нічого надзвичайного для інвестбізнесу. Проте інші, більш екзотичні телефонні коди, могли б привести до цікавішої історії.

Також перший переділ показує згадані в листуванні електронні адреси та імена, які найінтенсивніше використовують.

За кожною з них “ховається” весь перелік згадок цієї сутності в нашому датасеті. Водночас важливо, що “Алеф” досить чутливий до варіацій імен і прізвищ. Тому “Владимир Зеленский”, “Вова Зеленский”, “В. Зеленский” та “Volodymyr Zelenskiy” він визначатиме як різні сутності. На це слід зважати під час здійснення базового пошуку, особливо якщо йдеться про іноземні прізвища та імена, написання яких кирилицею (або навпаки — написання латинкою російських та українських імен) не є очевидним і може бути зафіксоване в різних варіаціях.

Базовий пошук

Базовий пошук по базі даних слід здійснювати через пошуковий рядок. Якщо на початковому етапі немає розуміння, яку саме інформацію ви шукаєте, можна спробувати попрацювати з найпростішими гіпотезами і вводити пов’язані з ними слова. Проте слід пам’ятати, що за пошуковим запитом “Украина” система видасть не лише згадки про Україну в листуваннях, а й бронювання в готелях з такою назвою. А прізвище “Зеленский” може стосуватися не лише українського президента, а й інших людей, які ніяк його не стосуються. Тому що чіткішим буде запит — то краще.

Налаштування розширеного пошуку дають змогу шукати частину слова, виключати певні варіанти результатів з пошукового завдання, шукати зі зміною кількох літер (що корисно під час пошуку чоловіків і жінок з однаковим прізвищем, в якому змінюються 2-3 літери в закінченні).

Для прикладу ми здійснимо пошук по імені Олександра Вінокурова, власника “Марафон Капіталу”, зятя міністра закордонних справ Росії Сергія Лаврова. Результат дає можливість дізнатися кілька варіантів його електронної пошти (корпоративні і особисті), а також подивитися на листи, де він є відправником чи адресатом. Також знаходимо кілька згадок прізвища й імені в пошті когось із асистентів, який приймає моніторингові повідомлення від пошукової системи про згадку шефа в медіа.

Ще один приклад. За ключовим словом "ДНР" у датасеті "Діаконія" можна знайти згадки про документи щодо розподілу біженців у регіонах Росії (цю діяльність РПЦ координувала з МНС Росії, про це в квітні на основі аналізу цього масиву даних писали журналісти "Слідства").

Порівняння з іншими датасетами

В “Алефі” передбачено режим “розслідувань”. Спрощено йдеться про порівняння кількох датасетів і пошуку збігів між ними. Водночас це не обов’язково мають бути інші “дампи” пошти.

Як найпростіший експеримент ми залили в систему нашу базу псевдосоціологів, перелік підсанкційних осіб та компаній, а також тих, санкції проти яких тільки пропонуєть запровадити, — з сайту НАЗК. Одним з прикладів результативних збігів є перелік підсанкційних журналістів ВГТРК, частину листування яких можна переглянути у відповідному “дампі”.

Пошук збігів: підсанкційні журналісти ВГТРК "знайшлися" у "зливі" пошти з сервера компанії

Додаткові можливості

Система дає змогу встановлювати сповіщення на випадок, якщо в базу додано нові датасети і там з’являється згадка про необхідне прізвище чи іншу сутність (адресу, номер телефона тощо). До того ж вбудований графічний редактор дає змогу самостійно візуалізувати зв’язки між фігурантами датасетів. А також користувачі у яких є навички програмування можуть вивантажити мережеву інформацію з Алефа та працювати з нею у інших, зручних середовищах. Детальніше про це читайте тут.

Заходьте на Алеф і починайте працювати тут

Ми хочемо надати доступ до "зливів" у першу чергу українським дослідникам та журналістам. Тому просимо вас заповнити коротку форму для верифікації. Ми надамо вам доступ до зливів за тією електронною поштою яку ви вкажете.

Проєкт здійснено за фінансової підтримки Міжнародного фонду «Відродження»

журналістика даних зламані пошти розслідування

Поделиться
Поделиться сюжетом
Источник материала
Каньє Весту відмовили у в'їзді до Австралії через пісню про Гітлера
Ukraine Art News
2025-07-03T09:00:49Z
Суд виправдав Шона Diddy Комбза у справі про торгівлю людьми з метою сексуальної експлуатації
Ukraine Art News
2025-07-03T08:31:10Z
10 найкращих зіркових образів Вімблдону за всю історію турніру
Elle
2025-07-03T07:21:44Z
Танцівник із кліпу Diddy звинуватив репера в зґвалтуванні й вимагає $10 млн
Ukraine Art News
2025-07-02T17:42:42Z
Ексклюзив ELLE: стилістка Маргарита Шекель про створення кліпу для Sevdaliza, локальні тренди й трансформацію моди
Elle
2025-06-30T14:12:40Z
Слухаємо Virgin — перший альбом співачки Lorde за чотири роки
Elle
2025-06-30T08:45:38Z
Образ дня: вагітна Ріанна показує, як стилізувати дві гучні тенденції цього літа
Elle
2025-06-30T08:00:36Z
«Міф» оперної сцени: як всесвітньо відомий співак Василь Сліпак залишив Париж заради захисту України
Photo Lviv
2025-06-30T05:00:31Z
На війні загинув колишній звукорежисер «Суспільне Чернігів» Дмитро Горнов
Ukraine Art News
2025-06-30T01:36:37Z
«Українську книжкову поличку» відкрили у Парагваї
Ukraine Art News
2025-07-03T09:21:41Z
На літній школі у Львові навчатимуть реставрувати настінні розписи доби сецесії
Хмарочос
2025-07-03T08:22:04Z
Ода українським брендам: Синтія Ніксон вкотре продемонструвала total образ від Bevza
Elle
2025-07-03T08:06:43Z
Українська дизайнерка збудувала дім у каліфорнійській пустелі. Її надихнув соціалістичний бруталізм
Хмарочос
2025-07-03T05:58:01Z
Ікона «Христос Вседержитель»: Від контрабанди до музейної реліквії
Photo Lviv
2025-07-03T05:06:29Z
Франко-українська торгова палата представляє 10 фіналісток конкурсу «Створено жінками — 2025»
Elle
2025-07-02T15:27:48Z
На станції метро "Золоті ворота" в Києві відкрили виставку про археологічну культурну спадщину
Ukraine Art News
2025-07-02T14:45:47Z
Вірш, що злякав імперію: як «Любіть Україну» став символом незламності
Ukraine Art News
2025-07-02T13:00:45Z
У Києві відкрили виставку картин Артура Котика, написаних під час війни
Ukraine Art News
2025-07-02T12:45:45Z
«Людина, що біжить»: український трейлер рімейку фантастики з Ґленом Павеллом і Джошем Броліном
KinoFilms
2025-07-03T10:00:35Z
«Найважливіше — любити те, що ти робиш»: як Том Гіддлстон став успішним в акторстві
Elle
2025-07-03T09:00:48Z
Фільм "Ти — Космос" увійшов до конкурсної програми Міжнародного кінофестивалю у Швейцарії
Ukraine Art News
2025-07-02T22:45:46Z
Третій сезон "Гри в кальмара" побив рекорд Netflix: за три дні він отримав 60,1 млн переглядів
Ukraine Art News
2025-07-02T18:42:47Z
Дженніфер Еністон зіграє головну роль у серіалі на основі бестселера NYT «Я рада, що моя мама померла»
Elle
2025-07-02T16:48:43Z
Дженніфер Еністон зіграє головну роль у серіалі "Я рада, що моя мама померла" за мемуарами Дженнетт Маккерді
Ukraine Art News
2025-07-02T15:45:41Z
Шарліз Терон різко розкритикувала весілля Джеффа Безоса та Лорен Санчес
Elle
2025-07-02T15:15:44Z
Від творців «Зборів ОСББ»: вийшов тизер нової української комедії «Батьківські збори»
KinoFilms
2025-07-02T12:54:25Z
Топ-5 фільмів за участі Брі Ларсон
Ukraine Art News
2025-07-02T11:45:45Z
Travel-щоденник ветеранки Олени Каспрович: подорож до египетського Марса-Аламу разом із трьома дітьми
Elle
2025-07-03T09:42:35Z
Громадський центр від Snøhetta у Швеції ніби виростає зі скелі та лісу
Хмарочос
2025-07-03T08:22:05Z
Польська залізниця запускає прямий потяг до узбережжя Хорватії
Хмарочос
2025-07-01T15:34:00Z
Тиха розкіш Аліканте: повний гід найзатишнішим курортом Іспанії
Elle
2025-07-01T12:15:40Z
ЄС нібито заборонить авіакомпаніям стягувати плату за ручний багаж. Це перемога чи навпаки?
Хмарочос
2025-07-01T11:34:00Z
Львів – місто єретиків, або як міщани конфліктували
Photo Lviv
2025-07-01T05:12:29Z
Дивіться на нову будівлю з «вертикальним лісом» у Нідерландах. У чому плюси таких проєктів?
Хмарочос
2025-06-30T08:57:49Z
Відчути драйв: Марія Себова, Вячеслав Дрофа, Анна Гольцберг, Володимир Ярославський і Христина Остапчук про досвід подорожі з Defender OCTA
Elle
2025-06-27T13:27:46Z
7 років подорожей, що об'єднують: як український бренд створив альтернативу класичному туризму
Elle
2025-06-27T12:33:57Z
Ці балетки — улюблене взуття Ніколь Кідман і Джіджі Хадід на літо-2025
Elle
2025-07-03T09:27:46Z
Через вибухи біля Житомира пошкоджено Кмитівський музей і ще десятки будинків «знищено вщент»
Хмарочос
2025-07-03T09:19:00Z
«Власник житла — власник життя». Чому на ринку оренди дискримінують сім’ї з дітьми та тваринами, ВПО та людей з інвалідністю
Хмарочос
2025-07-03T06:40:06Z
В Одесі відкрили пляж для людей з інвалідністю
Хмарочос
2025-07-03T05:58:02Z
З минулого Знесіння. Закінчення
Photo Lviv
2025-07-03T05:12:23Z
Євген Кравс – кращий спортивний фотокореспондент року
Photo Lviv
2025-07-03T05:00:31Z
6 ефективних технік саморегуляції тіла у спеку
Elle
2025-07-02T18:30:41Z
На Філіппінах та у Грузії з’явилися «Українські книжкові полички»
Ukraine Art News
2025-07-02T16:39:42Z
Могилу цадика Нахмана в Умані визнали пам’яткою національного значення
Ukraine Art News
2025-07-02T16:18:39Z
Оплата домашнього інтернету Sword: найкращі способи для мешканців Києва і передмістя
Хмарочос
2025-07-02T07:03:48Z
Стрімінг на космічному рівні: Netflix у колаборації з NASA показуватиме запуск ракет
Ukraine Art News
2025-07-01T01:00:55Z
Під Меджибізьким замком на Хмельниччині археологи виявили скелет дитини й артефакти XVII-XVIII ст
Ukraine Art News
2025-06-30T17:21:59Z
За два місяці до релізу: у мережу злили фото майбутніх iPhone 17 Pro та iPhone 17 Air
Gloss
2025-06-26T17:30:41Z
Суд у США відхилив позов 13 письменників про порушення авторських прав для навчання ШІ на їхніх книжках
Ukraine Art News
2025-06-26T14:24:42Z
У Франції знайшли залишки давньоримського поселення з унікальною мозаїкою
Ukraine Art News
2025-06-26T14:21:48Z
50% знижки на всі сервіси Bolt. Як отримати?
Хмарочос
2025-06-25T14:07:03Z
Яскравому — бути: тест-драйв міського кросовера Nissan Juke N-Sport
Elle
2025-06-23T17:45:41Z
Данські архітектори представили концепцію LivingPlaces, що змінює традиційні уявлення про житло
Хмарочос
2025-06-19T14:24:50Z
ТОП-5 легких літніх закусок
Elle
2025-06-17T14:30:38Z
«ТопШефи х WINETIME. Готуємо разом»: Влад Кіндер ділиться рецептом тунця татакі
Elle
2025-06-06T12:49:01Z
8 найкращих лимонадів у літню спеку
Krasinfo
2025-06-03T07:09:43Z
Весняне меню: детокс-салат із цибулі-порею з креветками
Elle
2025-05-20T19:09:34Z
«ТопШефи х WINETIME. Готуємо разом»: Анастасія Степанова ділиться рецептом лимонного тарту
Elle
2025-05-14T19:03:31Z
Сирники з лекваром: готуємо українську страву за 20 хвилин
Elle
2025-05-12T11:00:56Z
Сезонний рецепт: найсмачніший кіш зі спаржею
Elle
2025-05-09T18:34:08Z
Ідеальні літні сніданки
Krasinfo
2025-05-07T11:50:46Z
Великоднє меню: дуже смачна домашня куряча ковбаска
Elle
2025-04-18T18:10:02Z