MY.UAСтатьи
Как архивировать материалы из открытых источников
Как архивировать материалы из открытых источников

Как архивировать материалы из открытых источников

Арик Толер
12:00 28.03.2018

Как архивировать материалы из открытых источников

Открытые источники стали базой для множества масштабных расследований. О том, как архивировать материалы из подобных источников, расскажут спецы из #Bellingcat.
Источник

Проводя расследования по открытым источникам, важно задумываться над тем, как архивировать материалы, которые вы изучаете. Например, пользователь может удалить пост в социальной сети уже после публикации вашего расследования, или видео с шокирующими кадрами (например, военного преступления в Сирии) может быть удалено из-за цензурной политики YouTube.

Существуют две основных причины необходимости архивировать все цифровые свидетельства, применяемые в расследовании: сохранение их на случай удаления из оригинального источника и доказательство аудитории, что материал (если он был удалён) действительно существовал в том виде, в каком вы его представляете. Скриншоты легко подделать, поэтому крайне важно найти способ сохранять материалы так, чтобы показать, что вы не могли изменить их содержание.

Сторонние платформы для архивирования

Для большей части контента, в том числе постов в социальных сетях, новостных статей и других веб-страниц, имеется два сервиса, которые обычно срабатывают: Archive.today и Archive.org. Эти сайты сохраняют веб-страницы на собственных серверах, после чего они становятся доступны по ссылке. Кроме того, оба сайта сохраняют страницы на конкретный момент времени, поэтому можно наблюдать изменения между разными архивациями — например, до и после вырезания информации из статьи. Мы рекомендуем сохранять материалы на обоих сайтах, чтобы максимизировать количество архивируемого контента. Кратко опишем работу обоих сайтов и их эффективность при архивировании страниц различных популярных социальных сетей. В целом Archive.today более приспособлен для сохранения страниц в социальных сетях, так как делает это через специально созданный аккаунт, тогда как archive.org видит только полностью публичные страницы, не требующие аккаунта.

Archive.today

Из двух основных сайтов-архиваторов Archive.is более эффективен при работе с социальными сетями. Однако он действует далеко не так давно, как archive.org. Его следует считать менее стабильным, поскольку он гораздо скромнее по масштабам. Кроме того, этот сайт заблокирован в различных странах, поскольку экстремистский контент иногда распространяется через ссылки на archive.today. Альтернативные ссылки на этот сайт (Archive.is, Archive.li, Archive.ch…) позволяют обойти цензуру некоторых (но не всех) стран, например, России, Китая и Финляндии.

Archive.today сохраняет страницы исключительно по запросам пользователей, а не автоматически, как Archive.org. Чтобы сохранить страницу на этом сайте, просто введите в поле в красном прямоугольнике ссылку на неё.

Вы также можете архивировать страницы, сохранив закладку в вашем браузере, что позволяет сохранять в один клик страницы, на которых вы находитесь. Для этого сохраните новую страницу в ваших закладках (или избранном) со ссылкой:

javascript:void(open(‘https://archive.today/?run=1&url=’+encodeURIComponent(document.location)))

Теперь просто нажмите на вновь созданную закладку, чтобы сохранить любую страницу, открытую у вас в браузере.

Кроме того, можно перетащить кнопку на заглавной странице Archive.today на вашу панель закладок, чтобы не создавать закладку вручную.

Чтобы проверить, сохраняли ли уже какую-либо ссылку, введите её в поле в синем прямоугольнике.

Есть более продвинутые способы поиска сохранённых страниц, если вы не знаете точную ссылку. Например, если вы хотите найти все заархивированные статьи Bellingcat с тегом MENA (Middle East North Africa, Ближний восток и Северная Африка), введите в поиск следующее:

Звёздочка в конце ссылки позволит найти все статьи на сайте Bellingcat, ссылки на которые начинаются с «news/mena». Сюда входят все статьи в разделе «MENA» нашего сайта.

В результатах появятся статьи, вручную сохранённые пользователями, которые ввели ссылку, а также страницы со ссылками на базу данных сохранённых страниц Archive.org. В некоторых случаях можно открыть различные версии одной и той же страницы, если в статью вносились изменения.

Ещё одна полезная функция Archive.today — возможность сохранить целую страницу как изображение, даже если она очень длинная. Однако это не следует использовать как замену ссылке на архив, поскольку скриншоты можно редактировать после сохранения.

Archive.today относительно успешно архивирует страницы в социальных сетях, однако его работа далеко не идеальна. Ниже приведены сохранённые страницы из различных социальных сетей. Как правило, заархивировать страницу социальной сети, защищённую некими настройками приватности, вроде «эту страницу могут видеть только друзья друзей» на Facebook, с помощью сторонних архиваторов вроде Archive.today или Archive.org практически невозможно.

В примерах ниже нажмите на гиперссылку на каждую из социальных сетей, чтобы просмотреть сохранённую страницу на Archive.today.

Facebook

Работает довольно хорошо, за исключением фотографий и видео, встроенных в посты.

Instagram

Не работает.

Twitter

Работает очень хорошо, за исключением встроенного в твиты контента, в частности фотографий, видео и ссылок.

ВКонтакте (ВК)

Работает очень хорошо, за исключением встроенных фотографий и видео.

Одноклассники (ОК)

Работает очень хорошо, за исключением встроенных фотографий и видео.

YouTube

Может сохранять только метаданные и текст, но не сами видео.

Archive.org

«Интернет-Архив», основанный в 1996 году, уже более 20 лет сохраняет веб-страницы и имеет значительный бюджет, что обеспечивает стабильность, на которую нельзя рассчитывать в отношении Archive.today. Хотя у Archive.org есть множество замечательных проектов, в первую очередь нас интересует Internet Archive Wayback Machine (web.archive.org), которая позволяет пользователям архивировать конкретные страницы и просматривать страницы, заархивированные другими пользователями.

Как и в случае с Archive.today, процесс поиска и сохранения веб-страниц очень прост. Введите ссылку в строку поиска вверху страницы, чтобы посмотреть архивные версии. Чтобы сохранить страницу по ссылке, введите её справа внизу.

В то время как Archive.today сохраняет страницы только по запросам пользователей, Archive.org использует как запросы пользователей, так и скрипты для автоматического сохранения страниц. Например, заглавная страница Bellingcat была сфотографирована более 800 раз со дня покупки домена в мае 2014 года. Наверняка лишь небольшая их часть была сохранена по запросам пользователей.

При сохранении обычных веб-страниц и новостных статей Archive.org часто даёт фору Archive.today, поскольку позволяет переходить по клику на другие заархивированные страницы. Например, с помощью Internet Archive Wayback Machine можно перемещаться по значительной части сайта Bellingcat, как будто вы в 2014 году, поскольку все эти страницы были сохранены около 4 лет назад. На Archive.today можно найти гораздо меньше заархивированных страниц.

Archive.org хуже справляется с социальными сетями, чем Archive.today, но всё равно иногда пригождается.

Facebook

Хорошо работает с полностью публичными страницами, но, в отличие от Archive.today, не имеет доступа к страницам, которые требуют аккаунта на ФБ.

Instagram

Не работает.

Twitter

Работает очень хорошо, за исключением встроенного в твиты контента, в частности фотографий, видео и ссылок.

ВКонтакте (ВК)

Хорошо работает с полностью публичными страницами, но, в отличие от Archive.today, не имеет доступа к страницам, которые требуют аккаунта в ВК.

Одноклассники (ОК)

Хорошо работает с полностью публичными страницами, но, в отличие от Archive.today, не имеет доступа к страницам, которые требуют аккаунта на ОК.

YouTube

Не очень хорошо работает на основном сайте Wayback Machine, поскольку он плохо сохраняет даже метаданные и текст из видео.

Однако у Archive.org есть отдельный проект под названием YouTube Crawl, который архивирует видео с YouTube вместе с метаданными. Подробнее об участии в их проекте можно прочитать здесь. Это требует больших усилий, чем простое решение в один клик на web.archive.org и archive.today.

Сохранение фотографий и видео

Из предыдущего раздела вы узнали, что ни Archive.org, ни Archive.today не могут сохранять фотографии и видео с Instagram и YouTube, а также испытывают проблемы при сохранении фотографий с Facebook, ВК и других сайтов. Создание сторонней «нейтральной» платформы для сохранения медиаматериалов с этих сайтов гораздо сложнее. Вместо этого необходимо скачивать материалы отдельно, а затем предоставлять дополнительные материалы (например, скриншоты с метаданными, материалы на сайтах-зеркалах и т.п.), чтобы доказать подлинность скриншотов и видео.

YouTube

Имеется множество сайтов, позволяющих скачивать видео с YouTube, например KeepVid, Y2Mate и другие. Архивировать видео с YouTube совсем не сложно, если у вас есть достаточно места для их сохранения на жёстком диске или в облаке. Не забудьте сделать скриншот метаданных и сохранить страницу на Archive.today, чтобы сохранить название, дату загрузки и описание, даже если само видео не сохранится на странице.

Instagram

К сожалению, архивировать страницы в Instagram очень трудно. Зачастую мы можем разве что надеяться на кросспост на другом сайте (многие сомнительные сайты «заимствуют» контент Instagram и размещают его у себя) или вручную сохранять изображения в полном разрешении.

Чтобы открыть фото в Instagram в полном разрешении, выполните следующую процедуру:

  1. Найдите ссылку на фотографию в Instagram и удалите все данные после её ID. Например, для фотографии со ссылкой instagram.com/p/BfZJzBphUr1/ ID будет BfZJzBphUr1. Если после этого ID есть ещё что-то (such as «taken-by=username»), удалите эту часть.
  2. Введите в конце ссылки «/media/?size=l» (строчная L). Для ссылки instagram.com/p/BfZJzBphUr1/ результат будет instagram.com/p/BfZJzBphUr1/media/?size=l
  3. Теперь откроется фото Instagram в максимально доступном разрешении в формате JPG. В случае упомянутого выше поста это даст такой результат.

Чтобы сохранить видео с Instagram, можно воспользоваться различными сайтами вроде KeepVid, например, Gramblast и DreDown.

Facebook

Скачивать фотографии в высоком разрешении с Facebook значительно проще, чем с Instagram, поскольку эта функция встроена в пользовательский интерфейс сайта. Выберите «Опции», а затем «Сохранить» в меню фотографии, чтобы загрузить её с серверов Facebook. Возможно, изображение будет не того же разрешения, что на фотокамере, но это лучшее, что можно загрузить с самого Facebook.

Сохранять видео с Facebook чуть сложнее, но всё равно сравнительно просто. При просмотре видео нажмите на него правой кнопкой и выберите «показать ссылку». Теперь вы можете копировать эту ссылку и вставить её на сторонний сайт, чтобы скачать видео.

Как и в случае с YouTube и Instagram, имеется несколько сторонних сайтов, которые позволяют загружать видео с серверов Facebook на тот случай, если пользователь, который загрузил материал, удалит его. FBDown.net работает отлично, и на нём мало рекламы и всплывающих окон. Вставив ссылку на видео, которую вы скопировали из источника, вы можете скачать это видео в самом лучшем качестве по ссылке в красном прямоугольнике ниже.

ВК

Сохранять фотографии из ВК в полном разрешении очень просто: нужно выбрать «показать оригинал» в меню фотографии, и она откроется в максимальном доступном разрешении. Даже если пользователь удалит фотографию со своей страницы, ссылка в ВК с изображением в полном разрешении останется навсегда.

Сохранять видео из ВК немного сложнее, чем с YouTube, но это позволяют сделать различные бесплатные (и платные) инструменты. Например, GetVideo.org позволяет скачивать видео, загруженные в ВК, в оригинальном разрешении. Чтобы получить ссылку на видео, нажмите на него правой кнопкой и выберите «Скопировать ссылку на видео».

Следует отметить, что на GetVideo не следует нажимать «Best Quality». Вместо этого выберите самое большое конкретное разрешение (напр. 720p). Учитывайте, что файлы с этого сайта скачиваются достаточно медленно.

ОК

Лучший способ сохранять фотографии в полном или почти полном разрешении — выбрать «на весь экран», а затем сохранить изображение или сделать скриншот.

Для скачивания видео с «Одноклассников» есть меньше сайтов, чем для других социальных сетей, однако они всё же существуют, например, Video-Download.co.

Другие решения по архивации

Зачастую использовать описанные выше способы скачивания веб-страниц или видео невозможно, поскольку они защищены настройками приватности (что ограничивает доступ с таких сайтов, как Archive.today) или используют малоизвестные платформы для проигрывания видео, с которыми не работают такие сайты, как KeepVid. Все решения, приведённые выше в этом руководстве, бесплатные. Однако некоторые другие платные или условно бесплатные сервисы могут облегчить вам жизнь. Мы не станем рекомендовать вам, как тратить деньги, однако исследователи Bellingcat успешно использовали приведённые ниже решения (а одно даже разработали сами).

Некоторые программные решения позволяют загружать видео с большинства сайтов, даже если там не используется YouTube или другие популярные платформы. Video Download Capture от Apowersoft работает, на удивление, хорошо для практически всех встроенных видео, а также (в некоторых случаях) лайвстримов. Однако этот сервис требует оплаты для полноценного использования. Эта программа определяет, что в браузере проигрывается видео, а затем (обычно успешно) загружает его из оригинального источника. Если вы пытаетесь скачать конкретное видео и не можете найти другого решения, возможно, стоит воспользоваться пробным периодом этой программы. Если вы не можете воспользоваться пробным периодом или не хотите покупать эту программу, попросите в Twitter автора этой статьи (@AricToler) помочь скачать конкретное видео.

В случае, если веб-страницы защищены настройками приватности, очень сложно найти решение, способное создать полноценную стороннюю архивную копию сайта. Простое сохранение страниц в формате HTML крайне неудобно, поскольку создаёт на жёстком диске множество подпапок. Альтернативный вариант — сохранить страницу как PDF, либо распечатав её в PDF (Файл -> Печать -> Распечатать в PDF), либо воспользовавшись Adobe Create для сохранения страницы в PDF.

При этом вполне возможно изменять содержимое страниц в самом PDF-файле. На данный момент, наверное, наиболее заслуживающий доверия, пусть и не идеальный способ демонстрации содержимого защищенной страницы — запись экрана (список простых решений для этой процедуры см. здесь) во время просмотра страницы.

Наконец, если вы ведёте много онлайн-исследований и хотите воспользоваться автоматическим решением по слежению, чтобы восстановить свои шаги, предлагаем воспользоваться Hunch.ly, разработанным автором Bellingcat и мастером работы с Python Джастином Сейтцем. Когда этот плагин активен, он автоматически сохраняет каждую страницу, которую вы посещаете в ходе расследований. Если одна из этих страниц впоследствии будет удалена, а вы забудете её заархивировать, на помощь придёт Hunch.ly.

Используете ли вы другие сайты и ресурсы для архивации веб-страниц, изображений и видео? Предлагайте свои варианты в комментариях, если вы считаете, что их стоит добавить в это руководство.

поддержать проект

Поделиться
Поделиться сюжетом
Источник материала
20-летняя модель завоевала титул «Мисс Украина 2024»: она представит страну на конкурсе «Мисс Мира»
Gloss
2024-12-06T16:30:50Z
В сети рассекретили имя мужчины, который должен был стать героем шоу «Холостяк-13» вместо Терена
Gloss
2024-11-29T17:16:39Z
Украинский Щедрик стал частью новогодней рекламы Chanel
Gloss
2024-11-22T16:13:24Z
Украинка стала режиссером нового клипа Леди Гаги
Gloss
2024-10-30T15:28:08Z
Рэпер Эминем впервые станет дедушкой: видео его реакции на новость
Gloss
2024-10-04T16:48:49Z
Linkin Park возвращается с новой вокалисткой спустя 7 лет после смерти фронтмена
Gloss
2024-09-06T15:22:47Z
Мадонна отметила свой 66-й день рождения в шляпе от украинского бренда
Gloss
2024-08-28T12:00:55Z
Анонимная певица Klavdia Petrivna впервые показала свое лицо в новом клипе с группой Tvorchi
Gloss
2024-08-23T15:52:15Z
Первая среди украинских звезд: Светлана Лобода спела для Грэмми
Gloss
2024-08-20T13:43:04Z
МастерШеф 14 сезон. Випуск 18 від 28.12.2024
InfoHome
2025-01-08T16:45:55Z
Balenciaga представила очень минималистичную обувь The Zero
Gloss
2024-12-04T18:36:54Z
Аукционный дом MacDougall;s проведет перед аукционную выставку 22-23 ноября в Лондоне
Ukraine Art News
2024-11-12T20:18:58Z
Самые смешные фотографии дикой природы: финалисты конкурса Nikon Comedy Wildlife Awards 2024
Gloss
2024-09-30T13:13:29Z
Надя Дорофеева презентовала клип на новую песню «Нитроглицерин»
Gloss
2024-08-07T15:40:50Z
Balenciaga выпустили самую дорогую в мире авоську за 7 тысяч долларов
Gloss
2024-07-17T16:30:55Z
В Steam стартовал фестиваль файтингов
Overclockers
2024-07-16T06:52:19Z
ЗНАКОМСТВО С ЛОНДОНСКОЙ ХУДОЖНИЦЕЙ ЛАРОЙ ДЖУЛИАН
Ukraine Art News
2024-06-08T15:42:56Z
Right 2 Fitness Unveils New Metabolic Ignition System for Women Over 30
Elle
2024-05-27T13:28:03Z
Украинский трейлер фильма «Канадец» с Ричардом Гиром и Умой Турман
KinoFilms
2025-01-30T07:12:35Z
«Проклятые»
KinoFilms
2025-01-21T12:42:38Z
Второй украинский трейлер фильма «Обезьяна» по книге Стивена Кинга
KinoFilms
2025-01-20T15:54:36Z
PUMA выпустила коллаборацию с «‎Игрой в кальмара»: костюмы, кроссовки и аксессуары
Gloss
2025-01-07T14:06:52Z
Netflix показал тизер финального сезона сериала "Игра в кальмара": известна дата премьеры
Gloss
2025-01-03T13:43:02Z
Состоялась премьера второго сезона сериала «Игра в кальмара»: где смотреть
Gloss
2024-12-26T13:51:55Z
Netflix показал тизер мультсериала про Астерикса и Обеликса – видео
Gloss
2024-12-16T16:33:46Z
Вышел первый полноценный трейлер фильма Minecraft
Gloss
2024-11-20T14:43:04Z
Украинский трейлер фильма «Аматор» с Рамі Малеком
KinoFilms
2024-11-18T09:46:00Z
Гольф на снегу
Men's Life
2024-12-30T20:57:37Z
Стала известна судьба собаки, которую заметили на вершине 140-метровой пирамиды Египта
Gloss
2024-10-24T17:16:12Z
В Берлине открыли самые высокие качели в Европе – видео
Gloss
2024-10-14T15:15:49Z
Доступ к реке: 6 идей, как киевляне могут получить комфортные набережные
Хмарочос
2024-09-30T13:23:52Z
ТОП-8 экстремальных видов спорта
Men's Life
2024-08-19T07:57:54Z
В Китае открыли 24-километровый морской мост, который побил сразу 10 мировых рекордов
Gloss
2024-07-03T12:40:09Z
Самый большой в мире круизный лайнер Icon of the Seas отправился в свой первый рейс
Gloss
2024-01-29T17:51:45Z
Самые комфортные места для жизни уже в недалеком будущем
Men's Life
2024-01-24T08:33:40Z
Культурное значение шампанского в разных странах
Gloss
2023-11-29T10:12:53Z
Как с толком расставить приоритеты и достичь большего?
Men's Life
2025-01-29T09:12:48Z
Основные принципы раздельного питания
Men's Life
2025-01-28T13:00:48Z
Водка против джина: сравнение напитков
Ukraine Art News
2025-01-27T19:31:02Z
Селфи способны разрушить романтические отношения
Men's Life
2025-01-27T09:09:54Z
В ДТП погибла известная блогер из Харькова Анна Жук: как это произошло
Gloss
2025-01-24T18:00:54Z
Премія Brit Awards 2025 оголосила номінантів, співачка Charli XCX претендує на 5 нагород
Ukraine Art News
2025-01-24T14:06:44Z
Разработана методика запоминания новых слов
Men's Life
2025-01-22T08:48:41Z
Психологи определили, с какой скоростью развиваются любовные отношения
Men's Life
2025-01-22T08:45:45Z
Так вкусно что готовлю три раза в неделю! Оказалось не все знают этот простой рецепт
InfoHome
2025-01-22T07:30:42Z
Где выгодно купить запчасти для телефонов оптом: советы для мастеров и сервисных центров
Gloss
2025-01-27T16:49:10Z
Канадец собрал дома ядерный реактор, потратив всего 3 000 долларов
Gloss
2025-01-23T17:51:55Z
На выставке CES 2025 представили первый в мире летающий мотоцикл
Gloss
2025-01-21T18:06:50Z
Realbotix представила человекоподобного робота-женщину для «общения и близости»
Gloss
2025-01-14T13:49:21Z
Роботы Boston Dynamics не только стабильно стоят на ногах, но и научились делать сальто
Gloss
2025-01-02T13:24:49Z
Всемирно известный блогер MrBeast построил город за $14 млн для своего шоу
Gloss
2024-12-17T14:11:03Z
OpenAI запустила нейросеть Sora, которая может создавать видео из текста
Gloss
2024-12-10T15:19:34Z
Купил – поюзал – утилизировал: новая экоинициатива оʼgо
Gloss
2024-12-06T14:19:05Z
Мясной рулет два в одном. Лёгкий в приготовлении. Закуска для мужчин, цыганка готовит
InfoHome
2025-01-30T07:30:56Z
Куриные бедра на сковороде. Вкуснее, чем в духовке. Вкусный и быстрый ужин для семьи!
InfoHome
2025-01-30T07:27:48Z
Лучший способ как приготовить курицу с картошкой! Самый вкусный рецепт из курицы в духовке
InfoHome
2025-01-27T12:55:08Z
Почему из капусты и фарша я не готовил такое раньше? Гениальный рецепт на обед или ужин на всю семью
InfoHome
2025-01-27T12:52:21Z
Без весов - только стакан! Манник-Нежность - невероятно простой вкусный быстрый пирог к чаю!
InfoHome
2025-01-27T12:52:20Z
Яичница: рецепты счастливого брака
Men's Life
2025-01-27T09:12:57Z
Пышная запеканка из садика без муки! Без соды! Без крахмала! Творожная запеканка воздушная
InfoHome
2025-01-25T07:40:02Z
Хрустящая пицца фокачча без замеса теста
InfoHome
2025-01-22T07:27:38Z
Здоровое питание
Men's Life
2025-01-20T12:57:39Z