В середине декабря система резервного копирования (СРК) суперкомпьютера Киотского университета (Япония) дала сбой, в результате которого исчез большой объем данных. Об этом стало известно недавно. Ученые считают, что причиной потери файлов стало некорректное обращение с СРК, сообщает издание gizchina.com.
Как сообщают в университете, из-за ошибки в работе СКР данных, разработанной Japan Hewlett Packard LLC, система суперкомпьютера перегрузилась. В итоге, часть данных из хранилища была случайно удалена, а именно — около 77 ТБ, которые составляли 34 млн файлов. Пострадали файлы 14-ти групп пользователей, однако большинство файлов (для 10-ти групп) подлежат восстановлению, но вот файлы 4-х групп — нет.
"Приносим искренние извинения за доставленные неудобства. Мы постараемся сделать так, чтобы впредь подобная ситуация не повторилась", — говорится в официальном сообщении Киотского университета.
Ученые полагают, что при обновлении bash-скрипта, задействованного в процессе резервного копирования и отвечающего за удаление старых журналов, фиксирующих действия программы, была допущена ошибка "по невнимательности".
Новую версию скрипта записывали поверх старого как раз в тот момент, когда старый скрипт уже начал работать. Эксперты из Japan Hewlett Packard говорят, что из-за этой накладки значения переменных были утеряны, новый скрипт загрузился не полностью, поэтому удалились файлы, а не старые журналы. Ошибку никто не заметил, что и привело к плачевным последствиям, сотрудники Japan Hewlett Packard признают свою вину.
В настоящее время процесс резервного копирования остановлен. Сотрудники университета планируют возобновить резервное копирование к концу января после исправления проблемы и принятия мер по предотвращению подобной ошибки.
"Поскольку массив определенных данных не подлежит восстановлению, в будущем мы реализуем не только резервное копирование путем зеркалирования, но и будем хранить инкрементные резервные копии некоторое время. Мы будем работать над улучшением не только функциональности, но и управления операциями", — отметили ученые.
"Однако сложно исключить все риски, включая возможность потери файлов из-за отказа оборудования или аварии. Поэтому, даже если вы обычный пользователь, сделайте резервную копию важных файлов в другой системе", — резюмирует СМИ.