Научные и технические библиотеки №1 2008 год
Содержание:

14-я Международная конференция «Библиотечные и информационные ресурсы в современном мире науки, культуры, образования и бизнеса» – «Крым–2007»

Шрайберг Я. Л. Роль библиотек в обеспечении доступа к информации и знаниям в информационном веке. Ежегодный доклад Международной конференции «Крым

Секция «Автоматизированные и корпоративные библиотечные системы и технологии»

Воройский Ф. С. Итоги работы секции «Автоматизированные и корпоративные библиотечные системы и технологии» на Конференции «Крым–2007»

Маршак Б. И., Рагимова М. А. Автоматизированная система Российского Сводного каталога как корпоративный ресурс научно-технической информации

Карауш А. С., Макаревич А. С. Развитие информационных технологий в библиотеках: взгляд в будущее

Баженов И. С., Павлов А. И. Анализ информационного массива АБИС для оптимизации подсистемы резервного копирования

Еремеев Л. Г., Кузнецов А. В., Стрельчук И. П., Шепелева Ю. Ю. Сравнительный анализ функциональности современных библиотечных Z-клиентов

Жижимов О. Л., Мазов Н. А. Сервер ZooPARK: вчера, сегодня, завтра

Секция «Библиотековедение, библиографоведение и книговедение»

Столяров Ю. Н. Секция «Библиотековедение, библиографоведение и книговедение» – год шестой. (Аналитический обзор докладов

Дворкина М. Я. Библиотечно-информационная деятельность как система

ПРОФЕССИОНАЛЬНОЕ ОБРАЗОВАНИЕ

Соколов А. В. Эволюция библиотечной школы

ПРОБЛЕМЫ ИНФОРМАЦИОННОГО ОБЩЕСТВА

Земсков А. И. Некоторые особенности работы с электронными документами

НОВОЕ ПРОФЕССИОНАЛЬНОЕ ИЗДАНИЕ

«Медиатека» – журнал о новых информационно-коммуникационных технологиях в библиотеках


И. С. Баженов, А. И. Павлов

ГПНТБ СО РАН, Новосибирск

Анализ информационного массива АБИС
для оптимизации подсистемы резервного копирования

Процесс развития АБИС наиболее ярко проявляется в увеличении объемов хранимой информации. В свою очередь рост информационного ресурса требует своевременной поддержки соответствующего уровня системы резервного копирования, поскольку размер дискового пространства (объем хранимой информации) предъявляет соответствующие технические требования к этой системе по скорости, надежности, технологичности, возможности масштабирования и, конечно, стоимости. Так, в ГПНТБ СО РАН по мере развития АБИС дважды модифицировалась подсистема резервного копирования – последний раз это сделано в 2001 г. На графике отражена динамика роста дискового массива за период работы последней модификации данной подсистемы.

На начало года дисковый массив вырос более чем в четыре раза, а перспектива – более чем в десять. Такие темпы роста усиленно наталкивают на мысль о необходимости очередной модернизации подсистемы архивирования, что всегда связано с достаточно большими финансовыми затратами. Выбранная ранее модель стримера (HPUltrium 215) относится к линейке устройств Ultrium – это современное техническое решение, постоянно развиваемое и сохраняющее поддержку старших форматов носителей,
т. е. ленты, записанные на ранее использовавшемся носителе, могут использоваться (по крайней мере, читаться) на более новых моделях устройств Ultrium, что освобождает от необходимости приобретения ленточных картриджей нового типа и перезаписи старых архивов в связи с переходом на более производительную модель стримера. Это позволяет экономить определенные денежные средства: стоимость новых моделей стримеров достаточно высока (от 2,5 до 4,5 тыс. долларов США), поэтому продление жизненного цикла предыдущей модели дает положительный экономический эффект.

Продления срока службы стримера можно добиться, понизив нагрузку на него или, что то же самое, уменьшив поток сохраняемой информации. Естественно, такие действия не должны быть связаны с увеличением риска потери данных. Все должно строиться на анализе структурных компонент информационного массива АБИС с точки зрения периодичности и доли вносимых в них изменений, а также их ценности (уникальности).

По функционально-технологическому назначению информацию, используемую в АБИС, можно разбить на три группы:

1. Операционная система (сетевая ОС).

2. Приобретаемые БД.

3. БД собственной генерации, документооборот.

Операционная система серверов

Эта информация в основном изменяется очень редко. Обычно изменениями являются установка нового устройства, регистрация новых пользователей и другие мелкие работы. В системе ведутся журналы событий. Основной из них – журнал, отражающий события, связанные с безопасностью (попытки входа/выхода пользователя, удаление или модификация рабочих файлов и т. д.). Этот журнал необходим для контроля над внутренней безопасностью. Он заполняется очень быстро и ежедневно копируется, чтобы сохранять его в полном объеме для дальнейшего исследования. Остальные файлы операционной системы сохраняются путем создания образа файловой системы (fullbackup) по необходимости (на усмотрение системного администратора). На восстановление операционной системы в аварийной ситуации требуется время, соизмеримое с физическим копированием файлового образа.

Приобретаемые и полнотекстовые базы данных

Этот вид информации крайне редко подвергается модификации, которая обычно заключается в поступлении нового выпуска в виде дополнительных каталогов и файлов и/или актуализации существующего массива.

Массив сохраняется полностью, затем обновляется примерно раз в месяц (периодичность поступления новых выпусков) или по требованию (произведено большое количество изменений). При наличии лент, редком изменении и небольшом пополнении информация может храниться без перезаписи в течение одного года, по окончании этого срока данный массив полностью переписывается, независимо от наличия или отсутствия каких-либо дополнений или изменений.

Базы данных собственной генерации
и пользовательские файлы

В эту группу входят электронные каталоги библиотеки, библиографические базы данных и т. п., а также всевозможные документы и медиафайлы общего пользования. Информация меняется и копируется ежедневно в ночное время в режиме обновления на дисковый носитель отдельным томом и одновременно дублируется на магнитную ленту, но уже в режиме накопления. По окончании квартала процесс повторяется: новый цикл начинается с формирования полной копии изменяемой части информационного массива (см. диаграмму), затем идет процесс формирования следующей квартальной резервной копии добавлением ежедневных изменений. Цикл повторяется по окончании каждого квартала в течение года. Таким образом схема, называемая «дед-отец-сын», сохраняет предыдущее накопление сроком до одного года и гарантирует постоянный охват ретроспективы на срок не менее девяти месяцев, т. е. может быть восстановлена информация практически на любую дату ретроспективной глубиной до года.

К этой же категории резонно отнести и бухгалтерскую информацию, которая состоит из баз данных «1С:Бухгалтерия» и «1С:Зарплата», различных программ подготовки отчетности (налоговой и внутренней) и разнообразных текстовых документов. Все файлы, кроме баз данных, относящиеся к бухгалтерской информации, копируются, как и обычные файлы пользователей, хранятся также не менее девяти месяцев, но при этом дополнительно подвергаются шифрованию. Сами же бухгалтерские базы данных копируются каждые три часа во временные дисковые архивы и один раз в сутки на магнитную ленту. Сохраняется также ежедневная дисковая копия для дальнейшего быстрого восстановления в случае необходимости. Эти архивы хранятся не менее трех лет с возможностью полного восстановления на любую дату.

Сегодня относительное распределение объемов дискового пространства между различными информационными ресурсами ГПНТБ СО РАН выглядит следующим образом:

Как видно из диаграммы, массив с часто изменяемыми данными занимает всего 13% от общего информационного пространства (незаштрихованные секторы – 7% и 6%). При создании ежедневной резервной копии только этот массив подвергается программному сканированию на предмет поиска модифицированных файлов, соответствующие элементы копируются на диск (дифференциальное резервное копирование – differentialbackup). Практически эта величина составляет 4–10 Гб, что значительно меньше 1% нынешнего общего информационного пространства АБИС ГПНТБ СО РАН.

Копирование на жесткий диск в режиме обновления происходит со значительно большей скоростью, чем на ленточный носитель. Но (в определенном временном диапазоне) скорость важна лишь для сохранения ежедневных изменений, поскольку дублируемые файлы могут блокироваться на время создания копии. Накопительный архив может вестись параллельно с рабочим режимом, практически не влияя на производительность системы. Зато в случае повреждения носителя более вероятно восстановление данных с ленточного накопителя, так как у него отсутствуют файловая система и, соответственно, таблица размещения файлов (FAT). Данные располагаются последовательно, их структуры описания находятся в непосредственной близости по ленте. При повреждении ленты произойдет потеря лишь испорченных файлов, а в случае жесткого диска при повреждении FAT существует вероятность полной потери данных или весьма трудоемкое восстановление информации (чаще всего лишь частичное).

Все вышеописанное архивирование ведется на ленточный носитель (картридж) вместимостью 100 Гб (с заявленным сроком сохранности данных – 30 лет), при этом поддерживается аппаратное сжатие, за счет чего вместимость может возрасти до 300 Гб. Большему сжатию поддаются БД в форматах ISIS, WinIrbis и текстовые форматы. Практически не сжимаются полные тексты в форматах PDF или TIFF. Хорошо сжимаемая информация более характерна для ежедневного и, соответственно, накопительного копирования, а полные тексты – для условно-постоянной части информационного ресурса. Практически среднее значение информационного объема на единицу носителя составляет 175–180 Гб.

Существующие режимы архивирования позволяют восстановить информацию по требованию в следующих вариантах:

·      восстановление удаленного или испорченного файла;

·      восстановление нескольких версий одного и того же файла;

·      восстановление полной копии на любую дату;

·      восстановление образа операционной системы.

Таким образом, анализ информационного потока позволяет сделать вывод, что существующий аппаратно-программный комплекс на основе недорогого стримера способен еще достаточно долгое время обеспечивать функциональную полноту подсистемы резервного копирования с точки зрения как пользователя, так и администратора АБИС.

  
На главную