Г. А. Евстигнеева

Реалии практической оцифровки.
Специальное мероприятие на Международной конференции «Крым–2012»

Кратко освещена серия мероприятий, раскрывающих вопросы оцифровки документных массивов. Проанализированы доклады и сообщения, представленные в ходе специальной программы по проблемам качества оцифровки на конференции «Крым–2012».

Ключевые слова: Международная конференция «Крым–2012», оцифровка, электронные библиотеки, сканирование, качество, контроль, электронные копии, оборудование, стандартизация.

Специальное мероприятие «Реалии практической оцифровки» в рамках Международной конференции «Крым–2012» возникло не случайно. В последние годы заметно возрастают потребности и возможности организаций в оцифровке документных массивов. Создаются электронные библиотеки, архивы, тематические коллекции. В Сети предоставляются всё более значительные массивы информации на основе печатных документов. Библиотеки сканируют и издания, формируя электронные коллекции, и карточные каталоги – для предоставления их на сайтах имидж-каталогов. Архивы переводят в электронный вид массивы хранящихся документов. Музеи представляют в Интернете свои экспозиции. В библиотечной среде усилилась роль корпоративного создания и использования электронных ресурсов.

Всё это привело к необходимости выработки признаков для определения качества отсканированных файлов. Потребность в этом ощутили как создатели информации, так и её хранители, распространители, а также потребители. Именно поэтому возникла инициатива разработать единые критерии качества оцифровки. Инициаторами выступили ЗАО «ДиМи-Центр» – коммерческая компания, являющаяся одним из лидеров на рынке сканирующего оборудования, и НИИ репрографии. К ним активно присоединилась ГПНТБ России, а затем и РГБ. Именно такое сотрудничество – организаций разных, но одинаково заинтересованных в упорядочении процессов сканирования, – наиболее плодотворно.

Совместные исследования начались в 2011 г., и впервые тема качества сканирования и создания соответствующих нормативов прозвучала на Международной конференции «Оценка и контроль качества сканирования бумажных документов», прошедшей в апреле 2011 г. в г. Королёв (Московская область); на ней была отмечена существенная проблема – отсутствие в России и других странах СНГ нормативных документов, регламентирующих процедуры объективной оценки качества изготавливаемых цифровых копий первоисточников.

Рассмотрение этой темы продолжилось на проблемном семинаре и «круглом столе» «Нормативно-технические и технологические аспекты создания электронных копий документов» в рамках Международной конференции «Крым–2011». Инициативная группа, опираясь на результаты исследований, разработала методику «Оценка качества цифровых копий документов, полученных их сканированием», где приведены критерии и методы объективного контроля процессов сканирования и оценки качества цифровых копий, а также учтены основные положения действующих международных и национальных нормативов, регламентирующих технические требования к процессам сканирования.

Разработки впервые были представлены на «круглом столе» «Создание качественных электронных ресурсов в библиотеках, архивах, музеях и других государственных организациях», который состоялся в ГПНТБ России в феврале 2012 г.

В рамках конференции "Крым–2012" проведена специальная программа по проблемам качества оцифровки – «Реалии практической оцифровки»: проблемный семинар «Создание качественного цифрового документа – проблемы и решения», мастер-класс «Методика и средства контроля качества цифровых копий бумажных документов» и «круглый стол» «Нормативное регулирование процессов оцифровки».

Генеральный директор ЗАО «ДиМи-Центр» С. М. Тимиргалиев, открывая семинар, рассказал об инициативах, направленных на решение проблем качества оцифровки, в рамках развивающегося проекта, обозначил задачи, стоящие перед его участниками [1]. Он отметил, что созданная методика не только поможет разработать комплекс рекомендаций по выбору оборудования, организации и контролю процессов оцифровки, качественной обработке цифровых копий, но, что ещё важнее, ляжет в основу национального стандарта «Электронные копии бумажных документов. Показатели качества и методы контроля». Важным этапом формирования нормативно-технологического обеспечения качества процессов оцифровки фондов станет разработка отечественных инструментов и программного обеспечения по контролю качества сканирования и, для их успешного применения, – организация учебных тренингов для специалистов, осуществляющих и контролирующих оцифровку.

Многоаспектность проблем оцифровки с точки зрения пользователя наглядно представлена в докладе Ю. Ю. Юмашевой – специалиста МГУ [2]. Показано, что критерии качества оцифровки определяются рядом тесно взаимосвязанных факторов, главные из них – цели оцифровки, качество сканирующего оборудования, требования к процессу сканирования и к результирующему файлу.

Приоритеты для определения последовательности оцифровки: уникальные и особо ценные документы, наиболее востребованные документы, ветхие документы (в плохом физическом состоянии), тематические или авторские коллекции.

Ю. Ю. Юмашева отметила: «Жизненно важно заострить внимание на комплексности понятия качества электронных копий, которое может быть определено следующими параметрами: качество описания оригинала и цифровой копии объекта; качество сканирования; качество графической обработки цифровой копии».

В докладе обозначены проблемы, возникающие в ходе многих отечественных и зарубежных проектов оцифровки библиотечных, архивных и музейных фондов при сканировании, графической обработке и последующем представлении электронной копии в специальных программных оболочках, а также при описании электронных копий документов. Справедливо отмечено, что для пользовательской аудитории на первый план выходят вопросы адекватности электронной копии оригиналу, её репрезентативности, полноты, достоверности и юридической значимости, т.е. всего того, что должно быть отнесено к понятию качества.

Е. Б. Грузнова, начальник отдела формирования и обработки информационных ресурсов Президентской библиотеки имени Б. Н. Ельцина, развивая эту тему, затронула многие вопросы, связанные со сканированием документов, в том числе: принципы отбора документов для сканирования, выбор техники с учётом необходимого качества электронного документа, а также параметры качества цифрового материала в зависимости от его целевого использования.

Не менее важный вопрос – использование микрофильмов и микрофиш для создания электронных копий. Докладчик рассмотрела возможности использования этого метода оцифровки с точки зрения качества цифровой копии, отметила, что копия с микроформы несколько хуже копии с оригинала, но в большинстве случаев вполне пригодна для использования и перспективна, поскольку обеспечивает сохранность оригинала и значительно ускоряет процесс оцифровки. В докладе обращено внимание и на зависимость качества сканирования от технических показателей как сканера, так и самой оцифровки.

Важность выработки единых критериев качества цифровых документов подчеркнул С. Н. Клещарь, заместитель директора НИИ репрографии (Тула) [3]. Понимая важность проблемы, институт приступил к разработке стандарта, определяющего параметры объективной оценки качества и аутентичности получаемых цифровых копий. Стандарт предусматривает требования к получению электронных копий различных категорий в зависимости от целей и задач оцифровки. Определены три категории: «Мастер-копия» – для архивного хранения, цифровой реставрации и создания производных копий на различных носителях; «Цифровая копия высокого качества» – для долговременного хранения и последующего микрофиль-мирования; «Цифровая копия» – для оперативного доступа в компьютерных системах и сетях.

Предложены следующие критерии оценки качества сканирования: равномерность освещения оригинала документа в процессе сканирования; технические характеристики сканирующей системы по фиксации: высоких пространственных частот, тонопередачи различных оттенков нейтрально-серой шкалы и цветовой информации, уровня случайного шума.

В качестве инструментов оценки качества, осуществляющих сравнение отсканированных файлов с эталоном, предложено использовать специальные графические программы, а также специальное программное обеспечение, разработанное как приложение к стандарту.

В результате такой оценки определяются не только минимальные и максимальные значения уровней освещённости, но и усреднённые значения на каждом участке предварительно разделённого изображения, что необходимо для последующей регулировки и настройки осветителей сканирующей системы. Создаваемый нормативный документ распространяется на процессы сканирования как монохромных, так и цветных документов.

Стандарт разрабатывается ФГУП «Научно-исследовательский институт репрографии» в системе 33 класса «Единый российский страховой фонд документации» по государственному контракту с Управлением делами Президента Российской Федерации. Окончательная редакция будет разработана в 2013 г. и представлена на утверждение в Ростехрегулирование.

Н. И. Черновалова, заместитель генерального директора ЗАО «ДиМи-Центр» [4], обратила внимание на то, что важным фактором качества оцифровки является правильность выбора сканирующего оборудования. При существующем многообразии сканирующей техники возникает проблема: как разобраться в множестве предложений и обеспечить эффективность капиталовложений и качество работ.

В докладе сканирующее оборудование систематизировано по целевому назначению, функциональному составу, техническим характеристикам, производительности и степени автоматизации процесса; дана классификация современного профессионального сканирующего оборудования. Кроме того, представлен обзор дополнительного оборудования для обеспечения необходимых технических условий оцифровки, удобства работы с оригиналом разной степени сложности и разного физического состояния; охарактеризовано оборудование для создания страховых фондов документов в процессе их оцифровки – КОМ-систем, поддерживающих технологию страхового микрофильмирования оцифрованных фондов документов.

Докладчик предложила методические рекомендации по выбору оборудования, обеспечивающего необходимый уровень качества цифрового изображения – от высококачественных мастер-копий до временных копий документов.

О разработке «Методики определения технического соответствия оборудования для сканирования и контроля качества цифровой копии» рассказал Ю. И. Заславский, директор Центра сканирования ГПНТБ России. Он отметил, что при работе над методикой были учтены основные положения действующих международных и национальных стандартов, регламентирующих технические требования к процессам сканирования.

Методика обеспечивает выполнение операций по контролю качества сканирования с применением специальных инструментов, используемых в репрографии и цифровой фотографии, а также контроль технологических процессов с применением тест-оригиналов. Для внедрения методики в практику сканирования печатных документов в ГПНТБ России организованы обучающие семинары.

В соответствии с программой мероприятия состоялся мастер-класс «Методика и средства контроля качества цифровых копий бумажных документов», на котором прошли презентация «Методики определения технического соответствия оборудования для сканирования…» и демонстрация использования средств контроля и оценки качества цифровых копий бумажных документов в процессе сканирования.

Завершил программу «круглый стол» «Нормативное регулирование процессов оцифровки», где были даны рекомендации по использованию методики «Оценка качества цифровых копий документов…» как основополагающего документа для разработки нормативов контроля качества сканирования бумажных документов. Предложена к обсуждению первая редакция ГОСТа «ЕР СФД. Электронные копии бумажных документов. Показатели качества и методы контроля». В ходе дискуссии определены дальнейшие практические шаги по разработке нормативных документов контроля качества цифровых документов.

Список источников

1. Тимиргалиев С. М.Ключевые вопросы качественной оцифровки фондов // Труды Девятнадцатой междунар. конф. "Крым–2012". – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2012/disk/148.pdf

2. Юмашева Ю. Ю.Электронные копии объектов культурного наследия: точка зрения пользователя // Труды Девятнадцатой междунар. конф. "Крым–2012". – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2012/disk/023.pdf

3. Клещарь С. Н.Электронные копии бумажных документов. Показатели качества и методы контроля. (Проект первой редакции национального ГОСТ) // Труды Девятнадцатой междунар. конф. "Крым–2012". – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2012/disk/040.pdf

4. Черновалова Н. И. Выбор сканирующих систем: целевой подход // Труды Девятнадцатой междунар. конф. "Крым–2012". – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2012/disk/149.pdf.