УДК 025.4.036
Н. Б. Брачковская, В. В. Рубцов
Моделирование формата хранения
в специализированных базах данных
Анализ и моделирование основных характеристик формата хранения данных в специализированных базах данных на примере рукописных документов Библиотеки РАН.
В этой статье мы хотим показать, что формат «UNIMARC Bibliographic» является действительно универсальным форматом, с помощью которого можно создать не только библиографическое описание документа. В предыдущей публикации [1] нами затрагивалась тема графики в редкокнижных изданиях. Тема нашла дальнейшее развитие, электронный ресурс преобразован в гипертекстовую БД для среды Windows с многооконным интерфейсом и активным использованием графического материала.
Модель формата UNIMARC, представленную в этой статье, можно использовать для описания рукописного материала. Обычно для этого вида документов применяется стандарт ISAD(G) [2]. В Интернете есть перевод на русский язык только версии 1993 г., вторая редакция – 2000 г. – в России не используется (http://forum.rusarchives.ru/archive/index.php/t-28.html), и как национальный формат не адаптировался. Подготовка руководства «UNIMARC Guidelines for Manuscripts» планируется IFLA только в 2009 г. (http://www.ifla.org/VI/8/unimarc-publist.htm), и эта версия наверняка не будет окончательной.
Любой разработчик стремится к максимальной стандартизации в формате хранения данных, поэтому неизбежно использование локальных полей или целых блоков полей. Формат UNIMARC [3] предусматривает для этих целей поля, метки которых содержат цифру 9. В перспективе это закладывает большую гибкость формата при последующей модернизации создаваемой системы и обеспечивает высокий потенциал ее развития.
Основная цель создаваемой модели – хранение и использование сведений о рукописных документах. В Отделе автоматизации Библиотеки Российской академии наук была разработана примерная схема формата, которая окончательно оформлена в 2002 г. в виде «Технологической инструкции по заполнению информационной карты (описания рукописей)» [4]. В Инструкции учтена специфика описываемого материала, при этом мы ориентировались на опыт технологических и программных наработок при создании автоматизированной библиографической системы библиотеки. Задачи, поставленные перед системой при описании документа и представлении его на экране, решались форматными средствами, т.е. путем структурирования данных, а также программными средствами.
Нами проанализированы вопросы для возможного создания специализированной БД, описывающей рукописи: для традиционных функций учета, поиска и просмотра электронных записей и связанных с ними отсканированных изображений, а также для планирования сопутствующих дополнительных работ с рукописными документами. Ниже рассмотрены только особенности формата хранения данных.
Проектирование любого информационного массива всегда начинается с анализа общей структуры машинного формата. Данные, описывающие документ, размещаются как в полях, предусмотренных стандартом, так и в полях локального использования. Перечень полей локального использования, их количество и наполнение определяются спецификой описываемого материала. В общем случае в любой БД поля локального использования делятся на:
информационные (содержат документальные сведения), например, поля для описания графики в редкокнижных изданиях [1],
технологические (содержат специфическую, в том числе кодированную информацию), например, в UNIMARC-БАН [5] или в ППП ИРБИС [6]: имя рабочего листа, с помощью которого следует выполнять редактирование основных документальных сведений.
При описании документов-рукописей мы сталкиваемся с особенностями, с которыми не сталкивались так тесно при описании документов, изданных полиграфическим способом. Одна из таких особенностей – более тщательная проработка блоков данных для специфических сведений: о материале, сохранности, консервации (задание на консервацию), хранении (задание на хранение).
Сведения о привычном для нас библиографическом описании рукописи теперь составляют в создаваемом электронном описании менее значительную часть – на первый план выступают особенности экземпляра и правила его хранения. В формате UNIMARC, например, для рукописных материалов отведено место только в примечаниях – в поле 316, и только в версии 1994 г.
Нам потребовалось существенно расширить и дополнить состав полей, предоставляемый международным стандартным форматом UNIMARC [3], а также используемый нами формат UNIMARC-БАН [5] и специальный формат, разработанный для описания коллекций Отдела редких книг БАН [1].
В основу модели формата положена «Технологическая инструкция по заполнению информационной карты» [4]. Структура машинного описания документа состоит из пяти частей, называемых типами информации: библиографическое описание документа, материаловедческая основа документа, сохранность документа, задание по консервации, задание по хранению.
Информационная карта адаптирована к вновь созданному формату, сохранены привычная структура описания рукописи, последовательность полей и подполей. Дополнительно введены специальные и технологические поля: даты, учетные машинные сведения, уникальный номер записи, дата создания, дата редактирования, и др. Для примечаний (Блок 3) использованы все необходимые поля, предусмотренные вышеназванными форматами хранения данных. Поле 318 «Примечание о действиях» дублируется структурированными полями локального использования, в которых целенаправленно указываются отдельные действия по сохранности, консервации, хранению и срокам их контроля.
Поля формата UNIMARC, минимально необходимые для описания рукописей в соответствии с Информационной картой, приведены в табл. 1.
Таблица 1
№ п/п |
Метка поля |
Описание поля |
Общие и кодированные данные |
||
1 |
001 |
Идентификатор записи |
2 |
005 |
Дата версии или дата последнего редактирования |
3 |
100 |
Данные общей обработки |
4 |
101 |
Язык документа |
5 |
102 |
Страна публикации или производства |
6 |
106 |
Кодированные данные (текстовые материалы – физические характеристики) |
Описательная информация |
||
7 |
200 |
Заглавие и сведения об ответственности |
8 |
2-- |
Заглавие и сведения об ответственности – поля локального использования |
9 |
210 |
Публикация, распространение и т.п. |
10 |
215 |
Физическое описание |
Примечания |
||
11 |
300 |
Общие примечания |
12 |
304 |
Примечания, относящиеся к заглавию и сведениям об ответственности |
13 |
305 |
Примечания, относящиеся к сведениям об издании и библиографической истории |
14 |
310 |
Примечания, относящиеся к переплету и условиям доступности |
15 |
314 |
Примечания, относящиеся к сведениям об интеллектуальной ответственности |
16 |
316 |
Примечание, относящееся к экземпляру, на который составляется запись |
17 |
317 |
Примечание, относящееся к происхождению единицы |
18 |
318 |
Примечание о действиях |
19 |
320 |
Примечание о наличии в документе библиографии/указателей |
20 |
327 |
Примечание о содержании |
21 |
330 |
Резюме или реферат |
22 |
345 |
Приобретение/Общие примечания |
Сведения об интеллектуальной ответственности |
||
23 |
700 |
Автор – (Имя лица – первичная интеллектуальная ответственность) |
24 |
701 |
Соавтор(ы) – (Имя лица – альтернативная интеллектуальная ответственность) |
25 |
702 |
Прочие лица – Имя лица – вторичная интеллектуальная ответственность), например: переписчик рукописи |
Блок международного использования |
||
26 |
801 |
Организация – источник составления записи |
Блок полей локального использования |
||
27 |
9-- |
Прочие поля локального использования |
Элементы Информационной карты – поля локального использования приведены в табл. 2 (метки полей указаны условно).
Таблица 2
N п/п |
Метка поля |
Наименование блока полей |
Материаловедческая основа документа – 9 полей |
||
1 |
911 |
Шифр |
2 |
912 |
Переплет-обложка (футляр) |
3 |
913 |
Декор переплета |
4 |
914 |
Утраты элементов декора |
5 |
915 |
Дополнительная информация |
6 |
916 |
Обрез |
7 |
917 |
Блок, тетради, листы |
8 |
918 |
Текст |
9 |
919 |
Иллюстрации |
Сохранность документа – 5 полей |
||
10 |
921 |
Повреждения переплета (обложки) |
11 |
922 |
Повреждения листов |
12 |
923 |
Повреждения текста, иллюстраций |
13 |
924 |
Данные специальных измерений |
14 |
925 |
Биологические повреждения |
Задание по консервации документа – 5 полей |
||
15 |
931 |
Обработка рукописи |
16 |
932 |
Защитные операции |
17 |
933 |
Обработка переплета |
18 |
934 |
Обработка блока |
19 |
935 |
Обработка текста и иллюстраций |
Задание по хранению – 4 поля |
||
20 |
941 |
Задание по хранению |
21 |
942 |
Очередность действий |
22 |
943 |
Пагинация |
23 |
944 |
Условия хранения |
Прорабатывая форматную основу для модели БД рукописных документов, мы создаем аппарат не только для хранения сведений о документах и их особенностях, но включаем и элементы учета технологии работы с этими документами и предпосылки для дальнейшей, более полной научной работы с ними. Поле связи с мультимедийными компонентами позволяет использовать графические, аудио- и видеоматериалы и проводить мониторинг состояния документов.
Таким образом, в Отделе автоматизации БАН проработана комплексная модель описания еще одного вида специфических документов, при этом использован технологический и программный потенциал, опирающийся на опыт создания автоматизированных библиографических систем.
Отметим еще несколько очень важных результатов разработки. Структурирование данных обеспечивает широкий диапазон и высокую точность при генерации поискового аппарата. Дробность информации позволяет создавать большое число вспомогательных технологических форм представления данных на экране, а также генерировать специализированные отчеты, предназначенные для вывода на печать.
Список источников
1. Брачковская Н. Б., Рубцов В. В.Графика в базе данных редкой книги // Справочно-библиографическое обслуживание: традиции и новации : сб. науч. тр. / отв. ред. В. П. Леонов ; сост. Н. А. Сидоренко, Н. В. Бекжанова. – С.-Петербург : БАН, 2007. – С. 255–266.
2. ISAD(G) International Standard Archival Description (General). – Ottava, 1994 ; via Internet, 1998–04–07.
3. UNIMARC Manual: Bibliographic Format. – 2nd ed. Update 4. K.G. Saur Munchen, 2002. – (UBCIM Publications – New Series. Vol. 14).
4. Технологическая инструкция по заполнению информационной карты (описания рукописей) / сост. Азарова И. В., Беляева И. М. и др. ; утв. дир. Библиотеки РАН проф. В. П. Леонов. – РАН ; Библиотека РАН, 2002. – 17 с.
5. Брачковская Н. Б., Рубцов В. В.Библиографический формат UNIMARC и его российские производные. Справочная база данных // Науч. и техн. б-ки. – 2006. – № 6. – С. 60–65.
6. Система автоматизации библиотек ИРБИС. ГПНТБ России. Общее описание системы. Приложения. – Москва, 2002. – 322 с.