УДК 025.4.036
Н. Б. Брачковская, В. В. Рубцов
Моделирование формата хранения
в специализированных базах данных
Анализ и моделирование основных
характеристик формата хранения данных в специализированных базах данных на
примере рукописных документов Библиотеки РАН.
В этой статье мы хотим
показать, что формат «UNIMARC Bibliographic» является действительно
универсальным форматом, с помощью которого можно создать не только
библиографическое описание документа. В предыдущей публикации [1] нами затрагивалась тема графики в
редкокнижных изданиях. Тема нашла дальнейшее развитие, электронный ресурс
преобразован в гипертекстовую БД для среды Windows с многооконным интерфейсом и активным
использованием графического материала.
Модель формата UNIMARC,
представленную в этой статье, можно использовать для описания рукописного
материала. Обычно для этого вида документов применяется стандарт ISAD(G) [2].
В Интернете есть перевод на русский язык только версии 1993 г., вторая
редакция – 2000 г. – в России не используется (http://forum.rusarchives.ru/archive/index.php/t-28.html),
и как национальный формат не адаптировался. Подготовка руководства «UNIMARC Guidelines for Manuscripts» планируется IFLA только в 2009 г. (http://www.ifla.org/VI/8/unimarc-publist.htm), и эта версия наверняка не будет
окончательной.
Любой разработчик стремится к максимальной стандартизации в формате
хранения данных, поэтому неизбежно использование локальных полей или целых
блоков полей. Формат UNIMARC
[3] предусматривает для этих целей
поля, метки которых содержат цифру 9. В перспективе это закладывает большую
гибкость формата при последующей модернизации создаваемой системы и
обеспечивает высокий потенциал ее развития.
Основная цель создаваемой модели – хранение и использование сведений
о рукописных документах. В Отделе автоматизации Библиотеки Российской академии
наук была разработана примерная схема формата, которая окончательно оформлена в
2002 г. в виде «Технологической инструкции по заполнению информационной
карты (описания рукописей)» [4]. В
Инструкции учтена специфика описываемого материала, при этом мы ориентировались
на опыт технологических и программных наработок при создании автоматизированной
библиографической системы библиотеки. Задачи, поставленные перед системой при
описании документа и представлении его на экране, решались форматными
средствами, т.е. путем структурирования данных, а также программными
средствами.
Нами проанализированы вопросы для возможного создания специализированной
БД, описывающей рукописи: для традиционных функций учета, поиска и просмотра
электронных записей и связанных с ними отсканированных изображений, а также для
планирования сопутствующих дополнительных работ с рукописными документами. Ниже
рассмотрены только особенности формата хранения данных.
Проектирование любого информационного
массива всегда начинается с анализа общей структуры машинного формата. Данные,
описывающие документ, размещаются как в полях, предусмотренных стандартом, так
и в полях локального использования. Перечень полей локального использования, их
количество и наполнение определяются спецификой описываемого материала. В общем
случае в любой БД поля локального использования делятся на:
информационные (содержат документальные сведения), например, поля
для описания графики в редкокнижных изданиях [1],
технологические (содержат специфическую, в том числе кодированную
информацию), например, в UNIMARC-БАН
[5] или в ППП ИРБИС [6]: имя рабочего листа, с помощью
которого следует выполнять редактирование основных документальных сведений.
При описании документов-рукописей мы сталкиваемся с особенностями,
с которыми не сталкивались так тесно при описании документов, изданных
полиграфическим способом. Одна из таких особенностей – более тщательная
проработка блоков данных для специфических сведений: о материале, сохранности,
консервации (задание на консервацию), хранении (задание на хранение).
Сведения о привычном для нас
библиографическом описании рукописи теперь составляют в создаваемом электронном
описании менее значительную часть – на первый план выступают особенности
экземпляра и правила его хранения. В формате UNIMARC, например, для рукописных материалов отведено
место только в примечаниях – в поле 316, и только в версии 1994 г.
Нам потребовалось существенно
расширить и дополнить состав полей, предоставляемый международным стандартным
форматом UNIMARC [3], а также
используемый нами формат UNIMARC-БАН [5]
и специальный формат, разработанный для описания коллекций Отдела редких книг
БАН [1].
В основу модели формата положена «Технологическая инструкция по
заполнению информационной карты» [4].
Структура машинного описания документа состоит из пяти частей, называемых
типами информации: библиографическое описание документа, материаловедческая
основа документа, сохранность документа, задание по консервации, задание по
хранению.
Информационная карта адаптирована к вновь созданному формату,
сохранены привычная структура описания рукописи, последовательность полей и
подполей. Дополнительно введены специальные и технологические поля: даты,
учетные машинные сведения, уникальный номер записи, дата создания, дата
редактирования, и др. Для примечаний (Блок 3) использованы все необходимые
поля, предусмотренные вышеназванными форматами хранения данных. Поле 318 «Примечание о действиях» дублируется структурированными
полями локального использования, в которых целенаправленно указываются
отдельные действия по сохранности, консервации, хранению и срокам их контроля.
Поля формата UNIMARC,
минимально необходимые для описания рукописей в соответствии с Информационной
картой, приведены в табл. 1.
Таблица 1
№ п/п
|
Метка поля
|
Описание поля
|
Общие и кодированные данные
|
1
|
001
|
Идентификатор записи
|
2
|
005
|
Дата версии или дата
последнего редактирования
|
3
|
100
|
Данные общей обработки
|
4
|
101
|
Язык документа
|
5
|
102
|
Страна публикации или
производства
|
6
|
106
|
Кодированные данные
(текстовые материалы – физические характеристики)
|
Описательная информация
|
7
|
200
|
Заглавие и сведения об
ответственности
|
8
|
2--
9--
|
Заглавие и сведения об
ответственности – поля локального использования
|
9
|
210
|
Публикация, распространение
и т.п.
|
10
|
215
|
Физическое описание
|
Примечания
|
11
|
300
|
Общие примечания
|
12
|
304
|
Примечания, относящиеся к
заглавию и сведениям об ответственности
|
13
|
305
|
Примечания, относящиеся к
сведениям об издании и библиографической истории
|
14
|
310
|
Примечания, относящиеся к
переплету и условиям доступности
|
15
|
314
|
Примечания, относящиеся к
сведениям об интеллектуальной ответственности
|
16
|
316
|
Примечание, относящееся к
экземпляру, на который составляется запись
|
17
|
317
|
Примечание, относящееся к
происхождению единицы
|
18
|
318
|
Примечание о действиях
|
19
|
320
|
Примечание о наличии в
документе библиографии/указателей
|
20
|
327
|
Примечание о содержании
|
21
|
330
|
Резюме или реферат
|
22
|
345
|
Приобретение/Общие
примечания
|
Сведения об интеллектуальной ответственности
|
23
|
700
|
Автор – (Имя лица –
первичная интеллектуальная ответственность)
|
24
|
701
|
Соавтор(ы) – (Имя лица –
альтернативная интеллектуальная ответственность)
|
25
|
702
|
Прочие лица – Имя лица –
вторичная интеллектуальная ответственность), например: переписчик рукописи
|
Блок международного использования
|
26
|
801
|
Организация – источник
составления записи
|
Блок полей локального использования
|
27
|
9--
|
Прочие поля локального
использования
|
Элементы Информационной карты – поля локального использования
приведены в табл. 2 (метки полей указаны условно).
Таблица 2
N п/п
|
Метка поля
|
Наименование блока полей
|
Материаловедческая основа документа – 9 полей
|
1
|
911
|
Шифр
|
2
|
912
|
Переплет-обложка (футляр)
|
3
|
913
|
Декор переплета
|
4
|
914
|
Утраты элементов декора
|
5
|
915
|
Дополнительная информация
|
6
|
916
|
Обрез
|
7
|
917
|
Блок, тетради, листы
|
8
|
918
|
Текст
|
9
|
919
|
Иллюстрации
|
Сохранность документа – 5 полей
|
10
|
921
|
Повреждения переплета (обложки)
|
11
|
922
|
Повреждения листов
|
12
|
923
|
Повреждения текста, иллюстраций
|
13
|
924
|
Данные специальных измерений
|
14
|
925
|
Биологические повреждения
|
Задание по консервации документа – 5 полей
|
15
|
931
|
Обработка рукописи
|
16
|
932
|
Защитные операции
|
17
|
933
|
Обработка переплета
|
18
|
934
|
Обработка блока
|
19
|
935
|
Обработка текста и иллюстраций
|
Задание по хранению – 4 поля
|
20
|
941
|
Задание по хранению
|
21
|
942
|
Очередность действий
|
22
|
943
|
Пагинация
|
23
|
944
|
Условия хранения
|
Прорабатывая форматную основу
для модели БД рукописных документов, мы создаем аппарат не только для хранения
сведений о документах и их особенностях, но включаем и элементы учета
технологии работы с этими документами и предпосылки для дальнейшей, более
полной научной работы с ними. Поле связи с мультимедийными компонентами
позволяет использовать графические, аудио- и видеоматериалы и проводить
мониторинг состояния документов.
Таким образом, в Отделе автоматизации БАН проработана комплексная
модель описания еще одного вида специфических документов, при этом
использован технологический и
программный потенциал, опирающийся на опыт создания автоматизированных
библиографических систем.
Отметим еще несколько очень важных результатов разработки. Структурирование
данных обеспечивает широкий диапазон и высокую точность при генерации
поискового аппарата. Дробность информации позволяет создавать большое число
вспомогательных технологических форм представления данных на экране, а также
генерировать специализированные отчеты, предназначенные для вывода на печать.
Список источников
1. Брачковская Н. Б.,
Рубцов В. В.Графика в базе
данных редкой книги // Справочно-библиографическое обслуживание: традиции и
новации : сб. науч. тр. / отв. ред. В. П. Леонов ; сост. Н. А. Сидоренко, Н. В. Бекжанова.
– С.-Петербург : БАН, 2007. – С. 255–266.
2. ISAD(G)
International Standard Archival Description (General). – Ottava, 1994 ; via
Internet, 1998–04–07.
3. UNIMARC Manual:
Bibliographic Format. – 2nd ed. Update 4. K.G. Saur Munchen, 2002. –
(UBCIM Publications – New Series. Vol. 14).
4. Технологическая инструкция по
заполнению информационной карты (описания рукописей) / сост.
Азарова И. В., Беляева И. М. и др. ; утв. дир. Библиотеки
РАН проф. В. П. Леонов. – РАН ; Библиотека РАН, 2002. – 17 с.
5. Брачковская Н. Б.,
Рубцов В. В.Библиографический
формат UNIMARC и его
российские производные. Справочная база данных // Науч. и техн. б-ки. – 2006. –
№ 6. – С. 60–65.
6. Система автоматизации библиотек ИРБИС.
ГПНТБ России. Общее описание системы. Приложения. – Москва, 2002. – 322 с.
|