Home page | Каталоги и базы данных

УДК 930.25:681.3

Филимонова Т.И., Емельянова Л.В.

Особенности представления архивных материалов
в машиночитаемой форме

Рассмотрены основные принципы создания электронного каталога архивных материалов XVIII-XX вв., хранящихся в Доме Плеханова - секторе Российской национальной библиотеки, структура полей при их описании и практическая реализация поставленных задач.

В условиях интенсивного развития компьютерной техники и перспективных технологий Интернет-библиотека перестает быть лишь хранилищем культурного наследия человечества.

Предоставление информации обо всех хранящихся документах - одна из самых актуальных и сложных задач, стоящих перед библиотеками. В настоящее время практически все крупные фонды ведут электронную обработку новых поступлений, однако архивные и рукописные материалы вследствие сложности структурирования описаний практически не представлены в электронной форме.

Существуют и объективные причины: нет разработанного формата для описаний подобного типа документов; при большом потоке современных изданий задача автоматизации процессов обработки рукописных отделов отодвигается, как правило, на второй план, поскольку читателей, пользующихся рукописными материалами, несравнимо меньше основного потока абонентов, а потому трудозатраты на создание электронного каталога рукописей значительно превышают уровень его востребованности.

Однако сама возможность приобщения людей к ценным историческим источникам и их изучение вне зависимости от степени удаленности от источников, качественно новый уровень обработки и раскрытия фондов, обеспечение задач сохранности угасающих текстов и изображений делают необходимым создание электронных каталогов рукописных материалов. В конечном счете окупаются и трудозатраты.

Дом Плеханова - сектор Российской национальной библиотеки - создан в 1928 г. как научно-исследовательский институт по изучению истории общественной мысли и рабочего движения России и Европы. Его основой стали переданные семьей Плеханова в дар Советскому Союзу архивы и личная библиотека выдающегося философа, деятеля международного революционного и общественного движения Георгия Валентиновича Плеханова (1856-1918), членов группы "Освобождение труда", их соратников и единомышленников.

Сегодня здесь хранятся свыше 40 фондов общим объемом более 30 тыс. документов. Среди них фонды Л.Г. Дейча, В.И. Засулич, П.П. Маслова, П.Н. Милюкова, Р.М. Плехановой, Н.С. Русанова, П.Б. Струве, архив С.-Петербургской Духовной академии и др. В них сосредоточены материалы по русской и зарубежной истории, философии, искусству, истории религии и религиоведению, литературе, экономике; широко представлен разнообразный иконографический материал. Значительную часть коллекций составляет обширная переписка фондообразователей и лиц, входивших в их ближайшее окружение. В качестве примера достаточно привести имена Л.И. Аксельрод, А.В. Амфитеатрова, В.В. Болотова, Н.Н. Глубоковского, А.М. Горького, К. Каутского, Д. Кеннана, М. Лозинского, Б.В. Савинкова (Ропшина), А.Н. Скрябина, Т.Л. Щепкиной-Куперник и многих других, составивших гордость не только нашего Отечества, но и Мира в целом.

Личные фонды Г.В. Плеханова, послужившие основой для создания электронного каталога архивных материалов, включают:

книги и периодические издания личной библиотеки Г.В. Плеханова, насчитывающие более 9 тыс. документов на 18 европейских языках, 1,5 тыс. из которых содержат пометки Г.В. Плеханова;

архив Г.В. Плеханова - 5 030 документов, состоящий из биографических материалов, произведений (редакций и вариантов рукописей, подготовительных материалов, в том числе планов, заметок, постраничных разборов книг, рефератов, выписок из книг, фрагментов переводов), переписки, рукописей других лиц, листовок, иконографического материала.

Уже первые обработчики архива столкнулись с проблемами, часть которых и поныне остаются нерешенными: ряд материалов поступил в разрозненных листах, с многосложной пагинацией, некоторые из них на обеих сторонах листа содержат не связанные между собой записи.

Ряд материалов написан под диктовку Г.В. Плеханова его секретарями и помощниками; почерк самого Георгия Валентиновича менялся на протяжении жизни, что также создает значительные трудности при определении авторства.

Объективную сложность представляет атрибутация и расшифровка помет. Г.В. Плеханова на книгах: некоторые пометы частично утрачены при проведении переплетных работ, другие, выполненные карандашом, постепенно "затухают".

Состав хранящихся в Доме Плеханова документов является в определенной мере типичным для большинства существующих не только в нашей стране, но и за рубежом архивов, в которых основной массив материалов относится к XVIII-XX вв., периоду, когда история стала приобретать всемирный характер. Именно поэтому, как нам представляется, приобретенный опыт может оказаться полезным для аналогичных учреждений, решающих задачи раскрытия фондов и введения культурных памятников в научно-информационный оборот, обеспечения сохранности текстов и художественного оформления исторических документов.

Первые шаги в этом направлении предприняты в 1993 г., однако в то время библиотека не располагала достаточными техническими средствами для создания электронных каталогов книжных изданий, архивных материалов и их оцифровки. Это стало возможным только в 1997 г.

За это время был выработан концептуальный подход к проблеме создания банка данных архивных документов, определены поля описания рукописных материалов, найдено решение для формирования описаний с использованием многоуровневой системы справочников. В настоящее время осуществляется ввод рукописных материалов, относящихся к переписке Г.В. Плеханова (наименее изученной и фрагментарно введенной в научно-информационный оборот коллекции, являющейся в то же время наиболее значительной как в количественном, так и в качественном отношении), и отработка экспериментального варианта программы. В дальнейшем планируется поэтапный охват всех типов документов (архивных, книжных, иконографических), хранящихся в Доме Плеханова, целью которого является создание элемента единой информационно-поисковой системы РНБ.

Основными концептуальными положениями при создании электронного каталога архивных материалов стали:

интегрируемость в информационную систему (ИС) РНБ и предоставление в дальнейшем накопленных данных в Интернет;

гибкость архитектуры ИС, что дает возможность ее постоянного усовершенствования;

максимальный охват поисковых элементов системы для осуществления результативного поиска.

При выборе формата описания архивных и рукописных материалов за основу принят RUSMARC (Российский коммуникативный формат представления авторитетных/нормативных записей в машиночитаемой форме для книжных изданий), созданный на основе UNIMARC.

Структура основных полей формата подробно описана [1,2]. В таблице, представленной ниже, приведен основной список полей и подполей, которые добавлены для описания документов типа переписки (при этом использовалось правило включения в идентификатор поля или подполя цифры 9).

Таблица

Поле

Подполе

Назначение

Подключаемый
справочник

500

  Унифицированное заглавие  
 

$9i

Начальная строка текста письма  
 

$9p

Примечание  

620

  Место (административно-тер.) написания рукописи  
 

$9v

Ставится "?", если данные поля 620 ставятся под сомнение  

7_

  Интеллектуальная ответственность  
 

$9v

Ставится "?", если данные поля интеллектуальной ответственности ставятся под сомнение. Это же подполе введено во все поля интеллектуальной ответственности.  

796

  Адрес отправителя  
 

$a

Страна Географический файл
 

$b

Город Географический файл
 

$c

Улица Файл улиц
 

$d

Дата (ггггммдд)  
 

$p

Примечание  

798

  Адрес получателя  
 

$a

Страна Географический файл
 

$b

Город Географический файл
 

$c

Улица Файл улиц
 

$d

Дата (ггггммдд)  
 

$p

Примечание  

899

  Данные об экземпляре  
 

$a

Организация Файл организаций
 

$b

Фонд Файл фондов
 

$b

Опись Файл описей
 

$j

Шифр  
 

$p

Единица хранения  
 

$z

Примечание  

917

  Научная датировка  
 

$a

Дата, указанная в рукописи  
 

$9n

Научная датировка (поздняя временная граница)  
 

$9k

Научная датировка (ранняя временная граница)  
 

$y

Словесная формулировка (для распечатки)  
 

$p

Примечание  

918

  Материал (на чем написано) - физическая характеристика  
 

$a

Листы  
 

Sb

Материал Файл материалов
 

$c

Размер  
 

$d

Цвет Файл цветов
 

$y

Словесная формулировка (для распечатки)  
 

$p

Примечание  

919

  Материал письма (чем написано)  
 

$a

Листы  
 

$b

Материал письма (чернила, краска, графит и т. П.) Файл материалов письма
 

$c

Размер  
 

$d

Цвет Файл цветов
 

$y

Словесная формулировка (для распечатки)  
 

$p

Примечание  

923

  Бланки  
 

$a

Листы  
 

$b

Бланк организации / именной Файлы организаций, именной, родовых имен
 

$y

Словесная формулировка (для распечатки)  
 

Sp

Примечание  

924

  Нумерация листов (страниц)  
 

$a

Нумерация  
 

$b

Чистые листы  
 

$p

Примечание  

928

  Разлиновка  
 

$a

Листы  
 

$b

Ширина строк  
 

$c

Число строк  
 

$y

Словесная формулировка (для распечатки)  
 

$p

Примечание  

942

  Почерки  
 

$a

Листы  
 

$b

Почерк (условный порядковый номер и краткая характеристика)  
 

$c

Писец Файл именной
 

$w

Имя файла "изо" Файл изображений
 

$y

Словесная формулировка (для распечатки)  
 

$p

Примечание  

979

  Библиография  
 

$8

Язык публикации Файл кодов языков
 

$b

Тип публикации Файл типов публикации
 

$c

Библиографическое описание публикации без указания стр. Файл библиограф. описаний

980

  Сохранность рукописи (общая оценка)  
 

$a

Дата оценки (ггггммдд)  
 

$b

Категория сохранности Файл категорий сохранности
 

$p

Примечание  

989

  Упоминаемые документы в тексте рукописи  
 

$a

Упоминаемые документы Файл документов
 

Sp

Примечание  

990

  Тип документа (автограф, машинописная копия и т. п.)  
 

$a

Тип документа Файл типов документов

991

  Упоминаемые географические или административно-территориальные объекты  
 

$a

Страна/географическая местность Географический файл
 

$b

Город Географический файл
 

$c

Улица Файл улиц
 

$p

Примечание  

Файлы географических названий, имен, организаций и родовых имен построены по принципу авторитетных файлов, структура которых описана в [3]. При формировании записей типа авторитетных, применяемых при заполнении полей анализа содержания (блок 6), данные файлы используются как справочники в соответствующих подполях, а также в тех подполях, где по смыслу необходимо их подключение. Авторитетный контроль формируемых справочников предполагается проводить специалистами отделов РНБ, отвечающих за ведение авторитетных файлов.

При создании иерархической структуры полей, приведенной в таблице, мы руководствовались следующими принципами:

актуальностью поля или подполя для дальнейшего его использования в качестве поискового элемента;

возможностью представления данных полей и подполей для отображения информации в виде карточки, списка, всевозможных указателей, графического изображения архивного документа или его фрагментов;

способностью к адаптации в условиях неизбежных изменений формата;

возможностью конвертирования данных в поля коммуникативного формата.

Создание многофункционального информационно-поискового аппарата, состоящего из иерархической системы справочников, которые обеспечивают различные уровни доступа к информации и учитывают разнообразные задачи сотрудников сектора, читателей и исследователей, является наиболее важным и сложным этапом проектирования. Решение данной проблемы осложняется тем обстоятельством, что для выполнения научных изысканий нельзя заранее определить весь спектр поисковых элементов, за исключением справочников типа авторитетных записей, хотя и их структура изменяется и дополняется в процессе эксплуатации.

Значительным результатом экспериментального этапа стала разработка системы справочников, формирование которых происходит по мере ввода информации о документе в электронный каталог. Их максимальное использование позволяет прибегнуть к однократному вводу повторяющихся элементов описания, унификации терминологии однотипной информации и формированию поисковых запросов. Такой подход обеспечивает, на наш взгляд, наиболее точную выборку записей, удобный сервис при создании поискового выражения и сводит до минимума информационный шум, неизбежный при выборе в качестве поискового элемента строки текста.

Другим важным элементом предлагаемой структуры данных стал поиск по вспомогательным полям, которые делают представление о документе максимально полным. Его создание обусловлено необходимостью обеспечить субъективный подход формирования поисковых выражений при исследовательской работе с данными электронного каталога. Несмотря на возможный информационный шум, данная выборка может натолкнуть исследователя на проведение ассоциативного поиска. Это знакомо всем, кто собирал какую-либо информацию в Интернете. Вместе с тем важно найти оптимальное сочетание поисковых и условно-поисковых элементов, иначе существует опасность того, что ростки исследовательских находок потонут в информационном шуме.

Существенным аспектом информационно-справочного аппарата стало введение в его структуру оцифрованных данных документа и вспомогательного изобразительного материала, которые значительно сокращают ввод описательной информации, не являющейся поисковой. Соответствие изображения определенным полям описания документа достигается путем ссылки на файл. Таким же образом имя файла изображения участвует при выборке записей из электронного каталога. Данный механизм позволяет одновременно, разграничив ввод описательных характеристик документа и оцифровку его фрагментов, использовать данные в единой поисковой среде.

Такой подход может оказаться особенно плодотворным при определении авторства документа по почерку. Создаваемый при этом справочник увеличивает вероятность наиболее корректной установки авторства и времени создания исторического документа.

Предварительный анализ полученных результатов позволяет сделать вывод о возможности формирования оптимальной структуры данных для описания архивных и иконографических материалов и их исследования в рассмотренном электронном каталоге. Добавленные поля, перечисленные ранее, легко адаптируются к изменениям формата и конвертируются в поля коммуникативного формата, что позволит в дальнейшем производить обмен записями.

Экспериментальный вариант программы работает в среде FOXPRO. После его завершения планируется переход на следующую версию программы в среде VC++.

Сложность поставленной задачи в условиях быстрого развития техники и информационных технологий требует постоянного усовершенствования программы и творческого подхода специалистов к созданию электронных каталогов и оцифрованных фондов.

Список литературы

1. Российский коммуникативный формат представления библиографических записей (Российский вариант UNIMARC). Книги и сериальные издания / М-во культуры РФ, РБА. С.-Петербург, 1998.

2. UNIMARC MANUAL: Руководство по применению международного коммуникативного формата UNIMARC / ГПНТБ России. М., 1992.

3. Российский коммуникативный формат представления авторитетных/ нормативных записей (Российская версия UNIMARC / Authorities) / РБА. С.-Петербург, 1998,

а также

Абрамова Н.Т. Ценности образования, новые технологии и неявные формы знания // Вопр. философии. № 6. 1998. С. 58-65.

Геранзон Бу. Практический интеллект // Там же. С. 66-78.

Злобин Н.С. Культурные смыслы науки. М., 1997.


Copyright © 1995-99 ГПНТБ России