Home page | Каталоги и базы данных

Научные и технические библиотеки

Захаров В.П.

Библиотека Академии наук России


Создание системы информационного обеспечения проблем консервации и реставрации библиотечных фондов

Реставрация и консервация библиотечных фондов и материалов является новой научно-практической сферой деятельности в области науки и культуры. Это прикладная наука, вырастающая на стыке химии, физики, микробиологии, энтомологии и т.д.

Информационное обеспечение (ИО) проблем этой новой науки имеет свою специфику. В первую очередь это: 1) проблемы отбора источников информации, их большое рассеяние; 2) несложившаяся терминологическая система; 3) значительная роль фактографической информации; 4) наличие специфических задач, лежащих на стыке ИО и проблем сохранности (например, задача создания электронных образов изображений).

Два года назад в БАН России начата разработка комплексной информационной системы, базирующейся на совокупности связанных между собой баз данных, которые обеспечили бы информационную поддержку работ, ведущихся в БАН России по этому направлению, и позволили бы получать данные о текущем состоянии фондов библиотеки и определять методы консервации, учитывающие экологическую обстановку в хранилищах и текущее состояние фонда. Толчком и прообразом этой темы послужили работы по созданию компьютерной базы данных "Фонд Бэра" в рамках программы фазовой консервации, направленной на спасение книг, пострадавших при пожаре 1988 г.

База данных и знаний по превентивной консервации библиотечных материалов должна представлять собой сложный программно-информационный комплекс, состоящий по крайней мере из трех подсистем:

  • документально-библиографической системы научно-технической информации по консервации и реставрации библиотечных материалов;
  • фактографической базы данных, описывающей состояние книг, экологическое состояние книгохранилищ;
  • экспертной системы, призванной играть роль интеллектуальной справочной системы для специалистов по консервации и реставрации.

Эта тема выполняется в рамках государственной программы "Федеральный фонд науки и техники" сравнительно небольшим временным творческим коллективом из числа сотрудников научно-исследовательского отдела консервации документов, лаборатории профилактики биоповреждений и отдела информатики и автоматизации БАН России.

Кратко перечислим, что делается и сделано в БАН России по этой теме.

  1. Определены основные источники информации для формирования БД. Особенность данной системы заключается в том, что источники информации отличаются крайней рассеянностью. Часть исследований по реставрации и консервации в нашей стране проводилась в закрытых организациях, информация о них малодоступна. Что касается зарубежных источников информации (книг и журналов), то они в отечественных библиотеках большей частью отсутствуют или рассеяны таким образом, что трудно собрать о них сведения. В технологии поиска документальных источников планируется поиск по библиографическим ссылкам на основе указателя цитирования литературы Science Citation Index, выпускаемого Институтом научной информации США и представленного в БАН России в виде базы данных на CD—ROM. Следующая особенность — это реальное многоязычие информации.
  2. Создана библиографическая ИПС и БД по указанной предметной области и осуществляется ее опытная эксплуатация. Начало БД положила библиография, представленная книгой патриарха мировой консервации Дж. Куньи. Объем БД — более 10 тыс. библиографических записей.
  3. Накоплен документальный полнотекстовый материал по данной предметной области общим объемом 1,5 Мб, включая тексты на русском и английском языках по следующим темам: консервация и реставрация, биологическое повреждение бумаги, сохранность библиотечных фондов и др. Среди этих материалов значительное место занимают труды и разработки сотрудников БАН России. Полнотекстовая БД создается с помощью ИПС АГАМА.
  4. ИПС АГАМА представляет собой информационно-поисковую систему нового поколения. В настоящее время это, по-видимому, единственная система этого класса, предназначенная для работы с полнотекстовыми (первичными) документами на IBM-совместимых ЭВМ, обладающая развитыми средствами морфологического анализа и грамматической нормализации лексики как для русского, так и для английского языков.

  5. Разработан макет информационно-поискового тезауруса (ИПТ) и осуществляется его опытная эксплуатация. Фактически ИПТ — это понятийная классификация. При его составлении используется отношение "род — вид", т.е. деление общих понятий на частные, и некоторые другие релевантные для данной БД лексико-семантические связи понятий. Параллельно с классификацией лексики "сверху вниз", т.е. от общих понятий к частным, конкретным, проводилось объединение ключевых слов в классы условной эквивалентности и выделялись дескрипторы. В качестве дескрипторов выбирались слова английского языка, хотя БД содержит информацию на русском, немецком, французском, итальянском, испанском, голландском и других языках. По сути дела, создается многоязычный ИПЯ. Таким образом была сформирована основа дескрипторного ИПТ, насчитывающая в настоящее время около 2,5 тыс. ключевых слов, сгруппированных в 897 дескрипторов. Этот макет ИПТ в 1994 г. использовался при опытной эксплуатации библиографической БД.
  6. Разработана методика индексирования в библиографической БД. Формируется архив типовых запросов. Массив запросов формируется на основе тематического рубрикатора системы, разработанного авторитетным специалистом в области реставрации и консервации документов доктором биологических наук, проф. Ю. П. Нюкшей. В ходе опробования лингвистического обеспечения осуществлялось, по сути дела, "выращивание" документальной системы. Реальная эксплуатация системы и отработка различных аспектов ее лингвистических средств ведутся одновременно и параллельно, и система начинает выдавать информацию почти с "нулевого цикла" работ.
  7. Для построения процедур отбора терминологической лексики созданы частотные словари квазиоснов к текстам предметной области объемом 500 тыс. знаков и специальные программы создания и использования этих словарей. Создана первая редакция словаря терминологической лексики для данной предметной области.
  8. Исследовались иностранные источники информации, отраженные в нескольких зарубежных банках данных. БАН России планирует подключение к ним в режиме теледоступа в целях удовлетворения информационных потребностей всех заинтересованных пользователей как в библиотеке, так и в С.-Петербурге. Пока же с дек. 1993 г. БАН России подключилась к банку данных информации по консервации и реставрации в Стэнфордском университете (США) в режиме телеконференции.

По содержанию информационные сообщения телеконференции можно подразделить на сообщения, содержащие научно-техническую информацию, и сообщения организационного характера (о предстоящих конференциях, создании и изменении статуса профессиональных организаций, адресную информацию и т. п.). По некоторым из обсуждаемых проблем в телеконференции развертывается дискуссия. На основе сообщений телеконференции уже получено значительное количество разнообразной информации, которая накапливается и загружается в ИПС АГАМА.

Потребности в учете и планировании работ по консервации и реставрации в БАН России диктуют насущную необходимость разработки и создания фактографических баз данных, фиксирующих состояние библиотечных материалов в книгохранилищах. В частности, должна быть создана такая база данных для книг библиотеки Петра I. В связи с этим разрабатывается специальный машинный формат, включающий в себя как элементы библиографического описания редких и рукописных книг, так и элементы фактографии, необходимые для работы специалистов по консервации и реставрации книг.

Можно сказать, что разработанная в БАН России система информационного обеспечения проблем консервации и реставрации библиотечных фондов в скором времени сможет обслуживать не только сотрудников библиотеки, но и всех специалистов в данной области в Санкт-Петербурге и России. Наряду с созданием баз данных по консервации и реставрации, в 1995 г. БАН России приступает к выпуску бюллетеня по данной теме.

Copyright © 1995-97 ГПНТБ России