Home page | Каталоги и базы данных

Научные и технические библиотеки

УДК 025:65.011.56

Васильев А.В., Власова С.А.,
Глушановский А.В., Каленов Н.Е.

Типовая система для распределенной подготовки
библиографических баз данных

В течение 1994—1997 гг. специалистами БЕН РАН по гранту Российского фонда фундаментальных исследований велась разработка программного обеспечения двухуровневой информационно-аналитической системы "Наука России" [1, 2]. Основная задача системы — организация децентрализованного ввода библиографических данных с последующим их объединением и централизованной обработкой. Система состоит из локального и центрального комплексов.

Локальный комплекс (РОНА-Л), являвшийся по первоначальному замыслу типовым программным средством лишь для ввода данных, в процессе разработки превратился в самостоятельную, достаточно развитую информационную систему. В настоящее время комплекс обеспечивает:

  • инсталляцию баз данных с настройкой на ввод произвольных полей, часть из которых можно объявить обязательными, часть — выбираемыми из настраиваемых таблиц и файлов иерархической структуры типа рубрикаторов ВАК и ГРНТИ; любые поля могут быть объявлены ключевыми, по которым в процессе ввода строятся индексные файлы, обеспечивающие в дальнейшем быстрый поиск информации;

  • комплексный диалоговый ввод информации в систему подбаз данных (персоналии, организации, публикации, источники) с возможностью указания связей типа "библиографическая ссылка" и выбором значений полей из списка уже введенных; при вводе может быть реализован режим использования нормативных записей (подбаза персоналий — аналог файла нормативных записей индивидуальных авторов, подбаза организаций — аналог файла коллективных авторов);

  • пакетный ввод информации из экспортных файлов, аналогичных по структуре выходным файлам результатов поиска данных в системе Science Citation Index на CD—ROM;

  • пакетный ввод информации из текстовых файлов, содержащих библиографические описания публикаций, подготовленные в соответствии с ГОСТ 7.1—84; в процессе ввода осуществляется структурирование записей по основным элементам библиографического описания (индивидуальные и коллективные авторы, название, источник, год, выпуск, страницы);

  • редактирование введенной информации (в том числе последующий доввод в записи новых полей);

  • слияние баз данных, сформированных на разных компьютерах;

  • исключение дублированных записей. Одной из серьезных проблем, возникающих при децентрализованной подготовке библиографической информации, является появление логически дублированных записей (библиографических описаний, относящихся к одним публикациям), выявление которых стандартными средствами СУБД во многих случаях невозможно из-за различий в описаниях документов. В связи с этим возникает задача разработки специальных методов, алгоритмов и программного обеспечения для выявления и исключения подобных записей. В процессе работы над комплексом "РОНА-Л" такая задача решена — специальный модуль комплекса выявляет пары записей, "подозрительные" с точки зрения совпадения, и предлагает пользователю исключить одну из них или оставить в базе данных обе;

  • поиск информации и получение статистических данных как внутри отдельных подбаз, так и по комплексной системе; при этом реализован специальный алгоритм, обеспечивающий ускорение поиска;

  • вывод найденной информации в файлы различной структуры, в том числе формат HTML, текстовые файлы библиографических описаний и т. д.;

  • возможность формирования фрагмента исходной базы данных, содержащего результат выборки информации в соответствии с запросом.

Комплекс "РОНА-Л" разрабатывался в расчете на самую простую технику, которой обладают небольшие библиотеки. Программы написаны на языке "Си" в среде MS—DOS, рассчитаны на неподготовленного пользователя — сотрудника библиотеки и могут работать на любом IBM — совместимом ПК, начиная с АТ/286. Комплекс успешно работает во многих библиотеках институтов РАН и ряде ведомственных библиотек. С его помощью децентрализованно создана, пополняется и централизованно поддерживается в Институте физики Земли РАН библиографическая база данных по геофизическим методам разведки, включающая в настоящее время более 50 тыс. документов; при ее создании, благодаря использованию возможностей программного обеспечения, выявлено и исключено несколько тысяч дублированных записей. На основе комплекса построен сводный каталог книг и продолжающихся изданий централизованной системы библиотек БЕН РАН, работающий в локальной сети библиотеки и доступный с нескольких десятков рабочих мест.

Как показывает практика, комплекс "РОНА-Л" может с успехом использоваться не только для создания библиографических баз данных и баз данных типа "Who is who...", но также для организации системы ИРИ, ведения служебных баз данных в рамках межбиблиотечного абонемента и т. п.

Центральный комплекс, работающий под управлением СУБД Visual FoxPro 5.0., обеспечивает загрузку данных, подготовленных в рамках локального комплекса, поиск информации как в режиме локальной сети, так и через Интернет с использованием стандартных программ Netscape Navigator и Internet Explorer.

При разработке центрального комплекса использовались стандартный SQL-сервер Visual FoxPro 5.0 и Internet-сервера (IIS 3.0 — для работы в среде Windows NT 4.0 и PWS 10a для работы в среде Windows-95). В настоящее время центральный комплекс проходит опытную эксплуатацию в БЕН РАН.

СПИСОК ЛИТЕРАТУРЫ

1. Васильев А.В., Власова С.А., Глушановский А.В., Каленов Н.Е. Автоматизированная система "Наука России" // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества. Материалы конф. Евпатория. Респ. Крым, Украина, 23—28 мая 1994 г. М., 1994. С. 147—148.

2. Васильев А.В., Власова С.А., Глушановский А.В., Каленов Н.Е., Николова А.И. Опыт использования программного обеспечения системы "Наука России" для децентрализованной подготовки библиографических баз данных // Информационные продукты, процессы и технологии. Материалы конф. (НТИ-96, Москва, 20—21 нояб. 1996 г.). М., 1996. С. 93—94.


Copyright © 1995-99 ГПНТБ России