Home page | Каталоги и базы данных

Научные и технические библиотеки
Мазов Н.А., Малицкий Н.А.,
Баженов С.Р., Баженов И.С.,
Жижимов О.Л.

Объединенный институт геологии,
геофизики и минералогии СО РАН,
ГПНТБ, СО РАН, Новосибирск

Web-ориентированная информационно-поисковая
система для доступа к базам данных CDS/ISIS

В Сибирском отделении РАН исторически сложилось так, что его библиотечно-информационные ресурсы формируются под управлением СУБД CDS/ISIS. В настоящее время накоплены довольно крупные информационные массивы, основными держателями которых являются ГПНТБ СО РАН и информационно-библиотечные центры институтов СО РАН. Один из них — Информационно-библиотечный центр Объединенного института геологии, геофизики и минералогии (ОИГГиМ) СО РАН.

Выбор данной СУБД обусловлен следующими факторами: относительно высокой производительностью обработки данных, не требующей значительных вычислительных ресурсов (техническая оснащенность библиотек и информационных центров всегда оставляла желать лучшего); спецификой структуры библиографических данных (свободно-текстовой нечисловой структурированной информацией, удовлетворяющей рекомендациям стандарта ISO 2709); требованиями специализированного программного обеспечения, каким и явился СУБД CDS/ISIS; CDS/ISIS — некоммерческий продукт.

Для работы с БД в стандартном CDS/ISIS пользователь должен обладать определенными знаниями языка запросов, а также навыками работы в среде СУБД CDS/ISIS. Это вызывало определенные трудности при работе с БД как для научных сотрудников, так и для рядовых читателей, не всегда хорошо подготовленных к работе с информационно-поисковой системой. При создании принципиально новой схемы доступа к библиотечно-информационным ресурсам СО РАН необходимо было учесть эту проблему.

Идеальным решением в данной ситуации стало использование Интернет технологий на основе протокола НТТР. При этом мы как бы переходим к технологии "клиент-сервер", которая лишена недостатков технологии "файл-сервер" (снижается сетевой трафик, уменьшаются требования к вычислительным ресурсам рабочей станции пользователя, отсутствует дублирование ресурсов). Схема взаимодействия при этом выглядит следующим образом: клиент (пользователь) посылает запрос серверу, который им (сервером) исполняется, после чего результат поиска передается обратно клиенту. Клиент в данном случае — это рабочая станция с установленным Web-браузером. Сервер — станция со значительными вычислительными и дисковыми ресурсами с установленным Web-сервером (для взаимодействия с Web-браузером клиента), который через сервер баз данных CDS/ISIS получает информацию из БД в ответ на запрос клиента и отсылает ее обратно клиенту. Пользователь может применять любую ОС (Windows, Unix, Mac т.д.) и Web браузер (Internet Explorer, Netscape Navigator и др.). При этом предполагается, что интерфейс работы с БД будет везде иметь один и тот же вид. Этим достигается унификация пользовательского интерфейса системы. Набор элементов экранной формы должен быть жестко типизирован и прост, что позволит упростить требования к подготовленности пользователя для работы с БД. Ему достаточно уметь работать с Web браузером и изучить справочный материал системы о правилах составления поискового запроса.

Ключевым моментом при создании такой системы доступа к ресурсам CDS/ISIS был выбор поисковой машины, которая обеспечивала бы полную функциональность и высокое быстродействие. Под функциональностью в данном случае понимались: возможность взаимодействия с Web-сервером для обмена информацией при обработке запросов клиента к БД и выдаче результатов поиска; наиболее полный набор функций для обработки данных БД CDS/ISIS (поиск, работа со словарем, вывод результатов поиска, ввод, обновление и др.).

В настоящее время существуют несколько вариантов серверов БД CDS/ISIS (в том числе собственной разработки), на которых мы не будем заострять внимание, так как принято решение выбрать программу WWWISIS (разработка BIREME/PAHO/ WHO, Бразилия). Следует заметить, что на данный момент BIREME/PAHO/WHO — один из ведущих центров по разработке программного обеспечения для БД под управлением CDS/ISIS. Одним из его направлений является разработка сервера БД CDS/ISIS WWWISIS для WWW Windows NT. Существуют также версии сервера WWWISIS для наиболее распространенных аппаратных платформ. Сервер WWWISIS взаимодействует с Web-сервером через интерфейс CGI, который на сегодня поддерживается всеми существующими Web-серверами. Использование Win32 API в версии WWWISIS для MS Windows NT позволяет существенно повысить быстродействие одновременной (многопользовательской) обработки запросов к БД CDS/ISIS (многопоточность при выполнении запроса) по сравнению с быстродействием традиционной СУБД CDS/ISIS (ЮНЕСКО). Следует также заметить, что наряду с сервером WWWISIS производитель предлагает документацию, содержащую подробное описание всех функциональных возможностей сервера. Достаточно отметить, что сервер WWWISIS реализует следующие функции: взаимодействие с Web-сервером, выполнение поискового запроса к БД, работу с словарем поисковых терминов, вывод результатов поиска, ввод новых записей в БД, редактирование и удаление существующих записей БД, сортировку результатов поиска по различным полям БД, блокирование данных, экспорт/импорт записей БД в формате ISO—2709, а также набор функций для диагностики работы сервера в процессе обработки запросов пользователя. При этом производитель постоянно совершенствует функциональность сервера в его последующих версиях. Немаловажным фактором стала возможность бесплатного приобретения данного программного продукта.

Приведем ряд наиболее актуальных требований к интерфейсу создаваемой системы:

  • обеспечение возможности работы пользователя с системой с учетом используемого им клиентского программного обеспечения (возможность выбора кодовой таблицы — Windows, Unix, Mac, Dos);

  • безукоризненная работа системы с доминирующими Web-браузерами (IE 3.0 и Netscape 3.0 и выше);

  • выбор оптимального разрешения экрана (800х600);

  • использование стандартных унифицированных средств (HTML, JavaScript) для отображения запрашиваемой информации;

  • полностью текстовой интерфейс экранных форм и как следствие минимизация времени доступа к информации (исключение графических изображений, что существенно позволяет снизить сетевой трафик);

  • обработка полноты и корректности данных экранных форм на стороне клиента (возможностями используемого Web-браузера) без участия сервера (уменьшения количества транзакций "клиент-сервер");

  • эргономичность интерфейса (использование спокойных тонов, расположение кнопок и окон для ввода, сохранение значений экранной формы при возвращении к ней, прозрачность значений элементов экранных форм, возможность выбора пользователем режима поиска с учетом собственных требований и квалификации, наличие краткой и конкретной справочной информации по работе с системой);

  • полная функциональность в рамках решаемой задачи поиска информации (несколько режимов поиска; наличие разнообразных сервисных возможностей: выбор поисковых терминов из словаря БД, выбор формата, порций выдаваемой информации, навигация внутри выданных результатов поиска (переход к любой записи из найденного диапазона), подсветка поисковых ключей в тексте найденных записей, сохранение результатов поиска в файл);

  • наличие контактного адреса службы администрирования БД для осуществления обратной связи с пользователями (внесения замечаний и предложений по дальнейшему развитию системы).

Исходя из этих требований в СО РАН (ГПНТБ, ОИГГиМ) разработана Web-информационно-поисковая система, которая сегодня успешно функционирует в трех организациях Сибирского отделения РАН.

Основные свойства реализованной системы:

1. Доступ к ресурсам той или иной организации может обеспечиваться как для внутренней пользовательской сети, например доступ к БД Информационно-библиотечного центра ОИГГиМ СО РАН (в этом случае в системе устанавливается ограничение прав доступа только по IP-адресам пользователей), так и для внешних пользователей, например доступ к БД ГПНТБ СО РАН (в этом случае в системе предусмотрена полная аутентификация пользователей).

2. БД в описываемой системе включены в группы для структуризации информации. Пользователь может выбрать для работы одну или несколько групп БД. В этом случае будет сформирован объединенный список БД из этих групп. Это особенно важно при проведении одновременного поиска в БД, выбранных пользователем. В зависимости от сложности поискового запроса пользователь может выбрать любой из четырех режимов поиска: Простой, Стандарт, Эксперт, Мультипоиск (перечислены по возрастанию сложности).

3. Все режимы кроме первого дают возможность выбора поискового термина из словаря текущей БД и переноса его в формируемый запрос (режимы Эксперт и Мультипоиск в отличие от режима Стандарт предлагают помимо выбора одного значения поискового термина словаря БД осуществлять их групповой выбор). Режим Мультипоиск предназначен для проведения одновременного поиска в одной или нескольких базах данных. Выдача результатов поиска происходит в выбранном пользователем формате выдачи и определяемыми порциями. При выдаче результатов поиска предлагается следующий сервис: оперативная смена формата выдачи, прямой переход к любой странице или записи из списка найденных записей, подсветка значений поисковых терминов в тексте выдаваемых записей, сохранение текущей записи или списка отмеченных записей в ASCII файл на компьютере клиента, оперативное проведение повторного уточняющего поиска по заранее определенным полям с возможностью возврата к основному запросу.

4. Для всех режимов поиска существует подробная справка по формированию поискового запроса. Это особенно важно при использовании режимов Эксперт и Мультипоиск, так как в этом случае пользователь должен достаточно хорошо владеть языком составления запросов для БД CDS/ISIS. Пользователь в любой момент работы с БД может перейти из текущего в любой другой режим поиска, сменить текущую БД или группу БД. Имеется возможность получить краткое описание текущей БД.

5. В процессе эксплуатации описываемой системы доступа к БД разработана и внедрена система сбора и обработки статистики обращений к БД организации. В реализованной версии системы предусмотрен сбор следующей статистической информации: информация, идентифицирующая клиента; используемые кодировка и Web-браузер; режим поиска и источник информации; дата и время проведения поиска; трафик. Эти данные в свою очередь позволяют получать отчеты об использовании и актуальности предоставляемых ресурсов, проводить анализ дальнейшего развития системы в целом, выявлять приоритетные научные направления, а также решать другие задачи, связанные с использованием информационных ресурсов различными группами пользователей.

В заключение отметим, что описанная система находится в эксплуатации более года и за это время показала свою жизнеспособность. Тем не менее она постоянно совершенствуется, что естественно для системы такого класса. Более подробно ознакомиться с ее работой можно по следующим адресам: http://info. spsl.nsc.ru — ГПНТБ СО РАН, http://geolibr.uiggm.nsc.ru — ОИГГиМ СО РАН.


Copyright © 1995-2000 ГПНТБ России