Научные и технические библиотеки №2 2003 год
Содержание:

9-я МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ "КРЫМ–2002"

Секция 2. Автоматизированные библиотечные системы и технологии

Маршак Б.И. Современные проблемы разработки и внедрения автоматизированных библиотечно-информационных систем: системный подход и оценка программного окружения

Бродовский А.И. Система автоматизации библиотек ИРБИС: от третьего поколения к четвертому

Ступкин В.В. ИРБИС в библиотечных системах стран СНГ: типологический анализ и статистика

Мазов Н.А., Жижимов О.Л., Скибин С.В. Опыт построения распределенных информационных систем на основе протокола Z39.50

Грибов В.Т., Левова Л.В., Ефремов С.В., Трифонова Е.В. Автоматизированная информационно-библиотечная система "MARC-SQL": использование в библиотеках учреждений культуры, науки, образования

Сегберт М., Хохлов А.Ю., Вислый А.И., Рубина С.С. Новые электронные услуги для читателей Российской государственной библиотеки: проект РГБ – Фонд Эндрю У. Меллона

Шелюто О.Н., Скворцов В.В. Технологические аспекты внедрения автоматизированной системы в РНБ


Секция 3. Сетевые технологии, мультимедиа и Интернет в библиотеках

Гончаров М.В. Особенности библиотечных Интернет-комплексов

Федоров Б.Ф., Фридман В.П. Развитие технической базы Интернет-комплекса ГПНТБ России в рамках проектов Федеральной целевой программы "Электронная Россия"

Баженов С.Р., Баженов И.С., Федотов В.Б. Совершенствование веб-ориентированной системы управления базами данных CDS/ISIS

Нежурбеда Г.Г. Создание архивов Интернет-документов как новая задача национальных библиотек


Секция 6. Библиотечные кадры, профессия и образование

Адамьянц А.О. Новый взгляд на современные возможности обучения будущих библиотекарей: новые образовательные технологии кафедры информационных технологий и электронных библиотек МГУКИ

Кузнецова Т.Я. Дополнительное профессиональное библиотечное образование: концептуальные основы

Пилко И.С. Технологизация как тенденция развития библиотечного образования

Арзуханов А.С. Организация работы Учебно-методического центра ГПНТБ России

Очолла Деннис Н. Информационно-коммуникационные технологии в школах библиотековедения и информатики некоторых стран Африки


Секция 7. Информационно-лингвистическое обеспечение библиотечно-информационных систем

Зайцева Е.М. Универсальная десятичная классификация применительно к книжному делу: разработки и результаты практического использования


ИФЛА–2002

Эшкрофт Л. Цифровой разрыв и электронные технологии

Хаанк Д. Будущее электронных публикаций


ДИСКУССИОННЫЙ КЛУБ "ТЕРМИН"

Моргенштерн И.Г. Документ: информация и/или носитель?

Столяров Ю.Н. Документ: и информация, и носитель


Мазов Н.А., Жижимов О.Л., Скибин С.В.
Объединенный институт геологии,
геофизики и минералогии СО РАН,
Новосибирск

Опыт построения распределенных информационных
систем на основе протокола Z39.50.

Ряд организаций, располагающих библиографическими базами данных, работает в настоящее время над обеспечением унифицированного сетевого доступа к имеющимся ресурсам по стандартным протоколам для более широкого обращения к ним ученых, исследователей и других пользователей. Цель этих работ – построение единого информационного пространства и интеграция различных источников данных, т.е. создание распределенной информационной системы.

Однако в гетерогенной информационной среде, где используются серверы различных производителей, плохо взаимодействующих друг с другом (Orace, Informic, MS SQL Server, IBM DB2 и др.), возникают проблемы формирования единого информационного пространства. Все перечисленные серверы работают на фирменных протоколах обмена данными, а эти протоколы, как правило, несовместимы между собой. Поэтому на клиентском компьютере необходимо держать клиентское программное обеспечение для каждого из этих серверов.

Проблемы несовместимости протоколов обмена данными становятся неразрешимыми, когда в качестве единого информационного пространства рассматривается вся сеть Интернета или ее большая часть. Заранее неизвестно, какие серверы могут предоставить данные и какое клиентское программное обеспечение потребуется для доступа к ним.

Решение проблемы может быть лишь в унификации доступа к серверам любых производителей и базам данных. Именно для этой цели в мировом сообществе принят набор правил под общим названием Z39.50 [1,2].

В последнее время в России для построения информационно-библиотечных систем отмечается тенденция использования в качестве базового программного обеспечения небольшого числа отечественных АБИС целевого назначения. Их репертуар весьма скромен. По оценкам специалистов ГПНТБ России [3] более 95% потребностей АБИС покрывают пять-шесть сравнительно недорогих российских разработок.

Такое положение дел обусловливается еще и тем, что при внедрении больших СУБД с целью создания информационно-библиотечных систем возникает ряд трудностей:

  • имеющиеся в распоряжении у пользователей СУБД представляют собой достаточно сложные программные комплексы, для эксплуатации которых требуется наличие высококвалифицированных специалистов и значительных машинных ресурсов;

  • пользователи, имеющие опыт создания и эксплуатации систем, разработанных в соответствии с принципами "табличной" организации данных, часто бывают морально неподготовлены к восприятию принципов организации и ведения библиографических баз данных.

Таким образом, сложность существующих коммерческих СУБД, с одной стороны, предлагает наличие достаточно мощного машинного парка, а с другой – требует значительных усилий на их освоение и предъявляет повышенные требования к квалификации пользователей.

В целях обеспечения коллективного использования информационных ресурсов проведен анализ существующих информационно-поисковых систем для обработки больших информационных массивов, который показал, что системы подобного рода должны обладать следующими основными компонентами: собственно данные, программное обеспечение работы с данными, среда передачи информации, интерфейс пользователя.

На основании предшествующего опыта эксплуатации локальных и сетевых информационных систем, а также исходя из основных концепций протокола Z39.50, установлено, что распределенная информационная система должна отвечать следующим требованиям.

Возможность работы с распределенными данными – система должна допускать возможность работы с данными, расположенными на разных физических серверах, различных аппаратно-программных платформах и хранящихся в разнообразных внутренних форматах, в контексте одного клиентского сетевого соединения.

Логическая группировка данных – система должна позволять обрабатывать все запросы на логических группах баз данных, полностью скрывая тем самым физическое расположение последних.

Абстрактная модель данных – система должна строиться на основе абстрактной схемы данных, на которую должны быть отображены конкретные БД. Это позволяет объединять данные из разнородных систем в одной логической группе.

Абстрактная система запросов – система должна оперировать не конкретным синтаксисом запросов, а его логической сутью на основе абстрактных атрибутов.

Метаинформация – система должна предоставлять полную информацию о себе и обо всех своих ресурсах.

Разграничение доступа – система должна быть способна предоставлять различные уровни привилегий для пользователей по доступу к информации.

Учет и контроль – система должна уметь собирать статистические данные по запросам пользователей и вести их бюджеты.

Открытость – система должна допускать расширение и быть основана на открытых стандартах и протоколах.

Связь с другими системами – возможность интегрировать свои ресурсы с ресурсами других информационных систем.

Демократичность в общении – система должна предоставлять как простые и понятные для неподготовленного пользователя интерфейсы, так и профессиональные интерфейсы для доступа к информации.

Связь с WWW – система должна иметь шлюз для доступа к ней из WWW.

Реализация этих требований в реальной информационной системе позволила бы максимально удовлетворить сегодняшние потребности сетевого информационного сервиса для доступа к распределенным базам данных.

Авторами настоящего доклада построен прототип распределенной информационной системы, центральное место в которой занимает модульный сервер баз данных ZooPARK, поддерживающий протокол Z39.50, допускающий работу с данными различных СУБД и удовлетворяющий следующим требованиям: поддержка протокола Z39.50-1995 (v. 3), работа с различными СУБД, переносимость на различные аппаратные платформы.

Немаловажную роль играло желание максимально использовать существующие открытые разработки и библиотеки поддержки Z39.50, распространяемые другими разработчиками в исходных текстах. Это позволяет применить опыт, накопленный мировым сообществом, и избежать многих ошибок в реализации базовых функций Z39.50.

Включение в распределенную систему данных из новой СУБД для описываемого сервера ZooPARK сводится к разработке специального модуля с фиксированным программным интерфейсом (провайдер данных). Следует отметить, что функциональные характеристики сервера существенно зависят от возможностей провайдеров данных. Все провайдеры данных представляют собой динамически загружаемые библиотеки.

Распределенность информационной системы достигается двумя способами:

  1. Включение в комплектацию каждого сервера Z39.50 специального провайдера данных (Z-REMOTE для ZooPARK), способного открывать сеансы Z-связи с другими серверами, перенаправлять к ним запросы, получать ответы и возвращать последние ядру сервера.

  2. Установка серверного программного обеспечения в качестве промежуточного (между клиентом и серверами Z39.50) слоя, способность поддерживать множественные сеансы Z-связи. В качестве такого программного обеспечения используется шлюз НТТР-Z39.50, построенный на основе Z-CGI (разработка Объединенного института геологии, геофизики и минералогии – СО РАН).

В настоящее время в СО РАН создана распределенная информационная система, построенная на основе вышеописанного сервера Z39.50, для обеспечения доступа научных сотрудников к библиографической информации (в первую очередь аналитического характера – электронные варианты баз данных ВИНИТИ, каталогов библиотек и др.). Система состоит из ряда серверов Z39.50 ZooPARK, установленных в различных организациях и обеспечивающих доступ к базам данных под управлением CDS/ISIS (библиографическая аналитическая информация), реляционным базам данных MS SQL, MS ADO, MySQL (справочная информация, тезаурусы и классификационные схемы) и текстовым данным в формате SGML. Распределенность системы реализована двумя указанными выше способами. Информационная система также интегрирована в WWW через шлюз Z39.50-HTTP, функционирующий в среде серверов IIS для Windows или Apache для UNIX.

Следует отметить, что опыт эксплуатации серверов ZooPARK в составе информационной системы нашего института, распределенной информационной системы СО РАН, корпоративных распределенных библиотечных системах Новосибирска, Москвы, Омска и ряда других городов России показал его жизнеспособность и эффективность на больших информационных массивах библиографической информации. При этом особо следует отметить возможность перенаправления запросов (работа соответствующего провайдера Z39.50), логическое объединение пространственно разнесенных и разнородных баз данных (например, данных CDS/ISIS и MS ADO), время реакции системы. Примечательно, что сегодня в России именно этот сервер успешно применяется при построении распределенных информационно-библиотечных систем и занимает по различным оценкам от 60% до 70% серверного программного обеспечения Z39.50.

В ходе промышленной эксплуатации распределенной информационной системы дополнительно построены и протестированы специальные средства, расширяющие функциональные возможности эксплуатируемой системы. В частности, организован доступ к тезаурусам и различным классификаторам по схеме Zthes, музейным коллекциям по схеме CIMI. При этом для однозначной идентификации словарных статей тезаурусов применены оригинальные алгоритмы кодирования. В настоящее время ведутся работы по расширению возможностей сервера в части поддержки дополнительных функций Z39.50.

Таким образом, описанная выше технология построения распределенной информационной системы на основе протокола Z39.50 с применением сервера ZooPARK позволяет снять ряд ограничений, присущих оригинальным СУБД и информационным системам, а также обеспечивает расширение функциональных характеристик базовых СУБД, в частности, возможности работы с базами данных в режиме клиент-сервер, реализации мультибазовой концепции работы с данными, доступа к данным по стандартному открытому протоколу, интеграции баз данных с другими базами данных в гетерогенной информационной системе.

 

Список литературы

  1. ANSI/NISO Z39.50-1995. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification. Z39.50 Maintenance Agency Offical Text for Z39.50-1995, July 1995.

  2. Жижимов О.Л. Введение в Z39.50. 3-е изд., доп. и перераб. Новосибирск: Изд-во НГОНБ, 2002. 253 с.

  3. Шрайберг Я.Л., Воройский Ф.С. Автоматизированные библиотечно-информационные системы. М.: Либерея: ГПНТБ России, 1996. 273 с.

  
На главную