Home page | Каталоги и базы данных

Научные и технические библиотеки
УДК 025.4.036

Племнек А.И., Усманов Р.Т.

Z39.50: открытый доступ
к библиографической информации

Современные автоматизированные библиотечные системы предоставляют читателям и профессиональным библиотекарям широкий набор услуг по обработке информации. Одним из элементов технологий, обеспечивающих функционирование таких систем, является протокол Z39.50, определенный соответствующим стандартом (ANSI Z39.50—1995, ISO/FDIS 23950).

Протокол — это правила обмена информацией между компьютерами, непосредственно не касающиеся конечного пользователя, но обеспечивающие его каким-либо сервисом. Стандарт Z39.50 определяет такие правила взаимодействия компьютеров, которые позволяют пользователю при помощи одной-единственной программы, выполняющейся на компьютере-клиенте, производить поиск информации в базах данных, поддерживаемых компьютерами-серверами. Для библиотекаря это означает, что он со своего рабочего места, оборудованного недорогим персональным компьютером, сможет искать, получать и обрабатывать в электронном виде библиографическую информацию, хранящуюся в больших базах данных на мощных ЭВМ. Причем для этого ему будет необходимо освоить всего лишь одну программу.

Z39.50 разрабатывался в Библиотеке Конгресса США с начала 1980-х гг. и предназначался для обработки библиографической информации. Необходимость разработки данного протокола обусловливалась рядом причин: существованием различных поисковых языков и интерфейсов пользователя, неудобством представления информации.

С ростом интереса к Z39.50 в 1990 г. создана группа разработчиков, в состав которой вошли производители, поставщики информации, консультанты, учебные заведения, желающие получать или предоставлять доступ к различным видам информации, включая библиографическую, техническую, финансовую, тексты, изображения, аудио- и видеоматериалы. Образованное в 1989 г. при Библиотеке Конгресса США Агентство поддержки Z39.50 организует работу членов этой группы разработчиков и, учитывая их предложения, создает новые версии стандарта, последняя из которых была принята ANSI в 1995 г. и ISO в 1997 г. В настоящее время существует множество приложений Z39.50 и их число неуклонно растет.

Конечно, имеются и другие протоколы, обеспечивающие поиск и извлечение информации в глобальных информационных системах (HTTP, Gopher и т. д.). Но Z39.50 выгодно отличается от них тем, что форма представления результатов поиска (библиографических записей) и способ ввода поисковых запросов не зависят от источника информации. Z39.50 использует качественно иную модель взаимодействия компьютеров, которая позволяет абстрагироваться от способа организации конкретной базы данных, сделать доступ к ее содержанию независимым от формы хранения последнего. Многие вычислительные системы используют различные средства и методы описания, хранения и доступа к библиографическим данным — Z39.50 избавляет пользователя от необходимости адаптации к каждому из источников информации. Поэтому внедрение Z39.50 в библиотеках позволит сократить время обучения библиографов работе с базами данных и повысит производительность труда.

Следует отметить, что стандарт Z39.50 определяет лишь взаимодействие компьютеров, но не описывает взаимодействие между конечным пользователем и программой-клиентом. Таким образом, пользователь может выбрать из доступных клиентских приложений наиболее удобное для себя и использовать его как универсальное средство доступа к библиографическим БД, имея при этом единую форму представления данных.

В какой-то степени протокол Z39.50 может оказывать влияние на работу программы-клиента. Стандарт предусматривает выбор пользователем формы представления извлекаемых библиографических записей — простой текстовый формат, 15 диалектов формата MARC и т. д. Конечно, разнообразие форм представления информации определяется не только возможностями конкретного Z39.50-клиента, но и Z39.50-сервера. Например, сервер Библиотеки Конгресса США предоставляет записи только в формате USMARC, а сервер BIBSYS поддерживает 3 формата — NORMARC, USMARC и SUTRS (простой текстовый). При этом пользователь получает потенциальную возможность копировать записи из удаленных баз данных в локальные, исключая достаточно трудоемкий процесс создания собственных библиографических записей. Следует заметить, что этот аспект работы с библиографической информацией в ряде стран регулируется законами об авторском праве и интеллектуальной собственности. С целью исключения незаконного копирования такой информации некоторые Z-серверы предоставляют доступ к библиографическим записям только в простом текстовом формате, наименее удобном для последующей обработки.

Основными преимуществами Z39.50 являются поиск и извлечение информации. Два этих понятия тесно связаны между собой. Извлечение информации допускается лишь после того, как она найдена, а результат поиска (в Z39.50 им является набор идентификаторов найденных записей) сам по себе не имеет практической ценности без последующего извлечения данных.

В настоящее время в мире функционирует несколько сотен серверов, которые в основном обеспечивают доступ к библиографическим БД. В терминологии Z39.50 базой данных является набор записей, которые в свою очередь состоят из элементов. Элементами библиографической записи являются имена авторов, заглавие и т. д. По некоторым (не обязательно по всем) элементам можно производить поиск.

Пользователь может составлять довольно сложные поисковые запросы с использованием логических операторов (И, ИЛИ, И-НЕ), операций отношения (>, <, = и т. п.). Например, найти все издания, автором которых является Иванов, выпущенные издательством "Финансы и статистика" после 1990 г., причем в заглавии должно быть слово "судостроение" или "машиностроение". Поиск записи можно производить по начальным и конечным буквам слов. Стандартом предусмотрены и более изощренные способы поиска информации. Разумеется, полнота этих возможностей определяется конкретными реализациями сервера и клиента, которые, в зависимости от решаемых задач, могут обеспечивать как простые, так и довольно сложные поисковые запросы.

Z39.50 предоставляет возможность одновременного поиска в нескольких базах данных, поддерживаемых одним сервером. Пусть, например, в библиотеке имеется Z-сервер, обеспечивающий доступ к базам данных различных отделов (учебной, научной, художественной литературы и т. д.). В этом случае удобство одновременного поиска читателем необходимых ему изданий является очевидным. Также допускается проведение поиска одновременно в базах данных нескольких серверов. Это реализовано в некоторых клиентских приложениях — пользователь может искать необходимую литературу сразу в нескольких библиотеках.

Z39.50 предоставляет разнообразные средства извлечения найденной информации. Пользователь может не только указывать желаемую форму представления библиографических записей, о чем уже было сказано выше, но и управлять содержанием извлекаемой информации, указывая спецификацию элементов. Например, при извлечении большого количества записей имеет смысл извлекать краткие записи, содержащие информацию только об авторах, заглавии и дате издания. На основании сделанного выбора можно получать более подробные сведения. (Следует заметить, что полные записи могут иметь довольно большой размер — некоторые поставщики библиографической информации включают в них содержание книг, аннотации и т. п.)

Существует возможность управления не только формой представления всей библиографической записи, но и видом его элементов. Это позволяет получать библиографические записи, оформленные в соответствии с различными правилами каталогизации.

Стандартом определяются возможности обработки данных помимо поиска и извлечения. Например, можно отсортировать найденные библиографические записи по одному или нескольким элементам, прежде чем их извлекать. Существует возможность просмотра поисковых индексов сервера. Также можно заказать издание по найденному описанию, добавить новое или изменить старое описание. Это позволяет говорить об использовании Z39.50 в автоматизированных рабочих местах практически в любых подразделениях библиотеки — от МБА и каталогизации до книговыдачи.

Разумеется, производить изменения в базах данных сервера разрешено не каждому пользователю. Поэтому в Z39.50 предусмотрен контроль доступа. Можно ограничить не только круг лиц, имеющих право изменять записи, но и установить ограничения на поиск и извлечение конкретных записей и даже их элементов из определенных баз данных. Все это позволяет разграничить полномочия лиц, участвующих в жизненном цикле библиографической записи — от комплектаторов и каталогизаторов до читателей, и тем самым повысить эффективность и надежность автоматизированной библиотечно-информационной системы.

С 1996 г. в Центре "Открытые библиотечные системы" СПбГТУ (http://www.unilib.neva.ru/rus/olsc/) функционирует единственный пока в России Z39.50-сервер. Он предоставляет доступ к библиографической базе данных Фундаментальной библиотеки университета. Сервер обеспечивает поиск информации по авторам, заглавиям и рубрикам, извлечение записей в форматах SUTRS (простой текстовый), UNIMARC и USMARC. База данных содержит сведения о поступлениях за последние пять лет. Любой желающий может обратиться к этому серверу при помощи Z39.50-клиента или через WWW-шлюз (http://www.ruslan.ru:8001/rus/z3950/gateway.html).

Итак, основными преимуществами использования Z39.50 в современных библиографических информационно-поисковых системах являются:

  • простой и удобный доступ к удаленным базам данных при помощи единого пользовательского интерфейса;

  • сокращение времени обучения пользователя работе с различными информационными системами;

  • независимость от аппаратного и программного обеспечения, что позволяет включить существующие системы в единое библиографическое пространство;

  • возможность обработки как библиографической, так и небиблиографической информации.

Именно перечисленные качества делают Z39.50-системы поистине открытыми, обеспечивая оперативный, надежный и удобный доступ к библиотечным информационным ресурсам.


Copyright © 1995-98 ГПНТБ России