Home page | Каталоги и базы данных

Научные и технические библиотеки
Лавренова О.А.

Российская государственная библиотека, Москва

Электронные каталоги: тенденции и практика
Российской государственной библиотеки

В мировой практике наметились следующие тенденции развития электронных каталогов: расширение разнообразия видов поиска, использование неограниченного количества индексных файлов (индексирование по любым полям записей, реиндексирование записей в ранее сформированных базах данных при создании новых индексных файлов), формирование файлов нормативных записей и международное сотрудничество в этой области, ретроспективная конверсия традиционных каталогов в машиночитаемую форму, представление практически всех каталогов в Интернет, обеспечение удобного диалога при поиске в вычислительных сетях сразу по нескольким базам данных с одного рабочего места на базе протокола Z39.50.

В наше время никого не удивишь наличием в библиотеке ЭК. Однако тот факт, что РГБ — ведущая библиотека России — с 1998 г. предоставила в теледоступе свои библиографические ресурсы в форме ЭК не мог пройти незамеченным.

Необходимого объема средств для формирования достойной технической базы и приобретения зарубежной системы для создания интегрированной АИБС библиотека не получила. Поэтому данный шаг в области информатизации РГБ сделала в первую очередь за счет настойчивости, терпения, решительности и изобретательности штатных сотрудников самой библиотеки. Разработка проекта осуществлялась при финансовой поддержке РФФИ. Техническая реализация стала возможной благодаря поддержке Фонда Сороса в предыдущие годы. В результате теперь достаточно найти в сети Интернет Web-страницу РГБ — http://www.rsl.ru — и пользователю доступны ее основные БД.

Программное обеспечение электронных каталогов РГБ — автоматизированная информационная система МЕКА, разрабатываемая фирмой "ЛАБИС Лтд." (Москва) с 1992 г. как универсальная настраивающаяся система широкого назначения. Постоянно развиваясь, АИС МЕКА использовалась в РГБ для создания ЭК специальных коллекций (например сводный ЭК русской книги 1801—1825 гг.), других библиографических БД (например статьи из газет и журналов русского зарубежья), документально-фактографических и фактографических БД (в частности, энциклопедия "Мир профессий", банки данных "Библиотеки Москвы", "Деятели русского зарубежья" и т. д.). Благодаря внедрению этой системы удалось не только восстановить утраченные было достижения РГБ по автоматизированной каталогизации иностранных книг, которая велась с середины 1980-х гг., но и обеспечить ввод в БД полного потока поступающих отечественных книг, диссертаций. Самый главный результат — возможность предоставления пользователям БД ЭК РГБ как в локальной сети, так и в Интернет. Однако следует отметить, что при загрузке в систему на сервере РГБ записи из ЭК библиотеки пока конвертируются в другое программное обеспечение, основанное на пакете CDS/ISIS.

АИС МЕКА — 32- разрядная система, использующая при необходимости все ресурсы памяти компьютера и обладающая графическим интерфейсом с пользователем, что дает возможность обрабатывать книги на всех языках на основе кириллицы и латиницы с применением микросинтаксиса. При использовании стандартной клавиатуры возможен ввод самых экстравагантных символов. При выводе на экран образа каталожной карточки или при ее печати буквы представляются в их естественном начертании. Программный продукт разработан на алгоритмическом языке "Си++" и функционирует под управлением операционной системы MS-DOS версии 3.30 и выше или под Windows 95. Локальная сеть, на которой функционирует сейчас система МЕКА, состоит более чем из 50 персональных компьютеров, что позволяет быстро "вести" книгу по всему пути обработки в отделах РГБ и предоставлять читателям.

Лингвистическое обеспечение ЭК РГБ включает: формат для БЗ — RSLMARC (РГБМАРК), формат для нормативных записей — USMARC/Authorities, индексы ББК информационно-поисковый язык на основе таблиц ББК, с предметным входом, дополнительные ключевые слова для расширения возможностей поиска. При этом и в электронной форме соблюдается традиция РГБ вести каталоги на оригинальных языках и в оригинальной графике. Надо отметить, что в настоящее время западные библиотеки, традиционно использующие транслитерацию различных алфавитов в латинский осознали, что так продолжать нельзя. В особенности затруднительно вести многоязычные файлы. Поэтому библиотеки устремили свои взгляды на системы, использующие UNICODE. Для нас это тоже перспективная задача, но уже сейчас в ЭК РГБ обеспечивается, ввод "расширенных" кириллицы и латиницы, математических символов, специальных знаков, греческих букв и т. д.

Что касается форматов, то в русле тенденций к сближению различных национальных вариантов MARC РГБ принимает участие в работах по IMARC, а также по развитию UNIMARC и созданию его российской версии.

Рассмотрим, каким образом ЭК РГБ сформирован и совершенствуется в русле современных тенденций развития зарубежных и отечественных OPAC (Online Rublic Access Catalog) — электронных каталогов. Начнем с описания того, как генерируются параметры системы для ЭК, обеспечиваются разнообразные возможности поиска по любым элементам записей и их сочетаниям с учетом смысловых отношений между поисковыми признаками при тематическом поиске и формируются индексные файлы словоформ из произвольных полей записей по варьируемым параметрам.

Поскольку используемый пакет программ МЕКА изначально разрабатывался для поддержки хорошей лингвистики АИС, он успешно решает разнообразные задачи поиска в ЭК.

Параметры системы генерируются пользователем или разработчиком в соответствии с требованиями к создаваемому банку данных и задаются в специальных текстовых файлах, которые формируются или редактируются без изменения программного обеспечения.

Параметры систем, в том числе и ЭК, генерируются в следующем порядке: формирование перечня видов файлов (видов записей); описание каждого вида записей в шести текстовых файлах; подготовка перечня меток полей с индикаторами и идентификаторами и указание их наименований; подготовка перечня "ключевых" полей, т.е. тех, значения которых переносятся в индексный файл; формирование справочников к отдельным полям; разработка макетов ввода записей и структуры полей; описание форм вывода записей на экран и печать; изменение файла разделителей; разработка параметров поиска

Задаваемая в файле "Основное описание полей" структура элементов записей строится на основе формата РГБМАРК, в котором обеспечивается индентификация элементов данных, необходимая и достаточная для того, чтобы гарантировать высокую точность поиска в ЭК и программное формирование записей традиционного вида на выходе (например всех видов каталожных карточек).

В файле "Ключи" приводится перечень полей (меток, индикаторов, идентификаторов), для которых программно должны формироваться индексные (инверсные) файлы их значений. Как известно, инверсные файлы обеспечивают быстрый поиск в отличие от поиска сплошным просмотром соответствующих полей в записях. В ЭК обеспечивается возможность реиндексирования записей в базе данных, подготовленной до возникновения новых идей индексирования, которой придается сейчас существенное значение при развитии зарубежных, чаще всего довольно старых электронных каталогов. В ЭК РГБ для формирования новых инверсных файлов по "старым" записям достаточно изменить файл "Ключи" и запустить программу реорганизации базы данных.

Далее при генерации системы определяются в перечне полей и подполей такие, для которых целесообразно формировать справочники. Они заносятся в специальный файл "Справочники" и представляют собой перечни значений полей с кодами и/или текстами. В ЭК РГБ используются чаще всего справочники кодов стран и кодов языков, перечни видов источников комплектования фондов, уровней библиографического описания, видов носителей информации и т. д. Затем разрабатываются макеты ввода записей соответствующего вида и создается файл "Структура макетов ввода". После этого формируются файлы описания форм вывода данных на экран и печать.

Поисковые параметры систем на основе АИС МЕКА для обеспечения поисковых функций ЭК определяются в специальном файле, где даются: описание основного поискового меню конкретной системы, содержащее перечень режимов поиска; перечень подменю для каждого меню; списки полей, по которым ведется каждый вид поиска, с указанием различных признаков поиска; описание иерархического поиска с указанием перечней групп поисковых полей, групп выводимых полей и полей, связанных с данными в других видах записей; правила проверки полей БЗ по полям записей делений ББК или дескрипторов тезауруса (в некоторых БД); правила автоматического переноса полей из одной записи в другую того же или иного вида; системные константы; параметры сортировки выводимых на экран записей; перечень выходных форм — бланков; связь файлов нормативных записей для лиц и коллективов с БЗ.

Коррекция параметров поиска возможна и при уже сформированной БД в процессе эксплуатации ЭК, что придает гибкость структуре поисковых функций каталогов. Разумеется, при этом нельзя принимать решения, противоречащие другим заранее заданным параметрам.

Программное обеспечение ЭК РГБ позволяет: ведение поиска с верхнего или любого уровня до любого другого уровня иерархии вниз; выход на любой уровень иерархии и на уровни в разных тематических разделах одновременно по "предметному входу"; развертывание наименований делений на экране (с индексами или без них); переход от деления ББК к списку БЗ без привлечения индекса для поиска.

Еще одна важная тенденция совершенствования электронных каталогов — формирование файлов нормативных (авторитетных) записей и стремление объединить усилия для создания международных файлов. В частности, Европейская комиссия (13-я Генеральная дирекция комиссии Европейского союза) финансировала специальный проект "AUTHOR" (1995—1997 гг.).

Цель проекта — исследовать возможности международного обмена нормативными файлами, чтобы обеспечить доступ к authority files имен лиц и наименований коллективов на международном уровне; конвертировать нормативные данные, созданные национальными библиотеками-партнерами, в формат UNIMARC/ Authorities; использовать в практике каталогизации готовые нормативные записи.

В эксперименте участвовали пять европейских национальных библиотек (Франции, Великобритании, Бельгии, Испании, Португалии). При этом им пришлось работать с пятью правилами каталогизации, пятью MARC-форматами, четырьмя различными системами. Участники проекта предложили другим библиотекам изучить экспериментальный файл на определенном сервере в Интернет и прислать свои замечания и предложения. Затем рабочая группа UBCIM (IFLA) подготовила минимальный состав полей нормативных записей для международного обмена и разослала в различные страны на рассмотрение. РГБ приняла участие в этих работах и направила свои предложения. Это позволило РГБ утвердиться в своих проектных решениях, принятых как во время подготовки совместно с другими отечественными библиотеками российской версии формата UNIMARC/Authorities, так и при разработке проекта собственной службы ведения нормативных записей.

К сожалению, создание межбиблиотечной службы осложнено всевозможными обстоятельствами объективного и субъективного характера. Для ЭК РГБ давно формируются нормативные записи для имен авторов особых категорий (монарших особ, религиозных деятелей и т. п.). Начата подготовка файла наименований иностранных коллективных авторов. Источники данных о последних — традиционная картотека коллективов и перекрестные ссылки в библиографических записях из ЭК. К нормативным записям, естественно, могут обращаться как каталогизаторы во время формирования БЗ, так и пользователи при поиске в ЭК.

Особое значение библиотека придает многоязычности наших нормативных файлов, необходимости использования различных трафик. К сожалению, идентификация языков и трафик — слабое место основных форматов: и USMARC, и UNIMARC. Наши предложения о целесообразности более строгого отношения к указанию языка в Authority records в определенной степени учтены в предложениях по развитию формата UNIMARC/Authorities, подготовленных участниками европейского проекта.

Ведущие зарубежные библиотеки, имея ЭК текущих поступлений, естественно, вплотную заняты ретроспективной конверсией карточных и печатных каталогов в машиночитаемую форму. Способ организации ретроконверсии зависит от размеров финансирования, объема каталогов, потребностей библиотек, стоимости рабочей силы в конкретной стране. Например, в Национальной библиотеке Франции и Королевской библиотеке Бельгии использовались всевозможные способы ретроконверсии: сканирование с последующим распознаванием образов знаков, клавиатурный ввод нераспознанных записей или их частей, полный клавиатурный ввод относительно небольших и старых каталогов, где трудно автоматически выделить элементы данных или вообще распознать знаки.

В РГБ разработана концепция ретроконверсии каталогов, в которой определены приоритеты. В настоящее время начат пилотный проект ретроконверсии каталогов в рамках работ по гранту TACIS. Вначале планируются разработка требований и пробная конверсия небольшой партии карточек для выбора фирмы-подрядчика на основе конкурса (какая фирма выдаст лучшие результаты в виде машиночитаемых записей на основе их образов, полученных сканированием), затем — подготовка группы экспертов по ретроконверсии в библиотеке и формирование "пилотного" массива БЗ, загруженного в базу данных ЭК.

Уже сейчас "ретромассивами" пополняется ЭК авторефератов и диссертаций; формируются сводные электронные каталоги русской книги 1801—1825, 1826—1917 гг., сводный каталог периодики русского зарубежья; конвертируются накопленные ранее в старых системах библиотеки БЗ авторефератов и зарубежных книг, карт и нот; переводятся на оптические диски некоторые особенно актуальные фрагменты систематического и алфавитного каталогов книг.

Следует отметить, что ЭК РГБ пока представляется в Интернет на основе другого программного обеспечения, где поиск возможен в существенно более упрощенном виде по сравнению с версией для локальной сети. В перспективе возможны разные варианты. С одной стороны, АИС МЕКА почти готова для этой роли, с другой — библиотека при финансовой поддержке фонда TACIS готовит совместно с европейскими специалистами пилотный проект новой системы для АИБС РГБ. Работы закончатся в середине 2000 г. Вероятно, только тогда мы сможем воспользоваться протоколом Z39.50, которому библиотеки придают большое значение для обеспечения комфортного удаленного поиска в электронных каталогах.


Copyright © 1995-2000 ГПНТБ России