Home page | Каталоги и базы данных

Научные и технические библиотеки

Хопкинсон А.
Университет Мидлсекс, Лондон, Великобритания


CDS/ISIS и UNIMARC

Введение

Цель настоящего доклада — не рассказать о достоинствах формата UNIMARC, а объяснить, почему CDS/ISIS является удобным средством его внедрения.

В Европе и Северной Америке для автоматизации библиотек разработано множество программных продуктов, обеспечивающих обработку записей в одном из MARC-подобных форматов, как правило, в национальном формате той страны, в которой впервые внедрена система. К сожалению, большинство прикладных программ для того, чтобы использовать другой MARC-формат требуют доработки. Возможно, она окажется трудоемкой и дорогостоящей. К тому же MARC, будучи обменным форматом, предусматривает наличие определенных элементов данных в формате ввода, в связи с чем могут потребоваться эксперименты для отладки интерфейса между вариантом представления данных каталогизатором при вводе и представлением данных при экспорте записей для обмена.

CDS/ISIS

Теперь обратимся к CDS/ISIS, который позволяет разработать собственный внутренний формат и таблицу для конвертирования его в любой MARC-подобный формат.

CDS/ISIS для микрокомпьютеров разработан ЮНЕСКО в 1985 г., чтобы способствовать созданию баз данных на персональных компьютерах, особенно в развивающихся странах, чьи организации не могли позволить себе покупку коммерческих программных продуктов, которые используются и поддерживаются в других странах. Возможно, в настоящее время этот пакет — наиболее используемый для библиографии, поскольку он широко распространен в Индии, странах Латинской Америки и Юго-Восточной Азии.

Версия 1 имела ряд недостатков (но все последующие функционируют весьма эффективно). Она включала отдельные программы, которые в последующих версиях стали модулями одной главной программы. Перечислим их для справки, используя названия модулей, принятые в системе:

ISISENT — модуль ввода; ISISRET — модуль поиска; ISISINV — модуль работы с инверсными файлами; ISISPRT — модуль сортировки и печати; ISISDEF — модуль определения баз данных; ISISXCH — модуль работы с мастер-файлами; ISISUTL — модуль системных утилит; ISISPAS — модуль разработки прикладных программ.

Сейчас проходит тестирование версия, созданная для работы под WINDOWS: она должна обеспечить такой же функциональный уровень, что и существующая версия, однако пока в ней не поддерживаются форматные выходы — пользовательские программы, которые обеспечивают специальные формы вывода, не реализуемые стандартными средствами достаточно мощного языка форматирования.

CDS/ISIS можно получить бесплатно через ЮНЕСКО или национальных дистрибьюторов. Ряд пользователей внедрили UNIMARC с помощью CDS/ISIS и сейчас существует официальная модельная база данных Unibase [1], о которой будет сказано ниже.

UNIMARC используется в ГПНТБ России и других библиотеках Российской Федерации [2].

Ключевыми моментами обсуждаемой проблемы являются:

  • ввод данных, который можно осуществлять с помощью удобного для пользователя рабочего листа, размеченного идентификаторами полей (они идентифицируются как метками, так и именами полей);
  • средства определения данных, которые позволяют задать поля и подполя формата UNIMARC в структуре элементов данных записей;
  • средства обслуживания мастер-файлов, которые обеспечивают экспорт и импорт данных и позволяют переформатировать данные в БД в соответствии с требованиями обменного формата UNIMARC.

Обменный формат

UNIMARC как представитель семейства MARC-форматов является обменным форматом и включает три основных компонента:

  1. Определенная физическая структура: правила размещения в памяти компьютера данных, предназначенных для обмена. Ее можно сравнить с контейнером или носителем, в который помещены данные. Носитель остается неизменным, а данные меняются от записи к записи.
  2. Определители содержания: коды, идентифицирующие различные элементы данных в записи (например автор, заглавие, дата начала издания журнала, носитель информации); определители полей и подполей.
  3. Содержание записи, регламентируемое правилами представления элементов данных и тесно связанное с п. 2.

В UNIMARC имеются средства связывания записей (не поддерживаемые некоторыми MARC-форматами), позволяющие устанавливать связи между библиографическими записями, такими, как описание статьи и описание журнала, в котором она опубликована, или между записями авторитетных файлов и библиографическими записями.

Каким образом реализовать основные компоненты
UNIMARC с помощью CDS/ISIS?

Следует иметь в виду, что UNIMARC не нужно внедрять в саму базу данных: его внедрение сводится к возможности экспорта данных в этом формате. Тем не менее CDS/ISIS позволяет вводить записи в формате UNIMARC, так что конвертирование становится совсем простым.

Структура записи UNIMARC определена стандартом ISO 2709. Внутренняя структура записи в CDS/ISIS также базируется на этом стандарте, благодаря чему возможно эффективное конвертирование из внутреннего формата в формат обмена. Кроме того, внутренний формат предусматривает ввод записей переменной длины (до 8 тыс. символов), полей переменной длины (до 1 650 символов с учетом повторов) и повторяющихся полей.

Помимо этого CDS/ISIS использует трехсимвольные метки полей в соответствии с требованиями UNIMARC и идентификаторы подполей. Данные в UNIMARC необходимо формулировать последовательно, в соответствии с определенными правилами каталогизации; программный продукт дает возможность ввести в базу данных средства помощи, позволяющие правильно вводить информацию в подполя. Экраны ввода можно снабдить сообщениями, облегчающими процедуру ввода.

Пакет прикладных программ обеспечивает вывод данных согласно ISBD с заголовками, соответствующими национальным правилам каталогизации. Есть только одна проблема: система не обеспечивает вывода повторяющихся подполей в пределах одного поля, однако в случае необходимости индикаторы в начале каждого поля можно удалить.

Записи можно связывать как при выводе, так и при экспортировании.

Организация, намеревающаяся генерировать записи в формате UNIMARC, возможно, захочет использовать их и для своих нужд. Система располагает хорошими средствами индексирования и поиска, которые можно ориентировать на данные полей или подполей. Система позволяет выводить даже каталожные карточки!

Очень полезной особенностью CDS/ISIS является возможность написания собственных программ для взаимодействия с пакетом или для полной замены модулей. Например, в Чешской национальной библиотеке разработан вариант системы ввода, который обеспечивает подсказку подполей. Можно организовать разные способы ввода данных с помощью пользовательских программ ввода, которые будут поддерживать контроль данных при вводе в заданные поля. Новая версия под WINDOWS обеспечивает контроль ввода дданных в подполя в соответствии с информацией Таблицы определений полей.

Еще одной полезной особенностью является переформатирующая PHUT, которая позволяет конвертировать данные из формата ввода в формат UNIMARC.

UNIBASE

UNIBASE [1] — это демонстрационная база данных UNIMARC, цель которой продвижение UNIMARC как структуры, легко адаптируемой при создании национального MARC-формата. Ее разработчики выбрали CDS/ISIS, поскольку этот пакет очень гибкий и позволяет структурировать БД в соответствии с требованиями UNIMARC. База данных была разработана в Национальной библиотеке Португалии в 1993 г. Меню системы соответствуют тем, которые применяются в стандартной функционально ограниченной версии CDS/ISIS, реализующей только поиск, сортировку и печать информации. Вводить информацию нельзя. Форматы вывода могут служить модельными форматами для любой базы данных, в которой принят UNIMARC. Среди них формат, включающий метки UNIMARC, формат вывода по ISBD и сокращенный формат с метками.

Для улучшения вывода по ISBD на языке Pascal разработаны несколько форматных выходов (программ, которые позволяют более детально задать формат вывода, чем принятый язык форматирования).

К базе данных прилагается руководство, в котором кратко описан CDS/ISIS, в общих чертах рассмотрен UNIMARC, а в отдельном разделе рассказывается, как решены некоторые проблемы, возникающие при применении UNIMARC. К ним относится то, что CDS/ISIS не позволяет обрабатывать маркер записи и повторяющиеся подполя. Обработка повторяющихся подполей обеспечена при помощи ввода каждого повторяющегося подполя как повторяющегося поля и форматного выхода, который выводит данные так, как будто они введены в одно поле.

Основной недостаток модельной базы данных — отсутствие возможности ввода данных и обмена ими (последнее необходимо, чтобы продемонстрировать работу с обменным форматом). Это связано с лицензионными требованиями ЮНЕСКО: версия без ввода распространяется без ограничений; полная версия, используемая для создания новых записей, требует наличия лицензии.

Запись, описывающая монографию, в формате вывода по UNIMARC:

[MFN: 21] ---------------Маркер записи

Статус зап.:n Тип зап.:a Библ. уровень:m

Иерарх. уровень: Уровень кодирования: Описание: -----100: ^a19881128d1984 k f0engy 0103 101:0 ^aeng%^afre 102: ^aFR 200:1 ^aBibliography of publications on Unesco^d=Bibliographie des publications sur l'Unesco^zfre 210: ^aParis^cUnesco^d1984 215: ^aXIV, 433 leaves; ^d30 cm 510:1^aBibliographie des publications sur l'Unesco^zfre 675: ^a001:061.1(100) Unesco(01)^vmed^zpor 710:02^aUnesco 801: 0^aPT^bBN

Запись в формате вывода по ISBD:

UNESCO Bibliography of publications on Unesco = Bibliographie des publications sur l'Unesco. — Paris: Unesco, 1984. — XIV, 433 leaves; 30 cm

UDC 001:061.1(100) Unesco(01)

Запись в сокращенном формате:

MFN.......:21 AUTHOR......:UNESCO TITLE.......:Bibliography of publications on Unesco PUBLICATION.....: Unesco, 1984

Заключение

Модельная база UNIBASE демонстрирует, что UNIMARC можно реализовать с помощью CDS/ISIS. При этом остаются несколько проблем, однако большинство из них решаются в версии CDS/ISIS под WINDOWS, которая сейчас проходит официальное тестирование.

Нельзя недооценивать преимущества использования стандартного MARC-формата как на национальном уровне, так и в отдельных организациях; как в плане обмена с национальными и международными базами данных, так и при создании и поддержке системы. Например, пользователи CDS/ISIS и UNIMARC могут обмениваться готовыми форматами вывода и рабочими листами для ввода записей, не говоря уже о программах на языке Pascal, написанных как форматные выходы для улучшения представления информации при выводе. К тому же любой, столкнувшийся с проблемами при использовании CDS/ISIS, сможет решить их гораздо быстрее, если имеет дело со знакомым форматом.

СПИСОК ЛИТЕРАТУРЫ

  1. Unibase: UNIMARC demonstration database: user manual with diskette in CDS/ISIS; prepared by Instituto da Biblioteca Nacional e do Livro, Portugal for the IFLA UBCIM Programme. [Frankfurt]: IFLA UBCIM Programme, [1993].
  2. Shraiberg Ya. Application of the CDS/ISIS Software Package and UNIMARC format in the automated systems of the Russian National Public Library for science and technology and other libraries of the Russian Federation. in UNIMARC and CDS/ISIS: proceedings of the workshops held in Budapest ... and Barcelona, 1993. Munchen: Saur, 1994 (UBCIM publications, new series; vol 13). P. 57—76.
Copyright © 1995-97 ГПНТБ России