Home page | Каталоги и базы данных

Научные и технические библиотеки

Фролова Е.Е.
ГПНТБ России, Москва


Проблемы внедрения международного формата UNIMARC
в национальную информационную среду России

Разработка Российского коммуникативного формата представления элементов библиографической записи в машиночитаемой форме является одной из составляющих задач программы создания в стране библиотечной телекоммуникационной сети ЛИБНЕТ, направленной на образование интегрированной инфраструктуры библиотек России. В последний год в отечественной информатике произошел качественный скачок, обусловленный вхождением организаций России в глобальную компьютерную сеть Интернет, назрела необходимость в развитии национальной кооперативной каталогизации и обращения к международным онлайновым компьютерным центрам каталогизации, поэтому необходимость в коммуникативном формате, адекватном MARC, стала очевидной.

Одной из составных частей проекта создания Российского национального формата является адаптация формата UNIMARC для библиографических записей в отечественную информационную среду. Первый этап адаптации закончен и сегодня уже можно подвести итоги. Работа длилась полтора года. Каждая библиотека-участница занималась структурными и семантическими характеристиками определенного блока описания формата. На заседаниях рабочей группы обсуждались вопросы совокупности требований и однозначности представления каждого элемента данных. Проводилось сопоставление со стандартами, включающими те или иные позиции формирования элементов данных. Определялись различия между стандартами, на базе которых разработан формат UNIMARC, и аналогичными отечественными. В итоге мы получили обменный формат для книг и сериальных изданий. В настоящее время проводится окончательная редакция этого документа.

Преодолевая этот самый продолжительный этап в работе над форматом, специалисты столкнулись с множеством проблем. Одной из неразрешимых оказалась экономическая. Работа, финансируемая Министерством культуры РФ, из договорной быстро превратилась в работу на общественных началах, что, безусловно, отразилось на активности ее участников. Экономические трудности сказались и на преодолении территориальной разобщенности. И если вначале группа собиралась раз в две-три недели, то в дальнейшем интервалы между совещаниями значительно увеличились, что повлияло на запланированные сроки.

Теперь остановлюсь на проблемах, касающихся непосредственно самого формата.

Терминологические определения и семантические понятия играют в нашей работе большую роль, потому что в основном мы имеем дело с переводами, изобилующими новыми терминами и определениями, которые должны ассимилироваться в нашем сознании, чтобы потом превратиться в понятия. Относительно каждого необходимо прийти коллективно к однозначному пониманию, некоторые из них переработать лингвистически, а какие-то, возможно, включить в нашу практику каталогизации без изменений. Так, новыми понятиями для нас оказались точка доступа, значимое заглавие, язык каталогизации, трассировка записи, альтернативная интеллектуальная ответственность и др.

Такое новое понятие, как язык каталогизации, вначале было определено в качестве эквивалента языку описания, затем после переосмысления и обращения за консультацией к первоисточнику приобрело значение языка обработки записи, что заставило пересмотреть форматирование этого элемента в функционирующих системах.

Второй круг проблем связан с различиями в международных и отечественных правилах каталогизации. Самое существенное из них - формирование заголовка с индивидуальным автором. Формат UNIMARC предусматривает приведение одного автора в заголовке, отечественная библиография предписывает приведение в заголовке до трех авторов. И хотя некоторые не придают этому различию особого значения, поскольку в формате предусмотрена структура для альтернативной интеллектуальной ответственности, на практике от этого разночтения возникают неприятности. Например, при конверсии обменного формата во внутрисистемные форматы без указания кодов отношений мы можем получить в каталогизационном описании редакторов вместо авторов в заголовке. Поскольку коды отношений являются необязательным элементом в формате, мы не всегда можем достоверно определить авторскую принадлежность. Поэтому для гармонизации отечественных правил каталогизации с международными необходимо пересмотреть в наших правилах формирование заголовка в описании.

В связи с этим Межведомственным комитетом по каталогизации изучены мнения крупных библиотек относительно приведения одного автора в заголовке описания. Большинство библиотек положительно оценило эту инициативу и обосновало свое согласие перехода на международный вариант. Конечно, здесь мы должны ожидать недовольства вторых и третьих авторов, вынесенных за косую черту, но будем надеяться, что отечественная библиография от этого не пострадает. (Не нужно забывать, что мы ввели в заголовок второго и третьего автора не из гуманных соображений, а по политическим причинам, так как непозволительно было разрывать классиков марксизма-ленинизма.) Отход от этих традиций вызовет большое недовольство корифеев отечественной каталогизации, которые, как известно, являются самой консервативной частью библиотечного сообщества. Но почву для этих изменений готовить необходимо.

Еще одна проблема - регламентированные сокращения слов и словосочетаний, которые рекомендуются по нашим правилам во всех областях описания и не применяются в международных форматах. В национальном обменном формате мы можем проигнорировать это несоответствие, но выход на международный обмен и заимствование записей из центров каталогизации заставят нас отойти от установленных традиций. При этом не надо забывать, что экономия места на каталожной карточке приводит к многократному увеличению времени на обработку при пользовании стандартами на сокращения, к которым приходится прибегать при оформлении записи. С переходом от традиционных к электронным каталогам мы не будем лимитированы форматом каталожной карточки и необходимость в сокращениях отпадет.

Отечественные и международные правила по-разному определяют унифицированное заглавие. По национальным правилам оно включает только анонимные заглавия классических произведений; по международным - это более широкое понятие и используется для подборки произведений сходной формы или одного типа, собрании сочинений, оригинала заглавия, заголовка формы, договоров и других заголовков.

После продолжительных дискуссий мы включили сюда в адаптированном варианте формата заголовок формы, который не вписывается в другие области описания. Включение заглавия оригинала издания в сферу унифицированного, как это принято в международных правилах, не было утверждено рабочей группой.

В некоторых областях описания формата UNIMARC нас не устраивает слишком дробное деление элементов данных, а также избыточность информации, которая, как правило, не соответствует нашим внутрисистемным форматам. Здесь приходится принимать конкретные решения по каждому элементу, разрабатывать определенные схемы приведения данных, а иногда и сокращать набор полей в адаптируемом формате, как это было принято в области примечаний. (Число полей в 3-м блоке примечаний приближается к 30, помимо этого примечания могут быть сгенерированы дополнительно из 4-го блока, так что информация о примечаниях в формате UNIMARC, безусловно, представлена избыточно. Поэтому число полей 3-го блока в адаптируемом формате сокращено наполовину.)

В других областях описания наоборот: мы не укладываемся в определенные структуры элементов. Особенно это относится к кодированной информации - недостаточно для нас разработанными являются определители содержания, географические определители, коды авторских отношений, без чего невозможно однозначно идентифицировать весь репертуар обрабатываемых документов. Необходимо решать вопрос о наборе графических символов, не соответствующих нашим кодовым таблицам. Устранить такое несоответствие можно с помощью новых разработок (таблицы UNICOD), но для нас они пока не доступны в силу экономических и технических трудностей.

Самой сложной проблемой оказалась неординарная ситуация с полями связи. Структура полей связи, использующих грамматику вставленных или вложенных полей, является отличительной особенностью формата UNIMARC. В соответствии с программой гармонизации MARC-подобных форматов в 1996 г. разработана альтернативная структура полей связи, основанная на использовании прямых подполей. Естественно, что для обмена информацией в рамках одной страны предпочтительно выбрать единый безальтернативный вариант коммуникации. Здесь мы столкнулись с проблемой выбора. Достоинствами модернизированного варианта связи является то, что он позволяет использовать UNIMARC и в качестве внутрисистемного формата. В этой структуре машиночитаемая запись однозначно вписывается в структуру других MARC-подобных форматов, делает формат гостеприимным и контактным с международными системами. В традиционной архитектуре связи проявляется индивидуальность формата, наглядность обращения к другой записи, возможности приведения полного набора идентифицирующих издание элементов данных. Но здесь надо учитывать, что для конвертирования неформализованных полей связи с многовариантными наборами полей и подполей, для которых необходимо предусматривать сложные алгоритмы отношений и комбинаторный способ распознавания элементов, необходимо иметь солидную математическую поддержку и соответствующие объемы машинной памяти. Однако большинство участников выбрали традиционный вариант. Основным аргументом в пользу техники вставленных полей явилось ограничение состава полей в альтернативном варианте, а также распространение в России варианта UNIMARC с архитектурой вставленных полей связи в сети массовых библиотек Министерства культуры РФ.

Одним из ключевых вопросов адаптации формата оказался выбор модели записи для изданий с иерархическими уровнями. UNIMARC предполагает несколько таких моделей. Издание может быть представлено в самостоятельных записях на разном библиографическом уровне с использованием полей связи, в одной записи с общим заглавием в области серии, в одной записи со спецификацией в области примечаний.

При очевидной необходимости перехода к одноразовой каталогизации в каком-либо библиографирующем центре возникает необходимость в стандартизации единственного унифицированного варианта записи.

В результате продолжительных дискуссий в адаптированном варианте формата принята к использованию модель отдельной записи на каждый уровень документа. Основным доводом в пользу этого варианта является то, что он наиболее полно идентифицирует описываемый документ, может формировать любую исчерпывающую информацию к каждому иерархическому уровню записи. Однако, несмотря на свои положительные стороны, эта модель предполагает необходимость применения сложного программного интерфейса связи между записями, причем усложненного вложенными полями. Апробация этого варианта в режиме опытной эксплуатации определит ее жизнеспособность.

Адаптировав и переработав формат в части основных элементов данных, в дальнейшем необходимо было внести в него элементы, представляющие специфику национальной каталогизации. Проведя сопоставление внутрисистемных форматов функционирующих систем с форматом UNIMARC, каждая библиотека-участница выявила неэквивалентные UNIMARC элементы описания. В начале работы эти элементы предполагалось сгруппировать в девятом блоке национального использования. Однако впоследствии решено сформатировать их непосредственно в той области описания, к которой они относятся. Надо отметить, что подобных элементов оказалось минимальное количество, к ним относятся: шифр издания, тираж, сигла библиотеки, несколько видов примечаний и некоторые другие.

В итоге рабочей группой подготовлено руководство на книги и сериальные издания, которое проходит в настоящее время окончательную редакцию. Можно сказать, что концептуальное решение не изменять при адаптации формат UNIMARC, принятое в начале работы, выполнено. Хотя концепция представления основного заглавия нарушена: из состава подполей основного заглавия упразднены обозначение части и заглавие части, которые в адаптированном варианте должны форматироваться в самостоятельную запись на иерархическом уровне. Это существенное отступление от оригинала, которое приведет к необходимости конвертирования национального формата в международный UNIMARC.

Насколько оптимальными оказались принятые нами решения, покажет опытная эксплуатация и востребованность Российского коммуникативного формата.

В заключение несколько слов об организационной работе. В 1997 г. в Постоянном комитете по UNIMARC зарегистрированы отечественные классификационные системы, а также правила библиографического описания под следующими кодами: РНТИ - rugasnti, ББК - rubbk, правила составления библиографического описания - psbo.

В начале марта 1997 г. в Москве и С.-Петербурге проведены профессиональные семинары по развитию и использованию формата UNIMARC, на которых участники рабочей группы и специалисты заинтересованных организаций получили исчерпывающую информацию о новых разработках Постоянного комитета по UNIMARC, а также консультации по интересующим их вопросам непосредственно у разработчиков формата.

Copyright © 1995-97 ГПНТБ России