Home page | Каталоги и базы данных

Научные и технические библиотеки

Шрайберг Я.Л.
ГПНТБ России, Москва


Международный библиотечно-информационный обмен и поставка информации:
нужна ли гармонизация правил и стандартов

Международное библиотечно-информационное сотрудничество всегда подразумевало обмен информацией: библиографической, адресно-справочной, реферативной и т. д. Говоря о развитии, интенсификации и совершенствовании библиотечно-информационной кооперации на современном этапе, во многих случаях понимают именно увеличение потоков приема/передачи информации и модернизацию технологии ее генерации, передачи и организации доступа. Если попытаться классифицировать виды информационных потоков обмена по содержанию и назначению, то с точки зрения практики межбиблиотечной кооперации можно выделить:

  • массивы национальных библиографий, позволяющие обеспечить работу глобальных, межрегиональных, национальных и локальных систем корпоративной каталогизации;
  • потоки запросов по каналам МБА и МКО;
  • запросы и результаты теледоступа, в том числе и полнотекстовые материалы;
  • потоки электронной доставки документов;
  • разнообразные справочные, реферативные, библиографические и другие массивы библиотечной информации.

Безусловно, главными здесь являются массивы национальных библиографий, которые не только определяют и совершенствуют свои системы каталогизаций, но в значительной степени устанавливают (фиксируют) место той или иной национальной библиотеки в мировой библиотечно-информационной инфраструктуре. Существует множество примеров действующих технологий двухстороннего фрагментарного или полного обмена массивами национальных библиографий (один из них — обмен между Библиотекой Конгресса США и Российской книжной палатой), но очевидно, что более важными примерами информационной кооперации в области библиографии являются системы корпоративной каталогизации межгосударственного статуса (OCLC, RLIN, PICA и др.). При этом центральное звено таких систем формирует свой пакет требований к стандарту, формату, языку представления и системе классификации хранимой информации, а участники системы должны следовать этим правилам, если хотят, чтобы их библиография была частью этих систем.

Например, в OCLC используются библиографические правила AACR-2, формат — USMARC, системы классификации: Дьюи, Библиотеки Конгресса США, УДК. Преимущественно библиографическая информация представляется в оригинале — для языков на латинице. Для остальных — система транслитерации, причем используются схемы Библиотеки Конгресса США, а не стандарта ISO. Обязательным является использование предметных рубрик Библиотеки Конгресса США на английском языке. Библиотеки — поставщики библиографической информации, в первую очередь национальные, следуют этим правилам и сами доводят свою информацию до требований OCLC. Во-первых, они заинтересованы в том, чтобы их информация была принята OCLC и использовалась другими участниками; во-вторых, они, как правило, прекрасно сознают, что в централизованной системе периферийное звено не может требовать адаптации или даже максимальной настройки центра к периферии, а только наоборот.

Как правило, но не всегда и не все. В этом и состоит мой основной тезис.

Поясним подробнее. При любых видах библиотечно-информационных обменов, в том числе при поставке информации в системе корпоративной каталогизации, ключевыми пунктами являются следующие:

  • правила каталогизации (библиографические стандарты);
  • библиографические форматы;
  • языки представления информации;
  • системы классификации и индексирования.

Есть, конечно, и другие, но эти четыре являются основными и остановимся пока на них.

Национальные правила каталогизации многих стран приняты на основании рекомендаций ISBD и поэтому не имеют больших различий. Многие поставщики библиографии, скажем в OCLC, без труда адаптируют свои библиографические массивы к AACR-2 (как, впрочем, и к USMARC). И это — правильно: OCLC, платя поставщикам за информацию, вправе требовать ее в необходимом ему виде. Аналогична идеология и других систем корпоративной каталогизации и вообще информационных систем. Так, Knight Rider Information или Silver Mather, покупая у владельцев их базы данных или информацию для предоставления через свои ресурсы, требует представления информации в заданной структуре. В мировой практике сложилась устоявшаяся схема: центральный сервер (звено) корпоративной или иной информационной системы устанавливает свои правила, стандарты, схемы приема, хранения и передачи информации, а поставщики информации при несовпадении правил конвертируют свою информацию в заданные центром рамки. Такая же схема действует во многих случаях в других системах и при двухсторонних обменах информацией (яркий пример — HTML-разметки в информационных системах Интернет). Что может быть альтернативой такому подходу? Только выработка и принятие всеми участниками системы единых правил, формата, схемы, иногда специально конструируемых, а чаще всего выбираемых из уже существующих. Несколько типичных примеров.

Язык. Известны попытки создать единый универсальный язык человеческого общения — эсперанто, который, хотя и с трудом, был создан, но не оправдал возложенных на него надежд. Таким единым языком фактически стал английский и вряд ли кто сможет это отрицать.

Кодировка алфавитов — среди многообразия разработанных кодовых схем для букв различных алфавитов, цифр и знаков (только кириллических схем кодирования насчитывается 16) наиболее удачной стала, на мой взгляд, специально сконструированная единая для всех алфавитов кодовая схема — UNICODE.

Библиографические форматы. UNIMARC как пример специально созданного международного коммуникативного формата, пожалуй, можно считать удачным, поскольку иной подход — попытка создать универсальный конвертор для всех библиографических форматов семейства MARC, не используя UNIMARC, — провалился (1-й этап проекта известного европейского USEMARCON). А далее и USEMARCON стал опираться на UNIMARC.

Но существует и иная тенденция — так называемая гармонизация правил и стандартов, когда делаются попытки сблизить два различных правила, или первое сделать похожим на второе, или (что труднее) создать новое, забыв про два старых.

Например, действующие соответственно в США и России англо-американские правила каталогизации AACR-2 и ГОСТ 7.1—84 отличаются в основном тем, что в AACR-2 в заголовке описания приводят только одного автора (даже если их несколько), а в ГОСТ 7.1—84 допускается указывать от одного до трех, причем возможно и использование константы "и др.". Другие, менее значительные примеры: в AACR-2 в сведениях об ответственности обязательно приведение фамилии автора, а в ГОСТ 7.1—84 можно этого не делать, если они совпадают с формой, отраженной в заголовке описания; AACR-2 формируют карточку на многотомное издание в целом, а сведения о томах (номер тома и основное заглавие тома) дают в примечании о содержании. В то же время в ГОСТ 7.1—84 есть возможность дать все полные сведения о каждом томе, даже если объектами самостоятельного описания являются отдельные тома. Есть еще ряд не столь существенных отличий, отражающих национальные особенности библиографических систем двух стран.

Что же нам даст поднимаемая сегодня на щит многими национальными библиотеками идея гармонизации библиографических стандартов? Мы снивелируем национальные особенности в угоду упрощению (если удастся это сделать!) технологии информационного обмена, скажем в OCLC, а что при этом будут делать поставщики библиографии из Бразилии и Японии, например? Их-то массивы уже не будут пониматься гармонизированным AACR-2, как и многие другие. Очевиден вопрос, для чего нужен придуманный и финансируемый OCLC проект гармонизации библиографических стандартов США, России и Германии, в то время как проблема совместимости и обмена библиографической информацией по схеме USMARC (AACR-2) — UNIMARC (ГОСТ 7.1—84) для обмена с Россией, в частности, эффективно решается с помощью легко настраиваемого универсального конвертора. Почему национальные библиографические особенности в форматах или в стандартах надо нивелировать или, точнее, гармонизировать, ущемлять интересы национальных библиографий, создавать проблемы не включенным в эти проекты странам, когда есть цивилизованный и устоявшийся подход программного конвертирования.

Создание качественного и, главное, универсального конвертора — дело хлопотное, но многое уже делается. В основу совместимости и взаимодействия массивов информации в международном библиотечно-информационном обмене должны быть положены универсальные программные конверторы при сохранении в каждом случае национальных особенностей. Это касается правил каталогизации, библиографических форматов, схем классификации и других ключевых делений. При этом следует учитывать интересы не группы библиотек или стран, а всего мирового библиотечно-информационного сообщества.

Этот аспект необходимо принять во внимание и разработчикам недавно объявленного проекта UNIMARC (гармонизации форматов USMARC, UKMARC и CANMARC). В частности, что должен будет делать пользователь USMARC, если IMARC будет объявлен как новый формат взамен USMARC? Если, например, OCLC примет IMARC в качестве основного формата хранения, то как будут приниматься записи, скажем, от скандинавских или южноамериканских библиотек, привыкших посылать свою информацию в USMARC, или от ряда европейских библиотек, дающих информацию в UNIMARC?

Необходимые решения, конечно, будут приняты, но уже сейчас следует думать о последствиях. Вообще в области гармонизации и развития библиографических форматов происходят сегодня странные вещи. Общеизвестно, что двумя наиболее популярными форматами являются USMARC и UNIMARC, и постоянно на разных уровнях в разных проектах и разработках идут попытки их противопоставления, слияния, поглощения, разделения и т. д. А зачем? У каждого из них есть преимущества и недостатки, определяющие степень эффективности их применения. Так, UNIMARC описывает издание вообще, а USMARC — конкретный экземпляр, т. е. позволяет включать шифр издания, сведения об экземпляре, инвентарный номер. Но, с другой стороны, в UNIMARC есть резервные поля и любители гармонизировать могут все это восполнить. Но оба формата, что очень важно, и, пожалуй, главное — обеспечивают получение каталогизационного описания. В USMARC есть возможность получить больше добавочных описаний (хотя мы и считаем это избыточным). В обоих форматах был по-разному организован механизм вертикальных связей между записями, в USMARC есть несколько альтернатив, но применение любой из них для многотомников, например, требует каждый раз записи сведений о многотомнике в целом. В UNIMARC механизм связи со встроенными полями позволяет сведения о многотомнике в целом давать один раз. В USMARC примерно 200 полей, а в UNIMARC — 150, и т. д. Абсолютное большинство экспертов против искусственной гармонизации этих форматов. UNIMARC — прежде всего информационный коммуникативный формат (хотя используется и как внутрисистемный библиографический), а USMARC, наоборот, лучше приспособлен как внутрисистемный библиографический формат (применяется и как коммуникативный). И пусть они в этом состоянии существуют и развиваются далее, благо существует уже несколько конверторов USMARC — UNIMARC (встроенных и автономных) и разрабатываются новые.

И, наверное, уже совсем смешной покажется попытка гармонизировать классификационные схемы, пока, насколько нам известно, делаются попытки разных конкордансов, целесообразность которых тоже не очевидна. Возьмем пример УДК и Дьюи. Обе классификации являются десятичными и между ними есть известная сходимость: так, в обеих схемах десять нотаций от 0 до 9, совпадающих между собой по содержанию (за исключением 4-го раздела), например:

Дьюи УДК
000Общий класс0Общий отдел
100 Философия и психология1Философия. Психология
200Религия2Религия. Теология

Обе схемы используют арабские цифры, индексы строятся от общего к частному. И в Дьюи, и в УДК применяются общие и специальные определители для всех разделов и в пределах разделов соответственно и т. д. Таким образом, совпадений в содержании индексов и в методике достаточно. Но есть и основное отличие — грамматика, употребление грамматических знаков, что делает крайне затрудненным конвертирование индексов УДК в Дьюи и наоборот (в Дьюи индекс строится последовательно, обязателен выбор одного предмета; в УДК возможно отражение нескольких предметов, отношения предметов, обобщенное отражение предметов).

Еще более сложный уровень — соответствие между этими системами и ББК, системой классификации Библиотеки Конгресса США, классификации двоеточием и др.

Мы предлагаем принципиально простую схему. Предположим, российская библиографическая система использует ББК и/или УДК (русский вариант), но для более эффективной информационной совместимости с западными партнерами принято решение использовать Дьюи. Система переводится на русский язык и начинает использоваться в дополнение (или вместо одной из старых) к схемам без конкорданса. Так поступила ГПНТБ России, так собирается поступить ВГБИЛ и, по-моему, сегодня это единственно разумный и логичный путь.

Иная точка зрения, наверное, тоже может иметь место, но верность данного подхода — никакой гармонизации, сохранение национальных особенностей и использование широкого комплекса универсальных конверторов — уже подтверждена и продолжает подтверждаться практикой. Главное — чтобы в ожидании "гармонизированного" завтрака не остаться голодным: долго голодать — вредно.

Copyright © 1995-97 ГПНТБ России