Home page | Каталоги и базы данных

Научные и технические библиотеки

Фролова Е.Е.
ГПНТБ России


Основные направления работы
по адаптации формата UNIMARC в качестве
коммуникативного формата России

В 1995 г. под эгидой Российской библиотечной ассоциации (РБА) утвержден проект "Создание национального формата библиографических записей в машиночитаемой форме для библиотек России", в разработке которого принимают участие крупнейшие библиотеки и информационные центры страны: РНБ, РГБ, БАН, РКП, ГПНТБ России, БЕН РАН, ВГБИЛ, ИНИОН, ГИВЦ Минкультуры РФ, НБ МГУ, ЦНСХБ РАСХН, ГПНТБ СО РАН, ГЦНМБ, ГПИБ, ГРЮБ и др. Базовой организацией является Российская национальная библиотека, руководителем разработок назначена зам. директора РНБ И.Б. Цветкова. В качестве научных консультантов привлечены самые авторитетные и квалифицированные эксперты в области отечественной библиографии и информатики.

Основная цель проекта — создание национального Российского формата представления элементов библиографической записи в машиночитаемой форме, определяющего единые для библиографирующих учреждений России требования к структуре и содержанию данных при обмене и хранении библиографических записей как внутри России, так и на международном уровне.

Необходимость выработки единых решений в области составления записей, а также совместимости машиночитаемой информации предопределила создание объединенной рабочей группы специалистов, накопивших опыт автоматизации процессов обработки и ведения электронных каталогов.

На первых заседаниях рабочей группы определены концептуальные положения проекта, следствием чего явился документ "Создание Российского коммуникативного формата представления элементов библиографической записи в машиночитаемой форме", разработанный группой научных консультантов. В документе дано обоснование основных направлений, целей и задач работы, в результате чего для каждого определенного направления из участников рабочей группы сформированы подгруппы с самостоятельной проблематикой: подгруппа по сравнению действующих форматов различных организаций, подгруппа по адаптации формата UNIMARC в качестве коммуникативного формата России и подгруппа по разработке национального формата авторитетных записей на основе формата UNIMARC.

Работа рассчитана на три года и будет проводиться поэтапно, в конце каждого этапа планируется публикация методических рекомендаций или других нормативных материалов.

Участники рабочей группы пришли к выводу, что первоочередной задачей должна быть разработка коммуникативного формата, регламентирующего представление машиночитаемых библиографических записей для внутрироссийского и международного обмена.

Принципиальным было решение не создавать собственный обменный формат, а адаптировать к национальным условиям международный коммуникативный формат, разработанный и рекомендованный ИФЛА. Прототипом такого формата выбран UNIMARC, являющийся унифицированным и практически ориентированным на все виды документов. Кроме того, аналогично ГОСТ 7.1-84 "Библиографическое описание документа" формат базируется на принципах ISBD, что должно облегчить оптимизацию процесса обмена информацией. (Формат МЕКОФ, имеющий статус государственного стандарта, в настоящее время морально устарел и утратил свое международное значение.)

Проанализируем работу подгруппы по адаптации UNIMARC в качестве коммуникативного формата России.

Прежде всего составлены документы, определяющие содержание работы подгруппы: "Основные направления работ по адаптации формата UNIMARC в качестве коммуникативного формата России", а также "Этапы работы...". Документы прошли экспертизу научных консультантов и рекомендованы к исполнению.

В деятельности подгруппы просматривается несколько направлений различного характера:

  • работы общего ознакомительного характера (такие, как определение видов документов, на которые распространяется формат, обзор нормативных документов UNIMARC);
  • работы аналитического характера — по составу и структуре формата;
  • решение технологических вопросов взаимосвязи элементов данных или блоков описания;
  • решение организационных вопросов (обеспечение рабочей группы необходимыми нормативными материалами: государственными стандартами России в области информатики, стандартами ISO и последней версией Руководства по UNIMARC; систематическое информирование членов рабочей группы об изменениях и дополнениях, вносимых в формат Постоянным комитетом UNIMARC; реализация возможности обращения за консультацией по вопросам формата к международным экспертам; проработка вопроса о необходимости официальной регистрации классификационных систем ББК и ГРНТИ в UBICIM IFLA).

Работа по адаптации UNIMARC условно разделена на три этапа. Первый носит в основном информационно-аналитический характер и завершается определением набора обязательных библиографических элементов данных для машиночитаемой записи. На этом этапе необходимо решить следующие задачи.

    1. Определить виды документов, на которые будет распространяться коммуникативный формат UNIMARC, и виды документов для первого этапа его освоения.

    Адаптированный российский вариант UNIMARC должен распространяться аналогично международному формату на все виды документов: монографии, сериальные издания, картографические материалы, ноты, звукозаписи, графику, проекционные материалы и компьютерные файлы. Поскольку формат будет учитывать все специфические элементы, присущие каждому виду изданий, необходимо на первом этапе проработок ограничить вид документов, чтобы не захлебнуться в обилии информации. Поэтому решено для начала ограничиться традиционными видами документов: книгами и сериальными изданиями — и применительно к ним рассматривать основные позиции формата.

    2. Выявить различия между стандартами, на базе которых разработан UNIMARC, и аналогичными отечественными.

    На этапе анализа элементов данных проводилась сопоставительная работа со стандартами, включающими те или иные позиции формирования элементов. Международный формат UNIMARC основан на требованиях, применяемых стандартами ISO и Международными правилами библиографического описания ISBD.

    Основные сопоставляемые документы: Международные правила библиографического описания — ISBD и ГОСТ 7.1-84 "Библиографическое описание документа", ISO 2709 "Формат для обмена библиографической информацией на магнитной ленте" и аналогичный отечественный ГОСТ 7.14-84, ISO 3166 "Коды наименований стран" и соответствующий ему ГОСТ 7.67-94, ISO 5127/2 по видам документов и ГОСТ 7.60-90 "Издания. Основные виды...".

    Отечественные стандарты в основном аналогичны международным по набору элементов данных, областям описания, системе основных разделительных знаков, основным кодам языков и стран, что обеспечивает однозначность применения элементов данных, но все же отличаются от них по классификации видов и типов документов, по структурированию заголовков и некоторым другим специфическим характеристикам.

    Каждый элемент данных коммуникативного формата проходит экспертизу на соответствие относительно его представления в отечественных стандартах, так как в адаптированном варианте он должен получить наполнение, соответствующее нашему стандарту, но семантически не должен отличаться от международного.

    3. Провести обзор содержания полей с анализом элементов данных, имеющих альтернативные решения, для выработки однозначного подхода к формированию библиографической записи.

    Самый продолжительный этап в работе над форматом — обзор содержания полей с подробным анализом элементов данных по информационным блокам для их адекватного использования в национальной среде.

    Используя в своих автоматизированных системах UNIMARC, информационный орган по-своему его осмысливает и внедряет, принимает собственные конструктивные решения по структуре записи и ее наполнению. Уже не говоря о том, что появилось несколько различных структур в одном формате, даже наполнение элементов данных в нем трактуется различными организациями по-разному. Поэтому необходимо выработать однозначное понимание каждого элемента данных, особенно в той части данных, которые выходят за рамки наших стандартов.

    Решающее значение в этом вопросе имеют терминологические определения и семантические понятия. Роль терминологии в данном вопросе так велика еще и потому, что в основном мы работаем с переводами, в которых может быть неоднозначно передана интерпретация термина. В начале работы была признана необходимость организации терминологической группы, но на практике дело ограничилось включением специалиста по терминологии в подгруппу.

    Для углубленного анализа содержания формата области библиографического описания, которые включают в себя отдельные блоки полей, были распределены между библиотеками — участницами проекта и каждая должна была проанализировать свои элементы данных относительно их наличия или отсутствия в отечественных стандартах, применительно к российским особенностям, определить статус элементов и сопоставить форму их представления с Едиными правилами составления библиографического описания.

    4. Определить и согласовать обязательный набор элементов данных, необходимых для формирования машиночитаемой записи различного уровня.

    Одним из ключевых вопросов нашей работы является статус каждого элемента описания. По правилам UNIMARC статус обязательных элементов имеют всего 7 полей для всех видов документов и только 5 для книг и сериальных изданий, что недостаточно для полноценного библиографического описания по национальным правилам. Поэтому некоторые элементы данных, имеющие статус факультативных, получили статус обязательных в соответствии с ГОСТ 7.1-84, например: сведения об издании, месте издания, основные примечания и некоторые другие элементы.

    В связи с этим необходимо решить вопрос об уровнях полноты записи. Специфика работы разных библиотек вызывает необходимость разработки коммуникативного формата с различными уровнями полноты записи (полного, сокращенного и минимального). Эти уровни должны быть определены обязательным набором полей как для полного уровня библиографической записи, применяемой при каталогизации в национальных библиотеках и библиографирующих органах, так и для усеченных уровней записи, которые используются для обмена массовыми библиотеками или издательствами.

    Полный уровень записи помимо обязательных элементов содержит набор факультативных элементов библиографической записи, сведения для которых имеются на издании или могут быть установлены по другим источникам. Сокращенный уровень записи содержит, в основном, набор обязательных элементов UNIMARC и обязательных элементов по национальным стандартам России. Минимальный уровень — это минимум элементов библиографического описания, позволяющих идентифицировать издание.

Второй этап работы над форматом носит концептуальный характер и должен решить следующие задачи:

  • провести анализ формирования хронологических, вертикальных и горизонтальных связей между записями иерархических структур различных уровней;
  • разработать оптимальный вариант структуры записи на издания с иерархическим уровнем (многотомные и продолжающиеся издания) с целью унификации представления подобных записей в коммуникативном формате;
  • проработать структурирование элементов данных, не предусмотренных UNIMARC, но представляющих интерес для библиотек и информационных центров страны, и сформировать на их основе 9-й блок национального использования.

В настоящее время решается важнейший вопрос адаптации формата — организация структуры записи для изданий с иерархическими уровнями. UNIMARC содержит несколько механизмов связи — как для вертикальных, так и для горизонтальных взаимоотношений сложных записей. При составлении записи на многотомное или продолжающееся издание в UNIMARC могут быть использованы область серии или система полей связи четвертого блока. Описание может быть представлено в двух записях с использованием полей связи или в одной записи с использованием подполей основного заглавия или области серии. Каждый вариант имеет свои положительные и отрицательные стороны. По одной схеме мы выигрываем в полноте описания, но усложняем совместимость с другими системами; по другой — выигрываем в доступности и наглядности описания, но теряем часть информации.

Как известно, UNIMARC уже нашел применение в ряде библиотек и информационных центров страны, однако в них нет унифицированного подхода к формированию записей с иерархическим уровнем. Так, в системах ГИВЦ МК РФ, системе Сводного каталога ГПНТБ России, версии РКП, передающей информацию в Библиотеку Конгресса США, моделируются различные схемы построения записи. В результате РКП, поставляющая записи для всех этих систем, вынуждена передавать информацию для каждой организации в индивидуальной спецификации. Та же проблема существует и в ГПНТБ России, имеющей в нескольких автоматизированных базах данных различные структуры иерархической записи в UNIMARC; при этом обмен информацией между системами осуществляется посредством конвертеров, что (правда, без особых затрат) позволяет осуществлять ППП CDS/ISIS стандартными средствами, но все же представляет неудобства в рамках одной библиотеки.

Такая многовариантность приводит к расхождению в прочтении записи и потере информации при коммуникации. При очевидной необходимости перехода к одноразовой каталогизации в каком-либо библиографирующем центре возникает насущная потребность в стандартизации единственного унифицированного варианта записи.

Дискуссионным является вопрос: существует ли необходимость создания совершенно обособленной модели UNIMARC в российской версии или возможна трансформация в нем национальных особенностей без изменения его основы? При создании безальтернативного российского варианта формата с исключением полей и подполей данных UNIMARC мы можем отойти от международной практики форматирования и получить еще один вариант чисто национального формата, адекватного по значимости МЕКОФ. Возможно, будущий формат с максимальной точностью будет отражать специфику российской национальной библиографии, но все же он не будет оптимален при международном общении. Решение этого вопроса зависит от того, какая из двух моделей — международная или национальная — будет иметь больше сторонников.

Еще одним важным вопросом является безальтернативный подход к организации структуры записи. Существует мнение, что для успешной коммуникации между организациями необходим только один вариант передачи данных. С этим невозможно не согласиться, но все же тот вариант, который на данном этапе принят к рассмотрению — вариант построения отдельной записи на каждый уровень описания — мало применяется в международных функционирующих системах. Поэтому для сопрягаемости с этими системами придется дополнительно иметь как альтернативу еще одну схему структуры записи с использованием области серии для общего заглавия.

Вариант построения отдельной записи на каждый уровень описания наиболее полно идентифицирует описываемый документ, поэтому эта схема рассматривается в качестве модели для национального формата обмена информацией. Однако она предполагает сложный алгоритм системы связи между записями и необходимость применения сложного программного интерфейса, что сегодня на уровне средних и малых библиотек проблематично и экономически невыгодно.

Мнения специалистов по данному вопросу весьма противоречивы. Мы стараемся найти наилучший вариант, который соответствовал бы мнению большинства, не был бы некорректным для какой-либо части издания и наиболее полно отражал каждый из его иерархических уровней.

Дальнейшие проработки второго этапа будут касаться форматирования элементов данных, представляющих специфику национальной библиографии. Конкретизированные элементы данных будут проидентифицированы и сформатированы в 9-м блоке национального использования, как например шифры и сиглы библиотек, или отражены непосредственно в той области описания, к которой они относятся, с помощью выделения поля для национального использования с цифрой 9, как это сделано для международных номеров.

На третьем этапе необходимо завершить работу над форматом по следующим направлениям:

  • определить организацию структуры записи в машиночитаемой форме для составной части документа (статья из журнала, сборника, глава из книги). Здесь мы должны учитывать разработку Постоянного комитета UNIMARC на аналитику и национальные особенности библиографии;
  • разработать технологию взаимодействия между библиографическими записями и записями, содержащими авторитетные формы заголовков, в UNIMARC. На этом этапе мы должны будем объединиться с группой UNIMARC/Authority для принятия технологических решений по проблеме;
  • включить в среду коммуникативного формата все виды документов (в том числе спецвиды, картографические, музыкальные, аудиовизуальные материалы и компьютерные файлы). Необходимо пересмотреть все специфические поля, касающиеся полного репертуара формата, используя при этом разработки, подготовленные Постоянным комитетом UNIMARC, с привлечением к этой работе необходимых специалистов.

Все разработки подгруппы будут включены в Руководство по Российскому коммуникативному формату.

Copyright © 1995-97 ГПНТБ России