МЕЖДУНАРОДНЫЕ БИБЛИОТЕЧНЫЕ ДОКУМЕНТЫ

УДК 025.32

Т. А. Бахтурина

Понятие «пространство имён» (namespace)
и сферы его применения.
Пространства имён ISBD

Рассмотрено новое явление в международных библиотечных документах – «пространство имён», охарактеризованы «родная» сфера его применения – XML – и сферы заимствования – пространства имён IFLA, FRBR, ISBD. Сделан акцент на терминологии и документах, регламентирующих пространства имён в конкретных сферах.

Ключевые слова: пространство имён, XML, IFLA, FRBR, ISBD, терминология, Открытый реестр метаданных.

Библиотечный язык – и русский, и английский – перегружен терминологией математики, философии, логики, семантики, информационных технологий.

Тысячелетия в библиографическом описании существовали понятия «автор», «заглавие» и т.п. В XX в. их стали называть элементами библиографического описания и объединили в области. При этом элементы и области сохраняли привычные названия. К концу века появилось исследование «Функциональные требования к библиографическим записям» (Functional requirements for bibliographic records, FRBR), которое выстроило модель библиографической записи из объектов, атрибутов и связей, но в глубине этих понятий всё равно были заключены узнаваемые «авторы» и «заглавия».

Наступил XXI в. – появились инновационные международные документы «Описание ресурса и доступ» (Resource Description and Access, RDA) и «Модель/структура описания ресурса» (Resource Description Framework, RDF), а с ними – незнакомые термины, незнакомый язык современной каталогизации.

Отечественная каталогизация всегда чутко реагировала на инновации в международном сообществе. А наш журнал – «Научные и технические библиотеки» – оперативно информировал библиотечную общественность о новых явлениях и тенденциях. В «НТБ» впервые появились сообщения о «Международном стандартном библиографическом описании компьютерных файлов» (International standard bibliographic description for computer files, ISBD(CF)), позднее преобразованном в «Международное стандартное библиографическое описание электронных ресурсов» (International standard bibliographic description for electronic resources, ISBD(ER)).

Мы также оперативно информировали читателей и об основных этапах создания Консолидированного издания «Международного стандартного библиографического описания» (ISBD. Consolidated edition). Большое внимание уделяли терминологическим проблемам: сложным для однозначного понимания терминам FRBR; терминам, связанным с типологией электронных ресурсов; эволюции термина «Общее обозначение материала», который превратился в Консолидированном издании ISBD в новую область 0 – Область формы содержания и типа средства.

Подробно отслеживали и перипетии пересмотра «Англо-американских правил каталогизации» (Anglo-American Cataloguing Rules, AACR) – от расширенных, обогащённых, но традиционных правил AACR3 к правилам RDA – по структуре и духу соответствующим FRBR.

Среди инноваций последнего времени – возникновение и быстрое проникновение в базовые каталогизационные документы нового понятия «пространство имён» (namespace). Только во внешних ресурсах РГБ – 1 239 публикаций на эту тему. Вот почему мы решили осветить её в «НТБ».

Для библиотекарей термины «пространство» и «имена» существовали раздельно. Пространства: векторное, евклидово, космическое, ономастическое, трёхмерное, этнокультурное, информационное и др. Имена: личное, духовное, мирское, подлинное, родовое, собственное и др. Но в параллельном компьютерном мире эти слова соединились в один термин.

Пространство имён – некоторое множество, под которым подразумевается модель, абстрактное хранилище или окружение, созданное для логической группировки взаимосвязанных имён или терминов, классов, интерфейсов, функций, констант и других уникальных идентификаторов.

Идентификатор, определённый в пространстве имён, ассоциируется с этим пространством. Один и тот же идентификатор может быть независимо определён в нескольких пространствах. Таким образом, значение, связанное с идентификатором, определённым в одном пространстве имён, может иметь такое же значение, как и такой же идентификатор, определённый в другом пространстве.

Сфера применения этого явления – прежде всего компьютерное пространство, откуда это понятие перекочевало в IFLA, ISBD, FRBR, FRAD, FRSAD, UNIMARC и даже в многоязычный словарь по каталогизации MulDiCat. Свои пространства имён имеют или разрабатывают MARC21, RDA и другие «стандарты».

Пространство имён в XML. XML (Extensible Markup Language) – расширяемый язык разметки, представляющий собой свод общих синтаксических правил. XML – текстовый формат, предназначенный для хранения структурированных данных, обмена информацией между программами, а также для создания на его основе более специализированных языков разметки.

Пространство имён в XML – это стандарт Консорциума Всемирной паутины (World Wide Web Consortium, W3C), описывающий совокупность имён элементов и атрибутов, служащую для обеспечения их уникальности в XML-документе. В 2009 г. третья редакция стандарта получила статус рекомендации (Namespaces in XML 1.0. W3C Recommendation).

Основной причиной возникновения неймспейсов (термин применяется и в такой форме) явилась необходимость различать XML-элементы, обладающие одним и тем же именем, но имеющие разный смысл и предназначение, относящиеся к разным словарям разметки. В каждом словаре задано своё пространство имён – так разрешается проблема неоднозначности имён элементов и атрибутов.

Пространство имён сначала объявляют с помощью набора зарезервированных атрибутов. Имя такого атрибута должно либо быть xmlns, либо начинаться с xmlns: … Атрибут xmlns играет роль разделителя на книжном стеллаже: он разделяет различные классы элементов и атрибутов, чтобы их легче было применять в документе, не происходило путаницы. Существуют два способа объявления неймспейсов: с префиксом и без префикса.

Префиксный – это такой способ объявления пространства имён, при котором задаётся его имя. При использовании такого пространства имён всегда необходимо применять в дальнейшем расширенный вид имени элемента (или атрибута), чтобы указать на то, к какому пространству имён относится этот элемент (или атрибут). Для объявления префиксным способом используется следующая конструкция:

xmlns: имя_пространства_имён="URI_пространства_имён".

Беспрефиксный способ подразумевает объявление пространства имён по умолчанию для имён элементов и атрибутов, записанных в обычной форме. Его запись выглядит так же, как и при использовании префиксного способа, но без имени пространства_имён, т.е.:

xmlns="URI_пространства_имён".

Здесь префикс – это некоторое внутреннее имя XML-документа, можно использовать любой префикс. А URI фиксируется раз и навсегда, чтобы при виде этого URI было понятно, какой словарь разметки он представляет.

Пространство имён, объявленное для какого-либо элемента, является таковым для всех вложенных в него элементов, если для них не объявлено других пространств имён. Добавляя в документ новое пространство имён, мы делаем соответствующую привязку всех элементов и атрибутов, использующих его, к определённому адресу в Интернете. Этот адрес указывает на веб-страницу, на которой расположена информация о том, какие элементы и атрибуты может включать в себя данное пространство имён.

Пространства имён IFLA – Требования и параметры (IFLA Namespaces – Requirements and Options) разработаны Целевой группой IFLA по пространствам имён (IFLA Namespaces Task Group) в 2010 г., обновлены в 2011 г.

Тема пространства имён отражает текущую деятельность внутри сообществ IFLA. Это проект Группы пересмотра FRBR по пространству имён; работа Секций каталогизации, классификации и индексирования; ведение «Многоязычного словаря терминов и понятий по каталогизации» (Multilingual dictionary of cataloguing terms and concepts, MulDiCat) на веб-сайте IFLA; совместная работа ICADS (IFLA-CDNL Alliance for Digital Strategies) с UNIMARC и MARC форматами; работа Исследовательской группы ISBD/XML (ISBD/XML Study Group).

Термин «пространство имён» используется здесь более широко, чем в его обычных технических определениях, и охватывает все аспекты совместимости с Семантической паутиной, Семантическим Вебом (Semantic Web). Семантическая паутина – это направление развития Всемирной паутины (World Wide Web), целью которого является представление информации в виде, пригодном для машинной обработки.

В обычной Паутине, основанной на HTML-страницах, информация заложена в тексте страниц и извлекается человеком с помощью браузера. Семантическая же паутина предполагает запись информации с помощью онтологий. Семантическая паутина работает параллельно с обычной Всемирной паутиной и на её основе, используя протокол HTTP и идентификаторы ресурсов URI.

Документ IFLA содержит требования и рекомендации, посвященные пространствам имён IFLA, развитию стандартов (для чего создана новая Группа по программе стандартизации), координации деятельности с другими заинтересованными сообществами.

Требования и рекомендации IFLA (их всего 9) следующие:

Осуществлять мониторинг пространств имён IFLA, FRBR, FRAD, FRSAD, ISBD, MulDiCat и связи между ними;

Осуществлять связи с не-IFLA пространствами имён – Dublin Core, MARC21, RDA;

Исследовать сообщества пространств имён в плане  способности к взаимодействию (интероперабельности);

Осуществлять связи между доменами (архивов, библиотек, музеев, и т.д.) и их схемами и данными.

 

Пространство имён в FRBR (Namespace for FRBR) подготовлены Группой пересмотра FRBR (FRBR Review Group) в 2008 г. с конкретной задачей – «определить соответствующие пространства имён для FRBR (объект-связь) (FRBR (entity-relationship), FRBR (ER)) в RDF и других соответствующих синтаксисах». RDF является стандартом W3C для описания веб-ресурсов в Интернете, моделью описания, набором спецификаций, разработанных Консорциумом W3C, чтобы обеспечить средства моделирования метаданных в различных форматах (синтаксисах). Форматом, обычно связанным с RDF, является XML. Необходимо использовать XML-пространства имён для словарей объектов и связей FRBR, чтобы они были совместимы с RDF.

Словари FRBR составляют часть онтологии, которая может быть описана с использованием RDF схемы (RDFS). RDFS также является рекомендацией W3C. RDFS требует применения унифицированных идентификаторов ресурсов (URI, похожих на URL-адреса) для обозначения машиночитаемых мест для содержания пространства имён.

Основным стимулом проекта было формирование Целевой группы DCMI RDA (DCMI/RDA Task Group). Цель этой группы – определение компонентов RDA в качестве словаря RDF для использования при разработке приложений Dublin Core. Среди ближайших задач Группы пересмотра FRBR – создание «фирменного» домена пространства имён FRBR. Группа пересмотра FRBR должна также гарантировать, что пространство имён FRBR, основанное на FRBR (ER), может быть интегрировано в любое пространство имён объектно-ориентированного FRBR (FRBR-object oriented, FRBRoo).

Пространства имён ISBD (ISBD Namespaces), разработанные группой пересмотра ISBD (ISBD Review Group) и исследовательской группой ISBD/XML для консолидированного издания ISBD, были опубликованы в RDF в 2012 г.

Словари элементов ISBD включает в себя классы и свойства RDF, соответствующие элементам ISBD. Шесть словарей дают контролируемые терминологии области 0 ISBD: формы содержания, характеристики содержания и типы средства. Каждый класс, понятие и свойство имеют унифицированный идентификатор ресурса (URI) для использования триады  данных в Семантическом Вебе. Словари ISBD предоставляют быстрые ссылки для зарегистрированных наборов элементов ISBD. Каждый набор элементов или словарь понятий имеет ссылку на общее описание.

При использовании в обычном веб-браузере URI отображает HTML-страницы с человекочитаемой информацией об элементе или концепции. При использовании в семантическом браузере URI получает машиночитаемую информацию в RDF/XML формате. Кроме того, можно извлечь этот формат, используя обычный веб-браузер. Например, URI для ISBD формы содержания «музыка» является:

http://iflastandards.info/ns/isbd/terms/contentform/T1004.

Для получения RDF/XML-информации в обычном веб-браузере используется URI:

http://iflastandards.info/ns/isbd/terms/contentform/T1004.rdf.

 

Представляя документ о пространствах имён ISBD, Гордон Дансайя (Gordon Dunsire), руководитель Исследовательской группы ISBD/XML, отметил несколько ключевых моментов:

1. Сведения о метаданных в пространствах имён ISBD построены в трёх частях, которые называются «триада (тройка, триплет)» (triple): субъект – предикат – объект.

Название книги «Остров сокровищ»

Субъект сведений = субъект: Эта книга

Природа сведений = предикат: имеет название

Значение (величина, ценность) сведений = объект: «Остров сокровищ»

Эта книга – имеет название – «Остров сокровищ»

2. Унифицированный идентификатор ресурса может быть любым уникальным сочетанием  цифр и букв, может выглядеть как URL.

3. RDF требует субъекта и предиката из триады для URI.

Объектом может быть URI, или символьная строка («Остров сокровищ»).

4. Можно присвоить текущий «номер» базе, чтобы создать новый URI. Можно использовать набор свойств (= предикатов) для создания основных триад. Например, rdfs: для присвоения человекочитаемой метки свойству (или классу) RDF:

isbd: P1001 – rdfs: метка – «имеет содержание формы»

«Пространства имён ISBD» сохраняются и доступны с помощью Открытого реестра метаданных (Open Metadata Registry, OMR).

 

Теория пространств имён не проста и многим кажется избыточной, но она существует, хорошо зарекомендовала себя в разных областях, вошла в нашу библиотечную жизнь и потому достойна внимания профессионалов. Возможно, сейчас зарождается будущее библиографического описания и всей каталогизации.