Home page | Каталоги и базы данных

Научные и технические библиотеки

УДК 025.32

Грэдмен С.,

Корпорация Пика,
Лейден, Нидерланды

Каталогизация или метаданные:
старое вино в новых бутылках ?

Доклад 007—126 на 64-й Генеральной конференции ИФЛА (15—22 авг. 1998 г. Амстердам); буклет 4, с. 36—43.

Понятие метаданные отражает необходимость переосмысления соотношения между описательными и справочными элементами (в особенности это касается электронных документоподобных объектов — Document Like Objects).

В данном докладе перечислены некоторые фундаментальные различия между традиционной каталожной записью и метаданными; имеются в виду как процессы производства метаданных, их использования, так и взаимоотношения между метаданными и оригинальными документами (объектами), на которые составлены метаданные, а также взаимоотношения между метаданными и каталожными записями. В докладе сделана попытка доказать, что признание разницы между метаданными и каталожными записями является фундаментальным требованием при переосмысливании роли библиотекаря во вновь возникающей и быстро эволюционирующей информационной обстановке.

* * *

В докладе Рэчел Хири [1], опубликованном в 1996 г. (как давно это было, если судить по темпам развития Интернет), дано такое определение метаданным: "Хорошо всем знакомый библиотечный каталог может рассматриваться как набор метаданных в том смысле, что каталожная запись и есть информация об информации". Поскольку это определение сохраняет свое значение и сейчас, то вполне возможна корректная и несколько наивная реакция библиотекаря: "Давайте считать каталогизацию неким специфическим видом процесса генерации метаданных и оставьте в стороне весь этот небиблиотечный шум и гам; давайте заниматься делом, т. е. каталогизацией, как будто ничего существенного вокруг не происходит". Я специально подготовил этот доклад, пытаясь показать сколь неадекватна такая реакция. Свою задачу я вижу в том, чтобы показать такие моменты и проблемы процесса генерации и использования метаданных, которые в ближайшем будущем коснутся любого библиотекаря.

Мой доклад никоим образом нельзя считать введением в проблему метаданных: предполагаю, что читатель уже знаком с основными аспектами и определениями. Желающих познать азы или детали я отсылаю к материалам ИФЛА или Британского офиса по библиотечным сетям — ifla.inist.fr/infla/II/metadata либо ukoln.ac.uk./metadata, в которых (для краткости здесь и далее опускаются данные Интернет — http://www. — Ред.), любой человек, ознакомившийся с этой информацией, сумеет понять дальнейшее изложение. Поэтому я сознательно несколько сужаю тему, не буду ни рассматривать все проблемы стандартов, ни оценивать активность по составлению метаданных, а сосредоточусь только на одном примере, может быть, наиболее важном в данный момент. Я имею в виду так называемую систему Даблин Кор (Dublin Core, подробную информацию о ней можно найти по Интернет-адресу purl.org/metadata/dublin core). Я не собираюсь излагать и современные проблемы стандартизации в области Даблин Кор или в сфере существующих правил каталогизации или форматов — таких, например, как ISBD (ER) или агитировать в пользу каких-то рабочих моделей: это можно сделать в другом месте, например в дискуссионном листе, где выступают авторитетные в данной области специалисты.

Меня здесь больше беспокоят вопросы возможных взаимоотношений между процессами каталогизации и генерированием метаданных, на которые я пытаюсь дать робкий и осторожный ответ. Общепринято, что традиционные каталожные записи и метаданные в какой-то степени дополняют друг друга; я же утверждаю, что они различаются фундаментально и, может быть, представляют собой конфликтующие технологии.

Помимо всего прочего имеются несколько разумных причин как явных, так и скрытых, по которым сообщество пользователей метаданных не применяет MARC или не пытается корректировать эту систему форматов, а пользуется вновь созданной совершенно новой системой. Некоторые из этих причин имеют корни в сложившимся представлении о том, чем библиотекари заняты.

Метод метаданных пользуется преимуществом "новой попытки"; после завершения начального периода неизбежно появятся какие-то проблемы и подводные камни, с которыми библиотекари сталкиваются уже 30 лет. Изобретать заново колесо, может быть, и полезно (это часто наблюдается при автоматизации библиотек), однако не менее полезно учитывать и ошибки других.

Моя работа направлена на стимулирование дискуссии, и я приношу извинения за некоторые упрощения и аналогии в данном тексте.

Кто и как это делает?

При рассмотрении типичных результатов производства метаданных, сделанных по системе Даблин Кор, возникает искушение, по крайней мере у библиотекаря, считать их упрощенным вариантом каталогизации. Такой взгляд поддерживается и определением: "метаданные — это информация об информации (данные о данных); и они дают базовые сведения, например, об авторе произведения, дате создания, связи со схожими работами и т. д. Одной из узнаваемых форм метаданных является карточный библиотечный каталог: запись на карточке является метаданными о книге. Может быть, и не зная того, вы пользуетесь метаданными каждый день" [2]. Эту позицию разделяет и Присцилла Каплан [3]; в попытке ответить на вопрос, что такое метаданные, она пишет: "метаданные — это всего лишь информация об информации; каталожная запись — это метаданные... Мы можем называть это каталогизацией, хотя для кого-то этот термин излишне перегружен требованиями MARC или AACR2. В какой-то степени это игра слов, однако метаданные — это хороший нейтральный термин, соответствующий всем определениям". Уже упоминавшаяся г-жа Хири указывает на имеющуюся разницу в сложности уровня записи (по восходящей линии сложности от форматов "каталогизация в процессе печати, далее к Даблин Кор, далее — MARC - записи". Более серьезную разницу отмечает Тим Бернерс-Ли [4]: "метаданные — это машиночитаемая информация относительно ресурсов web в Интернете. Слово машиночитаемая является ключевым. Разработчики программного обеспечения могут использовать эту информацию и сделать нашу жизнь легче...". Заметьте, что здесь уже речь идет о программистах, а не о библиотекарях. Разница станет еще заметнее, если мы обратимся к истокам инициативы создания Даблин Кор, о которой вспоминает Стюарт Вайбель [5]: "Исходной мотивацией для проведения серии семинаров по Даблин Кор было понимание того, что авторы могут давать свой собственный вариант описания".

Итак, различаются не только технологии производства, возможные создатели записи — уже в основном не каталогизаторы. Кроме того, полезно помнить, что еще одним мотивом создания Даблин Кор было стремление облегчить поиск ресурсов в Интернет, а вовсе не составление описания как такового. Итак, описательный характер метаданных вполне случаен.

Все это дает нам основания отметить следующее: использование метаданных отличается от использования библиотечных каталогов; для их создания не нужно привлекать профессиональных каталогизаторов; на создание метазаписи требуется существенно меньше времени, чем на библиографическую запись; метаданные относятся к специфическому виду материалов — электронным ресурсам, и наконец (я еще скажу об этом ниже) отношение метаданных к исходному документу решительно отличается от взаимоотношений каталожной записи с библиотечной книгой. Хотя семантически записи Даблин Кор схожи с упрощенной каталожной записью и могут быть легко размечены в формате MARC, целостный контекст производства и использования метаданных существенно отличается от каталогизации и вызван стремлением избавиться от традиционного процесса каталогизации. Поэтому стремление считать процесс генерации метаданных лишь упрощенной каталогизацией является серьезной ошибкой.

 

Для кого это делается и как используется?

Каталожные записи делаются в библиотеках и в этом смысле их общей чертой является относительное пренебрежение интересами потенциальных пользователей этих записей. Будущие варианты использования каталожной записи (например, в электронном каталоге или при последовательном размещении каталожных карточек в печатном каталоге) до сих пор очень мало влияли на процесс создания таких записей, и совсем не влияли на их семантику (как она, например, формируется в AACR2). Этот факт можно бы считать преимуществом, однако библиотечное сообщество в настоящее время все более обеспокоено недостатками такого явного пренебрежения по отношению к пользователю и поневоле (под давлением политических и финансовых обстоятельств) вынуждено пересматривать некоторые принципы.

Что же касается Даблин Кор или других систем метаданных, то там совсем другое дело: одной из наиболее важных их особенностей является прямая ориентированность на потребности и запросы конечного пользователя. Это может считаться и недостатком, ибо интересы конечного пользователя и его поведение со временем меняются, поэтому существует угроза крутых поворотов; тем не менее зависимость от пользователя считается позитивным фактором. Там, где вводятся записи Даблин Кор, их элементы разрабатываются специально для специфических видов ресурсов (электронных объектов в среде Интернет), для определенного характера использования этих ресурсов (точности поиска в Интернет) и для определенной группы пользователей, которую разработчики Даблин Кор ласково называют цифровыми туристами (digital tourists).

Это же в какой-то степени относится и к семантике Даблин Кор, поскольку для метазаписи существенным является жесткая, однозначная связь с конкретным документом (т. е. тем экземпляром, который обрабатывается в данный момент). В результате при создании метазаписи соотношение между метаданными и самим ресурсом в физическом смысле — один к одному (процесс копирования метаданных по типу типографского размножения каталожных карточек в принципе невозможен. — Ред.). Это свойство особенно наглядно проявляется в синтаксисе метаданных, совершенно явно ориентированном на использование в WWW - среде.

Фундаментальное различие между каталожной и метазаписью может быть наилучшим образом проиллюстрировано сравнением взаимоотношений записи с оригиналом. В большинстве библиотечных систем библиографическая запись обычно дополнена служебными пометками — указателями местонахождения книги. Такой шифр обычно проставляется библиотекой под конкретную систему расстановки фонда и обслуживания в данной библиотеке, поэтому необходимы определенные дополнительные знания и усилия библиотекаря, чтобы выдать читателю объект его интереса. Весьма важно, что и сами пометки, и технологический процесс выдачи оригинала никоим образом не связаны с процессом составления данной конкретной библиографической записи и каталогизации в целом.

Для метаданных ситуация принципиально иная. "Метаданные отличаются от традиционных каталожных записей и тем, что запись составляется так, чтобы дать возможность непосредственной доставки документа при помощи соответствующего программного обеспечения; иными словами, запись содержит подробную информацию о доступе и адрес в сети" [1]. Таким образом, метаданные являются частью специфической информационной инфраструктуры (это правильно даже на уровне семантики). Реальная значимость метаданных в том, что точки доступа, созданные в записи, действительно работают (и это объясняет активную дискуссию о проблеме "порванных связей" и необходимость стандартизации записей универсальных адресов в Интернет). Формат этих точек доступа должен соответствовать используемому программному обеспечению; несколько упрощая, можно сказать, что метаданные с неправильным указателем адреса делают бессмысленной и бесполезной всю запись.

Итак, завершая этот раздел, еще раз отметим, что метаданные не только принадлежат к другому семейству, но также предназначены для другого использования и технологически прочнее связаны с оригиналом, чем каталожные описания. Парадоксально, но этот факт решительно усложняет дело, ибо роль метаданных в системе информационной инфраструктуры зависит от быстро меняющихся стандартов Интернет.

Метатехнология — шанс для библиотекаря?

Надеюсь, что теперь вам стали понятны фундаментальные различия между каталожными записями и метаданными. Эти две системы отражают две разные части информационной инфраструктуры. Конечно, можно пытаться объединить обе системы, например, используя электронный каталог библиотеки как шлюз к электронным ресурсам, в том числе и в электронной форме [5]. Я бы не хотел здесь подробно останавливаться на этой идее, но некоторые сомнения в осуществимости и практичности такого подхода у меня имеются.

В настоящее время существует важное направление исследований и связанная с ним практическая работа, которую выполняет Корпорация Пика (Pica, г. Лейден, Нидерланды). Это — объединение систем автоматизации библиотек и информационной технологии Интернет, которое мы делаем в нашем проекте доставки документов WebDoc и в проекте DELTA (Dutch Electronic Library Association).

Можно назвать и другие области, где специальные знания и опыт библиотекарей могли бы пригодиться при работе с метаданными (реально передача опыта, конечно, происходит, поскольку над составлением метаданных зачастую работают библиотекари). Я имею в виду использование повторяющихся элементов записи, опыт, накопленный при эксплуатации MARC-формата, архитектура подполей, применение контролируемого (нормативного) словаря (в какой-то мере аналога авторитетных файлов) и т. д.

В заключение я хочу отметить две области, в которых роль библиотекарей могла бы принести существенный и постоянный позитивный вклад в дело генерации метаданных. Как заявил недавно один из участников дискуссионного клуба Metadata2: "Мой собственный опыт показывает, что наиболее полезен для проведения поисков в библиотечном каталоге не сам формат, а сформатированная информация. Библиотекари традиционно следовали концепции согласованности при создании библиографической записи. Я понимаю, что возможность отличить Грин — имя автора от грин — в названии книги — очень большой шаг; но этот шаг бледнеет, если вам удается отличить, правильно выбрать Давид Грин среди множества других имен" [6]. Итак, первая область — сверка и контроль авторитетных записей, что действительно составляло главную заботу библиотекарей, и в этом контексте для них может существовать некая ниша систематической работы при генерации метаданных, проверке их тотальной совместимости, но, конечно, без малейшего шанса превратить такую работу в подобие каталогизации!

Вторая область — проблемы, связанные с аутентичностью метаданных. Недавний доклад Группы по метаданным при Европейской комиссии утверждает, что в настоящее время восприятие Даблин Кор идет слишком медленно. Среди разных причин здесь можно назвать относительно слабое использование технологии метаданных в таких широко популярных поисковых системах, как Альта Виста (Alta Vista), где пока еще акцент делается скорее на индексирование по ключевым словам. В упоминавшемся на дискуссионном клубе Metadata2 документе Стюарта Вайбеля эта проблема звучит следующим образом: "Я верю, что мы движемся от ментальности типа где я щелкну? к ментальности кому я доверяю?. Считаю, что это создает нам шанс, равно как и таит угрозу, поскольку доверие публики — это самое большое наше достижение. Различные формальные сообщества — музеи, правительственные органы, издатели, профессиональные и коммерческие организации — намереваются создавать описания надежных источников информации. Конечно, возможны случаи неправильного использования, они существуют и в практике применения метаданных. Это означает необходимость выработки каких-то совместных обязательств, конвенций (в том числе и средств контроля и проверки) с целью поставки надежных описаний информационных ресурсов".

Вероятнее всего, навигационная метаинформация будет поставляться какими-либо брокерами или заслуживающей доверия третьей стороной. Возможно, это примет форму справочника типа телефонных "желтых страниц". Составление описания ресурсов требует определенных затрат, поэтому я полагаю, что такие бесплатные сейчас системы, как Альта Виста или Яху (Yahoo!) могут приняться за создание платных каталогов имеющихся ресурсов.

Я не уверен в перспективности или желательности коммерческого пути; может быть, следует вовлекать библиотеки в этот необходимый для общества процесс информационного посредничества. Безусловно, необходимо наличие надежных третьих партий или сторон; не уверен, что каждый из нас будет счастлив зависеть от системы информационного посредничества через коммерческие предприятия. Сам же процесс проверки информации независимыми институтами так или иначе абсолютно необходим. Несмотря на то, что эти идеи противоречат столь модному сейчас тезису дерегуляции, я все же считаю их полезными.

Я надеюсь, что сумел разъяснить, что метаданные — это не пустой звук и уж конечно, не старое вино в новых бутылках. Суть этого термина в развитии, в переходе от чисто библиотечной идеологии к некоей другой. Мне бы хотелось, чтоб библиотеки включились в процесс эволюции и рассматривали метаданные не как угрозу своему существованию, а скорее как возможность пересмотра своей роли.

Литература и адреса в Интернет

1. Heery, Rachel. Metadata Formats. December 1996.

ukoln.ac.uk/BIBLINK/wpl/dl/l

2. Miller, Paul. Metadata for the Masses Sept. 1996.

ariadne.ac.uk/issue5/metada-masses

3. Caplan, Priscilla. You Call It Corn ...1995.

info.lib.uh.edu/pr/v6/n4/cap16n4

4. Berners-Lee, Tim. Metadata Architecture. 1998.

W3.org./DesignIssues/Metadata

5. Xu, Amanda. Metadata Conversion and the Library OPAC. 1998.

web.mit.edu/waynej/www/xu

6. Weinheimer, James: meta2@mrrl.lut.ac.uk


Copyright © 1995-2000 ГПНТБ России