Научные и технические библиотеки №2 2004 год
Содержание:

Десятая Международная конференция «Крым–2003» – «Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества»

Секция 7. Информационно-лингвистическое обеспечение библиотечно-информационных систем

Зайцева Е.М. Лингвистическое обеспечение АБИС: шаги на месте и движение вперед в сравнении с другими информационными системами

Гендина Н.И. Состояние теории, практики и подготовки кадров в сфере лингвистического обеспечения информационно-библиотечной технологии: стимулы и препятствия

Антошкова О.А., Астахова Т.С., Белоозеров В.Н. Ведение и совершенствование Универсальной десятичной классификации

Каспарова Н.Н. Основные положения «Российских правил каталогизации» – итоги пересмотра

Сукиасян Э.Р. «Предметный вход» в электронный каталог. Как повысить эффективность поисковых процедур


Секция 8. Формирование и сохранность фондов

Хахалева Н.И. Аспект гибридности в формировании системы фондов библиотеки

Петрусенко Т.В., Романов А.П. Книгообмен в информационном обществе: реалии и перспективы

Гриханов Ю.А. Модернизация системы депозитарного хранения библиотечных фондов России

Саразетдинов Р.Г. Размыкая цепь проблем: взгляд книгораспространителя на комплектование библиотек

Евстигнеева Г.А., Глухова Е.И. Финансовые аспекты комплектования иностранной литературы

Петухова Е.Л. Современные технологии комплектования книжных фондов

Зорина С.Ю. Комплектование библиотечных фондов. Пути эффективной интеграции библиотек и издателей


Секция 9. Организация экологической информации. Библиотечный мониторинг экологической культуры

Бычкова Е.Ф. Обзор работы секции «Организация экологической информации. Библиотечный мониторинг экологической культуры»


ИФЛА–2003

Земсков А.И., Павлова Н.П. ИФЛА–2003 – жаркое лето в Берлине

Еронина Е.А. Мероприятия Комитета ИФЛА по авторскому праву и Секции МБА и ДД

Проблемы качества работы библиотек на ИФЛА–2003 (Заседание Дискуссионной группы)

«Информационные технологии и работа Группы метаданных Даблин Кор» – семинар в Геттингене


К юбилею А.В. Соколова

Зверевич В.В. Десять лет из жизни профессора Аркадия Соколова

Соколов А.В. К вопросу о библиотечном кретинизме


УДК 025:65.011.56

«Информационные технологии
и работа Группы метаданных Даблин Кор» –
семинар в Геттингене

После завершения Всемирного конгресса ИФЛА состоялось одно весьма примечательное мероприятие – так называемый постконференционный семинар «Информационные технологии и работа группы метаданных Даблин Кор» (Satellite Meeting “Information Technology and DCMI”).

Семинар организован совместно библиотекой Геттингенского университета (где он и был проведен), Секцией информационных технологий ИФЛА и группой Даблин Кор (DCMI). В нем приняли участие 42 специалиста, в том числе двое с нашей стороны – А.И Земсков, директор ГПНТБ России, и Г.А. Евстигнеева, зав. отделом комплектования и научной обработки иностранной литературы и международного книгообмена. С докладами выступили 11 участников, среди них и Г.А. Евстигнеева.

Эта часть командировки на ИФЛА–2003 оказалась во многом занимательной.

Во-первых, сам Геттинген – город, основанный в XIII в. и бывший членом Ганзы (несмотря на положение в центре Германии), переживший и взлеты, и падения; в определенном смысле Геттинген – связующее звено трех европейских стран – Англии, Германии и России.

Близость лесного и гористого массива Гарц служила истоком многих легенд и сказок; неслучайно среди выдающихся геттингенцев – братья Гримм.

С XVIII в. – это город науки,  здесь жили и учились многие известные, замечательные люди; на домах мемориальные доски со знакомыми фамилиями – Бунзен, Эсмарх, Гете, Гейне, Бисмарк и много-много других.

Во-вторых – Университет, основанный в 1734 г. и ставший Alma Mater для представителей многих поколений граждан России (и иронично воспетый Пушкиным).

Наряду с университетами Саламанки, Сорбонны, Болоньи, Карловым университетом в Праге Геттингенский университет – составная часть европейского просвещения. Он – колыбель нобелевских лауреатов, жизнь которых так или иначе была какое-то время связана с Геттингеном – они здесь либо учились, либо работали, либо стажировались. Даже случайно выбранная часть списка нобелевских лауреатов-геттингенцев звучит симфонией разума – Вин, фон Лауэ, Планк, Штарк, Милликен, Зигбан, Герц, Гейзенберг, Дирак, Ферми, Паули,  Борн, Бете, Нернст, Лэнгмюр, Дебай, Ган, Кох, Мечников, Гюнтер Грасс и другие гиганты.

И в-третьих – библиотека Университета (www.sub.unigoettingen.de), в том числе празднующее свое 10-летие ее новое здание – образец современной функциональной библиотечной архитектуры.

Библиотека Геттингенского университета (точнее, это городская и университетская библиотека, сокращенно ее принято называть SUB Goettingen) создана в 1734 г. Она явилась первой научной библиотекой в современную эпоху, имея в виду политику комплектования, технологию обработки изданий и обеспечение доступности фондов.

Сегодня в библиотеке 4,5 млн. изданий; 1,1 млн. микроформ; 14 тыс. наименований журналов; 300 онлайновых баз данных; открытый доступ к 1,3 млн. книг; ежедневно библиотеку посещают 4 тыс. читателей.

Библиотечный комплекс состоит из нового здания (архитектор Экхард Гербер) – шедевра библиотечной архитектуры, недавно заново отремонтированного старого здания в Паулинер кирхе (построена в начале XIV в.) и ряда факультетских библиотек. (Именно о старом здании вспоминал Генрих Гейне – «в моих мечтах я возвращался в Геттинген и стоял в библиотеке»; в ней работали и братья Гримм, и Гете).

Сильная сторона библиотеки – умелое сочетание самых современных технологий. Помимо роскошного высокотехнологичного нового здания, в библиотеке создан Центр ретроспективной оцифровки; работают 4 сканера, микрофильмы передают для оцифровки в Берлин – в специализированную организацию; затем в Центре записывают данные в формате TIFF, хранят на двух серверах и передают в цифровую магнитоленточную службу (tape library). Использовать оптическое распознавание символов (OCR) в большинстве случаев нецелесообразно, поскольку, например, в формируемой электронной библиотеке по математике зачастую текстовая часть статьи содержит только слова-связки (эти слова – «поэтому», «вследствие чего», «итак», «очевидно, что» и т.п. – обычно входят в так называемый стоп-лист поиска). Зачастую основная часть математической статьи – формулы.

Активно ведутся разработки описания цифровых документов по схеме Даблин Кор и глубокие работы по комплектованию и реставрации старинного фонда (библиотека представляет собой часть распределенной Национальной немецкой библиотеки, отвечая за издания Германики 1701 – 1800 гг.).

В 2002 г. Немецкая библиотечная ассоциация назвала SUB лучшей университетской библиотекой Германии, имея в виду отлично налаженную кооперацию с другими немецкими и зарубежными библиотеками, внедрение новых технологий в сочетании с заботой о культурном наследии.

 

До начала семинара мы встретились с директором библиотеки (историком по специальности) доктором Элмаром Миттлером (Elmar Mittler) и провели достаточно успешные переговоры о возможных направлениях сотрудничества, среди которых: экология; цифровые библиотеки и проблемы Даблин Кор; печать документов по заказу. (В знак признательности за понимание важности этой технологии д-р Миттлер подарил ГПНТБ России напечатанную по специальному заказу книгу «100-летие Нобелевских премий» о нобелевских лауреатах, учившихся или работавших в Геттингене.)

Экскурсия по библиотеке была интересной и познавательной (примечательно, что в 11.00 в будний день ни один из карточных каталогов не использовался – все читатели работали с электронным каталогом!).

Пост-конференционный семинар, который прошел в библиотеке университета, оказался очень компактным и профессионально насыщенным.

На открытии семинара c приветствием выступил директор библиотеки доктор Элмар Миттлер. По его мнению, Даблин Кор всегда представлял собой очень заманчивую технологическую перспективу. Это движение снизу вверх – от народных масс, а не наоборот. Вскоре 40 – 60% публикаций будут электронными, и потребность  в составлении метаданных станет очень острой. Речь идет о системе, одинаково удобной как для библиотек и библиотекарей, так и для ученых, и поэтому носящей глобальный характер.

В SUB сразу же приступили к изучению возможностей Даблин Кор: в 1996 г. провели первую конференцию, а в 1997 г. начали совместный проект с Немецким библиотечным институтом (DBI) и Немецкой библиотекой (Die Deutsche Bibliothek). В ходе работы создали две базы данных – Мета-руководство и Мета-данные; сотрудник SUB – доктор Ганс Беккер (Hans Bekker) недаром зовется отцом DCMI.

Важно, что Немецкий институт стандартизации принял Даблин Кор в качестве стандарта.

Бывший руководитель группы, а ныне старший научный сотрудник Исследовательского центра OCLC Стюарт Вайбель (Stuart Weibel, weibel@oclc.org ) выступил дважды: с ключевым обзором «Положение дел в группе Даблин Кор» (State of the Dublin Core Metadata Initiative) и в заключение семинара – с сообщением «Программа национальных друзей Даблин Кор» (Dublin Core Metadata Initiative National Affiliate Program).

Существование DCMI во многом зависит от поддержки, оказываемой компанией OCLC. Последний год в 49 американских штатах сокращены бюджеты библиотек. Как следствие в OCLC уволены 30 сотрудников и сейчас поддержка со стороны Центра уменьшилась.

Член ПК Секции информационных технологий ИФЛА – директор Информационного центра Международного университета в Бремене Дианн Руш-Фейха (Diann Rusch-Feja; d.ruschfeja@iu-bremen.de) выступила с сообщением о формировании системы репозитариев (в данном контексте репозитарий эквивалентен архиву – А.З.) с технологией Открытых архивов (Dublin Core and Institutional repositories Open Archive Initiative, OAI).

Идеология Открытых архивов восходит к попыткам решения проблемы научных коммуникаций, сильно искаженных из-за алчности коммерческих издателей и больших задержек в публикации научных работ. Поэтому в 1991 г. профессор Поль Джинспарг (Paul Ginsparg) создал в Лос-Аламосской лаборатории морского флота специальный сервер препринтов, на котором размещались электронные версии самых свежих научных работ. Эти документы можно было выгружать, но не рекомендовалось на них  ссылаться (ввиду их формальной неопубликованности). Они не реферировались, но приветствовались отзывы и комментарии от научного сообщества. После публикации какой-либо работы ее препринт с сервера снимался. В 1999 г. произошло слияние ряда тематических коллекций такого рода документов.

Создание репозитариев в учреждениях или в группах учреждений (в первую очередь в университетах) оказалось очень перспективным делом, полезным как для авторов, так и для самих университетов.

Речь пока идет о таких типах документов, как препринты (электронные препринты, э-принты), технические отчеты, изображения, наборы данных, видеоматериалы, учебно-методические материалы и т.п. Поскольку метаданные могут различаться от одной предметной области к другой, полезно будет ввести сокращенную метазапись – это, можно сказать,  наименьший общий знаменатель, состоящий примерно из 10 элементов. Итак, у авторов появился еще один новый канал для публикации своих работ; быть может, изменится и формат цитирования, а значит, и возможности для оценки важности научных работ.

С докладом «Кодирование метаданных и стандарты передачи данных» (METS: Metadata Encoding and Transmission Standard) выступил Ричард Гартнер (Richard Gartner), сотрудник библиотеки Университета Оксфорд.

В стандартах, разработанных Службой стандартов Библиотеки Конгресса США (Library of Congress Standards Office) и Федерацией цифровых библиотек (Digital Library Federation), указаны три типа метаданных – описательные, административные, структурные, – которые кодируются в разных разделах единого документа.

Этот стандарт (он написан на языке XML) достаточен для описания всех видов метаданных цифровых объектов, он не предписывает содержания метаданных, а рекомендует основную схему, создает определенные рамки. Сами метаданные, а также внешние данные (например, текст, изображения, видео и т.п.) могут либо содержаться внутри METS-файла, либо указываться отсылками от него.

Сообщение «Открытые архивы в Европе и в Германии» (Open Archives Initiative in Europe and Germany) представил Уве Мюллер (Uwe Mueller), представитель Университета им. А. Гумбольдта (Humboldt University Berlin; u.mueller@cms.hu-berlin.de).

Он рассмотрел различные типы архивов: серверы научных организаций, содержащие препринты, э-принты; библиотеки, на серверах которых находятся базы данных электронного каталога, электронные журналы, и др.; музейные базы данных (метаданные объектов); архивы (исторические документы, материалы культурного наследия); образовательные учреждения со своими материалами.

Происхождение этих материалов может быть самым различным: собственные наработки, заимствованные  или вновь создаваемые базы данных и т.п. Нужно сказать, что концепция Открытого архива сейчас пользуется признанием, поскольку такие архивы допускают поиск по всем учреждениям, обеспечивают недорогое распространение ранее невидимых ресурсов, закладывают основу улучшения обслуживания.

На чем базируется идеология Открытого архива?

  1. Консолидация в мировом масштабе архивов научных материалов.

  2. Свободный доступ к архивам ( или по крайней мере к метаданным).

  3. Согласованные интерфейсы для архивов и поставщиков информации.

  4. Простота пользования.

  5. Базирование на уже существующих стандартах (например: HTTP, XML, DC).

Что предполагается (General Assumptions):

  1. Обмениваться метаданными, а не самими цифровыми объектами.

  2. Использовать асинхронную технологию сбора данных.

  3. Сформировать две группы участников системы Открытого архива:

  • первая – владельцы (держатели, хранители) данных (открытых архивов, репозитарев), которым обеспечен свободный доступ к метаданным и, быть может, бесплатный доступ и пользование ресурсами, а также простота в работе, не требующая создания каких-либо специальных коллективов и поэтому открывающая двери для участия малых организаций;

  • вторая – поставщики услуг (посредники), которые используют интерфейсы Открытых архивов поставщиков данных, собирают и хранят метаданные, быть может, выбирают, некоторые специализированные коллекции от поставщиков данных, пополняют состав метаданных и обогащают метазаписи, обеспечивают обслуживание на основе метаданных.

Техническая модель Открытых архивов – Протокол сбора метаданных (Protocol for Metadata Harvesting), который базируется на протоколе HTTP, при этом используются шесть типов запросов; ответы кодируются в синтаксисе языка XML; протокол поддерживает любой формат метаданных, по крайней мере, Даблин Кор.

Из других деталей отметим наличие иерархического ряда, даты последних изменений метаданных, возможность выявления ошибок и контроль за прохождением запроса.

Протокол предусматривает три типа классификации: по предметным рубрикам Немецкой библиографии (dnb); по формальному типу публикации (например диссертация); по формальному типу документа (например текст или аудио и т.п.).

Для сведения и практической ориентации приводим из доклада У. Мюллера предметную классификацию (Classification according to subjects) и классификацию типов документов (Classification according to formal document types), принятую Центром информации Немецкого института стандартизации (DINI)

 

Предметная классификация
(Classification according to subjects)

Спецификация 
(SetSpec)
Наименование элемента
(SetName)
dnb:01 Knowledge and Culture in General
(общие вопросы знания и культуры)
dnb:02 Books and Libraries, Information and Documentation
(книги, литература, информация и документация)
dnb:03 Reference Books, Bibliographies
(справочные книги, библиографии)
dnb:04 Directories and Phone Books
(директории, списки и телефонные книги)
dnb:05 Calendars (календари)
dnb:06 Journalism (журналистика)
dnb:07 Children's and Youth Literature
(литература для детей и юношества)
dnb:08 Comics, Cartoons, Caricatures Miscellanea
(комиксы, шаржи, карикатуры)
dnb:09 Esoterica Manuscripts, Book Art
(эзотерические рукописи, книги по искусству)
dnb:10 Philosophy (философия)
dnb:11 Psychology (психология)
dnb:12 Christianity (христианство)
dnb:13 General and Comparative Theology, Non-Christian Religion
(общая и сравнительная теология, нехристианские религии)
dnb:14 Sociology, Sociography (социология, социография)
...        ...
dnb:65 Economic History (история экономики)

 

Классификация по типу документов
(Classification according to formal document types)

Спецификация
(SetSpec)
Наименование (SetName)
doc-type:text Text (текст)
doc-type:notes Notes (ноты)
doc-type:image Image (изображения)
doc-type:audio Audio (аудио)
doc-type:video Video (видео)
doc-type:multimedia    Multimedia (мультимедиа)
doc-type:data Data (данные)
doc-type-binary Binary data, (executable) program (двоичные данные, исполняемые программы)

Сотрудница библиотеки Геттингенского университета Хайке Нойрат (Heike Neuroth) выступила с докладом «Система метаданных Даблин Кор и проблема обеспечения долговременной сохранности» (Dublin Core and long-term Preservation). В настоящий момент в библиотеке более 1,5 млн. цифровых журналов и монографий, в том числе оцифрованные самой библиотекой; изначально электронные ресурсы; сетевые документы: препринты; авторефераты; труды конференций; оптические диски и т.д. Метаданные о сохранности описывают весь жизненный цикл цифрового документа, в том числе исходный формат объекта, архивный и служебные форматы,  дату проведения оцифровки, технические данные, правовые сведения (копирайт, права доступа, условия пользования и т.п.).

Информацию о работах по обеспечению долговременной сохранности цифровых документов (Cooperative Initiative Long-Term Preservation of Digital Resources in Germany) представила Юте Швенс (Ute Schwens), сотрудница Немецкой библиотеки.

С учетом масштабов задачи и национальных особенностей кооперативный подход оказывается единственно возможным. В 2002 г. Министерство науки и образования Германии профинансировало полугодичный проект по изучению подходов к данной проблеме, затем был утвержден проект по аккумулированию опыта долговременной сохранности цифровых ресурсов на 2003 – 2006 гг. Проект возглавила Немецкая библиотека; партнеры – Баварская библиотека в Мюнхене, библиотека Геттингенского университета и др. Музеи представлены Институтом музееведения прусского культурного наследия; архивы – Баварским архивом публичных записей. Акцент делается на обеспечение доступности архивных материалов; предполагается организовать сетевой форум обсуждения различных аспектов этой проблемы и сгенерировать в Геттингене базу данных мирового опыта по обеспечению сохранности.

Представитель Геттингенского университета Томас Фишер (Thomas Fischer) рассказал о создании регистрирующей организации по метаданным (The DC Metadata Registry at Goettingen).

Профессор Технического университета (г. Берлин) Бернд Вегнер (Bernd Wegner), достаточно известный нашим читателям по публикациям в сборнике его статей и докладов, представленных на конференциях «Крым» и «ЛИБКОМ», рассказал о совместном проекте Немецкого исследовательского общества (DFG) и Российского фонда фундаментальных исследований ЭМАНИ – Электронный архив публикаций по математике (EMANI – Electronic mathematical Archiving Initiative).

Доклад Г.А. Евстигнеевой «Оцифровка и обеспечение сохранности российских журналов по математике» заинтересовал участников семинара, вызвал много вопросов по системе отбора публикаций, протоколам оцифровки и кодировки, на которые даны обстоятельные ответы.

В ходе семинара я вел себя как активный слушатель и выступил с комментариями такого рода:

  • стремиться хранить все подряд – неразумно, поскольку людям необходимо думать и, быть может, заново что-то изобретать, в этом ничего страшного нет. Сверхдолгое хранение цифровых материалов в сочетании с электронным поиском сделает нас заложниками старья, сделает нас трусливыми в науке, вечными детьми;

  • создав сверхбольшие запасы информации, мы безмерно усложним поиск нужных нам сведений; окажется, что проще сделать заново, чем найти. Кроме того, постоянное отыскивание вызовет комплекс вторичности, мы все время будем повторять уже пройденное, а нужно (в науке и технике по крайней мере) идти вперед, искать и делать незнаемое – для этого совсем не нужно оглядываться назад;

  • следует согласиться на какое-то динамическое равновесие, хранить только основы и классику, и помнить, что будоражить ум, тренировать его постоянной работой – это полезно для человечества в целом. Неслучайно сверхцивилизованные американцы сейчас включают в свой рацион, например на завтрак, волокнистую пищу (дыню или капусту) – иначе из-за слишком подготовленной и полупережеванной пищи пищеварительная система отвыкает работать нормально.

Мои речи вызвали интерес американцев и недовольное брюзжание отдельных коллег (арт-библиотекаря из Португалии), хотя я тысячу раз повторил, что говорю только о научно-технической информации.

В общем, вся поездка в знаменитый Геттинген – и экскурсия по древнему городу, и посещение его славного университета, и, конечно же, семинар – оказалась очень интересной и оставила самое приятное впечатление.

Земсков А.И.
ГПНТБ России

  
На главную