Научные и технические библиотеки №5 2008 год
Содержание:

БИБЛИОТЕЧНО-ИНФОРМАЦИОННАЯ ДЕЯТЕЛЬНОСТЬ: ТЕОРИЯ И ПРАКТИКА

Дворкина М. Я. Сущность и структура библиотечно-информационной деятельности

Сукиасян Э. Р. Централизованная систематизация в России. Четыре десятилетия побед и поражений

Шилов В. В. Об учете библиотечных фондов

Ткачева Н. И., Русакова Е. В., Морозов С. В. Интеграция библиотечных ресурсов для информационного обеспечения фундаментальных и прикладных исследований

Мохначева Ю. В., Харыбина Т. Н. Избирательное распространение информации как библиотечный сервис: основные цели, задачи и методы

ОТКРЫТЫЙ ДОСТУП И ОТКРЫТЫЕ АРХИВЫ ИНФОРМАЦИИ

Шрайберг Я. Л., Земсков А. И. Модели открытого доступа: история, виды, особенности, терминология

НАША ПРОФЕССИЯ

Матвеев М. Ю. Проблемы имиджа библиотечной науки, образования и профессии

К 50-ЛЕТИЮ ГПНТБ РОССИИ

Коготков Д. Я. Становление ГПНТБ как научно-исследовательского учреждения. (Воспоминания ветерана)

ОБЗОРЫ. РЕЦЕНЗИИ

Столяров Ю. Н. Как создавалась «Библиотечная энциклопедия»

Милясевич И. В., Швецова-Водка Г. Н. Фундаментальный учебник по библиотечному краеведению

Бойченко Е. Н. Познание истории техники: от школьной скамьи – до университетской кафедры

ОТКЛИК НА ПУБЛИКАЦИЮ

Петровский В. Б. Дополнение к прочитанному

ПИСЬМО В РЕДАКЦИЮ

Булушева Г. В. Предложение для совместной работы

Сукиасян Э. Р. Ответ Г. В. Булушевой

Памяти Ольги Марковны Серегиной


ОТКРЫТЫЙ ДОСТУП
И ОТКРЫТЫЕ АРХИВЫ ИНФОРМАЦИИ

УДК 025.5/6:024.5

Я. Л. Шрайберг, А. И. Земсков

Модели открытого доступа:
история, виды, особенности, терминология*

Открытый доступ (Оpenaccess) относится к условиям использования опубликованных изданий и является сегодня одной из мощно развиваемых технологий предоставления полных текстов изданий в доступ через Интернет. Согласно Берлинской декларации такое издание должно отвечать двум условиям:

1. Автор (авторы) и правообладатели должны предоставлять всем пользователям бесплатный, неотъемлемый, всемерный доступ к тексту и лицензировать право его копирования, использования, распространения передачи или показа публично, а также делать и распространять производные работы в любом цифровом формате для любых законных целей с соответствующей атрибуцией авторства и изготавливать небольшое количество печатных копий для личного пользования.

2. Полная версия данного издания и все вспомогательные материалы к ней, в том числе и копия авторского разрешения, депонируются в соответствующей электронной версии (и тем самым публикуются) по крайней мере в одном сетевом репозитарии с использованием необходимых технических стандартов, которые поддерживаются и обеспечиваются учреждением высшей школы (университетом), научным обществом, правительственным агентством или другой четко определенной организацией, которая придерживается принципов открытого доступа, неограниченного распространения, совместимости и долговременной сохранности документов.

В ходе последующих Берлинских конференций были уточнены конкретные требования (рекомендации) вузовским учреждениям по выполнению принципов Берлинской декларации:

1. Требовать от ученых депонирования всех их опубликованных работ в репозитарии открытого доступа;

2. Поддерживать своих ученых при опубликовании результатов их научных исследований в журналах открытого доступа, если подобные журналы по данной тематике существуют;

3. Обеспечивать поддержку создания таких журналов.

Выделим два основных технологических направления: журналы открытого доступа и архивы (репозитарии) открытого доступа. Оба направления – способы научного общения. Журналы открытого доступа публикуют прореферированные статьи, а репозитарии собирают документы – не обязательно прошедшие реферирование и не обязательно статьи. Институциональный репозитарий собирает «свои» работы, т. е. труды сотрудников данного учреждения и этим принципиально отличается от библиотеки. Журналы открытого доступа и репозитарии не являются взаимоисключающими - они дополняют друг друга.

Как считает Поль Петерс (PaulPeters), сотрудник издательства «Hindawi», определение открытый доступ можно считать «зонтичным» (umbrellaterm) термином, поскольку речь идет о целом семействе различных бизнес-моделей публикаций. Если же говорить о моделях оплаты, то имеются, по крайней мере, четыре варианта:

·      «зеленый» доступ;

·      финансирование публикаций благотворительным фондом WellcomeTrust;

·      оплата публикаций за счет автора или организации, его представляющей;

·      корпоративная модель, например SCOAP3

В течение ряда лет развиваются два основных направления открытого доступа к реферируемым научным документам – «золотое» (gold) и «зеленое» (green). Долгое время оба варианта считались равноправными, но в последние годы различия в этих бизнес-моделях стали очень заметными.

Известный английский (и одновременно канадский) ученый Стивен Харнад (StevenHarnad) так определяет эти направления, или варианты: «”Золотой” открытый доступ означает, что журнал не требует денег за доступ читателя к опубликованной в нем электронной статье. ”Зеленый” вариант означает разрешение размещать прореферированные материалы в общедоступных сетевых институциональных репозитариях или в центральных репозитариях <...>. Жаль, что один и тот же термин – открытый доступ – применяется к обоим вариантам, поскольку их значение совершенно различно».

Проблемой «золотого» доступа является то, что он требует значительной оплаты от автора публикации. По сути – это чисто коммерческая модель, еще более выгодная для издателей, чем модель подписки.

Журналы открытого доступа

Вначале приведем определение открытого доступа, предложенное Ларсом Бьорнсхаугом, директором библиотеки Университета г. Лунд (Швеция): «Журналы открытого доступа – это такие журналы, финансовая модель которых не предполагает взимания платы за доступ с читателей или с представляющих их интересы учреждений».

Определение открытого доступа, данное в ходе Будапештской инициативы (TheBOAI), сформулировано более широко: «Это право пользователя читать, выгружать, копировать, распространять, печатать, осуществлять поиск или проставлять гиперсвязи к полному тексту статей».

Идеология журналов открытого доступа разработана и поддержана в рамках проекта коалиции СПАРК. Суть технологии: материал проходит научное реферирование, оплачивается автором и затем предоставляется пользователям бесплатно.

Ведущий журнал открытого доступа по физике «NewJournalofPhysics» публикует статьи в среднем в течение 40 дней с момента их подачи на рассмотрение (хотя отклоняются до 70% рукописей) и за четыре года существования вышел на высокий уровень импакт-фактора – 3,585; общее количество выгрузок полных текстов – более 1 млн.

Издательский отдел Американского химического общества (ACS) предлагает опцию «авторский выбор» (ACSAuthorChoice). ACS на своем веб-сайте предоставляет неограниченный сетевой доступ к поступившим и опубликованным работам при условии предварительного внесения автором фиксированной платы за публикацию. Этим авторам также предоставляется право размещать данные статьи на собственном веб-сайте, а также на сайте институционального репозитария для некоммерческих научных целей. Такой механизм используется только для прореферированных и принятых к публикации работ, что обеспечивает разграничение коммерческих и научных интересов. Статья становится доступной в Сети после внесения автором оплаты: от 1 тыс. до 3 тыс. долларов, в зависимости от того, является ли он членом ACS или подписчиком на его издания.

На 28-й Конференции ИАТУЛ Марианна Хоссеранд Хаска (MarianneJosserandHasks), представитель BioMedCentral (Лондон), в своем докладе «Каким образом журналы открытого доступа облегчают публичный доступ к результатам работ, выполненных за счет общественных средств» (Howopenaccessjournalsfacilitatepublicaccesstopubliclyfundedresearch) отмечает: «Открытый доступ является сейчас одной из наиболее горячих тем для обсуждения среди специалистов по информации и научного сообщества. Финансирующие агентства и правительственные органы значительно продвинулись к тому, чтобы сделать доступ к результатам работ, выполненных за счет общественных средств, свободным, и каждый издатель научной или медицинской литературы предлагает сегодня либо опцию открытого доступа, либо журналы открытого доступа».

В мире 31 финансирующая организация подтвердила свою готовность оплачивать стоимость обработки научных статей в журналах открытого доступа; 14 финансовых фондов имеют разработанную политику для поддержки соответствующих публикаций. В некоторых случаях от получателей финансовой помощи требуется депонировать научные статьи в репозитариях открытого доступа.

Среди заметных примеров можно назвать американский Национальный институт здоровья (USNationalInstituteofHealth), Научный совет Великобритании (ResearchCouncilUK), Объединенный комитет по информационным системам (JISC). В Великобритании Национальный институт здоровья (UKNHSEngland) компенсирует стоимость публикаций открытого доступа для всех своих членов через участие в системе BioMedCentral. 2007 г. стал годом запуска британской системы UKPubMedCentral, которая предоставляет свободный доступ к постоянным сетевым архивам прореферированных научных работ.

Архивы открытого доступа

Репозитарии открытого доступа также становятся обязательным элементом для институтов, частично вследствие политики финансирующих органов, но прежде всего потому, что институты видят преимущества формирования электронных архивов как площадки, на которой демонстрируется их научная продукция.

Модель Открытого доступа разработана в рамках Берлинской декларации (2003 г.) и включает в себя идеи самоархивации и формирования институциональных репозитариев (ИР). ИР – это просто одна из возможных реализаций открытого доступа. Кроме ИР, можно назвать также предметные (тематические) репозитарии в качестве примеров других систем Открытого доступа. ИР могут существовать и без вовлечения в систему Открытого доступа.

ИР – это набор сервисов, которые университет предлагает членам своего сообщества, по управлению и распространению цифровых материалов, созданных в данной организации.

Как утверждает сетевая энциклопедия Википедия (Wikipedia), «Институциональный репозитарий – это место в сети для сбора, обеспечения сохранности и распространения в электронном формате интеллектуальной продукции учреждения, в частности научного учреждения».

Когда родилась идея депонирования научных публикаций, предполагающая обеспечение свободного доступа к ним, казалось, что это начинание имеет перспективу для определенной тематики, например атомной физики. Это соображение усиливалось определяющей ролью научного реферирования для поддержания качества работ, что легче обеспечить в узкой научной области. Но с 2001 г. и научные учреждения стали проявлять интерес к формированию институциональных (учрежденческих) репозитариев. Предполагалось на базе статистических данных ИР организовать контроль за активностью данного учреждения, его научной производительностью и качеством выполненных работ.

Создание системы из различных репозитариев обеспечивается проектом «Открытые архивы» (OpenArchivesInitiative). В нем предусмотрена разработка и продвижение стандартов совместимости (interoperability), что обеспечит эффективное распространение электронного сетевого контента. Истоки проекта лежат в стремлении улучшить доступ к архивам электронных препринтов (предполагаемых к публикации научных статей, не прошедших на данный момент стадии научного реферирования), которые легли в основу политики расширения научного общения. В настоящее время, помимо препринтов, работа ведется и с другими электронными документами, в первую очередь с научными и образовательными ресурсами. Базовые технологические решения и стандарты независимы от типа контента и экономических условий его поставки.

В ходе 69-й Генеральной конференции ИФЛА (27 июля – 9 авг. 2003 г., Берлин) в Геттингене прошел пост-конференционный семинар «Информационные технологии и работа группы метаданных Даблин Кор» (satellite meeting “Information Technology and DCMI”), где член Постоянного комитета Секции информационных технологий ИФЛА Дианн Руш-Фейха (Diann Rusch-Feja; mailto:d.ruschfeja@iu-bremen.de), директор Информационного центра Международного университета в Бремене, выступила с сообщением о формировании системы репозитариев с технологией открытых архивов (Dublin Core and Institutional Repositories Open Archive Initiative, OAI).

На этом же семинаре сообщение «Открытые архивы в Европе и Германии» (Open Archives InitiativeinEuropeandGermany) представил Уве Мюллер (UweMueller), сотрудник Университета им. А. Гумбольдта
(mailto:u.mueller@cms.hu-berlin.de). Он перечислил принципы, на которых базируется идеология «Открытого архива»:

·      консолидация в мировом масштабе архивов научных материалов;

·      свободный доступ к архивам (или, по крайней мере, к метаданным);

·      согласованные интерфейсы для архивов и поставщиков информации;

·      простота пользования;

·      опора на уже существующие стандарты (например HTTP, XML, DC).

Что предполагается для практической реализации моделей открытых архивов?

1. Обмениваться метаданными, а не самими цифровыми объектами;

2. Использовать асинхронную технологию сбора данных;

3. Сформировать две группы участников системы «Открытого архива»:

·      поставщики данных (открытые архивы, репозитарии), которым обеспечен свободный доступ к метаданным и, быть может, бесплатный доступ и пользование ресурсами, а также простота в работе, не требующая создания каких-либо специальных коллективов и поэтому открывающая двери для участия малых организаций,

·      поставщики услуг, которые используют интерфейсы открытых архивов поставщиков данных, собирают и хранят метаданные, быть может, выбирают некоторые специализированные коллекции от поставщиков данных, пополняют состав метаданных и обогащают метазаписи, обеспечивают обслуживание на основе метаданных.

Схема различных реализаций модели Открытого доступа приведена на рис. 1.

Рис. 1. Схема различных реализаций Открытого доступа.

Техническая модель Открытых архивов – Протокол сбора метаданных (ProtocolforMetadataHarvesting), который базируется на протоколе HTTP, при этом используются шесть типов запросов, ответы кодируются в синтаксисе языка XML; протокол поддерживает любой формат метаданных, по крайней мере, Даблин Кор. Из других деталей отметим наличие иерархического ряда, даты последних изменений метаданных, возможность выявления ошибок и контроль за прохождением запроса. Протокол предусматривает три типа классификации: по предметным рубрикам Немецкой библиографии (dnb), по формальному типу публикации (например диссертация), по формальному типу документа (например текст, аудиодокументы и т.п.).

В настоящее время «Открытые архивы» – это работа над проектом и одновременно название некоммерческой организации, во главе которой стоят Карл Лагоз из Университета Корнелл (CarlLagoze, ComputingandInformationScience, CornellUniversity) и Герберт Сомпель из Национальной лаборатории Лос-Аламоса (HerbertVandeSompel, DigitalLibraryResearchandPrototyping, LosAlamosNationalLaboratoryResearchLibrary). ПоддержкупроектуоказываютФондМеллона (AndrewW. MellonFoundation) идругиеизвестныеорганизации: CoalitionforNetworkedInformation, theDigitalLibraryFederation, NationalScienceFoundation.

Суть идеи – создание совместимых (с низким барьером несовместимости) репозитариев для обмена метаданными, публикации и архивирования. Протокол сбора метаданных (TheOAI-ProtocolforMetadataHarvesting, OAI-PMH) определяет механизм сбора записей с метаданными из репозитариев. Поставщики метаданных используют открытые стандарты HTTP (HypertextTransportProtocol) и XML (ExtensibleMarkupLanguage). Сами метаданные могут быть в любом формате, согласованном сообществом, хотя базовый уровень совместимости обеспечивается уже первым уровнем протокола Даблин Кор. Таким образом, метаданные из многих источников собираются в одной базе данных, и обслуживание ведется на основе этих агрегированных, или собранных (centrallyharvested, or "aggregated") данных. Связь между метаданными и соответствующим контентом не определяется протоколом OAI. Важно понимать, что OAI-PMH не предоставляет поисковых возможностей – это просто механизм сбора данных в одном месте.

В целом проект Открытого доступа позволил сделать из отдельных ИР цельную систему с возможностями эффективного поиска.

Если вспомнить историю, то необходимо отметить, что первый архив (arXiv) стартовал в 1991 г., затем последовал CogPrints – архив по психологии, лингвистике и нейронаукам; в дальнейшем сформировалась Сетевая справочная библиотека по компьютерным наукам (NetworkedComputerScienceTechnicalReferenceLibrary, NCSTRL) и библиотека по экономике – RePEc. Кроме того, на основе студенческих и аспирантских работ была сформирована Сетевая библиотека авторефератов и диссертаций (NetworkedDigitalLibraryofThesesandDissertations, NDLTD). Механизм заполнения репозитариев – самоархивация силами авторов.

К основным признакам репозитария отнесем следующие:

·      электронное содержание,

·      работа в интересах сообщества и управление им же,

·      институциональная поддержка (т.е. вышестоящей организацией),

·      надежное и постоянное хранение,

·      доступность содержания.

Основные функциональные задачи:

·      прием научных материалов,

·      использование метаданных,

·      контроль доступа,

·      поддержка открытий,

·      обслуживание,

·      сохранность.

В октябре 1999 г. Поль Гинспарг, Рик Люс и Герберт Сомпель (в то время они работали в Университете г. Гент) собрали группу технических специалистов на конференцию в Санта-Фе (штат Нью-Мексико, США). Цель проведения конференции – оптимизация процесса обнаружения электронных препринтов. Участники предложили разработать универсальный инструмент для самоархивации (theUniversalPreprintService, UPS). Выбор нужно было сделать между методикой перекрестного поиска во многих архивах, например с помощью протокола Z39.50 (Cross search), либо методикой сбора (harvest) метаданных в один или несколько «центральных» архивов. Имевшийся на тот момент опыт использования распределенных ресурсов, в частности британской системы ResourceDiscoveryNetwork (RDN), показал, что даже для пяти тематических шлюзов возникают проблемы эффективности поиска; к таким же выводам пришли в США.

Два момента, определяющие совместимость архивов электронных препринтов: первый – конечный пользователь имеет дело с многочисленными поисковыми интерфейсами (что усложняет обнаружение ресурсов); второй – отсутствие машинного метода обмена метаданными. Решения состояли в использовании перекрестного поиска в архивах и сбора метаданных в архивах с последующей передачей их в централизованный банк данных. Было предложено создание универсального сервиса для авторской самоархивации научной литературы (theUniversalPreprintService, UPS). UPS должен стать «фундаментальным и свободным слоем информации – основы для выстраивания как бесплатных, так и коммерческих сервисов».

На встрече в Санта-Фе прототипом UPS стала система с одной централизованной базой данных метаописаний, собранных из многих архивов. Таким образом, поиск нужно было проводить только в одной-единственной базе данных. Само название UPS пришлось сменить на OAI-PMH, чтобы не вступать в конфликт с известной фирмой по почтовой доставке.

Для дальнейшего изложения нужно привести определения, которые используются в материалах по открытым архивам.

Электронный препринт (E-print) – это архивированный автором документ. В обычном применении термина предполагается, что электронный препринт – это результат научных или иных исследований.

Документоподобный объект (Document-likeobject) – это единица набора цифровых данных, сравнимая с печатным документом. Термин обозначает относительно простой стабильный ресурс и не включает в себя, например, мультимедийные продукты или интерактивные сервисы.

Ресурс (Resource) – это то, что можно идентифицировать. Знакомые нам примеры включают электронные документы, изображения, сервис (например, сегодняшняя сводка «погода в Минске»), а также коллекцию других ресурсов. Не все ресурсы можно найти в Сети (например, людей, корпорации или переплетенные книги в библиотеке также можно считать ресурсами). Определение взято из «Руководства по ведению Даблин Кор в XML» Энди Пауэлла и Пита Джонстона (AndyPowellandPeteJohnston. GuidelinesforimplementingDublinCoreinXML).

XML– акроним для ExtensibleMarkupLanguage, расширяемого языка разметки. XML – это язык для создания других языков. Он определяет способы описания данных. На его основе можно создать язык для описания DTD или схемных наборов. XML-отображения (таблицы соответствия) существуют для многих форматов записи метаданных.

DTD– акроним для DocumentTypeDefinition, определения типа документа. DTD является формальной спецификацией структуры документа.

Даблин Кор (DublinCore, DC) – это формат метаданных, установленный путем международного консенсуса. Набор метаданных определяет 15 элементов для простого описания и поиска ресурсов. Все элементы рекомендованы, но ни один из них не является обязательным. При помощи дополнительных элементов, дополнительного описания элементов и словарных терминов Даблин Кор может быть расширен. Определение взято из «Словаря метаданных» (UKOLN'smetadataglossary) и «Метаданные в оболочке» (Metadatainanutshell) Майкла Дэя (MichaelDay).

Совместимость, интероперабельность (Interoperability)– это способность систем, служб и организаций работать совместно и беспрепятственно для достижения одной общей и отдельных целей. В технической сфере совместимость поддерживается открытыми стандартами для связи между системами и описания ресурсов и коллекций. Здесь совместимость рассматривается в первую очередь в контексте обнаружения ресурсов и обеспечения доступа к ним.

Предложенная «Конвенцией Санта-Фе» архитектура идентифицирует две роли (две функции): «Поставщики данных» (DataProviders) и «Поставщики услуг» (ServiceProviders).

Поставщики данных работают с публикациями, депонируют ресурсы в репозитарии и «выставляют» для сбора метаданные своих ресурсов. Они создатели и держатели метаданных и репозитария ресурсов.

Поставщики услуг собирают метаданные и организуют обслуживание по всем документам. Это может быть поисковый интерфейс, научное реферирование и т.п. Конечно, возможно совмещение функций поставщика данных и поставщика услуг. Принято принципиальное решение: отказ от поддержки только одного интерфейса для конечного пользователя в пользу поддержки интерфейса пользователя и машинного интерфейса для сбора метаданных.

Для облегчения сбора метаданных должно быть достигнуто согласие по следующим моментам:

·      транспортный протокол, например HTTP или FTP.

·      формат метаданных – Даблин Кор или MARC.

Основа для поддержки качества метаданных – обязательный набор элементов, наименований документов,  предметных заголовков и т.д.

За 2–3 года разработки идеологии и технологии сообщество продвинулось от электронных препринтов к любым видам электронных ресурсов. OAI-PMH может быть расширен до применения любых форматов метаданных, которые могут быть записаны в XML. Протокол базируется на HTTP при запросе и на XML – для ответов; он отлично работает в Сети и может защищаться от сетевых помех и вирусов экранами; дает возможность поставщикам услуг сообщить «дайте мне некоторые из ваших записей или все», и запрос «некоторые» может относиться к датам, наборам данных формату метаданных и т.п.

Простой, базирующийся на уже существующих технологиях, легкий в установке протокол OAI-PMH имеет множество инструментов. (Общая схема сбора метаданных приведена на рис. 2.)

Рис. 2. Сбор метаданных, описывающих разнородные документы (пре­принты, рабочие отчеты, наборы данных и др.), от нескольких разнотипных источников (поставщиков) – тематических архивов, институциональных репозитариев и т.п.

(Продолжение в следующем номере.)

  
На главную