ОТКРЫТЫЙ ДОСТУП
И ОТКРЫТЫЕ АРХИВЫ ИНФОРМАЦИИ

УДК 025.5/6:024.5

А. И. Земсков, Я. Л. Шрайберг

Конкретные модели и проекты открытого доступа

Движение за Открытый доступ (ОД) по сути своей, конечно, интернациональное. Для того чтобы проиллюстрировать размах этого движения, вовлеченность в него фактически всего мирового сообщества мы расскажем в этой статье о проектах и программах, инициированных многими зарубежными организациями и отдельными учеными, о широко известных системах ArXiv и Dspace, приведем примеры шведского опыта и работ, выполняемых в ряде других стан.

Мировая директория научных архивов ОД (DirectoryofAcademicOpenAccessrepositories, OpenDOAR), составленная в 2006 г., насчитывает более 800 записей (архивов).

Таблица 1

Количество университетов (в процентах) в различных странах,
имеющих институциональные репозитарии
(данные журнала «D-LibMagazine», сентябрь 2005 г.)

Австралия – 95%

Бельгия – 53%

Дания – 50%

Финляндия – 5%

Франция – 27%

Германия – 100%

Италия – 22%

Норвегия – 100%

Швеция – 64%

Нидерланды – 100%

Великобритания – 22%

США – 50% (докторские диссертации)

В докладе Кэтлин Оливер (Kathleen B. Oliver) и Роберта Свэйна (Robert Swain), сотрудников Университета Джонса Хопкинса, «Директории институциональных репозитариев: результаты исследования и рекомендации», представленном на 72-й Генеральной конференции ИФЛА (20–24 авг. 2006 г., Сеул, Корея), названы 23 общедоступных директории институциональных репозитариев, из них специально отмечены следующие:

·      ROAR (RegistryofOpenAccessrepositories, Southamptonuniversity) – описание 610 репозитариев с указанием страны, программного обеспечения; имеет возможности поиска;

·      OAIster (Мичиганский университет, США) – насчитывает 611 репозитариев, имеет возможности поиска;

·      Экспериментальный регистр репозитариев по машиностроению (Университет Иллинойса в Урбана Шампейн, США);

·      Directory of Mathematical Preprint and e-Print servers – специализированныерепозитарии;

·      OpenDOAR(Университет Ноттингама, Великобритания, и Университет Лунда, Швеция) – этот международный каталог занимает ведущее место, его основная тематика – биомедицина.

В докладах на той же конференции отмечены интересные факты, заслуживающие внимания. Так, инициированные ВОЗ (Всемирная организация здравоохранения) и ФАО (Продовольственная и сельскохозяйственная организация ООН – FoodandAgricultureOrganization, FAO) и поддержанные специалистами Корнельского и Йельского университетов базы данных HINARI (HealthInternetworkAccestoresearchInitiative), AGORA (AccesstoGlobalOnlineResearchinAgriculture) представляли бесплатный доступ для сотрудников 2 тыс. учреждений в 68 беднейших странах мира (ВНП на душу населения – менее 1 тыс. долларов США) и условно платный – для стран с ВНП на душу населения от 1 тыс. до 3 тыс. долларов.

Сейчас существует много бесплатных программ, помогающих созданию текстовых и мультимедийных электронных библиотек, в том числе программа Eprint, созданная в Университете Саутгэмптона (Великобритания), и программа GreenstoneDigitalLibrary Университета Вайкато (Новая Зеландия), уже хорошо известная в нашей стране.

Европейская комиссия не планирует сделать публикации ОД и обеспечение сохранности цифровых материалов обязательной процедурой, но будет поддерживать передовой опыт и инициировать обсуждение политики в этой области… Это заявление Еврокомиссии содержит обещание поддержки обеспечения доступа к публикациям, в которых отражены научные работы, финансируемые Седьмой рамочной программой (FP7). Например, предполагается включать стоимость публикации в смету проекта и подготовить рекомендации, относящиеся к публикации статей в открытых репозитариях по истечении периода эмбарго. Еврокомиссия выделяет 50 млн евро на следующие два года для формирования инфраструктуры, в том числе электронных репозитариев. Примерно половина из этой суммы будет направлена на работы по обеспечению сохранности электронных документов и создание инструментов сотрудничества; 10 млн евро предназначены для обеспечения доступа и использования научной информации в рамках программы eContentPlus.

На 8-й Международной конференции «Вузовские библиотеки и информационное обслуживание: новые парадигмы в цифровую эпоху» (AcademicLibrariesandInformationServices: NewParadigmsfortheDigitalAge; 7-9 февр. 2006 г., Билефельд, ФРГ) одной из главных обсуждаемых проблем были институциональные репозитарии, т. е. учреждения, согласившиеся взять на себя бремя собирать, хранить и выдавать в обслуживание электронные версии документов, созданных в данном учреждении или даже в нескольких учреждениях (чаще всего – университетах).

Речь идет о новой модели публикаций результатов научных исследований – OpenArchiveInitiative. На конференции освещен опыт совместной работы Немецкой национальной библиотеки, библиотеки Геттингенского университета и компании IBM по созданию системы долговременного хранения и обслуживания цифровыми материалами на базе технологии открытых систем (OpenArchivalInformationSystem, OAIS). О состоянии дел по выполнению этого проекта рассказал руководитель службы информационных технологий Немецкой национальной библиотеки Рейнхард Атенхонер (ReinhardAtenhoner). Проект, финансируемый Федеральным министерством по науке и образованию, базируется на практическом опыте, накопленном в ходе реализации аналогичного проекта компании IBM с Национальной (Королевской) библиотекой Нидерландов (в частности, создание системы архивации цифровых документов – DigitalInformationandArchivingSystem).

Лео Вайерс, бывший директор библиотеки Технического университета г. Делфт, а в настоящее время сотрудник некоммерческой компании SURF, рассказал о разработке в 2004 г. в Нидерландах программы DARE (акроним от DigitalAcademicRepositories – Цифровые вузовские репозитарии). К участию в DARE подключены все университеты, Национальный научный фонд и Академия наук. В результате предполагается получить систему ОД ко всем репозитариям и обеспечить поиск по названию учреждения, научной отрасли и типу документа. Создана система получения стандартизованных отчетов о всех научно-исследовательских работах Нидерландов в едином программном оформлении; проводится оцифровка диссертаций (ежегодно защищаются около 10 тыс. диссертаций).

Определенным свидетельством высокого развития системы институциональных репозитариев (по данным на 1.01.06 в мире насчитывалось более 600 таких репозитариев, в том числе: 104 – в Германии, 31 – в Великобритании, 25 – в Швеции) является создание в Германии специализированной организации по выработке стандартов и рекомендаций в этой области, в том числе по работе с авторами, урегулированию вопросов авторского права, согласованию требований к документации (в том числе с использованием протоколов извлечения метаданных – ProtocolofMetadataHarvesting, PMH) и т.д. Название организации – «Немецкий проект по сетевой информации» (DeutscheInitiativeforNetworkedInformation, DINI); создана в 2000 г., сетевой адрес www.dini.de. Всем организациям, приступающим к созданию репозитария, можно смело рекомендовать обратиться к DINI за методической помощью.

На другом важном международном семинаре – «Институциональные архивы для науки: опыт и проекты по открытому доступу», который прошел в Италии в конце 2006 г. на базе Итальянского института здоровья (IstituitoSuperiorediSanita), состоялся обмен мнениями между учеными и специалистами по информации. В центре внимания были перспективы развития информационных технологий для поддержки инновационного процесса научного общения.

На конференции рассматривалась также деятельность итальянской Группы Открытого доступа, сформированной в 2006 г. в составе библиотечной комиссии Конференции президентов (канцлеров) итальянских университетов для реализации принципов Берлинской декларации. Цель деятельности Группы – пробуждение интереса к преимуществам Открытого доступа к журналам и архивам ОД или репозитариям.

Италия оказалась вполне подходящим местом для подобного форума, поскольку в стране широко применяются стандарты протоколов ОД, в основном в вузовских организациях.

Один из ключевых принципов ОД – самоархивация научных материалов в сети, позволяющая достигнуть высокого уровня цитирования статей. Количество репозитариев растет (на момент конференции их было около 800 по всему миру) в результате роста интереса к ОД среди ученых всех специальностей. Дерек Лоу (DerekLaw) из британского Университета Старклайд, заметил, что депонирование статей в репозитариях ОД приводит к большему количеству цитирования, поэтому авторы с удовольствием размещают свои работы в форматах ОД.

Подобные наблюдения подчеркивают ценность статистических данных для измерения доступа и использования электронных журналов. Весьма важно, чтобы библиотеки имели возможность сравнивать пользование периодическими изданиями общей тематики, находящимися в ОД, с журналами вне ОД. Если наблюдения окажутся в пользу ОД, это может быть очень полезным с точки зрения расходов библиотеки.

На этой конференции также обсуждались проблемы авторского права для полной реализации принципа ОД и устранения любых экономических, юридических и технологических препятствий в доступе к научной информации. Участники согласились с тем, что совершенно необходимо предоставить авторам средства контроля права на их интеллектуальную собственность. Приоритетным является доведение до сведения авторов условий размещения работ в репозитарии или публикации статьи в журналах ОД. Четко проработанные стратегии и соглашения между научным учреждением или университетом и издателем должны гарантировать распространение знания во благо всего сообщества. Конференция выявила необходимость в энергичной кампании по просвещению авторов и перехода репозитариев от этапа разработки к обслуживанию.

Проект Великобритании по Открытому доступу к диссертациям

Великобритания приступила к созданию Национальной службы электронных тезисов диссертаций после проведения 18-месячных испытаний, в которых участвовали 10 библиотек и организаций высшей школы. Новая служба под названием EThOS формируется на базе Британской библиотеки. Предполагается сделать британские авторефераты диссертаций доступными для всего мира. Поскольку доступ к материалам будет бесплатным, стоимость оцифровки (90% от стоимости годовых расходов на проект, составляющей 0,5 млн фунтов) будет обеспечиваться спонсорами.

Энтони Троман (AntonyTroman), представитель Британской библиотеки, сообщил участникам Ежегодной конференции Объединенного комитета по научной информации (JISC) в 2007 г., что крупные учреждения, участвующие в проекте по диссертациям, будут вносить фиксированную плату – 8 тыс. фунтов в год. Из этих средств будут покрываться расходы на оцифровку всех диссертаций, поступивших из данного учреждения в течение года, а также оцифровываться те тексты диссертаций за прошлые годы, на которые поступил запрос. Одна из копий оцифрованных текстов будет возвращаться в учреждение, чтобы там могли включить этот файл в собственный институциональный репозитарий. Формирование службы EThOS – часть нового двухлетнего проекта.

Администраторы EThOS считают невозможным организовать обращение к авторам всех выпущенных ранее авторефератов для получения разрешения на оцифровку их работ. Поэтому одной из проблем, которую будет изучать EThOS, является потенциальная законодательная угроза, связанная с отсутствием авторского разрешения.

На конференции ИАТУЛ (Международная ассоциация библиотек технических университетов) в Стокгольме в 2006 г. представитель Национального института информатики (Токио) Юко Мураками (YukoMurakami) в докладе «Промежуточные оценки национального проекта создания институциональных репозитариев в Японии» (TheinterimmethodofthenationalprojectforinstitutionalrepositoriesinJapan) рассказал о состоянии дел в Японии.

Национальный институт информатики (NationalInstituteofInformatics), основанный в 2000 г., является межуниверситетской научной организацией. Проект создания институциональных репозитариев стартовал в 2004 г. и находится в фокусе задач института по формированию инфраструктуры кибернауки. Организовано взаимодействие по формированию репозитариев ОД с 57 университетами; бюджет проекта в 2006 г. составил 2,6 млн долларов.

Тематический репозитарий аrXiv

ArXiv (произносится архив, поскольку буква Х здесь соответствует греческой) – это коллекция электронных препринтов научных статей по физике, математике, компьютерным наукам, нелинейным наукам и количественной биологии, доступных через Интернет. Во многих областях математики и физики почти все научные статьи размещены в системе arXiv.

Идеология архива разработана в 1991 г. профессором Полем Гинспаргом (PaulGinsparg) в Национальной атомной лаборатории Лос Аламос (LosAlamosNationalLaboratory). С 2001 г. он занимает должность профессора физики, компьютерных и информационных наук в Университете Корнелл (США).

Владельцем arXiv, его оператором и главным финансистом выступает Корнельский университет, архив размещен на его сайте, а также и на многих зеркальных сайтах по всему миру. По состоянию на декабрь 2006 г. в arXiv.org насчитывалось более 400 тыс. электронных препринтов (е-prints); ежемесячно добавляется в среднем 4 тыс. новых.

Создание arXivпредваряло революцию в научных публикациях, которая сейчас называется «Движение за открытый доступ», что может в итоге привести к исчезновению традиционных научных журналов. Система формально не включает в себя научное реферирование (peerreview), однако в 2004 г. было введено правило так называемого одобрения (endorsement), обеспечивающее релевантность поданной статьи. Одобрить материал может либо автор уже размещенной статьи, либо автоматизированная система, в которую заложены различные критерии качества.

Большинство документов архива в дальнейшем проходит реферирование и публикуется в научных журналах, но некоторые работы, в том числе очень весомые, остаются только в электронном формате (e-print). Хорошо известный недавний пример – доказательство Предположения Тэрстона о геометризации, в частном случае включающее в себя Предположение Пуанкаре (Thurston'sgeometrizationconjecture, includingthePoincaré conjecture); доказательство было размещено в системе arXiv в ноябре 2002 г. Григорием Перельманом, заявившим: «Если кто-нибудь заинтересуется моим доказательством, пусть заходит и читает – здесь все имеется». От публикации традиционным методом он отказался.

Директория журналов Открытого доступа
(Directory of Open Access Journals, DOAJ)

Директория журналов Открытого доступа – DOAJ – очень удобный инструмент для работы. Подчеркнем, речь в данном случае идет не о репозитарии, в котором непосредственно хранятся полнотекстовые документы, а о системе, фактически повторяющей все основные моменты Сводного каталога электронных документов, доступных с помощью сетевых технологий. Этот сетевой каталог предоставляет прямой выход на полнотекстовые документы, размещенные на соответствующих серверах по всему миру.

Создавалась система DOAJ сотрудниками Университета г. Лунд (Швеция) при активном содействии Отдела национальной координации и развития Королевской библиотеки (Стокгольм). Поддержку проекту оказывают Институт Открытого общества (OpenSocietyInstitute), Шведская национальная библиотека (NationalLibraryofSweden), коалиция SPARC, компания «Axiell».

Критерии деятельности и отбора изданий:

Тематика журналов, представленных в DOAJ:

сельское хозяйство и пищевая продукция (AgricultureandFoodSciences),

искусство и архитектура (ArtsandArchitecture),

биология и науки о жизни (BiologyandLifeSciences),

экономика и бизнес (Business and Economics),

химия (Chemistry),

науки о Земле и экология (Earth and Environmental Sciences),

общие вопросы (General Works),

здравоохранение (Health Sciences),

история и археология (History and Archaeology),

языки и литература (Languages and Literatures),

юридические и политические науки (LawandPoliticalScience),

математика и статистика (Mathematics and Statistics),

философия и религия (Philosophy and Religion),

физика и астрономия (Physics and Astronomy),

наука в общем (Science General),

общественные науки (Social Sciences),

технология и машиностроение (TechnologyandEngineering).

В докладе Ларса Бьорнсхауга (LarsBjörnshauge), директора библиотек Университета г. Лунд, «Журналы открытого доступа и развивающийся мир – опыт работы Директории журналов Открытого доступа» (Openaccessjournalsandthedevelopingworld – experiencesfromoperatingtheDirectoryofOpenAccessJournals, DOAJ), представленном на конференции ИАТУЛ в 2007 г., подчеркнуты особенности DOAJ – это прореферированные журналы ОД с охватом всех дисциплин на всех языках; единый интерфейс; услуги сбора метаданных на основе протокола OAI-PMH для библиотек и других поставщиков; предоставление поисковых возможностей конечным пользователям.

Количество журналов в DOAJ по состоянию на май 2007 г.: 2700 наименований журналов более чем 2000 издателей из 80 стран на 40 языках.

Распределение вклада различных издателей на июнь 2007 (табл. 2): 10 издателей представили свыше 10 наименований, 24 издателя – более 5 наименований, 1906 издателей – по 1 наименованию; всего 2044 издателя.

Некоторые из журналов успели завоевать популярность: за два года журнал «PloSBiology» добился импакт-фактора 13,9 – наиболее высокого среди журналов подобного профиля.

Таблица 2

Распределение по странам журналов, размещенных в DOAJ
(представлены первые 15 стран)

Страна

Количество журналов,
размещенных в DOAJ

США

553

Великобритания

272

Бразилия

222

Испания

146

Япония

112

Германия

95

Индия

87

Чили

75

Канада

74

Венесуэла

65

Австралия

63

Франция

59

Турция

54

Мексика

53

Италия

51

Польша

38

Таблица 3

Поступление документов в DOAJ по годам

Годы

Доля от общего объема массива, в%

С 2006

6

2001 – 2005

52

1996 – 2000

32

1991 – 1995

6

1990 и раньше

4

Программное обеспечение DSpace

Одна из основных инициатив в продвижении технологии самоархивации – Dspace, продукт совместной деятельности библиотеки Массачусетсского технологического института и компании «HewlettPackard».

Dspace – бесплатное программное обеспечение для репозитариев цифровых документов, позволяющее работать с различными входными форматами документов; обеспечивает ввод, индексацию, сохранность и распределение научных материалов в электронном формате.

Научные организации всего мира используют Dspace для самых разнообразных архивных целей:

В списке Dspace (на октябрь 2006 г.) более 100 организаций-участников, в том числе университеты штатов Мэриленд, Аризона, Висконсин, Техас, Иллинойс; университеты Корнел, Дрексел, Дж. Мейсона; Национальная атомная лаборатория Лос Аламос, Национальная лаборатория реактивного движения Пасадина (США); университеты Кэмбридж, Лафборо, Лондонский, Глазго, Абердин (Великобритания); Утрехт, Лейден (Голландия); Нагойя, Цукуба, Васеда (Япония); среди российских – Уральский и Красноярский государственные университеты.

DSpace работает с любыми видами электронных документов, включая текст, изображения, видео, аудиофайлы. Содержание также может быть самым различным (статьи и препринты, технические отчеты, рабочие документы, труды конференций, диссертации в электронном формате, материалы в помощь образованию, оцифрованные библиотечные коллекции).

Любопытно ознакомиться с выдержками из «Руководства для студентов Корнеллского университета по процедуре публикаций в системе DSpace@Cornell»:

«DSpace – это вновь разработанный репозитарий, первоначально созданный в Массачусетсском технологическом институте, для сбора, распространения и обеспечения сохранности интеллектуальных произведений ученых, исследователей и др.

Корнеллский университет использует DSpace для сбора различных видов работ, в том числе полных текстов диссертаций и тезисов, глав из книг, изображений и других типов электронного контента.

Будучи утвержденным дипломником, вы можете опубликовать свою оригинальную работу и бесплатно передать ее в коллекцию Корнельского университета, тем самым сделав ваше произведение доступным ученым всего мира через сеть WWW.

Размещение вашей работы в DSpace сбережет вам время и деньги, упрощая процесс публикации диссертации или тезисов. Вместо передачи вашего труда на утверждение в Комиссию по дипломам, вы можете просто загрузить в DSpace финальную версию в формате AdobeAcrobat, где ее просмотрят, одобрят в установленном порядке для сетевой публикации.

Процедура приема в DSpace нацелена на то, чтобы вы сдали финальную версию, свободную от ошибок и одобренную кафедрой…

Имейте в виду, что некоторые издатели не принимают к публикации работы, уже размещенные в DSpace.

В DSpace у вас имеется выбор: либо свободная, общедоступная публикация, либо публикация в «закрытом режиме», в котором будут доступны только наименование работы, автор, аннотация и другие метаданные. По прошествии 5 лет полный текст станет общедоступным.»

(Продолжение в № 8 2008 г.)