Научные и технические библиотеки №10 2012 год
Содержание:

НАША ПРОФЕССИЯ. КАДРЫ. ОБРАЗОВАНИЕ

Соколов А. В. О бедном магистре замолвите слово

Каратыгина Т. Ф. Формирование межкультурной толерантности студентов – будущих специалистов в сфере библиотечно-информационного обслуживания

Стрелкова И. Б. Молодой учёный в библиотечной сфере: ценностная мотивация и профессиональная востребованность

Марьясова Н. В. Духовно-нравственные основы профессиональной деятельности

Байрамова И. З. Современное состояние кадрового обеспечения библиотек Азербайджанской Республики

ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В БИБЛИОТЕКАХ

Леонтьев А. А. Эволюция информационных технологий, Интернет и библиотека: триумф Интернета или несбывшиеся надежды

Кирьянова А. П. Применение технологий интернет-маркетинга в научной библиотеке: теоретический аспект

ПРОБЛЕМЫ ИНФОРМАЦИОННОГО ОБЩЕСТВА

Стирлинг П., Ильен Г., Санц П., Сепетьян С. Депонирование электронных документов во Франции: пятилетний опыт применения нового законодательства и уроки на будущее

НАША ИСТОРИЯ

Глазков М. Н. Забытый персонаж эпохи

ИНФОРМАЦИОННЫЕ СООБЩЕНИЯ

Павлова Н. П. Крымский форум накануне юбилея: Девятнадцатая Международная конференция «Крым». Обзор работы


ПРОБЛЕМЫ ИНФОРМАЦИОННОГО ОБЩЕСТВА

УДК 026.06

Питер Стирлинг, Гильдас Ильен, Паскаль Санц, Софи Сепетьян

Депонирование электронных документов во Франции:
пятилетний опыт применения нового законодательства
и уроки на будущее

Доклад на совместном заседании «Обязательное депонирование электронных документов: от законодательства к реализации, от комплектования к доступу» секций Библиографии, Информационных технологий, Национальных библиотек, Управления знаниями и Союза по выработке электронных стратегий Конференции директоров национальных библиотек в ходе 77-й Генеральной конференции ИФЛА (13–18 авг. 2011 г., Сан-Хуан, Пуэрто-Рико). Публикуется с одобрения аппарата ИФЛА.

Оригинал на английском языке см.: http://conference.ifla.org/ifla77

Ключевые слова: депонирование, электронный документ, обязательный экземпляр, библиотеки, Франция, «Кодекс наследия», Интернет, Национальная библиотека Франции, архивы, архивирование, закон DADVSI, сетевые архивы, веб-сайты.

История и основы законодательства
по депонированию электронных документов во Франции

Закон об обязательном экземпляре во Франции появился в 1537 г. при короле Франциске Первом в документе, известном как «Декрет Монпелье» (“Ordonnance de Montpellier”). Документ обязывал издателей и книготорговцев депонировать экземпляр каждой книги, опубликованной или доступной во Франции, в Королевскую библиотеку, которая позднее превратилась в Национальную библиотеку Франции (Bibliotheque nationale de France – BNF).

В течение веков было принято несколько законов для регулирования поступления обязательного экземпляра (ОЭ). Законодательство эволюционировало, для того чтобы охватить различные типы и виды публикаций, тем самым подстраиваясь ко всем основным технологическим и социальным переменам. Это особенно актуально в последнее время, когда инновации привели к созданию многих новых форм публикаций, которые постепенно включались в законодательство о депонировании. Самые «свежие» дополнения, последовавшие за принятием Закона об авторских и смежных правах в информационном обществе (2006 г.), – это электронные публикации и документы в Интернете.

        Таблица 1

История законодательства об обязательном экземпляре во Франции

Вид документа или ресурса, подлежащего депонированию

Год принятия
закона

Печатные материалы

1537

Карты и планы

1648

Ноты

1793

Фотографии и звукозаписи

1925

Плакаты

1941

Видео и мультимедийные документы

1975

Кинофильмы

1977

Мультимедийные документы, программное обеспечение и базы данных

1992

Интернет-ресурсы

2006

Сама мысль, что целью ОЭ является сохранение культурного наследия страны, присутствовала в законодательстве изначально. Формулировки «Декрета Монпелье» свидетельствуют: уже в то время идея охраны, защиты книг от их возможной утраты последующими поколениями была центральной. Ставились, правда, и другие цели – государственный контроль за публикациями и защита авторских прав.

ОЭ иногда рассматривается как источник государственного контроля за публикациями, однако ещё до принятия первого закона об обязательном экземпляре уже действовали законы о цензуре, которые достаточно эффективно обеспечивали такой контроль.

Со временем задачи депонирования сместились, при этом аспекты государственного контроля смешались с аспектами сохранения культурного наследия. Причём статус произведения, подлежащего обязательному депонированию, использовался также для охраны авторских прав в течение 1793 – 1925 гг. С 1925 г. ОЭ во Франции уже не выполняет эту функцию, и сегодня Кодекс интеллектуальной собственности (Code de la propriété intellectuelle), французский закон об авторском праве, соотнесённый с Бернской конвенцией, указывает, что авторское право возникает в момент создания любого произведения. Однако в других странах, в первую очередь в США, ОЭ остается крепко связанным с законодательством об авторских правах.

Целеустановка на сохранение культурного наследия как основа законодательства об ОЭ была подтверждена в ходе пересмотра законодательства в 1992 г. В «Кодекс наследия» (Code du Patrimoine) – свод французских законов, относящихся к культурному наследию, – добавлены положения, касающиеся ОЭ.

Роль ОЭ была также подчёркнута в Декрете о формировании новой Национальной библиотеки Франции (1994 г.). В этом документе две первые задачи библиотеки были определены следующим образом: 1. Собирать, каталогизировать, сохранять и обогащать национальное наследие во всех областях знания и в особенности наследие французского языка и французской цивилизации; 2. Обеспечивать доступ как можно большего количества людей к библиотечным фондам за исключением секретных документов, защищенных законом, и при условиях соблюдения законодательства по интеллектуальной собственности и обеспечения сохранности фондов. Далее в тексте поясняется, что ОЭ – это один из способов, которыми могут быть реализованы указанные задачи.

В качестве базовых целей библиотеки приведённые положения иллюстрируют дух законодательства об ОЭ, что полностью относится и к электронным публикациям, и ко всем иным видам документов. В ОЭ должны входить все материалы, опубликованные во Франции, независимо от их содержания, языка или ценности; они должны храниться неограниченное время и быть доступны пользователям, но при условиях уважения интеллектуальной собственности и без риска нанесения ущерба сохранности документа.

Статьи Кодекса наследия (вместе с другими документами) определяют способы, в соответствии с которыми материалы собираются, хранятся и становятся доступными.

Современное французское законодательство,
регулирующие депонирование электронных документов

«Кодекс наследия», включающий Закон об обязательном экземпляре
(Legal Deposit Law, 1992), и DADVSI (2006)

Базовый документ, регулирующий систему ОЭ во Франции – это «Кодекс наследия». (При обсуждении различных аспектов законодательства об ОЭ в докладе мы будем ссылаться на статьи Части 3 Кодекса, посвященной ОЭ. В системе французского права кодекс представляет собой свод законов и нормативов в конкретной области.)

Обязательное депонирование электронных документов было прописано в Законе 2006 г. «Об авторских и смежных правах в информационном обществе» (“Droits d’auteur et droits voisins dans la société de l’information” – DADVSI). Этот закон – следствие директивы Европейского Союза 2001 г. по авторскому праву (European Union Copyright Directive 2001/29/CE). В нём введена возможность депонирования электронных документов в BNF как исключение из Закона по авторскому праву.

Вследствие своего происхождения этот закон во многом схож с законами других европейских стран, например Финляндии или Дании. Поэтому можно сказать, что ситуация, изложенная в этом докладе, не является уникальной – чисто французской, и может рассматриваться с точки зрения и других национальных законодательств стран Европы, хотя, конечно, существуют и отличия.

В перечень документов, которые подлежат обязательному депонированию, закон DADVSI включил также: «знаки, сигналы, надписи, изображения, звуки или сообщения любого рода, передаваемые публике электронными способами».

Определение «электронной публикации» сознательно сформулировано в самых общих терминах, чтобы избежать каких-либо ограничений из-за перечисления конкретных технологий, часть из которых может со временем устареть.

Закон разрешает, а на самом деле требует, обязательного депонирования всего, опубликованного в Интернете, за исключением частной корреспонденции (электронная почта, интранеты, социальные сети и т.п.). Круг подобных публикаций простирается от веб-сайтов до видео- или аудиозаписей, любых форм электронных публикаций (электронные журналы, электронные книги, блоги и т.п.), которые доставляются электронными («не материальными») способами. Публикации на физических носителях, например CD–ROM, уже охвачены статьями «Кодекса наследия», поскольку они были включены в Закон 1992 г. об обязательном экземпляре.

Другие статьи касаются ответственности изготовителей, в первую очередь в отношении предоставления технической информации, необходимой для сбора и обеспечения сохранности документов, и практических вопросов работы с коллекциями, а также условий доступа. В законе также указано, что все детали, касающиеся его выполнения, будут прописаны в декрете (выпуск декретов является обычным механизмом практической реализации законодательства во Франции).

Важно отметить, что на момент подготовки доклада такой декрет – в процессе утверждения, т.е. пока ещё не опубликован. Поэтому реализация Закона об обязательном экземпляре, который мы рассматриваем, хотя и осуществляется на практике Национальной библиотекой Франции в течение нескольких лет, считается экспериментальной. Определенные разработки и детали функционирования закона будут либо подтверждены, либо уточнены при утверждении и опубликовании декрета. Следовательно, некоторые положения проекта декрета, на которые мы сегодня ссылаемся, нельзя считать до конца определенными, и возможности, обсуждаемые в связи с этим декретом, остаются на уровне гипотез.

Декрет об обязательном экземпляре 1993 г.

Декрет, выпущенный для реализации Закона об обязательном экземпляре 1992 г., был модифицирован в 2006 г., чтобы дать BNF возможность предложить издателям поставлять вместо физического документа его цифровую копию, при этом технология депонирования должна согласовываться издателем и BNF. До сих пор такой метод использовался только при депонировании очень больших плакатов, с которыми трудно и неразумно работать, если они представлены в физическом формате; сейчас они депонируются как pdf-файлы.

Проводился также эксперимент по электронному депонированию одной из главных французских региональных газет «Ouest France». Однако возможность замены печатного документа его электронным файлом предполагает много вариантов, которые в будущем нужно изучить; важно отметить: депонирование требует, чтобы электронная версия была абсолютно идентична печатной и чтобы она использовалась только для замены депонируемого физического документа. Этот подход нельзя применять, например, для одновременного комплектования электронной и бумажной версий романа: здесь библиотека должна сделать однозначный выбор.

Декрет о создании Национальной библиотеки Франции (1994)

Как уже отмечено, Декрет о создании новой BNF поставил проблему ОЭ как центральную для реализации миссии библиотек. Фактически основной законодательной базой для библиотек до сих пор служит Закон об обязательном экземпляре 1992 г., интегрированный в «Кодекс наследования», и соответствующий декрет 1993 г. Однако Декрет о формировании BNF подчёркивает и укрепляет статус фонда депонированных материалов как части национального наследия, специально созданного для обеспечения долговременной сохранности.

Генеральный кодекс публичной собственности, Кодекс интеллектуальной собственности, Закон об информационных технологиях, файлах и свободахэти три части законодательной системы напрямую не связаны с системой ОЭ, однако их следует упомянуть, имея в виду практические положения и реализацию Закона о депонировании.

Генеральный кодекс публичной собственности (Code général de la propriété des personnes publiques), Кодекс интеллектуальной собственности (Code de la propriétéintellectuelle) представляют собой своды законов; обеспечение сохранности и работа с документами, подпадающими под действие Закона об обязательном экземпляре, в этих двух кодексах задаются несколькими положениями.

Закон об информационных технологиях, файлах и свободах (Loi relative à l'informatique, aux fichiers et aux libertés) существенно влияет на положения, касающиеся доступа и использования коллекций электронных документов, поскольку в нём установлены строгие ограничения относительно защиты персональных данных, которые могут находиться в составе этих коллекций.

Законодательные документы, которые мы рассмотрели, предоставляют три возможных механизма сбора электронных документов в рамках существующего законодательства: по «Кодексу наследия» с учётом модифицированного закона DADVSI (2006 г.) – автоматизированный сбор материалов через Интернет (посредством протокола OAI-PMH); депонирование электронных файлов издателем (посредством системы «электронного депозита»); по декрету 1993 г., пересмотренному в 2006 г., – депонирование электронных файлов как замена депонирования строго идентичных печатных версий.

Как по экономическим, так и по культурным причинам BNF отдаёт приоритет автоматизированному сбору материалов из Интернета, и в настоящем докладе рассматривается, в частности, этот аспект депонирования. Полный спектр возможностей будет освещён в качестве возможных предложений по использованию и других подходов.

В настоящее время депонирование электронных публикаций, связанное с традициями более ранних видов депонирования, создаёт определенные проблемы, обусловленные самой природой материала. Как показано в предыдущем разделе, нормативные документы, регулирующие систему ОЭ, предполагают для депонирования широкий спектр материалов. Однако природа электронных документов означает, что два руководящих принципа, лежащих в основе французского подхода к ОЭ, а именно – доступность публикации на территории Франции и полнота депонируемых коллекций – должны быть рассмотрены заново.

Видовой состав документов, подлежащих депонированию,
и сопутствующие вопросы

В соответствии с «Кодексом наследия» всё, что опубликовано в Интернете во Франции, подлежит депонированию. Это ставит вопрос, как определить понятие «французский Интернет». Очевидно, что вся информация, доступная в Сети, доступна и во Франции. Следовательно, определение, основанное на концепциях, применимых к печатным книгам (т.е. когда собирается выпущенный материал), непригодно. Определение, которое должно войти в разрабатываемый декрет и которое уже использует BNF, основано на идее связи с французской территорией.

Для того чтобы установить, подпадает ли документ под систему национального депонирования электронных документов, используются три критерия: документ доступен в Сети, имеет французский национальный домен высшего уровня Top Level Domain (TLD) .fr или любое доменное имя, зарегистрированное держателем доменных имен, находящимся во Франции (например, домены с расширением .com); создатель веб-сайта (или другого документа) является лицом, живущим во Франции, или компанией, расположенной во Франции; веб-сайт был создан во Франции (этот критерий допускает более широкую интерпретацию, чем предыдущий, а также обладает определенной гибкостью).

Важно отметить: на практике, учитывая масштаб деятельности BNF и ограничения на доступные ресурсы, названные критерии, или условия, при сборе веб-сайтов проверяются не систематически. Однако это общее определение национального характера принимается во внимание при формулировании общей политики и размещении сетевых коллекций, поскольку основной точкой входа является адрес веб-сайта, зарегистрированного с расширением .fr. Перечисленные условия можно также оспаривать во время или после сбора документов на основе индивидуальных обращений создателей.

Однако возникает вопрос, имеет ли смысл «национальное» разделение Интернета, поскольку гиперссылки «не обращают внимания» на национальные границы, и по сути своей Интернет – международный.

Остаются и другие вопросы: является ли национальное законодательство об обязательном экземпляре полноценным и правомочным средством реализации крупномасштабного обеспечения сохранности документов в Интернете; возможно ли посредством национальных законодательных инструментов определять правила копирования и сохранности документов; следует ли считать архивирование материалов Интернета – как международной сущности – укладывающимся в контекст сохранения национального культурного наследия.

Распределение по странам ставит вопрос о международном сотрудничестве и совместимости коллекций.

Учреждения, отвечающие за депонирование электронных документов

«Кодекс наследия» возложил ответственность за депонирование на три учреждения культуры: Национальную библиотеку Франции, Национальный архив радиовещания Франции (Institut national de l’audiovisuel, INA) и Национальный центр кинофильмов и изображений (Centre national du cinéma et de l’image animée, CNC). В готовящемся декрете должны быть определены границы ответственности между BNF и INA, поскольку CNC отвечает за сохранение кинофильмов.

В свое время эти учреждения согласовали разделение, основываясь на логике их коллекций: INA – интернет-публикации, относящиеся к телевидению и радиовещанию во Франции, BNF – все остальные материалы. В готовящемся декрете разделение должно быть зафиксировано более точно.

В этом докладе мы делаем акцент на практических аспектах сбора интернет-материалов с учетом опыта BNF; INA использует другой подход, основанный на значительно более частом просмотре меньшего количества сайтов, концентрируясь при этом на так называемых потоковых документах.

Вся правовая ответственность за сбор документов и обслуживание ими лежит на BNF и INA, вместе с тем другие организации также могут вовлекаться в процесс, когда речь идёт о предварительном отборе материалов для включения в коллекции. В порядке эксперимента BNF уже сотрудничает с 25 французскими региональными библиотеками, на которые возложена обязанность получения ОЭ из типографий, – это так называемые библиотеки обязательного депонирования (Bibliothèques du dépôt légal imprimeur), участвующие в отборе сайтов соответствующих регионов для их архивирования в ходе национальных или региональных избирательных кампаний.

Специалисты и ученые из различных организаций (университетов, ассоциаций и т.п.) также вовлечены в отбор сайтов по какой-либо тематике или проектам, приуроченным к различным событиям и сбору массивов данных, например, таких, как «сетевая активность», «сетевая литература», «устойчивое развитие».

Во Франции реализуются и другие проекты по архивированию Сети вне рамок контекста законодательства об обязательном экземпляре. Некоторые университеты активно вовлечены в научно-исследовательские и конструкторские работы с Сетью, в том числе и по архивированию сетевых документов. Наиболее активный из них – Фонд памяти Интернета (Internet Memory Foundation), ранее известный как Европейский архивный фонд (European Archive Foundation) – некоммерческая организация, нацеленная на обеспечение сохранности Интернета. Однако только INA и BNF могут воспользоваться преимуществами, обусловленными законодательством об обязательном экземпляре, в частности, возможностью собирать веб-сайты, не запрашивая разрешения издателей.

Во Франции – с её хорошо известными традициями административного и культурного централизма – проблема распределения задач между учреждениями культурного наследия рассматривается в основном применительно к BNF и INA, причём оба эти учреждения расположены в Париже. В других странах приходится уточнять распределение задач, границы ответственности, например между национальной библиотекой и национальным архивом (что характерно для Великобритании).

В случае существования федеральной администрации приходится предусматривать распределённые и кооперативные организационные схемы, такие как сети региональных, специализированных библиотек (например в Швейцарии и Германии). Безотносительно к конкретному законодательству могут развиваться другие виды сетей, что и происходит в США, где под эгидой Программы обеспечения сохранности национальной электронной инфраструктуры (National Digital Infrastructure Preservation Program) под руководством Библиотеки Конгресса США в архивировании сетевых документов участвует широкий круг учреждений, например, такие, как некоммерческий фонд Интернет-архив (Internet Archive), Электронные библиотеки Калифорнии (California Digital Library), Университет Северного Техаса (University of North Texas).

Проблемы масштабов и полноты

Обязательный экземпляр, как он определён французским законом и традициями, ранее был нацелен на достижение идеальной полноты: фонды должны включать абсолютно всё опубликованное или ввезённое во Францию (с учётом тех критериев, о которых сказано выше). Однако распространение обязательного депонирования на электронные документы означает, что порядок нужно пересмотреть.

Определение электронного документа в «Кодексе наследия» сформулировано без какой-либо связи с форматом (электронная книга, сетевой документ и т.п.), скорее, акцент делается на содержание, которое передается электронными методами. Это расширяет область применения обязательного депонирования за счет включения всего опубликованного в Сети (опять же с учётом изложенных выше критериев). Но возникают и сложности, поскольку сама природа Сети противоречит любой идее абсолютно полной коллекции.

Эта проблема связана с огромным количеством информации, доступной в Сети. В апреле 2011 г. количество доменных имён, зарегистрированных с расширением .fr, составляло около 2 млн, и к этому числу следует добавить сайты, которые относятся к компетенции французского ОЭ, зарегистрированные с другими доменными именами высшего уровня (TLD), и в особенности .com, .org, .net.

Французская ассоциация по присвоению сетевых имён (Association Française pour le Nommage Internet en Coopération, AFNIC) – учреждение, отвечающее за администрирование французского географического домена TLD .fr, подсчитала, что этот домен составляет примерно третью часть «французского Интернета». Вместе с тем обзор национального домена, выполненный BNF в 2010 г., показал, что значительная часть доменных имен, отмеченных в законодательстве об обязательном экземпляре, имеет незначительный контент или совсем его не имеет; в то же время крупные сайты содержат миллионы отдельных файлов.

Таблица 2

Распределение доменов (внутри TLD.fr) по количеству адресов документов
на данном домене
(источник – исследование BNF 2010 г.)

Количество адресов

Количество доменов

Менее 10

976 948

11–100

580 362

101–1000

320 620

1001–10 000

85 471

10 001–50 000

23 630

50 001–100 000

352

Более 100 001

230

Сеть трудно представить себе состоящей из индивидуальных, отдельных публикаций; скорее, это сплошное информационное пространство с подвижными границами. Внутри этого пространства достаточно трудно определить раздельные и устойчивые «единицы хранения» или «выпуски», которые можно было бы сравнить с книгой или выпуском периодического издания. Веб-сайт может содержать множество страниц, изображений, видео- или аудиофайлов, документы в формате .pdf или Word, приложения и т.п. Кроме того, Сеть по своей природе использует связи (гиперссылки) внутри сайта или между сайтами, так что значительная часть информации приобретает смысл и значимость исходя из контекста в составе сложной сети взаимосвязанных элементов. Ещё более усложняет дело постоянный поток информации, поскольку сайты обновляются с частотой, которая варьируется внутри сайта и между сайтами.

Сказанное означает, что для обеспечения истинной полноты потребуется собирать всё и заниматься этим постоянно. Технология просмотра Сети и соответствующая ёмкость хранения собранных документов показывают, что это просто невозможно. Собранные коллекции будут огромными и неуправляемыми – как для библиотекаря, так и для пользователя. Поэтому единственный выход из создавшегося положения – отказаться от идеала полноты и согласиться с тем, что ОЭ сетевых документов будет представлять собой только часть из всего, доступного в Сети. В готовящемся декрете проблема обновления сетевого материала будет учтена с указанием, что сайты должны собираться «хотя бы раз в год». Но даже при этом условии объём материала таков, что собрать абсолютно полную коллекцию даже раз в год также невозможно. Следовательно, есть два подхода: селекция и выборка.

Первый вариант предполагает предварительную селекцию сайтов, которые нужно собрать на основе заключения об их качестве, научной или эстетической значимости. Это приведёт к тому, что сайты, публикующие научные исследования, правительственные или официальные документы либо художественные произведения, имеющие особую значимость, будут привлекать больше внимания при формировании коллекции. Такой подход во многом схож с принципом комплектования книг – когда библиотекарь отбирает документы, способные обогатить научные фонды.

Альтернативный подход – выборка – ближе к идее обязательного экземпляра: сайты собираются без предварительного суждения относительно их ценности или потенциального интереса для современных или будущих исследователей. Скорее, целью является сохранение репрезентативного набора национального «электронного» творчества, в котором как можно более точно будет отражён «характер» национальной сети на данный момент.

У каждого подхода существуют свои ограничения: для селекции требуются определение критериев и затраты времени кураторов, ученых и других специалистов, при этом останется вероятность, что сайты, отобранные сегодня, в будущем не будут считаться наиболее важными. С другой стороны, выборка означает, что при такой технологии важные сайты могут либо вообще не попасть в коллекцию, либо попасть не полностью. При этом не исключено, что кто-нибудь будет утверждать, что большая часть собранного не представляет интереса для учёных, а содержание его совершенно ничтожно.

Каким образом собирается сетевой материал

Чтобы выполнить обязательства по депонированию, учитывая при этом реальное положение с сетевыми документами, BNF с 2006 г. использует «смешанную модель» архивирования Сети, в которой объединены два подхода к отбору документов: широкий (или доменный) обзор и сфокусированный (или селективный).

Первый включает в себя ежегодный обзор всех доменных имён, зарегистрированных в TLD .fr; список имён поставляется ежегодно по соглашению с AFNIC. В будущем библиотека надеется получить возможность просматривать сайты, зарегистрированные в других TLD – org, .net , .com. Они попадают в зону действия законодательства об обязательном экземпляре, а их количество – примерно две трети сайтов, зарегистрированных во Франции. Для этого потребуется заключать дополнительные соглашения напрямую с регистраторами.

В этом случае не выносится суждений, касающихся качества или ценности того, что собирается (в традициях депонирования должно собираться всё, что попадает под рассмотренные выше критерии). Такого рода ежегодный сбор использует технические настройки, допускающие сбор ограниченного количества данных с каждого домена: в 2010 г. было 10 тыс. адресов (или файлов) на один домен. Идея этого подхода состоит в представлении своего рода «мгновенной фотографии» французской части Сети, однако ограниченной как по глубине, так и по охвату во времени. Тем не менее, этот подход отражает смысл обязательств депонировать «французскую сеть» по крайней мере раз в год, что создаёт возможность формирования репрезентативного образца французской интернет-продукции.

Другой дополнительный подход – сфокусированный просмотр – предполагает сбор сайтов, которые отобраны библиографом BNF, а иногда другими партнёрами (например региональными депозитарными библиотеками или учеными). Этот подход, в общем-то, находится в рамках законодательства об обязательном экземпляре, и его можно сопоставить и сравнить с комплектованием книг и иных ресурсов в целях развития фондов научной библиотеки. Библиотекарь выбирает сайты с учётом ценности и значимости размещённого на них материала, рассматривая их как часть ресурсов BNF по данной тематике.

Критерии отбора сайтов должны совпадать с общей политикой комплектования национальной коллекции и соответствовать традиционной работе отдела комплектования библиотеки. Отбираются сайты, которые не были собраны или недостаточно представлены при «тотальном» просмотре. Сюда могут входить сайты с иным TLD, чем .fr, либо сайты или их части, которые нельзя было собрать из-за их объёма (большие институциональные сайты, индивидуальные блоги и т.п.).

Сфокусированный подход дает возможность собирать сайты чаще, чем один раз в год. В 2011 г. BNF разработала систему постоянного просмотра; сайты могут собираться ежегодно, два раза в год, ежемесячно, еженедельно или даже ежедневно. Это позволяет, например, формировать ежедневную подборку новых сайтов, чтобы показать, какие материалы размещаются в тот или иной день на домашних страницах, а также улучшить качество коллекции сайтов, которые часто обновляются, или таких, которые не поддерживает архивирование. Количество собираемых файлов с одного сайта варьируется в зависимости от частоты просмотра, объёма коллекции и числа файлов.

И наконец, BNF разработала экспериментальную процедуру, в ходе которой создатели веб-сайтов могут сами предлагать свои сайты для включения в коллекцию. В настоящий момент на веб-сайте BNF размещаются сообщения относительно ОЭ электронных документов и адрес электронной почты, на который можно посылать веб-сайты. В зависимости от результатов эксперимента такой подход может быть развит после публикации декрета.

Архивирование сетевых документов в BNF основано на двух программах, созданных как продукт открытого доступа в партнёрстве с другими учреждениями. Это – робот-подборщик Heritrix, который собирает файлы, входящие в архив, и программа NetarchiveSuite, дающая возможность планировать, программировать и наблюдать за ходом просмотров.

Важно отметить, что такого рода просмотры, сопровождаемые изготовлением копий веб-сайтов, стало возможно применять только в рамках «Кодекса наследия» с поправками, внесёнными в закон DADVSI, поскольку было предусмотрено соответствующее исключение из законодательства об интеллектуальной собственности. Согласно статье L132-4, разрешается копирование защищенного материала, «когда такое воспроизведение необходимо для сбора, обеспечения сохранности или доступа» к нему. Поскольку невозможно собирать документы Интернета, не прибегая к копированию, потребовалось создать соответствующую юридическую возможность, и в законе DADVSI специально рассмотрены проблемы, возникшие из-за несовместимости новых технологий и законодательства в различных областях.

Обязанности создателей и издателей

В упомянутой выше статье закона DADVSI также указано: не нужно спрашивать разрешение создателей веб-сайтов и правообладателей. Система архивирования, основанного на получении разрешения, существует во многих других странах (например в Великобритании и США), но такой подход делает невозможным крупномасштабный просмотр домена из-за невозможности идентификации и установления контактов с владельцами миллионов доменов.

Некоммерческий фонд Internet Archive, который начал свою работу в 1996 г., не имея законодательной поддержки для решения задач архивирования в глобальном масштабе, использует подход “opt-out” («уберем по первому требованию»). Согласно этому подходу, документ становится недоступным в архиве, если поступает жалоба от создателя сайта или правообладателя. Ещё раз заметим, что данное исключение из прав интеллектуальной собственности применяется только в жёстких рамках законодательства, регулирующего получение ОЭ в целом и, в частности, контроль доступа к архивным материалам.

Другое положение, введённое в «Кодекс наследия», связано с изменениями в депонировании электронных документов и устанавливает отношения между создателем (издателем) и депонирующим учреждением. В отличие от традиционного депонирования библиотека сама собирает веб-сайты, а не получает ресурсы от издателей. Однако закон поясняет, что создатель обязан, если потребуется, помогать сбору материалов.

Декрет будет конкретизировать: создатели обязаны предоставлять все пароли или другие средства, необходимые для доступа к документам. Это касается не только разделов веб-сайтов, защищённых паролями, но и таких файлов, как аудиовизуальные документы, платные журналы или электронные книги, которые могут быть защищены системами Управления правами на электронные документы (УПЭД). УПЭД может ограничивать не только формирование коллекции сайтов, но и обеспечение долговременной сохранности, и в Декрете должно быть указано, что издатели обязаны предоставлять всю необходимую информацию и средства доступа.

Важно отметить, что в базовом определении электронных материалов, подлежащих обязательному депонированию, подчёркнуто: они должны быть «публично обнародованы», следовательно, исключается любой материал в Интернете, который может считаться частной корреспонденцией. Таким образом, если пароли защищают частные документы, особенно в случае приватных зон социальных сетей, эти зоны находятся вне обязательств по депонированию. Однако опубликованный платный материал, доступный посредством пароля (или иным способом – таким, как распознание IP), попадает в зону действия об обязательном депонировании точно так же, как печатные документы, подлежащие депонированию. Издатели, следовательно, обязаны предоставлять всю необходимую помощь по формированию доступной коллекции в библиотеке.

Открытые вопросы и проблемы

В отличие от других учреждений (таких, как Королевская библиотека Нидерландов, которая давно приступила к организации депонирования электронных материалов на основе соглашения с издателями и через несколько лет начала программу архивирования Сети) BNF в настоящее время концентрирует свои усилия на депонировании сетевых документов, в первую очередь по экономическим и практическим причинам: огромные объемы общедоступных сетевых документов, которые иначе были бы навечно утрачены, собраны библиотекой с помощью автоматизированной системы.

Ещё в 2004 г., когда BNF запустила первый экспериментальный обозреватель доменов (domain crawler) в партнёрстве с Internet Archive, она ощущала настоятельную необходимость организовать полномасштабный сбор материалов, поскольку Сеть меняется чрезвычайно быстро, и большие массивы данных национального наследия исчезают каждый день. Однако некоторые виды материалов этими способами оказалось трудно или невозможно собирать: либо из-за того, что материала не было в Сети, либо вследствие технических или коммерческих препятствий, ограничивающих доступ.

Как отмечено выше, законодательство охватывает все опубликованные электронные материалы и обязывает создателей документов при необходимости сотрудничать с библиотекой, что открывает путь к использованию других методов, таких, как депонирование файлов самими создателями.

Этот подход BNF пока не использует, отчасти потому, что взаимные обязательства создателей веб-сайтов и BNF в Декрете должны быть прописаны более точно. Следовательно, разумно подождать, пока будет готова нормативная база. Однако предварительная работа выполняется: рассматриваются организационные и технические процедуры, которые затем можно будет использовать.

Одна из областей экспериментирования с ОЭ файлов – это газеты, которые создают специфические проблемы в их хранении и обеспечении сохранности. Эксперименты проводились с 2005 по 2009 г. системой региональных газет «Ouest France», которые распространяются в большом количестве экземпляров в западных регионах страны. Было организовано депонирование электронных версий 47 локальных изданий этой газеты: BNF собирала и консервировала только одно главное издание в печатном формате, тем самым экономя ресурсы как самой BNF, так и издателей.

Опыт пришлось прервать из-за недостатка соответствующих ресурсов, поскольку на тот момент оказалось невозможно распространить эту технологию на другие газеты. Вероятно, что именно такой подход, а не сбор сетевых версий, будет использоваться, хотя возникают определенные технические и юридические проблемы.

Некоторые из этих проблем можно решить, используя архивирование Сети, но остается ряд вопросов. Сегодня существует много видов материалов, которые трудно собирать: «насыщенные» издания (видео, «потоковые» документы, документы Flash, javascript и т.д.), «глубинная сеть» (база данных и т.п.), подписные и защищённые паролем документы. Часть проблем по природе своей – технические, и BNF надеется решить их за счёт международного сотрудничества: разработать инструменты и овладеть навыками сбора таких «богатых» изданий.

Другие проблемы представляют собой комбинацию технических, правовых и организационных вопросов. В случае ресурсов, защищённых паролем или требующих проверки аутентичности методом запроса IP-адреса, робот Heritrix «обходит» защищённые страницы. Конечно, это значит, что решать проблему необходимо путем установления контакта с создателями сайта. «Кодекс наследия», при поддержке готовящегося к выпуску Декрета, обяжет создателей сотрудничать с BNF и предоставлять всю необходимую информацию по документам, попадающим в зону действия обязательного депонирования, – бесплатным или платным. Поскольку такое юридическое обязательство – новое, нужно будет выяснить, достаточно ли легко организовать сотрудничество издателей документа с BNF в этой области. Кроме того, потребуется большая работа со стороны библиотеки, чтобы поддерживать и налаживать контакты с издателями, в то время как бюджет BNF жёстко урезается.

В определённых случаях потребуется также добавлять какие-то новые технические разработки, например в том случае, когда пароль открывает доступ к читателю, работающему на базе Flash-технологии, и робот Heritrix не может собирать документы. Эта работа начнётся на серьёзной основе только после опубликования Декрета, и потребуются значительные организационные изменения, чтобы отладить новый способ сбора материала. Однако это позволит BNF собирать намного больше документов, чем сейчас и, в частности, комплектовать электронные книги, сетевые журналы и другие ценные электронные ресурсы, которые в настоящее время не собираются.

Похоже, что для некоторых типов публикаций депонирование файлов издателями позволит BNF выполнить обязательства перед законом. Сегодня единственный вид систематического депонирования документов (помимо экспериментов с периодикой), выполняемый издателями, – это большие плакаты, которые, как отмечено выше, собираются и хранятся в электронном, а не в печатном формате в соответствии с Декретом 1993 г., модифицированном в 2006 г.

По мере возрастания интереса к электронным книгам и их коммерческой значимости остаётся открытым вопрос, как наилучшим образом управлять коллекцией этих документов. В BNF эта проблема обсуждается как специалистами отделов, отвечающих за депонирование электронных документов, так и теми, кто занимается депонированием печатных книг, а также библиотекарями, которые стремятся комплектовать электронные книги в тех или иных тематических областях.

Технологический процесс, принятый для сбора этих публикаций, будет также иметь влияние и на другие библиотечные технологии, в том числе на каталогизацию и обеспечение сохранности таких произведений. BNF изучает варианты, наилучшим образом отвечающие поставленным задачам.

Параллельный вопрос касается тех документов, которые можно назвать «подарком, или дарением в цифровой форме». Во Франции обязательное депонирование всегда дополнялось комплектованием за счет подарков. Этот канал содействовал формированию коллекций культурного наследия и научных. Интересно, возможно ли такие комбинации применить к электронным ресурсам: мы знаем, конечно, о комплектовании платных электронных ресурсов, но не о подарках цифровых «рукописей» (от авторов, художников и др.). Каким образом эти коллекции будут юридически и технически взаимодействовать с фондами, сформированными в ходе обязательного депонирования? Такие вопросы нужно будет обсуждать в контексте поиска общего решения для электронных публикаций за пределами уже существующего порядка архивирования сетевых документов.

И наконец, широкую дорогу дальнейшему изучению проблем формирования коллекций электронных документов открывает международное сотрудничество. Многие проекты уже осуществляются, в частности, Международным консорциумом по обеспечению сохранности Интернета (International Internet Preservation Consortium, IIPC).

Хранение материалов, полученных по системе обязательного
депонирования электронных документов

Юридические обязательства по сохранению культурного наследия. Как подчёркнуто в начале доклада, цель обязательного депонирования – формирование постоянной коллекции культурного наследия Франции. Идея обеспечения сохранности является сердцем обязательного депонирования: коллекции, сформированные из обязательных экземпляров, должны быть сохранены навечно. Это положение, записанное в декретах о создании BNF и «Кодексе наследия», введено в действие «Генеральным кодексом публичной собственности»; его статья L2112-1 уточняет: один экземпляр каждого документа, собранного в качестве ОЭ, должен рассматриваться как часть элементов, составляющих общественную собственность, и следовательно, «неотчуждаемым и неотъемлемым».

Это фундаментальное обязательство придаёт особую значимость технологиям обеспечения сохранности, при этом коллекция электронных материалов, полученных в качестве ОЭ, выдвигает как технические, так и юридические проблемы, с которыми мы ранее не встречались.

Технологические методы обеспечения сохранности электронных документов: изготовление копий для хранения. С технической точки зрения, в BNF имеется система, обеспечивающая долговременную сохранность коллекции депонированных электронных документов. Основное отличие технологии обеспечения сохранности электронных ресурсов состоит в возможности изготовления копий либо идентичных, либо модифицированных, позволяющих менять формат. По сути, сохранность электронных документов окажется невозможной, если не будет предусмотрено копирование одной платформы на другую.

Закон DADVSI от 2006 г. отразил исключения в законодательстве об интеллектуальной собственности, позволяющие копирование материалов, защищённых авторским правом, если это необходимо для формирования коллекции и обеспечения её сохранности.

В настоящее время собранные сетевые материалы (в формате ARC или WARC-файлов) хранятся на серверах, используемых для доступа к коллекциям. Кроме того, изготовляется резервная копия, чтобы предотвратить потерю качества файла и носителя; осуществляется периодическое копирование и замена дисков или лент. Резервная копия является первым шагом в обеспечении долговременной сохранности битовых потоков.

В дальнейшем – для долговременной сохранности – BNF будет включать в свои сетевые архивы централизованную электронную систему SPAR (Scalable Preservation and Archiving Repository). Этот репозитарий совместим с принципами модели системы открытой архивации Open Archival Information System (OAIS). Помимо проверки целостности данных, SPAR будет допускать анализ используемых форматов, что позволит осуществлять политику долговременной сохранности и избежать устаревания форматов (на основе миграции и эмуляции).

Упоминаемая ранее статья «Кодекса наследия» разрешает такой вид обработки данных, который необходим для сохранения фондов ОЭ. Разрабатываемый декрет также будет предписывать изготовителям раскрывать все технические детали, необходимые для обеспечения хранения депонированных материалов. В частности, это будет важно, если депонированные материалы защищены системой управления правами на электронные документы, которые препятствуют воспроизведению или модификации файлов.

Требование издателя модифицировать или изменить материал. BNF должна учитывать, что издатель либо другое лицо может потребовать уничтожить или изменить информацию, содержащуюся в архивах сетевых документов. Это особенно актуально в свете закона «Об информационных технологиях, файлах и свободах», позволяющего гражданам корректировать или уничтожать касающуюся их информацию, которая опубликована на веб-сайте или находится в распоряжении третьей стороны. Подобные требования могут также поступить от автора или издателя документа.

Однако установленное законом обязательство сохранять депозитарные коллекции превосходит по своей силе любые иные права или требования уничтожить документ, поэтому в работе с цифровыми коллекциями должна применяться такая же защита, как и в работе с книжными фондами или коллекциями иных физических документов, которые запрещено уничтожать или изменять. Такая законодательная охрана жизненно важна для обеспечения цельности коллекции культурного наследия и составляет суть законодательства об обязательном экземпляре.

Это та область, которая должна быть уточнена в Декрете. Организацией, отвечающей за проблемы частной жизни и защиты персональных данных во Франции, является Национальная комиссия по информатике и свободам (Commission Nationale de l’Informatique et des Libertés, CNIL). Недавно она опубликовала рекомендации, касающиеся готовящегося Декрета; в них признаётся: право уничтожать или изменять документ не должно применяться по отношению к документам, находящимся в депозитарных фондах. Предусматривается, что такого рода требования будут удовлетворяться методом ограничения или запрещения публичного доступа к данному документу, но не уничтожения его.

И, наконец, следует отметить, что материал, содержащийся в сетевых архивах, может быть удалён или уничтожен по решению суда (точно так же, как это происходит и с печатными документами). Однако, такие случаи чрезвычайно редки.

Нерешённые вопросы и проблемы. Основная проблема, уже возникшая с созданием SPAR, – это управление рисками в работе с архивными сетевыми коллекциями. В то время как технологии долговременной сохранности, рассмотренные выше, вполне возможны, любое вмешательство в коллекции несёт в себе угрозу, связанную с затратами человеческого и машинного времени при анализе и обработке коллекции, и потребует увеличения объема памяти. Следовательно, может оказаться невозможным применение технологий обеспечения наивысшего качества ко всем архивным материалам. Вместо этого придётся пользоваться технологией управлениями рисками, позволяющей определить, в каком конкретно формате и при каких обстоятельствах может возникнуть определённый риск устаревания и каким конкретно материалам должен быть дан наивысший приоритет качества.

Это можно сравнить с технологиями работы с фондами печатных документов, когда физические носители становятся хрупкими, их подвергают специальной обработке, хранят на специальных стеллажах и выдают только при соблюдении специальных условий.

Приоритетное юридическое обязательство обеспечить сохранность электронных депозитарных коллекций по сути своей не меняется, однако, как и в случае решения проблемы полноты коллекции (с учётом гигантского объёма данных, подлежащих депонированию), приходится использовать прагматический подход и разумно работать с ограниченными ресурсами обеспечения сохранности.

Фонд обязательного экземпляра и национальная библиография:
обязательства по каталогизации материалов,
полученных для депонирования

Требования закона к составлению описания материала. Сама природа электронных материалов и особенно Сети также требует новых подходов к обязательству создавать библиографию французской национальной продукции, что записано в «Кодексе наследия» в качестве одной из целей депонирования. Это обязательство BNF реализует путем составления Французской национальной библиографии и обеспечения доступности каталогов, составленных INA и CNC. Если электронные публикации, схожие по формату с традиционными (например, такие как электронные книги и онлайновые журналы), могут, по крайней мере теоретически, обрабатываться точно так же, как традиционные, то информация, опубликованная в Сети, и сетевые архивы нуждаются в иной обработке.

Сетевые материалы – это, скорее, не отдельные публикации, а постоянный поток взаимосвязанных данных. Применение здесь традиционного метода библиографии в полном объёме оказывается невозможным как с точки зрения идентификации каталогизируемой единицы (веб-сайт, домен, хост, директория, файл и т.д.), так и из-за колоссального количества документов (обзор французской части Интернета, выполненный в 2010 г., выявил около 1, 6 млн доменов и около 800 млн файлов).

Следовательно, в Декрете должно быть предусмотрено использование автоматизированного индексирования вместо традиционных библиографических методов для обеспечения доступа к коллекциям. Это соответствует мерам, уже предпринятым BNF по отношению к веб-архивам, т.е. веб-архивы должны использовать ту же логику, что и «живая» Сеть, в которой сайты взаимосвязаны, а не существуют в качестве отдельных стабильных единиц. В других учреждениях, однако, используются иные подходы, особенно, если программа архивирования Сети ограничена (по закону или по утвержденной технической политике) сбором отдельных данных. Например, Британская библиотека и Библиотека Конгресса США каталогизируют индивидуальные сайты. Отчасти это возможно потому, что они пока не выполняют крупномасштабных обзоров Сети; сомнительно, что данный подход может быть использован при технологии обзора доменов.

Технические средства, используемые в настоящее время. Экспериментальный интерфейс, открывающий доступ к коллекциям сетевого архива BNF, действует с 2008 г. Он основан на программе открытого доступа Wayback Machine, первоначально разработанной в Internet Archive. Однако до настоящего момента не создано полноценного полнотекстового индексирования сетевых архивов. Эта проблема ляжет в основу проектов ближайшего будущего, поскольку необходимо обеспечить полное использование природы сетевых архивов с помощью функциональной поисковой машины с добавлением меток времени (датированием).

Сегодня в BNF основным средством доступа является поиск по URL, аналогичный функциям поиска, которые работают на веб-сайте Internet Archive (www.archive.org). Уровень индексирования означает, что вся коллекция, находящаяся в сетевом архиве, доступна для поиска, как это и требуется законом. Однако существует ясное ограничение на доступ – необходимо знать URL сайта, который вы ищете; кроме того, не существует непрерывности в документах архива из-за сайтов, которые со временем изменили свои сетевые адреса. Например, политическая партия UMP (Union pour un Mouvement Populaire) изменила свой веб-сайт с http://www.u-m-p.org/ на http://www.lemouvementpopulaire.fr/, и переход с одной версии на другую не будет точным без использования соответствующих средств в сетевом архиве. Невозможно также выполнять тематический поиск в архиве, не говоря уже о более сложном процессе обработки данных. Это также означает, что, по крайней мере в настоящее время, сетевые архивы доступны не через каталог BNF, а только через специальный интерфейс, отделённый от других поисковых инструментов библиотеки.

В Британской библиотеке и Национальной библиотеке Сингапура выполнили очень интересную работу по интегрированию сетевого архива в другие цифровые коллекции. Очевидно, это ещё одна ключевая область, которой нам предстоит заниматься в будущем, в том числе и для того, чтобы продемонстрировать ценность сетевых архивов для пользователя.

Вопросы и проблемы на будущее. Рассмотренные препятствия, по-видимому, могут ограничить доступ к архивам. И даже, если рамки закона разрешают индексирование, включая URL-индексирование как альтернативу обязательству создавать национальную библиографию, ясно: чтобы соответствовать духу обязательств и предоставлять учёным возможность анализировать сетевую культурную продукцию Франции, потребуется найти новые технологические решения, которые отвечали бы интересам ученых и характеру данных и позволили бы осуществлять обработку данных так же, как это делается в «живой» (не архивной) части Сети.

И опять же проблема организации международного сотрудничества возникает как императив. Если коллекции создаются в контексте международной кооперации, то даже когда сетевой доступ невозможен по юридическим причинам, может быть удастся создать системы, реализующие поиск по коллекциям многих стран или, по крайней мере, по документам, хранящимся в различных учреждениях. Это – предмет дискуссий с консорциумом IIPC. С точки зрения BNF, технологические разработки, позволяющие раскрывать содержание сетевых архивов методом поиска по каталогу, могут быть шагом в правильном направлении.

И наконец, природа электронных ресурсов, и в частности сетевых архивов, открывает возможность создания иных средств доступа, помимо традиционного «описания» ресурсов. Первым шагом в этом направлении будет реализация систем полнотекстового индексирования, хотя могут использоваться и другие инструменты, которые дают возможность более детальной обработки электронных материалов.

Проект LAWA (Longitudinal Analytics of Web Archive Data), поддержанный Европейской комиссией, посвящён изучению использования и прототипам средств глубокой обработки данных, которые могли бы позволить продвинуться дальше в этой области. Создание таких инструментов, которые обеспечивают манипуляцию огромными массивами данных посредством специфического программного обеспечения, до сих пор тесно связано с юридической ситуацией, касающейся доступа к этим ресурсам.

Условия доступа к документам, полученным по системе
обязательного депонирования электронных материалов

Обеспечение доступа и проблема защиты коллекции. Сегодня существуют три модели доступа к сетевым архивам: «тёмный» архив, когда материал собирается, но остаётся недоступным (по крайней мере, в течение периода эмбарго); «белый», или «открытый» архив, полностью доступный через Интернет; и «серый» архив – с предоставлением контролируемого доступа при выполнении определённых условий.

По французскому законодательству, материал, поступивший по системе ОЭ на электронные документы, доступен только как «серый» архив со строгим ограничением доступа к нему. Это создает проблему между очевидной потребностью обеспечить доступ к архивам, которые иначе окажутся бессмысленными, и законодательными ограничениями.

Одна из миссий BNF, записанная в Декрете о её основании, звучит так: «Предоставлять доступ к наибольшему числу коллекций за исключением секретных, установленных по закону, и на условиях, соответствующих законодательству по интеллектуальной собственности и обеспечению сохранности коллекции».

Это хорошо демонстрирует противоречия между необходимостью доступа, необходимостью сохранения коллекций, необходимостью уважать права интеллектуальной собственности наряду с защитой персональных данных. Однако в отличие от бумажных и других физических носителей, использование электронных ресурсов не содержит в себе риска их порчи, поскольку, как сказано выше, закон разрешает изготавливать копии специально для целей консервации, и система, установленная BNF, полностью отделяет копии для доступа читателей от копий для обеспечения сохранности.

Следовательно, особенно важным становится аспект прав интеллектуальной собственности. «Кодекс наследия» уточняет: электронные документы, поступившие по системе обязательного депонирования, могут изучаться «в помещениях библиотеки специально аккредитованными специалистами, работающими на индивидуальных рабочих местах, пользование которыми закреплено исключительно за ними». В Декрете это ограничение должно присутствовать, хотя в нём может содержаться разрешение на доступ ограниченному числу других библиотек, которые вместе с BNF несут ответственность за депонирование. В таком случае доступ из этих региональных библиотек также будет регулироваться требованием наличия индивидуальных рабочих мест и аккредитации специалистов.

Доступ к сетевым архивам предоставляется в научных читальных залах BNF. Эти помещения закреплены за исследователями, которые подтвердили необходимость их работы с такими коллекциями. (Подобные ограничения применяли при работе с традиционными депонированными материалами в основном из-за необходимости обеспечивать условия их сохранности. Для работы с сетевыми архивами существуют иные причины, объясняющие ограничения на доступ.)

Авторские права и интеллектуальная собственность. Важно ещё раз подчеркнуть, что Закон 2006 г. об обязательном экземпляре электронных документов и соответствующие статьи в «Кодексе наследия» создавались специально для обеспечения защиты авторских прав и интеллектуальной собственности в меняющем информационном обществе.

Это приводит к ситуации, которая может показаться парадоксальной: BNF в настоящее время собирает материалы, которые свободно доступны в Сети, но после сбора доступ к ним разрешается на очень жёстких условиях. Проще говоря, это предотвращает своего рода «соревнование» между архивными версиями сайта и «живым» веб-сайтом: если бы архивные материалы были доступны в Интернете и оказались проиндексированы поисковыми машинами, устаревшие версии веб-сайта теоретически могли бы оказаться выше, чем текущие версии. Даже и без этого авторы и создатели веб-сайтов предпочитают, чтобы люди пользовались «живым» сайтом, поскольку это позволяет отслеживать активность пользования, извлекать доход и т.д. Более того, если бы BNF начала собирать сайты, требующие оплаты, контроль за доступом стал бы ещё более важным, поскольку, без сомнения, библиотека не может давать открытый и бесплатный доступ к ресурсам, за который издатели требуют оплаты.

Право на частную жизнь, защита персональных данных и чувствительные материалы. Среди причин ограничения доступа – соблюдение права на частную жизнь и защита персональных данных. Закон 1978 г. «Об информационных технологиях, файлах и свободах» разрешает гражданам корректировать или уничтожать информацию о них, опубликованную на веб-сайте; за этим следит CNIL. Существование ОЭ означает, что более старые версии веб-сайта, содержащие какую-либо нежелательную информацию, все ещё будут доступны в архивах BNF. Как отмечено выше, CNIL признала, что BNF не обязана модифицировать или уничтожать такие материалы, хотя может принять решение о дополнительных ограничениях на доступ.

Подобные случаи возникают, если решением суда документ признан оскорбительным или незаконным.

Практическое значение для BNF. Ограничение на доступ, налагаемое законом, является первой реакцией, поскольку потенциально «чувствительный» материал де-факто защищён от публичного доступа и с ним можно знакомиться только в ходе научной работы или для других оправданных целей. CNIL в своих рекомендациях по Декрету счёл удовлетворительными меры, уже предпринятые BNF по аккредитации учёных, требующих доступа к определенным материалам. Однако этого может оказаться недостаточно для всех без исключения «чувствительных» ситуаций, для которых могут потребоваться и другие решения.

Предложенная BNF система, которую предстоит реализовать, – это система «ограниченного доступа», при котором отдельные материалы могут быть извлечены из архива, открытого для научных библиотек, после чего эти документы либо размещаются в недоступном «темном» архиве, либо доступ к ним открывается только по специальному требованию с определенными дополнительными разъяснениями. Подобная система уже существует применительно к печатным и другим материалам, и те же самые принципы могут быть использованы и для сетевых архивов.

BNF обязана ограничивать доступ, когда этого требует решение суда; она также обязана – согласно требованиям «Кодекса наследия» – ограничивать доступ к секретным материалам «в соответствии с установленным законодательством», в том числе военным. Кроме того, в очень редких случаях «чувствительный» или незаконный материал (например, публикация, возбуждающая расовую ненависть) недоступен, т.е. чтобы его получить, следует пройти специальную процедуру. Такая же процедура может потребоваться и в случае книг, содержание которых по судебному решению признано оскорбительным, и поэтому они изъяты из обращения.

Экземпляр, поступивший в BNF по системе ОЭ, не может быть уничтожен, поскольку он защищён статусом депозитарной коллекции, но система контролируемого доступа в подобных случаях защищает лицо, подвергшееся оскорблению, от распространения таких материалов. Во всех подобных случаях ограничение на доступ применяется только для строго определенных изданий с учётом гражданских прав и требований по защите права на частную жизнь, а также с учётом миссии BNF по обеспечению сохранности культурного наследия.

Вопрос о постоянном либо временном ограничении доступа, а также уточнение периода, по прошествии которого к документу может быть открыт доступ, должен решаться в каждом конкретном случае с возможной переоценкой критериев оправданности ограничения доступа.

Ещё одна проблема – право воспроизводить архивные материалы – регулируется Законом об интеллектуальной собственности так же, как и в случае с другими депозитарными коллекциями: любое воспроизведение строго ограничено – потенциальные проблемы при копировании электронных ресурсов оказываются намного большими именно потому, что намного легче делать идентичные копии.

В настоящее время копирование ограничено изготовлением распечаток с экрана; копирование в файл запрещено так же, как и копирование других файлов (в том числе изображений, документов в формате PDF или другом, HTML, программ и т.д.). «Кодекс наследия» разрешает копирование исключительно в целях обеспечения сохранности коллекции; следовательно, разрешается копирование файлов, находящихся на серверах хранения, на компьютере, которым пользуются читатели библиотеки (как и сбор документов, сама идея «копирования» становится проблематичной, поскольку любое использование электронных сетевых ресурсов включает в себя копирование файлов), но не разрешается изготовление более «постоянных» копий.

Разрабатываемый Декрет должен также внести большую ясность в эту проблему. Похоже, что доступ будет открыт только с использованием «интерфейсов для доступа, поиска и обработки документов, предоставляемых BNF, INA и иными учреждениями». Это важное ограничение на обработку архивных данных – серьёзная проблема при обращении учёных к архивам.

Открытые вопросы и проблемы на будущее.В настоящее время существует двойное ограничение на доступ к архивам, препятствующее их использованию: юридические ограничения, требующие контроля за доступом, и технические, возникающие из-за отсутствия полнотекстового поиска и иных инструментов доступа и работы с архивами.

Сегодня доступ разрешается только в научных читальных залах BNF. Чтобы улучшить обслуживание пользователей, готовящийся Декрет должен разрешить контролируемый доступ ограниченного количества региональных библиотек, которые участвуют в отборе сайтов. Для реализации преимуществ такого подхода потребуются новые инструменты и новые способы использования архивных материалов. Уже предлагаются варианты использования, которые предоставят возможности для более глубокой работы исследователей, снятия копии сайта по запросу самих создателей.

Если говорить об учёных, то запрет даже на использование скриншотов ограничивает их обращение к архивам для научной работы. Можно представить определённые исключения для использования в научных целях небольшой части архивированного сайта, хотя достаточно трудно понять, как это может «вписаться» в законодательство, которое запрещает любое копирование депонированных электронных документов вне помещений BNF или других аккредитованных учреждений.

Более серьёзный вопрос возникает относительно возможности для учёных анализировать архив в целом. Как отмечено выше, Декрет определяет, что любой доступ к архивам BNF должен осуществляться через интерфейсы, предоставляемые библиотекой. Исследователи, работающие с Сетью, а значит и с сетевыми архивами, нуждаются в инструментах, которые позволят им производить поиск не только в архивах (как позволяет это делать, например, полнотекстовое индексирование), но и в технологиях глубокой обработки данных, что означает более творческое использование коллекции. Это может включать инструменты по построению диаграмм, использование определенных терминов, трендов в разрезе различных веб-сайтов либо анализ связи между сайтами и динамику во времени. Различные научные центры уже работают с подобными инструментами, однако законодательные ограничения не разрешают им копировать данные, находящиеся в библиотеке, с целью их обработки подобными инструментами либо устанавливать подобные программы в BNF, чтобы проводить анализ архивов на месте. Следовательно, BNF должна рассмотреть способы обеспечения доступности этих инструментов для учёных и, в частности, разрешать использование определённого программного обеспечения. Несомненно, партнёрство с университетами и научными центрами в этой сфере будет очень важным, и BNF уже приступила к реализации кооперативного проекта Medialab at Sciences Po для изучения подобных вопросов.

Недавно мы столкнулись с ещё одной ситуацией, однако аналогичные ей будут без сомнения происходить чаще по мере роста известности сетевых архивов и увеличения объёма документов, исчезнувших из «живой» Сети, – это случаи, когда создатель веб-сайтов или автор хотел бы восстановить материал, которого уже нет в Сети и копии которого у них нет.

Строго говоря, закон запрещает любое копирование документов, поступивших по системе обязательного депонирования, за исключением копирования в целях формирования коллекций, обеспечения их сохранности и работы с ними библиотеки. Однако, как отмечено выше, главная цель – защита интеллектуальной собственности правообладателей. В случае, когда сам правообладатель запрашивает материал, для него можно было бы сделать исключение. Конкретные способы удовлетворения таких требований ещё предстоит определить.

Важно также отметить, что технические процедуры, позволяющие извлекать все относящиеся к веб-сайту файлы, полученные в определённый период времени, пока ещё не разработаны. Программа SPAR должна помочь в решении этого вопроса, но потребуются и другие технические меры.

И наконец, в BNF уже поступило несколько требований на копирование сетевых архивов в связи с рассмотрением дел в судах. Нужно доказать присутствие материалов в Сети на определённый момент. (Такого рода свидетельства могут потребоваться при решении вопросов интеллектуальной собственности или при обсуждении условий продаж при сетевой торговле.) BNF, обладающая статусом учреждения национального уровня, должна иметь возможность сыграть свою роль в качестве доверенного третьего лица, поскольку она располагает такого рода материалами. Использование коллекций с метаданными, отображающими каждый файл, может служить доказательством, что файл находится в Сети в точный день и час, когда он был собран. Однако это ставит некоторые проблемы в том, что касается точного описания условий, при соблюдении которых можно воспользоваться исключением на запрет копирования депонированных материалов. Нужно изучить проблему глубже, чтобы определить, какие условия можно считать достаточными для оправдания исключения в законе. Если такое исключение будет найдено, BNF понадобится получить технические средства, необходимые для производства «авторизованной» копии файла с точными разметками даты сбора и провенансом материала. Такой вид использования сетевых архивов ещё предстоит опробовать. Однако если будут созданы прецеденты, подобные запросы будут поступать всё чаще.

Последний пример демонстрирует важность обеспечения в идеале депонирования французской сети с широким охватом, как это реализуется в BNF. Невозможно предсказать заранее, какие именно сайты могут оказаться важными или востребованными через несколько лет. Следовательно, необходимо собирать как можно больше, поскольку значимость коллекции электронных депонированных документов может проявиться только в будущем.

Заключение

Система обязательного экземпляра на электронные документы существует во Франции всего лишь несколько лет, но она уже нашла своё место как часть базовой функции BNF. Начиная с первых экспериментов в 2002 г., BNF сформировала систему архивирования сетевых документов, включающую необходимые технические комплексы, создала соответствующие подразделения с привлечением опытных специалистов по работе с цифровыми массивами, ИКТ, индексации, а также правоведов. Для всего этого, конечно, требуется сильная поддержка со стороны руководства библиотеки. В настоящее время BNF располагает надежной, гибкой и эффективной технологией сетевого архивирования, обеспечивающей сохранность материалов, опубликованных во французской части Сети: эти материалы найдут своё место в коллекциях культурного наследия, создаваемых в рамках Закона об обязательном экземпляре.

В ближайшее время важным шагом станет публикация Декрета: в нём будет четко прописана юридическая основа депонирования и создана возможность для библиотеки продвигаться в реализации важных проектов улучшения качества коллекций, платных публикаций и, возможно, расширения доступа учёным через региональные библиотеки.

Как основатель в 2003 г. консорциума IIPC и (в течение длительного времени) член его исполнительного комитета, BNF проявляет активность в международном сообществе при работе над этими и многими другими проблемами. Международная кооперация, как техническая, так и организационная, будет и впредь занимать центральное место в разработке системы депонирования электронных документов.

Формирование коллекции международными усилиями, обсуждение со специалистами, сравнительный анализ, стандартизация наряду с обменом технологиями, специалистами и накопленным опытом – всё это является неоценимым достоянием и создаёт для BNF уникальную возможность реализовать программу архивирования сетевых документов за последние десять лет. Поскольку архивирование Сети (по самой её природе) – это проблема мирового масштаба, международное сотрудничество останется фундаментом изучения и решения многих стоящих перед нами проблем.

Приложение

Законодательные документы, регулирующие систему
обязательного экземпляра электронных документов во Франции:

Code du patrimoine [Cultural heritage code]: title 3, legal deposit
http://www.legifrance.gouv.fr/affichCode.do?idArticle=LEGIARTI000006845515&idSection
TA=LEGISCTA000006159934&cidTexte=LEGITEXT000006074236&dateTexte=20110517
(consulted 17 May 2011)

Loi n°2006–961 du 1 août 2006 relative au droit d'auteur et aux droits voisins dans la société
de l'information [Law on Authors’ Rights and Related Rights in the Information Society]
http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006054152&dateTexte
=20110520 (consulted 20 May 2011)

Code de la propriété intellectuelle [Intellectual Property Code]
http://www.legifrance.gouv.fr/affichCode.do?cidTexte=LEGITEXT000006069414&dateTexte
=20110520 (in French); consulted 20 May 2011

Code général de la propriété des personnes publiques [Code of public property]
http://www.legifrance.gouv.fr/affichCode.do?cidTexte=LEGITEXT000006070299&dateTexte
=20110520 (consulted 20 May 2011)

Loi n°78–17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés.
[Law on information technology, files and freedoms]
http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006068624&dateTexte
=20110520 (consulted 20 May 2011)

Décret n°94–3 du 3 janvier 1994 portant création de la Bibliothèque nationale de France
[Decree creating the Bibliothèque nationale de France]
http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006082797&dateTexte
=20110520 (consulted 20 May 2011)

Décret n°93–1429 du 31 décembre 1993 relatif au dépôt légal [Decree regarding legal deposit]
http://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006082758&dateTexte
=20110520 (consulted 20 May 2011)

Отдельные законы, принятые в других странах

США:

Copyright Law of the United States of America and Related Laws Contained in Title 17 of
the United States Code; Chapter 4: Copyright Notice, Deposit, and Registration.
http://www.copyright.gov/title17/92chap4.html (consulted 20 May 2011)

Великобритания:

Legal Deposit Libraries Act 2003
http://www.legislation.gov.uk/ukpga/2003/28/contents (consulted 30 May 2011)

Учреждения, отвечающие за депонирование во Франции

BnF: http://www.bnf.fr/en/professionals/digital_legal_deposit/a.digital_legal_deposit_web_
archiving.html (consulted 20 May 2011)

INA: http://www.ina-entreprise.com/entreprise/activites/depot-legal-radio-tele/depot-legal
web.html (consulted 20 May 2011)

Иные депонирующие организации (без законодательной поддержки):

Internet Memory Foundation. http://internetmemory.org/en/ (consulted 20 May 2011)

Sciences Po, Médialab. http://www.medialab.sciences-po.fr/index.php?page=home
(consulted 20 May 2011)

Другие источники:

AFNIC. French Domain Name Industry Report 2010.
http://www.afnic.fr/data/actu/public/2010/afnic-french-domain-name-report-2010.pdf
(consulted 20 May 2011)

Bermes, Emmanuelle; Fauduet, Louise; Peyrard, Sébastien. A data first approach to digital preservation: the SPAR project. In: World Library and Information Congress: 76th Ifla GeneralConference And Assembly (IFLA 76), 10–15 August 2010, Gothenburg, Sweden.
http://www.ifla.org/files/hq/papers/ifla76/157-bermes-en.pdf (consulted 20 May 2011)

Bleicher, Ariel. “A Memory of Webs past”. In: IEEE Spectrum, Mars 2011.
http://spectrum.ieee.org/telecom/internet/a-memory-of-webs-past/0 (consulted 30 May 2011)

BnF. Preservation of digital material: the SPAR project.
http://www.bnf.fr/en/professionals/preservation_spar/s.preservation_SPAR_presentation.html
(consulted 20 May 2011)

Department for Culture, Media and Sport, “Legal Deposit”.
http://www.culture.gov.uk/what_we_do/libraries/3409.aspx (consulted 30 May 2011)

Huchet, Bernard; Illien, Gildas; Oury, Clément. Le temps des moissons. Le dépôt légal du

Web: vers la construction d’un patrimoine cooperative. In: Revue de l’Association des Bibliothécaires de France, 2010, n° 52, pp. 28–31 International Internet Preservation Consortium. http://www.netpreserve.org/about/index.php
(consulted 20 May 2011)

Internet Archive. http://www.archive.org/ (consulted 20 May 2011)

Internet Archive. Arc File Format.
http://www.archive.org/web/researcher/ArcFileFormat.php (consulted 20 May 2011)

Internet Archive. Heritrix. http://crawler.archive.org/ (consulted 20 May 2011)

ISO. Open archival information system: Reference model (ISO 14721:2003).
http://www.iso.org/iso/iso_catalogue/catalogue_tc/catalogue_detail.htm?csnumber=24683
(consulted 30 May 2011)

Library of Congress. Web Archiving. http://www.loc.gov/webarchiving/index.html
(consulted 30 May 2011)

Netarchive.dk. NetarchiveSuite. http://netarchive.dk/suite/Welcome (consulted 20 May 2011)

UK Web Archive. http://www.webarchive.org.uk/ukwa/ (consulted 30 May 2011)

UK Web Archive, “Legislative Status”.
http://www.webarchive.org.uk/ukwa/info/about#legislative_status (consulted 30 May 2011)

  
На главную