Home page | Каталоги и базы данных

Научные и технические библиотеки


 

Вислый А.И.
Российская государственная библиотека,
Москва

Электронные библиотеки России.
Проблемы формирования и использования

«Куда идем мы с Пятачком? Большой-большой секрет!». Насчет «большого секрета» – это, конечно, преувеличение. Но вот насчет понимания… Попробую изложить свою точку зрения.

Во-первых, сразу ограничу область обсуждения. Оцифрованные звукозаписи, фильмы и прочее пусть пока останутся в стороне. Постараемся разобраться с полными текстами книг. И только. В рамках данного доклада будем понимать под электронной библиотекой собрание оцифрованных полных текстов уже существующих и выпущенных в свет книг.

Во-вторых, выделим в отдельную область само производство полных текстов. Будем называть необходимый для этого комплекс работ электронным издательством; соответственно, компанию, торгующую полными текстами, – электронным книжным магазином.

В-третьих, под традиционной библиотекой будем понимать собственно библиотеку.

Теперь о текущей ситуации. Что мы видим, попав в Интернет? Например, по адресу http://www.lib.ru  – библиотеку Машкова: около 30 тыс. полных текстов книг. Ни одна традиционная библиотека России ничем подобным похвастаться не может. Разве что «зеркало» себе сделает. Да и в зарубежном мире не очень-то… Откуда все это у Машкова? Ответ достаточно прост. Планшетный сканер стоит копейки. «Софт» для распознавания – в России даром. Дальше – энтузиазм и полное незнание законов об авторском праве, и вот – Стругацкие. Полностью. Разные люди по всей стране сканируют, распознают и присылают в библиотеку Машкова электронные тексты книг. Он их собирает и выставляет в Интернет. Бесплатно! И что? То ли памятник ему за это ставить, то ли в тюрьму сажать? Впрочем, альтернатива для России вполне обычная.

Попробуем разобраться с рядом вопросов.

  1. В какой мере традиционные библиотеки должны сами заниматься сканированием книг и других документов из собственных фондов, т.е. выполнять функции электронного издательства?

  2. Что и в каком порядке сканировать?

  3. Что традиционные библиотеки должны (или не должны) делать с уже существующими полными текстами книг в электронном виде?

  4. Какие из уже существующих полных текстов традиционные библиотеки должны брать в свои фонды?

  5. И что в конце концов делать с авторским правом, когда это касается Интернета?

Начнем с последнего вопроса. По моему мнению, действующий закон «Об авторском праве и смежных правах» дает все необходимые ответы на спорные вопросы об оцифровке и «выставлении» в Интернет разного рода произведений. Я, конечно, не юрист, но формулировки статей закона вполне однозначны и редко допускают различное толкование. Другое дело, что закон отстаивает права автора произведения и не слишком заботится о пользователях Интернета. А кто сказал, что о них надо заботиться особо?

Начнем с понятия оцифровки (сканирования, распознавания и т.п.). С точки зрения закона этот процесс называется воспроизведением. «Воспроизведение произведения – изготовление одного или более экземпляров произведения или его части в любой материальной форме, в том числе в форме звуко– и видеозаписи, изготовление в трех измерениях одного или более экземпляров двухмерного произведения и в двух измерениях – одного или более экземпляров трехмерного произведения; запись произведения в память ЭВМ также является воспроизведением».

Хорошо. Все предельно ясно. теперь о том, что можно и чего нельзя делать.

Прежде всего: «Исключительные права автора на использование произведения означают право осуществлять или разрешать следующие действия: воспроизводить произведение (право на воспроизведение) …», т.е. нельзя заниматься воспроизведением произведения без разрешения автора! Никому. Включая библиотеки! Это по закону. Есть исключения, предусмотренные в том же законе, но при внимательном рассмотрении ни одно из них не касается обсуждаемых здесь проблем. Например, распространенное заблуждение, что библиотека в целях сохранности что-то все же может, основано на следующей формулировке: «Допускается без согласия автора и без выплаты авторского вознаграждения, но с обязательным указанием имени автора, произведение которого используется, и источника заимствования репродуцирование в единичном экземпляре без извлечения прибыли: правомерно опубликованного произведения библиотеками и архивами для восстановления, замены утраченных или испорченных экземпляров, предоставления экземпляров произведения другим библиотекам, утратившим по каким-либо причинам произведения из своих фондов…». Но: «Репродуцирование (репрографическое воспроизведение) – факсимильное воспроизведение в любых размере и форме одного или более экземпляров оригиналов или копий письменных и других графических произведений путем фотокопирования или с помощью других технических средств, иных, чем издание; репрографическое воспроизведение не включает в себя хранение или воспроизведение указанных копий в электронной (включая цифровую), оптической или иной машиночитаемой форме».

Итак, произведения, защищенные авторским правом, нельзя сканировать, распознавать и «выставлять» в Интернет! И просто сканировать нельзя. Разве только для личных нужд (см. ст. 18 закона). Следовательно, нарушаем. Впрочем, ничего нового в этом нет.

В принципе каждого сканировщика произведения, размещенного в какой-либо из электронных библиотек? можно привлечь к уголовной (именно так) ответственности. А также и самих держателей электронных библиотек. Первых – за незаконное воспроизведение, вторых – за незаконное опубликование. Но пока ситуация развивается по анекдоту: «Вон скачет неуловимый Джо!». «А что, он и вправду такой неуловимый?». «Да нет! Поймать его можно, вот только кому он нужен?».

Тем самым электронные библиотеки растут. Авторы молчат, а пользователи Интернета потихоньку радуются и на дармовой бумаге (за счет предприятий) печатают себе интересующие книги. Идиллия. Ответ на вопрос: «А почему молчат авторы?» – в общем-то, ясен. Пока на их гонорарах опубликование произведений в Интернете никак не сказывается. Разве что лишняя реклама.

Долго ли такая ситуация продлится? Думаю – еще лет пять. По крайней мере до момента становления серьезных электронных издательств и электронных книжных магазинов. При появлении компаний, осуществляющих продажу полных текстов книг через Интернет, идиллия испарится. Кого-то посадят, кого-то припугнут и за каждый полный текст придется платить. Думаю, что на уровне стоимости книги на полке магазина, но платить обязательно.

Существует ли вариант «чистого» сканирования (воспроиз-ведения)? Вроде бы да. Произведения, на которые срок авторского права, т.е. 50 лет после смерти автора, исчерпан. Не так уж и мало. Но не очень интересно. Да и тут имеются вопросы. А в чьей собственности находится текст «Евгения Онегина»? Вот я его отсканировал и продал. Не должен ли я чего нашему государству, точнее Мингосимуществу? Ответа на этот вопрос нет. Возникает и чисто юридическая казуистика: например, если книга иностранного автора хранится в фонде российской библиотеки и срок действия авторского права по российским законам истек, а по законам страны этого автора еще нет – можно сканировать или нельзя? Ответа я также не знаю.

В любом случае сканировать можно те произведения, на которые срок действия авторского права закончился и, конечно же, те произведения, на сканирование которых имеется прямое разрешение автора. Это касается и библиотек.

Теперь о традиционных библиотеках. Ни одна из них «в упор не замечает» ту же электронную библиотеку Машкова. Прежде всего в силу консервативности.

Но вот проблема. Скажем, полный текст «Мастера и Маргариты» в Интернете есть. В библиотеке (в электронном виде) его нет. А должен быть или нет? Как насчет миссии библиотеки – собирать, хранить, предоставлять доступ? Значит, должен быть! И сразу цепочка вопросов:

  1. Имеет ли право библиотека переписать из Интернета полный текст книги, если он там уже имеется в свободном доступе?

  2. Как предусмотреть в расходах библиотеки закупку необходимого оборудования и оплату персонала для вечного (ни много, ни мало) хранения этого полного текста?

  3. Что брать и что не брать из Интернета (или CD–ROM) в фонд библиотеки для того же вечного хранения?

  4. Как обеспечить вечное хранение этого текста в условиях быстро меняющегося компьютерного оборудования и форматов записи информации?

  5. На каких основаниях и каким образом осуществлять обслуживание читателей?

Это цепочка вопросов, на которые рано или поздно придется отвечать. А вторая причина, по которой традиционные библиотеки не замечают библиотеки электронные – «сложно все это». Сказав один раз: «Да, это дело библиотеки», придется нести постоянные и все возрастающие расходы. А в традиционных библиотеках денег традиционно нет. Поэтому большинство библиотек идет по более простому пути. Сначала определяется некая стратегия: что в первую очередь сканировать, что во вторую и т.д. Затем запускается сам процесс сканирования. Вполне неспешный. Несколько сот книг в год. При таком объеме перечисленные выше вопросы не стоят так остро. На первые несколько лет хватает нескольких компьютеров, а что дальше – там будет видно.

Сразу оговорюсь – ничего плохого в таком подходе нет (если, конечно, при этом не нарушен закон). Но нужно четкое и ясное понимание того, что при таком подходе библиотека выполняет функции электронного издательства, а не свои непосредственные задачи. И отговорки насчет сохранности не принимаются. Из-за малых объемов сканирование не решает никаких задач обеспечения физической сохранности фонда. Если нужно обеспечить сохранность хотя бы ста тысяч книг, а в год сканируется сто, то и говорить об этом не стоит.

Вернемся теперь к первому вопросу: «В какой мере традиционные библиотеки должны сами заниматься сканированием книг и других документов из собственных фондов?».

Мне кажется, что ответ на этот вопрос относится к разряду чисто прагматичных. Удалось найти заказчика, инвестиции, гранты на оцифровку какой-либо коллекции документов – «вперед и с песней». Есть обоснованная уверенность, что получившаяся коллекция будет пользоваться спросом и по крайней мере покроет затраты на ее создание – тоже неплохо. Все остальные мотивы роли не играют. Что же касается сканирования для обеспечения сохранности фондов или для создания «национального информационного ресурса», то бюджетное финансирование этого процесса появится, когда в государственные придет понимание того, что это – элемент национальной политики. По сути дела появится заказчик – государство. Пока такого понимания нет. Безусловно, необходимо заниматься формированием этого понимания на всех уровнях – от «проталкивания» отдельных проектов до разработки национальной программы.

Следующий вопрос – «что и в каком порядке сканировать?», если библиотека решила этим заняться. Мне кажется, ответ на этот вопрос вытекает из ответа на предыдущий вопрос. Раз уж заказчик, инвестор, грантодатель платит деньги, то вопрос «что сканировать?» решается только в процессе переговоров. По своему опыту знаю – приемлемые решения всегда можно найти. Они могут быть далеко не простыми. Например, вариант: «Мы отдаем для сканирования некоторую коллекцию партитур, а вы делаете нам электронный каталог всех нотных изданий». В этом варианте библиотека, конечно же, не решает вопроса оцифровки редких книг, но получает нужную ей часть электронного каталога. Другой пример: библиотека обладает потрясающей коллекцией фотографий по истории железнодорожного транспорта и уверена, что в оцифрованном виде она будет приобретена рядом зарубежных музеев за хорошие деньги. Почему бы не отсканировать?

Предвижу вопросы. А как же фонд редких книг и рукописей? Нет ни инвесторов, ни потенциальных покупателей. Читателям физический экземпляр давать нельзя, разваливается. Они же, бедные, страдают. Пусть страдают дальше, а заодно участвуют в формировании государственной политики в области оцифровки наиболее ценных коллекций. Жалобами и предложениями в Министерство культуры, например.

Самый интересный вопрос: «Что традиционные библиотеки должны (или не должны) делать с уже существующими полными текстами книг в электронном виде?» Текстов много, практически все в свободном доступе.

Общий объем полных текстов книг – приблизительно 40 тыс. наименований. Некоторые дублируют друг друга. Это не значит, что тексты сканировались дважды. Просто держатели библиотек их копировали. Но в любом случае общий объем близок к объему книг, издаваемых в России в течение года.

Я считаю, что библиотеки национального уровня ответственны за решение задачи по отбору полных текстов книг в Интернет, переписыванию их на свои серверы, организацию вечного хранения и обеспечению доступа читателей. Должны ли библиотеки национального уровня разделить поток полных текстов между собой, или этим должна заниматься какая-то одна из них – это вопрос второй. Важно, что нельзя допустить, чтобы этим занималась организация не из библиотечного мира, «Информ-ресурс» например. Попробую обосновать свою точку зрения.

Прежде всего, библиотека есть библиотека вне зависимости от того, на каком носителе опубликовано произведение. Технология хранения и «чтения» (в широком смысле), конечно, зависит от физической формы произведения. Микрофиши и хранить, и читать нужно не так, как обычные книги. Но это не играет никакой существенной роли. Главное, что библиотеки владеют налаженной технологией хранения и обеспечения доступа к гигантским объемам информации. В любой другой организации эту технологию придется создавать заново. И в результате все равно получится библиотека. Чтобы хорошо это понять, достаточно почитать переписку нынешних держателей электронных библиотек. Сегодня они стоят перед решением типично библиотечного вопроса: «Как наладить каталогизацию электронных фондов?».

Цитирую со странички http://www.lib.ru/COMPULIB/libtezisy.txt : «Архив должен быть полнотекстовым. Несколько альтернативных тезаурусов (например – авторы по алфавиту, книги по тематике, книги по годам). Внутри должно быть единое хранение с простой монтабельной системой управления, при каждой книге хранить несколько ключевых атрибутов: автор/название/год издания/тематика/подтематика/переводчик/УДК/место в хранилище. Тезаурусы строить «автоматом» по текущему содержимому. Поиск по атрибутам (автор/название/год издания/тематика/…) – обязательно. Кстати, тезаурусы можно строить на том же движке, что и поиск. Ибо что такое алфавитный каталог? Это поиск по шаблону «все». Тематический каталог? Это сортировка не по автору, а по теме и только потом – по автору. И т.д.».

Все предельно ясно. Абсолютно те же вопросы, что при создании карточного или электронного каталога традиционной библиотеки.

Во-вторых, надежды на то, что Интернет в целом заменит систему традиционных библиотек, иллюзорны. Наиболее вероятный сценарий развития событий такой: библиотеки со своими информационными ресурсами «встроются» в общую инфраструктуру и займут там свое традиционное место как хранители больших объемов информации. Основная задача традиционной библиотеки в сфере ее области ответственности какой была, такой и останется: каталогизация как традиционных изданий, так и электронных ресурсов.

Несколько слов о каталогизации. Не для библиотекарей, а для тех, кто только начал этим заниматься. Под каталогизацией понимается процесс описания издания. Он состоит из четырех этапов.

  1. Составление библиографического описания. Авторы и многое другое, что принято называть авторами, заглавие, место и дата издания, издатель и прочее, прочее, прочее. Всего в зависимости от типа издания атрибутов – с тысячу.

  2. Систематизация. Это присвоение изданию одного или нескольких систематических индексов. Наиболее распространенные в России системы индексации: УДК, ББК, ГРНТИ, ДДК.

  3. Предметизация. Осмысленное присвоение изданию предметных рубрик и/или ключевых слов. Например, рубрики «Аттракторы» для изданий, посвященных вопросам устойчивости решений некоторых уравнений механики сплошной среды.

  4. Шифрование. По сути дела присвоение кода, по которому издание можно найти на полке или в Интернете (URL, если угодно).

Именно каталогизацию традиционные библиотеки могут делать профессионально. (Иногда настолько профессионально, что в карточных каталогах ничего не найдешь.) А главное, в традиционных библиотеках для этого имеются люди и какие-никакие деньги.

Теперь для библиотекарей. По поводу составления библиографического описания. В последнее время наметилась дискуссия: «А не использовать ли Dublin Core для каталогизации электронных документов?». Вопрос принципиальный. Суть его в следующем. Например опять-таки «Мастер и Маргарита»: есть и книга на полке, и полный текст на сервере. Нужна запись в электронном каталоге. На саму книгу в электронном каталоге есть запись в формате MARC (РУСМАРК или MARC21 – не очень важно). И что же на электронную версию – Dublin Core? Не понял! Для непрофессионалов: в Dublin Core атрибутов записи – пятнадцать, в формате MARC – больше тысячи. С моей точки зрения, каталогизацию электронных изданий в библиотеке надо производить по тем же правилам, что и изданий в бумажной форме. Значит, в формате MARC. Лишняя нагрузка? Да. Но все равно не иначе.

Последний вопрос: «Какие из уже существующих полных текстов в электронной форме традиционные библиотеки должны брать в свои фонды?». По моему мнению, это вопрос для нескольких отдельных статей. Но на первом этапе – этапе накопления электронных ресурсов хочется предложить очень простой принцип: собирать все полные тексты тех произведений, которые уже есть в фонде как обычные книги.

И наконец, а нужно ли библиотеке вообще собирать полные тексты? Они присутствуют где-то в Интернете, дал ссылку из своего электронного каталога и достаточно. В общем-то, да! Для кого угодно другого, но не для библиотеки. Нельзя нарушать основное правило. Если имеется запись в каталоге, то должно быть и само произведение. А ссылка (линк) в Интернете – вещь временная. Сегодня есть, а завтра нет. По разным причинам. Это опять-таки к вопросу о технологии библиотечной работы, в частности технологии обеспечения сохранности. Вопрос отдельный и чисто библиотечный.

Резюме. Настало время для активного обсуждения как вопроса создания электронных библиотек внутри традиционных, так и диалога между библиотекарями и держателями электронных библиотек в Интернете.


Copyright © 1995-2002 ГПНТБ России