Часть I. Информационные
и технологические ресурсы ГПНТБ
России*
По данным Минсвязи РФ на начало
2003 г. Интернетом в России регулярно
пользуются около 6 млн. человек (т.е. всего
лишь 4% населения страны), но разговоров об
этой относительно новой технологии
необычайно и несоразмерно много.
Несоразмерно – потому что, например, очень
новая, очень близкая Интернету технология
мобильной телефонии (а к мобильным
телефонам, по тем же данным, в России уже
подключены 18 млн. владельцев) развивается
намного быстрее и без всяких песнопений:
заплатил деньги, купил контракт и аппарат
по вкусу и по возможностям – и говори
сколько хочешь! Быть может, дело в том, что
мобильный телефон – устройство скорее
личного пользования, предназначенное для
передачи в первую очередь ваших личных
сведений и поручений, а Интернет законно
вторгается в сферу общественных отношений,
создавая вокруг себя и в себе колоссальные
информационные ресурсы. Именно поэтому
Интернет – благородная и благодатная тема
для профессиональных или светских
рассуждений, и авторы данной статьи вполне
следуют сложившейся практике.
Рост
Интернет-активности в России хорошо
иллюстрируется показателями работы
сервера ВИНИТИ, крупнейшей в России
организации по обработке научно-технической
информации (рис. 1).
Рис.
1. Нагрузка на сервер ВИНИТИ в 1995–2001 гг.
(из
национального доклада «Информационные
ресурсы России»
на сервере www.inforeg.ru).
Что публикуется. В национальном
докладе «Информационные ресурсы России»
за 2001 г. отмечается: «Основная часть
информационных ресурсов (по ряду оценок не
менее 90%), создающихся на предприятиях, в
организациях и органах управления,
используется исключительно или в основном
для обеспечения их собственной
деятельности.
Информационные ресурсы,
создаваемые для предоставления
информационных продуктов и услуг
неопределенному заранее множеству
потребителей, условно можно назвать
ресурсами «массового» использования. Они
составляют не более 5% общего количества
информационных массивов, фондов, баз данных
и т.д.».
Эти оценки подтверждаются и
другими источниками. Например, по данным г-жи
Клэр Харт, президента аналитической
компании Factiva, созданной совместно
компаниями Dow
Jones
и Reuter,
ежегодно в мире производится 25 терабайт
газетной, 10 терабайт журнальной (примерно 1 млн. годовых комплектов научных журналов), 2
терабайта книжной информации (считая, что в
2000 г. выпущены 1 млн. 300 тыс. книг), 195 терабайт внутриофисной
документации!
Итак, использование электронных
ресурсов растет быстрыми темпами, а в
составе производимой информации 84%
приходится на технологическую
документацию и управленческую переписку.
Цель нашей
работы – понять, как удаленные
пользователи используют сетевые материалы
ГПНТБ России, что привлекает их на веб-сайт
крупной научно-технической библиотеки, с
какими материалами они предпочитают
работать?
Методика.
Прямых опросов посетителей веб-сайта мы не
проводили, поэтому пришлось прибегнуть к
косвенным методикам, сравнивая поведение
читателей, пришедших в библиотеку, и
статистику работы ее веб-сайта. Авторы
благодарят сотрудников ГПНТБ России А.И.
Бродовского, С.М. Дунаевскую, Е.А. Еронину и М.В.
Залужскую за представленные
статистические данные. Период сбора
статистики: 15.12.02–15.01.03. Предыдущие выборки
показали сходные результаты.
Сложности такого рода
исследований понятны:
содержание документов веб-сайта
и основного фонда неоднородно;
методические возможности
мониторинга неодинаковы: для печатных
изданий – учет требований; в локальной сети
– запрос документа; в сетевой работе –
обращения к веб-сайту (hits,
visitor, sessions);
отношение разных субъектов к
различным объектам дается в сравнении, но
нет оснований говорить о каком-либо
совпадении массивов читателей библиотеки и
посетителей веб-сайта – вполне возможно,
что это совершенно разные люди (данное
предположение подтверждено
экспериментально).
Информационные
и технологические ресурсы ГПНТБ России. В
печатных фондах и микроформах ГПНТБ России
– около 8 млн. документов, из них (в тыс. экз.):
книги
2 000
периодика
3 800
микроформы
1 600
неопубликованные переводы
300
электронные ресурсы
6,2
Если вести учет в традиционных
показателях, то электронные офлайновые
публикации составляют менее одной тысячной
от общего фонда. Несколько иная картина
получается, если используется статистика с
учетом объема информации, которая может
быть предоставлена посетителю библиотеки в
терабайтах:
книги
2
периодические и другие
издания
3
офлайновые электронные
ресурсы
0,6(около 10%
от общего
количества)
Как видим, при использовании
различных методик расхождение подсчета
примерно в 100 раз.
На февраль 2003 г. в ГПНТБ России
имелись 358 персональных компьютеров, из них
324 – в локальной сети, 83 – предоставлены
читателям, при этом 45 – имеют доступ в
Интернет, в том числе 30 – в Интернет-клубе.
Во время проведения эксперимента
библиотека оплачивала выход в Интернет
пропускной способностью 512 кб/с.
Что читали в России в 2001 г.? Для
ответа воспользуемся анализом А.М.
Ильницкого («Книгоиздание в контексте
социально-экономических преобразований в
современной России». М.: Вагриус, 2002), где
указаны виды литературы и спрос на них
читательской аудитории в процентах к
общему количеству опрошенных (допускалось
назвать несколько видов литературы,
поэтому итог превышает 100%):
детективы
31
профессиональная
литература
22
учебники
20
детская
литература
19
словари,
справочники
14
любовные
романы
12
энциклопедии
11
книги
рецептов, советы хозяйке
11
фантастика
8
сказки
8
зарубежная
поэзия
1,5
К каким материалам чаще обращаются
наши читатели? Рассмотрим тематический
состав фонда ГПНТБ России, отраженного в
электронном каталоге (табл. 1).
Обратим внимание на очень
интересный показатель, в какой-то мере
характеризующий интенсивность спроса по
данной тематике и «запас» по
комплектованию фонда – отношение
количества отраженных в ЭК наименований
литературы к числу выдач, прошедших через
систему ЭК; назовем его коэффициент
полноты фонда. В данной выборке этот
показатель меняется достаточно хаотично:
от 5,5 (экономика и экономические науки) до 37 (физика).
В принципе это означает, что у читателя
всегда имеется определенный выбор внутри
данной тематики.
Таблица 1
Тематика книг, отраженных в ЭК ГПНТБ
России (первые
по численности 11 тематических рубрик ГРНТИ),
и число выдач книг по данной тематике через
систему ЭК ГПНТБ России за апрель – декабрь 2002 г.
Рубрика ГРНТИ
Число
записей
в ЭК
Число
выдач
книг
в ЭК
№
Название
06
Экономика,
экономические науки
26
819
4
919
29
Физика
20
511
553
55
Машиностроение
18
691
2
043
50
Автоматика
и телемеханика,
вычислительная техника
15
333
1
064
27
Математика
9
605
560
47
Электроника,
радиотехника
9
201
716
38
Геология
8
970
435
67
Строительство,
архитектура
8
748
861
31
Химия
7
274
516
10
Государство
и право, юридические науки
6
319
423
87
Охрана
окружающей среды, экология человека
6
092
1
400
Поскольку распределение по
рубрикам может иногда носить субъективный
характер, мы в целях сглаживания случайных
выбросов провели тематическое
группирование экспериментальных данных (табл.
2).
Таблица 2
Число документовыдач за апрель–декабрь
2002 г.
по группам индексов ГРНТИ
Группа смежных тематических рубрик
ГРНТИ
Суммарная выдача
Коэффициент полноты фонда
1. Энергетика, горное дело,
машиностроение, металлургия, химическая
технология и промышленность,
строительство и архитектура, транспорт (рубрики
ГРНТИ 44, 52, 53, 55, 61, 67, 73)
735
9,0
2. Экономика, экономические
науки (рубрика ГРНТИ 06)
4
919
5,5
3. Экология и смежные науки:
экология, геология, управление, общие
вопросы (рубрики ГРНТИ 38, 81, 82, 87)
5. Радиопромышленность:
электротехника, электроника и
радиотехника, связь, автоматика и
телемеханика, вычислительная техника (рубрики
ГРНТИ 45, 47, 49, 50)
2
357
12,9
6. Библиотечные и смежные
науки: культура, массовые коммуникации,
журналистика, средства массовой
информации, информатика (рубрики ГРНТИ
15, 19, 20)
262
23,3
Вывод
из тематического анализа:
как и предполагалось, читатели библиотеки
интересуются в первую очередь прикладными
и точными науками, а материалы по
библиотековедению, информатике и т.п. спрашивают
значительно меньше, несмотря на
относительную полноту этой части коллекции
(читатель мог бы получить в 23 раза больше
наименований литературы по данной тематике,
чем он реально запросил).
Зависит ли активность спроса
посетителей читальных залов от объема
предлагаемой литературы? Это
принципиальный вопрос: в профессиональной
литературе довольно часто применяется
термин критическая масса, обозначающий
некий порог, при переходе которого
поведение системы существенно меняется.
В англоязычной литературе для
обозначения связи каких-то двух величин
достаточно часто используется термин dose-dependent, т.е. эффект
зависит от количества. Здравый смысл
подсказывает, что существует положительная
связь между объемом предлагаемой
информации и спросом на нее (табл. 3).
Таблица 3
Сравнение объема записей в ЭК ГПНТБ
России
с числом запросов на отраженную в нем
литературу
за май–ноябрь 2002 г.
Месяц
Число записей в ЭК
Число запросов
Май
287
820
11
614
Июнь
291
420
7
679
Июль
295
129
8
548
Август
297
767
5
689
Сентябрь
300
058
3
982
Октябрь
304
328
17
479
Ноябрь
307
594
11
338
При общем и монотонном росте
числа записей в ЭК количество запросов
изменялось немонотонным образом. Попытка
ответить на вопрос, имеется ли зависимость
между объемом и активностью посещений,
оказалась неудачной. Корреляции пока не
обнаружено, или она маскируется
широкомасштабными сезонными колебаниями
посещения библиотеки.
Как зависит спрос от года публикации
изданий? Поскольку выставленные на веб-сайте
материалы доступны только с момента их
сетевой публикации, т.е. с момента открытия
или модернизации веб-сайта, то зависимость
активности спроса от времени, прошедшего с
начала публикации данного документа,
представляется весьма существенной для
целей нашего исследования. Мы провели
анализ спрашиваемости книг внутри каждой
выбранной тематической группы в
зависимости от года публикации (рис. 2–7).
Рис.
2. Спрос на книги по точным наукам (группа 4) в
зависимости от года публикации.
Рис.
3. Спрос на книги по энергетике, горному делу,
машиностроению, металлургии, химической
технологии и промышленности, строительству
и архитектуре, транспорту (группа 1) в
зависимости от года публикации.
Рис.
4. Спрос на книги по экологии и смежным
наукам (группа 3) в зависимости от года
публикации.
Рис.
5. Спрос на книги по радиопромышленности (группа
5) в зависимости от года публикации.
Рис.
6. Спрос на книги по библиотечным и смежным
наукам (группа 6) в зависимости от года
публикации.
Рис.
7. Спрос на книги по экономике (группа 2) в
зависимости от года публикации.
Рис.
8. Спрос на иностранные книги (без
тематического разделения) в зависимости от
года публикации.
Нужно заметить, что
относительный спрос на иностранные книги в
ГПНТБ России (рис. 8) в 3–4 раза ниже, чем на
отечественные (имеется в виду общий объем
спроса, отнесенный к полному количеству
изданий). Это, конечно, не может быть
оправданием снижения объемов иностранного
комплектования, но может свидетельствовать
в пользу другой технологии, например
персональной доставки полного текста по
заказу (pay
per view).
В завершение данного раздела
приводим обобщенные данные спроса на книги
(рис. 9).
Рис.
9. Спрос на книги в целом (без разделения на
отечественные и иностранные и без
тематического разделения) в зависимости от
года публикации.
Вниманию читателей – любителей
аналитических формул предлагаем
общую эмпирическую формулу зависимости
активности спроса (Y)
от момента публикации (x):
Y = x2e(1-x).
В нашем распоряжении были
данные и по спросу на журналы, но, к
сожалению, выяснить какие-либо корреляции
по ним оказалось затруднительно (рис. 10).
Рис.
10. Спрос на периодику в зависимости от года
публикации.
Проведенные исследования
позволили выделить четыре этапа изменения
спроса.
Первый этап
– формирование спроса от нулевого уровня
до максимального значения – продолжается
примерно 1,5 года при достаточно слабой
зависимости от тематики. Заметим, что в
изучаемой нами области нет такого явления,
как предварительная рекламная кампания,
или «раскрутка», или что-то подобное, да и
критики не особо балуют вниманием научно-технические
публикации. Кроме того, речь идет не об
одной книге или серии публикаций, а о спросе
на многотысячный по числу наименований
массив. Так что процесс идет естественным
образом, и наблюдаемая длительность
периода формирования спроса, как и его
независимость от тематики, видимо,
представляют собой нечто фундаментальное в
библиотечной науке (точнее, в поведении
читателя), как, например, закон Брэдфорда.
Конечно, внутри этого периода отражены и
технологические задержки по пути
прохождения издания в библиотечной
обработке – от момента поступления издания
до постановки на полку либо появления
записи в электронном каталоге.
Второй
этап – «рабочая площадка», или период
расцвета – соответствует максимуму спроса,
который может с колебаниями продолжаться
несколько лет (чаще всего от 3 до 7 в
зависимости от тематики), либо вообще
отсутствовать (сравните для примера рис. 2–6
и 9). Поиски объяснений консервативности или
динамичности читательского спроса в
зависимости от тематики выходят за пределы
нашей компетентности. Заметим лишь, что
имеющие тематическое родство с
полнотекстовыми материалами веб-сайта
книги группы 6 (информатика и т.п.)
удерживают читательский интерес в среднем
7–9 лет.
Третий этап
– «быстрое увядание», спад читательского
интереса – также является нетривиальным
ввиду независимости его длительности (2–3
года) от тематики. Здесь уже нет поводов
ссылаться на библиотечные технологии, а
нужно соглашаться с универсальным
характером модели усредненного
читательского спроса.
Четвертый
этап – «спокойная старость» –
характеризуется небольшим, но постоянным
спросом (в нашей библиотеке он составляет
1–2 документовыдачи в год, но и не каждый год)
на протяжении многих-многих лет.
Что же является основной
причиной падения спроса на публикации по
самому широкому спектру тематики? Ведь в
огромном большинстве рассмотренных
предметных рубрик (например в математике)
никаких крутых изменений не происходило и
старых фактов и выводов никто не отменял. Но
людей привлекает все новое, ожидание
появления новых дополнительных фактов,
новое изложение старых наблюдений, при
наличии выбора они просто предпочитают
более свежее издание.
Итак,
потребность в обновлении – это
экспериментально подтвержденный факт
поведения пользователя. Следовательно,
конструктору веб-сайта необходимо очень
тщательно следить за его обновлением.