УДК 025.4.036
Гончаров М.В., Земсков А.И.
Причины посещения веб-сайта ГПНТБ России
Часть I. Информационные
и технологические ресурсы ГПНТБ
России*
По данным Минсвязи РФ на начало 2003 г. Интернетом в России регулярно пользуются около 6 млн. человек (т.е. всего лишь 4% населения страны), но разговоров об этой относительно новой технологии необычайно и несоразмерно много. Несоразмерно – потому что, например, очень новая, очень близкая Интернету технология мобильной телефонии (а к мобильным телефонам, по тем же данным, в России уже подключены 18 млн. владельцев) развивается намного быстрее и без всяких песнопений: заплатил деньги, купил контракт и аппарат по вкусу и по возможностям – и говори сколько хочешь! Быть может, дело в том, что мобильный телефон – устройство скорее личного пользования, предназначенное для передачи в первую очередь ваших личных сведений и поручений, а Интернет законно вторгается в сферу общественных отношений, создавая вокруг себя и в себе колоссальные информационные ресурсы. Именно поэтому Интернет – благородная и благодатная тема для профессиональных или светских рассуждений, и авторы данной статьи вполне следуют сложившейся практике.
Рост Интернет-активности в России хорошо иллюстрируется показателями работы сервера ВИНИТИ, крупнейшей в России организации по обработке научно-технической информации (рис. 1).
Рис.
1. Нагрузка на сервер ВИНИТИ в 1995–2001 гг.
(из
национального доклада «Информационные
ресурсы России»
на сервере www.inforeg.ru).
Что публикуется. В национальном докладе «Информационные ресурсы России» за 2001 г. отмечается: «Основная часть информационных ресурсов (по ряду оценок не менее 90%), создающихся на предприятиях, в организациях и органах управления, используется исключительно или в основном для обеспечения их собственной деятельности.
Информационные ресурсы, создаваемые для предоставления информационных продуктов и услуг неопределенному заранее множеству потребителей, условно можно назвать ресурсами «массового» использования. Они составляют не более 5% общего количества информационных массивов, фондов, баз данных и т.д.».
Эти оценки подтверждаются и другими источниками. Например, по данным г-жи Клэр Харт, президента аналитической компании Factiva, созданной совместно компаниями Dow Jones и Reuter, ежегодно в мире производится 25 терабайт газетной, 10 терабайт журнальной (примерно 1 млн. годовых комплектов научных журналов), 2 терабайта книжной информации (считая, что в 2000 г. выпущены 1 млн. 300 тыс. книг), 195 терабайт внутриофисной документации!
Итак, использование электронных ресурсов растет быстрыми темпами, а в составе производимой информации 84% приходится на технологическую документацию и управленческую переписку.
Цель нашей работы – понять, как удаленные пользователи используют сетевые материалы ГПНТБ России, что привлекает их на веб-сайт крупной научно-технической библиотеки, с какими материалами они предпочитают работать?
Методика. Прямых опросов посетителей веб-сайта мы не проводили, поэтому пришлось прибегнуть к косвенным методикам, сравнивая поведение читателей, пришедших в библиотеку, и статистику работы ее веб-сайта. Авторы благодарят сотрудников ГПНТБ России А.И. Бродовского, С.М. Дунаевскую, Е.А. Еронину и М.В. Залужскую за представленные статистические данные. Период сбора статистики: 15.12.02–15.01.03. Предыдущие выборки показали сходные результаты.
Сложности такого рода исследований понятны:
содержание документов веб-сайта и основного фонда неоднородно;
методические возможности мониторинга неодинаковы: для печатных изданий – учет требований; в локальной сети – запрос документа; в сетевой работе – обращения к веб-сайту (hits, visitor, sessions);
отношение разных субъектов к различным объектам дается в сравнении, но нет оснований говорить о каком-либо совпадении массивов читателей библиотеки и посетителей веб-сайта – вполне возможно, что это совершенно разные люди (данное предположение подтверждено экспериментально).
Информационные и технологические ресурсы ГПНТБ России. В печатных фондах и микроформах ГПНТБ России – около 8 млн. документов, из них (в тыс. экз.):
книги
2 000
периодика
3 800
микроформы
1 600
неопубликованные переводы
300
электронные ресурсы
6,2
Если вести учет в традиционных показателях, то электронные офлайновые публикации составляют менее одной тысячной от общего фонда. Несколько иная картина получается, если используется статистика с учетом объема информации, которая может быть предоставлена посетителю библиотеки в терабайтах:
книги
2
периодические и другие издания
3
офлайновые электронные ресурсы
0,6(около 10%
от общего количества)
Как видим, при использовании различных методик расхождение подсчета примерно в 100 раз.
На февраль 2003 г. в ГПНТБ России имелись 358 персональных компьютеров, из них 324 – в локальной сети, 83 – предоставлены читателям, при этом 45 – имеют доступ в Интернет, в том числе 30 – в Интернет-клубе. Во время проведения эксперимента библиотека оплачивала выход в Интернет пропускной способностью 512 кб/с.
Что читали в России в 2001 г.? Для ответа воспользуемся анализом А.М. Ильницкого («Книгоиздание в контексте социально-экономических преобразований в современной России». М.: Вагриус, 2002), где указаны виды литературы и спрос на них читательской аудитории в процентах к общему количеству опрошенных (допускалось назвать несколько видов литературы, поэтому итог превышает 100%):
детективы
31
профессиональная литература
22
учебники
20
детская литература
19
словари, справочники
14
любовные романы
12
энциклопедии
11
книги рецептов, советы хозяйке
11
фантастика
8
сказки
8
зарубежная поэзия
1,5
К каким материалам чаще обращаются наши читатели? Рассмотрим тематический состав фонда ГПНТБ России, отраженного в электронном каталоге (табл. 1).
Обратим внимание на очень интересный показатель, в какой-то мере характеризующий интенсивность спроса по данной тематике и «запас» по комплектованию фонда – отношение количества отраженных в ЭК наименований литературы к числу выдач, прошедших через систему ЭК; назовем его коэффициент полноты фонда. В данной выборке этот показатель меняется достаточно хаотично: от 5,5 (экономика и экономические науки) до 37 (физика). В принципе это означает, что у читателя всегда имеется определенный выбор внутри данной тематики.
Таблица 1
Тематика книг, отраженных в ЭК ГПНТБ
России
(первые
по численности 11 тематических рубрик ГРНТИ),
и число выдач книг по данной тематике через
систему ЭК ГПНТБ России за апрель – декабрь 2002 г.
Рубрика ГРНТИ |
Число записей в ЭК |
Число выдач книг в ЭК |
|
---|---|---|---|
№ | Название | ||
06 | Экономика, экономические науки | 26 819 | 4 919 |
29 | Физика | 20 511 | 553 |
55 | Машиностроение | 18 691 | 2 043 |
50 |
Автоматика
и телемеханика, вычислительная техника |
15 333 | 1 064 |
27 | Математика | 9 605 | 560 |
47 | Электроника, радиотехника | 9 201 | 716 |
38 | Геология | 8 970 | 435 |
67 | Строительство, архитектура | 8 748 | 861 |
31 | Химия | 7 274 | 516 |
10 | Государство и право, юридические науки | 6 319 | 423 |
87 | Охрана окружающей среды, экология человека | 6 092 | 1 400 |
Поскольку распределение по рубрикам может иногда носить субъективный характер, мы в целях сглаживания случайных выбросов провели тематическое группирование экспериментальных данных (табл. 2).
Таблица 2
Число документовыдач за апрель–декабрь
2002 г.
по группам индексов ГРНТИ
Группа смежных тематических рубрик ГРНТИ |
Суммарная выдача |
Коэффициент полноты фонда |
---|---|---|
1. Энергетика, горное дело, машиностроение, металлургия, химическая технология и промышленность, строительство и архитектура, транспорт (рубрики ГРНТИ 44, 52, 53, 55, 61, 67, 73) |
735 |
9,0 |
2. Экономика, экономические науки (рубрика ГРНТИ 06) |
4 919 |
5,5 |
3. Экология и смежные науки: экология, геология, управление, общие вопросы (рубрики ГРНТИ 38, 81, 82, 87) |
3 318 |
7,3 |
4. Точные науки: математика, кибернетика, физика, химия, механика (рубрики ГРНТИ 27, 28, 29, 30, 31) |
2 532 |
18,2 |
5. Радиопромышленность: электротехника, электроника и радиотехника, связь, автоматика и телемеханика, вычислительная техника (рубрики ГРНТИ 45, 47, 49, 50) |
2 357 |
12,9 |
6. Библиотечные и смежные науки: культура, массовые коммуникации, журналистика, средства массовой информации, информатика (рубрики ГРНТИ 15, 19, 20) |
262 |
23,3 |
Вывод из тематического анализа: как и предполагалось, читатели библиотеки интересуются в первую очередь прикладными и точными науками, а материалы по библиотековедению, информатике и т.п. спрашивают значительно меньше, несмотря на относительную полноту этой части коллекции (читатель мог бы получить в 23 раза больше наименований литературы по данной тематике, чем он реально запросил).
Зависит ли активность спроса посетителей читальных залов от объема предлагаемой литературы? Это принципиальный вопрос: в профессиональной литературе довольно часто применяется термин критическая масса, обозначающий некий порог, при переходе которого поведение системы существенно меняется.
В англоязычной литературе для обозначения связи каких-то двух величин достаточно часто используется термин dose-dependent, т.е. эффект зависит от количества. Здравый смысл подсказывает, что существует положительная связь между объемом предлагаемой информации и спросом на нее (табл. 3).
Таблица 3
Сравнение объема записей в ЭК ГПНТБ
России
с числом запросов на отраженную в нем
литературу
за май–ноябрь 2002 г.
Месяц |
Число записей в ЭК |
Число запросов |
---|---|---|
Май |
287 820 |
11 614 |
Июнь |
291 420 |
7 679 |
Июль |
295 129 |
8 548 |
Август |
297 767 |
5 689 |
Сентябрь |
300 058 |
3 982 |
Октябрь |
304 328 |
17 479 |
Ноябрь |
307 594 |
11 338 |
При общем и монотонном росте числа записей в ЭК количество запросов изменялось немонотонным образом. Попытка ответить на вопрос, имеется ли зависимость между объемом и активностью посещений, оказалась неудачной. Корреляции пока не обнаружено, или она маскируется широкомасштабными сезонными колебаниями посещения библиотеки.
Как зависит спрос от года публикации изданий? Поскольку выставленные на веб-сайте материалы доступны только с момента их сетевой публикации, т.е. с момента открытия или модернизации веб-сайта, то зависимость активности спроса от времени, прошедшего с начала публикации данного документа, представляется весьма существенной для целей нашего исследования. Мы провели анализ спрашиваемости книг внутри каждой выбранной тематической группы в зависимости от года публикации (рис. 2–7).
Рис. 2. Спрос на книги по точным наукам (группа 4) в зависимости от года публикации.
Рис. 3. Спрос на книги по энергетике, горному делу, машиностроению, металлургии, химической технологии и промышленности, строительству и архитектуре, транспорту (группа 1) в зависимости от года публикации.
Рис. 4. Спрос на книги по экологии и смежным наукам (группа 3) в зависимости от года публикации.
Рис. 5. Спрос на книги по радиопромышленности (группа 5) в зависимости от года публикации.
Рис. 6. Спрос на книги по библиотечным и смежным наукам (группа 6) в зависимости от года публикации.
Рис. 7. Спрос на книги по экономике (группа 2) в зависимости от года публикации.
Рис. 8. Спрос на иностранные книги (без тематического разделения) в зависимости от года публикации.
Нужно заметить, что относительный спрос на иностранные книги в ГПНТБ России (рис. 8) в 3–4 раза ниже, чем на отечественные (имеется в виду общий объем спроса, отнесенный к полному количеству изданий). Это, конечно, не может быть оправданием снижения объемов иностранного комплектования, но может свидетельствовать в пользу другой технологии, например персональной доставки полного текста по заказу (pay per view).
В завершение данного раздела приводим обобщенные данные спроса на книги (рис. 9).
Рис. 9. Спрос на книги в целом (без разделения на отечественные и иностранные и без тематического разделения) в зависимости от года публикации.
Вниманию читателей – любителей аналитических формул предлагаем общую эмпирическую формулу зависимости активности спроса (Y) от момента публикации (x): Y = x2e(1-x).
В нашем распоряжении были данные и по спросу на журналы, но, к сожалению, выяснить какие-либо корреляции по ним оказалось затруднительно (рис. 10).
Рис. 10. Спрос на периодику в зависимости от года публикации.
Проведенные исследования позволили выделить четыре этапа изменения спроса.
Первый этап – формирование спроса от нулевого уровня до максимального значения – продолжается примерно 1,5 года при достаточно слабой зависимости от тематики. Заметим, что в изучаемой нами области нет такого явления, как предварительная рекламная кампания, или «раскрутка», или что-то подобное, да и критики не особо балуют вниманием научно-технические публикации. Кроме того, речь идет не об одной книге или серии публикаций, а о спросе на многотысячный по числу наименований массив. Так что процесс идет естественным образом, и наблюдаемая длительность периода формирования спроса, как и его независимость от тематики, видимо, представляют собой нечто фундаментальное в библиотечной науке (точнее, в поведении читателя), как, например, закон Брэдфорда. Конечно, внутри этого периода отражены и технологические задержки по пути прохождения издания в библиотечной обработке – от момента поступления издания до постановки на полку либо появления записи в электронном каталоге.
Второй этап – «рабочая площадка», или период расцвета – соответствует максимуму спроса, который может с колебаниями продолжаться несколько лет (чаще всего от 3 до 7 в зависимости от тематики), либо вообще отсутствовать (сравните для примера рис. 2–6 и 9). Поиски объяснений консервативности или динамичности читательского спроса в зависимости от тематики выходят за пределы нашей компетентности. Заметим лишь, что имеющие тематическое родство с полнотекстовыми материалами веб-сайта книги группы 6 (информатика и т.п.) удерживают читательский интерес в среднем 7–9 лет.
Третий этап – «быстрое увядание», спад читательского интереса – также является нетривиальным ввиду независимости его длительности (2–3 года) от тематики. Здесь уже нет поводов ссылаться на библиотечные технологии, а нужно соглашаться с универсальным характером модели усредненного читательского спроса.
Четвертый этап – «спокойная старость» – характеризуется небольшим, но постоянным спросом (в нашей библиотеке он составляет 1–2 документовыдачи в год, но и не каждый год) на протяжении многих-многих лет.
Что же является основной причиной падения спроса на публикации по самому широкому спектру тематики? Ведь в огромном большинстве рассмотренных предметных рубрик (например в математике) никаких крутых изменений не происходило и старых фактов и выводов никто не отменял. Но людей привлекает все новое, ожидание появления новых дополнительных фактов, новое изложение старых наблюдений, при наличии выбора они просто предпочитают более свежее издание.
Итак, потребность в обновлении – это экспериментально подтвержденный факт поведения пользователя. Следовательно, конструктору веб-сайта необходимо очень тщательно следить за его обновлением.