Научные и технические библиотеки №11 2003 год
Содержание:

Суслова И.М., Кармовский В.В. Библиотечный менеджмент: полемика и реальность

Гончаров М.В., Земсков А.И.  Причины посещения веб-сайта ГПНТБ России. Часть I. Информационные и технологические ресурсы ГПНТБ России

Юшина О.Л. Информационно-психологическая безопасность: библиотековедческий аспект (по материалам зарубежной литературы)

Кожевникова Е.С. Библиотека и Интернет

Абызгильдин А.Ю. Электронная библиотека в вузе

Джаксо П.  Идентификатор цифрового объекта


Обзор газеты “Information World Review”
(Dec. 2002)

Демпси К. Глядя в будущее

Грин Д. Когда сеть сама начнет думать


ЮБИЛЕИ

Авраева Ю.Б. И педагог, и ученый. (К юбилею С.А. Езовой)

Стрельникова А.Г., Карнуп И.Н. Санкт-Петербургская ЦНСХБ: вчера, сегодня, завтра

Михайловская Н.В. Знакомьтесь: Научная библиотека Новосибирского государственного педагогического университета.
(К 65-летию библиотеки)


НАШИ
АВТОРЫ


УДК 025.4.036

Гончаров М.В., Земсков А.И.

Причины посещения веб-сайта ГПНТБ России

Часть I. Информационные
и технологические ресурсы ГПНТБ России*

По данным Минсвязи РФ на начало 2003 г. Интернетом в России регулярно пользуются около 6 млн. человек (т.е. всего лишь 4% населения страны), но разговоров об этой относительно новой технологии необычайно и несоразмерно много. Несоразмерно – потому что, например, очень новая, очень близкая Интернету технология мобильной телефонии (а к мобильным телефонам, по тем же данным, в России уже подключены 18 млн. владельцев) развивается намного быстрее и без всяких песнопений: заплатил деньги, купил контракт и аппарат по вкусу и по возможностям – и говори сколько хочешь! Быть может, дело в том, что мобильный телефон – устройство скорее личного пользования, предназначенное для передачи в первую очередь ваших личных сведений и поручений, а Интернет законно вторгается в сферу общественных отношений, создавая вокруг себя и в себе колоссальные информационные ресурсы. Именно поэтому Интернет – благородная и благодатная тема для профессиональных или светских рассуждений, и авторы данной статьи вполне следуют сложившейся практике.

 

Рост Интернет-активности в России хорошо иллюстрируется показателями работы сервера ВИНИТИ, крупнейшей в России организации по обработке научно-технической информации (рис. 1).

Рис. 1. Нагрузка на сервер ВИНИТИ в 1995–2001 гг.
(из национального доклада «Информационные ресурсы России»
на сервере www.inforeg.ru).

 

Что публикуется. В национальном докладе «Информацион­ные ресурсы России» за 2001 г. отмечается: «Основная часть информационных ресурсов (по ряду оценок не менее 90%), создающихся на предприятиях, в организациях и органах управления, используется исключительно или в основном для обеспечения их собственной деятельности.

Информационные ресурсы, создаваемые для предоставления информационных продуктов и услуг неопределенному заранее множеству потребителей, условно можно назвать ресурсами «массового» использования. Они составляют не более 5% общего количества информационных массивов, фондов, баз данных и т.д.».

Эти оценки подтверждаются и другими источниками. Например, по данным г-жи Клэр Харт, президента аналитической компании Factiva, созданной совместно компаниями Dow Jones и Reuter, ежегодно в мире производится 25 терабайт газетной, 10 терабайт журнальной (примерно 1 млн. годовых комплектов научных журналов), 2 терабайта книжной информации (считая, что в 2000 г. выпущены 1 млн. 300 тыс. книг), 195 терабайт внутриофисной документации!

Итак, использование электронных ресурсов растет быстрыми темпами, а в составе производимой информации 84% приходится на технологическую документацию и управленческую переписку.

Цель нашей работы – понять, как удаленные пользователи используют сетевые материалы ГПНТБ России, что привлекает их на веб-сайт крупной научно-технической библиотеки, с какими материалами они предпочитают работать?

 

Методика. Прямых опросов посетителей веб-сайта мы не проводили, поэтому пришлось прибегнуть к косвенным методикам, сравнивая поведение читателей, пришедших в библиотеку, и статистику работы ее веб-сайта. Авторы благодарят сотрудников ГПНТБ России А.И. Бродовского, С.М. Дунаевскую, Е.А. Еронину и М.В. Залужскую за представленные статистические данные. Период сбора статистики: 15.12.02–15.01.03. Предыдущие выборки показали сходные результаты.

Сложности такого рода исследований понятны:

  • содержание документов веб-сайта и основного фонда неоднородно;

  • методические возможности мониторинга неодинаковы: для печатных изданий – учет требований; в локальной сети – запрос документа; в сетевой работе – обращения к веб-сайту (hits, visitor, sessions);

  • отношение разных субъектов к различным объектам дается в сравнении, но нет оснований говорить о каком-либо совпадении массивов читателей библиотеки и посетителей веб-сайта – вполне возможно, что это совершенно разные люди (данное предположение подтверждено экспериментально).

 

Информационные и технологические ресурсы ГПНТБ России. В печатных фондах и микроформах ГПНТБ России – около 8 млн. документов, из них (в тыс. экз.):

книги

2 000

периодика

3 800

микроформы

1 600

неопубликованные переводы

300

электронные ресурсы

6,2

Если вести учет в традиционных показателях, то электронные офлайновые публикации составляют менее одной тысячной от общего фонда. Несколько иная картина получается, если используется статистика с учетом объема информации, которая может быть предоставлена посетителю библиотеки в терабайтах:

книги

2

периодические и другие издания

3

офлайновые электронные ресурсы

0,6(около 10%
от общего количества)

Как видим, при использовании различных методик расхождение подсчета примерно в 100 раз.

На февраль 2003 г. в ГПНТБ России имелись 358 персональных компьютеров, из них 324 – в локальной сети, 83 – предоставлены читателям, при этом 45 – имеют доступ в Интернет, в том числе 30 – в Интернет-клубе. Во время проведения эксперимента библиотека оплачивала выход в Интернет пропускной способностью 512 кб/с.

Что читали в России в 2001 г.? Для ответа воспользуемся анализом А.М. Ильницкого («Книгоиздание в контексте социально-экономических преобразований в современной России». М.: Вагриус, 2002), где указаны виды литературы и спрос на них читательской аудитории в процентах к общему количеству опрошенных (допускалось назвать несколько видов литературы, поэтому итог превышает 100%):

детективы

31

профессиональная литература

22

учебники

20

детская литература

19

словари, справочники

14

любовные романы

12

энциклопедии

11

книги рецептов, советы хозяйке

11

фантастика

8

сказки

8

зарубежная поэзия

1,5

 

К каким материалам чаще обращаются наши читатели? Рассмотрим тематический состав фонда ГПНТБ России, отраженного в электронном каталоге (табл. 1).

Обратим внимание на очень интересный показатель, в какой-то мере характеризующий интенсивность спроса по данной тематике и «запас» по комплектованию фонда – отношение количества отраженных в ЭК наименований литературы к числу выдач, прошедших через систему ЭК; назовем его коэффициент полноты фонда. В данной выборке этот показатель меняется достаточно хаотично: от 5,5 (экономика и экономические науки) до 37 (физика). В принципе это означает, что у читателя всегда имеется определенный выбор внутри данной тематики.

 

Таблица 1

Тематика книг, отраженных в ЭК ГПНТБ России
(первые по численности 11 тематических рубрик ГРНТИ),
и число выдач книг по данной тематике через систему ЭК ГПНТБ России за апрель – декабрь 2002 г.

Рубрика ГРНТИ Число
 записей 
в ЭК
 
Число
 выдач 
книг
в ЭК
Название
06 Экономика, экономические науки 26 819 4 919
29 Физика 20 511 553
55 Машиностроение 18 691 2 043
50 Автоматика и телемеханика,
вычислительная техника
15 333 1 064
27 Математика 9 605 560
47 Электроника, радиотехника 9 201 716
38 Геология 8 970 435
67 Строительство, архитектура 8 748 861
31 Химия 7 274 516
10 Государство и право, юридические науки 6 319 423
87 Охрана окружающей среды, экология человека 6 092 1 400

Поскольку распределение по рубрикам может иногда носить субъективный характер, мы в целях сглаживания случайных выбросов провели тематическое группирование экспериментальных данных (табл. 2).

Таблица 2

Число документовыдач за апрель–декабрь 2002 г.
по группам индексов ГРНТИ

Группа смежных тематических рубрик ГРНТИ

Суммарная выдача

Коэффициент полноты фонда

1. Энергетика, горное дело, машиностроение, металлургия, химическая технология и промышленность, строительство и архитектура, транспорт (рубрики ГРНТИ 44, 52, 53, 55, 61, 67, 73)

735

9,0

2. Экономика, экономические науки (рубрика ГРНТИ 06)

4 919

5,5

3. Экология и смежные науки: экология, геология, управление, общие вопросы (рубрики ГРНТИ 38, 81, 82, 87)

3 318

7,3

4. Точные науки: математика, кибернетика, физика, химия, механика (рубрики ГРНТИ 27, 28, 29, 30, 31)

2 532

18,2

5. Радиопромышленность: электротехника, электроника и радиотехника, связь, автоматика и телемеханика, вычислительная техника (рубрики ГРНТИ 45, 47, 49, 50)

2 357

12,9

6. Библиотечные и смежные науки: культура, массовые коммуникации, журналистика, средства массовой информации, информатика (рубрики ГРНТИ 15, 19, 20)

262

23,3

Вывод из тематического анализа: как и предполагалось, читатели библиотеки интересуются в первую очередь прикладными и точными науками, а материалы по библиотековедению, информатике и т.п. спрашивают значительно меньше, несмотря на относительную полноту этой части коллекции (читатель мог бы получить в 23 раза больше наименований литературы по данной тематике, чем он реально запросил).

 

Зависит ли активность спроса посетителей читальных залов от объема предлагаемой литературы? Это принципиальный вопрос: в профессиональной литературе довольно часто применяется термин критическая масса, обозначающий некий порог, при переходе которого поведение системы существенно меняется.

В англоязычной литературе для обозначения связи каких-то двух величин достаточно часто используется термин dose-dependent, т.е. эффект зависит от количества. Здравый смысл подсказывает, что существует положительная связь между объемом предлагаемой информации и спросом на нее (табл. 3).

Таблица 3

Сравнение объема записей в ЭК ГПНТБ России
с числом запросов на отраженную в нем литературу
за май–ноябрь 2002 г.

Месяц

Число записей в ЭК

Число запросов

Май

287 820

11 614

Июнь

291 420

7 679

Июль

295 129

8 548

Август

297 767

5 689

Сентябрь

300 058

3 982

Октябрь

304 328

17 479

Ноябрь

307 594

11 338

При общем и монотонном росте числа записей в ЭК количество запросов изменялось немонотонным образом. Попытка ответить на вопрос, имеется ли зависимость между объемом и активностью посещений, оказалась неудачной. Корреляции пока не обнаружено, или она маскируется широкомасштабными сезонными колебаниями посещения библиотеки.

 

Как зависит спрос от года публикации изданий? Поскольку выставленные на веб-сайте материалы доступны только с момента их сетевой публикации, т.е. с момента открытия или модернизации веб-сайта, то зависимость активности спроса от времени, прошедшего с начала публикации данного документа, представляется весьма существенной для целей нашего исследования. Мы провели анализ спрашиваемости книг внутри каждой выбранной тематической группы в зависимости от года публикации (рис. 2–7).

Рис. 2. Спрос на книги по точным наукам (группа 4) в зависимости от года публикации.

 

Рис. 3. Спрос на книги по энергетике, горному делу, машиностроению, металлургии, химической технологии и промышленности, строительству и архитектуре, транспорту (группа 1) в зависимости от года публикации.

 

Рис. 4. Спрос на книги по экологии и смежным наукам (группа 3) в зависимости от года публикации.

 

Рис. 5. Спрос на книги по радиопромышленности (группа 5) в зависимости от года публикации.

 

Рис. 6. Спрос на книги по библиотечным и смежным наукам (группа 6) в зависимости от года публикации.

 

Рис. 7. Спрос на книги по экономике (группа 2) в зависимости от года публикации.

 

Рис. 8. Спрос на иностранные книги (без тематического разделения) в зависимости от года публикации.

Нужно заметить, что относительный спрос на иностранные книги в ГПНТБ России (рис. 8) в 3–4 раза ниже, чем на отечественные (имеется в виду общий объем спроса, отнесенный к полному количеству изданий). Это, конечно, не может быть оправданием снижения объемов иностранного комплектования, но может свидетельствовать в пользу другой технологии, например персональной доставки полного текста по заказу (pay per view).

 

В завершение данного раздела приводим обобщенные данные спроса на книги (рис. 9).

Рис. 9. Спрос на книги в целом (без разделения на отечественные и иностранные и без тематического разделения) в зависимости от года публикации.

 

Вниманию читателей – любителей аналитических формул предлагаем  общую эмпирическую формулу зависимости активности спроса (Y) от момента публикации (x): Y = x2e(1-x).

В нашем распоряжении были данные и по спросу на журналы, но, к сожалению, выяснить какие-либо корреляции по ним оказалось затруднительно (рис. 10).

Рис. 10. Спрос на периодику в зависимости от года публикации.

 

Проведенные исследования позволили выделить четыре этапа изменения спроса.

Первый этап – формирование спроса от нулевого уровня до максимального значения – продолжается примерно 1,5 года при достаточно слабой зависимости от тематики. Заметим, что в изучаемой нами области нет такого явления, как предварительная рекламная кампания, или «раскрутка», или что-то подобное, да и критики не особо балуют вниманием научно-технические публикации. Кроме того, речь идет не об одной книге или серии публикаций, а о спросе на многотысячный по числу наименований массив. Так что процесс идет естественным образом, и наблюдаемая длительность периода формирования спроса, как и его независимость от тематики, видимо, представляют собой нечто фундаментальное в библиотечной науке (точнее, в поведении читателя), как, например, закон Брэдфорда. Конечно, внутри этого периода отражены и технологические задержки по пути прохождения издания в библиотечной обработке – от момента поступления издания до постановки на полку либо появления записи в электронном каталоге.

Второй этап – «рабочая площадка», или период расцвета – соответствует максимуму спроса, который может с колебаниями продолжаться несколько лет (чаще всего от 3 до 7 в зависимости от тематики), либо вообще отсутствовать (сравните для примера рис. 2–6 и 9). Поиски объяснений консервативности или динамичности читательского спроса в зависимости от тематики выходят за пределы нашей компетентности. Заметим лишь, что имеющие тематическое родство с полнотекстовыми материалами веб-сайта книги группы 6 (информатика и т.п.) удерживают читательский интерес в среднем 7–9 лет.

Третий этап – «быстрое увядание», спад читательского интереса – также является нетривиальным ввиду независимости его длительности (2–3 года) от тематики. Здесь уже нет поводов ссылаться на библиотечные технологии, а нужно соглашаться с универсальным характером модели усредненного читательского спроса.

Четвертый этап – «спокойная старость» – характеризуется небольшим, но постоянным спросом (в нашей библиотеке он составляет 1–2 документовыдачи в год, но и не каждый год) на протяжении многих-многих лет.

Что же является основной причиной падения спроса на публикации по самому широкому спектру тематики? Ведь в огромном большинстве рассмотренных предметных рубрик (например в математике) никаких крутых изменений не происходило и старых фактов и выводов никто не отменял. Но людей привлекает все новое, ожидание появления новых дополнительных фактов, новое изложение старых наблюдений, при наличии выбора они просто предпочитают более свежее издание.

Итак, потребность в обновлении – это экспериментально подтвержденный факт поведения пользователя. Следовательно, конструктору веб-сайта необходимо очень тщательно следить за его обновлением.


* Часть II будет опубликована в № 12.
  
На главную