Home page | Каталоги и базы данных

УДК 026:5

Захаров А.Г., Мешалкин Л.Д., Дубров А.П.

Роль фундаментальных библиотек
в информационном обеспечении научных исследований

Предложена программа повышения роли фундаментальных библиотек в информационном обеспечении исследований. В результате системного подхода созданы новые показатели качества работы и новые функции библиотек. Описаны базовые понятия, в рамках которых следует проводить обсуждение деятельности библиотек и оптимизацию их комплектования.

Информационный взрыв, переживаемый наукой в настоящее время, заставляет по-новому взглянуть на место и функции фундаментальных научных библиотек. Стоит задача перехода от депозитарной схемы сбора, хранения и выдачи запрашиваемой научной информации к более активным формам деятельности, которые включают оценку информативности источников, оптимальное комплектование репертуара, адресное обслуживание исследователей. Естественно, что переход может произойти только при укреплении взаимодействия библиотек с их индивидуальными и коллективными пользователями. Взаимодействие должно быть взаимно выгодным. Этого можно достигнуть, если рассмотреть системно комплекс проблем, связывающих научные издания, пользователей библиотек всех уровней иерархии и функции фундаментальных библиотек. Примером такого системного подхода является работа, в которой описана совокупность характеристик систем поддержки решений [1].

Ключевым звеном предлагаемой программы является новая технология оценки полноты, значимости и своевременности научной информации группы источников. При ее описании используется развернутый пример из области прикладной статистики, в которой работает один из авторов статьи. Естественно, что распространение схемы на другие области науки потребует коллективных усилий. Предложенная технология открывает новые возможности по изучению реальной динамики развития конкретных направлений науки.

Системный подход предполагает рассмотрение во взаимодействии трех главных компонент информационного процесса: научных изданий, пользователей библиотек, функций фундаментальных библиотек. Особое внимание в нем уделяется вопросам взаимодействия прямых и косвенных пользователей системы. Одновременный учет интересов непосредственных пользователей научных библиотек и различных звеньев иерархии управления коллективными пользователями позволяет за счет целостности использования информации заметно расширить функции фундаментальных библиотек в направлении превращения их в аналитико-информационные центры науки.

В условиях резкого сокращения ресурсов, выделяемых на поддержку информационного обеспечения, большое внимание привлекает задача оптимизации репертуара библиотек. В статье [2] предлагаются два формальных критерия оптимизации комплектования.

Предлагаемая программа - это развитие и систематизация с единой методической позиции того, что предлагалось в последние годы руководителями крупнейших научных информационно-библиотечных центров страны [3, 4, 5]. В то же время программа - очередной шаг в направлении количественной оценки информативности группы источников и использования подобного типа оценок при создании репертуара для научных библиотек. Наш подход к измерению информативности перекликается с работами Института научной информации (Institute for Scientific Information, ISI), но приоритет отдается знаниям специалиста, а не формальным конструкциям при ссылках на работы (<WWW.isinet.com/prodserv/rsg/ front.html>).

Схема новой технологии

Ключевыми понятиями новой технологии являются понятие новация в науке (новаторская идея, стартовая точка нового научного направления, новый перспективный метод) и ее отражение в источнике информации (первоисточник, ссылка, изложение). Примером новации было известное выступление Дж. Тьюки о сравнении эффективностей двух распространенных оценок разброса в статистике (среднего абсолютного отклонения и среднеквадратического отклонения) в применении к серии выборок из нормального распределения с меняющейся долей загрязнения [6]. Хорошо известно, что при отсутствии загрязнения среднеквадратическое отклонение лучше (эффективнее) абсолютного отклонения. Однако в работе было показано, что при практически ничтожной доле загрязнения положение меняется и более эффективным становится среднее абсолютное отклонение. Более того, с ростом загрязнения теоретически лучшая оценка становится просто плохой. Тем самым статистическим оценкам параметров предъявлено требование устойчивости по отношению к малым отклонениям от предполагаемого теоретического распределения и по существу поколеблено уважение к таким фундаментальным понятиям математической статистики, как эффективность и достаточность.

Выступление Дж. Тьюки стало началом нового научного направления в статистике, называемого устойчивостью, или робастностью (от английского robust - здоровый, крепкий, здравый) оценивания. При этом на протяжении по крайней мере двадцати лет в каждой работе, посвященной робастности, делались ссылки на статью Дж. Тьюки. Поэтому проследить за новым направлением можно было просто по ссылкам на эту статью, особенно если они сопровождались кратким изложением ее содержания. (Обсуждение примера будет продолжено через два абзаца.)

Самое опасное в информационном обеспечении научной деятельности - это отсутствие информации о новации. Поэтому о научной полноте источника информации в простейшем случае можно следить по времени появления на его страницах ссылок или других видов отражения новаций. Опишем формально механизм, в рамках которого можно учитывать скорость отражения новаций.

Каждый институт (коллективный пользователь библиотеки) периодически (раз в несколько лет) составляет список принципиальных для развития науки новаций - L - в области его деятельности за последние годы, указывая, в каких источниках эти новации впервые опубликованы. Эти списки вместе с определением понятия отражение новации в источнике передаются в библиотеку. Для разных областей знания могут использоваться разные критерии отражения. В простейшем случае (как в примере) за отражение можно принять просто ссылку на соответствующую работу с кратким изложением ее содержания. В любом случае понятие отражение должно быть изложено в терминах, доступных работнику информационной службы. Руководствуясь списками, сотрудники библиотеки определяют для каждого источника информации дату, когда в нем впервые была отражена новация. Отсюда простым вычитанием определяется время запаздывания отражения новации в данном источнике - t. То, что запаздывание может быть огромным и что ему необходимо уделять внимание, убедительно показано в работе [7]. Далее для каждого подмножества источников - A - можно подсчитать долю новаций d(t) из списка, отраженную за время t, прошедшее после первого опубликования новации, по крайней мере в одном из источников подмножества A. Неубывающая функция f(t|A,L) = d(t) указывает долю новаций из списка L, отраженных в рассматриваемом подмножестве источников A с запаздыванием не выше t. Мы предлагаем использовать функцию f(t|A,L) в качестве одной из характеристик информационной полноты подмножества источников A по отношению к нуждам пользователя, составившего список L. Практическое применение функций f(t|A,L) - это отбор оптимального репертуара библиотеки при данной стоимости заказа.

Продолжим обсуждение примера. В таблице (прил.), составленной для данной статьи Л.Д.Мешалкиным и А.М.Шурыгиным, перечислены ключевые моменты развития идей и методов устойчивости, при этом каждый результат снабжен двумя баллами. Балл А - за влияние на последующее развитие теории и балл Б - за практическую важность предложения. Обратите внимание, что баллы за теоретическое значение и значение для практики не всегда совпадают. Кроме того, некоторые результаты открывались несколько раз.

Безусловно, таблица имеет определенную субъективную окраску, но общую тенденцию возникновения нескольких частично изолированных центров развития и параллельного появления новых идей она отражает. Покажем теперь, как для усиления понятия отражение можно использовать знание, таблицы. Для простоты будем считать, что каждому результату присвоен только один балл, называемый его весом.

Для каждого направления науки - i - и момента времени - T - можно подсчитать общий вес результатов - Wi,o(T) - в направлении i, полученных в мире до момента T, считая параллельно открываемые результаты только один раз. Точно также для каждой группы источников A можно подсчитать вес результатов - Wi,a(T,t) - направления i, отраженных в входящих в группу изданиях с запаздыванием не более t при дополнительном условии, что результаты получены до момента T-t. Обозначим долю весов новаций - di(t)=Wi,a(T,t)/Wi,o(T-t) - из таблицы, отраженную в группе источников через время t после их опубликования. Усредним теперь величины di(t) по всему списку направлений данной науки и обозначим полученный результат - Ed(t). Величины Ed(t) можно использовать в дальнейшем вместо d(t).

Новые функции библиотеки. В качестве вторичного продукта оценки информационной полноты возникает возможность подбора для конкретного пользователя набора источников, в совокупности наиболее полно отражающих интересующий именно его подсписок тем - LL, отобранных из L. Таким образом пользователь получает оптимальный список доступных источников, которые он должен регулярно просматривать при работе над темой. Работа со списком L исследователей института, непосредственно заинтересованных в научной состоятельности списка, позволяет запустить механизм уточнения списков. Из анализа списков L и LL можно выяснить:

соответствие представления о новациях руководства (ученого совета) НИИ представлению о них индивидуальных исследователей;

долю новаций в предметной области, которую отслеживают сотрудники конкретного НИИ;

долю новаций, которую отслеживают сотрудники отделения РАН (групп НИИ) определенного направления;

соответствие закупаемой библиотекой информации непосредственным интересам сотрудников НИИ.

Как видно из перечня, функции фундаментальной библиотеки заметно расширяются и библиотека становится центром, добывающим новые данные об использовании информации в научном процессе.

Новые трудовые ниши для ученых. Работа над систематизацией развития научных направлений, необходимая для оценки информативности научных изданий, может иметь чисто практическое приложение для ученых. Ведь эта работа является необходимым звеном в составлении аналитических обзоров, которые может оплачивать Российский фонд фундаментальных исследований.

С 1997 г. в медицине функционирует служба подведения итогов медицинских исследований методом метаанализа - Cochrane Collaboration; недавно в Москве, в издательстве Медиа Сфера открыто ее представительство. Служба выпускает обзоры, рассчитанные на практических врачей мира и распространяемые на компакт-дисках. В составлении обзоров принимают участие тысячи ученых. Нам кажется, что подобные организации могут быть созданы не только в медицине, но и в других направлениях науки. По европейским стандартам Cochrane Collaboration является некоммерческой организацией, тем не менее работа исследователей поддерживается материально. Некоммерческая по европейским стандартам поддержка в условиях России весит очень существенно и может помочь сохранить научный потенциал страны без дополнительных ассигнований со стороны государства.

Базовые понятия, используемые при обсуждении
деятельности фундаментальных библиотек

При системном анализе роли научных библиотек необходимо отдельно рассмотреть различные источники информации и их характеристики, структуру индивидуальных и коллективных пользователей библиотек, указать различные инструменты, с помощью которых строятся оценки качества и использования информации. После этого можно перейти к систематизации показателей качества источника информации и показателей характеристики деятельности библиотек, а также предложить некоторые критерии оптимизации комплектования библиотек. Специальное внимание мы уделяем условным характеристикам качества, когда в качестве условий выступают группы научных направлений и отдельные группы пользователей.

Источники информации. В настоящее время целесообразно различать следующие источники информации [8]:

традиционные печатные первоисточники;

традиционные печатные реферативные издания;

традиционные печатные справочные библиографические издания, например журналы типа Current Contents и SCI;

полные тексты статей на CD;

материалы научных конференций на CD. (Это особенно важный источник информации, так как некоторые конференции помещают на компакт-диск все поступившие на конференцию материалы. В таком случае диск представляет собою как бы срез существующих в данный момент идей, в том числе и идей, которые не были включены оргкомитетом в конференцию.);

реферативные поисковые системы на CD;

электронные версии журналов, получаемые по теледоступу со специального сервера;

электронные оглавления журналов;

электронные справочники по предметным областям.

межбиблиотечный абонемент. (МБА в строгом смысле - не источник информации, а средство его доставки. Но с точки зрения библиотеки удобно абонемент рассматривать в качестве источника, имеющего стоимость и спрос.);

международный межбиблиотечный абонемент (ММБА).

Различение информации по видам носителей (традиционные печатные, компакт-диски, электронные средства связи, почта) связано прежде всего с резкими различиями в цене различных компонент жизненного цикла информации на разных носителях [9], надежностью дальнейшего получения информации по электронным каналам, скоростью получения информации и наконец навыками пользователей работать с новыми видами и носителями информации.

В реальной деятельности необходимо, чтобы все источники информации учитывались в рамках одной информационной системы, позволяющей по характеристикам индивидуальных источников информации вычислять характеристики подмножеств источников. Паспорт источника должен обязательно содержать ссылки на информационно близкие к нему другие источники.

Пользователи информации. Для полноты информационного обслуживания библиотеки должны иметь научные паспорта коллективных пользователей (институтов). В паспорте указывается штатная численность ученых соответствующего института и цифры, характеризующие реальный спрос сотрудников на различные виды услуг. Отдельно следует учитывать списки новаций, периодически составляемые институтами, и тематику работ, указываемую при подборе источников для сотрудников института. Как уже отмечалось, сравнение "официального списка" новаций в данной области знания со списком тем, над которыми реально работают сотрудники соответствующих институтов, представляет несомненный интерес для руководства профильных институтов, а в ряде случаев и для руководителей групп НИИ.

Показатели, с помощью которых строятся оценки качества и использования информации, подразделяются на три вида: характеристики спроса, характеристики качества и использования источников и характеристики информационной близости источников информации.

Спрос на получение информации характеризуется числом заказов на получение данного источника (подмножества источников) информации, включая ММБА и электронные носители информации.

Показатели, характеризующие качество и использование информации:

число цитирований источника (подмножества источников) сотрудниками института [10];

экспертные оценки старения информации по отдельным направлениям науки [11];

измерение информативности подмножества источников с помощью введенных в начале статьи функций f(t|A,L);

показатель (в процентах) научной заинтересованности пользователей в основных достижениях мировой науки данного направления.

Показатели, характеризующие близость по информационному содержанию двух источников - это предмет дальнейших исследований. В настоящее время можно использовать экспертные оценки близости содержания.

Практика библиотечной работы и интересы руководства коллективными исполнителями могут помочь существенно расширить предложенный здесь список показателей.

Библиометрические характеристики источника информации удобно разделить на абсолютные, условные и комбинированные, которые являются функциями от абсолютных и условных показателей.

Абсолютные показатели:

объем информации источника;

оценка источника по специальной шкале, отражающей удобство пользования этим источником. Эта характеристика предлагается, главным образом, для источников с библиографической информацией. (Пользоваться библиографическими системами на компакт-дисках значительно удобнее, чем их бумажными аналогами. Однако и компьютеризованные системы различаются по вниманию, уделяемому удобству пользователя.);

стоимость компонент жизненного цикла источника [9];

стоимость удовлетворения одного запроса на источник;

среднее запаздывание поступления информации.

Условные показатели:

спрос на источник данной группой пользователей (условие - группа пользователей);

цитирование источника данной группой пользователей (условие то же);

экспертная оценка группой экспертов относительной важности источника для данной предметной области (условия: состав экспертов и предметная область);

информативность источника по отношению к данному списку тем, оцениваемая с помощью функции f(t|источник,L) (условие - список тем).

Комбинированные показатели:

отношение цены жизненного цикла источника к ожидаемому спросу на него в течение этого периода. Эта характеристика является одной из важнейших при комплектовании, так как указывает среднюю стоимость для библиотеки выполнения одного запроса с помощью данного источника;

отношение цены жизненного цикла источника к экспертной оценке важности его информационного содержания. Эта характеристика в неявном виде используется сегодня при комплектовании. Она построена по тому же принципу, что и предшествующая оценка, но оценка понятия важность информационного содержания не конкретизирована. Поэтому предпочтение следует отдавать предшествующей характеристике как более объективной. Если важность информационного содержания измерять оценкой ожидаемого спроса на источник, то обе оценки совпадут.

После того как введены характеристики отдельных источников, можно перейти к рассмотрению библиотеки в целом.

Показатели деятельности библиотеки строятся на основании характеристик источников информации и имеют близкую классификацию.

Абсолютные показатели:

обеспеченность первичной информацией в натуральных единицах;

обеспеченность библиографическими и реферативными изданиями;

интегральные (валовые) объемы обслуживания;

список функций библиотеки (уже указывалось, что возможны новые услуги индивидуальным и коллективным пользователям библиотеки);

детальное описание научных интересов коллективных пользователей библиотеки в виде списков L и других подобных материалов;

сводное описание провозглашенных и реально реализуемых научных интересов индивидуальных пользователей;

основные принципы формирования репертуара библиотеки.

Обобщенные итоговые характеристики, построенные путем взвешивания однотипных условных по отношению к направлению науки показателей (перечень носит предварительный характер и легко может быть расширен):

полнота удовлетворения запросов пользователей. Оценки желательно строить каким-либо объективным методом, например путем сопоставления ожидаемых запросов и возможности их удовлетворения;

среднее время запаздывания и полнота поступающей информации, оцениваемая с помощью функций f(t|A,L);

интенсивность использования ресурсов библиотеки научными сотрудниками институтов;

расстояние между "идеальным" и реальным использованием ресурсов. (Этот показатель отражает, в частности, насколько эффективно библиотеке удается обучать читателей использованию новых информационных возможностей.)

Принципы формирования оптимального репертуара

Известно, что любая неопределенная задача решается лучше, если неизвестные качественные понятия удается оцифровать, хотя бы приближенно, и свести решение реальной проблемы к решению некоторой математической оптимизационной задачи. Сопоставление ответов, ожидаемого и полученного в ходе решения оптимизационной задачи, обычно помогает улучшить качество отображения реального мира в мир математический и тем самым способствует решению исходной задачи.

Комплектование - одна из основных задач каждой фундаментальной библиотеки. Для направлений науки, в которых может хорошо работать предложенная в начале статьи технология или какой-либо ее аналог, можно при комплектовании заказа использовать один из двух оптимизационных критериев.

Первый критерий - это подход с точки зрения максимума качества информации. С помощью проведенных оценок находится наиболее информативное в смысле функций f(t|A,L) подмножество источников, которое удовлетворяет финансовым ограничениям. Это подмножество и закупается.

Второй критерий - подход со стороны максимального удовлетворения ожидаемого спроса на источники информации. По предшествующему опыту прогнозируется спрос и рассчитывается ожидаемая стоимость обслуживания одного заказа для каждого из источников. Далее источники упорядочиваются в порядке возрастания стоимости обслуживания одного заказа и отбираются с учетом стоимости до тех пор, пока не будут исчерпаны финансовые возможности.

Первый подход более сложен, так как требует большой предварительной подготовки. Однако он предпочтителен, поскольку уменьшает дублирование информации и менее зависит от сложившихся традиций работы с нею читателей.

 

* * *

Итогом реализации предлагаемой программы должно стать усиление роли фундаментальных библиотек в научном процессе. Это достигается путем усиления адресности информационного обеспечения. Введение новых функций библиотек достигается, главным образом, благодаря повышению качества и полноты переработки информации. Подключение коллективных пользователей к оценке информативности источников научной информации не обременительно для институтов, так как эта работа должна быть частью их профессиональной деятельности. Кроме того, коллективные пользователи различных уровней иерархии получают очень важную отдачу за потраченные усилия. Техническая сторона анализа и инициатива поиска новых показателей качества информации остается за библиотеками. Это будет способствовать росту сотрудничества между НИИ и фундаментальными библиотеками. Работа по оптимизации репертуара библиотек в целом должна способствовать удешевлению научного обеспечения НИР.

Программа только намечает план действий. Его детализация и реализация потребуют объединенных усилий специалистов конкретных областей знания, включая организаторов науки, информационных работников и экономистов. При этом надо подумать о целенаправленной подготовке кадров для предстоящей деятельности. В этом отношении вызывает тревогу, что исследовательские отделы ведущих фундаментальных библиотек заняты в основном налаживанием коммуникационных связей и техническим перевооружением и не уделяют внимания вопросам, поднятым в настоящей статье.

Список литературы

1. Мешалкин Л.Д., Гольдберг С.И. Интеллектуальные системы: освоение новых методов. Природа. 1994. № 10. С. 66-75.

2. Захаров А.Г. Библиотека по естественным наукам РАН и новые информационные технологии // Проблема интеграции информационных ресурсов. М., 1998. С. 114-118.

3. Арский Ю.М. ВИНИТИ в системе научной и технической информации на рубеже XXI века // Тр. конф. "НТИ-99. Интеграция. Информационные технологии. Телекоммуникации.". М.: ВИНИТИ, 1999.

4. Земсков А.И. Научно-технические библиотеки на пороге информационного общества: взгляд инженера // Там же.

5. Арский Ю.М. Задача ВИНИТИ как национального информационного центра на современном этапе формирования информационного общества // Проблема интеграции информационных ресурсов. М., 1998. С. 9-17.

6. Айвазян С.А., Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Основы моделирования и первичная обработка данных. М.: Финансы и статистика, 1983. С. 341-343.

7. Дубров А.П. Сроки поступления зарубежной научной информации // Науч. и техн. б-ки. 1998. № 4. С. 47-51.

8. Васильчиков В.В., Харыбина Т.Н., Слащева Н.А., Черкасова И.Ю. Состояние и перспективы информационного обслуживания в центральной библиотеке Пущинского научного центра РАН // Проблема интеграции информационных ресурсов. М., 1998. С. 163-169.

9. Земсков А.И. Информационно-библиотечное обеспечение науки // Проблема интеграции информационных ресурсов. Москва, 1998. С. 41-47.

10. Дубров А.П., Красикова О.Л. Использование цитат-анализа для изучения и формирование фонда иностранных журналов научных академических библиотек // Науч. и техн. б-ки. 1997. № 6. С. 26-34.

11. Дубров А.П., Мотенкова Е.Л., Красикова О.Л. Отношение ученых Российской академии наук к новым информационным технологиям // Там же. 1998. № 11. С. 17-27.


Copyright © 1995-99 ГПНТБ России