Научные и технические библиотеки №5 2003 год
Содержание:

Соколов А.В. Доживем до воскресения (Перспективы библиотечной профессии в XXI веке)

Госина Л.И., Алексеев Н.Г. Библиотечное объединение как система: структурные элементы и связи

Коломейчук Е.М. Типологические характеристики центральных универсальных библиотек в библиотечных законах субъектов Российской Федерации

Кожевникова Е.С. Социально-психологические последствия информатизации библиотек

Шмидт А.В. Мотивы и мотивация посещения библиотеки

Иванов С.А. Научные библиографии – важный источник библиометрических исследований


ЭЛЕКТРОННЫЕ КНИГИ
ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ

Земсков А.И. Электронные книги – новый взгляд

Вегнер Б. Полная цифровая библиотека по математике: некоторые проблемы структуры


22-я КОНФЕРЕНЦИЯ ИАТУЛ

Савениж Б. Проект «Рокада»: к новой модели научного общения

Хакала Ю. Библиотеки, метаданные и сохранность электронных ресурсов

Новости электронных библиотек (по материалам пресс-релиза компании Эльзевир)


ПРОФЕССИОНАЛЬНАЯ КВАЛИФИКАЦИЯ

Павлова Л.П. Должностные инструкции работников библиотеки: их назначение и роль (из опыта ГПНТБ СО РАН)

Сукиасян Э.Р. Иногда полезно сначала подумать и посмотреть вокруг

Сороколетова Н.В. Библиотека и компьютер. Обучение пользователей и персонала


ДИСКУССИОННЫЙ КЛУБ «ТЕРМИН»

Алешин Л.И. Технология и техника: вопросы терминологии


ЮБИЛЕИ

Гашумова Г.Т. Научная библиотека Дагестанской государственной медицинской академии: прошлое и настоящее


ИНФОРМАЦИОННЫЕ СООБЩЕНИЯ

Павлова Н.П. Программа ЮНЕСКО «Информация для всех» в России

Опарина О.Д. Итоги Всероссийской научно-практической конференции «Университетская библиотека: проблемы и решения»


НАШИ АВТОРЫ


УДК 002.2:51

Иванов С.А.

Научные библиографии –
важный источник библиометрических исследований

При проведении исследований ученые обращаются в мировую систему научной коммуникации для поиска необходимой научной информации. Эта информация может содержаться в различных источниках – книгах, справочниках, диссертациях, научных докладах, препринтах, статьях в периодических и продолжающихся изданиях.

К настоящему времени человечество накопило миллионы различных документов. Например, Библиотека Конгресса США хранит 7 млн документов, из которых 5 млн пред­ставлены в Интернете [1]. Объем информации, переведенной в электронную форму и доступной в Интернете, насчитывает около 2,5 млрд документов, состоящих из html-страниц с постоянными адресами [2].

Необходимая ученому научная информация рассеяна по самым различным источникам. Для преодоления этого свойства мировой системы научной коммуникации ученые систематизируют научную информацию по темам. Документальным отражением этого процесса становятся библиографии.

Тематическая область представлена основными видами публикуемых научных документов: статьями в периодических изданиях и научных сборниках, монографиями и книгами, тезисами докладов на симпозиумах и конференциях, диссертациями, препринтами и т.д.

Наибольшее значение для статистического анализа системы научной коммуникации представляют статьи в журналах (до 80–90% от общего числа документов) и книги (до 10%).

В зависимости от потребностей научного сообщества исторически сложились несколько видов библиографий:

  • списки трудов выдающихся ученых;
  • библиографии при обзорных статьях по новым тематикам;
  • библиографии, подготавливаемые институтами научной информации в момент наибольшего интереса научного сообщества к новым направлениям;

  • библиографии при первых монографиях по новым направлениям;

  • исчерпывающие тематические библиографии, охватывающие практически все документы, относящиеся к одной тематической области.

Наиболее интересным информационным объектом оказались исчерпывающие библиографии (full bibliography), на основе которых можно анализировать процессы создания нового научного знания. Временной период документов, входящих в них, много больше времени жизни отдельных ученых, научных школ и периодических изданий. Создание подобных библиографий стало возможным благодаря появлению Интернета, а достижения в области электронной обработки документов существенно упростили их подготовку.

 

Исторический экскурс

Процессам научной коммуникации посвящена монография А.И. Михайлова, А.И. Черного, Р.С. Гиляревского «Научные коммуникации и информатика» [3], в которой мировая система научной коммуникации впервые рассматривалась как целостный информационный объект. Исследования этой системы основаны на статистических методах анализа тематических библиографий, которые являются совокупностями тематически однородных документов. Эти совокупности обладают цельностью, документы в них связаны между собой формальной системой ссылок на предшествующие документы или семантическими связями.

Исторически анализ этих совокупностей связан с именем А. Лотки [4], который в 1926 г. впервые описал феномен распределения ученых, работающих в одной области, по количеству публикаций за определенный промежуток времени и построил эмпирические частотные распределения ученых по числу опубликованных работ (эмпирический закон Лотки). Полученное им распределение аппроксимируется гиперболической функцией:

,

где — число ученых, опубликовавших по i статей, +1=2.

В 1934 г. С. Бредфорд открыл второй феномен мировой системы научной коммуникации – закономерность рассеяния статей одной тематики в системе периодических изданий (закон Бредфорда) [5]. В 1949 г. Г. Ципф сформулировал этот закон в рамках гиперболических распределений [6].

Если упорядочить (проранжировать) периодические издания по мере уменьшения количества статей по определенной тематике, то это распределение может быть представлено в виде гиперболы:

,

где — число статей в журнале r-го ранга, (r = 1, 2, 3,...),
– показатель степени гиперболического распределения, в случае классического распределения Ципфа = 1,0.

Это распределение составляет основу наукометрических и библиометрических исследований документальных информационных массивов различной тематической направленности.

Дополнительно в информатике исследуется динамика документальных информационных потоков в различных областях науки. В большинстве случаев на больших временных (десятки лет) интервалах наблюдается экспоненциальное увеличение числа документов [7].

Эти методы, ранее использовавшиеся для исследования различных документальных массивов, положены в основу статистического анализа библиографий.

  

Роль библиографий в коммуникационных процессах

У многих ученых возникает потребность представлять научному сообществу библиографии документов (публикации в мировой научной печати, доклады, препринты и т.д.), найденных в библиотеках и созданных в рамках работы над научными проектами. Многие ученые осознали важность такой информационной работы, позволяющей сохранить для следующих поколений исследователей не только результаты их научной деятельности, но и документальное представление тематической области на основании оригинальных научных документов.

Среди них наиболее ценными информационными объектами оказались исчерпывающие библиографии документов, относящихся к одной тематической области на протяжении всей истории ее развития. Такие информационные документы создавались как отдельными энтузиастами-учеными, так и целыми международными коллективами в рамках исследовательских проектов. Ранее создание таких библиографий предпринималось, как правило, отдельными учеными при их первых монографиях по новым научным направлениям.

Сегодня научное сообщество осознало, что успешное развитие любого нового научного направления во многом зависит от привлечения в данную тематическую область новых сил. Для этого молодые ученые должны получить максимально возможное представление о состоянии выбранной ими тематики и о задачах, которые предстоит решать.

Появление Интернета резко активизировало процессы создания библиографий. Если до возникновения электронных средств коммуникации было известно не более десяти исчерпывающих тематических библиографий, то сейчас их число приближается к сотне.

 

Библиографические ресурсы Интернета

Наиболее значимым событием в развитии системы научной коммуникации стало появление в Интернете информационных веб-сайтов различных научных школ (университетов, научных институтов, коллективов и т.д.) и даже отдельных ученых, многие из которых представляют на своих веб-страницах списки научных публикаций по тематике исследований.

Некоторые научные школы представляют электронные монографии по новым научным направлениям, не имеющие печатных аналогов. Например, монография «Информатика: библиометрия, наукометрия, информетрия" с подробным списком цитированной литературы [8], монография Р.Н. Костова «Наука и методология измерений» [9], посвященная количественным методам в науковедении; ее библиография содержит более чем 5 600 научных документов – это один из наиболее полных списков литературы по наукометрии.

Одними из первых роль и значение тематических библиографий оценили математики [10]. Можно отметить уникальную по объему библиографию по теории петель и узлов, состоящую из 4 167 документов, в том числе 3 126 статей 176 авторов из 383 периодических изданий, опубликованных в 1766–1991 гг.; 1 567 книг, 145 препринтов и т.д. [11].

Такие библиографии обладают устойчивыми статистическими закономерностями вне зависимости от тематической направленности. Эти закономерности связаны с особенностями функционирования мировой системы научной коммуникации, объединяющей работу мирового научного сообщества.

 

Исследование библиографии по конкретной теме

В качестве примера рассмотрим библиографию по фракталам и теории хаоса, представленную в Интернете [12]. В ее состав включены 1 147 документов, опубликованных в 1890–1998 гг., в том числе 778 статей 542 авторов в 255 периодических и продолжающихся изданиях, 122 статьи в различных непериодических сборниках, 3 доклада на различных конференциях, 225 книг, 3 автореферата диссертаций и др.

Семантический анализ документов позволяет предположить, что интересы составителей связаны с устойчивыми распределениями в социальных науках, физиологии, биофизике и их анализом с применением теории фракталов.

Книги составляют почти 20% от общего числа документов данной тематики. Если проследить динамику роста их количества в 1890–1998 гг., то получится следующая картина: к 1894 г. выпущена 1 книга, 1900 г. – 2, 1910 г. – 4, 1920 г. – 5, 1930 г. – 7, 1940 г. – 8, 1950 г. – 10, 1960 г. – 15,1970 – 32, 1980 г. – 57, 1990 г. – 167, 1998 г. – 225.

Начиная с 1945 г. эта зависимость может быть аппроксимирована экспоненциальной функцией:

1/г.,

где  – число книг, опубликованных к моменту времени t;
tо – начало участка экспоненциального роста;
– относительная скорость роста.

Среднее время удвоения количества книг – 10,5 лет.

Статьи составляют 68% от общего числа документов и рассеяны по изданиям различной тематической направленности. Если проследить динамику роста количества статей и журналов, в которых они опубликованы в 1890–1998 гг., то получится следующая картина: к  1890 г. выпущен 1 журнал и опубликована 1 статья, 1900 г. – 3 и 2, 1910 г. – 6 и 5, 1920 г. – 7 и 6, 1930 г. –10 и 9, 1940 г. – 11 и 10, 1950 г. – 15 и 14, 1960 г. – 27 и 24, 1970 г. – 57 и 42, 1980 г. – 106 и 67, 1990 г. – 569 и 211, 1998 г. – 778 и 255.

На интервале 1975–1993 гг. эти зависимости могут быть аппроксимированы экспоненциальными функциями:

для статей – , 1/г.,

где – число статей, опубликованных в журналах ко времени t;
 – относительная скорость роста количества статей;
среднее время удвоения числа статей – 5 лет;

для журналов – ,  1/г.,

где  – количество журналов со статьями ко времени t;
– относительная скорость роста числа журналов;
среднее время удвоения количества журналов на этом интервале – 7 лет.

В библиографии наблюдаются два периода, характерные для большинства новых научных направлений. Первый (1890–1975 гг.) – латентный (скрытый): в различных изданиях публикуются единичные статьи, которые в дальнейшем становятся наиболее цитируемыми; за это время опубликована 21 статья. Второй (1975–1995 гг.) – экспоненциальный рост числа статей и журналов. Этот период характеризуется повышением интереса научного сообщества к данной тематике и увеличением числа ученых, начинающих работать над ней. Так, в рассматриваемой библиографии имеются ссылки на публикации, широко цитируемые специалистами в области информатики [4, 5, 6, 7].

Одним из основных свойств мировой системы научной коммуникации является рассеяние статей по различным журналам. Авторы, как правило, публикуют свои статьи в изданиях соответствующей тематической направленности. Редакционные коллегии журналов отбирают для публикации статьи, представляющие, по их мнению, наибольшую научную ценность и отражающие различные аспекты развития тематической области. Интересы журналов шире интересов отдельной тематической области, причем документальный поток изданий значительно больше отдельного документального тематического потока, что приводит к крайне неравномерному распределению статей по различным изданиям.

Тематическая библиография отражает точку зрения составителей на предметную область, и коллекция документов отбирается по семантическому принципу. Поэтому публикации, собранные в тематической библиографии, оказываются рассеянными по широкому кругу изданий.

Отражением этого феномена стало ранговое распределение журналов по числу опубликованных статей из тематической библиографии. Вначале для каждого журнала определяется количество публикаций, затем журналы упорядочиваются по мере уменьшения числа статей; каждому журналу присваивается порядковый номер (ранг), начиная с первого. Для журналов с одинаковым числом статей ранги присваиваются последовательно, увеличиваясь на единицу. Полученное распределение может быть представлено множеством:

{N1(t), N2(t), N3(t), ...,Nr(t),...},

где t – момент времени создания библиографии (табл.).

В информатике данное дискретное распределение представляют на графике в двойных логарифмических координатах точками: по оси абсцисс – номера рангов, начиная с первого (г =1,2,3, ...), по оси ординат – число статей в журнале r-ранга.

Ранговое распределение журналов может быть аппроксимировано гиперболической функцией:

, диапазон ,

где  – число статей в журнале r-го ранга,
– показатель степени гиперболического распределения.

На графике в двойных логарифмических координатах эта аппроксимация данных представляет собой прямую линию с тангенсом угла наклона к горизонтальной оси – . Это гиперболическое распределение точно соответствует классическому распределению Ципфа, для которого =1.0.

Ранг журнала Число статей Ранг журнала Число статей
1 46 17 10
2 36 18–19 9
3 33 20–21 8
4–5 24 22–24 7
6 21 25–29 6
7 20 30–33 5
8–9 19 34–46 4
10 17 47–57 3
11 14 58–104 2
12–13 13 105–255 1
14–16 12

Наиболее продуктивными изданиями оказались Science – 46 статей (1962–1996 гг.), Biophysical Journal – 37 статей (1960–1995 гг.), American Journal of Physiology – 34 статьи (1950–1994 гг.).

В середине 1990-х гг. рост числа статей отклоняется от экспоненциальной зависимости; это связано с тем, что составители еще не успели включить в свою библиографию последние публикации.

Данную точку зрения подтверждает анализ близкой по тематике библиографии по теории динамического хаоса [13]. Эта наибольшая по объему из известных на сегодняшний день тематических библиографий создана научной группой под руководством Петера Е. Бекмана (Peter E. Beckmann; email: beckmann@mail.uni-mainz.de) из Университета Майнза в Германии (http://www.uni-mainz.de) и содержит 12 614 библиографических описаний документов по нелинейной динамике и близким тематически областям.

Вернемся к библиографии по фракталам и теории хаоса и рассмотрим распределение ученых по продуктивности (542 автора, 778 статей). Сгруппируем авторов по количеству статей (соавторство не учитывается). Пусть N(i=1) – число ученых, опубликовавших по одной статье, N(i=2) – по две, N(i=3) – по три и т.д. Рассмотрим распределение размеров групп для ученых, опубликовавших различное число статей (I=1, 2, 3, ...):

{N(i=1), N(i=2), N(i=3),...,N(i),...}.

Итог: 1 статью опубликовали 434 ученых, 2 – 64, 3 – 18, 4 – 9, 5 – 6, 64, 73, 9 – 1, 11 – 9, 15 –2.

Это дискретное распределение можно представить на графике в двойном логарифмическом масштабе точками: по оси абсцисс – число статей, опубликованных ученым, по оси ординат – размеры группы ученых с таким числом статей.

Данное распределение может быть аппроксимировано гиперболической функцией:

где  – число авторов с i опубликованными статьями,
– показатель степени гиперболического распределения.

На графике в двойных логарифмических координатах эта аппроксимация представляет прямую линию с тангенсом угла наклона к горизонтальной оси – (+1).

Значение > 1,0 отличается от классической величины = 1,0, соответствующей эмпирическому закону А. Лотки. В рассматриваемом информационном массиве преобладают ученые с небольшим числом опубликованных статей. Наиболее продуктивным автором оказался американский математик польского происхождения Б.Б. Мандельброт (B.B. Mandelbrot – 15 статей в 1967–1990 гг.); в библиографии присутствуют описания двух его известных книг: «The Fractal Geometry of Nature» и «Fractals: Form, Chance and Dimension».

Эти документы – лишь незначительная часть полного списка его научных трудов, включающего 9 книг и 176 публикаций с 1951 по 2000 г. (134 статьи в 63 периодических и продолжающихся изданиях, 18 тезисов выступлений на конференциях и симпозиумах, 23 статьи в книжных сборниках).

Проведенный статистический анализ позволяет сформулировать основные закономерности тематических библиографий:

  • существование латентного периода, продолжающегося десятки лет;

  • наличие периода экспоненциального роста числа публикаций, во время которого и создаются различные виды библиографий;

  • гиперболическое ранговое распределение журналов по числу статей, соответствующее эмпирическому закону Ципфа;

  • гиперболическое частотное распределение авторов по числу опубликованных статей (эмпирический закон А. Лотки).

Эти закономерности выполняются на тематическом информационном массиве, что позволяет высказать предположение, что они являются отражением динамического процесса формирования тематической области в мировой системе научной коммуникации, для которой характерно рассеяние публикаций одной тематики по большому числу изданий.

Мировая система научной коммуникации служит для объединения целенаправленной деятельности большого числа ученых, проживающих в разных странах, говорящих на разных языках и работающих в одном тематическом направлении.

 

Заключение

Интернет предоставил научному сообществу невиданные ранее возможности для создания библиографий по различным научным направлениям. С этим во многом связано появление большого числа библиографий, создаваемых различными научными коллективами по тематике их исследований.

Сегодня каждая научная школа имеет реальную возможность участвовать в коммуникационных процессах, представляя всему научному сообществу не только результаты своих исследований, но и описание предметной области, отраженной в ранее созданных документах.

Основываясь на анализе тематических коллекций документов, наукометрические исследования позволяют устанавливать объективные закономерности функционирования социального института науки, в частности законы продуктивности различных групп ученых и рассеяния публикаций по журналам.

 

Список литературы

  1. Dowling М. Libraries, Librarians and Library Association in the United States in 2001: Making a Difference in the Knowledge age // IFLA Journal. 2001, V. 27,
    N 3. Р. 133–142.

  2. Шумский С.А. Самоорганизующиеся нейронные сети // Научная сессия МИФИ–2001, 3-я Всерос. науч.-техн. конф. «Нейроинформатика–2001». М.: МИФИ, 2001. С. 182–211.

  3. Михайлов А.И., Черный А.И., Гиляревский Р.С. Научные коммуникации и информатика. М.: Наука, 1976. 432 с.

  4. Lotka A.J. The Frequency Distribution of Scientific Productivity // Journal of the Washington Academy of Science, 1926. V. 16. P. 317–323.

  5. Bradford S.C. Documentation. London: Crosby Lockwood, 1948. 156 p.

  6. Zipf G.K. Human Behaviour and the Principle of Least Effort. Addison – Wesley, Cambridge, 1949.

  7. de Solla Price D.J. Little Science, Big Science. New York: Columbia University Press, 1986. 301 p.

  8. Sciences of Information: Bibliometrics, Scientometrics, Informetrics. Noyer I.M. (Ed.). Solaris, N 2. Presses Universitaires de Rennes, 1995.
    http://www.info.unicaen.bnum/jelec/Solaris/d02/

  9. Kostoff R.N. Science and Technology Metrics.
    http://www.dtic.mil/dtic/kostroff/Metweb5_1.html

  10. Site of Bibliographies.
    http://liinwww.ira.uka.de/bibliography

  11. A Bibliography of Literature in Knots and Braids. Compiled by Joyce A.R. gopher:
    //math.berkeley.edu/00/Topology/Bibliography_on_Knots.html 

  12.   Fractals and Chaos References. National Simulation Resource. University of Washington.
    http://nsr.bioeng.washington.edu/NSR/NSR.html

  13. Beckmann Peter E. Bibliography of Chaos // Johannes Gutenberg – Universitat Mainz. 2001.
    http://www.uni-mains.de/FB/Physik/Chaos/Chaosbib.htm

  
На главную