УДК 025.4.036
И. В. Зибарева
Опыт использования баз данных сети STN International
в библиотечно-информационной работе
Подытожен многолетний опыт использования баз данных международной
научно-технической информационной сети STN International в библиотечно-информационной работе.
Современный этап развития научно-технических библиотек характеризуется
активным использованием онлайновых библиографических баз данных. Наряду с
обслуживанием читателей такие БД, их кластеры и сети все шире применяются
большими библиотеками в исследованиях, проводимых в области
библиотечно-информационных наук [1].
Эти исследования отражают глобальную тенденцию последнего времени, охватывающую
и Россию (см., например, [2–7]), – превращение научно-технических
библиотек из упорядоченных хранилищ печатных изданий в современные информационные
центры.
Ряд библиотек проводит постоянный мониторинг текущего состояния,
динамики, тенденций и перспектив развития научных исследований на уровне
различных дисциплин, исследовательских организаций, государств, геополитических
регионов (см., например, [5, 6]). Эти работы, как правило, связаны с
различными видами библиометрического анализа и в целом свидетельствуют об
актуальности библиометрических исследований как части
библиотечно-информационных наук [2].
Важное место в подобных исследованиях занимает анализ цитирования.
До недавнего времени основным источником сведений о цитировании в области
естественных наук служила мультидисциплинарная БД «ScienceCitationIndex» (SCI) и информационные продукты на ее основе, производимые
«ThomsonReuters»
(ранее InstituteforScientificInformation). Наряду с БД SCI все шире используются мультидисциплинарная БД «Scopus» производства «Elsevier» [8] и поисковая система (ПС) GoogleScholar (GS) [9]. БД «Scopus»
является равноценной альтернативой БД SCI [10]. ПС GS иногда полезно дополняет
профессиональные библиографические БД, охватывая не учитываемые ими типы
источников, но не гарантируя полноту и релевантность найденной информации [11].
Химия – одна из естественных наук – движущих сил современного научно-технического
прогресса. В библиотечно-информационном аспекте химия примечательна тем, что
информация в ней крайне быстро накапливается и очень медленно стареет: в
настоящее время специализированная БД «ChemicalAbstracts» (СА), производимая «ChemicalAbstractsService» (CAS),
реферирует около 1 млн документов в год, а в современных публикациях
встречаются ссылки на работы вековой давности и более. В последнее время эта БД
также стала использоваться для анализа цитирования химических публикаций [12–14].
Базы данных SCI
и СА входят в состав международной научно-технической информационной сети ScientificandTechnicalNetworkInternational
(STNInternational) [15], объединяющей около 200БД. Помимо сети STN онлайновый доступ к БД SCI возможен через Всемирную паутину (WorldWideWeb), а к БД СА (и другим БД
производства CAS) –
через подписку с установкой специального программного обеспечения. В этом
случае рассматриваемые БД известны как WebofScience (WoS) и SciFinder,
соответственно.
Доступ к БД SCI
и БД СА через сеть STN
обладает рядом преимуществ, среди которых – возможность одновременного информационного
поиска в нескольких БД. Единый командный язык сети STN Messenger
обеспечивает эффективный многопараметровый статистический анализ поисковых
результатов, в том числе на очень больших массивах.
В Центре STN
Новосибирского института органической химии СО РАН накоплен более чем
десятилетний опыт совместного использования БД SCI и БД СА в библиометрическом изучении
российской химической науки. Полученные результаты, связанные с составлением и
последующим многофакторным анализом электронных библиографий некоторых ведущих
ученых, исследовательских институтов и журналов, обобщены ранее [7]. Хронологические рамки исследования
– 1920–2006 гг.; отдельныебиблиографии
содержали до 66 350 записей.
Ясно, что подобный охват возможен только при использовании онлайновых
БД, и что лишь электронный характер библиографий, позволяющий применять
современные компьютерные технологии, обеспечивает их содержательный
многопараметровый анализ, оперативное обновление и предоставление пользователю
в наиболее удобной для дальнейшей работы форме.
Совместное применение двух БД с различной номенклатурой реферируемых
источников и способами индексирования информации обеспечило всесторонний охват
интересующих документопотоков, невозможный при отдельной работе с любой из них.
На примере отечественныххимических исследований
показано, что совместное использование БД SCI и БД СА сети STN дает более полный отбор публикаций,
подтвержденный независимой проверкой, и что БД CA наряду с БД SCI может применяться для изучения цитирования российских публикаций,
начиная с 1996 г. [7, 12].
Наряду с достоинствами использование онлайновых библиографических
БД в российских библиотеках имеет некоторые недостатки и ограничения, особенно
в контексте исследований. Во многом они обусловлены тем, что большинство БД
создавалось лишь для упорядоченного хранения и быстрого поиска информации – их
применение в библиометрических исследованиях не предполагалось. С этим связаны
основные проблемы – отсутствие стандартизации библиографических данных и
недостаточная полнота информации в некоторых полях [16]. Нередко это требует тщательного ручного редактирования
первичных результатов, в том числе с использованием независимой информации.
Определенной проблемой являются достаточно многочисленные и
разнообразные ошибки в БД. Как правило, они – результат технических ошибок
авторов публикаций, издателей журналов и (или) производителей БД, а в контексте российской науки – и неизбежное
следствие языковых различий.
Интересной специфической проблемой с недавних пор стало выявленное
нами двойное цитирование в БД российских публикаций. Ведущие отечественные
журналы сейчас издаются как правило в двух версиях – оригинальной и переводной.
Некоторые международные журналы при цитировании публикаций из таких изданий
требуют давать, как одну, ссылку на обе версии. В БД, однако, каждая подобная
ссылка рассматривается как две, что завышает формальные библиометрические
показатели отечественных авторов и организаций [16].
Безусловно, все отмеченные проблемы и ограничения необходимо
тщательно учитывать при использовании БД сети STN в библиотечно-информационной работе,
а двойное цитирование отечественных публикаций – и в планируемом ежегодном
государственном статистическом наблюдении результативности научных организаций.
На основании поисков в БД CA и БД SCI
получены величины ряда библиометрических индикаторов (импакт-факторов отечественных
журналов, индексов цитирования российских публикаций и некоторых других),
сопоставленные затем с соответствующими показателями из специализированных БД «JournalCitationReports» (JCR) и «EssentialScienceIndicators» (ESI), производимых «Thomson Reuters».
Такое сравнение является содержательным, поскольку занижение в этих БД, по
разным причинам, библиометрических показателей не англоязычных документопотоков
отмечалось неоднократно, в том числе нами [7].
В частности, оно позволяет оценить, насколько корректно представлена в БД JCR и
БД ESI современная российская наука. Следует заметить, что тестирование
глобальных научно-технических БД на адекватность представления в них
релевантной отечественной литературы – актуальная задача библиотечно-информационного обслуживания.
Методики оперативного составления библиографий и библиографических
пособий с использованием онлайновых БД имеют практическую ценность, так как
тесно связаны с техническим и технологическим обеспечением библиографической
деятельности.Один из примеров, основанный на
проведенном в сентябре 2008 г. в БД CA и БД SCI
информационном поиске по теме «Нанонаука и нанотехнология в России» и
возможностях командного языка STNMessenger,
приведен ниже.
В результате поиска по контролируемым
терминам этих БД, содержащим префикс «нано-», получены два массива относящихся
к России данных, в которые вошли 4 506 публикаций из БД SCI и 6 073 публикаций из БД CA.
Командный язык сети STN содержит специальный алгоритм автоматического выявления и
удаления дубликатов при генерации библиографического списка на основе разных
БД. Однако оригинальные и переводные версии публикаций, имеющие различную
нумерацию страниц, этот алгоритм не выявляет.Была
использована другая возможность командного языка – превращение найденных
публикаций в «отформатированные ссылки», содержащие имя первого автора, год,
номера тома, выпуска и первой страницы публикации. Например, найденная в БД CA
публикация С. П. Губин.
Наночастицы палладия // Российский химический журнал. – 2006. – Т. 50. – № 4. –
С. 46–54 трансформируется в «GUBIN S
P, 2006, V50, P46».
Сопоставление таких ссылок из двух БД позволило отобрать неидентичные
публикации и получить общий список российских работв
области нанонауки и технологии, включающий (на сентябрь 2008 г.) 9 242
наименования, что составляет 87,4 % от общего числа найденных в двух БД публикаций.
Малое число дубликатов указывает, что в рассматриваемом случае БД SCI и БД СА кардинально
дополняют друг друга. Этот результат также свидетельствует о том, что в
рассматриваемом случае БД CA
предстает скорее как мультидисциплинарная, а не просто химическая БД, поскольку
в ней отражены физические, материаловедческие и биомедицинские исследования,
связанные с нано- наукой и технологией.
Полный просмотр полученного списка – довольно трудоемкая и достаточно
дорогостоящая задача.Однако с помощью команды Analyze из него можно извлечь распределения публикаций по
типам и (или) организациям; ранжировать авторов, журналы, контролируемые
(индексируемые) термины по частоте встречаемости. Другая команда – Tabulate – позволяет соотнести ранжированные распределения с
«отформатированными ссылками» и получить таблицу (фрагмент показан ниже),
которую при необходимости можно дополнить соавторами, контролируемой
терминологией и т.д. Такая таблица позволяет легко составить библиографическое
пособие по различным аспектам изучаемой
проблемы, отобрать обзорные публикации, труды конференций, патенты, сгруппировать
публикации по тематическим разделам и др.
Пример
обработки поисковых результатов по российской нано-науке
и технологии с помощью командного языка STNMessenger
Отформатированная ссылка
|
Источник публикации
|
Тип
публикации
|
Адрес автора
|
Рубрика
БД CA
|
ABALYAEVA V V, 2006, P47
|
Al’tern. Energ. Ekol.
|
Journal
|
Inst. Problem Khim. Fiz., RAN, Chernogolovka, 142432, Russia
|
Electrochemistry
|
BABUSHKINA N, 2006, V212, P101
|
NATO Sci. Ser., II
|
Journal
|
Department of Physics, Ural State University, Yekaterinburg, 620083,
Russia
|
Nonferrous metals and alloys
|
KHLESTKIN V K, 2008, V24, P609
|
Langmuir
|
Journal
|
Novosibirsk Institute of Organic Chemistry, Novosibirsk, 630090, Russia
|
Surface chemistry and colloids
|
KOGAN
B Y, 2006, V2, P71
|
NSTI Nanotech 2006, NSTI Nanotechnology Conference and Trade Shoёw,
BOSTON, MA, United States, May 7-11, 2006
|
Conference;
Computer optical disk
|
Organic Intermediates and Dyes Institute, Moscow, 123995, Russia
|
Radiation Biochemistry
|
PANIN V E, 2007, P123
|
|
Book
|
Russia
|
Nonferrous metals and alloys
|
RU 2281122, 2006
|
|
Patent
|
Gos. Obraz. Uchrezh-denieVyssh. Prof. Ob-raz. “Mosk. Gos. Inst. Stali i Splavov”, Russia
|
Pharmaceuticals
|
ZLOBINVA, 2005, V5824, P23
|
Proc. SPIE-Int. Soc. Opt. Eng.
|
General review; Journal
|
All-Russian Electrotechnical Institute, Moscow, 111250, Russia
|
Radiation chemistry, photochemistry, and photographic
and other reprographic processes
|
ZOLOTUKHIN I V, 2006, P45
|
Al’tern. Energ. Ekol.
|
General review
|
VoronezhGos. Tekh. Univ., Voronezh, 394026, Russia
|
Ceramics
|
IVANOVSKAYA V, 2005, P9
|
Nanostructures
|
Conference;
General review
|
Institute of Solid State Chemistry, Ural
Branch, Russian Aca-demy of Sciences, Yekaterinburg, 620219, Russia
|
Electric phenomena
|
SYSOEV V V, 2007, V7, P3182
|
Nano Lett.
|
Journal
|
Department of Physics, Saratov State Technical University, Saratov,
410054, Russia
|
Inorganic Analytical Chemistry
|
Полученный опыт позволяет рассмотреть онлайновые БД – один из
элементов системы документальных коммуникаций (СДК) – в связи с другими
элементами системы – читателями и библиотечно-информационными работниками.
В настоящее время библиографы и (или) другие библиотечно-информационные
специалисты проводят многочисленные поиски библиографической информации в
разнообразных БД. Это, во-первых, поиск по запросам читателей (ИРИ,
библиографические справки), для составления библиографических пособий и др.Во-вторых, поиски, связанные с переходом РАН на
специальную систему показателей результативности научной деятельности
сотрудников (ПРНД) и предстоящим общим переходом Российской Федерации к новому
порядку оценки результативности научных организаций, – в обоих случаях на
основе, в сущности, библиометрических индикаторов. И, наконец, поиски в рамках
выполняемых библиотеками собственных библиометрических исследований.
Таким образом, регулярно работая с БД, библиографы имеют возможность
досконально изучить их свойства с тем, чтобы, рекомендуя БД пользователям
(прямая связь), объективно характеризовать возможности, преимущества,
недостатки и ограничения БД. При этом они могут сообщать о замеченных
недостатках, ограничениях и ошибках производителям БД (обратная связь), т.е. работать
на улучшение БД. Контакт с издателями (производителями первичной информации)
также важен, поскольку библиографические БД создаются на основе именно их
продукции. В результате такой работы библиотечных специалистов БД как элемент
СДК претерпевают изменения.
Кроме того, при проведении в БД поисков, например, по запросам читателей,
помимо библиографического списка публикаций по определенной теме библиограф при
помощи современных технологий может получать различную дополнительную информацию:
распределение публикаций по видам; геолокация авторов; списки наиболее активных
и (или) цитируемых авторов и (или) институтов и др. Другими словами, библиограф
может провести аналитическую обработку полученных библиографических списков.
При этом происходит прибавление ценности
(value-adding) к запрошенной читателем
информации, причем в удобном для дальнейшего анализа виде.
Наконец, творческое использование БД дает возможность получения
новых библиометрических индикаторов (из недавних можно отметить индексы Хирша и
Эгге), т. е. способствует дальнейшему развитию и совершенствованию
библиометрических методов, представляющих интерес для
библиотечно-информационного сообщества.
Таким образом, использование возможностей современных БД вкупе с
библиометрическими методами и новейшими информационными технологиями позволяет
библиотечно-информационному специалисту существенно повысить качество
предоставляемых читателям услуг. Он может: 1) более полно удовлетворять
потребности читателя посредством добавления ценности к запрошенной информации и
тем самым максимально реализовывать свои поисковую, оценочную и
рекомендательную функции; 2) проводить собственные библиометрические
исследования; 3) участвовать в совершенствовании БД, взаимодействуя с их
производителями (вендорами).
Можно надеяться, что комплексные библиометрические исследования
науки в российских научно-технических библиотеках с использованием онлайновых
библиографических БД получат дальнейшее развитие. Этому, в частности,
способствует возрастающая доступность таких БД, как WoS, JCR, ESI, Scopus и
некоторых других, а также появление в них новых возможностей анализа поисковых
результатов. Этим исследованиям также будет содействовать появление встроенных
программ обработки данных в БД производства ВИНИТИ, открытие общего доступа к
БД РФФИ, а также завершение работ по созданию Российского индекса научного
цитирования (РИНЦ).
Автор благодарит РФФИ за
финансовую поддержку (проект
№ 08-06-00337).
Список источников
1.
Wormell I. Databases as analytical tools / I. Wormell. – // Encyclopedia
of Library and Information Science. – N. Y. : Marcel Dekker, 2000. – Vol. 70. –
Suppl. 33. – P. 77–92.
2. Слащева Н. А. Наукометрические
исследования в библиотеке (на примере Центральной библиотеки ПНЦ РАН) //
Н. А. Слащева // Науковедение. – 2002. – № 3. – С. 147–154.
3. Слащева Н. А. Электронная
информация в наукометрических исследованиях / Н. А. Слащева,
Ю. В. Мохначева // НТИ. Сер. 1. – 2003. – № 5. – С. 21–27.
4. Мохначева Ю. В. Избирательное
распространение информации как библиотечный сервис: основные цели, задачи,
методы / Ю. В. Мохначева, Т. Н. Харыбина // Науч. и техн.
б-ки. – 2008. – № 5. – С. 62–67.
5.
Информационные ресурсы региона: принципы формирования, организационная,
видовая структура / отв. ред. Е. Б. Соболева; ГПНТБ
СО РАН. – Новосибирск, 2000. – 167 с.
6. Состояние и развитие
основных направлений научных исследований: библиометрический анализ : сб. науч. тр. / ГПНТБ СО РАН ; [редкол.: Е. Б. Соболева
(отв. ред.) и др.]. – Новосибирск, 2003. – 183 с.
7. Зибарева И. В. Некоторые аспекты
библиометрических исследований в Сибирском отделении Российской академии наук /
И. В. Зибарева, И. В. Курбангалеева,
Н. С. Редькина, Б. С. Елепов // Библиотековедение. – 2008.
– № 3. – С. 39–45.
8.
De Moya-Anegon F. Coverage analysis of Scopus: a journal metric
approach / F. De Moya-Anegon, Z. Chinchilla-Rodriguez,
B. Vargas-Quesada, E. Corera-Alvarez, F.J. Munoz-Fernandez,
A. Gonzales-Molina, V. Herrero-Solana // Scientometrics. – 2007. –
Vol. 73. – N 1. – P. 53–78.
9.
Bar-Ilan J. Some measures for comparing citation databases /
J. Bar-Ilan, M. Levene, A. Lin // J. Informetrics. – 2007.
– Vol. 1. – N 1. – P. 26–34.
10.
Norris M. Comparing alternatives to the Web of Science for coverage of
social sciences’ literature / M. Norris, C. Oppenheim // J. Informetrics.
– 2007. – Vol. 1. – N 2. – P. 161–169.
11.
Noruzi A. Google Scholar: the new generation of citation indexes /
A. Noruzi // LIBRI: International Journal of Libraries and Information
Sciences. – 2005. – Vol. 55. – P. 170–180.
12.
Ridley D. D. Citation searches in on-line databases:
possibilities and pitfalls / D. D. Ridley // Trends Analyt. Chem. –
2001. – Vol. 20. – P. 1–10.
13.
Whitley K. M. Analysis of Scifinder Scholar and Web of Science
citation searches / K. M. Whitley // J. Am. Soc. Inform. Sci.
Technol. – 2002. – Vol. 53. –№ 14. – P. 1210–1215.
14. Зибарева И. В. ChemicalAbstracts: база данных для библиометрических исследований /
И. В. Зибарева, В. М. Бузник // Росс. хим. журн. – 2007. –
Т. 51. – № 3. – С. 166–171.
15.STNInternational [Электронный ресурс]. – Режим доступа: http://www.stn-international.de
16. Зибарева И. В. Опыт
использования библиографических БД для наукометрических исследований российской
химической науки / И. В. Зибарева, Н. В. Круковская //
Образовательные технологии и общество. – 2007. – № 1. – С. 297–303 [Электронный
ресурс]. – Режим доступа:
http://ifets.ieee.org/russian/depository/v10_i1/pdf/30.pdf
|