УДК 025.4.036
И. В. Зибарева
Опыт использования баз данных сети STN International
в библиотечно-информационной работе
Подытожен многолетний опыт использования баз данных международной научно-технической информационной сети STN International в библиотечно-информационной работе.
Современный этап развития научно-технических библиотек характеризуется активным использованием онлайновых библиографических баз данных. Наряду с обслуживанием читателей такие БД, их кластеры и сети все шире применяются большими библиотеками в исследованиях, проводимых в области библиотечно-информационных наук [1]. Эти исследования отражают глобальную тенденцию последнего времени, охватывающую и Россию (см., например, [2–7]), – превращение научно-технических библиотек из упорядоченных хранилищ печатных изданий в современные информационные центры.
Ряд библиотек проводит постоянный мониторинг текущего состояния, динамики, тенденций и перспектив развития научных исследований на уровне различных дисциплин, исследовательских организаций, государств, геополитических регионов (см., например, [5, 6]). Эти работы, как правило, связаны с различными видами библиометрического анализа и в целом свидетельствуют об актуальности библиометрических исследований как части библиотечно-информационных наук [2].
Важное место в подобных исследованиях занимает анализ цитирования. До недавнего времени основным источником сведений о цитировании в области естественных наук служила мультидисциплинарная БД «ScienceCitationIndex» (SCI) и информационные продукты на ее основе, производимые «ThomsonReuters» (ранее InstituteforScientificInformation). Наряду с БД SCI все шире используются мультидисциплинарная БД «Scopus» производства «Elsevier» [8] и поисковая система (ПС) GoogleScholar (GS) [9]. БД «Scopus» является равноценной альтернативой БД SCI [10]. ПС GS иногда полезно дополняет профессиональные библиографические БД, охватывая не учитываемые ими типы источников, но не гарантируя полноту и релевантность найденной информации [11].
Химия – одна из естественных наук – движущих сил современного научно-технического прогресса. В библиотечно-информационном аспекте химия примечательна тем, что информация в ней крайне быстро накапливается и очень медленно стареет: в настоящее время специализированная БД «ChemicalAbstracts» (СА), производимая «ChemicalAbstractsService» (CAS), реферирует около 1 млн документов в год, а в современных публикациях встречаются ссылки на работы вековой давности и более. В последнее время эта БД также стала использоваться для анализа цитирования химических публикаций [12–14].
Базы данных SCI и СА входят в состав международной научно-технической информационной сети ScientificandTechnicalNetworkInternational (STNInternational) [15], объединяющей около 200БД. Помимо сети STN онлайновый доступ к БД SCI возможен через Всемирную паутину (WorldWideWeb), а к БД СА (и другим БД производства CAS) – через подписку с установкой специального программного обеспечения. В этом случае рассматриваемые БД известны как WebofScience (WoS) и SciFinder, соответственно.
Доступ к БД SCI и БД СА через сеть STN обладает рядом преимуществ, среди которых – возможность одновременного информационного поиска в нескольких БД. Единый командный язык сети STN Messenger обеспечивает эффективный многопараметровый статистический анализ поисковых результатов, в том числе на очень больших массивах.
В Центре STN Новосибирского института органической химии СО РАН накоплен более чем десятилетний опыт совместного использования БД SCI и БД СА в библиометрическом изучении российской химической науки. Полученные результаты, связанные с составлением и последующим многофакторным анализом электронных библиографий некоторых ведущих ученых, исследовательских институтов и журналов, обобщены ранее [7]. Хронологические рамки исследования – 1920–2006 гг.; отдельныебиблиографии содержали до 66 350 записей.
Ясно, что подобный охват возможен только при использовании онлайновых БД, и что лишь электронный характер библиографий, позволяющий применять современные компьютерные технологии, обеспечивает их содержательный многопараметровый анализ, оперативное обновление и предоставление пользователю в наиболее удобной для дальнейшей работы форме.
Совместное применение двух БД с различной номенклатурой реферируемых источников и способами индексирования информации обеспечило всесторонний охват интересующих документопотоков, невозможный при отдельной работе с любой из них. На примере отечественныххимических исследований показано, что совместное использование БД SCI и БД СА сети STN дает более полный отбор публикаций, подтвержденный независимой проверкой, и что БД CA наряду с БД SCI может применяться для изучения цитирования российских публикаций, начиная с 1996 г. [7, 12].
Наряду с достоинствами использование онлайновых библиографических БД в российских библиотеках имеет некоторые недостатки и ограничения, особенно в контексте исследований. Во многом они обусловлены тем, что большинство БД создавалось лишь для упорядоченного хранения и быстрого поиска информации – их применение в библиометрических исследованиях не предполагалось. С этим связаны основные проблемы – отсутствие стандартизации библиографических данных и недостаточная полнота информации в некоторых полях [16]. Нередко это требует тщательного ручного редактирования первичных результатов, в том числе с использованием независимой информации.
Определенной проблемой являются достаточно многочисленные и разнообразные ошибки в БД. Как правило, они – результат технических ошибок авторов публикаций, издателей журналов и (или) производителей БД, а в контексте российской науки – и неизбежное следствие языковых различий.
Интересной специфической проблемой с недавних пор стало выявленное нами двойное цитирование в БД российских публикаций. Ведущие отечественные журналы сейчас издаются как правило в двух версиях – оригинальной и переводной. Некоторые международные журналы при цитировании публикаций из таких изданий требуют давать, как одну, ссылку на обе версии. В БД, однако, каждая подобная ссылка рассматривается как две, что завышает формальные библиометрические показатели отечественных авторов и организаций [16].
Безусловно, все отмеченные проблемы и ограничения необходимо тщательно учитывать при использовании БД сети STN в библиотечно-информационной работе, а двойное цитирование отечественных публикаций – и в планируемом ежегодном государственном статистическом наблюдении результативности научных организаций.
На основании поисков в БД CA и БД SCI получены величины ряда библиометрических индикаторов (импакт-факторов отечественных журналов, индексов цитирования российских публикаций и некоторых других), сопоставленные затем с соответствующими показателями из специализированных БД «JournalCitationReports» (JCR) и «EssentialScienceIndicators» (ESI), производимых «Thomson Reuters». Такое сравнение является содержательным, поскольку занижение в этих БД, по разным причинам, библиометрических показателей не англоязычных документопотоков отмечалось неоднократно, в том числе нами [7]. В частности, оно позволяет оценить, насколько корректно представлена в БД JCR и БД ESI современная российская наука. Следует заметить, что тестирование глобальных научно-технических БД на адекватность представления в них релевантной отечественной литературы – актуальная задача библиотечно-информационного обслуживания.
Методики оперативного составления библиографий и библиографических пособий с использованием онлайновых БД имеют практическую ценность, так как тесно связаны с техническим и технологическим обеспечением библиографической деятельности.Один из примеров, основанный на проведенном в сентябре 2008 г. в БД CA и БД SCI информационном поиске по теме «Нанонаука и нанотехнология в России» и возможностях командного языка STNMessenger, приведен ниже.
В результате поиска по контролируемым терминам этих БД, содержащим префикс «нано-», получены два массива относящихся к России данных, в которые вошли 4 506 публикаций из БД SCI и 6 073 публикаций из БД CA.
Командный язык сети STN содержит специальный алгоритм автоматического выявления и удаления дубликатов при генерации библиографического списка на основе разных БД. Однако оригинальные и переводные версии публикаций, имеющие различную нумерацию страниц, этот алгоритм не выявляет.Была использована другая возможность командного языка – превращение найденных публикаций в «отформатированные ссылки», содержащие имя первого автора, год, номера тома, выпуска и первой страницы публикации. Например, найденная в БД CA публикация С. П. Губин. Наночастицы палладия // Российский химический журнал. – 2006. – Т. 50. – № 4. – С. 46–54 трансформируется в «GUBIN S P, 2006, V50, P46».
Сопоставление таких ссылок из двух БД позволило отобрать неидентичные публикации и получить общий список российских работв области нанонауки и технологии, включающий (на сентябрь 2008 г.) 9 242 наименования, что составляет 87,4 % от общего числа найденных в двух БД публикаций. Малое число дубликатов указывает, что в рассматриваемом случае БД SCI и БД СА кардинально дополняют друг друга. Этот результат также свидетельствует о том, что в рассматриваемом случае БД CA предстает скорее как мультидисциплинарная, а не просто химическая БД, поскольку в ней отражены физические, материаловедческие и биомедицинские исследования, связанные с нано- наукой и технологией.
Полный просмотр полученного списка – довольно трудоемкая и достаточно дорогостоящая задача.Однако с помощью команды Analyze из него можно извлечь распределения публикаций по типам и (или) организациям; ранжировать авторов, журналы, контролируемые (индексируемые) термины по частоте встречаемости. Другая команда – Tabulate – позволяет соотнести ранжированные распределения с «отформатированными ссылками» и получить таблицу (фрагмент показан ниже), которую при необходимости можно дополнить соавторами, контролируемой терминологией и т.д. Такая таблица позволяет легко составить библиографическое пособие по различным аспектам изучаемой проблемы, отобрать обзорные публикации, труды конференций, патенты, сгруппировать публикации по тематическим разделам и др.
Пример
обработки поисковых результатов по российской нано-науке
и технологии с помощью командного языка STNMessenger
Отформатированная ссылка |
Источник публикации |
Тип |
Адрес автора |
Рубрика |
ABALYAEVA V V, 2006, P47 |
Al’tern. Energ. Ekol. |
Journal |
Inst. Problem Khim. Fiz., RAN, Chernogolovka, 142432, Russia |
Electrochemistry |
BABUSHKINA N, 2006, V212, P101 |
NATO Sci. Ser., II |
Journal |
Department of Physics, Ural State University, Yekaterinburg, 620083, Russia |
Nonferrous metals and alloys |
KHLESTKIN V K, 2008, V24, P609 |
Langmuir |
Journal |
Novosibirsk Institute of Organic Chemistry, Novosibirsk, 630090, Russia |
Surface chemistry and colloids |
KOGAN B Y, 2006, V2, P71 |
NSTI Nanotech 2006, NSTI Nanotechnology Conference and Trade Shoёw, BOSTON, MA, United States, May 7-11, 2006 |
Conference; Computer optical disk |
Organic Intermediates and Dyes Institute, Moscow, 123995, Russia |
Radiation Biochemistry |
PANIN V E, 2007, P123 |
|
Book |
Russia |
Nonferrous metals and alloys |
RU 2281122, 2006 |
|
Patent |
Gos. Obraz. Uchrezh-denieVyssh. Prof. Ob-raz. “Mosk. Gos. Inst. Stali i Splavov”, Russia |
Pharmaceuticals |
ZLOBINVA, 2005, V5824, P23 |
Proc. SPIE-Int. Soc. Opt. Eng. |
General review; Journal |
All-Russian Electrotechnical Institute, Moscow, 111250, Russia |
Radiation chemistry, photochemistry, and photographic and other reprographic processes |
ZOLOTUKHIN I V, 2006, P45 |
Al’tern. Energ. Ekol. |
General review |
VoronezhGos. Tekh. Univ., Voronezh, 394026, Russia |
Ceramics |
IVANOVSKAYA V, 2005, P9 |
Nanostructures |
Conference; General review |
Institute of Solid State Chemistry, Ural Branch, Russian Aca-demy of Sciences, Yekaterinburg, 620219, Russia |
Electric phenomena |
SYSOEV V V, 2007, V7, P3182 |
Nano Lett. |
Journal |
Department of Physics, Saratov State Technical University, Saratov, 410054, Russia |
Inorganic Analytical Chemistry |
Полученный опыт позволяет рассмотреть онлайновые БД – один из элементов системы документальных коммуникаций (СДК) – в связи с другими элементами системы – читателями и библиотечно-информационными работниками.
В настоящее время библиографы и (или) другие библиотечно-информационные специалисты проводят многочисленные поиски библиографической информации в разнообразных БД. Это, во-первых, поиск по запросам читателей (ИРИ, библиографические справки), для составления библиографических пособий и др.Во-вторых, поиски, связанные с переходом РАН на специальную систему показателей результативности научной деятельности сотрудников (ПРНД) и предстоящим общим переходом Российской Федерации к новому порядку оценки результативности научных организаций, – в обоих случаях на основе, в сущности, библиометрических индикаторов. И, наконец, поиски в рамках выполняемых библиотеками собственных библиометрических исследований.
Таким образом, регулярно работая с БД, библиографы имеют возможность досконально изучить их свойства с тем, чтобы, рекомендуя БД пользователям (прямая связь), объективно характеризовать возможности, преимущества, недостатки и ограничения БД. При этом они могут сообщать о замеченных недостатках, ограничениях и ошибках производителям БД (обратная связь), т.е. работать на улучшение БД. Контакт с издателями (производителями первичной информации) также важен, поскольку библиографические БД создаются на основе именно их продукции. В результате такой работы библиотечных специалистов БД как элемент СДК претерпевают изменения.
Кроме того, при проведении в БД поисков, например, по запросам читателей, помимо библиографического списка публикаций по определенной теме библиограф при помощи современных технологий может получать различную дополнительную информацию: распределение публикаций по видам; геолокация авторов; списки наиболее активных и (или) цитируемых авторов и (или) институтов и др. Другими словами, библиограф может провести аналитическую обработку полученных библиографических списков. При этом происходит прибавление ценности (value-adding) к запрошенной читателем информации, причем в удобном для дальнейшего анализа виде.
Наконец, творческое использование БД дает возможность получения новых библиометрических индикаторов (из недавних можно отметить индексы Хирша и Эгге), т. е. способствует дальнейшему развитию и совершенствованию библиометрических методов, представляющих интерес для библиотечно-информационного сообщества.
Таким образом, использование возможностей современных БД вкупе с библиометрическими методами и новейшими информационными технологиями позволяет библиотечно-информационному специалисту существенно повысить качество предоставляемых читателям услуг. Он может: 1) более полно удовлетворять потребности читателя посредством добавления ценности к запрошенной информации и тем самым максимально реализовывать свои поисковую, оценочную и рекомендательную функции; 2) проводить собственные библиометрические исследования; 3) участвовать в совершенствовании БД, взаимодействуя с их производителями (вендорами).
Можно надеяться, что комплексные библиометрические исследования науки в российских научно-технических библиотеках с использованием онлайновых библиографических БД получат дальнейшее развитие. Этому, в частности, способствует возрастающая доступность таких БД, как WoS, JCR, ESI, Scopus и некоторых других, а также появление в них новых возможностей анализа поисковых результатов. Этим исследованиям также будет содействовать появление встроенных программ обработки данных в БД производства ВИНИТИ, открытие общего доступа к БД РФФИ, а также завершение работ по созданию Российского индекса научного цитирования (РИНЦ).
Автор благодарит РФФИ за
финансовую поддержку (проект
№ 08-06-00337).
Список источников
1. Wormell I. Databases as analytical tools / I. Wormell. – // Encyclopedia of Library and Information Science. – N. Y. : Marcel Dekker, 2000. – Vol. 70. – Suppl. 33. – P. 77–92.
2. Слащева Н. А. Наукометрические исследования в библиотеке (на примере Центральной библиотеки ПНЦ РАН) // Н. А. Слащева // Науковедение. – 2002. – № 3. – С. 147–154.
3. Слащева Н. А. Электронная информация в наукометрических исследованиях / Н. А. Слащева, Ю. В. Мохначева // НТИ. Сер. 1. – 2003. – № 5. – С. 21–27.
5. Информационные ресурсы региона: принципы формирования, организационная, видовая структура / отв. ред. Е. Б. Соболева; ГПНТБ СО РАН. – Новосибирск, 2000. – 167 с.
6. Состояние и развитие основных направлений научных исследований: библиометрический анализ : сб. науч. тр. / ГПНТБ СО РАН ; [редкол.: Е. Б. Соболева (отв. ред.) и др.]. – Новосибирск, 2003. – 183 с.
7. Зибарева И. В. Некоторые аспекты библиометрических исследований в Сибирском отделении Российской академии наук / И. В. Зибарева, И. В. Курбангалеева, Н. С. Редькина, Б. С. Елепов // Библиотековедение. – 2008. – № 3. – С. 39–45.
8. De Moya-Anegon F. Coverage analysis of Scopus: a journal metric approach / F. De Moya-Anegon, Z. Chinchilla-Rodriguez, B. Vargas-Quesada, E. Corera-Alvarez, F.J. Munoz-Fernandez, A. Gonzales-Molina, V. Herrero-Solana // Scientometrics. – 2007. – Vol. 73. – N 1. – P. 53–78.
9. Bar-Ilan J. Some measures for comparing citation databases / J. Bar-Ilan, M. Levene, A. Lin // J. Informetrics. – 2007. – Vol. 1. – N 1. – P. 26–34.
10. Norris M. Comparing alternatives to the Web of Science for coverage of social sciences’ literature / M. Norris, C. Oppenheim // J. Informetrics. – 2007. – Vol. 1. – N 2. – P. 161–169.
11. Noruzi A. Google Scholar: the new generation of citation indexes / A. Noruzi // LIBRI: International Journal of Libraries and Information Sciences. – 2005. – Vol. 55. – P. 170–180.
12. Ridley D. D. Citation searches in on-line databases: possibilities and pitfalls / D. D. Ridley // Trends Analyt. Chem. – 2001. – Vol. 20. – P. 1–10.
13. Whitley K. M. Analysis of Scifinder Scholar and Web of Science citation searches / K. M. Whitley // J. Am. Soc. Inform. Sci. Technol. – 2002. – Vol. 53. –№ 14. – P. 1210–1215.
14. Зибарева И. В. ChemicalAbstracts: база данных для библиометрических исследований / И. В. Зибарева, В. М. Бузник // Росс. хим. журн. – 2007. – Т. 51. – № 3. – С. 166–171.
15.STNInternational [Электронный ресурс]. – Режим доступа: http://www.stn-international.de
16. Зибарева И. В. Опыт использования библиографических БД для наукометрических исследований российской химической науки / И. В. Зибарева, Н. В. Круковская // Образовательные технологии и общество. – 2007. – № 1. – С. 297–303 [Электронный ресурс]. – Режим доступа: http://ifets.ieee.org/russian/depository/v10_i1/pdf/30.pdf