ПРОБЛЕМЫ ИНФОРМАЦИОННОГО ОБЩЕСТВА

УДК 026:06

П. Е. Дедик

Новые возможности доступа
к ресурсам зарубежных библиотек:
системы Web Scale Discovery

Показаны особенности электронных каталогов нового поколения, обеспечивающих доступ к ресурсам библиотек. Рассмотрены системы типа Web Scale Discovery, появившиеся в результате развития каталогов нового поколения. На основе публикаций в профессиональной печати охарактеризованы результаты внедрения систем в зарубежных университетских библиотеках.

Ключевые слова: электронные каталоги нового поколения, федеративный поиск, объединённый поисковый индекс, ранжирование по релевантности, системы типа Web Scale Discovery, информационно-поисковая система Summon, юзабилити, системы метаданных, зарубежные университетские библиотеки.

Эта статья – продолжение предыдущей [1], где рассмотрены электронные каталоги нового поколения (next generation catalogs), важнейшая особенность которых – возможность доступа из единого поискового интерфейса ко всем информационным ресурсам библиотеки, включая локальные электронные коллекции и удалённые полнотекстовые базы данных с лицензионным доступом. Однако ни в одной из систем, позиционируемых непосредственно как каталоги нового поколения, эта особенность не реализована в полной мере.

Можно выделить два основных направления, по которым в каталогах нового поколения решается проблема обеспечения доступа ко всем доступным информационным ресурсам: технология Federated Search и построение объединённого поискового индекса.

Federated Search – информационная технология, позволяющая пользователям производить из одной точки доступа поиск одновременно в нескольких источниках информации, доступных через телекоммуникационные сети. Для обозначения этой технологии в англоязычной литературе используется целый ряд терминов: Broadcast searching, Consolidated searching, Cross-database searching, Distributed searching, Integrated searching, Metasearch searching [2].

В качестве русского перевода термина federated search я буду использовать словосочетание объединённый поиск. Системы объединённого поиска преобразуют нужным образом поисковые запросы и направляют их к нескольким удалённым БД; полученные результаты объединяются с минимальным устранением дублирования описаний и представляются в единой форме. Пользователи могут упорядочивать результаты объединённого поиска по разным критериям; считается, что возможно и ранжирование результатов «по релевантности».

Для связи с различными удалёнными источниками информации используются коннекторы, которые адресуют поисковые запросы к каждой системе и затем получают от них результаты поиска. Технология объединённого поиска в последнее время используется в библиотеках достаточно часто, поскольку предоставляет очевидные преимущества: не нужно изучать множество разнообразных поисковых интерфейсов, реализованных в различных БД. Это позволяет решить проблему доступа к научному контенту на уровне журнальных статей.

Однако по мере увеличения количества доступных библиотеке удалённых БД увеличивается и количество используемых коннекторов, что может существенно снижать итоговую скорость выполнения запросов. К недостаткам систем объединённого поиска следует также отнести сложности с устранением дублирования записей в результатах поиска и весьма ограниченные возможности эффективного ранжирования по релевантности.

Возможности объединённого поиска реализованы в целом ряде каталогов нового поколения. Например, система Encore использует поисковую машину Recearch Pro, при помощи которой поиск по запросу пользователя автоматически проводится как в каталоге библиотеки, так и во всех доступных БД. Пример поисковой выдачи системы Encore в библиотеке St. Lawrence University см.: http://encore.stlawu.edu/iii/encore/articles/C%7CSinterface%7COrightresult?lang=eng&suite=def, где видно, какое количество релевантных запросу «interface» ресурсов найдено в лицензионных базах научных журналов, доступных в библиотеке: «Academic Search Complete», «JSTOR», «Oxford Journals», ScienceDirect, «SAGE», SAGE Journals Online и др.

Разработчики других систем каталогов нового поколения идут по пути построения объединённого поискового индекса для обеспечения доступа к каталогу библиотеки и локальным электронным ресурсам. Смысл термина поисковый индекс отличается от его понимания в литературе, посвящённой поисковым машинам Интернета. В данном случае объединяются в единый массив описания ресурсов (как печатных, так и электронных) из всех доступных в библиотеке информационных источников, которые затем нормализуются на основе специально разработанной единой схемы метаданных. На основе объединённого поискового индекса реализуются как процедуры информационного поиска, так и алгоритмы ранжирования результатов по релевантности. Пример системы, в которой строится такой объединённый поисковый индекс, – VuFind(см., например, электронный каталог Западного Мичиганского университета (США): http://www.wmich.edu/library/catalog.php).

Поисковая выдача системы VuFind принципиально отличается от поисковой выдачи в системе Encore, использующей объединённый поисковый индекс. В первом случае есть только описания информационных ресурсов из локальных коллекций библиотеки. Описания статей из лицензионных БД (например, баз электронных научных журналов), доступных в библиотеке, отсутствуют. Для доступа к лицензионным базам в электронном каталоге библиотеки предусмотрен обычный список «A to Z», в который входят такие базы, как «EBSCOHost eBook Collection», «Emerald Journals», «IEEE Xplore» , «Inspec», «Sage Journals Online», «ScienceDirect», «Science Citation Index», «Scopus», «Ulrichsweb (Global Serials Directory)» и др.

Существенные преимущества построения объединённого локального индекса заключаются в скорости работы поисковых алгоритмов, а также проявляются при реализации алгоритмов ранжирования по релевантности. При этом, однако, каждое информационное хранилище требует создания специального программного обеспечения, которое будет использоваться для выделения и нормализации метаданных. Ещё большие сложности связаны с правовыми аспектами интегрирования информации даже на уровне метаданных, поскольку доступ и обработка информации из коммерческих БД невозможны без переговоров с владельцами контента и заключения соответствующих договоров.

Проблема построения единого поискового индекса особенно остро проявляется при обеспечении доступа пользователей к полнотекстовым электронным научным журналам. Этот вид информационных ресурсов очень востребован, а в крупных библиотеках количество доступных электронных журналов достигает десятков тысяч. При этом обычно доступ к журналам осуществляется через алфавитные списки баз данных вида «A to Z». Для поиска необходимой информации пользователям приходилось осваивать много разных поисковых интерфейсов, что отрицательно сказывалось на посещаемости сайтов библиотек.

Системы типа Web Scale Discovery

К началу 2009 г. сайты продвинутых академических библиотек предлагали разные технологические решения, которые в совокупности давали пользователям возможность ориентироваться в печатных и электронных ресурсах. Это были традиционные онлайн-каталоги, системы объединённого поиска, алфавитные и предметные перечни электронных журналов и специализированных БД (списки «A to Z»). Позднее библиотеки стали размещать на своих сайтах каталоги нового поколения, которые предоставляли пользователям целый ряд новых возможностей.

Эти поисковые средства удовлетворяли информационные потребности пользователей на уровне изданий (книг, журналов, а также различных коллекций). Однако поиск на уровне статей из журналов был довольно сложной процедурой. Сначала следовало было обратиться к сайту провайдера необходимого контента (издательству или агрегатору), а затем уже в новом поисковом интерфейсе искать нужную статью. По мере увеличения числа научных журналов, газет и других ресурсов в электронной форме такой способ поиска становился всё более затруднительным. Библиотеки, взаимодействуя с разработчиками информационных систем, пытались найти способы организовать доступные коллекции документов и управлять ими.

Также создавались предметно-специализированные руководства, которые должны были помочь пользователям ориентироваться в огромном количестве электронных ресурсов, относящихся к той или иной предметной области. Однако пользователи с трудом осуществляли навигацию в такой сложно организованной информационной среде и всё чаще даже в исследовательских целях обращались к системам Google и Google Scholar. Необходимо было сформировать позитивное отношение к имеющимся в библиотеках поисковым средствам, убедить пользователей в том, что информационные ресурсы библиотек незаменимы в процессе обучения и научных исследований. Кроме того, библиотеки должны были подтвердить востребованность своих ресурсов, чтобы оправдывать бюджеты, которые постоянно находились под угрозой сокращения.

Всё это способствовало появлению в 2009–2010 гг. информационно-поисковых систем типа Web Scale Discovery, что можно рассматривать как дальнейшее развитие библиотечных каталогов нового поколения. Web Scale Discovery – это доступ к каталогу библиотеки и всевозможным журнальным и специализированным БД в рамках единого интерфейса.

Термин Web Scale Discovery появился в 2009 г. в ходе серии семинаров, которые проводились компанией «Serials Solutions» и журналом «Library Journal». Этот термин не так просто перевести на русский язык, учитывая, что даже в английском нет его однозначного толкования. По-видимому, наиболее подходящим будет такой перевод: «Средства поиска и доставки информации, ориентированные на весь Web». Web Scale можно перевести как масштаб, равный Web. Разработчики систем Web Scale Discovery ставят перед собой задачу объединить в рамках единой поисковой системы максимально возможное количество доступных через Интернет информационных источников, как лицензионных, так и свободного доступа.

Основная цель создания таких систем не сводится к тому, чтобы просто построить объединённый поисковый индекс для электронного каталога библиотеки и всех её доступных электронных коллекций. Задача apriory– объединить в доступный для эффективного поиска информационный универсум как можно больше различных источников информации. Результаты поиска по такому информационному универсуму доступны всем внешним пользователям систем типа Web Scale Discovery, однако доступ к полным текстам возможен только для тех ресурсов, в отношении которых в библиотеке имеются лицензионные соглашения.

В январе 2010 г. библиотека Университета Edith Cowan (Австралия) первой среди университетских библиотек установила систему класса Web Scale Discovery – Summon от компании «Serials Solutions». М. Бридинг обратился к библиотечному сообществу с призывом изучить и оценить предлагаемые новые поисковые средства: «Хотя эта концепция кажется очень привлекательной, только опыт работы реальных пользователей библиотек может доказать, что она является таковой» [3].

В 2009–2010 гг. определились основные игроки сегмента Web Scale Discovery. Это системы EBSCO Discovery Service (компания «EBSCO Publishing»), Primo Central (компания «Ex Libris»), Summon (компания «Serials Solutions»), WorldCat Local (Центр OCLC, США). Приведу интернет-адреса библиотек, в которых в настоящее время установлены такие системы:

EBSCO Discovery Service – Библиотека Middle East Technical University, (опция «METUnique SEARCH»), http://ww2.lib.metu.edu.tr/en/index.php; Библиотека James Madison University, www.lib.jmu.edu;

Primo Central – Библиотека University of East Anglia, http://www.uea.ac.uk/is/lib; Библиотека Vanderbilt University’s Jean and Alexander Heard (опция «Search Discover Library»), www.library.vanderbilt.edu;

Summon – Библиотека Western Michigan University (опция «Power Search»), http://www.wmich.edu/library; Библиотека Grand Valley State University, http://www.gvsu.edu/library;

WorldCat Local – Библиотека University of Delaware, http://www.lib.udel.edu; Библиотека Willamette University, http://library.willamette.edu.

Особенности систем Web Scale Discovery

Для более подробного знакомства с системами Web Scale Discovery рассмотрим Summon, которая стала первой системой этого класса. Её презентация состоялась в январе 2009 г. [4] и вызвала большой интерес у библиотечных специалистов. Summon изначально предназначалась для удовлетворения потребностей научного сообщества. Сегодня большинство «покупателей» этой системы – университетские и научные библиотеки.

По данным Ассоциации научных библиотек США (ARL), более 30% её членов используют Summon, что делает эту систему одной из наиболее популярных среди таких библиотек.

По данным на начало 2012 г., ресурс Summon включает более 95 тыс. электронных журналов и около 7 тыс. издательств, общий объём – свыше 800 млн единиц. Summon имеет лицензионные соглашения с крупнейшими провайдерами и агрегаторами научного контента: ProQuest, Lexis Nexis Academic, Gale, IEEE, Emerald, Springer, Sage, Taylor and Francis и др. Благодаря этим соглашениям ведётся постоянная подготовка метаданных и полных текстов всех доступных информационных ресурсов в соответствии со специально разработанной схемой метаданных.

Система Summon реализована в библиотеке Западного Мичиганского университета (http://wmich.summon.serialssolutions.com). Поисковая выдача, отсортированная по релевантности, показывает только описания полнотекстовых ресурсов. Это достигается путём сужения запроса. Например, общее количество описаний, найденных по запросу «environment», – 14 153 403. Для того чтобы получить описания только полнотекстовых ресурсов, запрос нужно сузить посредством подключения опции «Items with full text online», размещённой среди верхних фасет в левой части экрана. В этом случае будет получено 13 366 420 описаний. Миллионы доступных полнотекстовых документов, найденных по специализированному термину, дают представление об объёме поискового индекса системы. В левой части экрана размещены фасеты, использование которых позволяет сужать поисковый запрос. Отметим, что доступ к полным текстам лицензионных ресурсов требует авторизации пользователя.

Особенность Summon– детальнопроработанная совокупность атрибутов фасеты «Subject», что существенно расширяет возможности модификации запросов при проведении тематического поиска. Пользователь может упорядочивать атрибуты фасеты «Subject» как по количеству документов, так и по алфавиту, а также включать в запрос любые имеющиеся атрибуты.

Локальные и удалённые ресурсы. Объединённый индекс системы Summon включает в себя как локальные коллекции библиотеки (в том числе каталог), так и контент издателей и агрегаторов. Есть возможность в автоматическом режиме агрегировать описания всех основных интегрированных библиотечно-информационных систем, цифровых систем управления контентом и институциональных репозитариев. Могут быть использованы все основные системы метаданных, включая MARC, Dublin Core, XML, EAD.

По умолчанию Summon отображает для пользователей библиотеки результаты поиска информации, доступной в системе, в том числе предоставленной издателями и агрегаторами, с которыми библиотека имеет лицензионные соглашения. Можно использовать опцию «Add results beyond your library's collection», также размещённую среди верхних фасет в левой части экрана, которая позволяет провести поиск в полном объёме системы Summon, а не только по локальным и удалённым коллекциям библиотеки.

Для рассмотренного выше запроса «environment» количество релевантных описаний в этом случае – 21 653 496, что даёт более точное (хотя и косвенное) представление об общем объёме индекса Summon. Система может быть конфигурирована таким образом, чтобы включать (или наоборот не включать) в поисковую выдачу записи из общего индекса Summon, относящиеся к каталогам других библиотек. Каждая библиотека может сделать записи своего (локального) контента недоступными для поиска другими покупателями системы Summon.

Релевантность. Поиск в Summon по ключевым словам ведётся как по метаданным, так и по полному тексту ресурсов, если он доступен. Для ранжирования результатов поиска по релевантности разработан оригинальный алгоритм, в котором разные поля метаданных и разные области полного текста ресурсов имеют различный вес. Для разных типов ресурсов используются свои модификации алгоритма вычисления релевантности. Например, при вычислении релевантности для статей из научных журналов учитывается, сколько раз они цитировались (Summon имеет доступ к контенту Web of Science). Разработана также постоянно совершенствуемая программа, устраняющая дублирование описаний одного и того же источника, полученных от разных БД, провайдеров и агрегаторов.

У системы EBSCO Discovery Service (появилась позже) есть некоторые особенности, отсутствующие у других систем этого класса. Например, она предоставляет пользователям возможность проводить объединённый поиск по информационным ресурсам от издателей и агрегаторов, с которыми у EBSCO нет соглашений о преиндексировании контента и включении метаданных в объединённый поисковый индекс. Пользователь может выбрать нужные ему ресурсы и произвести по ним объединённый поиск, результаты которого будут отображаться обычным образом в центральной части экрана.

Работа с системами объединённого поиска подразумевает соответствующую информационную культуру пользователей и умение реализовывать различные поисковые стратегии. В качестве примера можно привести Библиотеку Ливерпульского университета – крупного образовательного и исследовательского центра Великобритании. Этой библиотекой система EBSCO Discovery Service с довольно скромным интерфейсом была выбрана именно потому, что она предоставляет расширенные возможности управления доступным контентом.

По-видимому, нет оснований отдавать предпочтение какой-либо одной системе Web Scale Discovery. Каждая из них имеет собственную концепцию, все они постоянно развиваются. Та или иная система уместна и востребована в определённых условиях (с учётом миссии библиотеки, контингента её пользователей и содержания её коллекций).

Каталоги нового поколения и системы Web Scale Discovery предназначены для решения разных задач. Web Scale Discovery, может быть, проигрывают в количестве «красивых» особенностей, таких, как облака тэгов, цветные обложки книг, добавленные пользователями комментарии. Но их главное преимущество – огромный массив высококачественного полнотекстового контента, объединённого в рамках единого поискового индекса. Те и другие системы используются в университетских библиотеках с одной целью: наиболее полно удовлетворить запросы студентов, преподавателей и исследователей и способствовать тому, чтобы пользователи вернулись в библиотеки.

Некоторые университетские библиотеки устанавливают системы обоих типов. Например, система Summon и каталоги нового поколения установлены в библиотеках Государственного университета Северной Каролины – http://www.lib.ncsu.edu/catalog (Endeca), Западного Мичиганского университета – http://www.wmich.edu/library (VuFind), Государственного университета Гранд Вэлли – http://www.gvsu.edu/library (Encore).

Трудно сказать, является ли случайным совпадением тот факт, что во всех этих библиотеках из семейства Web Scale Discovery выбрана система Summon, обеспечивающая также надёжную и удобную работу пользователей из любой точки земного шара.

Использование новых поисковых средств в библиотеках
и оценки юзабилити

Объединение в рамках единого интерфейса каталога библиотеки, статей из электронных научных журналов и ресурсов других типов удобно для пользователей, так как теперь им не нужно выбирать подходящую систему, чтобы начать поиск. Поиск по объединённому индексу более быстрый и предоставляет гораздо больше возможностей ранжирования по релевантности.

Однако новые поисковые средства несут в себе и определённые сложности: будут ли пользователи способны дифференцировать ресурсы из разных источников и работать с большими массивами результатов поиска? Будут ли они понимать границы возможностей поисковых систем и то, что определённая часть онлайн-ресурсов находится за пределами досягаемости этих систем?

За новыми поисковыми средствами могут скрываться различные поисковые стратегии, которые целесообразно применять в разных предметных областях. Эти поисковые средства могут отвлекать внимание пользователей от тщательно отобранных и организованных коллекций информационных ресурсов (как электронных, так и традиционных). Новые поисковые средства требуют, чтобы процесс обучения пользователей был организован с учётом разных академических дисциплин, информационных потребностей и уровня информационной культуры пользователей.

Электронные каталоги нового поколения во многом обязаны своим появлением современным пользователям университетских библиотек – поколению Net. Именно они, согласно опросам LibQUAL+, неоднократно проводившимся Ассоциацией научных библиотек США, оценивая поисковые возможности ЭК библиотек, выбрали вариант «Меньше чем требуется». Поэтому в течение 2007–2009 гг. в ряде университетских и научных библиотек были внедрены (как правило, в дополнение к существующим АИБС) каталоги нового поколения.

В 2010–2011 гг. в университетских библиотеках появились и системы Web Scale Discovery. Результаты внедрения каталогов нового поколения в 260 академических библиотеках США и Канады проанализированы [5].

Что же изменилось в библиотеках с появлением новых информационных систем? С какими проблемами столкнулись сотрудники библиотек? Как пользователи оценивают новые системы, и оправдались ли ожидания сотрудников университетских библиотек – вернуть студентов и исследователей в библиотеки?

Электронные каталоги нового поколения обычно «надстраиваются» над существующими в библиотеках АИБС. При этом возникают проблемы, которые могут касаться многих составляющих технологического процесса библиотеки. Однако, согласно исследованию [6], большая часть проблем связана с каталогизацией ресурсов (в исследовании участвовали представители академических библиотек, в которых либо уже внедрили каталоги нового поколения, либо внедряют). Вот наиболее типичные проблемы:

наличие противоречий, некорректных и отсутствующих значений в кодах полей MARC-формата, по которым строятся фасеты и их значения;
интеграция контролируемых (LCSH, MeSH) и неконтролируемых словарей (например ключевых слов);
интеграция и преобразование описаний с разными схемами метаданных;
взаимодействие и обмен данными между АИБС библиотеки и каталогом нового поколения.

Внедрение каталогов нового поколения способствует тому, что каталогизаторы всё больше интересуются, как их данные предоставляются пользователям. Каталогизаторы благодаря новым визуальным интерфейсам каталогов могут оценить свою работу с позиций пользователей, чтобы увидеть возможности каталогизации, подтвердить значимость каталожных данных высокого качества. Некоторые участники исследования отметили: их прежняя каталогизационная практика не вполне была связана с поиском по ключевым словам и оценкой релевантности, которые очень значимы для каталогов нового поколения [6]. Почти все участники этого исследования заявили, что в их библиотеках планируется параллельное использование каталога нового поколения и традиционного.

Если так, то какой из них должен быть «главным»? Чтобы решить этот вопрос, необходимо определить, какой из каталогов более приспособлен для поиска того или иного типа ресурсов. Каталогизаторы могут помочь руководству библиотеки понять сильные и слабые стороны интерфейсов разных каталогов. Кроме того, высказывается мнение, что внедрение каталогов нового поколения должно способствовать появлению нового типа каталогизаторов, которые смогут наполнить новым содержанием традиционные и проверенные временем технологии каталогизации [Там же].

Целый ряд публикаций последних лет посвящён вопросам оценки юзабилити каталогов нового поколения и тому, как пользователи оценивают новые поисковые средства в сравнении с традиционными онлайн-каталогами. Следуя стандарту ISO 9241–11, под юзабилити (usability – англ.) будем понимать степень эффективности, продуктивности и удовлетворённости, с которой определённая система или продукт может применяться пользователями в конкретных условиях для достижения заданных целей.

Как правило, исследования юзабилити проводились в небольших группах пользователей (не более 25 человек) в рамках какой-либо одной библиотеки. Общий вывод из этих исследований: пользователям новые каталоги нравятся больше, чем традиционные, к которым они почти перестают обращаться. Новые каталоги оказываются более эффективными поисковыми средствами. В статье [19] рассмотрены возможности каталога Endeca в сравнении с традиционной АИБС Voyager: значительно увеличивается количество поисковых запросов с использованием ключевых слов; уменьшается среднее время выполнения поисковых запросов, становится больше задач, которые пользователи рассматривают как простые (уменьшение доли сложных). При работе с каталогом Endeca количество релевантных поисковому запросу документов на первых страницах поисковой выдачи возрастает на 70%. Весьма позитивно оценивается пользователями фасетная навигация системы Primo[20], интерфейс которой воспринимается как интуитивно понятный и дружественный, в нём можно легко разобраться.

Изучению фасетной навигации в процессе информационного поиска на примере каталога нового поколения Aqua brouser посвящена работа [7]. В дополнение к фасетам активно используются облака тэгов, отображаемые параллельно поисковой выдаче в системе Aqua brouser. Фасеты и облака тэгов нужны, когда выбирают исходный поисковый термин при работе в незнакомой предметной области, а также при проведении поиска в предметной области со сложным тезаурусом.

Фасетная навигация VuFind привлекательна для пользователей большим количеством отображаемой в поисковой выдаче информации, относящейся к каждому найденному документу (обложки, аннотации …) [8]. Пользователи хотели бы активно добавлять (такую возможность предоставляет система VuFind) тэги, комментарии и другую информацию, но при реализации этих операций возникают технические сложности, которые должны быть устранены разработчиками системы.

Системы Web Scale Discovery появились на информационном рынке на несколько лет позже, чем каталоги нового поколения, однако уже есть ряд публикаций, посвящённых использованию этих систем в академических библиотеках, например [8, 9].

Положительный эффект от их внедрения: увеличение востребованности информационных ресурсов библиотек, количества обращений к электронным полнотекстовым ресурсам, особенно электронным научным журналам и специализированным предметным БД. Например, в Государственном университете Гранд Вэлли сотрудники библиотеки отмечают «тройную» выгоду от установки системы Summon[13]. Во-первых, теперь преподаватели гораздо реже слышат жалобы студентов на то, что они не могут найти информацию по какой-либо теме. Во-вторых, студенты имеют возможность доступа к качественной и достоверной информации прямо со страниц своих «course page» благодаря размещению там виджетов с поисковыми окнами Encore и Summon. В-третьих, на основании данных систем о частоте обращения к информационным ресурсам библиотеки сотрудники могут подтвердить их востребованность, что очень важно при обосновании и планировании бюджета библиотеки.

Исследования по юзабилити, проводимые в библиотеках, позволяют сформулировать вопросы к разработчикам систем Web Scale Discovery, ответы на которые способствуют их совершенствованию. Вырабатываются рекомендации по улучшению дизайна, функциональных возможностей, а также их интеграции с другими компонентами веб-сайтов библиотек.

Один из важных выводов исследований: при помощи самых выразительных и доходчивых способов нужно объяснять пользователям, как работать с системами Web Scale Discovery, прежде чем они начнут их использовать и столкнутся с многочисленными вопросами.

В статье [14], где приведены результаты тестирования юзабилити системы Summon, установленной в библиотеке Государственного университета Северной Каролины, выделены направления работы:

1. Изучать и оценивать действующие алгоритмы ранжирования по релевантности, чтобы понять, какие поисковые стратегии будут наиболее эффективны при решении различных задач.

2. Разработать обучающие «туры» и подробные руководства, которые с помощью скриншотов и видеофрагментов будут демонстрировать пользователям примеры эффективных поисковых стратегий и описывать ключевые особенности систем Summon. Примеры «туров» можно найти на продвинутых коммерческих сайтах, таких как Amber ack, Facebook, Twitter, IBM (см., например: http://manybills.researchlabs.ibm.com/help/tour.html).

3. Подбирать преподавателей основных базовых курсов, учитывая такой критерий, как обязательное знание основных особенностей новых поисковых систем.

После внедрения новых систем в библиотеках обнаружился и целый ряд проблем. Одна из них – поддержание в рабочем состоянии переходов со страниц поисковой выдачи к файлам, содержащим полные тексты информационных ресурсов. Результаты одного из тестирований системы Summon[15] показали, что только 65% всех линков к полнотекстовым ресурсам оказались реально работающими!

Вторая проблема: возникают сложности в ранжировании по релевантности. Пользователи могут видеть на первых страницах поисковой выдачи описания документов, релевантность которых очень сомнительна. Например, в библиотеке Западного Мичиганского университета, где установлена Summon, её разработчикам пришлось принимать меры, чтобы с первых страниц поисковой выдачи по запросам со специализированными научными терминами удалить статьи из газет [16].

Третья проблема: довольно часто библиотекарям трудно представить, каким именно контентом располагает установленная в их библиотеке система Web Scale Discovery. Они привыкли, что предметное «покрытие» доступного в библиотеке контента описывается в терминах традиционных предметно-ориентированных БД. В исследовании [17] отмечается, что для ежедневного обслуживания студентов не очень удобен список из 6 800 издателей и 94 000 электронных журналов, доступных через систему Summon, установленную в библиотеке Edith Cowan University (Австралия).

Сегодня наиболее типична ситуация, когда Web Scale Discovery является только одним из возможных поисковых средств, предоставляемых библиотекой. Пользователи также могут «из одной точки доступа» обращаться к онлайн-каталогу библиотеки (роль которого часто выполняет каталог нового поколения), системам объединённого поиска, а также к алфавитным и предметным перечням электронных БД. Пример такой комбинации поисковых средств – сайт библиотеки Западного Мичиганского университета (http://www.wmich.edu/library).

При использовании опции «Power Search» поиск информационных ресурсов ведётся с помощью системы Summon; опция «Catalog» задаёт переход к каталогу нового поколения VuFind, а опция «Articles» обеспечивает поиск в информационной базе «ProQuest Research Library». Такое представление различных поисковых средств связано не только со стремлением удовлетворить информационные потребности пользователей поколения Net, но и необходимостью формировать у них правильный подход к работе с учебной и научной информацией. Такой подход не сводится лишь к быстрому и простому способу получения необходимой информации, как, к сожалению, считают многие современные пользователи, для которых все информационные объекты кажутся одинаково ценными [18]. Они рассматривают Summon «как Google, только в библиотеке» [17], и им вполне достаточно той информации, которую они находят в результате поиска в этой системе.

Выявились проблемы и, так сказать, более высокого порядка. Пользователи легко осваивают мощные поисковые возможности таких систем, но у них возникают сложности с правильной интерпретацией найденных результатов и пониманием того, из каких БД получены описания тех или иных документов. Мощность и простота использования новых поисковых средств оказываются обоюдоострыми. С одной стороны, пользователи находят много разнообразных ресурсов, с другой – им явно не хватает знаний, чтобы оценить качество и содержание ресурсов, а также поисковых стратегий. Поэтому необходимо совершенствовать информационную культуру пользователей и знакомить их с поисковыми стратегиями.

Выводы

Требуется время, чтобы системы Web Scale Discovery заняли своё место на информационном рынке, так как они основаны на новой трудоёмкой технологии. Для того чтобы собирать и агрегировать метаданные на уровне статей из журналов и глав книг из коммерческих БД, необходимы договоры и соглашения с тысячами издателей и провайдеров. Чтобы отслеживать все изменения, которые постоянно происходят с таким большим объёмом контента, требуется специальное постоянно совершенствуемое программное обеспечение. Системы Web Scale Discovery создавались в определённом смысле как панацея, которая обеспечит единый «гуглоподобный» поиск в электронных информационных коллекциях, доступных в библиотеках. Чуда пока не произошло.

Эти системы используются сегодня во многих университетских, научных и публичных библиотеках и заслужили высокие оценки пользователей. Однако они пока не могут претендовать на роль «единого поискового окна», обеспечивающего доступ ко всем информационным ресурсам библиотеки. Библиотеки ещё не могут отказаться от таких традиционных конструкций, как алфавитные и предметные списки электронных журналов и специализированных предметных БД.

Структура информационных потребностей пользователей современных научных библиотек оказалась сложной и многомерной. В качестве перспективного решения для университетских библиотек в исследовании [14] предлагается предоставление различных «контекстов» доступа к информационным ресурсам библиотеки (и к поисковым средствам типа Web Scale Discovery) для различных групп пользователей: студентов младших курсов, студентов старших курсов, аспирантов и научных работников. Исследование показало, что среди аспирантов система Summon пользуется гораздо меньшей популярностью, чем среди студентов младших курсов. Среди аспирантов чаще всего её используют те, кто ведёт междисциплинарные исследования, реже – работающие в узких специальных предметных областях.

Заключение

Библиотеки ведут трудную борьбу за внимание пользователей и ведущее положение среди других подразделений университетов. Обеспечение доступа к научной информации остаётся важнейшей задачей университетских библиотек, наряду с другими, связанными с образовательными и научными потребностями университетов. Совершенствование библиографических сервисов и поисковых средств – направление деятельности университетских библиотек, в рамках которого они могут и должны демонстрировать свою значимость и востребованность.

Новые информационные системы, такие как каталоги нового поколения и системы Web Scale Discovery, обладают потенциалом, благодаря которому может быть радикально изменен характер взаимодействия пользователей с обширным информационным пространством – коллекциями библиотек.

Можно сказать, что маятник качнулся в обратную сторону. Если несколько лет назад пользователи были недовольны электронными каталогами библиотек, то сейчас ситуация изменилась: новые поисковые средства обладают возможностями, превышающими уровень знаний пользователей, привыкших работать с Amazon и Google. И библиотеки должны помогать пользователям расширять эти знания. С другой стороны, сотрудники библиотек должны совершенствовать принципы и технологии своей деятельности, чтобы реализовать все преимущества новых систем доступа к информационным ресурсам.

Список источников

1. Дедик П. Е. Новые возможности доступа к ресурсам зарубежных библиотек: каталоги нового поколения / П. Е. Дедик // Науч. и техн. б-ки. – 2013. – № 2. – С. 65–84.

2. Vastrad G.,Bharathy J.,Kumar P. D. Federated Search and Discovery Tools // Proceedings of 8th International CALIBER. – 2011, Goa University, Goa, March 02–04, 2011. – Режим доступа: http://ir.inflibnet.ac.in/dxml/bitstream/handle/1944/1599/6.pdf?sequence=1.

3. Breeding M. The state-of-the-art in library discovery // Computers in Libraries. – 2010. – Vol. 30, № 1. – P. 31–34.

4. Burke J. Discovery versus Disintermediation: the new reality driven by today’s end-user. –Режим доступа: http://www.vala.org.au/vala2010/papers2010/VALA2010_57_Burke_Final.pdf

5. Yang S. Q. Next generation or current generation – OPACs of 260 academic libraries // Library Hi Tech. – 2011. – Vol. 29, № 2. – P. 266–300.

6. Wynne S. C. and Hanscom M. J. The Effect of Next-Generation Catalogs on Catalogers and Cataloging Functions in Academic Libraries // Cataloging & Classification Quarterly. – 2011. – Vol. 49, № 3. – P. 179–207.

7. Olson T. A. Utility of a faceted catalog for scholarly research // Library Hi Tech. – 2007. – Vol. 25, № 4. – P. 550–561.

8. Denton W., Coysh S. J. Usability testing of VuFind at an academic library // Library Hi Tech. – 2011. – Vol. 29, № 2. – Режим доступа: http://pi.library.yorku.ca/dspace/bitstream/handle/10315/6743/usability-testing-of-vufind-at-an-academic-library-article-postprint.pdf?sequence=4 [дата обращения: 21.06.2012].

9. David Aymonin, Alain Borel, Raphal Grolimund, Thomas Guignard, Georges Iffland and Lionel Walter. Be realistic, demand the impossible: Comparison of 4 discovery tools using real data at the EPFL Library Technical report – Dec. 19, 2011. – Режим доступа: http://infoscience.epfl.ch/record/172947/files/EPFL-discovery-techreport-20111219_1.pdf?version=1

10. Judy Luther, Maureen C. Kelly. The Next Generation of Discovery // Library Journal. – 2011. –March 15. – P.66–71.

11. Chand P. Web Scale Discovery Tools // Proceedings of 8th Convention PLANNER–2012, Sikkim University, Gangtok, March 01–03, – P.7–18. – Режим доступа: http://shodhganga.inflibnet.ac.in/dxml/bitstream/handle/1944/1665/2.pdf?sequence=1.

12. Jody Condit Fagan Meris Mandernach Carl S. Nelson Jonathan R. Paulo Grover Saunders.Usability Test Results for a Discovery Tool in an Academic Library // Information Technology And Libraries. – 2012. –March. – P.83–112. – Режим доступа: http://ejournals.bc.edu/ojs/index.php/ital/article/viewFile/1855/1745.

13. Way D. The Impact of Web-scale Discovery on the Use of a Library Collection (2010). Scholarly Publications. Paper 9. – Режим доступа: http://scholarworks.gvsu.edu/library_sp/9.

14. NCSU libraries SUMMON user research: findings and recommendations. – Режим доступа: www.lib.ncsu.edu/.../userstudies/2010summon/Summon-usability.docx.

15. Notess G. R. Deciphering Discovery // Online, Jan – Feb 2011.

16. Bair S. A., Boston G. and Garrison G. Taming Lightning in More Than One Bottle: Implementing a Local Next-Generation Catalog Versus a Hosted Web-Scale Discovery Service" (2011). University Libraries Faculty & Staff Publications. Paper 21. – Режим доступа: http://scholarworks.wmich.edu/library_pubs/21.

17. Howard D., Wiebrands C. (2011, February). Culture Shock: Librarians' Response to Web Scale Search. Paper presented at the 2011 ALIA Information Online Conference, Australian Library and Information Association, Sydney, N.S.W.

18. Gross J., Sheridan L. Web scale discovery: the user experience // New Library World. – 2011. – Vol. 112, № 5/6. – P. 236–247.

19. Antelman K., Lynema E. and Pace A. K. Towards a twenty-ﬁrst century library Catalog // Information Technology and Libraries. – 2006. – Vol. 25, № 3. – Р. 128–139. – Режим доступа: http://eprints.rclis.org/bitstream/10760/8177/1/antelman_lynema_pace.pdf

20. Sadeh T. User-Centric Solutions for Scholarly Research in the Library // LIBER QUARTERLY, 2007, Volume 17 Issue ¾.– Режимдоступа: http://www.de-zeventiende-eeuw.nl/index.php/lq/article/view/URN%3ANBN%3ANL%3AUI%3A10-1-113501/8124.