Научные и технические библиотеки №11 2010 год
Содержание:

Соколов А. В. Информатические опусы. Опус 3. Онтология информации. Типы реальностей и типы информации

ДОКУМЕНТОВЕДЕНИЕ

Столяров Ю. Н. Документ: инвариантная и вариативная компоненты дефиниции

БИБЛИОТЕЧНО-ИНФОРМАЦИОННАЯ ДЕЯТЕЛЬНОСТЬ: ТЕОРИЯ И ПРАКТИКА

Редькина Н. С. Службы информационных технологий в научных библиотеках

Голубенко Н. Б. Особенности информирования студентов в НТБ Кузбасского государственного технического университета

ДИСКУССИОННЫЙ КЛУБ

«К барьеру!» – интеллектуальный поединок на Крымском форуме

«РОССИЙСКИЙ “БИБЛИОБУС” В АМЕРИКЕ»: ИНТЕРВЬЮ, РЕПОРТАЖИ. (Научно-образовательная профессиональная программа «Библиотечное дело, информационные системы и образование в США-2010)

Иванова Е. В., Волкова К. Ю. 12-й Международный семинар «Электронные ресурсы и международный обмен: Восток – Запад» (Обзор работы. Продолжение)

НОВЫЕ СТАНДАРТЫ

ОБЗОРЫ. РЕЦЕНЗИИ

Сукиасян Э. Р. Новое поколение справочников по библиотекам региона

Березная Т. И., Кислова Е. П. Профессиональное чтение библиотекаря: специализированный бюллетень «ЛибМаркет»

ВЕСТНИК АССОЦИАЦИИ ЭБНИТ

Выпуск 11

Ежегодная отчетно-выборная конференция Ассоциации ЭБНИТ (Обзор работы)

Павлов А. И. , Баженов И. С. , Грешнов Е. Б. Модернизация аппаратно-программного комплекса обеспечения сохранности данных в связи с внедрением технологии обслуживания читательского заказа в системе ИРБИС

Соколинский К. Е. Новые подходы к каталогизации заимствованием в ИРБИС-корпорации

Ушакова О. Б. Использование системы ИРБИС как инструмента анализа обслуживания абонентов ИРИ

Березная Т. И., Пекур Е. В. Мультимедийные уроки по работе с САБ ИРБИС

Шихова Х. И. Автоматизация ресурсных центров в целях совершенствования высшего образования

Памяти В. Н. Зайцева


К. Е. Соколинский

Международная ассоциация ЭБНИТ,
Учебно-информационный центр Северо-Западного
заочного технического университета, С.-Петербург

Новые подходы к каталогизации заимствованием
в ИРБИС-корпорации

Рассмотрен новый программный интерфейс для работы с ИРБИС-корпорацией и применённые в нём методы повышения эффективности заимствования записей. Обоснована необходимость использования специальной технологии кэширования, нормализации формы запросов и ранжирования результатов поиска по качественным признакам.

Использование в каталогизации готовых библиографических записей можно считать неотъемлемой частью современной библиотечной технологии. Поэтому большинство российских АБИС включают средства заимствования. Как правило, предусматривается заимствование по протоколу Z39.50 (например, в системах ИРБИС, «Руслан», «Академия+»), но в некоторых случаях поддерживаются и специализированные технологии (режимы заимствования из ОРАС Global, WEB ИРБИС и др.). Распространение получили также интеграционные порталы (например, порталы АРБИКОН, Корпоративной сети московских библиотек, RUSLANet, Сигла и др.), позволяющие выгружать записи без установки дополнительных программ. Таким образом, разными способами обеспечивается доступ к значительному массиву записей, который может использоваться как в текущей каталогизации, так и при ретроконверсии.

Тем не менее значительная часть библиотек либо вообще не применяет каталогизацию заимствованием, либо применяет, но без существенного выигрыша от этого [1]. Нередко трудоёмкость получения и редактирования готовых записей превышает трудоёмкость их самостоятельного создания. Косвенным свидетельством неэффективности заимствования допустимо считать сохранение прежних штатов каталогизаторов [2. С. 57] и предпочтение, отдаваемое многими библиотеками ресурсоёмкой технологии имидж-каталогов перед ретроконверсией.

Можно указать на совокупность как организационных, так и технических причин недостаточного применения заимствования. К первой группе причин относится разрозненность  библиографических ресурсов, высокие барьеры для вступления в корпоративные объединения и несогласованность стандартов. Ко второй – недостаточная эффективность инструментальных средств заимствования. И если существующую организационную структуру приходится рассматривать как данность, то технические препятствия устранимы и должны быть устранены.

Сегодня в российских технологиях распределённого поиска можно выделить следующие проблемы:

1. Низкая скорость выполнения запросов. При последовательном поиске она определяется количеством серверов, при параллельном – скоростью самого медленного сервера. В зависимости от принципа работы поисковой системы время ожидания может оказаться весьма значительным (Даже в эффективном программном обеспечении АРБИКОН среднее время выполнения широковещательного запроса – 37,7 секунд [3].)

2. Трудоёмкость ввода поискового запроса. В большинстве случаев поиск по оптимальному идентификатору записи – ISBN – возможен только при условии, что он введён с разделителями (тире).

Поэтому цифровое значение, которое может быть легко считано с обложки книги сканером штрих-кодов, оказывается для поиска непригодным. При поиске по автору зачастую некорректно интерпретируются инициалы. Они или вообще игнорируются, или их требуется вводить с обязательным соблюдением пунктуации – с пробелом и после запятой. (Например, инициалы не учитываются на портале RUSLANet и в клиенте Lib Navigator.)

3. Сложность выбора оптимальной записи в результатах поиска. Как правило, библиографические записи при поиске отображаются в соответствии с порядком сканирования серверов-источников. Нередко при этом выводится несколько десятков вариантов одной записи и выбор наилучшей оказывается проблематичным.

4. Недостатки реализации клиентов. При использовании стандартных windows-клиентов в проксируемой сети возникает необходимость дополнительной настройки прокси-сервера и установки специального программного обеспечения. Автономная работа клиентов делает также невозможным эффективное кэширование и фильтрацию неработоспособных серверов. С другой стороны, при использовании веб-приложений обычно не удаётся обеспечить отображение результатов по мере выполнения запроса, поэтому пользователю приходится ожидать сканирования всех источников.

Таким образом, можно сделать заключение о необходимости создания программного средства, позволяющего устранить все описанные выше недостатки. И в настоящее время ведётся его разработка для системы ИРБИС. Планируется, что оно сделает более эффективным использование имеющихся режимов.

ИРБИС располагает сегодня самым широким набором режимов заимствования. Непосредственно из АРМа «Каталогизатор» могут быть получены записи с серверов Z39.50, из OPAC Global и ИРБИС-корпорации. При этом поддерживаются все распространённые форматы данных: RUSMARC, USMARC, UNIMARC. Однако наиболее перспективным является заимствование в ИРБИС-корпорации. Это связано с распространённостью системы ИРБИС, применением в корпорации единого формата и отсутствием искажений, вносимых конвертерами. Поэтому создаваемый в настоящее время новый программный интерфейс ориентирован в первую очередь на интеграцию библиографических ресурсов пользователей ИРБИС. В то же время заимствование возможно не только через АРМ «Каталогизатор», но и через любой браузер. По своей форме интерфейс является AJAX-ориен­ти­ро­ванным веб-приложением. Архитектура решения даёт возможность соединить простоту использования веб-технологий с эргономичностью windows-интерфейса.

Главный акцент при разработке интерфейса делается на скорости получения данных, и как ключевые факторы быстродействия рассматриваются эффективное кэшировние, параллелизация процессов, блокировка сбойных серверов.

Сходство принципов комплектования многих видов библиотек (например публичных) позволяет прогнозировать и сходство библиографических потребностей. Поэтому постоянный опрос всех источников нецелесообразен, и оправдано многократное предоставление пользователям единожды собранных данных – кэширование.

При определении времени жизни кэша очевидна необходимость учёта специфики библиографической деятельности. Например, если нужная запись может быть заимствована в одной из пяти библиотек, библиографу, скорее всего, окажется достаточно найденных записей и повторное сканирование всех источников ради альтернативных вариантов не потребуется.

Более редким должно быть обновление кэша на издания советского периода, так как появление описаний на них в каталогах менее вероятно, чем на литературу последних лет выпуска.

Всё это уместно назвать принципами «библиографического кэширования». Ожидается, что они будут уточнены и дополнены на основе фактических данных статистики заимствования.

Поскольку новый интерфейс предполагает сортировку и быстрое извлечение больших объёмов данных, вместо традиционного файлового кэширования используется кэширование в локальную реляционную базу данных. Оно осуществляется в фоновом режиме и практически не отражается на скорости выполнения запроса.

Второе средство повышения скорости – распараллеливание. Запросы множеству серверов выполняются и обрабатываются одновременно самостоятельными процессами. За счёт этого нивелируется разница во времени отклика источников, и записи извлекаются максимально быстро. Кроме того, более эффективно используются вычислительные ресурсы, так как данные одного запроса обрабатываются в момент ожидания выполнения другого, и при этом может быть задействован весь аппаратный потенциал (процессоры, ядра процессоров, память).

Третье средство повышения эффективности – мониторинг работоспособности серверов. Хорошо известно, что запросы к  неработоспособным серверам крайне длительны. Они продолжаются до максимального времени, отведённого на запрос (тайм-аута). Поэтому целесообразно минимизировать их количество. Сбойный сервер на сутки блокируется, и новые обращения к нему, в случае повторения неудачных запросов, происходят через экспоненциально увеличивающиеся промежутки времени.

Таким образом, скорость выполнения запросов оптимизируется за счёт целого ряда как давно апробированных, так и оригинальных технологий. Но это не рассматривается как единственный фактор эффективности. Не меньшее внимание уделяется пользовательскому интерфейсу. К его ключевым особенностям относятся упрощённый механизм ввода запросов, динамический вывод результата, оптимизированный принцип сортировки записей и поддержка клавиатурных команд.

В отличие от большинства WEB-интерфейсов, где результаты демонстрируются после завершения выполнения запроса, в описываемом решении их вывод обеспечивается при получении новых данных. Кроме того, сам процесс поиска начинает выполняться автоматически при указании каталогизатором минимальных идентификационных сведений. По мере ввода запроса возникают и динамические «подсказки» в стиле Google, которые предлагают применить данные, использованные в предшествующих запросах. Всё это позволяет свести к минимуму время ввода. Той же цели служат упрощённые правила формулировки запроса.

ISBN может вводиться как с разделителями (дефис), так и без них. Благодаря этому создаются условия для получения записей на современные издания путём простого считывания сканером книжного штрих-кода. Для книг без ISBN обеспечивается возможность поиска по библиографическим данным. Данные об авторе могут вводиться как с соблюдением правил ГОСТа на библиографическое описание (с запятой после фамилии и пробелами между инициалами), так и в предельно упрощённой форме – без каких-либо знаков препинания, даже без точек после инициалов (например, иванов и и). Из заглавия могут вводиться лишь несколько первых слов. Год указывается последними двумя цифрами, так как библиографические записи на книги столетней давности мало востребованы.

Как показывает статистика, фамилия и инициалы автора, несколько символов заглавия (в общей сложности 10–12 знаков), позволяют идентифицировать нужную запись в 99,5% случаев. Поэтому в основу концепции интерфейса положен принцип однозначной идентификации.

Вместе с тем предлагаются и оптимальные условия для выбора нужных записей в результатах поиска. Записи, полученные из разных источников, выводятся не просто в порядке сканирования серверов, но ранжируются по формальным признакам качества. В роли таких признаков выступают: авторитетность источника; количество ранее выполненных заимствований; количество заполненных полей и подполей записи; объём записи.

Значимость каждого из этих критериев может быть самостоятельно определена пользователем с помощью настроек. Индивидуальные предпочтения сохраняются и учитываются в следующих сеансах заимствования.

И хотя ранжирование не претендует на решение проблемы оптимального выбора, однако позволяет структурировать хаотичный набор записей, при этом оставляя последнее слово за человеком. Для визуальной оценки может использоваться краткая библиографическая запись, полный набор полей записи, название библиотеки-источника и автоматически сгенерированный индекс качества. В то же время проектируется и технология консолидации записей, которая предполагает объединение всех версий записи в одну. Возможно, она позволит полностью снять вопрос о выборе оптимальной записи.

Поскольку очевидно, что «отрыв» каталогизатора от клавиатуры для использования «мыши» требует времени и снижает координацию действий, для выполнения технических операций предлагается употреблять сочетания клавиш. Переход между полями может осуществляться сочетаниями «CTRL» и клавишами управления курсором, выбор записи – применением «CTRL» и цифровых клавиш. Но применение «мыши», ставшей самым привычным инструментом для многих каталогизаторов, также остаётся допустимым.

Таким образом, в интерфейсе ИРБИС-корпорации предусматриваются все средства для повышения эффективности ввода запроса, технической реализации поиска и выбора оптимальных записей. По сравнению с другими программными решениями, его преимуществом являются функции:

  • специализированного кэширования широковещательных запросов;
  • динамического вывода результатов поиска и их ранжирования по формальным критериям качества;
  • алгоритмической нормализации данных пользовательского запроса;
  • автодополнения элементов поискового запроса.

Поэтому можно рассчитывать, что интерфейс ИРБИС-корпорации изменит отношение библиографов к каталогизации заимствованием и позволит доказать её высокую эффективность.

Список источников

1. Фронкин А. В. Современная библиотека в контексте корпоративной деятельности [Электронный ресурс] // Труды науч.-практ. конф., посвященной 145-летию Тверской областной библиотеки им. А. М. Горького (Тверь, Россия, 20 мая 2005). – Электрон. текстовые дан. – Режим доступа: http://corbis.library.tver.ru/cbs-ot08.htm.– Загл. с экрана.

2. Саринкова Т. Г. Внедрение новых компьютерных технологий в работу отдела комплектования и научной обработки фонда [Текст] / Т. Г. Саринкова // Современные тенденции развития библиотечно-информационных технологий вузовских библиотек : материалы конф. (Россия, Хабаровск, 21–23 октября 2003 г.). – Хабаровск : Изд-во ХГТУ, 2003. – С. 72–79.

3. Усманов Р. Т. Оценка эффективности работы распределенной сети Z39.50 серверов АРБИКОН [Электронный ресурс] / Р. Т. Усманов, А. А. Кузнецов // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса : материалы конф. (Судак, Авт. Респ. Крым, Украина, 4–12 июня 2005 г.). – Электрон. текстовые дан. – Москва : ГПНТБ России, 2005. – Режим доступа: http://www.gpntb.ru/ win/inter-events/ crimea2005/disk/217.pdf.– Загл. с экрана.

  
На главную