Научные и технические библиотеки №2 2008 год
Содержание:

14-я Международная конференция «Библиотечные и информационные ресурсы в современном мире науки, культуры, образования и бизнеса» – «Крым–2007»

Секция «Библиотечные кадры, профессия и образование»

Сукиасян Э. Р.Проблемы библиотечной профессии, кадров и непрерывного образования на Крымских форумах

Кузнецова Т. Я.Кадровое обеспечение национальных библиотечных программ: новые задачи непрерывного профессионального образования

Гендина Н. И.Высшая библиотечно-информационная школа в динамично меняющемся мире: факторы повышения конкурентоспособности выпускников

Кудрина Е. Л. Повышение качества подготовки специалистов библиотечно-информационного профиля в контексте социального партнерства вуза с библиотеками региона

Гришина С. М. Перспективы библиотечной профессии в малых городах: к проблеме библиотечных кадров в городах-спутниках мегаполисов

Скнарь В. К. Библиотечно-информационное образование Украины в процессе инновационного развития

Кузьмин Е. И., Мурована Т. А., Ершова Т. В. Информационно-образовательный портал «Культура и искусство»: на пути к эффективному образованию

Секция «Информационный рынок и формирование фондов»

Петрусенко Т. В. Интеграционные подходы к организации процессов комплектования в национальной библиотеке

Цветкова В. А., Полунина Т. К. Доступность научной литературы: тиражи и потребности

Секция «Экологическая информация и экологическая культура»

Бычкова Е. Ф. Направления работы Экологической секции на Крымском форуме1

Сибирцева Е. А., Левицкая Л. В., Карауш А. С. Региональные электронные информационные ресурсы по экологии: доступ расширяется

Меркешкина Л. В. Информационные ресурсы региона: содействие научной и исследовательской деятельности в области экологии. Из опыта работы Брянской ОНУБ им. Ф. И. Тютчева

Бычкова Е. Ф., Кондрашева И. Ю. Реферативная БД «Экология: наука и технологии» – важная часть электронной библиотеки ГПНТБ России по экологии

ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ. ЭЛЕКТРОННЫЕ РЕСУРСЫ

Воройский Ф. С., Колосов К. А. Основные технологические принципы разработки электронных библиотек гуманитарных вузов России

Сороколетова Н. В., Трубчанинова Г. А. Методика создания сводного электронного каталога периодических изданий в библиотеках Белгородской области

ПРОБЛЕМЫ ИНФОРМАЦИОННОГО ОБЩЕСТВА

Земсков А. И. Некоторые особенности работы с электронными документами. (Продолжение)


ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ.
ЭЛЕКТРОННЫЕ РЕСУРСЫ

УДК 025:65.011.56

Ф. С. Воройский, К. А. Колосов

ГПНТБ России

Основные технологические принципы разработки
электронных библиотек гуманитарных вузов России

Актуальность темы этой статьи определяется обстоятельствами, которые, как мы считаем, являются достаточно общими для большинства гуманитарных вузов России, а в определенной части  – и технических вузов. К этим обстоятельствам относятся:

  • единство общих целей и задач, которые должны решаться вузовскими электронными библиотеками (ВЭБ);
  • наличием определенной специфики состава и содержания контента ВЭБ, а также характера сервисов, которые должны обеспечиваться;
  • отсутствием отработанных методов проектирования ВЭБ;
  • недостаточной (как правило!) профессиональной подготовкой специалистов вузов, привлекаемых к проектированию и реализации ВЭБ.

Остановимся на нашем видении основных концептуальных вопросов проектирования ВЭБ.

Общие цели и задачи создания ВЭБ

Основная цель создания ВЭБ – информационное обеспечение высокого качества учебного процесса, научной, инновационной и управленческой деятельности вуза электронными и телекоммуникационными средствами доступа и отображения собственных ресурсов и заимствованных в Интернете.

Дополнительные цели:

  • обеспечение высокого уровня информационного (в том числе корпоративного) взаимодействия с профильными вузами, отделениями и филиалами вуза, а также с другими организациями и удаленными пользователями, включая руководителей и чиновников министерств и ведомств РФ, студентов всех форм обучения и др.;
  • обеспечение доступа студентов и преподавателей вузов к внешним информационным ресурсам Интернета;
  • внедрение обучающих систем, опира­ющихся на новейшие информационные технологии;
  • расширение объема дистанционного обучения путем реализации дополнительных образовательных услуг (второе высшее образование, повышение квалификации, переподготовка кадров и др.);
  • пропаганда достижений вуза с целью привлечения для работы в нем молодых и перспективных ученых и преподавателей;
  • повышение качества набора студентов и слушателей для учебы в вузе;
  • повышение привлекательности и качества культурно-воспитательной и массовой работы, проводимой в вузе.

Для достижения названных целей программно-технический комплекс ВЭБ должен обеспечить решение следующих задач:

1. Возможность отображения своими средствами в аудиториях, научных лабораториях, специально выделенных рабочих местах на кафедрах и в залах: всех видов образовательной, научной и учебно-методической литературы по профилю вуза, картографической документации, словарей и справочников, газет и журналов, учебных и художественных фильмов, видео- и ТВ-программ, музыкальных произведений.

2. Поддержку своими средствами подготовки и предоставление в доступ внешним пользователям через веб-сайт вуза полнотекстовых документов, мультимедийных ресурсов.

3. Обеспечение доступа профессорско-преподавательскому составу и студентам вуза к образовательным и информационным сайтам Интернета, содержащим профильные для вуза информационные ресурсы.

4. Проведение дистанционного обучения и телеконференций (как внутривузовских, так и с внешними пользователями).

5. Обеспечение ведения, наполнения, развития контента ВЭБ (включая ее медиатеку и специализированные ТВ-программы) и архива наиболее представительных ресурсов – как актуальных в текущее время, так и снятых с сайта ВЭБ.

Вопросы о составе и распределении программно-технических средств, обеспечивающих реализацию перечисленных задач, должны решаться в процессе технического проектирования ВЭБ с учетом этапов его реализации. Защита программно-технологического комплекса ВЭБ, его информационных ресурсов и сервисов, а также круглосуточный доступ к контенту должны обеспечиваться общесистемными средствами ВЦ вуза.

Основные принципы проектирования ВЭБ

ВЭБ являются достаточно сложными объектами автоматизации информационных процессов, поэтому на их проектирование, реализацию и развитие полностью распространяются требования ГОСТ 34.601–90 [1], определяющего стадии и этапы проектирования, а также их содержание. В то же время этот стандарт (в зависимости от характера объекта автоматизации и состояния исходной базы) разрешает объединять отдельные стадии (например эскизного и технического проектирования). Обязательной стадией проектирования ВЭБ является проведение предпроектного обследования вуза, его локальной сети и используемых программно-технических средств.

К числу сведений, необходимых для проектирования ВЭБ, относятся:

1. Краткая характеристика имеющихся программно-аппаратных средств вуза, содержащая следующие элементы:

  • наименование используемых операционных систем;
  • описание локальной вычислительной сети (имеется одна общая сеть или несколько; если несколько, то по какому принципу они разделены и возможна ли связь между ними; пропускная способность ЛВС; количество клиентских мест в сети или сетях; включена ли в ЛВС библиотека вуза; все ли кафедры обеспечены связью по ЛВС с библиотекой);
  • вид и пропускная способность каналов связи с Интернетом;
  • виды и конфигурации серверного оборудования вуза, степень их загрузки информационными ресурсами и текущими задачами (примерно, в процентах);
  • характеристика оборудования, установленного на кафедрах и в учебных классах в корпусах вуза (в частности, имеется ли возможность реализации в каждом корпусе класса с демонстрационным оборудованием ВЭБ);
  • наличие в вузе программно-технических комплексов для работы с большими массивами CD и/или DVD, если имеется, то какова их доступность в ЛВС вуза;
  • наличие крупномасштабных ЖК, плазменных и/или других панелей, пригодных для использования при работе с медиацентром (в частности для демонстрации ТВ-программ).

2. Краткая характеристика существующей медиатеки вуза, содержащая следующее:

  • количество оптических дисков (CD и DVD) с записью мультимедийных документов и данных, необходимых для обеспечения учебного процесса;
  • количество аудиозаписей;
  • экспертную оценку возможного или требуемого роста медиатеки в ближайшие годы;
  • наличие электронного каталога мультимедийных и аудиозаписей.

3. Исходные предложения (требования) по архитектуре программно-аппаратного комплекса ВЭБ; варианты: централизованная (сервер – залы коллективного доступа); полностью распределенная (сервер – рабочие места на кафедрах и в учебных классах); смешанная.

Для всех вариантов необходимо указать количество рабочих мест (с учетом возможности их реализации по этапам в ближайшие годы), оборудованных средствами, обеспечивающими возможность работы с медиаданными.

4. Исходные требования к качеству отображаемой информации.

Программно-аппаратный комплекс должен обеспечивать разрешающую способность передаваемого изображения. Возможныеварианты: обычные картографические изображения; изображения, полученные в результате аэрокосмической съемки с высоким разрешением; мультимедийные и ТВ-программы – низкого, среднего или высокого качества.

Проведение предпроектного обследования предполагает:

разработку организационной и методической документации проведения обследования,

сбор данных обследования,

обобщение и анализ полученных данных,

написание итогового отчета о результатах обследования.

Организационной документацией является приказ ректора вуза о проведении предпроектного обследования, содержащий распоряжение о проведении обследования; сроки проведения; перечень лиц, отвечающих за разработку методики (желательно – первый проректор); проведение обследования как во всем вузе, так и в его основных подразделениях (желательно – на уровне деканов и заведующих кафедрами), а также подготовку итогового документа; вид итогового документа, порядок его обсуждения и представления к утверждению.

Выполнение сбора данных обследования по единой для вуза методике производится ведущими сотрудниками подразделений под руководством их заведующих. Считается целесообразным выполнять эту работу в максимально сжатые сроки (в пределах 1–2 недель).

Результаты анализа, оформленные в виде научно-технического отчета, могут содержать:

  • общую характеристику сложившейся системы информационного обеспечения и справочно-информационного обслуживания вуза и ее недостатков;
  • оценку технико-экономической целесообразности создания ВЭБ;
  • анализ опыта создания отечественных и зарубежных систем аналогичного класса;
  • оценку возможности создания ВЭБ на базе имеющихся в вузе средств;
  • дерево задач, которые целесообразно решить с использованием проектируемого программно-технологического комплекса ВЭБ;
  • исходные данные для формирования требований к программно-технологическому комплексу ВЭБ;
  • приложения с обобщенными данными обследования, чертежи, схемы, описания, обоснования, расчеты и другие сведения, не вошедшие в основной текст отчета.

Учитывая, что выполнение работ на этом этапе не требует значительных финансовых затрат, полный цикл выполнения обследования может составлять от одного до трех месяцев*.

По нашему мнению, ВЭБ должна рассматриваться как подсистема вузовской АБИС. (Обоснование этого утверждения дано в работах [2–4].) Это означает, что реализация ВЭБ как части программно-технологической базы АБИС ставит новые задачи, связанные с их проектированием, в том числе:

разработку и реализацию в вузах подсистем «Электронная библиотека», оборудованных программно-аппаратными и технологическими комплексами, соответствующими решаемым в них задачам;

внесение в работу вузовских библиотек существенных организационных и технологических изменений.

Они связаны с необходимостью:

  • выделения в их рамках специальной структуры, ответственной за все виды работ по формированию информационных ресурсов ВЭБ, а также поддержку, предоставление в доступ, сохранение и использование этих ресурсов;
  • наращивания программно-аппаратной базы АБИС, необходимой для функционирования ВЭБ;
  • внесения определенных изменений в технологию работы подразделений библиотек, непосредственно связанных с комплектованием полнотекстовых информационных ресурсов, в частности, переход от привычных методов библиографической обработки к обработке, обеспечивающей полноценный обмен полнотекстовыми и мультимедийными данными в Интернете с применением систем метаданных и их форматов, использующих XML-ориенти­рованные языки разметки гипертекста, а также современных сетевых протоколов.

(Предложения по организационно-технологическому построению электронных библиотек как подсистем АБИС, которые могут быть использованы при проектировании ВЭБ, изложены в работах [2, 5].)

5. Проектирование и реализация ВЭБ должны производиться поэтапно. Это определяется как требованиями ГОСТ 34.601–90, так и учетом реальных возможностей вузовских библиотек по полномасштабному внедрению электронных библиотек, отвечающих поставленным перед ними целям и задачам. Содержание этапов разработки и внедрения ВЭБ, а также сроки их выполнения определяются исходя из сложности и стоимости работ и наличия ресурсов в вузах на их выполнение.

В качестве вариантов операционной системы (ОС) для ВЭБ до 2010 г. можно рекомендовать:

  • сертифицированную Комиссией при Президенте Российской Федерации ОС WindowsXPProfessional. Она позволяет (помимо других расширенных возможностей работы с цифровыми изображениями, музыкой и видеофильмами) производить запись телепередач и воспроизводить файлы в формате MP3;
  • выпущенную в сентябре 2004 г. версию ОС – MCE 2005 (WindowsXPMediaCenterEdition 2005), ориентированную на более совершенные аппаратные графические компоненты, в частности ТВ-тюнеры, обеспечивающие высокое качество изображения, которое не уступает изображению на экране хорошего телевизора;
  • из перспективных ОС для серверов указанной цели будет отвечать ОС WindowsVista (WindowsServer 2008), выпуск ее полномасштабных клиентских версий ожидается в 2008 и 2009 гг. Тогда же будет прекращена поддержка версий WindowsXP и WindowsServer 2003. Однако мы полагаем, что переход на эту ОС целесообразно будет произвести не ранее 2010 г. [6–8].

Для оборудования ПК центров коллективного доступа – из существующих в настоящее время ОС – требованиям обеспечения работы ВЭБ отвечает версия ОС WindowsXPMediaCenterEdition, выпущенная в 2002 г. В интерфейсе пользователя представлены функции записи на DVD и CD. Установка MCE 2005 производится «поверх» WindowsXPHomeEdition.

6. В качестве прикладного ПО веб-сервера для ВЭБ предлагается использовать ПО отечественных производителей, которое обеспечивает:

  • использование коммуникативных форматов ввода RUSMARC, UNIMARC или MARC21;
  • выбор записей из числа найденных с последующей их обработкой, включая выгрузку выбранных записей в стандартных форматах RUSMARC, UNIMARC или MARC21;
  • полную совместимость со всеми компонентами данного семейства программных продуктов;
  • возможность работы по предоставлению и использованию ресурсов в сетях Интернет и Интранет по протоколу Z39.50 и его модификациям;
  • единую технологию обслуживания локальных и удаленных пользователей;
  • единую технологию обслуживания запросов, поступающих в режиме онлайн и по электронной почте;
  • полную совместимость описаний рабочих листов ввода для обеспечения процесса каталогизации с сетевой версией системы;
  • возможность использования единого библиографического массива как для технологических операций, так и для обслуживания локальных и удаленных пользователей;
  • возможность поиска по неограниченному числу полей библиографической записи и их комбинациям, в том числе определенных набором BIB-1, принятым де-факто как стандарт поисковых определений библиотечных систем, с применением логики «И», «ИЛИ» и «ФРАЗА ЦЕЛИКОМ», с возможностями определения префиксов и квалификаторов поисковых терминов, грамматической нормализации слов русского языка и применения аппарата усечений;
  • работу с полнотекстовыми, мультимедийными, видео- и аудиодокументами и данными;
  • поддержку электронных библиотек, электронную доставку документов и МБА;
  • поддержку распределенных корпоративных систем и многофилиальных сетей;
  • автоматическое распознавание кодировки входящего пользователя (в онлайновом режиме и режиме электронной почты);
  • простые и удобные системы биллинга и авторизации пользователей;
  • возможность работы с любым количеством библиографических БД, в том числе и одновременно;
  • возможность формирования запроса в фиксированной и свободной формах с использованием большинства операций информационного поиска;
  • широкие возможности настройки и создания наиболее удобного для пользователей конкретной библиотеки окружения;
  • удаленное авторизированное внесение изменений в БД, включая редактирование существующих записей, добавление новых, удаление без актуализации;
  • низкие первоначальные затраты на программно-технический комплекс;
  • низкие затраты на сопровождение и администрирование комплекса.

Необходимость учета перечисленных условий важна, поскольку они обеспечивают взаимодействие пользователей ВЭБ и библиотечного ресурса в Интернете, а также определяют не только качество АБИС, но и систему обслуживания вузовской библиотеки в целом. Известно, что число удаленных (виртуальных) пользователей, ежедневно посещающих сервер библиотеки, все чаще превышает число ее физических посетителей. Сказанное объясняет все возрастающий спрос администрации библиотек разной ведомственной принадлежности на внедрение подобных систем. Такие системы уже широко распространены в библиотечной практике и продолжают внедряться в библиотечные технологии не только многих российских библиотек, но и библиотек других стран.

7. Состав аппаратных средств ВЭБ, их количество и технические характеристики определяются на стадии технического проектирования на основании результатов предпроектного обследования вуза, объемов и видов информационных ресурсов (и предполагаемого их роста в ближайшие 3–5 лет). Приобретение и установку этих средств целесообразно разбить на этапы, сроки и содержание которых определяются перспективами развития ВЭБ и финансовыми возможностями вуза.

Пример концептуального проектирования
программно-аппаратного комплекса ВЭБ

В 2006–2007 гг. сотрудники ГПНТБ России, являющиеся ведущими преподавателями кафедры новых информационных технологий и электронных библиотек МГУКИ, выполнили работы по созданию концептуальной модели электронной библиотеки МГУКИ. Цель ее создания – отработка программно-технической базы, информационной структуры, дизайна, а также начальная загрузка контента ЭБ на основе имеющихся в библиотеке текстовых документов кафедр университета.

Предварительный вариант общей функциональной блок-схемы алгоритма работы модели ЭБ МГУКИ, создаваемой на основе ПО Web-ГПНТБ России при обслуживании пользователей, приведен на рис. 1. Предварительный вариант общей функциональной блок-схемы ЭБ МГУКИ, создаваемой на основе комплекса программных средств Системы автоматизации библиотек ИРБИС, представлен на рис. 2.

Рис.1. Блок-схема алгоритма работы модели ЭБ МГУКИ, создаваемой на основе
ПО Web-ГПНТБ России при обслуживании пользователей.

Краткая характеристика программно-аппаратного комплекса опытной модели ЭБ МГУКИ

ПО Web-ГПНТБ России полностью соответствует условиям, указанным ранее. Предусмотрено также, чтобы все функции и возможности ПО могли управляться администратором системы, включая настройку поисковых форм, добавление и удаление поисковых полей, настройку их атрибутов, включение рубрикаторов и статических словарей. При этом особое внимание уделялось дополнительным сервисным функциям, направленным на улучшение обслуживания пользователей и интегрирование внутрибиблиотечных и межбиблиотечных технологий посредством библиотечного информационного комплекса. Последнее особенно важно для приближения к современным ИТ удаленного обслуживания читателей и пользователей электронных библиотек.

ПО Web-ГПНТБ России обеспечивает четыре базовых режима доступа, которые могут комбинироваться и переопределяться для каждого конкретного коллективного или индивидуального пользователя:

1. Свободный доступ предназначен для общедоступного предоставления базовых ЭК и БД. Он является основным режимом работы ПО (более 80% обращений приходится именно на свободный доступ и не требует регистрации пользователей).

2. Авторизированный доступ с возможностью выгрузки записи и/или группы записей предназначен для организации межбиблиотечных и многофилиальных технологий. В этом режиме необходима регистрация пользователей в БД управления доступом ПО. Для доступа пользователям необходимо пройти процедуру авторизации. Кроме базовых операций в этом режиме доступны процедуры выгрузки и загрузки записей в/из БД в форматах RUSMARC, UNIMARC, MARC21, редактирования и удаления записей. Это позволяет использовать данный режим для ведения корпоративных информационных ресурсов, сводных каталогов, а также оптимизировать работу внутренних технологий многофилиальных библиотечных систем и т.д.

3. Авторизированный доступ с возможностью заказа предназначен для реализации функций МБА, ЭДД и организации работы с потоком документов в многофилиальных системах. Требует регистрации и авторизации пользователей. Кроме базовых функций в этом режиме доступны модули оформления заказа для доставки на различные кафедры библиотеки и/или филиальной сети с возможностью определения условий и времени получения первоисточников, подготовки обычной копии (доставка почтой или факсом) и электронной копии части документа с последующей доставкой заказчику по электронной почте или FTP.

4. Авторизированный доступ с возможностью заказа в технологические БД АРМ «Книговыдача» ИРБИС аналогичен предыдущему режиму, однако все заказы и их обработка осуществляются соответствующим АРМом ИРБИС, что позволяет достичь обшей технологии обработки как для локальных, так и для удаленных пользователей. Наиболее актуален для библиотек, имеющих внутреннюю организацию доступа читателей по технологии Интранета. Кроме того, позволяет более простым способом организовать обслуживание по МБА и ЭДД в библиотеках, имеющих централизованный каталог.

Рис. 2. Предварительный вариант общей функциональной блок-схемы ЭБ МГУКИ, создаваемой на основе комплекса программных средств Системы автоматизации библиотек ИРБИС

Другая важная особенность ПО Web-ГПНТБ России – встроенная поддержка включения в ЭК и БД ссылок на полные тексты документов. При этом реализована свободная технология формирования ссылок в виде URL, что позволяет использовать ПО Web-ГПНТБ России не только для формирования собственной коллекции полных текстов, но и для каталогизации и включения в БД ресурсов Интернета, что крайне важно (как подчеркнуто ранее) в современных условиях. Более того, с учетом непрерывного увеличения удельного веса электронных коллекций у ведущих поставщиков периодики данное свойство становится критически важным и с экономической точки зрения. Например, стоимость подписки на электронные коллекции Эльзевир, одного из ведущих научных издательств мира, может быть в несколько раз (а в некоторых случаях и в десятки раз!) ниже стоимости аналогичной печатной коллекции. При этом необходимо помнить о том, что доступ к электронным версиям полностью снимает проблему определения оптимальной экземплярности: все читатели библиотеки имеют возможность одновременно обратиться к одному и тому же экземпляру журнала или другого издания. Но это отдельная тема – тема коренного изменения фундаментальных основ работы библиотеки на базе информационных технологий.

Таким образом, ПО Web-ГПНТБ России может использоваться в качестве базовой технологии при создании виртуальных и электронных библиотек. Процесс формирования ссылок достаточно прост и полностью интегрирован с технологией каталогизационного описания ИРБИС: при форматировании записи автоматически генерируется стандартная ссылка и в описании появляется прямая ссылка на полный текст документа.

ПО для доступа к распределенным Интернет-ресурсам по протоколу Z39.50 составляет разработанный ГПНТБ России программный модуль обеспечения работы по протоколу Z32/Z64 (предназначен для эксплуатации в качестве базового сервера и шлюза Z39.50 – ISO23950) распределенной информационной системы общего назначения на платформе Windows NT. Он обеспечивает решение задач параллельного поиска информации в распределенных БД, как библиографических, так и полнотекстовых. В основе его построения использована клиент-серверная архитектура, базирующаяся на стандартах и принципах открытых систем. Это позволяет использовать клиентскую и серверную части как совместно – для построения полнофункциональной поисковой системы, так и раздельно – для взаимодействия с другими системами по протоколу Z32/Z64.

Модуль обеспечивает доступ к базам данных ИРБИС32 и ИРБИС64 и служит для построения виртуальных распределенных Интернет-каталогов, позволяющих публиковать в Интернете и Интранете собственные ресурсы, а также осуществлять через Интернет поиск данных в каталогах других систем с возможностью их импорта в собственные БД (ИРБИС и ИРБИС64). Z32/Z64 является частью программно-технологического комплекса системы автоматизации библиотек ИРБИС.

В состав программного модуля Z32/Z64 входят:

базовыйсервер Z-ИРБИС (Windows NT 4.0 sp6, Windows 2000, Intel);

сервер Z39.50 для поддержки полнотекстового поиска (WindowsServer, 512 Мбайт);

шлюз HTTP-Z39.50 (IIS 4.0, Windows XP, Windows 2000, Intel);

графическое рабочее место клиента информационной системы (Win32, Windows 95/98/NT/2000).

Принципы построения и функциональные возможности базового сервера Z-ИРБИС:

  • создан на основе базового пакета YAZ, что обеспечивает функциональную поддержку стандарта Z39.50, включая его последние изменения;
  • имеет встроенный провайдер данных ИРБИС, обеспечивающий доступ к БД ИРБИС32 или ИРБИС64, в зависимости от вида сервера;
  • обеспечивает расширенную поддержку сеансовых соединений, позволяющую производить хранение и обработку результатов поиска на уровне сервера;
  • имеет встроенный контроль прав доступа пользователей на основе анализа IP-адресов клиентов;
  • позволяет производить подключение неограниченного числа баз данных;
  • поддерживает форматы представления данных – ISO–2709 (RUSMARC, UNIMARC, MARC21), SUTRS, XML;
  • позволяет производить настройки форматов представления данных путем редактирования внешних форматных файлов, написанных на языке форматирования ISIS;
  • поддерживает кодировки UTF-8, Windows-1251, KOI-8;
  • поддерживает набор поисковых атрибутов bib-1 (с возможностью их редактирования) и обеспечивает соответствие требованиям профайла Bath (требования по совместимости возможностей поиска).

Принципы построения и функциональные возможности сервера Z39.50 для поддержки полнотекстового поиска по произвольному набору документов:

  • использует функции провайдера Z39.50 для доступа к модулю полнотекстового поиска системы ИРБИС64 (подсистема полнотекстового информационного поиска в ИРБИС64 разработана коллективом программистов ГПНТБ России [10]);
  • работает как сервер внутренней сети (Интранет) и взаимодействует со шлюзом HTTP-Z39.50;
  • обеспечивает полнотекстовой поиск на основе анализа индексированного набора документов в форматах HTML, Word, TXT, PDF;
  • поисковый запрос формируется через шлюз HTTP-Z39.50 с использованием логических операторов И, ИЛИ, НЕ;
  • результатом поиска являются гиперссылки к найденным документам.

Принципы построения и функциональные возможности шлюза HTTP-Z39.50:

  • использует функции базового пакета YAZ, что обеспечивает функциональную поддержку стандарта Z39.50, включая последние изменения;
  • функционирует как скрипт на веб-сервере;
  • не зависит от типов серверов Z39.50, к которым он обращается;
  • поддерживает представление данных в кодировке UTF-8;
  • позволяет выводить данные в формате ISO–2709 (для возможностей импорта), а также в форматированном виде в построчном представлении по полям;
  • обеспечивает параллельный поиск по неограниченному числу серверов Z39.50 (локальных и удаленных);
  • позволяет формировать сложные поисковые запросы с использованием логических операторов И, ИЛИ, НЕ;
  • поддерживает идентификацию пользователей с использованием проверки имени и пароля с целью ограничения доступа внешних пользователей к возможностям импорта данных;
  • поддерживает встроенную систему формирования заказа для электронной доставки документов.

В разработанном программном пакете Z32/Z64 реализованы два способа поиска информации по полному тексту документов, основанных 1) на загрузке полнотекстовых документов в БД ИРБИС64 с последующим обращением к этой БД через сервер Z64 и выводом результатов через шлюз HTTP-Z39.50; 2) на индексации массива документов в формате HTML, находящихся на сервере, с последующим доступом к ним через сервер Z39.50 и выводом результатов через шлюз HTTP-Z39.50.

Для обоих вариантов вывод результатов полнотекстового поиска осуществляется через шлюз HTTP-Z39.50, который обеспечивает динамическое форматирование отображаемого полнотекстового документа, выделяя другим цветом найденные поисковые слова в теле документа. В зависимости от целей использования и полноты имеющегося библиографического описания возможно использование первого или второго способа создания полнотекстовых БД. При наличии библиографических описаний индексируемых документов целесообразнее размещать их в БД ИРБИС64, что позволит пользователю выводить как описание документов, так и их полные тексты.

При отсутствии внешних библиографических описаний документов, а также при наличии в HTML-документах полей метаданных, содержащих сведения Dublin Core, возможно использование второго способа, предусматривающего индексацию произвольного набора документов.

Реализация опытной модели ЭБ МГУКИ

Проектирование сайта модели ЭБ МГУКИ

На рис. 3 представлен фрагмент начальной страницы поискового интерфейса ЭБ МГУКИ. Пользователю предоставляется возможность двух вариантов поиска: простого и расширенного. По умолчанию задействуется простой поиск, при котором пользователь вводит искомое слово или фразу. Этот вариант по форме использования приближен интерфейсам наиболее распространенных поисковых Интернет-порталов (например Google, Yandex), что позволяет пользователю не тратить время на освоение особенностей интерфейса.

При обработке введенного запроса шлюзом HTTP-Z39.50, разработанным при участии одного из авторов этой статьи [9], он преобразуется в форму, использующую набор атрибутов bib1 протокола Z39.50, следующего вида:

@or @attr 1=1035 @attr 5=1 <поисковое выражение> @attr 1=4 @attr 5=1 <поисковое выражение>.

Рис. 3. Фрагмент начальной страницы поискового интерфейса ЭБ МГУКИ.

В данном случае используется дизъюнкция с применением двух атрибутов первой группы набора bib1: 1035 (поиск по любому полю) и 4 (поиск по заглавию) и установлено усечение окончаний (значение 1 для атрибутов пятой группы набора bib1). Использование комбинации двух вариантов поисковых атрибутов позволяет искать записи в библиографических БД на сервере Z39.50 даже в случае наличия не полностью сформированного словаря для атрибута 1035 (поиск по любому полю). Это связано с тем, что в базовой версии системы ИРБИС для поиска по любому полю может использоваться индекс, соответствующий поиску по ключевому слову. В этом случае поиск по отдельно введенному слову будет осуществляться корректно, но для поиска по введенной фразе, когда требуется найти рядом стоящие слова, следует использовать поиск по заглавию.

Интерфейс расширенного поиска предлагает пользователю заполнить хотя бы одно из дополнительных полей: «Название», «Автор/Создатель», «Ключевые слова», «Год издания». В этом случае поиск на сервере Z39.50 осуществляется с использованием дизъюнкции соответствующих атрибутов первой группы набора bib1 протокола Z39.50. Кроме того, пользователю предлагается указать, в каких базах данных будет производиться поиск: в каталоге библиографических описаний ресурсов или в полнотекстовой БД.

В разрабатываемой в настоящее время новой версии WEB-ИРБИС планируется одновременный поиск по обоим типам БД за счет использования провайдера к полнотекстовым БД для сервера Z39.50 (сервер Z64).

В нижней части начальной страницы поискового интерфейса вводится список библиографических описаний наиболее спрашиваемых электронных ресурсов, а также сводная таблица количества ресурсов по типам материалов: учебные, справочные, нормативные документы и др. Пользователь может перейти к просмотру ресурсов, отобранных по типу материала.

Результаты выполнения поискового запроса по каталогу ресурсов выводятся в виде списка найденных записей.

Элементы оформления интерфейса и форматы представления записей в выходной форме написаны на языке форматирования, близком к используемому в ИРБИС, и вынесены во внешние файлы, что позволяет их модифицировать, не прибегая к программированию или перекомпиляции.

Для удобства пользователей искомые слова или фразы выделяются цветом. Элементы описания документа, в частности ключевые слова, являются гиперссылками, что расширяет возможности навигации пользователя при поиске по каталогу. Переход к просмотру полного текста также осуществляется по гиперссылке.

При поиске ресурсов в электронных библиотеках, а также в распределенных информационных системах с разнородными типами данных часто используют описания ресурсов, представленные в соответствии со схемой метаданных DublinCore. В этом варианте выходной формы предусмотрена гиперссылка, при вызове которой можно посмотреть описание ресурса в формате DublinCore. Данный формат представления формируется сервером Z39.50 (Z64), что позволяет выгрузить описания всех ресурсов ЭБ в DublinCore для последующего их использования в системах, которые производят сбор метаданных, в частности, в OAI (“инициативе открытых архивов”) [3].

В выходной форме предусмотрена гиперссылка для перехода к поиску введенной фразы в полнотекстовых БД. При переходе к этому типу поиска пользователь имеет возможность ввести дополнительные параметры: расстояние между словами, степень сходства и др.

Информационные ресурсы МГУКИ на начальный период работы по созданию модели ЭБ составили более 260 единиц полнотекстовых документов, находящихся на ПК в НТБ университета и кафедре информационных технологий и электронных библиотек в ГПНТБ России. Из них 240 документов выполнены в формате doc, 12 документов – в tif, около 10 документов – в pdf.

Анализ характера этих ресурсов показал, что их подавляющее большинство может быть отнесено к разряду учебно-методических материалов, а небольшая часть – к дипломным работам студентов. Практически все документы требуют обработки и преобразования в единую форму, пригодную для использования в ЭБ МГУКИ. Имеются в виду преобразование их структуры, редактирование, использование единых шрифтов, форматов и др.

Подготовка библиографических записей для ЭК полнотекстовых изданий выполняется силами студентов кафедры информационных технологий и электронных библиотек Библиотечно-информационного института МГУКИ по единой технологической инструкции (с использованием ПО ИРБИС64 – последней на настоящее время версии системы).

Предварительная обработка документов выполнялась также силами студентов. Эта работа предусматривала:

  • техническое редактирование текстовых документов, выполненных в формате doc.;
  • переименование файлов (перевод наименований на латиницу);
  • разбиение крупных документов на части для реализации возможности полнотекстового поиска в массивах документов с использованием разработанного в ГПНТБ России программного обеспечения;
  • преобразование документов, выполненных в непригодном для ЭБ формате tif, в формат pdf.

К началу мая 2007 г. работа выполнена полностью.

Список источников

1. ГОСТ 34.601-90. Комплекс стандартов на автоматизированные системы. Автоматизированные системы. Стадии создания. Введ. 29.12.90. Взамен ГОСТ 24.601–86 и ГОСТ 24.602–86. Переиздан. Июнь 1997 г.

2. Воройский Ф. С. Основы проектирования автоматизированных библиотечно-информационных систем. – Изд. 2-е, доп. и перераб. – М. : Физматлит, 2007. – 521 с.: ил. 25; табл. 19. – Библиогр.: 430 назв.

3. Гончаров М. В. Практическая реализация библиотечного Интернет-комплекса : научно-практ. пособие / М. В. Гончаров, К. А. Колосов. – М. : ФАИР-ПРЕСС, 2005. – 192 с.

4. Воройский Ф. С.Развитие электронных библиотек как подсистем АБИС перспективное направление автоматизации библиотек // «Информационные технологии, компьютерные системы и издательская продукция для библиотек»: докл. и тез. докл. Междунар. конф. «LIBCOM–2006». – М. : ГПНТБ России. – 2006. – [Электронный ресурс] – Режим доступа: http://www.gpntb.ru/libcom6/disk/trud.html. – Загл. с экрана.

5. Воройский Ф. С. Основные принципы организационно-функционального построения электронных библиотек как подсистем АБИС // ”Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества”: Материалы конф. «Крым–2007». – М. : ГПНТБ России, 2007 г. – [Электронный ресурс] – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2007/cd/proceeding.html. – Загл. с экрана.

6. Елманова Н.WindowsVista и затраты на информационные технологии // Компьютер пресс. – 2005. – № 11. – С. 20–22.

7. Колесов С. Планы выпуска продуктов Microsoft на 2006–2008 годы // PCWEEK (RussianEdition). – 2006. – № 3 (513). – С. 28, 29.

8. Воройский Ф. С. Информатика. Энциклопедический систематизированный словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах. – 4-е изд. перераб. и доп. – М. : Физматлит, 2006. – 965 с.

9. Колосов К. А. Новые возможности поисковых средств портала ВГБИЛ // Труды 12-й Междунар. конф. "Крым–2005". – М. : ГПНТБ России, 2005. [Электронный ресурс] – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2005/disk/183.pdf. – Загл. с экрана.

10. Бродовский А. И.ИРБИС64 как инструмент создания и ведения полнотекстовых баз данных / А. И. Бродовский, Е. В. Попов, К. О. Сбойчаков // Там же. – Режим доступа: http://www.gpntb.ru/win/inter-events/crimea2005/disk/trud.html. – Загл. с экрана.

  
На главную