Home page | Каталоги и базы данных

Научные и технические библиотеки
Гончаров М.В.

зав. отделом перспективных исследований
и экспертиз в области новейших информационных технологий
ГПНТБ России

Новые проекты ГПНТБ России в области
телекоммуникации

В рамках Программы телекоммуникационных проектов ГПНТБ России и ряда федеральных проектов, в которых активно участвует Библиотека (в частности проекта LIBWEB, финансируемого РФФИ и РГНФ) в настоящее время проводится следующий комплекс работ:

  1. Разработка типовых решений для библиотечных WWW-серверов;

  2. Дальнейшая разработка, тестирование и промышленная эксплуатация системы доступа пользователей к библиографическим, информационным и справочным ресурсам ГПНТБ России по каналам Интернет с использованием технологии World Wide Web (WWW);

  3. Дальнейшее наполнение информационных и библиографических массивов сервера ГПНТБ России с целью их бесплатного и свободного использования всеми пользователями Интернет;

  4. Модернизация коммуникационной составляющей ГПНТБ России.

Особое внимание при выполнении Телекоммуникационной программы ГПНТБ России уделяется новым большим проектам, которые в настоящее время активно развиваются и отрабатываются в экспериментальном режиме. К таким проектам относятся прежде всего создание Российского центра корпоративной каталогизации, Российского онлайнового библиотечно-информационного центра и развитие системы "Виртуальная библиотека", с поддержкой Совета по программе "Информатизация России" — Федеральная целевая научно-техническая программа на 1996—2000 гг. "Исследования и разработки по приоритетным направлениям развития науки и техники гражданского назначения" (Проект № 317.43).

Разработка и внедрение комплекса типовых решений. Данные работы предусматривают разработку и внедрение в эксплуатацию программно-технического комплекса UNIX-сервера, обеспечивающего доступ пользователей по протоколу http к библиографическим ресурсам. Разработаны два типовых решения: на базе использования программного обеспечения public domain — операционная система Linux 1.2.8., http-сервер Appache (Типовое решение 1); на базе OC Windows 95 / Windows NT, http-сервера WebSite (Типовое решение 2).

Типовое решение 1 представляет собой дистибутив OS Linux с дополнительным программным обеспечением: русифицированный web-сервер Appache, программный шлюз к базам данных CDS/ISIS, позволяющий реализовать поиск в БД CDS/ISIS с использованием протокола http. Данное типовое решение в настоящее время передается участникам проекта LIBWEB и другим заинтересованным организациям бесплатно.

Типовое решение 2 находится на этапе экспериментальной апробации. Окончательный вариант будет готов в конце 1998 г.

Дальнейшая разработка, тестирование и промышленная эксплуатация системы доступа пользователей к библиографическим, информационным и справочным ресурсам ГПНТБ России по каналам сети Интернет с использованием технологии WWW. За последние два года разработана технология использования реальных массивов, размещенных на файловых серверах при удаленном доступе. По результатам анализа производительности в качестве основной для сервера ГПНТБ России принята схема, при которой файлы основных массивов БД (MST-файлы в терминологии CDS/ISIS) разделяются для внутреннего использования и удаленного доступа так же, как инвертированные файлы разводятся по соответствующим разделам серверов с различными ОС. Это позволяет поддерживать внутреннюю целостность системы БД — ведется, актуализируется и модифицируется один массив, который затем инвертируется для различных ОС. Таким образом, состояние БД для удаленного доступа практически эквивалентно состоянию реальной БД (различия могут выявляться только при инвертировании в разное время).

Поддержка инвертированных файлов на UNIX-сервере требует значительного дискового пространства. Это — одна из причин невозможности размещения на первом этапе всего Сводного каталога научно-технической литературы для удаленного доступа по каналам Интернет. ГПНТБ России приняла решение использовать две копии информационных массивов (БД), что позволяет избегать проблем, связанных с безопасностью, целостностью и актуализацией.

После конфигурации и запуска UNIX-сервера проведены работы по организации взаимодействия пользователей с библиографическими базами данных, которые традиционно поддерживаются в ГПНТБ России на базе семейства иерархических СУБД CDS/ISIS. Данное ПО разрабатывается ЮНЕСКО и распространяется в базовой комплектации бесплатно для библиотек различного уровня. (Наиболее популярно это ПО в странах СНГ, Латинской Америки, в Италии.) На сервере была инсталлирована версия CDS/ISIS/UNIX, которая потребовала дополнительной конфигурации ОС и создания специального ядра, позволяющего наиболее оптимально управлять данной СУБД.

Для обеспечения работы пользователей по протоколу http подготовлен специальный программный комплекс (написан на внутреннем языке CDS/ISIS/PASCAL), непосредственно управляющий поиском информации в БД, процессом выборки необходимых для вывода полей и форматирования. При этом значительным преимуществом пакета является практически мгновенный поиск по инвертированным полям, а недостатком (присущим всем СУБД такого типа) — значительное время и затраты ресурсов ОС для процесса форматирования. Ранее для минимизации указанных недостатков были изменены внутренние программы форматирования выходных документов и введено ограничение на вывод найденных библиографических описаний — форматировались и выводились первые 25 найденных документов. Кроме того, был ограничен набор выходных форматов — на первом этапе поддерживается только формат выдачи полного библиографического описания со сверткой и подсверткой.

В настоящее время в ГПНТБ России разработан ряд новых программ, позволяющих устранить перечисленные выше недостатки, — сняты ограничения на просмотр полученных результатов и выбор форматов. При осуществлении поиска CDS/ISIS в текущей версии запускается специальной программой-шлюзом httpd-CDS/ISIS в пакетном режиме. Данное решение потребовало написания соответствующей программы, разработки системы команд и передачи параметров из http-форм в CDS/ISIS.

Программа шлюза (написана на языке C++) выполняет следующие основные функции: конвертирование запроса в альтернативную кодировку, а выходного документа — в кодировку, запрашиваемую пользователем через httpd-сервер; формирование файла команд и параметров для обработки CDS/ISIS; инициирование выполнения пакетного поиска; переформатирование полученного результата с метками HTML.

Для нормального функционирования системы решен комплекс задач по автоматическому определению кодировки кириллического алфавита для каждого входящего пользователя. Это потребовало внесения изменений в исходный текст NSCA httpd и перекомпиляции данного ПО. В настоящее время поддерживаются три основных кодировки — для MS-DOS (OS/2), MS Windows и KOI-8. Внутреннее хранение информационных массивов и текстов осуществляется в кодировке для MS Windows; проводятся мероприятия по переводу на общую для проекта внутреннюю кодировку ISO.

Информационное наполнение системы ГПНТБ России. В рамках этого направления проведен комплекс работ по дальнейшему определению номенклатуры библиографических информационных ресурсов, размещаемых для организации удаленного доступа, подготовке HTML-страниц и форм для создания удобного для пользователя интерфейса к библиографическим и полнотекстовым массивам.

Подготовлена, актуализирована и проинвертирована для UNIX-сервера БД ретроспективной части Российского сводного каталога научно-технической литературы (РСвК) — 370 тыс. записей. В настоящее время ведутся работы по слиянию ретроспективной базы (1987—1991 гг.) с текущей (с 1991 г. по настоящее время), что в дальнейшем (после полного переинвертирования) позволит эксплуатировать актуализированную версию РСвК для CDS/ISIS.

Подготовлена, актуализирована и проинвертирована для UNIX-сервера полная БД электронного каталога ГПНТБ России (115 тыс. полных библиографических записей). При этом необходимо иметь в виду, что структура ЭК в части периодических изданий предусматривает однократный ввод библиографического описания и последующую приписку фиксированной информации (номер выпуска, журнала или тома). Физически данное описание соответствует от 1 до 52 поступивших единиц. Также подготовлена, актуализирована и проинвертирована полная версия БД "Фонд алгоритмов и программ" ГПНТБ России (71 тыс. полных библиографических записей), которая ведется с 1984 г. и содержит аналитическое описание документов по опубликованным алгоритмам и программам.

Проведен комплекс работ по предоставлению в доступ полных текстов материалов международных конференций "Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества", включая программы, сборники докладов и ряд других документов.

Общий объем информационного наполнения сервера — 102 Мб., общий объем БД — 534 тыс. записей.

Текущее состояние:

  • РСвК — 370 тыс. записей — актуальная часть, 120 тыс. — зарубежная книга до 1987 г.;
  • Электронный каталог ГПНТБ России — 137 тыс. записей, поступления периодических изданий — 23 тыс. записей;
  • БД "Фонд алгоритмов и программ" — 73 тыс. записей;
  • БД "Авторефераты диссертаций" — 35 тыс. записей;
  • полнотекстовый электронный вариант сборника "Научные и технические библиотеки" (1996—1997 гг.) — 12.6 Мб;
  • электронный вариант журнала "Библиотека" 1998 г. — 7 Мб;
  • материалы Международных конференций "Крым" — 9.7 Мб ("Крым-94", "Крым-95", "Крым-96", "Крым-97", "Крым-98") — 16.2 Мб;
  • раздел "Десятичная классификация Дьюи" — 9 Мб;
  • раздел "Виртуальный музей Волошина" — 37 Мб;
  • раздел "Виртуальная библиотека" — 25 Мб;
  • другие полнотекстовые материалы — 20 Мб.

Модернизация коммуникационной составляющей ГПНТБ России. В рамках работ по этому направлению разработана новая схема подключения хост-центра ГПНТБ России к ресурсам Интернет с использованием оптоволоконной технологии. Проведен анализ существующих протоколов и методов подключения, а также сравнительный анализ действующих поставщиков транспортных и IP услуг.

По результатам анализа и с учетом экономических факторов выбрана схема прямого подключения по 1/4 полного 2 Мб ствола, арендуемого у компании КОМКОР, с возможным использованием резерва. Таким образом, организован оптоволоконный транспортный канал с номинальной скоростью 512 Кб/с "ГПНТБ России, к. 509 — AMTC-9, стойка FreeNet". В качестве провайдера IP выбран FreeNet, который обеспечивает на некоммерческой основе высоконадежное подключение российских пользователей к ресурсам ГПНТБ России. Однако для работы с зарубежными пользователями принято решение сохранить ранее действовавший канал на базе радиомодемной технологии ГПНТБ—ИППИ РАН. Кроме указанных каналов связи, предполагается использование 64 кбит/с канала связи (стандарт ISDN), который будет предоставлен фондом "Институт Открытое общество". Полученная таким образом телекоммуникационная связка позволит обеспечить эффективную работу пользователей как с российскими, так и с зарубежными ресурсами.


Copyright © 1995-98 ГПНТБ России