Home page | Каталоги и базы данных

Научные и технические библиотеки
Перов А.И.

Информационно-правовой
консорциум "Кодекс", С.-Петербург

Программные технологии "Кодекс"
как универсальный инструмент создания и доступа
к электронным библиотекам

Консорциум "Кодекс" занимается созданием электронных библиотек по правовой и экономической тематике более 9 лет. За это время накоплен большой опыт по созданию и распространению таких информационных ресурсов в России и за рубежом.

Первоначально для создания и обеспечения доступа к правовой информации разработчики использовали стандартные системы управления базами данных (СУБД). Однако по мере совершенствования механизмов обработки информации, расширения информационного массива до размеров в несколько десятков мегабайт становилось все более и более ясно, что стандартные СУБД не вполне удовлетворяют предъявляемым к ним требованиям. В числе таких требований:

1. Необходимость эффективно хранить объекты различного размера. Документы, комментарии, СНИПы и т.п. довольно сильно варьируются в размере — от сотен байт до десятков мегабайт. Накладные расходы на хранение должны быть минимальными. Поэтому система должна уметь хранить записи разного размера и реализовывать сжатие данных. В универсальных СУБД хранение записей переменной длины обычно реализуется не очень эффективно, а сжатие — только в дорогих серверных системах.

2. Обеспечение поддержки передачи изменений в БД. При этом обновления должны быть небольшого размера, а сама процедура актуализации — выполняться достаточно быстро. Встроенные системы репликации универсальных БД для этого не подходят — они требуют постоянного соединения между СУБД во время репликации и не имеют режима передачи пакетов. Универсальные системы для создания справочных систем обычно вообще не имеют такой возможности.

3. Поиск информации на русском языке, в том числе и такие сложные виды поиска, как "интеллектуальный". Такие возможности поддерживаются только в дорогих серверных СУБД причем с использованием дополнительных пакетов.

4. Работа на различных платформах (DOS, Windows, UNIX), в различных архитектурах (локальная, файл-сервер, клиент-сервер). Универсальные СУБД обычно работают в одной архитектуре.

5. Низкая стоимость. На основе этих и других требований разработан инструментальный комплекс создания и ведения полнотекстовых баз данных "Кодекс-Мастер". Первоначально он предназначался для создания и ведения полнотекстовых правовых БД, содержащих только текстовую информацию по различным правовым темам. Однако принципы, заложенные в этой системе управления БД, позволили затем абстрагироваться от конкретного вида представления информации. Появилась возможность хранения в таких БД не только текстовой информации, но и другой (например, формулы, таблицы, иллюстрации и т.п.). Расширение возможностей системы открыло новые направления ее использования при создании полнотекстовых БД, сходных по характеру хранимой информации.

Комплекс "Кодекс-Мастер" представляет собой инстумент для создания информационно-поисковых систем различного назначения: правовых баз данных, баз данных документов организаций или учреждений, электронных версий газет, журналов, книг, различных справочников (библиографических, адресных, тематических и т.п.), словарей и др.

Он рассчитан на создание и ведение больших массивов документальной информации. Хранение информации в БД организовано на основании логического разбиения документов на типы по некоторым формальным параметрам. Таким параметром может выступать характер информации, представленной в документе (например, нормативный документ можно отличить от консультации в виде "вопрос-ответ" или от тематического словаря). Совокупность документов, относящихся к одному типу, выделяется в тематический раздел. Все тематические разделы БД логически связаны между собой, между ними действует механизм гипертекстовых переходов по ссылкам и обеспечен сквозной поиск. Все это позволяет характеризовать совокупность информационных разделов как единое информационное пространство.

Структура документов, с которыми предполагает оперировать разработчик полнотекстовых баз данных на основе программы "Кодекс-Мастер", может быть различна. Характеристики самого программного комплекса "Кодекс-Мастер" не накладывают ограничений на состав атрибутов, описывающих документ. Однако для обеспечения совместимости информационных разделов с базовым программным комплексом "Кодекс" и сохранения принципа единого информационного пространства, Центр компьютерных разработок создал набор стандартных шаблонов, на базе которых легко реализовать тематический раздел, для хранения практически любых документов. При возникновении потребности в тематическом разделе с новой структурой Центр компьютерных разработок оставляет за собой право создания соответствующего шаблона для конкретного разработчика.

БД "Кодекс" представляет собой гипертекстовое пространство, состоящее из текстовых объектов. Текстовый объект (объект БД) состоит из текста произвольного размера и набора атрибутов (показателей). Из любого места текстового объекта в любое место другого текстового объекта могут быть установлены гипертекстовые ссылки. Текстовые объекты в пределах одного раздела имеют одинаковую структуру. При вводе новых текстов в БД система автоматически производит индексирование по всем словам для последующего быстрого контекстного поиска по всем разделам БД.

Программа "Кодекс-Мастер" фактически является функциональной надстройкой над программным комплексом управления полнотекстовыми базами данных "Кодекс" и, соответственно, обладает всеми функциональными характеристиками этого комплекса. Использование программы возможно в локальном, сетевом вариантах или с использованием корпоративной версии "Кодекс-Intranet". Программа имеет развитый, дружественный и интуитивно понятный интерфейс, реализующий все возможности Windows-интерфейса. В данной программе реализована возможность настройки режимов работы, атрибутов поиска, интерфейса пользователя, вывода информации на печать, "горячих" клавиш и т.д. Форматирование текстов возможно средствами встроенного текстового редактора или путем загрузки форматированных текстов из других редакторов (например MS Word). Тем не менее разработчики полагают, что пользователи комплекса "Кодекс-Мастер" должны обладать определенными навыками работы с ЭВМ и разработки БД различного назначения.

Дальнейшее развитие линии программных продуктов "Кодекс" ориентировано на интеграцию с программными продуктами фирмы Microsoft. Примером такой интеграции служит система "Кодекс для Word", в которой для доступа к БД "Кодекс" используется интерфейс программы MS Word.


Copyright © 1995-2001 ГПНТБ России