Home page | Каталоги и базы данных

Научные и технические библиотеки

УДК 002.6 АСНИ

Ермаков И.К., Ахмадиев Н.И.

База данных полных текстов стандартов
в автоматизированной системе обработки
информации по стандартизации

Важным шагом в развитии системы научно-технической информации по стандартизации стало внедрение новых информационных технологий с целью объединения распределенных фондов нормативной документации в интегрированную автоматизированную систему обработки информации (АСОИ) по стандартизации, метрологическому обеспечению и сертификации.

Важным элементом АСОИ является банк данных "Стандарт", предназначенный для ввода, обработки, хранения и выдачи полных текстов государственных стандартов.

Накопление полных текстов стандартов в банке данных "Стандарт" происходит в соответствии с отработанной и проверенной в течение трех лет технологией. Сначала ВНИИКИ получает из Федерального фонда стандартов тексты государственных стандартов на бумажных носителях. Эти тексты сканируются на рабочих станциях локальной сети ВНИИКИ. Для проведения работ используется программно-технический комплекс, включающий следующие компоненты:

рабочие станции сканирования Deskpro XL фирмы Compaq в конфигурации: процессор Intel Pentium-90(133) Mhz; архитектура PCI/EISA; оперативная память 16—32 Mb; контроллер, жесткий диск и устройство для чтения CD—ROM — SCSI-2.

В качестве операционной системы с равным успехом применяются OC Windows 95 и Windows NT 4.0. Используются сканеры HP ScanJet II и III различных модификаций, скоростной сканер Fujitsu. Для хранения информации о полных текстах используется магнитооптическая библиотека Pinnacle Micro Alta объемом 20 Гбайт, а также накопители на магнитооптических дисках Pinnacle Micro Sierra объемом 1,3 Гбайт. Для записи данных на CD—ROM используется устройство для записи компакт-дисков Pinnacle Micro Recordable CD.

Рабочие станции функционируют с локальной сети под управлением двух серверов Compaq Proliant 4000, один из которых выполняет функции контроллера домена и сервера хранения, а второй является сервером приложений, в частности сервером Lotus Notes.

Вопросы качества графической информации о полных текстах государственных стандартов решаются путем обучения операторов станций сканирования. Сканируя документ, оператор исходит из необходимости последующего распознавания графического файла OCR-системами и его преобразования в текстовый документ.

Файлы изображений государственных стандартов хранятся в соответствии с принятой в АСОИ структурой хранения, позволяющей эффективно использовать аппаратные и программные средства. Структура хранения графической информации о полных текстах стандартов создавалось исходя из следующих принципов: хранение графической информации осуществляется на одном сервере АСОИ; изменение и удаление файлов полных текстов осуществляется только администратором БД, что позволяет существенно снизить вероятность сбоев и утраты информации; количество файлов в 1 подкаталоге не более 1000 (в перспективе возможно увеличение до 2000), что обеспечивает быстрый доступ к нужному файлу, в том числе и по локальной сети; уникальность имени файла; возможность четкой координации групповой работы по сканированию; возможность автоматизированного уплотнения списка файлов в случае появления свободных мест в структуре.

С учетом этих требований, структура позволяет хранить необходимое количество файлов изображения (от 15 до 300 тыс. для каждой из БД) без ухудшения скорости доступа.

После сканирования изображения полных текстов государственных стандартов привязываются к библиографической БД "НОРМДОК". Эта часть работ выполняется администратором базы данных с помощью средств автоматизации Lotus Notes. В ходе привязки осуществляются следующие виды контроля информации: контроль отсутствия дублей полных текстов стандартов, физического наличия файлов на диске, наличия библиографической информации о данном стандарте, отсутствия дублей библиографической информации о данном стандарте, контроль отсутствия подключенного файла у данного стандарта.

Информация, не прошедшая хотя бы один из этапов контроля, помечается как ошибочная и предоставляется администратору БД для проверки и исправления.

Последующий доступ к полным текстам государственных стандартов осуществляется с помощью комплекса программных средств Watermark Enterprise Edition, который обеспечивает эффективную работу с многостраничными графическими файлами. Для обеспечения взаимодействия Watermakr Enterprise Edition и Lotus Notes используется технология OLE—2.

С помощью описанной выше технологии во ВНИИКИ создан библиографический банк данных по нормативным документам. На его основе разработана информационно-поисковая система и базы данных указателей нормативных документов, перечень которых указан в табл. 1. Обеспечивается поиск нормативных документов по обозначению и наименованию, классификаторам ОКС и КГС.

Таблица 1

Указатели нормативных документов (НД)

Количество НД

ГОСТ

21500

ОСТ

33000

ТУ

98000

ИСО/МЭК

12000

США, ФРГ, Англия, Франция, Япония

80000

Стандарты других стран

90000

Помимо библиографического банка данных, во ВНИИКИ создан банк данных полных текстов государственных стандартов. Банк данных содержит государственные стандарты в графическом виде и поставляется на CD—ROM. Перечень тематических сборников приведен в табл. 2. Одновременно поставляется база данных указателей государственных стандартов и информационно-поисковая система с выводом на экран и распечаткой текстов стандартов. Принимаются заявки на подборку полных текстов стандартов по интересующей пользователей тематике.

Актуализация фонда стандартов в банках данных проводится в сроки, определяемые заказчиком.

Минимальные требования к аппаратно-программным средствам: компьютер типа IBM PC/AT 486/487, ОЗУ 16—32 Мб, винчестер 1 Гб, CD—ROM 2-х скоростной и выше, принтер, система управления данными Lotus Notes, операционная система Windows 95/97 или Windows NT.

Таблица 2

№№ сборников

Тематика сборников

Количество стандартов

1

Горное дело. Полезные ископаемые

790

2

Нефтяные продукты

363

3

Металлы и металлические изделия

2015

4

Транспортные средства и тара

689

5

Машины, оборудование и инструмент

235

6

Энергетическое и электротехническое оборудование

1166

7

Силикатно-керамические и углеродные материалы и изделия

209

8

Лесоматериалы. Изделия из древесины. Целлюлоза. Бумага. Картон

564

9

Химические продукты и резиноасбестовые изделия

1933

10

Текстильные и кожевенные материалы и изделия

879

11

Пищевые и вкусовые продукты

957

12

Измерительные приборы. Средства автоматизации и вычислительной техники

853

13

Здравоохранение. Предметы санитарии и гигиены

365

14

Изделия культурно-бытового назначения

310

15

Атомная техника

169

16

Сельское и лесное хозяйство

1066

17

Общетехнические и организационно-методические стандарты

2155

18

Электронная техника. Радиоэлектроника и связь

1203


Copyright © 1995-98 ГПНТБ России