Home page | Каталоги и базы данных

Научные и технические библиотеки

Абарюс П.,Сакалаускайте Э.

Вильнюсский университет


Автоматизированное управление новыми видами информационных ресурсов

С появлением баз данных на компакт-дисках (CD—ROM) и с развитием возможностей теледоступа произошел качественный скачок в обеспечении ученых и специалистов научно-технической, экономической и коммерческой информацией. Эти два метода, как и обеспечение данными и информацией на гибких магнитных дисках, должны рассматриваться не как альтернативные, а как взаимно связанные, дополняющие друг друга. Особенно это характерно для библиотечно-библиографических баз данных, для которых стандартизованы наполнение (UNIMARC) и структура (ISO 2709) записи. Следует отметить, что проблема выбора и комбинирования упомянутых возможностей актуальна при ограниченных финансовых ресурсах для сетей библиотек и информационных органов.

Качество информационного обслуживания из баз данных определяется уровнем соответствия состава баз и/или их частей потребностям пользователей. В настоящее время формирование фонда баз данных в Литве осуществляется традиционными методами, не позволяющими получить высокого качества. При определении априорной полезности баз данных в отраслевых и академических информационных и библиотечных системах используется информация, получаемая от специалистов и ученых соответствующих ведомств. В информационных и библиотечных системах, в которых абоненты обслуживаются межотраслевой информацией, качество определения априорной полезности информационными и библиотечными работниками и привлекаемыми из обслуживаемых организаций немногочисленными учеными и специалистами значительно ниже. Поэтому необходимо разработать методы автоматизированной подготовки рекомендаций выбора и распределения баз данных, базирующиеся на прогнозировании полезности, исходя не только из оценок специалистов, но и из информации об использовании имеющихся баз данных.

Проблема выбора баз данных близка к проблеме автоматизированного управления ведением справочно-информационных фондов в информационно-библиотечных системах. Отдельные базы данных и/или их части можно рассматривать как документы справочно-информационных фондов. Однако из-за ограниченного количества (сотни) и стоимости (что характерно и для зарубежных книг и периодических изданий) их следует выделить в отдельный, специфический класс, требующий высококачественных управленческих решений.

Для выбора баз данных по индивидуальным характеристикам и определения их полезности необходимы статистические исследования. У распространяемых баз данных, как правило, имеется много индивидуальных характеристик.

В частности, на CD—ROM и в печатном виде распространяется БД о базах данных на CD—ROM. Запись этой БД включает ряд характеристик. Поскольку обработка больших массивов данных при поиске управленческих решений требует много ресурсов ЭВМ, необходимо выяснить природу и взаимосвязи индивидуальных характеристик баз данных и определить те из них, которые будут использованы в качестве параметров при автоматизированной подготовке управленческих решений для конкретных информационных и/или библиотечных систем. Для отыскания скрытых, но объективно существующих закономерностей, которые определяются воздействием внутренних и внешних причин на полезность баз данных, сжатия факторов или главных компонент, число которых значительно меньше количества первоначально взятых признаков, а также выявления и изучения статистической связи индивидуальных характеристик с факторами или главными компонентами наиболее подходящим методом является факторный анализ.

Для более глубокого исследования природы отдельных индивидуальных характеристик баз данных, их связей целесообразно использовать совокупность статистических методов, именуемых корреляционным анализом.

Для определения прогнозируемой полезности баз данных, полезность которых в периоде, предшествующем планируемому, неизвестна, предлагается использовать аналоговое прогнозирование, т. е. получение сведений в результате установления сходства. Сходство устанавливают на основе классификаций баз данных по их признакам. Когда признаки неизвестных индивидуальных объектов сравниваются с признаками известных классов и объекты распределяются на классы, после чего объекты становятся известными, т. е. обладающими всеми свойствами типичных представителей соответствующих классов, имеется в виду аналоговое прогнозирование — диагностирование. Решение задачи определения прогнозируемой полезности баз данных базируется на использовании методов кластерного анализа с различными мерами сходства (или расстояний).

Для ведения баз данных, имеющихся в Литве, и оцениваемых баз данных на CD—ROM, используется CDS/ISIS/M (на IBM PC и VAX). После конвертирования данных для статистических исследований и подготовки управленческих решений используется ППП SPSS/PC, имеющий (как и CDS/ISIS) мощные средства конвертирования данных.

Copyright © 1995-97 ГПНТБ России