Home page | Каталоги и базы данных

УДК 025:65.011.56

Буртовая М.А., Евстигнеева Г.А.,
Пискунова О.Э., Семочкина В.А.

Использование баз данных на CD-ROM
в работе библиографа

На примере использования справочника Ulrich's Plus представлен опыт специалистов отдела комплектования и обработки иностранной литературы ГПНТБ России, полученный при разработке и применении автоматизированной технологии отбора, обработки и ввода библиографических данных, содержащихся в справочниках на CD-ROM.

Стремительное развитие компьютерной техники и программного обеспечения в последние годы позволило перейти к новым технологиям передачи и обработки информации. Возникшие совсем недавно технологии CD-ROM находят широкое применение во всем мире для хранения и использования полнотекстовых, реферативных и библиографических баз данных. Использование баз данных на CD-ROM делает поиск информации более быстрым и совершенным, существенно расширяет возможности использования информационных ресурсов.

В ГПНТБ России ведется серьезная работа по созданию библиографических БД, что приводит к необходимости переработки специалистами-библиографами больших массивов информации для ее ввода в БД. Наиболее удобной для этих целей является информация на CD-ROM. Если раньше мы использовали справочники на CD-ROM лишь для более полного и эффективного отбора информации, то сегодня у нас появился первый опыт автоматизированного переноса данных о зарубежных журналах, взятых из библиографических источников на CD-ROM, а именно Ulrich's Plus и EBSCO, в БД "Новые зарубежные журналы и журналы, поступающие в организации" (далее в тексте - База данных).

Создатели электронных продуктов заботятся о том, чтобы доступ к информации и ее отбор были несложными и максимально удобными для потребителя. Поэтому здесь у нас не возникло трудностей. Однако автоматизированный ввод отобранных сведений в Базу данных потребовал создания не только конвертера, но и особой технологии. Технология переработки информации, взятой из любых справочников на CD-ROM, в основном одинакова, поэтому мы расскажем о ней на примере справочника Ulrich's Plus.

В первую очередь был проведен анализ соответствия полей в записях Базы данных и Ulrich's Plus. Справочник позволяет работать в нескольких форматах. Для сравнения полей выбран формат Detailed, содержащий текстовое обозначение полей. Мы убедились, что такое соответствие имеется. Сравнение содержательной наполненности полей показало, что здесь тоже имеется совпадение, за исключением некоторых полей. Казалось бы, что разработка конвертера сводится только к приведению в соответствие меток полей Базы данных и Ulrich's Plus. На самом деле разработчики столкнулись здесь с некоторыми проблемами. Например, написание ISSN в Базе данных и Ulrich's Plus - не одинаковое. У нас это сплошной восьмизначный номер (например 01309765), а в Ulrich's Plus международный стандартный номер пишется с пробелом (0130-9765), который необходимо автоматически убрать.

Из-за различий в библиографической записи необходимость ручной доработки документа, взятого из Ulrich's Plus, не исчезла, поэтому решили организовать вспомогательную БД по принципу работы основной Базы данных (с массивом библиографических записей, словарем, рабочим листом, возможностями поиска по словарю, сверки на дублетность, просмотра и корректуры записей по MFN и по результатам поиска). Именно во вспомогательную БД передается информация, отобранная из Ulrich's Plus. После создания поискового словаря она дорабатывается библиографом и в готовом виде перекачивается в основную Базу данных. Редактирования требуют следующие элементы библиографической записи:

язык издания (корректура записей, содержащих несколько языков);

расшифровка аббревиатуры, цена и т. д.;

сведения об основном и предыдущем заглавии, а также об издательстве и месте издания.

Во вспомогательную БД из Ulrich's Plus переносятся индексы Дьюи и предметные рубрики, на основании которых в соответствии с требованиями Базы данных производится рубрикация по ГРНТИ.

Для передачи сведений из вспомогательной БД в основную необходимо предварительно провести сверку записей на дублетность. Трудность здесь состоит в том, что единственным поисковым элементом словаря является ISSN. Однако записи, не содержащие ISSN, все же необходимо как-то обозначить в словаре. Для этого в словарь автоматически, по признаку отсутствия записи в поле ISSN, вводится специальный условный трехбуквенный код, позволяющий не утратить библиографическую запись без ISSN при ее обработке и автоматическом переносе в Базу данных. В ходе разработки рассматривались различные варианты сверки на дублетность: по активным ISSN, по активным и измененным ISSN журналов обеих баз данных.

Сверка активных ISSN с измененными оказалась неэффективной, так как этот способ приводил к определенным трудностям при обновлении словаря и увеличению записей в словаре вспомогательной БД. Поэтому мы остановились лишь на первом способе сверки на дублетность, т. е. по активным ISSN. К сожалению, при этом требуется дополнительная ручная сверка, обусловленная отсутствием международного стандартного номера в некоторых журналах и несоответствием библиографических записей.

Разработанная программа предоставила новые возможности для корректуры уже имеющихся в Базе данных библиографических записей журналов. Стала возможной автоматическая замена заданных элементов библиографической записи (заглавия, ISSN, кода страны, издательства, адреса, цены, периодичности, года начала издания).

Несмотря на то, что не удалось достичь передачи всей информации без ручной доработки, объем ввода новых библиографических записей существенно увеличился, в то время как количество ошибок при вводе значительно уменьшилось. За два месяца работы с программой конвертера обработано в 2,5 раза больше библиографических записей журналов, чем обычно, причем около 60% из них введено полностью автоматически.


Copyright © 1995-99 ГПНТБ России