Home page | Каталоги и базы данных

Научные и технические библиотеки


 

Надпорожская Е.В., Платонова А.С.,
Яковишина Л.А.
Центральная городская публичная
библиотека им. В.В. Маяковского,
С.-Петербург

Опыт конвертирования базы данных
электронного каталога из АС-Облбиблиотека
в систему автоматизации библиотек ИРБИС

С 1993 г. Центральная городская публичная библиотека (ЦГПБ) им. В.В. Маяковского (С.-Петербург) начала вести электронный каталог в программе АС-Облбиблиотека (ГИВЦ МК РФ) и работала в этой программе до 1999 г.

Со временем программа ГИВЦ перестала удовлетворять нуждам библиотеки по ряду причин. Основной было отсутствие возможности в полной мере описывать разные виды документов. Кроме того, настало время общения между библиотеками, а данная программа не позволяла передавать и принимать записи электронного каталога; не было конвертора из внутреннего формата в UNIMARC (или RUSMARC) и не предполагалось его создавать силами ГИВЦ; работа по созданию справочников велась вслепую, что не давало возможности видеть и корректировать то, что набиваешь; вместо справочника предметных рубрик создавался словарь ключевых слов.

С 1997 г. отдел автоматизации ЦГПБ начал тестировать другие библиотечные программы (в том числе и новую версию программы ГИВЦ), которые брал для этого у их производителей по договору. После тестирования нескольких программ библиотека пришла к выводу, что на данный момент больше всего подходит система автоматизации библиотек ИРБИС (ГПНТБ России), и приняла решение перейти на нее.

К тому времени в ЭК русского фонда ЦГПБ было создано около 51 тыс. записей. Библиотека встала перед проблемой: или вновь вводить такое количество документов, или конвертировать ЭК. Решили идти по второму пути, поскольку о потере такого количества документов не могло быть и речи. Конвертор решили сделать своими силами.

Мы получили от ГИВЦ (г. Тула) список полей внутреннего формата с номерами от 1 до 85. На самом деле предполагалось использовать только 31 поле. При этом номера полей, как и их названия экранной формы записи не соответствовали номерам и названиям полей в списке внутреннего формата ГИВЦ.

Прежде всего мы создали таблицу соответствия полей программ АС Облбиблиотека и ИРБИС для формулирования правил обработки записей. Оказалось, что поля программы ГИВЦ не имеют структуры (подполей), имеют простую порядковую нумерацию, большая часть полей не повторяется, отсутствуют поля для описания некоторых типов документов.

Сделав выгрузку файла ЭК в ГОСТ-формат, мы обнаружили, что не все поля, перечисленные в списке полей внутреннего формата ГИВЦ выгружаются в соответствующие поля ГОСТ-формата. Также мы выяснили, что данных, вносимых библиотекарями, гораздо больше, чем полей в программе ГИВЦ, и в одно поле вводятся данные для нескольких полей в виде простого текста, разделенного знаками препинания, не всегда соответствующими государственному стандарту библиографического описания.

Началась кропотливая работа над технологическим заданием для конвертора с просмотром записей различных видов документов и попыткой разноса данных по полям ИРБИС.

В программе ГИВЦ обязательным полем как для работы, так и для поиска дублетов является поле ISBN. В то время (1993 г.) очень много книг выходило без ISBN, поэтому в нашей библиотеке (по рекомендации ГИВЦ) по определенным правилам создавались свои ISBN на те издания, где он отсутствовал. Более того, были случаи, когда два или более издания совершенно разного содержания имели одинаковый ISBN, поэтому приходилось указывать ISBN и через тире порядковый номер. В связи с этим мы рекомендуем при конвертировании убрать такие ISBN, поскольку в дальнейшем искать по ним дублетные издания невозможно. Из-за этого в ИРБИС дублетные издания ищутся по всем полям, идентифицирующим дублеты, кроме ISBN.

Приступая к конвертированию, мы остановили процесс комплектования и обработки и сделали выгрузку ЭК из программы ГИВЦ в ГОСТ-формат. После этого ГОСТ-файл ЭК пропустили через конвертор и импортировали полученные записи в ИРБИС в текстовом DOS-формате несколько раз. Можно было просматривать записи и в DOS-формате, но мы убедились, что легче проверять записи в программе ИРБИС, так как сразу же строятся словари и быстро выявляются многие ошибки, а кроме того, виден сам документ в форме карточки. При этом мы видели, как библиотекари пытались найти выход при описании сложных документов. Кроме того, многие поля использовались не по назначению, так как этих полей не было в программе ГИВЦ. После каждого такого конвертирования дорабатывалось технологическое задание.

Одна из основных проблем состояла в том, что из одного неструктурированного поля программы ГИВЦ приходилось разносить содержимое в несколько полей ИРБИС. Самое сложное при этом было разбить данные одного поля ГИВЦ, содержащего информацию нескольких полей. Сотрудники библиотеки отделяли сведения одно от другого не всегда одними и теми же символами, а данные в поле приводили в произвольной последовательности. Разделители данных часто не соответствовали стандартам библиографического описания и сокращения слов.

При выгрузке в ГОСТ-формат у записей появляются идентификаторы типа документов (монографии и многотомники), а в программе ИРБИС предлагаются отдельные рабочие листы для разного вида документов. Поэтому оказалось несложным по этим идентификаторам добавить поле рабочего листа. Возникла необходимость добавить статус документа в поле «Сведения об экземплярах». Приняли также решение изменить дату формирования документов на дату конвертирования, так как дата ГИВЦ строго не привязана к экземпляру.

В документе ГИВЦ поля: «Инв. номер», «Штрих-код» и «Место хранения» – повторяющиеся, а поля: «№ КСУ» и «Цена экземпляра» – неповторяющиеся, единственные для каждого экземпляра документа, поэтому при конвертировании рекомендуем цену ставить в поле «Общая цена»; КСУ для каждого экземпляра всех записей ЭК установить одинаковую, желательно экзотическую.

В результате при конвертировании нам удалось «поймать»:

  • инверсию инициалов в поле «Автор» как для полей авторов, редакторов, так и для поля «Сведения об ответственности»;

  • «роль» автора в создании документа;

  • «…» в начале текста поля;

  • точку для анонимных произведений;

  • развести по повторяющимся подполям сведения, вписанные в программе ГИВЦ в одно поле через знаки препинания;

  • сведения, относящиеся к заглавиям сложных сборников.

Оказалось возможным разнести: редакторов по соответствующим полям, коллективы по соответствующим полям, содержание по подполям, разночтения фамилий, псевдонимов, область серии, количественные характеристики, кавычки, скобки (круглые и прямые) в поле ответственности, особенности описания таких сложных документов, как сборник без общего заглавия.

При конвертировании ЭК мы столкнулись с тем, что база данных комплектования остается пустой, а в программе ГИВЦ нет возможности выгрузки БД комплектования в ГОСТ-формат. Мы решили импортировать конвертированный ЭК в БД комплектования ИРБИС. Таким образом, мы получили возможность отслеживания дублетных описаний комплектования.

После такого копирования нам пришлось сделать несколько глобальных корректировок в базе комплектования. Необходимо было провести глобальную замену содержания полей рабочих листов на имя рабочего листа базы комплектования ИРБИС. Для этого пришлось сделать две глобальные корректуры. Первая – удалить все имеющиеся имена рабочих листов (так как это рабочие листы ЭК), а затем сделать глобальную вставку имени рабочего листа базы комплектования.

Вторая корректура была посвящена заполнению поля 66 в ИРБИС – отметки о переносе описания документов из БД комплектования в ЭК, так как теоретически все документы должны попадать в электронный каталог из комплектования. Мы решили этот вопрос, вставив в это поле дату конвертирования и имя нашего ЭК.

Это было необходимо сделать для того, чтобы в ИРБИС была возможность приписывать дублеты к старому документу. Таким образом мы сохранили БД комплектования и дали возможность комплектаторам видеть ее и отслеживать по ней дублеты, начиная с момента создания своей базы в компьютере (1993 г.).

Конечно, не все получилось так, как хотелось. В ИРБИС в БД комплектования введены не все поля для правильного описания некоторых видов документов. Поля для описания многотомника и сборника без общего заглавия практически не представлены. По этой причине при импорте ЭК в БД комплектования библиографические описания именно этих документов были иногда искажены, но сведения из полей, не представленные в рабочих листах комплектования, не терялись, а попадали в страницу «Добавочные». Тем не менее осталась проблема многотомников, которые представлялись заглавием типа «Сочинения», а у отдельного тома не было своего заглавия. В этом случае мы имели урезанное описание, которое представлено в БД комплектования только полем «Обозначение, номер тома». При вводе дублетов этих документов комплектаторы не обнаруживают их описания в своей базе. Правда, есть выход – первым вводить поле ISSN, но, к сожалению, эта информация иногда бывает неправильной или отсутствует.

После передачи дополнительных экземпляров (дублетов) документа в программе из БД комплектования в ЭК происходит принудительное запоминания последней КСУ в этом экземпляре (поле КСУ, не повторяющееся в ЭК), поэтому все остальные экземпляры документа остаются без записи КСУ. При конвертировании нам пришлось номер этого единственного КСУ переносить в первое повторяющееся поле экземпляров, так как невозможно было вычислить, к какому экземпляру относится это КСУ.

Поскольку записей самих КСУ в БД ЭК нет, то мы пришли к выводу, что номер старых КСУ только в первом повторении поля экземпляров не имеет смысла. Оставить же пустым это подполе невозможно, поскольку при обращении к дублету в ИРБИС во все экземпляры с незаполненными подполями КСУ автоматически вписывается номер обрабатываемой в данный момент записи КСУ. Поэтому во все поля экземпляров с пустым подполем КСУ мы, при помощи глобальной корректировки, вставили экзотический номер КСУ типа 9999, который сразу можно отличить от других и найти в поиске.


Copyright © 1995-2002 ГПНТБ России