Home page | Каталоги и базы данных | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Научные и технические библиотеки | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
УДК 025.35:65.011.56 Вершинин М.И., Масевич А.Ц. Создание
электронного каталога иностранных
журналов БАН: Электронная каталогизация иностранных журналов – едва ли не самая актуальная задача из всех, стоящих перед Библиотекой Российской Академии наук, и эта актуальность давно и неоднократно обосновывалась. В 1990-1993 гг. в БАН осуществлена попытка адаптации системы GLIS (GEAC Library Information System), разработанной фирмой GEAC, Inc. Фирма поставила в БАН ЭВМ GEAC-8000, оснащенную терминалами, и программное обеспечение подсистем каталогизации и комплектования. В 1992-1993 гг. начался и осуществлялся ввод в электронный каталог библиографической информации о зарубежных сериальных изданиях, получаемых библиотекой. Однако в конце 1993 г. работы по вводу данных в систему практически прекратились из-за сбоев технических средств и программного обеспечения, ведущих к потере информации в базе данных. Программное и аппаратное обеспечения, поставлявшиеся фирмой GEAC в 1980-е гг., уникальны и требовали сопровождения специалистами именно этой фирмы, что вело к расходам, значительно превышавшим возможности БАН. К тому же система на базе ЭВМ GEAC-8000 морально устарела, и дальнейшая ее отладка была весьма проблематичной даже при наличии финансовых ресурсов. К сожалению, информацию, уже введенную к моменту возникновения сбоев, не удалось сохранить и конвертировать в другую систему [1; 2].
Количественная оценка информационного ресурса Традиционно журналы в БАН учитываются вместе с продолжающимися изданиями. Из-за этого обстоятельства получение полных и точных данных о количестве иностранных журналов практически невозможно без значительных и неоправданных трудозатрат. Тем не менее существуют некоторые возможности для ориентировки. Согласно Сводному указателю иностранных периодических изданий на 1 янв. 1979 г. в БАН насчитывалось 8 240 названий иностранных журналов [3]. По данным отдела комплектования (ОКБФ) БАН на январь 2002 г. во все отделы библиотеки, включая отделы при институтах С.-Петербургского Научного центра (СПбНЦ) РАН, поступили 6 267 названий иностранных периодических и продолжающихся изданий, из которых журналы составили примерно 4 тыс. названий. Картотека журналов отдела научной обработки литературы (ОНОЛ) содержит информацию о журналах, поступавших с 1986 г. во все отделы БАН, включая отделы при институтах СПбНЦ РАН. Картотека ведется и в настоящее время. В ней зарегистрировано около 8 тыс. названий иностранных журналов, поступавших с 1986 по 2002 г. В архивной картотеке, содержащей журналы, поступавшие в БАН до 1986 г., количество названий не подсчитывалось. По мнению сотрудников ОНОЛ общее количество иностранных журналов БАН не превышает 15 тыс. названий. Данные на 2000 г., полученные из библиотек–отделов БАН при институтах СПбНЦ РАН, приведены в табл. 1 (см. также [4]). Таблица 1 Иностранные периодические и продолжающиеся издания в библиотеках при институтах СПбНЦ РАН на 2000 г.
Следует отметить, что информация о количестве иностранных журналов в БАН неполна и противоречива. В табл. 1 данные о журналах представлены вместе с данными о продолжающихся изданиях. При этом одно и то же название журнала может поступать более чем в одну библиотеку. Однако с известной долей уверенности можно утверждать, что сегодня в БАН имеется от 10 до 15 тыс. названий иностранных журналов.
Постановка задачи Задача состоит в разработке и реализации долгосрочной программы создания полного электронного каталога иностранных журналов, имеющихся в БАН. Этот каталог создается как часть электронного каталога БАН. Предполагается многоцелевое использование системы:
Взаимодействие с существующими или проектируемыми модулями, такими, как полный электронный каталог БАН, система электронной доставки документов, модули, связанные с комплектованием, обработкой, организацией фонда.
Этапы реализации При разработке программы определены следующие этапы ее реализации:
Состояние дела Сегодня на веб-сайте БАН (www.ban.ru) пользователям доступен список названий иностранной периодики, поступающей в БАН в текущем году с указанием страны публикации, а также сиглы подразделения БАН, получающего издание. Доступ к статьям из журналов обеспечивается системой электронной доставки документов БАН. Перечисленные выше этапы с первого по третий полностью реализованы. Четвертый этап находится в стадии выполнения. Пятый и шестой этапы – основная и самая трудоемкая часть нашего проекта. В настоящее время ведется электронный каталог журналов (364 названия), находящихся в подсобном фонде читального зала. Созданы 6500 записей на отдельные тома, поступившие за последние 10 лет. Доступ к каталогу обеспечивается разработанной в БАН программой JournInt. Кроме того, базы данных на журналы ведутся в двух библиотеках СПбНЦ РАН – Зоологического института и Института озероведения.
Структура системы "Иностранные журналы" Система проектируется как часть электронного каталога БАН и состоит из двух взаимосвязанных баз данных, поддерживаемых системой CDS/ ISIS. Файл 1 (основные записи) – массив полных библиографических записей иностранных журналов. Файл 2 (регистрационные записи) – массив записей, содержащих спецификацию, т.е. информацию о наличии в БАН выпусков (томов и номеров) каждого издания. В базе данных содержатся два типа записей – на каждый том и на каждый выпуск (номер) издания. Создание массива записей файла 1: Конвертирование данных. Для создания массива записей файла 1 использовался CD-ROM ULRICH. Эта система позволяет осуществлять выгрузку записей в текстовый формат с различной разметкой записей, но не более 200 записей за один сеанс. В течение двух недель была осуществлена выгрузка всей базы данных ULRICH в текстовые файлы с разметкой тэгами USMARC (общее количество 208 тыс. записей). Создана программа, осуществляющая конвертирование записей в формат UNIMARC-БАН и затем формирование БД в формате CDS/ ISIS. Таблица соответствия: исходный формат ULRICH (текстовый файл с разметкой метками USMARC) – формат UNIMARC-БАН. Формат UNIMARC-БАН создан на базе формата UNIMARC. Некоторые особенности этого формата описаны в наших публикациях [5]. Один из предоставляемых системой CD-ROM ULRICH формат выгрузки записей использует метки полей формата USMARC. Однако нельзя говорить о соответствии формата ULRICH формату USMARC. В формате ULRICH не всегда используются подполя и индикаторы. Часть информации в записях находится вне области разметки. Тем не менее данные в записях, выгруженных из ULRICH, организованы единообразно и последовательно, поэтому при конвертировании можно опираться на различные признаки категории данных: на их расположение в строках и колонках, на знаки пунктуации и т. п. Пример 1. Запись, выгруженная системой CD-ROM ULRICH в текстовом формате с метками USMARC.
Полностью привести и проконтролировать всю таблицу соответствия в настоящей статье не представляется возможным. Ниже приводятся примеры конвертирования некоторых данных.
Пример 2. Фрагмент таблицы соответствия формат ULRICH (метки USMARC) ® формат UNIMARC-БАН (конвертирование осуществляется простым переносом информации.):
Во многих случаях при конвертировании осуществлялся не только перенос данных, но и декодирование информации, присутствовавшей в исходных записях в кодированном виде, или, наоборот, кодирование отдельных данных (например периодичность издания); в отдельных случаях – замена системы кодирования (например коды стран USMARC на коды UNIMARC). Отдельные английские выражения частично заменялись русскими эквивалентами. Остановимся подробней на последней задаче – переводе отдельных выражений библиографического описания с английского на русский язык. В простейших случаях использовался табличный метод прямой замены английских терминов на русские (табл. 2). Таблица 2 Примеры соответствия английских и
русских выражений
На сегодня представляется неосуществимым автоматизированный перевод таких элементов данных, как аннотации или предметные рубрики. Перевод предметных рубрик и таблица соответствия составлены в неавтоматизированном режиме. Замену английских рубрик русскими планировалось осуществить автоматически. В качестве примера рассмотрим наиболее сложные для конвертирования поля, содержащие данные о прежних названиях журналов. Формат USMARC предусматривает для этой информации поля 247 и 547. В формате выгрузки из базы данных ULRICH (текстовый файл) в поле 247 отсутствует предусмотренная USMARC информация: сведения, относящиеся к заглавию, ISSN, даты существования прежнего заглавия, отношение прежнего заглавия к существующему. Имеется только собственно прежнее заглавие. Недостающие данные находятся в поле 547 в неструктурированном виде. Однако информация представлена всегда единообразно и последовательно, что позволяет осуществить ее конвертирование. Формат UNIMARC предусматривает несколько полей для прежних заглавий: во-первых, группы полей связи 43-, и 44-; во-вторых, поле 520 из блока вариантов заглавий; в-третьих, возможно также отражение этой информации в поле 311 – примечание к полям связи. Наше решение расходится с требованием Российского коммуникативного формата, предписывающего использование полей связи и не допускающего использования поля 520. Использование полей 4-го блока должно предусматривать создание отдельной записи на каждое из прежних названий. С одной стороны, такое решение позволяет полнее отразить собрание журналов, обеспечить ввод специфики на издания, изменившие названия, слившиеся с другими или отделившиеся от других. С другой – при таком решении на первом этапе значительно повышаются трудозатраты на создание массива основных записей. Оно требует дополнительных программных средств на актуализацию связей между основной и регистрационной записью, т. е. возможность на выходе при операциях поиска, сортировки и т. д. одновременного представления записей на прежние и существующее название. И наконец, при таком решении значительно увеличивается объем базы данных. Не отказываясь в принципе от использования в дальнейшем полей связи, мы на данный момент приняли временное, упрощенное решение. Оно предусматривает использование поля 520, структура которого позволяет полно отразить прежние названия издания в пределах одной записи. При этом предполагается, что на следующих этапах работы информация будет автоматически введена в поля связи и при этом в автоматическом или полуавтоматическом режиме будут созданы отдельные записи на прежние названия. Пример 3. Результат конвертирования данных о прежних названиях изданий
Результат (UNIMARC-БАН)
... Корректировка основных записей. При анализе записей, полученных из базы данных ULRICH (проанализированы 138 записей), каталогизаторы БАН установили, что для создания полноценной записи требуется определенный объем редактирования. Редакционные исправления и дополнения записей можно разбить на три основных группы.
Создание массива для файла 2. В файле 2 (регистрационные записи) содержатся записи двух уровней – на каждый том (набор выпусков за определенный период) и на каждый выпуск (номер) журнала. Необходимость создания записей, отражающих два уровня описания издания, обусловлена следующими обстоятельствами.
Записи на каждый том создаются в первую очередь полуавтоматическим вводом через специальный разработанный комплекс программ (см. ниже). Записи на выпуски генерируются автоматически из записей на том. Формат регистрационной записи на том. Создается на каждый том издания, при отсутствии деления на тома – на каждый год. При наличии нескольких комплектов издания регистрационные записи создаются для каждого комплекта.
Формат регистрационной записи на выпуск (номер). Запись на каждый выпуск генерируется автоматически из записи на том. В данном случае в подполе а поля 200 вводится номер выпуска. В записи используется поле связи 462, где в технике встроенных полей отражается номер тома, а в повторении – идентификатор записи на том. Запись связывается с регистрационной записью на том. Поле 461 копируется из записи на том. Примечания, относящиеся к каждому выпуску (номеру), вносятся в соответствующие поля блока 3 -. Программное обеспечение создания регистрационных записей на том. Ввод спецификаций (данных о наличии выпусков) на каждый том поддерживается программным модулем специального назначения, разработанным в ОИА БАН (SpecInt).
Рис. 1. Окно поиска и отбора издания
Ввод спецификаций изданий. Особенностью ввода спецификаций является практическое исключение ручного ввода информации. Выделяя ячейки и используя определенные команды (табл. 3), оператор вводит данные об отдельных выпусках издания. Рис. 2. Окно ввода спецификаций Ввод шифров. В случае, если издание имеется в БАН в нескольких экземплярах, в соответствующее окно вводится шифр или сигла подразделения БАН, которую отбирают из выпадающего меню. Список шифров и сигл формируется автоматически при выборе издания. Если ввод спецификаций для данного издания ранее не производился, то список пуст. Новые шифры или сиглы должны вводится в соответствующем окне, при этом они автоматически добавляются в список. Ручной ввод шифров непосредственно в ячейку не предусмотрен. Панель инструментов делится на четыре части:
Таблица 3 Функциональные кнопки и кнопки управления видом интерфейса
Каждой части панели инструментов предшествует кнопка половинного размера. Щелчок на этих кнопках вызывает редко используемые функции (в порядке расположения на панели инструментов):
Особенности работы над каталогом иностранных журналов БАН: концепция проекта предполагает максимальную полноту охвата материала при планировании работ на долгий срок, трехуровневую структуру массива, практическое исключение ручного ввода данных, кроме некоторой локальной информации. Подготовительные этапы, предусматривающие планирование, создание и модификацию программного обеспечения, а также экспериментальный ввод данных, завершены. К основным этапам, предусматривающим создание массивов данных и требующим большого объема трудозатрат, еще не приступали.
Список литературы
| |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Copyright © 1995-2002 ГПНТБ России |