Home page | Каталоги и базы данных

Научные и технические библиотеки

УДК 025.32:681.3

Моторина А.Н.


Заполнение полей в формате MARC. Опыт отдела научной обработки литературы НБ ЧГТУ

В течение четырех лет (1991-1994 гг.) НБ ЧГТУ формировала электронный каталог, используя программу АИБС & quot; MARC & quot;, разработанную НПО" Информ - система & quot; и рекомендованную Госкомвузом РФ к внедрению в библиотеках высших учебных заведений.

Не имея в начале работы никаких рекомендаций и указаний по методике заполнения полей формата MARC, мы использовали ограниченное число полей, исходя из" Правил библиографического описания изданий & quot;, государственных стандартов и консультаций с разработчиками программы.

Перед началом ввода библиографических записей в ПЭВМ проделана большая подготовительная работа и принят ряд методических решений как организационного характера, так и непосредственно касающихся порядка и методики заполнения полей. Учитывая специфику вуза и принципы старения научно-технической литературы, решено заносить в базу данных информацию об изданиях по естественнонаучной и технической тематике и архитектуре, начиная с 1975 г. издания. Ввод информации производили с каталожных карточек служебного алфавитного каталога, а не с книги (последнее предпочтительнее, но практически невыполнимо). Осуществляла ввод группа библиотекарей из разных отделов на четырех ПЭВМ" Мазовия & quot; с 9 до 19 час. в течение полутора лет.

Перед вводом информации в базу данных главный библиотекарь просматривал карточки служебного алфавитного каталога и отмечал, что надо вводить. Каждый библиотекарь, работавший на ПЭВМ, фиксировал, с каких карточек им введена информация. При неясностях или каких-либо затруднениях необходимые решения принимались совместно с главным библиотекарем и заносились в картотеку методических решений.

После завершения работы по созданию БД информации о естественнонаучной и технической литературе мы по согласованию с отделами обслуживания приступили к вводу в ПЭВМ информации о литературе по философии (с 1975 г. издания) и экономике (с 1987 г. издания), а также о художественной литературе.

Приняты решения о порядке заполнения полей: применять сокращения в тексте библиографического описания по соответствующему стандарту, но в полях"Название книги" и"Ключевые слова" сокращений не делать; использовать римские и арабские цифры согласно установленным в библиотеке правилам; ставить точки в поле"Другие авторы", если авторов больше трех и они не указаны на карточке; заносить информацию в поле"Ключевые слова" в том случае, если она имеется на карточке; вносить в поле"Ответственность" фамилии редакторов, редакторов части тома и т. п.

По ходу изучения программы и ее версий программистом и библиотекарями вносились изменения в порядок ввода, увеличивалось число заполняемых полей. Некоторые изменения привели к трудностям при переходе с одной программы на другую. Например, ключевые слова первоначально заносились в одно поле и отделялись друг от друга точкой, затем точкой с запятой; последнее привело к тому, что при разнесении информации в разные поля пришлось выполнить значительную по объему формальную работу.

Методические рекомендации «Заполнение полей автоматизированной информационно-библиотечной системы"MARC"» по задаче"Информ-система" получены только в мае 1993 г. после того, как была создана основная база данных. Они помогли нам при редактировании БД и в дальнейшей работе, но не решили всех наших проблем. Позже в библиотеку пришли и другие методические рекомендации по заполнению полей формата MARC.

Работая с программой АИБС"MARC", мы поняли, что система оказалась"замкнутой" и ее возможности нас не вполне устраивают:

  • перечень поисковых элементов и длину полей нельзя изменять;
  • формы выходных документов (каталожные карточки и др.) не соответствуют принятым в нашей библиотеке, а внести изменения невозможно;
  • при большом объеме БД (20 тыс. записей и более) поиск по этой программе осуществляется очень медленно;
  • возникают трудности при обеспечении базы лингвистикой;
  • отсутствует квалифицированное сопровождение адаптации программы.

В январе 1994 г. НБ ЧГТУ приступила к реализации программы"Библиотека-3", разработанной в МГУ, предварительно изучив ее и проведя экспериментальный ввод информации в БД.

С 1995 г. и по настоящее время наша библиотека использует среду программы МГУ"Библиотека-4". Осваивая ее, мы учли все ошибки, допущенные при реализации предыдущих программ, использовали многие (но еще не все) ее возможности для ввода в АИБС дополнительных сведений, которые не могли быть введены с помощью АИБС"MARC" и"Библиотека-3". Перечислим основные нововведения:

  • в поле"Другие авторы" (повторяемое) вносим всех авторов, указанных в книге;
  • наличие подполя"Роль лиц" в авторском поле позволяет заносить в это подполе редакторов, авторов предисловий, художников, переводчиков и т. п. и затем осуществлять поиск информации по полю"Авторы", зная одного из них;
  • наличие подполя"Название произведения" в авторском поле дает возможность делать аналитическую роспись сборников и затем осуществлять поиск необходимых произведений какого-либо автора в поисковом поле"Название"
  • система оказалась"открытой", поэтому библиотекарь может сам изменять длину полей;
  • созданы словари: предметных рубрик, каталожных индексов, серий, ключевых слов, коллективных авторов и т. д., а также различные словари формализованной лексики; используются разные типы словарей; они выполняют функции нормативной лексики для библиотекарей и одновременно играют роль предметного ключа для читателей.

В настоящее время система БД"ЭЛЕКАТ" представляет из себя 7 самостоятельных каталогов. Данные на 01.09.95 г.:

  • основная база данных - 118 383 записи;
  • новинки - сведения о изданиях, поступивших в библиотеку и прошедших обработку за последний месяц; на основе этой базы составляется и печатается"Список новых поступлений";
  • авторефераты диссертаций - 2736 записей. На этом каталоге совершенствовалась методика работы с внешними словарями. При заполнении БД авторефератов использовался словарь"Коллективные авторы" из основной базы данных, т. е. один и тот же внешний словарь может быть подключен к разным базам данных;
  • ретрокаталог - 343 записи, куда заносится та часть изданий, которые не внесены в основную базу; постепенно по мере проведения подготовительной работы сотрудников отдела обработки с карточками служебного алфавитного каталога пополняется новыми записями;
  • база АПУ к"ЭЛЕКАТ", которая пока еще не предоставляется читателям, но после редактирования будет служить справочно-поисковым аппаратом для всей системы БД, а также ускорит работу систематизатора;
  • официальные материалы - сведения о законодательных материалах и подзаконных актах всех структур власти с 1995 г. 3100 записей;
  • БД электронного каталога Научной библиотеки МГУ, которая представлена в"ЭЛЕКАТ" осенью 1995 г.

Первые пять БД формируются сотрудниками отдела обработки, БД"Официальные материалы" - сотрудниками справочно-библиографического отдела. На все БД составлены паспорта-характеристики.

Особенностью нашей системы"ЭЛЕКАТ" является наличие двух вариантов баз данных:

  • служебный, обслуживаемый программой"Библиотека-4" - для сотрудников библиотеки; читательский, обслуживаемый комплексом программ, разработанных Челябинским региональным центром высшей школы (ЧРЦ ВШ), что создает большие трудности диспетчеру БД, но ускоряет процесс поиска информации читателям. Это вызвано тем, что поисковые возможности программы ЧРЦ ВШ в несколько раз превышают возможности программы"Библиотека-4" при больших объемах БД, особенно при использовании контекстного поиска.

Чтобы привести старую часть основной БД (библиографические записи, занесенные в"ЭЛЕКАТ" с помощью АИБС"MARC") в соответствие с новыми записями (занесенными в"ЭЛЕКАТ" по программам"Библиотека-3" и"Библиотека-4"), в 1995 г."ЭЛЕКАТ" несколько раз реорганизовывали:

  • провели групповую перекодировку соответствующих полей и данных, подготовленных разными программами - АИБС"MARC" и"Библиотека-4";
  • разрезали поле"Другие авторы" для улучшения поиска по персоналиям;
  • разделили информацию в поле"Ключевые слова" для того, чтобы повысить качество поиска информации (раньше у нас несколько ключевых слов находились в одном поле);
  • отсортировали и загрузили базу в комплекс"Библиотека-4" по авторскому знаку для редактирования старой части фонда и ввода ретрозаписей, ранее не включенных в"ЭЛЕКАТ", начиная с буквы А.

В настоящее время ввод информации, лингвистическое обеспечение баз данных, индексация источников информации, а также вся традиционная обработка изданий возлагаются на сотрудников отдела обработки. При этом надо отметить, что содержание труда меняется. В функции отдела вошли новые виды работ: предметизация, индексирование документов с использованием различных ИПЯ, работа с компьютером. Отсутствие методических указаний заставило библиотекарей самостоятельно изучать эти вопросы, постоянно заниматься повышением квалификации в вопросах семантики, лингвистики, различных АИБС и т. п. Так, при подготовке словарей мы стремились унифицировать их, используя все известные нам документы и материалы, создавая при этом свои локальные методы и правила. Например, для словаря предметных рубрик мы взяли за основу разделы и терминологию таблиц УДК для научных библиотек, таблицы ББК для научных библиотек (сокращенный вариант) и для массовых библиотек, предварительно сверив их с нашими рабочими таблицами. Мы остановились на относительно крупных делениях, учитывая состав фонда и его наполняемость. Содержание предметных рубрик соответствует глубине индексации от 2 до 7 знаков.

При выделении ключевых слов, мы приняли следующие правила:

  • ключевое слово берется из текста, оглавления, предисловия, аннотации документа;
  • ключевые слова уточняются при помощи АПУ к систематическому каталогу и классификационных таблиц;
  • имя существительное употребляется во множественном числе (за исключением употребляемых только в единственном);
  • применяются словосочетания;
  • используется общепринятая терминология, а также инверсия и синонимия;
  • затруднительные случаи выясняются по изданным тезаурусам, терминологическим словарям, энциклопедиям;
  • грамматические и синтаксические правила в написании слов и словосочетаний идентичны для всех словарей и записей"ЭЛЕКАТ".

Как видно из всего вышесказанного, в настоящее время библиотекари отдела обработки занимаются лингвистическим обеспечением автоматизированной системы"ЭЛЕКАТ", которое является такой же неотъемлемой ее частью, как и информационное, программное и техническое. Лингвистическое обеспечение определяет смысл поиска, качество создаваемой информации, а значит, и эффективность ее использования. Следовательно, рациональный выбор, полнота и глубина всех ИПЯ, используемых в библиотеке, определяют качество конечных результатов ее деятельности - системы"ЭЛЕКАТ". Процесс индексирования является основным средством раскрытия содержания как отдельного документа, так и всего фонда. Поэтому при создании"ЭЛЕКАТ" индексированию необходимо уделять должное внимание, особенно качеству систематизации, так как ошибки приводят к потере информации.

Качество предметного поиска в"ЭЛЕКАТ" определяют также ключевые слова. Обязанности по координатному индексированию документов и созданию словарей ключевых слов возложены на двух систематизаторов и заведующего отделом обработки. Сократившийся поток печатных документов, поступающих в библиотеку, высвобождает время на координатное индексирование документов, но процесс этот сложный, малознакомый. Систематизаторам трудно представить в"ЭЛЕКАТ" каждую область знания с равным"весом" индексации. Для этого необходим соответствующий штат сотрудников с высшим как гуманитарным, так и техническим образованием. Увеличивается время на научную обработку литературы. Например, если вначале мы брали по 3-5 ключевых слов, то теперь - по 12-15. С ростом объема вводимой информации увеличивается и время на ввод одной записи в базу данных. Так, вначале создания"ЭЛЕКАТ" библиотекарь в среднем вводил за час 10-15 записей, сейчас максимум 3-4.

Глубокая предмашинная обработка документов включает не только анализ предмета документа, но и установление связей между рубриками, индексами, терминами, т. е. между различными ИПЯ.

Поддержание высокого уровня лингвистического обеспечения должно находиться под постоянным вниманием и контролем высококвалифицированных специалистов. Отсутствие контроля даже за грамматическими средствами ИПЯ приведет к появлению ложных словосочетаний и выражений, искажающих смысл документа. Поэтому нам так необходимы методические указания, принципы и методы индексирования, разработанные государственными центрами, а также грамматические базы данных и различные лингвистические процессоры, позволяющие автоматически генерировать необходимое лингвистическое обеспечение в"ЭЛЕКАТ". Огромную помощь всем библиотекам, формирующим электронные каталоги, оказали бы словари нормализованной лексики; их использование решило бы много проблем при тематическом поиске во всех БД.

Переход на безбумажную основу обслуживания читателей можно уже осуществить, используя"ЭЛЕКАТ", но в эту базу должны быть внесены различные служебные пометки: идентификаторы издания и экземпляра, инвентарные номера, сиглы хранения и т. д.

В связи с этим сразу появляется проблема идентификации экземпляра. На первый взгляд, им может быть инвентарный номер, но в вузовских библиотеках используются разные формы учета: инвентарный, безынвентарный, забалансовый. Поэтому в НБ ЧГТУ разработан проект идентификатора единицы хранения, который планируется заносить в одно из полей формата MARC и в штрих-код с целью автоматизации процесса книговыдачи.

Идентификатор единицы хранения в НБ ЧГТУ выглядит следующим образом:

НБ ЧГТУ ГП-ВУ-ИН-КЦ,

где: ГП - год поступления экземпляра в библиотеку (два последних знака); ВУ - вид учета в библиотеке (один знак: 0 - забалансовый, 7 - инвентарный, 8 - безынвентарный, 9 - учет методических изданий ЧГТУ); ИН - индивидуальный номер экземпляра (при инвентарном учете равен инвентарному номеру, при безынвентарном учете и учете методических изданий равен регистрационному номеру плюс порядковый номер экземпляра, при забалансовом учете равен порядковому номеру экземпляра издания); КЦ - контрольная цифра.

При наличии локальной библиотечной сети необходим также идентификатор издания, в качестве которого может быть использован номер ISBN. Этот идентификатор позволит быстро осуществлять проверку на дублетность, хранить информацию об издании в отдельной компактной базе, а также (совместно с идентификатором единицы хранения) автоматизировать процесс книговыдачи. Как известно, не все издания имеют ISBN. Для таких материалов в библиотеке разработан проект идентификатора издания, так называемый АЛКОД. За основу кодирования издания берется его библиографическое описание. Процесс кодирования заключается в сжатии библиографического описания путем выборки фиксированного числа символов из его элементов. При этом учитываются правила каталогизации издания в соответствии с ГОСТ 7.1-84"Библиографическое описание документов".

В АЛКОД включаются символы из элементов библиографического описания в следующей последовательности:

  • заголовок библиографической записи (индивидуальный автор, коллектив индивидуальных авторов, коллективный автор, несколько коллективных авторов; при отсутствии вышеуказанных авторов - составители, редакторы) - первые буквы фамилий трех авторов или наименований трех коллективных авторов - три знака;
  • основное заглавие издания - первые буквы трех первых слов основного заглавия - три знака;
  • подзаголовочные данные - первая буква первого слова, указывающая тип издания - один знак;
  • спецификация многотомного издания (том, выпуск, подвыпуск или часть, раздел и т. д.) - цифровые значения спецификации - количество знаков переменное;
  • место издания - две первые буквы первого слова места издания - два знака;
  • год издания - две последние цифры года издания - два знака. Например: АЛКОД ТБП-ПАД-У-ЧЕ-94 соответствует библиографическому описанию: Трусковский В.И., Барков Л.А., Плотников В.К. Прессы-автоматы для обработки порошковых материалов: Учеб. пособие для студ. вузов. - Челябинск: Металл, 1994.

Суммируя вышесказанное, хотим подчеркнуть: создание"ЭЛЕКАТ", центрального звена в автоматизации библиотеки, полностью зависит от кадрового состава отдела научной обработки литературы. Настало время пересмотреть структуру и функции как отдела, так и всей библиотеки вуза в целом. Мы считаем, что необходимо"выпрямить" путь книги до передачи ее в отделы обслуживания. Для этого целесообразно объединить отделы комплектования и обработки, выделить новые сектора по предмашинной обработке документов (лингвистическое и информационное обеспечение"ЭЛЕКАТ"), группу по обслуживанию техники (ПЭВМ, принтеров и т. д.), группу по вводу информации и др. Эти предложения находятся в стадии обсуждения, но мы надеемся, что оптимальный вариант будет найден.


Copyright © 1995-97 ГПНТБ России